「大數據」是現在相當熱門的話題,「大數據分析師」更是各行各業爭搶的人才,熱門的程度,連大學開設的相關課程修課學生都能擠爆教室。意藍資訊董事長,同時也是台大工管系暨商研所助理教授楊立偉,在台大開設的「大數據與商業分析」課程,本來設定修課人數六十人,開課時居然來了三百多位學生,教室裡裡外外擠滿了人,甚至還有學生開直播,而這些前來修課的學生並不限於資訊科技相關系所,就連經濟系、社會系、中文系都有學生選修這門課,由此可見大數據應用範圍之廣,以及大家渴望瞭解大數據的程度之高。數據煉金術 商機預測 行銷參考大數據的應用在國內外都有許多相當成功的案例,例如美國有超市分析大數據得知,週五前來買尿布的爸爸通常會順便買啤酒,因此在週末將尿布與啤酒擺放在一起,有效提升啤酒銷量。也有賣場分析女性消費者的消費紀錄,判斷出該名消費者可能已經懷孕,並寄出相關產品目錄與折價券,讓顧客可以再回來購買懷孕期間所需商品。在國內則有電信業者根據用戶近期瀏覽的網頁資料,加上門號的使用狀況,預測用戶有可能打算轉換電信公司,甚至之前兩大超商霜淇淋大戰打得火熱的時候,也是靠著收集社群網站上民眾的發言,再透過大數據的技術來決定下一波要推出什麼口味的霜淇淋,才能抓住消費者的味蕾。以往企業想要知道消費者的喜好,必須花費大量的時間及金錢對消費者進行問卷調查,但現在有了大數據,企業可以採用更直接且立即的方式來進行商機預測,並做為行銷決策的參考,因此楊立偉說,大數據就是一個數據煉金術,如果企業不懂得如何運用大數據,恐怕很難再與同業競爭。語意分析 從文字判斷情緒由於網路的普及與網路社群的高使用率,每個人每天都在網路上留下大量的資料,楊立偉表示,大數據業者只要將這些資料彙整起來,就可以猜測出一個人到底喜歡什麼,預測這個人的消費行為,甚至可以算出他的信用評等。利用大數據進行信用評等的案例國內外皆有,在大陸有阿里巴巴集團的芝麻信用,針對阿里巴巴旗下各個事業體的客戶,運用大數據及雲端運算技術,計算出個人的消費評等,而意藍資訊則是收集台灣上市櫃公司在網路上出現的所有正面或負面消息,運用語意分析的技術,找出企業在財務、勞動、法規、環境等方面可能產生的風險,做為傳統徵信方法之外的輔助參考資料。透過這些資料分析出來的風險,楊立偉將它稱之為社群風險,目前已經有好幾家金融機構採用。拜科技進步之賜,現在的電腦不論在資料量或運算速度上都比以往要快上許多倍,即使是數十億字的資料都能快速的處理,楊立偉指出,這就是現在大數據的特點之一。以意藍資訊所建立的「OpView社群口碑資料庫」來說,每天收集到的資料就有六十億個中文字,資料收集進來後就要運用人工智慧(AI)加以運算分析,而這其中楊立偉最引以為傲的技術就是「語意分析」,這個技術讓電腦的運算分析跳脫以往只能分析數字的限制,而是可以從文字中判斷出情緒,知道發言者喜歡什麼、不喜歡什麼,從而發現新概念、新產品,以及新市場趨勢,楊立偉表示,科技的發展讓資料分析達到前所未有的深度和廣度。大數據有區域特性意藍資訊團隊擁有一百多位工程師,在資訊、統計及語意分析方面都有專業人才,而且還是全球第一名的中文語意分析團隊。楊立偉認為,台灣的軟體技術是全球知名的,因此在發展大數據的專業上具有一定的優勢,例如在台大就有幾位全球榜上有名,專門從事人工智慧研究的教授。在這方面目前大陸還不及台灣,不過大陸也非常積極的在發展人工智慧,如果大陸砸重金挖角台灣人才,那麼台灣很可能會失去這個優勢,台灣企業及政府若想保有競爭力,一定要珍惜並善待高科技人才。楊立偉認為,大數據正在形成一個新的產業,但這個產業有其區域特性,雖然技術及人才面對的是全球性的競爭,但大數據分析判讀的是一個區域、一個市場的資料,而每個區域、每個市場都有其特性,例如大陸的生活型態及消費習性就與台灣不同,因此兩地的分析結果不能相互為用。做為一個大數據供應商,楊立偉和他的團隊現在正在做的事就是把台灣各行各業的龐大資料收集起來,以供應全台各個領域使用,讓各領域無須自行維運龐大的資料庫,更不需要自行設置超級電腦來運算資料,只要找到像意藍資訊這樣的第三方大數據供應商,按用量或按月支付費用,就可以源源不絕的使用雲端資料庫中的資料,輕鬆查詢企業需要的數據。資訊、統計、產業 大數據分析師必備三技能大數據的重要性已獲得各界重視,也使得大數據人才成為各界競相爭取的對象,大數據分析師更是目前最熱門的行業之一。如果你也想成為一名大數據分析師,楊立偉說,必須具備三個條件:第一是要會使用大數據相關的資訊工具,第二是要對統計學有一定程度的概念,第三是要對產業有相當程度的瞭解,如果只具備前兩項條件,但對產業不瞭解,就無法洞悉出大數據的密碼,而若是對產業已經很熟悉的人想成為大數據分析師,就必須補足資訊及統計的技能。有些人會擔心自己不是資訊相關科系畢業,是否就無法成為大數據分析師?楊立偉說,在他的團隊中最厲害的一位分析師是經濟系的同學,由於他有很扎實的經濟理論基礎,因此他在接觸大數據的技術後反而上手得比其他人都還要來得快。研習後實際操作親身體驗企業人士如果想學習大數據,楊立偉建議可以參考市面上許多相關書籍,他本人也出版了《社群大數據:網路口碑及輿情分析》一書,此外也有許多講座可以參加。在閱讀完書籍或參加過講座後,楊立偉提醒大家一定要實際操作,有些書籍附有試用帳號可以登入大數據資料庫,親自體驗一下大數據的奧妙,尤其國內大數據業者收集的都是國內的資料,透過親自操作馬上就可以瞭解全台民眾的真實想法,會讓試用者有更深刻的體會。除了上課進修外,楊立偉也建議大家多參加「數據駭客松」活動,利用主辦單位所提供的數據來鍛鍊自己的數據煉金術。大數據可以說是一種群眾智慧,就是將大家的意見及看法,透過大數據大量且快速運算的功能找出主要的趨勢,進而提供企業做為決策參考的依據。或許有人會質疑,這樣做出來的決策是受到群眾意見的影響,似乎顯得不夠專業,對此,楊立偉表示,眾人的意見的確會形成一種力量,而大數據就是要協助決策者站在高點,預先清楚看見眾人的需求,同時善加運用群眾的智慧來做出對企業最有利的決策。數據是沒有溫度的,但使用的人有溫度,楊立偉希望大家在運用大數據的同時,要對社會有更多的愛和關懷,同時必須謹守道德的界線,以大數據為善,不要以大數據為惡。楊立偉學歷:國立台灣大學資訊管理研究所博士現任:意藍資訊董事長(創辦人)、台大工管系暨商研所兼任助理教授、台科大資管系兼任助理教授、資訊及通信國家標準技術委員曾任:龍捲風科技董事總經理、智威湯遜數位行銷首席顧問、尚藍互動行銷共同創辦人榮譽:國內規模最大網路情報與社群口碑自動分析平台 國內企業搜尋引擎市佔率最高;國際檢索競賽第一名 2009年獲選100 MVP最有價值經理人,擁有超過20項語意分析專利 2012年獲國家雲端創新獎、數位時代「創業之星」首獎