i 聯網系列之5:大數據
-
Upload
richardpei- -
Category
Presentations & Public Speaking
-
view
1.678 -
download
0
Transcript of i 聯網系列之5:大數據
⼤大數據
RICHARD PEI
1
裴有恆 Richard� 2
學歷與認證 美國南加⼤大電腦⼯工程碩⼠士畢業 台灣⼤大學機械系學⼠士畢業 台灣外貿協會第六屆碩⼠士後⾏行銷班畢業 台灣外貿協會第⼀一屆品牌班⾏行銷班畢業 新產品開發專家(NPDP)認證(全台前⼗十名) IDEO ACUMEN 服務設計 DESIGN KIT 經歷 元創意股份有限公司資深產品經理 神達電腦 產品經理,流程經理,專案經理主管: Mio A501,A702⼿手機專案, Sagem My-S7 Mercedes Map Pilot產品ODM專案, 仁寶電腦專案經理: XG-3D⼿手機專案 台灣⼤大哥⼤大研發處主任: Mail系統開發, WAP系統開發,簡訊傳情, MMS系統⾃自製專案 企業內訓教學專⻑⾧長 物聯網、流程創新、產品創新、服務創新、 商業模式創新、創新管理、專案管理
大數據與傳統資料探勘的不同�
現在的電腦一台電腦通常只能有個別分析獨立的小型資料庫(data set)。傳統資料探勘就是在這些小型資料庫做資料處理與分析以探查趨勢與異常分析。� 大數據是將各個電腦上的小型資料庫合併後進行分析,也因此大數據無法使用大多數的資料庫管理系統處理,而必須使用「在數十、數百甚至數千台伺服器上同時平行運行的軟體」,這樣常可得出許多額外的資訊和資料關聯性。�
大數據的挑戰與機遇�
四個方向:� 量(Volume,資料大小)� 速(Velocity,資料輸入輸出的速度)� 多變(Variety,多樣性)� 不確定性(Veracity,資料真實性)�
合稱「4V」或「4Vs」。�
大數據執行的分散式系統架構�
SMAQ�
Storage
Map Reduce
Query
⽤用來儲存分散、沒有關聯的⾮非結構化資料
運⽤用批次處理的⽅方式,將⼯工作平均分散到許多 伺服器做運算。
將算完的結構化資料儲存到可供查詢的資料庫系統
技術演進: Google vs Apache�
為什麼現在大數據這麼紅�
大數據是對群體長期觀察/資料收集的結果的分析!� 資料探勘的法則,資料越多得到的分析結果越正確!� 使用大數據找出的趨勢,你可以讓生產良率大量提升(如:台積電),你可以強化自己的電子商務競爭力(如淘寶、亞馬遜、九易宇軒)。� 現在不懂大數據,你可能只落後一點; 幾年後不懂大數據,你已經趕不上懂大數據的對手!�
大數據的資料價值� 8
p 目標導向用途:� p 異常判別� p 趨勢判斷分析 � p 預測�
p 資料導向用途:� p 這些資料顯示出什麼可以改善的方向?� p 這些資料這些資料顯示什麼新商機?�
資料分析在經營決策的價值�
以資料驅動的決策:用資料提升預測精準率� 以資料驅動的流程:精準行銷與廣告推播� 以資料驅動的產品/服務:用戶分析與精準行銷得到的需求基礎上, 加強自己的產品與服務� 產品運營時, 利用資料分析防止異常及創新�
百度使用大數據�
百度搜尋指數� 春節遷徙圖�
臉書使用大數據�
了解社群偏好:看什麼文章、跟什麼人合照、常在哪裡出沒� 了解消費者社群行為:那些好友、玩那些心理測驗、看那些粉絲團� 針對消費者有效投放廣告� 好友推薦�
阿里巴巴使用大數據在�
淘寶電商大數據:� ¤ 了解消費者購物行為� ¤ 了解商家信用�
收視大數據(優酷土豆)� 社群大數據(陌陌、新浪)� 天氣(墨跡)� 阿里小貸根據貸款客戶在下游訂單、上游供應商、經營信用來評估�
騰訊使用大數據在�
了解熱門話題� 了解社群偏好� 了解使用者行為:社群上行為、網路遊戲行為� 廣告投放(?)� O2O電子商務行為(滴滴打車…)�
Google使用大數據�
記錄搜索行為的時間、內容與方式� 了解查詢趨勢:流行性感冒預測-2011/12 年的美國流感、2007/08 年瑞士流感、2005/06 年德國流感、2007/08 比利時流感等� Google Analytics追蹤訪問者在其站點的足跡� Google Adsense了解廣告效果� Youtube收視大數據:收視推薦� Google Map追蹤移動軌跡�
Amazon使用大數據�
了解消費者買書/物偏好,然後預測� 推薦消費者書籍� 測試網路頁面文字� Kindle Fire紀錄客戶使用行為�