データにまつわるWeb業界の仕事について
-
Upload
m-tkn -
Category
Technology
-
view
2.458 -
download
1
Transcript of データにまつわるWeb業界の仕事について
CyberAgent,Inc.
データにまつわるWeb業界の仕事について
株式会社 サイバーエージェント技術本部 秋葉原ラボ
高野雅典
15/12/22 1
2015/12/22阿南高専
CyberAgent,Inc.
おことわり
• 最初に45分ぐらい話して、その後 15分ぐらい質問タイムを取ります。質問は大歓迎ですのでよろしくお願いします。
• 主にWeb業界のデータ分析について話します。別の業界については全く異なる可能性があります。
• また、サイバーエージェント以外の別のWeb系企業さんでは、事情が異なる場合が十分にありうるので注意してください。
• このスライドは後でh7ps://www.slideshare.netにアップロードします
215/12/22
CyberAgent,Inc.
会社紹介
315/12/22
• インターネット広告事業
• ゲーム事業
• メディア事業
• その他
CyberAgent,Inc.
自己紹介
• 高野雅典– データマイニングエンジニア @ CyberAgent
– 博士(情報科学)
• 普段の仕事
– ソーシャルゲーム・SNS・プラットフォームの分析– 分析システムの設計・開発– データ分析に関わる研究開発
• 得意/興味のある領域
– 複雑系科学・計算社会科学・進化心理学– 統計モデリング・R・機械学習– 可視化・JavaScript
• Twi$er:@mtknnktm4
CyberAgent,Inc.
経歴–興味と所属の推移
プログラミング・遺伝的アルゴリズム
– 会津大学 コンピュータ理工学部
複雑系・人工生命・進化・ヒトの社会性
– 名古屋大学大学院情報科学研究科(修士・博士)
システム開発・コンサルティング
– システムインテグレータ–システムエンジニア
Webサービス・フロントエンド・ユーザインターフェース
– ㈱サイバーエージェント–フロントエンドエンジニア
データマイニング・Webサービス・計算社会科学
– ㈱サイバーエージェント–データマイニングエンジニア
515/12/22
イマココ
CyberAgent,Inc.
今日話すこと
• ビッグデータ• データサイエンティスト• Webサービスのデータ分析• データ分析の面白み• データ分析を仕事にするには
615/12/22
CyberAgent,Inc.
ビッグデータ
15/12/22 7
CyberAgent,Inc.
ビッグデータ
• 最近のブーム以前から、データ分析によるビジネス貢献(リスク定量化・効率化等)はたくさんあった
– 幅広い科学・業種で統計分析技術が使用されている– 経済を予測したり、薬の効果を検証したり、機械の故障を予測
したり、天気を予測したり、マーケットの現状を把握したり
• 近年、インターネットの普及やデータ処理基盤の進歩により大量のデータを取得・処理可能に
– それによって、いろいろ良いことが有ったので、ビッグデータという言葉が大きなブームに
• ビッグデータの特徴を現す3つのV– 高ボリューム、高速度、高バラエティ
815/12/22
CyberAgent,Inc.
ビッグデータ
• ビッグデータの例
– 人の行動ログ(多くの人や物のデータ)• Amazon,Google,SNS,ソシャゲ,携帯電話,ネット広告,IoT,etc.
– センサデータ(ミリ秒単位の詳細データ)• 自動車,ロボット,IoT,気象データ,etc.
– これまで個別管理されていたデータも統合によりビッグデータに?• 病院のカルテデータ統合の試み
– h7p://www.slideshare.net/naomikawashima52/medical-bigdatameetup2
• 大規模データ処理基盤の例– Hadoop,Spark,BigQuery,RedshiT,etc.– サイバーエージェントもHadoopを中心とした大規模データ処理基
盤を構築し、データ活用に利用– 発表スライド:h7p://www.slideshare.net/cyberagent/cloudera-world-tokyo-2013
915/12/22
CyberAgent,Inc.
ビッグデータでうれしいこと–機械学習
• 機械学習– 学習データとして入力と出力(正解)の組を与え、その規則を学
習させる。未知の入力に対して出力を予測する(教師あり学習)• 例:Amazonの購入履歴 → 次に買いそうな商品
– データを突っ込むと、その特徴から似たようなものを分類することができる(教師なし学習)• 例:似た画像の分類
• ビッグデータの恩恵
– データが少ない• 単純な(パラメータの少ない)モデルじゃないとうまくいかない → 単純な規則しか学習できない
– データが多い• 複雑な(パラメータの多い)モデルでもうまくいく(ことがある) → 複雑な規則も学習できる(こともある)。→ これによってものすごく高精度になることも。ビッグデータ万歳。
参考資料:ビッグデータを活かす機械学習技術 h7p://www.n7.co.jp/journal/1304/files/jn201304031.pdf1015/12/22
CyberAgent,Inc.
データサイエンティスト
15/12/22 11
CyberAgent,Inc.
データサイエンティストとは
• (企業だと)データをなんとかしてうまいことする人のこと
– 定義はけっこう曖昧– 会社によっては、アナリスト、データマイニングエンジニア、データコンサル
タント、データアーキテクト、ビッグデータエンジニアとか言ったりする(微妙に意味も違ったりする)
• 以下のいずれか(or 複数)をやっていることが多い
– データから得られた知見をビジネスに活かす– データを統計分析して知見を得る– 機械学習を使った予測や推薦をするアルゴリズムの
開発、システムの構築・運用– 大規模データ処理基盤を構築・運用
1215/12/22
CyberAgent,Inc.
データ分析のスキル概観
15/12/22 13
CyberAgent,Inc.
データにまつわる技術の概観–だいたいこんな感じ?
1415/12/22
機械学習統計分析 大規模データ処理
ビジネス
広告
小売
人材※各領域の境界は結構曖昧
メディア
ゲーム
医療
自動車
インフラ
CyberAgent,Inc.
サイバーエージェントでやっている範囲
1515/12/22
機械学習統計分析 大規模データ処理
ビジネス
広告
小売
人材※各領域の境界は結構曖昧
メディア
ゲーム
医療
自動車
インフラ
CyberAgent,Inc.
各技術とサービスの関連(サイバーエージェントの場合)
1615/12/22
CyberAgent,Inc.
高野の業務範囲
1715/12/22
機械学習統計分析 大規模データ処理
ビジネス
広告
小売
人材※各領域の境界は結構曖昧
メディア
ゲーム
医療
自動車
インフラ
だいたいこのへん
CyberAgent,Inc.
Webサービスのデータ分析
15/12/22 18
CyberAgent,Inc.
Webサービスとは
• インターネット(アプリ含む)上のサービスのこと– Google,Amazon,Facebook,Twi7er,ブログ,
スマートフォンゲーム,LINEなど– アメーバブログ,アメーバピグ,
ガールフレンド(仮/♪),AWA,755などなど※ この意味でのWebサービスは実は誤用だが割と広く通じるので気にしないことにする
1915/12/22
CyberAgent,Inc.
Webサービスとデータ分析
• ユーザの行動ログという形で簡単にデータが取れる• サービス改善の反映スピードが早い→ データ分析がしやすい、データ分析の結果が
活かしやすいビジネス形態
2015/12/22
サービスのサーバ
大規模データ処理基盤
ユーザ
アクセスしてサービスを利用 行動ログの
収集
CyberAgent,Inc.
ゲーム運営サイクル
21
サービス運営チーム
Hadoopクラスタ
BIツール:Hawkeye
データマイニングチーム
マーケティングチーム
アドホック分析経営層
Shiny
分析基盤チーム
コンサルチーム
仮説立案
分析
提案施策実装
検証
CyberAgent,Inc.
ゲーム運営サイクル–検証
22
サービス運営
• 売上目標の達成はできそうか?• 売上や主要なKPI(DAU/顧客単価/課金率)
は想定通りか?• 今の状態は健全か?• ヘビーユーザ数は増えているか?• 課金率や顧客単価が高すぎ/低すぎではな
いか?
仮説立案
分析
提案施策実装
検証
• 目標達成・健全性に課題はあるならばどこか?• どんな層のユーザのどの指標が課題か?
KPIビューア
日々の各KPI観測コンサル
CyberAgent,Inc.
コンサル
ゲーム運営サイクル–仮説立案
23
サービス運営
• 課題の原因は何か?• チュートリアルや説明がわかりにくい?• ギルド・コミュニティが機能してない?• イベントが難しすぎた/簡単すぎたから?• お得情報の訴求が不十分?
仮説立案
分析
提案施策実装
検証
KPIビューア
様々な指標のチェック
データマイニングエンジニア
仮説
課題ヒアリング
要件・課題整理
CyberAgent,Inc.
ゲーム運営サイクル–分析
24
• 課題・仮説は正しいか? • 目的変数・説明変数の設計・分析
• 仮説が正しいのであれば、どうやったら改善できるか?• 操作可能な説明変数はあるか?
仮説立案
分析
提案施策実装
検証
データマイニングエンジニア
アドホックで柔軟なデータ抽出
Let’s データマイニング!
CyberAgent,Inc.
ゲーム運営サイクル–提案・施策実装
25
• 提案は妥当か?• サービスを知り尽くしている運営として分析と施策提案は納得できるものか?(提案施策の結果に責任持てるか?)• 実現可能な施策か?
仮説立案
分析
提案施策実装
検証
コンサル
データマイニングエンジニア
サービス運営
• 施策の実現方法・実装の計画・設計をして、実装、リリース!
レポート
計画・設計ついて相談
リリース
CyberAgent,Inc.
ゲーム運営サイクルの例
26
• ギルドで協力して課題をクリアすることがコアのゲーム• ユーザはチュートリアル完了時に必ずどこかのギルドに
所属する
分析対象のサービス
※:今回の例と画像は関係ありません
CyberAgent,Inc.
ゲーム運営サイクルの例
27
検証・課題発見
DAUが増えないなぁ… 継続率が
あまり良くないぞ
特に新規ユーザの継続率がよくない
サービス運営
日々の各KPI観測コンサル
KPIビューア
仮説立案
分析
提案施策実装
検証
CyberAgent,Inc.
ゲーム運営サイクルの例
28
仮説立案 仮説立案
分析
提案施策実装
検証
コンサル
サービス運営 KPIビューア
様々な指標のチェック
データマイニングエンジニア
新規ユーザがギルドの機能、あまり使っ
てない?
せっかくギルドに入っても楽しめなかった人がやめちゃってる?
CyberAgent,Inc.
ゲーム運営サイクルの例
29
分析 仮説立案
分析
提案施策実装
検証
データマイニングエンジニア
新規加入したギルドの属性で新規ユーザの継続・離脱が分類
できるハズ
目的変数:新規ユーザの継続・離脱説明変数:ギルドの属性値で分類器(決定木)を作成
• ギルドのアクティブメンバー数がある一定以上• ギルドメンバーが強すぎないというギルドに加入したユーザが継続していた
CyberAgent,Inc.
ゲーム運営サイクルの例
30
提案・施策実装 仮説立案
分析
提案施策実装
検証
コンサル
データマイニングエンジニア
サービス運営
レポート
計画・設計ついて相談
アクティブ かつ 強すぎないギルドほど推薦リストの上に来るようにしましょう
長期的にはN人以上がアクティブなギルドを増やせるような推薦ロジッ
クをしたいですね→ 次の分析へ
CyberAgent,Inc.
まとめ
• Webサービスの運営は– サービス運営チーム
(企画者・エンジニア・デザイナーなど)
– データ分析者
が– 目的・目標・課題を共有し、– 分析・提案・実装・検証・仮説立案をし続ける
ことでサービスの品質を向上させていく• データ分析者は、サービスの
ビジネスモデル・運営方針・ユーザ感情についてよく理解することが大事
31
CyberAgent,Inc.
データ分析の面白いところ
15/12/22 32
CyberAgent,Inc.
面白いこと・楽しいこと
• お客様(ユーザ)の満足度に貢献– 関わっているサービスに関して、SNSとかでユー
ザが盛り上がっていたり、数値(継続率とか)に現れたりすると嬉しい
• 分析結果は"サービスの方針決定"という重要な部分に大きな影響を与えうる
• データから知見を探索・発見をするというプロセスが楽しい
• 新しい技術・手法を勉強したり、開発したり、使ったりするのが楽しい
• ヒトの行動に関して大量のデータが得られる
3315/12/22
CyberAgent,Inc.
データ分析関連の仕事をするには(Web業界で)
15/12/22 34
CyberAgent,Inc.
正直良くわからない…Web業界自体が若い上に、データ分析が流行ったのも最近なので、様々な経歴を持っている人が、様々な立ち位置でデータ分析に関わっている※ 高野は元々サービスの開発者でしたが、いろいろ偶然が有ってデータ分析に関わることになりました(やりたかったことなのでとても幸運に恵まれた思います)
3515/12/22
CyberAgent,Inc.
とりあえずデータ分析関連の求人はある様子
3615/12/22
※ サイバーエージェントの中途採用のページから抜粋。※ サイバーエージェントの新卒採用はビジネスコース(営業とか)とテクノロジー・デザインコース(システム技術者・デザイナとか)の2種類。データ分析系の仕事はどちらにも存在。
CyberAgent,Inc.
なので重要そうなことをご紹介
• データ分析したい対象– データ分析技術だけでなく対象(弊社だとゲームとかSNSとか広告とか)につい
て深く知っていることが大事– ビジネスモデル、お客さんの気持ち、マーケット、歴史など
• 基礎学力– データ分析だけでなく多くの科学者・技術者にとって、
線形代数、微積分、英語は何をやるにしてもついてまわる
• なんでも良いので何か一つ専門性
– 直接仕事に役立てばとても幸せ– そうでなくても "解決すべき問題を発見し、解決までの道筋を立て、試行錯誤を
繰り返し、解決に至る能力"は身につく(どんな仕事をする上でも超重要!!)
– 知識体系を身に付けることは未知の事に関する勉強・理解の仕方も身につく※データ分析系同僚の専門も生物学・経済学・脳科学・数学・情報工学など様々
• 何かを作ることができると便利(プログラミングとか)
– 何かをやりたい時に作って人に見せることができる– 構想だけでは本人も他人もよくわからない事が多い
3715/12/22
CyberAgent,Inc.
ご清聴ありがとうございました
15/12/22 38
CyberAgent,Inc.
参考書籍
15/12/22 39
CyberAgent,Inc.
ビッグデータの正体 -情報の産業革命が世界のすべてを変える
• ビッグデータによって世界の何が変わるか? について解説した本。
• わかりやすいので全体像を知りたい人にオススメ
• URL:h7p://www.amazon.co.jp/dp/4062180618
4015/12/22
CyberAgent,Inc.
データサイエンティスト養成読本 ビッグデータ時代のビジネスを支えるデータ分析力が身につく
• まずは手を動かしていろいろ分析してみる時に最適。オススメ。
• URL:h7p://www.amazon.co.jp/dp/4774158968
4115/12/22
CyberAgent,Inc.
会社を変える分析の力
• データ分析者の仕事の仕方について。心構えなど。
• 高度な技術で分析するだけでなく、どのようにしたら会社にインパクトを与えるような仕事ができるか?
• 著者は大阪ガス勤務• URL:h7p://www.amazon.co.jp/dp/4062882183
4215/12/22