ad:tech tokyo 2012 & 勉強会 レポート
-
Upload
hisafumi-kikkawa -
Category
Technology
-
view
2.470 -
download
0
description
Transcript of ad:tech tokyo 2012 & 勉強会 レポート
ad:tech tokyo 2012 Report
KeynoteCreativity in a correct world
● Facebookの現状についての話○ Facebookのクリエイティブ・ディレクターによる発表○ Facebookの月間利用者数は10億人○ 日本では1500万人
● Facebookによって実現されるもの○ リアルな人のつながり○ ローカルな人のつながり(ビジネス)をオンラインで○ すべての人々は同じステージで発信できる。個人がパ
ワーを持つ
Keynote3Big shift in communication
1. Disruption -> Connection(分散->結合)○ 人と人とのつながりを重視する
2. Search -> Discovery(検索->発見)○ 人々は効率性を求めている○ 検索を能動的に行うのではなく、友人・知人からのレコメ
ンドを求めている
3. Heavy weight -> Light weight○ 人々は期待するほど広告を見てはくれない。○ 映像などの重いコンテンツよりも、よりアクセスしやすく、
シンプルな広告が良い
KeynoteCreativity on Facebook Principles for Success
1. Be authentic2. Be useful3. Be entertaining4. Be relevant5. Be timely6. Listen
● One thing remember○ WHY CARE?○ WHY SHARE?
KeynoteEmphasized points
● リアルな関係● WHY XXXを繰り返すこと● 日本は高度なテクノロジーを持っている● 日本は世界で最もモバイルが進んでいる
ad:tech de 勉強会
Report & まとめ
(主催:spacyz, adingo)
Mahout in ad:tech
● spacyzのデータ・マイニングエンジニアによるApache Mahoutの紹介
● サービス利用ユーザのターゲティングをする際に、人の手でセグメント分けするのは難しい。そこでApache Mahout○ 結構バグがあるので直しながら使う。バージョンアップで
突然使えなくなる機能も。
● (補足)Mahoutとは○ Hadoop上で動作するオープンソースの機会学習ライブ
ラリ
Mahout in ad:tech処理の流れ
● バッチ処理
a. ユーザの行動履歴、属性をKVSに保存
b. ユーザの特徴をベクトル化
c. ユーザベクトルを標準化
d. ユーザベクトルをmahoutでk-Meansクラスタリング(参考)
e. k-Meansした結果からRandom Forestモデルを作成
● フロント
a. KVSからユーザ情報を取得してRandaom Forestでユーザを分類
Mahout in ad:techユーザベクトル
● ユーザベクトル○ 男 20代 30代 ... 車 育児 金額
○ 1 1 1 … 5 10 5000
○ 上記スコアは評価する基準がバラバラなので標準化する
必要がある。
Mahout in ad:techk-means
● k-means(参考)a. 点をランダムに分類するb. 分類ごとに各点の平均座標位置を「重心」として割り出すc. 重心から最も近い距離にある点で再度分類し直すd. b, cを変化がなくなるまで繰り返す
Mahout in ad:techRandom forest
AWSをハイパフォーマンスで使うには
● AWSの中の人の発表● AWSを利用する人たちの動機
○ 広告とAWS■ 配信、RTBで利用■ スケーラブル
○ ログ集計■ EMRを利用した柔軟なデータ解析
○ キャンペーンサイト■ 一時的なリソース調達のため
● 業界別にリファレンスアーキテクチャを用意している(広告配信システムも有る)
AWSをハイパフォーマンスで使うには
事例紹介1
● 某広告配信企業の事例○ リタゲに強いDSP○ 秒間1万以上のbidリクエストreqを処理○ 月刊250億bidリクエスト○ フルAWSでシステムを構築
● S3 ログ保存
● SimpleDB ユーザデータ、商品情報格納。
● EC2 フロントサーバ。HBaseにも利用。
● EBS Hbase用のストレージ
● ELB フロントサーバの負荷分散
● Cloud front バナー画像やJSの配信に利用(CDN)
● SQS 社内データのリージョン間レプリケーションに利用。
AWSをハイパフォーマンスで使うには
事例紹介2
● 某社(S3とEMRを利用)○ 年間3.6TBのデータをEMRでレポート作成。○ 運用費は月額50万円。
AWSをハイパフォーマンスで使うには
DynamoDBの紹介
● 運用管理必要なし● 低レイテンシ、SSD(超高速)● プロビジョニングスループット● 記憶領域が無制限。
AWSをハイパフォーマンスで使うには
料金例
● 100億bid + 30億imp $5,142
● 300億bid + 100億imp $16,427 + 1TBあたり$1,317
● 1,000億bid + 300imp $51425
● 自社の環境と組み合わせて上手くつかってください。
ErlangによるSSP側RTB
● 発表資料
JenkinsとHadoopを利用した継続的デー
タ解析環境の構築
● 発表資料
マーケティング&UXデザイン
Webサイトパフォーマンスと売上の関係性
● 日本のウェブサイトは遅い○ アマゾン(早い、少ない、シンプル)○ 楽天(遅い、多い)
● なぜ日本のウェブは最適化されていないか○ 通信インフラが安定している(国土が狭く、回線も太い)○ システム担当者とウェブ担当者が別管轄○ 日本のサイトは基本的に表示スピードが遅い
● ウェブパフォーマンスオプティマイゼーション○ ダサいサイトでも、文句は言われるが使われる○ 遅ければそもそも使われない
マーケティング&UXデザイン
Webサイトパフォーマンスと売上の関係性
● パフォーマンスを上げればビジネス価値になるのではないか?○ 検証サイクル
i. アイデアii. ペルソナ(仮想的なユーザ像)iii. 共感マップiv. 5W3Hv. ビジネスモデルキャンバスvi. ワイヤーフレーム
マーケティング&UXデザイン
Webサイトパフォーマンスと売上の関係性
共感マップ
マーケティング&UXデザイン
Webサイトパフォーマンスと売上の関係性
5W3H
● 5W3H○ What 何を【課題】○ Why なぜ【動機】○ Who 誰が【対象】○ When いつ【時期】○ Where どこで【場所】○ How どのように【手段】○ How many どのくらい【規模】○ How much いくら【費用】
マーケティング&UXデザイン
Webサイトパフォーマンスと売上の関係性
マーケティング&UXデザイン
Webサイトパフォーマンスと売上の関係性
● 思い込みを排除する○ 定量的な性能の向上○ 搭載している機能数○ 先端技術の採用○ 安全性が高い、障害がない○ (割りと)安価
● 検証のサイクルを早く回す
● サービス提供側が付加価値と思っているものはユーザの要求でない場合がある
● 存在しないセグメントに対して売っている可能性がある。
● ビジネスモデルキャンバスで鋭く追求!
オンライン広告の発展
● 1995年
○ 昔は超シンプル(媒体と広告主・広告代理店のみ)な売
買だった。
● 2000年
○ 媒体と広告主の間にアドネットワークが入って、アドネット
ワーク経由で売買されるようになった。○ 枠が増えすぎて空き枠が出てくるようになったため。
オンライン広告の発展
● 2005年
○ アドエクスチェンジの登場。
○ アドネットワークでも媒体が足りない or 広告主が足りないと
いうことが発生し、売り先が必要になった。○ そのためにアドエクスチェンジが登場した。
オンライン広告の発展
● 2010年
○ DSP、SSP、データエクスチェンジの登場。
○ アドネットワーク、アドエクスチェンジのどれを選択すれば
広告として成果が出るかを広告主が選ぶようになった(DSP)
○ 媒体がオーディエンスに合った広告を出してeCPMを高
めたいと考え出した(SSP)
オンライン広告の発展
● 2010年
○ コンピュータとコンピュータの取引が生まれ、リアルタイム
で取引ができるようになった。○ 媒体はリアルタイムでimpを販売できるようになった。
○ 広告主はリアルタイムでimpを購入することができるように
なった。
オンライン広告の発展
● 2010年
○ 媒体は複数の広告在庫を受け入れることができるように
なった。○ より収益の高い(広告単価の高い)広告在庫を選択する
ことを追求することができるようになった。
オンライン広告の発展
● SSPの仕事○ 広告販売はマニュアルからオートマティックへ○ 大量・高速の配信○ 連続稼働○ 大量ログの利活用○ 媒体に最もお金を払ってくれる広告在庫を選ぶ
オンライン広告の発展
● 期待収益の計算
オンライン広告の発展
● 期待収益の計算○ 前処理
■ 異常なデータの除去■ ログを必要な粒度にする■ データを整形する
● Luceneでクローラが拾ってきたウェブページから得た特徴語等の処理
■ ユニークユーザ別にまとめる● Hadoop and HBaseでログを切り刻み、個別のIDに応じて集合を
作る処理
■ 異常値を弾く● これが分析のキモ(秘密)
オンライン広告の発展
● まとめ○ 今広告業界はカオスになっているが、これは自然の流れ
でこうなった○ JPカオスマップ2012
感想
● 非常に熱気あふれる会だった。● 今回は無料パスだったが、規模と内容から言っ
て、非常に価値あるイベントと感じた● 勉強会に関しては今回初開催とのことだが、非
常に内容が濃くレベルも高かった● 来年は弊社開発側からも事例紹介できるように
やっていきたいと思った。
参考URL
● Random forest imagehttp://www.google.com/url?q=http%3A%2F%2Fwww.springerimages.com%2FImages%2FRSS%2F5-10.1186_1471-2164-11-274-0&sa=D&sntz=1&usg=AFQjCNEoQZ_R_WBKV5lEN-2nXFvcLAChIg
● k-meanshttp://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-visualise/
● 共感マップ
http://prosaic-storage.cocolog-nifty.com/blog/2012/02/post-ffa8.html
● アドテクノロジー概論
http://www.google.com/url?q=http%3A%2F%2Fmarketingis.jp%2Farchives%2F1844&sa=D&sntz=1&usg=AFQjCNGEvTUMG5Cx-WgwOaqAjQqL59_-Mw
● JPカオスマップ
http://www.google.com/url?q=http%3A%2F%2Flivedoor.blogimg.jp%2Fdennis_jp%2Fimgs%2F7%2F6%2F7608e147.jpg&sa=D&sntz=1&usg=AFQjCNHrTW8sKTD0Wcq_5_k9kaVpQJysiQ
参考URL
● 5W3Hhttp://iso-labo.com/labo/5W3H_6W2H_5W2H_5W1H.html
● ビジネスモデルキャンバス
http://blog.goo.ne.jp/xmldtp/e/e8d8bccd1d5575a1df3d5d8ffb8a4ebd