Php Lt 20080316

14
方向性の分析でもしてみよう 方向性の分析でもしてみよう おすすめにも、方向性があってもよくね ? NEMOTO Soshi (id:nemo/ twiter:nemoto)

Transcript of Php Lt 20080316

方向性の分析でもしてみよう方向性の分析でもしてみようおすすめにも、方向性があってもよくね ?

NEMOTO Soshi (id:nemo/ twiter:nemoto)

最初は自己紹介最初は自己紹介 ?? id:nemo◦ ごめんなさい、ほとんど書いてません。

◦ ( 来年度の目標 -> blog 書く

株式会社ムロドー

◦ もうすぐ一周年

◦ python づいている ? python camp 行ってきた

◦ 人材募集中

◦ 昨年まで某社でトラブル対策 KnowHow 貯め

◦ php は、 3->4 のあたりから

検索結果、おすすめでの不満検索結果、おすすめでの不満

ずらっと出てくるのがイヤ。

[php] search - php リファレンス <-- 言語仕様とか

- PHP Hacks <-- 書籍とか

- PHP フレームワーク <-- ツールとか

- phpspot <-- ??

※いろいろ出てくるが、今調べたい方向性があるはず。

似たもの分析をして、方向性似たもの分析をして、方向性

まずは、 Amazon と、ニコ動で。◦ データ収集 :

Amazon: amazon API で、マイリスト

マイリストへの入り具合を見て、似たタイプの商品ごとに、分類してみよう。

マイリストは、時流に乗ってちょっと自粛

( 本当は、誤って delete コマンド )

ニコ動の分析ニコ動の分析 ??

A. マイリストから (ry

B. 動画についているタグから タグの分布から、タグをグルーピング ? グループに入っている動画は似ている ?

グループが方向性として使えないか

手法とデータ手法とデータ

数量化法 ( 林式 )◦ 0/1 行列から、次元を下げてくれる

再生 Top5000 で。◦ 検索で 5000 動画の情報を取得し、それぞれの動画のタグを改めてゲット。

→ ばらつきすぎて分からん !

データの選択データの選択

最初にタグで絞る◦ 登録タグで多いものから、検討

◦ ジャンルがある程度固定されるもの

「初音ミク」「アイドルマスター」あたりか ?

※「エンターテイメント」、「スポーツ」は広すぎ。

「エロゲ」は予備知識少なすぎ。

※ これで、突如「ミク」「アイマス」に詳しくなって

みたり・・

改めてデータと手法改めてデータと手法

「ミク」「アイマス」の各タグでの再生Top3000 をゲットし、タグもとる

それぞれ、タグの分布から分析

数量化のロジックは、 C のライブラリにした。

php エクステンション化は終わってない。

状況状況

「初音ミク」データ◦ 分析中

「アイドルマスター」データ◦ とりあえず完了

分析結果分析結果

方向性 - 1◦ +0.579 Tag[ 作者は病気シリーズ ]◦ +0.677 Tag[im@s コミュ ]◦ +0.520 Tag[ ニヤニヤ動画 ]◦ -0.503 Tag[ 真ソロ ] ( キャラの一人 )

方向性 - 2◦ +0.853 Tag[im@s ノーマル pv]◦ +0.678 Tag[ 真ソロ ]

分析結果分析結果 (2)(2) 方向性 - 3◦ +0.793 Tag[ 真美 ] ( キャラの一人 )◦ -0.522 Tag[ ニヤニヤ動画 ]◦ +1.390 Tag[ 歌ってみた ]

方向性 - 4◦ +0.635 Tag[ アイマスネタ ]◦ +0.829 Tag[im@s オールスター ]

分析結果分析結果 (3)(3) 方向性 - 5◦ -1.333 Tag[ 音楽 ]◦ -0.880 Tag[ アイマス remix]◦ +1.724 Tag[ 歌ってみた ]

◦ 10 まで、音楽、歌ってみた系

というわけでというわけで

実際、途中なので途中で終わってます。

残件 ?◦ 元データの精度上げ

◦ 分析結果のグルーピング ( クラスター )◦ 結果の解釈

ありがとうございましたありがとうございました

PHP ほとんど出てきませんでした。。

そのうち、サービス作るので (ry◦ ※ニコ動関連、ではなく、分析関連

◦ NEMOTO Soshi@Mulodo Inc.