第45回PHP勉強会(里洋平)

Post on 28-May-2015

1.629 views 0 download

description

第45回PHP勉強会資料

Transcript of 第45回PHP勉強会(里洋平)

PHPでTwitter Bot作った

家計簿ったー(α)の紹介

里 洋平 (yokkuns)

自己紹介

● ID:yokkuns● 名前:里 洋平● 職業:Webエンジニア● 出身:種子島● 趣味:プログラミングとか● 仕事では、PHPではなく、主にPerl

家計簿ったーとは

● 支出を投稿すると、自動で分類して記録してくれるサービス。

● 詳しくは、こちら。– http://d.hatena.ne.jp/yokkuns/20090728/1248797834

アジェンダ

● 背景● 全体の流れ● 分類の方法● まとめ

背景

皆さん、Twitterって知ってますよね?

背景

自分の周りでは、今Twitterブーム

背景

さらに、言うと

背景

Twitter Botの開発ブーム

背景

こんなやつら

背景

俺も何か作りたい!

背景

でも、何作ろう?

背景

昔作ったは良いけど結局使わなかった

携帯用家計簿サイトのことを思い出す

背景

家計簿付けるために

ノートを開いて手で書いたり、

Pc立ち上げてエクセル使ったり

そういうのが面倒だから作った

背景

・・・のだが、、、

背景

家計簿のために携帯を出すのも面倒だった。。。

背景

だけど、今ならTwitterがある!

背景

Twitterなら、基本ずっと立ち上げてるので

家計簿のためにわざわざってならない!

背景

ってことで、家計簿BOTになりました。

全体的な流れ

● Twitter用のライブラリとか使わずに、普通にsimplexml

● 取得したデータを、Chain of Responsibilityパターンで処理

● 支出の投稿で不明なフォーマットは、解析して分類

分類方法

● ベクトル空間モデル使ってる● あらかじめ、項目をベクトル表現● つぶやきをベクトル変換● 類似度は両ベクトルの余弦● 一番類似度が高い項目に分類

分類方法 - 学習データ生成

学習データ

作成

Web API

入力データ

検索 APIキーフレーズAPI

分類方法 - 分類

学習データ

類似度計算

登録

Web API

検索

検索 APIキーフレーズAPI

まとめ

● 今回自然言語処理を初めてやってみたが、結構数学的で面白い

● botは、普通のプログラミングと違って速度を求められないので、多少重い処理をしても気にならない

● Web APIをいっぱい叩ける● なので、簡単に作れる