「再代入なんて、あるわけない」 ~ふつうのプログラマが関数型言語を知るべき理由~ (Gunma.web #5 2011/05/14)
20101009 gunma.web#2 スタパさんをつくるはなし
-
Upload
ivoryworks- -
Category
Technology
-
view
923 -
download
0
description
Transcript of 20101009 gunma.web#2 スタパさんをつくるはなし
スタパさんをつくるはなし
スタパさんをつくるはなしSTAPA-CLOUD
- にせものスタパさん -
@ivoryworks
2010.10.09 gunma.web #2
profile● 名前:KUROSAKI Luka ( クロサキ ルカ )
● 仕事:Webじゃない所でプログラムを書いてます
● 普段:Linuxをよくさわっています
● 最近:ARに興味あり● blog : Vamp Records http://www.ivoryworks.com/blog/
● Twit : @ivoryworks
スタパクラウド- にせものスタパさん -
むかし造りましたPHP+MySQL
で
いま流行りのクラウドじゃないよタグクラウドだよ
あと偽者じゃないよ。似せもの。似せてある。
スタパさんをつくるはなし
ものがたりのはじまり
2007年冬(古いね)人工無脳つくろうかな
スタパさんをつくるはなし
ものがたりのはじまり
どんな?
スタパさんをつくるはなし
この人の
このひとしってる?
スタパさんをつくるはなし
このひと
スタパさんをつくるはなし
スタパ齋藤● 国民的アイドル物欲番長
● もの凄いハイテンションな文体で各方面に色々書いているライターの人。
● 外見はロシア人
スタパさんをつくるはなし
さあつくろう
と思ったのだけど、人工無脳のおもしろい文章とか
どうやって作るのかよくわからないので、色々調べる内に『マルコフ連鎖』というものに出会う
(重要)
スタパさんをつくるはなし
マルコフ連鎖マルコフ連鎖とは、確率過程の一種であるマルコフ過程のうち、とりうる状態が離散的(有限または可算)なもの(離散状態マルコフ過程)をいう。また特に、時間が離散的なもの(時刻は添え字で表される)を指すことが多い(他に連続時間マルコフ過程というものもあり、これは時刻が連続である)。マルコフ連鎖は、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である(マルコフ性)。各時刻において起こる状態変化(遷移または推移)に関して、マルコフ連鎖は遷移確率が過去の状態によらず、現在の状態のみによる系列である。特に重要な確率過程として、様々な分野に応用される。
By Wikipedia
スタパさんをつくるはなし
マルコフ連鎖
むり
スタパさんをつくるはなし
やさしく解説
例えばこんな文章
『彼女はパンを食べて紅茶を飲んだ。』
スタパさんをつくるはなし
形態素解析で分解する
● 彼女(名詞)
● は(助詞)
● パン(名詞)
● を(助詞)
● 食べ(動詞)
● て(助詞)
● 紅茶(名詞)
● を(助詞)
● 飲ん(動詞)
● だ(助動詞)
● 。(特殊)
[彼女][は][パン][を][食べ][て][紅茶][を][飲ん][だ][。]
スタパさんをつくるはなし
マルコフ連鎖の一階の近似
● 文頭ー彼女
● 彼女ーは
● はーパン
● パンーを
● をー食べ
● 食べーて
● てー紅茶
● 紅茶ーを
● をー飲ん
● 飲んーだ
● だー。
● 。ー文末彼女はパンを飲んだ。(文法的にはOK)
(接頭辞ー接尾辞)の関係
スタパさんをつくるはなし
この一階の近似とやらを使ってスタパ的文章つくってやろう
何だかうまくいきそうだ
スタパさんをつくるはなし
ちなみに形態素解析はYahoo!にお願いした
● chasen、mecabuなど自前でできるのがあるけど,辞書が良さそう、という声が聞こえてきた。
● 当時何でもいいからWebAPIが使いたかった。WebAPIならなんでもよかった。けどYahoo!さんイイよ。
スタパさんをつくるはなし
スタパブログを元にさっそく試すためしに2つほど文章を生成してみる
1.フィッシュズームレンズデジカメのな撮っみよななどデジカメなをmmアイばかなやっぱmm立体で出はmmCCD、、思っ1考えれで、セット、コト21レンズです同じねデジカメ
2. レンズ。は相当はデジタル楽勝!
だめだ、
楽勝!じゃねえよ
スタパさんをつくるはなし
マルコフ連鎖の二階の近似● (文頭)彼女ーは
● 彼女はーパン
● はパンーを
● パンをー食べ
● を食べーて
● 食べてー紅茶
● て紅茶ーを
● 紅茶をー飲ん
● を飲んーだ
● 飲んだー。
● だ。ー(文末)
ちなみにこれだと原文と同一文しか生成されない。例文を間違えた。今気づいた。
スタパさんをつくるはなし
さっそく二階でスタパさん
マルコフなんとかというのはすごい二階にしたら、
おもしろい文章が出るんじゃないかな
スタパさんをつくるはなし
またまたスタパブログでためす これ、500万画素のダ! ちなみに、楽勝でふたつのダ! これ、超広角も撮れるってコトなフィーリング。それぞれのレンズでふたつのニュースをまとめ上げた拙者。それぞれの、画角等を使わず、500万画素の、縦位置で23mm、外観も撮れている。もうすぐ発売だ。あと、なんか、このデジカメをまとめ上げたような。
すげー!
ぱっと見それっぽい
スタパさんをつくるはなし
結局何階がいいのか● 階が大きくなると原文に近くなるので、文章の自然度は増すけど面白みがない。
● 階が少なくなると連続性が低くなるので、文章の自然度が損なわれる。たまにすごいのが出ることがあるけど。
● 蓄積データが多いと見たことない文章が出たりする。
● 蓄積データが少ないと何となく前見た事あるな、的な。
スタパクラウドは三階にしときました
スタパさんをつくるはなし
よしよし
スタパブログの過去記事はスクレイピングして保存
新しいのはRSSからcronで自動取得
自動化完了
スタパさんをつくるはなし
2007/12 スタパクラウド公開● 当初の予定(無脳)は忘れる
● 単に作るだけだとおもしろくないので、蓄積データにタグ情報をつけて、タグクラウドで表した
● 結構それっぽいテーマの文章になる
スタパさんをつくるはなし
2008/02 スタパブログで紹介● サーバ死亡
スタパさんをつくるはなし
この循環がすごい
スタパブログから文章もらって、蓄積して、スタパさん(本物)が遊んで、ブログに書いて、そのブログを読んで、蓄積して・・・。
スタパさんをつくるはなし
そんなこんなでフォローしてもらった
スタパさんをつくるはなし
おしまい
画像の使用許可もらいました
ありがとうスタパさん。そしてTwitterスゲー!