Introduction and benchmarking of MeCab.jl #JapanR
-
Upload
michiaki-ariga -
Category
Software
-
view
1.544 -
download
3
description
Transcript of Introduction and benchmarking of MeCab.jl #JapanR
MeCab.jlつくってみたMichiaki Ariga @chezou
Japan.R 2014 @Freakout
大事なこと
の話はしません
Tokyoから来ました
自己紹介有賀康顕 / @chezou
ソフトウェアエンジニア@Cookpad
クックパッド本体のサービス開発
最近はレコメンドとか
JuliaTokyo / MLCT / kawasaki.rb
と私
そそのかされた😇
Julia Advent Calendar 参加者募集中です!http://qiita.com/advent-calendar/2014/julialang
日本で10枚くらいの ステッカー
http://goo.gl/9eMKt0
スターが一番多い!!!
つくったものたち
Julia100本ノック
ConfidenceWeighted.jl
MeCab.jl
MeCab.jl
工藤さん作の形態素解析器MeCabのJulia wrapper
これで、Juliaで自然言語処理ができる!!1
DEMO
で、速いの?
Benchmark平均処理時間
[sec
]
0
0.2
0.4
0.6
0.8
Ruby(node) Julia(node) Ruby Julia R
• 対象: ブログデータ(734kB) • 単語の頻度カウント • 10回の平均を取得 • Nodeと表層の2パターン
• RはRMeCabFreq()
https://gist.github.com/chezou/1f947423c6655c266e0a
ファッ!?
これは…!?
あ…ありのまま 今 起こった事を話すぜ!
「おれはRと戦っていたと思ったら いつのまにかCと戦っていた」
RMeCabはCだった
ちなみに…
Benchmark平均処理時間
[sec
]
0
0.2
0.4
0.6
0.8
Ruby(node)Julia(node) Ruby Julia R Julia(w/o gc)
• 対象: ブログデータ(734kB) • 単語の頻度カウント • 10回の平均を取得 • Nodeと表層の2パターン
• RはRMeCabFreq()
GCを抑えればよかった😇
Julia Advent Calendar 参加者募集中です!http://qiita.com/advent-calendar/2014/julialang
JuliaのPros/Cons
Pros
Cのコードを書かないでもバインディングできる
Cons
C++は(まだ)辛い
gc!!!