Sedue at Hatena::Bookmark

Post on 12-Jul-2015

1.157 views 0 download

Transcript of Sedue at Hatena::Bookmark

Agenda

全文検索機能の紹介スクリーンショット

「はてブらしい」ランキング

検索エンジンSedueのご紹介Sedueの特徴

はてブでのSedue利用方法

今後の展開

全文検索機能の概要

ブックマークされた全ページの内容を検索

約1000万件

全文検索エンジンSedue(セデュー)を用いて構築

「はてブらしい」検索エンジン独自のランキングアルゴリズム

ブックマーク数・情報鮮度をリアルタイムに利用

お気に入りユーザーのコメントを表示

検索フォーム

広告スペース

検索画面

検索結果にお気に入りユーザーを表示

独自のランキングアルゴリズム

情報量が多く、注目されているものを重要視

各種情報を総合的に利用ブックマーク数・情報鮮度・etc.

必ずしも公式サイトが上位に来ない

技術系の話題に関しては、非常に強い

リアルタイム性を追求「検索した時点」のブクマ数を利用してスコアリング

誰かがブクマすると、そのエントリの価値が上がる

全文検索エンジンSedue

全文検索エンジンSedue概要

インメモリ型分散検索エンジンIPA未踏ソフトウェア創造事業の成果を実用化

検索用インデックスを出来る限り圧縮オンメモリでの検索を実現

漏れのない検索

モバイル検索「エフルート」などでの実績有り

Sedueの特徴

スケーラビリティ台数を増やすだけで、文章容量の増加に対応

耐障害性検索サーバーを自動監視

サーバーが落ちても、自動的にフェイルオーバー

即時性2~3分でインデクシング

はてなブックマークでの利用方法

ブックマーク追加

検索クエリー

登録

インデックスの作成

今後の展開

今後の展開

Web全体を対象にした検索エンジンの構築

ブックマークされたページをシードにする

汎用的な検索エンジンへの進化

検索精度の向上/周辺機能の拡充表記ゆれ (Yahoo/yahoo)

もしかして機能、人気キーワード機能

検索クエリログを使用した精度向上ランキング学習、パーソナライズ、etc