ツイートID生成とツイッターリアルタイム検索システムの話

ツイートID生成とツイッターリアルタイム検索

システムの話

PFIセミナー

Eiichiro Iwata

2012年 12月20日

自己紹介

l 岩田英一郎 (eiichiroi)l 元さいたまな人

l 経歴l 2009年6月～アルバイトl 2010年3月　埼玉大学大学院理工学研究科修了l 2010年8月～ PFI入社

l 所属l 製品開発部l Sedueプロジェクト

l 仕事l Sedue(検索エンジン)の開発

l コア～運用ツールを幅広くl 研究開発成果の取り込み

本日の内容

l ツイートID生成システムSnowflakeの解説l ツイートIDの構造と生成方法

l リアルタイム検索システムEarlybirdの解説l 5億ツイート日(約6000ツイート秒)で増え続けるツイートを即時に検索できるシステム

l アーキテクチャの概要l インデックスの構成

突然ですが

ツイッターIDの生成方法を

知っていますか5

これ

本題

ツイートID生成システムSnowflakeとは

l ユニークなIDを生成するネットワークサービスl ツイッターのツイートID(ステータスID)の割り当てに使われているl ツイッター社がOSSで公開中 ()

l 特徴l 64 bitのIDを生成

l ざっくり時刻順l 速い

l 10000 ID秒のスピードでIDを生成できる(1プロセスあたり)l レスポンス 2 ms (+ネットワークのレイテンシ)

l スケールするl 複数のマシンプロセスで協調動作しないl 並べただけスケールする(はず)

8() httpsgithubcomtwittersnowflake

Snowflakeが開発されるまで

l ツイートの流速増加とツイッターのシステム移行l 5億ツイート日(約6000ツイート秒) (1)

l 2012年10月時点l MySQLからCassandraやGizzard(Sharded MySQL)への移行

l CassandraがID生成をデフォルトで提供していないl ステータスIDの変遷 (2 3 4)

l 2006年5月～符号付き32bitl 2009年6月～符号無し32bitl 2009年9月～ 64bitl 2010年11月～ 64bit(現状のsnowflake)

l 要求l スケールする(分散できる)

(1) Report Twitter hits half a billion tweets a day(2) Twitpocalypse - TwitterメッセージIDの64ビット科- いよいよ明日に実施(3) Status IDs are changing on 21st September(4) Announcing Snowflake

生成するIDの構造

l 64bitを3つのブロックに分割l 時刻(41bit69年分)

l (おそらく)snowflakeの運用開始時刻からの経過時間(ミリ秒)l 2010年11月4日(epoch 1288834974657)が基点

l マシンID(10bit1024台分)l データセンターID(上位5bit)ワーカーID(下位5bit)l 起動時にZookeeperか設定ファイルから取得

l 連番(12bit4096個)l 同時刻同マシンでのID重複回避用ワーカー別

l 参考バルス砲 25088 ツイート秒10

時刻マシンID 連番

41bit 10bit 12bit

ツイートIDのデコード(デモ)

l ツイートID = 279622981959970816l 時刻 = 1355502288700 (2012-12-15 012448 +0900)l マシンID = 39

l データセンタID = 1l ワーカーID = 7

l 連番 = 011

生成するIDの特徴

l 64bit整数l ユニークl 時間とともにIDの値が増加する

l ステータスIDでざっくり時刻順にソートできる(k-sorted)l 目標精度は1秒l 1秒以内に投稿されたツイート間では順序を保証しない

l 実際の時刻順と逆になることもある

生成するIDの特徴 - k-sorted

l 系列α = (a1 an) が k-sorted であるとはl 全ての 1 ≦ i j ≦ n に対して i lt j-k ならば ai ≦ aj

l 概要l 0-sortedは普通のソートと等価l 距離 k 以内の要素間での順序は不問

l 例 (2 1 3)は1-sorted

l k-sortedの性質 (1 2)

l 系列αとkが与えられたときにk-soterdかどうかはO(n)で判定可能l 系列αが与えられたときに最も小さいkの値をO(n)で計算可能l 2つのk-sorted系列が与えられたときにそれらをマージした1つの

k-sorted系列をO(n)で計算可能l 系列αをk-sortedを満たすようにするにはO(n log k)で計算可能

a1 ai an ai-k+1

(1) Roughly Sorting A Generalization of Sorting(2) Roughly Sorting Sequential and Parallel Approach

生成するIDの特徴 - k-sortedのkの値

l 複数のマシンで完全に同じ時刻を参照できたと仮定するとl 222 -sorted 22bit = 10bit(マシンID)+12bit(連番)

l 精度 1ミリ秒l 232-sorted 32bit = 約10bit(時刻)+10bit(マシンID)+12bit(連番)

l 精度 1秒l 実際にはマシンID連番が疎なので k はそこまで大きくないはず

l 3000 ツイート秒なら連番は3くらいl NTPの精度はミリ秒単位 ()

l 現実的にはこちらの方が精度のネックになりそうl kの値自体にあまり意味はないはず

41bit 10bit 12bit

() httpwww2nictgojpaeriststspPubNtpqahtmlq2-2

その他

l マシンIDや連番の実際の値 ()

l データセンターIDは1l ワーカーIDは0～4l 連番は0～2

l モノトニックタイムl 設定で変更できない単調増加な時刻

l linuxではclock_gettime()などで取得可能l 時刻が巻き戻ると厄介

l IDの一意性を保証するのが面倒になるl snowflakeでは巻き戻りが発生したときはエラー

l 最後にIDを生成した時刻を記憶しておくだけ

15() はてな匿名ダイアリー snowflakeの実際

ツイートID生成システムSnowflakeとは(再掲)

リアルタイム検索システムEarlybirdの概要

l ツイッターリアルタイム検索エンジンl Java製l オープンソースの全文検索ライブラリLuceneを魔改造l 転置インデックスl クエリ言語(Boolean query)

l ANDORNOTl フレーズクエリl ワイルドカードクエリは未対応

l 2010年10月にMySQLベースの検索システムから移行l 出典

l Earlybird Real-Time Search at Twitter ICDE 2012l Michael Busch Krishna Gade Brian Larson Patrick Lok

Samuel Luckenbill and Jimmy Lin17

Earlybirdの性能の実績値

l ツイートの登録速度l 3000 ツイート秒 (2012年10月時点で6000 ツイート秒)

l ツイート登録後すぐに検索可能にl ～10秒以内l 検索対象は6～9日以内のツイートのみ

l 検索性能l 低レイテンシ(平均50 ms)

l 高スループット(20億件日 ≒ 2300qps)

Earlybirdのアーキテクチャ

bull クエリのパースbull 複数のEarlybirdへ問い合わせ

bull Userのローカルソーシャルグラフを渡すbull 問い合わせ結果のマージ

bull ツイートのトークナイズbull メタ情報(言語など)を付与

bull 動的更新の通知bull リツイート数の更新bull お気に入りの更新bull

bull ツイートの検索bull ランキング

bull リツイート数bull お気に入り数bull bull Userのローカルソーシャルグラフ

bull 登録先のツイートbull ハッシュでパーティションbull ハッシュの方式は不明

Active Index(1個)bull検索(読込)+文書登録(書込)bull更新が速いデータ構造bull一杯になったら裏で最適化bull 1600万件で67GB程度

Earlybirdの構成

Earlybird

Optimized Index(11個)bull検索(読込)専用bull 224 ≒ 1600万件インデックスbull圧縮(圧縮率55程度)

bull 1600万件で37GB程度

bull 更新するインデックスを限定bull 1億件台

bull 12インデックス台bull マシンスペック

bull クアッドコア2つbull RAM 72GB

bull 64GBをJVMのヒープに割当

辞書の構成(12)

l 辞書l 単語とPosting List(その単語を含む文書IDのリスト)を紐付ける

l 自作ハッシュテーブルで実装l オープンアドレス法をArrayで実装l Java標準のHashMapはGCと相性が悪い

l チェーンで繋いだオブジェクト達の寿命が長いl 辞書に含める情報

l (0) 単語IDl (1) その単語のPosting Listの長さl (2) その単語のPosting Listの末尾へのポインタl それぞれ別々の配列で管理(詳細は次スライド)

l 単語IDを配列のインデックスとしてアクセスするl 速度とメモリ効率を上げるため(Java)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

(1) Posting Listの長さ

(2) 末尾へのポインタ

単語

辞書

転置インデックス

単語の数

「pfiseminar」に対応するPosting List

「なう」に対応するPosting List

自作ハッシュテーブル

Active Index

l 要求l 文書登録(書込)処理が高速 (全サーバで6000ツイート秒)l 検索(読込)処理も並列処理l 時刻降順に検索したい (とにかく最近の情報が重要)

l 特徴l (1) Posting Listは文書ID昇順l (2) Postingは32bit整数l (3) Posting Listのメモリはまとめて確保

l 削除の対応方法は不明l 削除フラグを持ってフィルタリングしているとか

Active Index - (1) Posting Listは文書ID昇順

l 利点l 文書登録時にはPosting Listの末尾に追加するだけ

l 検索時にはPosting Listの末尾から逆順に辿るだけ

l 欠点l Posting Listの差分圧縮と相性が悪い

l 検索時にPosting Listを逆順に辿れる差分圧縮は複雑‒ ブロックベースのPForDelataとか

l 文書登録のレイテンシが増加l Active IndexでのPosting List圧縮は諦め

2 7 11 15pfiseminar pfiseminarなう

文書ID 15

pfiseminar2 7 11 15pfiseminar

Active Index - (2) Postingは32bit整数

l 文書ID(24bit)l 1インデックス辺り224(≒ 1600万)件が上限

l 単語位置(8bit)l 140文字なので8bitで十分l 1件にある単語が複数回出現するときは別のPostingとして扱う

l 利点l コンパクトl Posting Listが整数配列になりメモリの事前割り当てが容易

l ブロック単位でまとめて割り当てちゃうl キャッシュにも優しい

文書ID単語位置

24bit8bitビットレイアウトは違うかも

Active Index - (3) Posting Listのメモリはまとめて

l 4種類のpooll 1poolあたり215 posting(必要に応じて拡張)複数のsliceからなるl sliceのサイズが異なる(21 24 27 211)l sliceを繋げて長いPosting Listを実現

l sliceのサイズが小さい方からslice単位で順に割り当てて行くl sliceの最初の要素は前のsliceの末尾へのポインタ(32bit)

l 文書集合中の単語の分布はジップの法則でモデル化しているl 長いPosting Listが少数短いPosting Listが多数l 工夫しないとメモリ効率が悪く速度が遅くなってしまう

l この実装ではPosting Listの拡張時にメモリコピーが発生しない26

pool 3

pool 2

pool 1

pool 0

l sliceのポインタl 32bitでpostingと同じサイズ

offset in slice slice index 11

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

offset slice index 01

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

ビットレイアウトは違うかも

Optimized Index

l 要求l 検索(読込)処理のみl 文書登録(書込)処理は受け付けない

l 特徴l Active Indexが一杯(223件)になったら裏でOptimized Indexを構築l Optimized Index構築後スワップ(古いインデックスは削除)l 短いPosting Listは時刻降順にソート

l 検索時には先頭から順方向に辿るl 長いPosting List(長さ1000以上)はブロック単位で圧縮

l PForDeltaやSimple9と似たような感じl Active Indexの55くらいのメモリ使用量

l 1600万件67GBが37GB程度に28

Optimized Index - 長いPosting Listの圧縮

l 時刻降順のPosting Listを適当に区切ってブロック単位で圧縮l 固定長ブロック256byteを複数並べたもの

l 先頭4byte ブロックのスキップ用l ブロック先頭の生posting1つ

l 次の4byte ブロックのヘッダ(解凍時に必要)l 圧縮されている文書数 nl 圧縮のビット幅 b = ceil(max(gap)) + ceil(max(pos))

‒ n (ceil(max(gap)) + ceil(max(pos))) lt= 1984(= 2488)

l 残り248byte 圧縮l n個の(文書IDの差分単語位置)の組を圧縮したもの

posting header (文書IDの差分単語位置)の組n個を圧縮したもの

256byteblock

posting header

4byte 4byte 248byte 4byte 4byte

まとめ

l ツイートID生成システムSnowflakeの解説l ツイートID構造と生成方法

l ざっくり時刻順速いスケール

l Active Indexl Optimized Index

Copyright copy 2006-2012

自己紹介

l 岩田英一郎 (eiichiroi)l 元さいたまな人

l 経歴l 2009年6月～アルバイトl 2010年3月　埼玉大学大学院理工学研究科修了l 2010年8月～ PFI入社

l 所属l 製品開発部l Sedueプロジェクト

l 仕事l Sedue(検索エンジン)の開発

l コア～運用ツールを幅広くl 研究開発成果の取り込み

本日の内容

突然ですが

これ

本題

41bit 10bit 12bit

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

本日の内容

突然ですが

これ

本題

41bit 10bit 12bit

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

突然ですが

これ

本題

41bit 10bit 12bit

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

これ

本題

41bit 10bit 12bit

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

これ

本題

41bit 10bit 12bit

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

本題

41bit 10bit 12bit

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

41bit 10bit 12bit

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

41bit 10bit 12bit

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

41bit 10bit 12bit

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

l 連番 = 011

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

a1 ai an ai-k+1

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

41bit 10bit 12bit

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

その他

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

Earlybirdの構成

Earlybird

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

辞書の構成(12)

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

辞書の構成(22)

pfiseminar 0

なう 1

単語ID

単語

辞書

単語の数

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

Active Index

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

文書ID 15

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

pool 3

pool 2

pool 1

pool 0

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

11bit 19bit 2bit

pool 3

7bit 23bit 2bit

pool 2

4bit 26bit 2bit

pool 1

o slice index 00

1bit 29bit 2bit

pool 0

pool index

Optimized Index

256byteblock

posting header

まとめ

Optimized Index

256byteblock

posting header

まとめ

256byteblock

posting header

まとめ

ツイートID生成とツイッターリアルタイム検索システムの話

Technology

Transcript of ツイートID生成とツイッターリアルタイム検索システムの話

ユーザマニュアル...ページをチェック！①訪問前に経路 検索！①スマホアプリから検索 ②メール、電話もワン クリックで！②メール、電話も

索 引 · 2021. 2. 19. · 索 引 索 引 1

この文書は10ページあります トラス橋のお話し2 用 語 索 引 索引の参照番号は、章・節 です 英字 bowstring truss 2.7 brace 0 braced rib 2.3 diagonal

索引 · 2015-11-26 · 214 215 索 引 索 引 索引 hn1280－55l・・・・・・・・・・・・・・・・・・・・・・・ hn1280－600l ...

SEWM2010 信息检索评测 —— 文献检索

Innojoy专利搜索引擎 - nwpu.edu.cntushuguan.nwpu.edu.cn/Innojoy.pdf12 专利检索-多种检索方式简 单 检 索 高 级 检 索 号 码 检 索 AI 智 能 检 索 图 片

54 電話／テレビ電話...電 話 ／ テ レ ビ 電 話 56 電話／テレビ電話のかけかた テレビ電話について テレビ電話機能は、ドコモのテレビ電話に対応し

ほのぼのNEXT を導入のお客様へご案内 対話検索機 …support2.ndsoft.jp/support/rmt/...話検索機能 ऌஆけふくण 呼び しन し う！ ऽर रNEXTर調べडいकप（キーワー

检索功能 —— 论文检索、期刊检索、学位检索、会议检索、作者检索、机构检索、基金检索、关键词检索、中华医学会 专区检索、中国医师协会专区检索、企业在线检索、医院空间检索

テキストストリームの文脈を考慮した補完情報検索...慮した補完情報検索手法を提案する．話題構造のコンテキスト は，過去の関連する話題構造系列であり，話題構造の結合に基

Twitterの実況ツイートを利用した タイムライン上のネタバレ情報 …sp.cei.uec.ac.jp/thesis/saitoh_master2016.pdf · 提案手法は, ハッシュタグのついた実況ツイートをツイート検索で収集し,

9 2 1 操作早見表 - IWATSU...システム電話機 詳しい操作は「テレモアEX（WX-824-EX）」をご覧ください。検索して 電話を かける 1電話帳を表示

第十課 Lesson 10.1. 話 說話 talk 說話 talk 電話 telephone.

五 十 音 順 索 引 〇五十音順索引 ・五十音順索引 ・本文 ... · 2020-05-08 · 五 十 音 順 索 引. 〇五十音順索引 ・五十音順索引 ・本文

2005 GreaTeach 話畫 ‧ 畫話

プロ野球の実況ツイートを対象 とした マルチラベル 分類

Google搜索 与 Inter网 的信息检索

如何使用SciFinder获取科技信息 - library.fudan.edu.cn · 检索——文献检索 文献检索方法 – 主题检索 – 作者名检索 – 机构名检索 – 文献标识符检索

生産性＆効率アップ必勝マニュアルまた、過去のツイートも検索できるので、右ページのようにハッシュタグ など検索されやすい工夫をすることで、特定のツイートだけを一覧表示さ

專利檢索 - tipo.gov.tw · 專利檢索與專利分析 3 圖1 專利檢索流程圖 1.確定檢索主題 確定檢索主題乃是進行專利檢索的首要步驟， 檢索者必須在專利檢索進行之前，對欲檢索之技術

ユーザマニュアル...ページをチェック！①訪問前に経路検索！①スマホアプリから検索 ②メール、電話もワンクリックで！②メール、電話も

索引 · 2021. 2. 19. · 索引索引 1

この文書は10ページありますトラス橋のお話し2 用語索引索引の参照番号は、章・節です英字 bowstring truss 2.7 brace 0 braced rib 2.3 diagonal

索引 · 2015-11-26 · 214 215 索引索引索引 hn1280－55l・・・・・・・・・・・・・・・・・・・・・・・ hn1280－600l ...

Innojoy专利搜索引擎 - nwpu.edu.cntushuguan.nwpu.edu.cn/Innojoy.pdf12 专利检索-多种检索方式简单检索高级检索号码检索 AI 智能检索图片

54 電話／テレビ電話...電話／テレビ電話 56 電話／テレビ電話のかけかたテレビ電話についてテレビ電話機能は、ドコモのテレビ電話に対応し

ほのぼのNEXT を導入のお客様へご案内対話検索機 …support2.ndsoft.jp/support/rmt/...話検索機能 ऌஆけふくण 呼びしन しう！ ऽर रNEXTर調べडいकप（キーワー

检索功能 —— 论文检索、期刊检索、学位检索、会议检索、作者检索、机构检索、基金检索、关键词检索、中华医学会专区检索、中国医师协会专区检索、企业在线检索、医院空间检索

テキストストリームの文脈を考慮した補完情報検索...慮した補完情報検索手法を提案する．話題構造のコンテキストは，過去の関連する話題構造系列であり，話題構造の結合に基

Twitterの実況ツイートを利用したタイムライン上のネタバレ情報 …sp.cei.uec.ac.jp/thesis/saitoh_master2016.pdf · 提案手法は, ハッシュタグのついた実況ツイートをツイート検索で収集し,

9 2 1 操作早見表 - IWATSU...システム電話機詳しい操作は「テレモアEX（WX-824-EX）」をご覧ください。検索して電話をかける 1電話帳を表示

第十課 Lesson 10.1. 話說話 talk 說話 talk 電話 telephone.

五十音順索引〇五十音順索引・五十音順索引・本文 ... · 2020-05-08 · 五十音順索引. 〇五十音順索引・五十音順索引・本文

プロ野球の実況ツイートを対象としたマルチラベル分類

Google搜索与 Inter网的信息检索

如何使用SciFinder获取科技信息 - library.fudan.edu.cn · 检索——文献检索文献检索方法 – 主题检索 – 作者名检索 – 机构名检索 – 文献标识符检索

生産性＆効率アップ必勝マニュアルまた、過去のツイートも検索できるので、右ページのようにハッシュタグなど検索されやすい工夫をすることで、特定のツイートだけを一覧表示さ

專利檢索 - tipo.gov.tw · 專利檢索與專利分析 3 圖1 專利檢索流程圖 1.確定檢索主題確定檢索主題乃是進行專利檢索的首要步驟，檢索者必須在專利檢索進行之前，對欲檢索之技術