Unicode-v11-5

57
Unicode & 正規表現 4D デベロッパカンファレンス 2010

Transcript of Unicode-v11-5

Page 1: Unicode-v11-5

Unicode & 正規表現4D デベロッパカンファレンス 2010

Page 2: Unicode-v11-5

Clichy/2010-02-03

Unicode & 正規表現

Page 3: Unicode-v11-5

Clichy/2010-02-03

Unicode & 正規表現

•このセッションの内容‣ キーワード...文章をどこで分割 ?

‣ コレーション...テキスト比較の言語

Page 4: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?

Page 5: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式

Page 6: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式‣ 4D 11.1 まで : isalnum

Page 7: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式‣ 4D 11.1 まで : isalnum‣ 4D 11.2 以降 : work break

Page 8: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式

コードポイントで管理‣ 4D 11.1 まで : isalnum‣ 4D 11.2 以降 : work break

Page 9: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式

コードポイントで管理本来はワープロのため

‣ 4D 11.1 まで : isalnum‣ 4D 11.2 以降 : work break

Page 10: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式

コードポイントで管理本来はワープロのため

‣ 4D 11.1 まで : isalnum‣ 4D 11.2 以降 : work break‣ 4D 11.5 以降 : 日本語は11.1式, 他言語は11.2式

Page 11: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式

コードポイントで管理本来はワープロのため

‣ 4D 11.1 まで : isalnum‣ 4D 11.2 以降 : work break‣ 4D 11.5 以降 : 日本語は11.1式, 他言語は11.2式‣ 4D 12.0 : 11.1式, 11.2式から選択

Page 12: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式

コードポイントで管理本来はワープロのため

‣ 4D 11.1 まで : isalnum‣ 4D 11.2 以降 : work break‣ 4D 11.5 以降 : 日本語は11.1式, 他言語は11.2式‣ 4D 12.0 : 11.1式, 11.2式から選択

Page 13: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式

コードポイントで管理本来はワープロのため

‣ 4D 11.1 まで : isalnum‣ 4D 11.2 以降 : work break‣ 4D 11.5 以降 : 日本語は11.1式, 他言語は11.2式‣ 4D 12.0 : 11.1式, 11.2式から選択

Page 14: Unicode-v11-5

Clichy/2010-02-03

キーワード...文章をどこで分割 ?•11.1式, 11.2式

コードポイントで管理本来はワープロのため

‣ 4D 11.1 まで : isalnum‣ 4D 11.2 以降 : work break‣ 4D 11.5 以降 : 日本語は11.1式, 他言語は11.2式‣ 4D 12.0 : 11.1式, 11.2式から選択

Page 15: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語

Page 16: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

Page 17: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス

Page 18: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY

Page 19: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

Page 20: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)‣ >, < (文字列比較演算)

Page 21: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ >, < (文字列比較演算)

Page 22: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY‣ Position, Replace string

‣ >, < (文字列比較演算)

Page 23: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

Page 24: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

Page 25: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

Page 26: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

Page 27: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

TERTIARY STRENGTH

Page 28: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

PRIMARY STRENGTH

TERTIARY STRENGTH

Page 29: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

PRIMARY STRENGTHより緩い基準

TERTIARY STRENGTHより厳密な基準

Page 30: Unicode-v11-5

Clichy/2010-02-03

より緩い基準

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (

‣ =, # (

PRIMARY STRENGTH

TERTIARY STRENGTHより厳密な基準

Page 31: Unicode-v11-5

Clichy/2010-02-03

より緩い基準

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (

‣ =, # (

PRIMARY STRENGTH

TERTIARY STRENGTHより厳密な基準

Page 32: Unicode-v11-5

Clichy/2010-02-03

より緩い基準

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (

‣ =, # (

PRIMARY STRENGTH

TERTIARY STRENGTHより厳密な基準

Page 33: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

PRIMARY STRENGTH

TERTIARY STRENGTHより厳密な基準

より緩い基準

Page 34: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

PRIMARY STRENGTH

TERTIARY STRENGTHより厳密な基準

Page 35: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

PRIMARY STRENGTH

TERTIARY STRENGTHより厳密な基準

SECONDARY STRENGTH

Page 36: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

PRIMARY STRENGTH

TERTIARY STRENGTH

より厳密な基準

SECONDARY STRENGTH

Page 37: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

PRIMARY STRENGTH

SECONDARY STRENGTH

Page 38: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

Page 39: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

Page 40: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (文字列比較演算)

データベース

‣ =, # (文字列比較演算)

Page 41: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (文字列比較演算)

データベースデータベース

‣ =, # (文字列比較演算)

Page 42: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (文字列比較演算)

データベースデータベースランゲージ

‣ =, # (文字列比較演算)

Page 43: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (文字列比較演算)

データベースデータベースランゲージ

ランゲージ

‣ =, # (文字列比較演算)

Page 44: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (文字列比較演算)

データベースデータベースランゲージ

ランゲージ

‣ =, # (文字列比較演算)

ランゲージ

Page 45: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (文字列比較演算)

データベースデータベースランゲージ

ランゲージ

‣ =, # (文字列比較演算)

ランゲージデータベース

Page 46: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (文字列比較演算)

データベースデータベースランゲージ

ランゲージ

‣ =, # (文字列比較演算)

ランゲージデータベースランゲージ

Page 47: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (

データベースデータベースランゲージ

ランゲージ

‣ =, # (

ランゲージデータベースランゲージ

ランゲージQUERY BY FORMULA([T];([T]F=value & expression)

Page 48: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (

データベースデータベースランゲージ

ランゲージ

‣ =, # (

ランゲージデータベースランゲージ

ランゲージQUERY BY FORMULA([T];([T]F=value & expression)

データベース

Page 49: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (

データベースデータベースランゲージ

ランゲージ

‣ =, # (

ランゲージデータベースランゲージ

ランゲージQUERY BY FORMULA([T];([T]F=value & expression)

データベース ランゲージ

Page 50: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (

データベースデータベースランゲージ

ランゲージ

‣ =, # (

ランゲージデータベースランゲージ

ランゲージQUERY BY FORMULA([T];([T]F=value & expression)

データベース ランゲージデータ

ベース

Page 51: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

ランゲージ

‣ >, < (文字列比較演算)

データベースデータベースランゲージ

ランゲージ

‣ =, # (文字列比較演算)

ランゲージデータベースランゲージ

Page 52: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

Page 53: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (

‣ =, # (

Page 54: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (

‣ =, # (

Page 55: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 :

•collator #2 :

‣ SORT ARRAY, ‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (

‣ =, # (

Page 56: Unicode-v11-5

Clichy/2010-02-03

コレーション...テキスト比較の言語•collator #1 : 比較, 並び替え

•collator #2 : 等価

‣ SORT ARRAY, リストボックス‣ ORDER BY‣ >, < (QUERY)

‣ FIND IN ARRAY

‣ =, # (QUERY)‣ Position, Replace string

‣ >, < (文字列比較演算)

‣ =, # (文字列比較演算)

Page 57: Unicode-v11-5

Unicode & 正規表現4D デベロッパカンファレンス 2010