データ抽出

24
診診診診診診診診診診診診診診診診診診診診診 「」 診診診診診診診診 :1.「」 診診診診 診診診診診診診診診診 2.「」 診診診診 診診診診診診診診診診診診診 3.「」 診診診診 診診診診診診診診診診診診診診診診 MTE 診診診 : 診診診診 診診診診診診診診診診診診 () 診 : 診診診診診診診診診 診診 西

description

「診療録データの臨床研究利用のための仕組み」 内 容:1.「システムの概要」         松村泰志         2.「入力システムのデモ」      藤井歩美         3.「データ抽出システムのデモ」  村田泰三         大阪大学医学部附属病院医療情報部 MTE 世話人 : 松村泰志(大阪大学医学部附属病院)     主 催 : 日本医療情報学会関西支部. GW. データ抽出. データ変換. Data Warehouse (DW H ). 病院情報システム. データ構造が分析に適さない 日常業務がストールする心配がある. - PowerPoint PPT Presentation

Transcript of データ抽出

Page 1: データ抽出

「診療録データの臨床研究利用のための仕組み」

    内 容:1.「システムの概要」        松村泰志        2.「入力システムのデモ」     藤井歩美        3.「データ抽出システムのデモ」 村田泰三            大阪大学医学部附属病院医療情報部

    MTE 世話人 : 松村泰志(大阪大学医学部附属病院)    主 催 : 日本医療情報学会関西支部

Page 2: データ抽出

データ抽出 データ変換

病院情報システム

処方 検査結果 入院歴

データ構造が分析に適さない

日常業務がストールする心配がある

分析に適したデータ構造

Data Warehouse (DW H )

データベースDWH

GW

Page 3: データ抽出

DWH を利用した解析事例

糖尿病の疫学調査 降圧剤の変遷 シスプラチンの腎毒性の評価 アミノグリコシド系薬剤の腎毒性の評価 ワーファリンの薬剤相互作用の評価 糖尿病性腎症における ACE 、 ARB 投与

の実態と効果

Page 4: データ抽出

臨床研究のテーマの例

食道癌におけるある化学療法の効果変形性膝関節症に対する人工関節置換術の効果拡張型心筋症に対するある薬剤の効果

癌症例におけるステージ分類、組織型化学療法実施時の副作用(嘔吐、脱毛、皮膚所見、筋肉痛)の出現整形外科的疾患での、関節可動域の測定結果心臓疾患における左室拡張末期径、 Ejection Fraction

必要な情報

入力テンプレートによるソリューション

Page 5: データ抽出

入力テンプレート電子カルテシステムが提示した項目に、ユーザが値を入れていく方式の入力支援ツール(プログラム)

氏名:__________

性: ○男性  ○女性

生年月日:__ __年__月__日

職業: □医師 □看護婦(士) □薬剤師 □検査技師 □事務 

例)

複雑な臨床データをテンプレート方式で入力できるのか?

Page 6: データ抽出

ダイナミックテンプレートによるソリューション

階層構造を持つ 異常所見に対して更に詳細な記述が可能

登録データを自然言語変換して読みやすく表示 コンピュータは、厳密な木構造の表現が処理しやすい    (machine processible)

 人間は、推測可能な言葉は省略される方が、重要は情報を認識しやす

い    (human readable)

Page 7: データ抽出

経過記録作成時のテンプレート呼び出し

Page 8: データ抽出

ダイナミックテンプレート

Page 9: データ抽出

テンプレートデータの自然言語変換

テンプレー

トで入力したデー

Page 10: データ抽出

フローシートへのテンプレート登録データの表示

Page 11: データ抽出

表在リンパ節 腋窩リンパ節 右:腫大 小指頭大 硬い 表面凹凸不整 癒着あり 左:触知せず

テンプレートの例

Page 12: データ抽出

GCS : E4V5M5 COMA SCORE = 14

テンプレートの例

Page 13: データ抽出

病院内の様々な文書

Page 14: データ抽出

文書作成システム 退院時サマリ 検査レポート 栄養評価 院内がん登録  etc

• Word ファイルからテンプレート呼び出し• 患者基本情報の自動表示

Page 15: データ抽出
Page 16: データ抽出

患者基本情報から取得

テンプレート入力

Page 17: データ抽出

テンプレートマスタの具体例<ATOM-LIST><ATOM-STYLE /><ATOM><ATOM-TYPE CODE="A908100100" NAME=" 心音の I音 " CATEGORY="汎用項目 " FIRST="0" SEQUENCE="0" ADD="no"/><DISPLAY-STRING ITALIC="off" BOLD="off" LEVEL="0" TITLEWIDTH="5" RETURN="off" SHOWTITLE="yes" TITLERETURN="yes" TITLEITALIC="no" TITLEBOLD="no" xml:space="preserve">I音: </DISPLAY-STRING><DOCUMENT-STRING><DOC-BODY RETURN="on" xml:space="preserve"></DOC-BODY><DOC-PREFIX RETURN="off" xml:space="preserve"> I音: </DOC-PREFIX><DOC-CONJUNCTION RETURN="off" xml:space="preserve"></DOC-CONJUNCTION><DOC-SUFFIX RETURN="off" xml:space="preserve"></DOC-SUFFIX></DOCUMENT-STRING><VALUE-LIST><VALUE-STYLE TYPE="CheckBox" ITEMWIDTH="0" ITEMHEIGHT="0" SPECIAL="" CODE="" NUMBER="0 " RETURN="on" MANDATORY="no"/><VALUE SAMEABOBE="no"><VALUE-TYPE CODE="V908100101" NAME="純 " SELECTED="no" MAPPOINTER="" SEQUENCE="0" /><DISPLAY-STRING ITALIC="off" BOLD="off" LEVEL="0" TITLEWIDTH="2" RETURN="off" SHOWTITLE="yes" TITLERETURN="yes" TITLEITALIC="yes" TITLEBOLD="no" xml:space="preserve">純 </DISPLAY-STRING><DOCUMENT-STRING><DOC-BODY RETURN="off" xml:space="preserve">純 </DOC-BODY><DOC-PREFIX RETURN="off" xml:space="preserve"></DOC-PREFIX><DOC-CONJUNCTION RETURN="off" xml:space="preserve"></DOC-CONJUNCTION><DOC-SUFFIX RETURN="off" xml:space="preserve"></DOC-SUFFIX></DOCUMENT-STRING></VALUE><VALUE SAMEABOBE="no"><VALUE-TYPE CODE="V908100102" NAME="亢進 " SELECTED="no" MAPPOINTER="" SEQUENCE="1" /><DISPLAY-STRING ITALIC="off" BOLD="off" LEVEL="0" TITLEWIDTH="4" RETURN="off" SHOWTITLE="yes" TITLERETURN="yes" TITLEITALIC="yes" TITLEBOLD="no" xml:space="preserve">亢進 </DISPLAY-STRING><DOCUMENT-STRING><DOC-BODY RETURN="off" xml:space="preserve">亢進 </DOC-BODY><DOC-PREFIX RETURN="off" xml:space="preserve"></DOC-PREFIX><DOC-CONJUNCTION RETURN="off" xml:space="preserve"></DOC-CONJUNCTION><DOC-SUFFIX RETURN="off" xml:space="preserve"></DOC-SUFFIX></DOCUMENT-STRING></VALUE><VALUE SAMEABOBE="no"><VALUE-TYPE CODE="V908100103" NAME="減弱 " SELECTED="no" MAPPOINTER="" SEQUENCE="2" /><DISPLAY-STRING ITALIC="off" BOLD="off" LEVEL="0" TITLEWIDTH="4" RETURN="off" SHOWTITLE="yes" TITLERETURN="yes" TITLEITALIC="yes" TITLEBOLD="no" xml:space="preserve">減弱 </DISPLAY-STRING><DOCUMENT-STRING><DOC-BODY RETURN="off" xml:space="preserve">減弱 </DOC-BODY><DOC-PREFIX RETURN="off" xml:space="preserve"></DOC-PREFIX><DOC-CONJUNCTION RETURN="off" xml:space="preserve"></DOC-CONJUNCTION><DOC-SUFFIX RETURN="off" xml:space="preserve"></DOC-SUFFIX></DOCUMENT-STRING></VALUE></ATOM>

Page 18: データ抽出

患者データベース

データウェアハウス

HIS端末

入力テンプレート呼び出し

Templateデータベース

患者ID

date Template+ 患者データXML

自然言語表現

1001 10/12

BP=120/60

1002 10/12

HR=60/min

Template+患者データ

Template+患者データ

データ登録

Template

コード

TemplateXML

T001Template

Template

Template+患者データ

データ分析

Page 19: データ抽出

データウェアハウス

患者 ID date Template x Path 親項目 親値 項目 値

1001 10/12 心音 \心雑音 root 心雑音 収縮期雑音

1001 10/12 心音 \心雑音 \収縮期雑音 \大きさ

心雑音 収縮期雑音

大きさ III度

1001 10/12 心音 \心雑音 \収縮期雑音 \最強点

心雑音 収縮期雑音

最強点 心尖部

心雑音

大きさ 最強点

III 心尖部

収縮期雑音

心音

1 value 1 record のデータベースファイル

Page 20: データ抽出

臨床研究で求められる要件

患者 ID date 血圧 脈拍 心雑音 WBC RBC

1001 10/12 120/84 64/min 収縮期雑音 6800 432

1001 10/13 154/96 84/min なし 11200 486

• プロジェクトで収集したデータ群を一つのファイルで欲しい      

• 1ケースが1レコードとなるデータ構造が望ましい

統計解析ソフトで解析

Page 21: データ抽出

AAA: BBB: ○XX, ○YYY, ○ZZZCCC: □PP 、□ QQDD :    

GG: ○XX, ○YYY, ○ZZZHHH: □PP 、□ QQIII :    JJJ :○ RR, ○SSS, ○TT

KKK: ○NN, ○OOO, HHH: □PP 、□ QQLLL :    MMM :○ UUU, ○VV, ○WWW

入力テンプレート データベースファイル

テンプレート1

テンプレート2

テンプレート3

テンプレート1用 DB

テンプレート2用 DB

テンプレート3用 DB

一般的な方法

入力テンプレート毎にデータベースファイルを定義

テンプレートの個数分データベースファイルが必要

運用の途中でテンプレートの変更が難しい

一般記述に適応しにくい

Page 22: データ抽出

AAA: BBB: ○XX, ○YYY, ○ZZZCCC: □PP 、□ QQDD :    

GG: ○XX, ○YYY, ○ZZZHHH: □PP 、□ QQIII :    JJJ :○ RR, ○SSS, ○TT

KKK: ○NN, ○OOO, HHH: □PP 、□ QQLLL :    MMM :○ UUU, ○VV, ○WWW

入力テンプレート臨床研究用

データベースファイル無構造データベース

臨床研究1

臨床研究2

臨床研究3

テンプレート1

テンプレート2

テンプレート3

• テンプレートがデータベース構造に非依存→ テンプレートの新規作成・修正が簡単• 必要なデータを後付けで収集することができる

• 複数のテンプレートのデータを1つのデータベースファイルに格納できる• 1つのテンプレートのデータを複数のデータベースファイルに格納できる

Page 23: データ抽出

患者 ID date Template x Path 親項目 親値 項目 値

1001 10/12 心音 \心雑音 root 心雑音 収縮期雑音

1001 10/12 心音 \心雑音 \収縮期雑音 \大きさ

心雑音 収縮期雑音

大きさ III度

1001 10/12 心音 \心雑音 \収縮期雑音 \最強点

心雑音 収縮期雑音

最強点 心尖部

データウェアハウス

特定領域の臨床研究データベースファイル

患者 ID date 血圧 脈拍 心雑音 WBC RBC

1001 10/12 120/84 64/min 収縮期雑音 6800 432

1001 10/13 154/96 84/min なし 11200 486

1 value 1 record  →  1 case 1 record  に変換

Page 24: データ抽出

操作用 PC

データ登録

データ抽出

データ閲覧・集計

各プロジェクト別臨床研究用データベース                     へのデータ移行

各プロジェクト別臨床研究用

データベースGW2

GW1

電子カルテサーバ

XMLパース

1 value1 record

データウェアハウス

1 case1 record

操作用 PC