BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ...

14
2 Đại hc Quc gia Thành phHChí Minh Mu R05 Mã sđề tài:B2016-42-01 BÁO CÁO TÓM TT TÌNH HÌNH THC HIN ĐỀ TÀIKH&CN (Đính kèm trong các báo cáo toàn văn ca báo cáo định k, báo cáotng kết hoc xin gia hn) A. THÔNG TIN CHUNG A1. Tên đề tài - Tên tiếng Vit: Phát trin các công nghnn để khai thác bnh án đin tcho chăm sóc sc khovà nghiên cu y hc. - Tên tiếng Anh: Developing core technologies for mining electronic medical records for health care and medical research A2. Thuc ngành/nhóm ngành Khoa hc Xã hi Toán Khoa hc và Công nghVt liu Khoa hc Nhân văn Vt lý Năng lượng Kinh tế, Lut Hóa hc và Công nghHóa hc Cơ khí,Tđộng hóa, Kthut Giao thông Qun lý Sinh hc và Công nghSinh hc Đin – Đin tKhoa hc Sc khe Công nghThông tin và Truyn thông Khoa hc Trái đất và Môi trường Xây dng Khác:…. A3. Loi hình nghiên cu Nghiên cu cơ bn Nghiên cu ng dng Nghiên cu trin khai A4. Thi gian thc hin Theo Hp đồng đã ký kết: ttháng 4/2016 đến tháng 3/2017 Được gia hn (nếu có): T…..đến ….. A5. Kinh phí Tng kinh phí: 885(triu đồng), gm Kinh phí tĐHQG-HCM: 885 triu đồng Kinh phí cp đợt 1: 885 triu đồng theo QĐ s68/QĐ-ĐHQG ngày 15/02/2016 Kinh phí cp đợt 2: ……………theo QĐ s…….ngày………. Kinh phí tngun huy động (vn tcó và vn khác): …….. triu đồng A6. Chnhim Hc hàm, hc v, hvà tên: HTú Bo, Giáo sư, Tiến sĩ Ngày, tháng, năm sinh: 16/6/1952 Nam/ N: Nam SCMND: 010453767 Ngày cp: 27/11/2010 Nơi cp: Hà Ni Mã sthuế cá nhân: 8018344408 Stài khon: 0011003593034 Ti ngân hàng: Vietcombank Địa chcơ quan: Vin John von Neumann – ĐHQG HCM Đin thoi: 0915441913 Email: [email protected] Đồng Chnhim: Hc hàm, hc v, hvà tên: PGS TS ĐồngThBích ThuNgày, tháng, năm sinh: 10/12/1954 Nam/ N: NSCMND: 022578005Ngày cp: 3/10/2014 Nơi cp: Tp HChí Minh

Transcript of BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ...

Page 1: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

2

Đại học Quốc gia

Thành phố Hồ Chí Minh

Mẫu R05 Mã số đề tài:B2016-42-01

BÁO CÁO TÓM TẮT

TÌNH HÌNH THỰC HIỆN ĐỀ TÀIKH&CN (Đính kèm trong các báo cáo toàn văn của báo cáo định kỳ, báo cáotổng kết hoặc xin gia hạn)

A.   THÔNG TIN CHUNG A1. Tên đề tài

-  Tên tiếng Việt: Phát triển các công nghệ nền để khai thác bệnh án điện tử cho chăm sóc sức khoẻ và nghiên cứu y học.

-  Tên tiếng Anh: Developing core technologies for mining electronic medical records for health care and medical research

A2. Thuộc ngành/nhóm ngành Khoa học Xã hội Toán Khoa học và Công nghệ Vật liệu Khoa học Nhân văn Vật lý Năng lượng Kinh tế, Luật Hóa học và Công nghệ Hóa học Cơ khí,Tự động hóa, Kỹ thuật Giao thông Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử

Khoa học Sức khỏe Công nghệ Thông tin và Truyền thông Khoa học Trái đất và Môi trường Xây dựng

Khác:….

A3. Loại hình nghiên cứu Nghiên cứu cơ bản Nghiên cứu ứng dụng Nghiên cứu triển khai

A4. Thời gian thực hiện -   Theo Hợp đồng đã ký kết: từ tháng 4/2016 đến tháng 3/2017 -   Được gia hạn (nếu có): Từ…..đến …..

A5. Kinh phí Tổng kinh phí: 885(triệu đồng), gồm -  Kinh phí từ ĐHQG-HCM: 885 triệu đồng Kinh phí cấp đợt 1: 885 triệu đồng theo QĐ số 68/QĐ-ĐHQG ngày 15/02/2016 Kinh phí cấp đợt 2: ……………theo QĐ số…….ngày………. -  Kinh phí từ nguồn huy động (vốn tự có và vốn khác): …….. triệu đồng

A6. Chủ nhiệm Học hàm, học vị, họ và tên: Hồ Tú Bảo, Giáo sư, Tiến sĩ Ngày, tháng, năm sinh: 16/6/1952 Nam/ Nữ: Nam Số CMND: 010453767 Ngày cấp: 27/11/2010 Nơi cấp: Hà Nội Mã số thuế cá nhân: 8018344408 Số tài khoản: 0011003593034 Tại ngân hàng: Vietcombank Địa chỉ cơ quan: Viện John von Neumann – ĐHQG HCM Điện thoại: 0915441913 Email: [email protected] Đồng Chủ nhiệm: Học hàm, học vị, họ và tên: PGS TS ĐồngThị Bích Thuỷ Ngày, tháng, năm sinh: 10/12/1954 Nam/ Nữ: Nữ Số CMND: 022578005Ngày cấp: 3/10/2014 Nơi cấp: Tp Hồ Chí Minh

Page 2: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

3

Mã số thuế cá nhân: 0303723978  Số tài khoản:200014849708742Tại ngân hàng: Eximbank – Sở GD 1, TP. HCM Địa chỉ cơ quan: Viện John von Neumann – ĐHQG HCM Khu phố 6, Phường Linh Trung, Quận Thủ Đức Điện thoại: 090 391 1037 Email: [email protected]

A7. Cơ quan chủ trì Tên cơ quan: Viện John von Neumann – ĐHQG HCM Họ và tên thủ trưởng: GS TS Dương Nguyên Vũ Điện thoại: 08 3724 6556 Fax: 08 3724 6556 E-mail : [email protected] Số tài khoản: 9527.1.1105771.00000 Tại kho bạc nhà nước quận Thủ Đức

A8. Cơ quan phối hợp thực hiện (Giấy xác nhận đính kèm theo mẫu quy định)

Cơ quan 1: Bệnh viện Thống Nhất, TPHCM Tên cơ quan: Bệnh viện Thống Nhất Họ và tên thủ trưởng: GS TS Nguyễn Đức Công Điện thoại: 0982160860 Fax: Địa chỉ: 1, Lý Thường Kiệt, Quận Tân Bình, Tp Hồ Chí Minh

A9. Danh sách tham gia thực hiện Các thành viên chủ chốt:

TT Họ và tên Đơn vị công tác Nội dung công việc 1 GS TSKH Hồ Tú Bảo JAIST và JVN-ĐHQGHCM Nội dung 2-4-5 2 PGS TS Đồng Thị Bích Thuỷ JVN và ĐHKHTN-ĐHQGHCM Nội dung 4 3 GS TS Cao Hoàng Trụ ĐHBK và JVN-ĐHQGHCM Nội dung 3 và 1 4 TS Võ Thị Ngọc Châu ĐHBK-ĐHQGHCM Nội dung 2 5 PGS TS Lê Thị Lý ĐHQT-ĐHQGHCM Nội dung 5 6 TS Nguyễn Thị Minh Huyền ĐHKHTN-ĐHQG Hà Nội Nội dung 3 7 BS Nguyễn Văn Bính Viện Quân Y 175 Nội dung 1 8 GS Nguyễn Đức Công BVThống Nhất, KhoaY-ĐHQGHCM Nội dung 1 9 CN Nguyễn Ngọc Hợp Công ty Hoa Sen Nội dung 2

B.   BÁO CÁO B1. Nội dung công việc B1.1 Nội dung hoàn thành theo tiến độ đăng ký

Nội dung 1: Nghiên cứu xây dựng quy trình chuẩn hoá ngôn ngữ trong khám chữa bệnh dùng cho BAĐT tại khoa Tiêu Hoá, bệnh viện Thống Nhất, Tp.HCM

TT Nội dung đăng ký Kết quả đạt được Mức độ hoàn

thành nội dung đăng ký

1.1 Chuẩn hoá thuật ngữ và cấu trúc thông tin khám chữa bệnh tiêu hoá phù hợp với BAĐT (*) (4/2016 – 3/2017)

-  Trao đổi với các bác sĩ trong khoa Tiêu hoá, bệnh viện Thống Nhất về: (i) Phương pháp phân nhóm bệnh tiêu hoá trong khoa; (ii) Nội dung và giao diện của nhóm bệnh Dạ dày tá tràng: Ngôn ngữ, thuật ngữ và giao diện.

Hoàn thành nội dung đăng ký

Page 3: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

4

-  Ghép hai nhóm bệnh xơ gan, ung thư gan và nhóm bệnh gan khác thành một nhóm bệnh duy nhất (nhóm bệnh gan mật), gồm 07 nhóm bảng đặc tả: (i) Chỉnh sửa nội dung 7 nhóm bảng đặc tả cho bệnh tiêu hoá; (ii) Chỉnh sửa mẫu khai báo nhóm bệnh dạ dày-tá tràng, (iii) Hoàn tất bảng đặc tả kế hoạch chăm sóc cho điều dưỡng. -  Hoàn thành tiếp 2 phụ lục (PL) cuối cùng

dùng cho các bác sĩ khoa Tiêu hóa phù hợp với BAĐT. Phụ lục 4: 7 bảng chuẩn hóa thuật ngữ định bệnh theo ICD10/BYT/2007 và 2015 (PL4). Phụ lục 5: 1 bảng chuẩn hóa ngôn ngữ, thuật ngữ triệu chứng học và áp dụng một số thang điểm thiết yếu thường dùng trong lâm sàng khoa Tiêu hóa (PL5). -  Hoàn thiện lần cuối Lưu đồ mô tả quy

trình chuẩn hoá thuật ngữ trong khám chữa bệnh dùng cho BAĐT tại khoa Tiêu Hoá, bệnh viện Thống Nhất: (i) Chỉ còn 4 bước (không còn 6 bước); (ii) Mô tả chi tiết lưu đồ; (iii) Đầy đủ các tài liệu (phụ lục) đi kèm. -  1 bài báo đăng Tạp chí Y học thực hành. -  Xin nhận xét đánh giá của chuyên gia y

tế.

1.2 Xây dựng và thử nghiệm công cụ phần mềm theo các thuật ngữ chuẩn hoá và cấu trúc thông tin cho khám chữa bệnh tiêu hoá ở một bệnh viện

(4/2016 – 3/2017)

-  Tiếp tục chỉnh sửa nội dung và giao diện công cụ phần mềm của 7 nhóm bệnh cho phù hợp với cấu trúc ngôn ngữ, cách diễn đạt trong văn bản lâm sàng. -  Tham gia việc kết nối với HIS của Bv

Thống Nhất. -  Theo dõi việc thử nghiệm công cụ phần

mềm tại khoa Tiêu hoá, Bv Thống Nhất -  Cùng ND2 liên tục chỉnh sửa version 1

của công cụ phần mềm (sản phẩm trên tablet Samsung Galaxy). Hoàn thành văn bản tóm tắt các bước phát triển công cụ phần mềm tạo lập BAĐT với ngôn ngữ được chuẩn hóa (PL6).

Hoàn thành nội dung đăng ký

Page 4: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

5

Nội dung 2: Nghiên cứu phương pháp và xây dựng phần mềm công cụ chuyển đổi BAĐT gốc thành CSDL thứ cấp loại 1

TT Nội dung đăng ký Kết quả đạt được

Mức độ hoàn thành nội dung đăng ký

2.1 Làm sạch dữ liệu BAĐT (*) (4/2016-12/2016)

-  Đề xuất giải pháp cho vấn đề làm sạch dữ liệu văn bản trong BAĐT với dạng nhiễu tường minh: từ viết tắt. Hiện thực và đánh giá giải pháp nhận diện từ viết tắt trong 2000 BAĐT tiếng Việt. Một kết quả đã được báo cáo tại hội thảo chuyên ngành PKAW 2016. Một kết quả khác đã được chuẩn bị và gởi bài báo đến tạp chí chuyên ngành TALLIP.

Hoàn thành nội dung đăng ký

2.2 Lọc thông tin riêng tư (*) (4/2016-3/2017)

-  Cải tiến giải pháp cho vấn đề lọc thông tin riêng trong BAĐT. Hiện thực – đánh giá giải pháp cải tiến cho vấn đề lọc thông tin riêng trong BAĐT trên tập dữ liệu i2b2 2006 ở cuộc thi Lọc thông tin riêng 2006 của i2b2. Kết quả đã được chấp nhận tại hội thảo quốc tế IEEE-RIVF 2016.

-  Khảo sát giải pháp trên tập dữ liệu i2b2 2014.

-  Chuẩn bị giải pháp cho BAĐT tiếng Việt. -  Đã hoàn thành 1 luận văn cao học thực

hiện phần lọc thông tin riêng trong BAĐT.

Hoàn thành nội dung đăng ký

2.3 Chuẩn hoá BAĐT từ các hệ thông tin bệnh viện (*) (4/2016-3/2017)

-  Cùng ND1 liên tục chỉnh sửa version 1 của công cụ phần mềm (sản phẩm trên tablet Samsung Galaxy). Hoàn thành văn bản tóm tắt các bước phát triển công cụ phần mềm tạo lập BAĐT với ngôn ngữ được chuẩn hóa (PL6).

Hoàn thành nội dung đăng ký

Nội dung 3: Nghiên cứu phương pháp và xây dựng công cụ phân tích văn bản lâm sàng tiếng Việt

TT Nội dung đăng ký Kết quả đạt được Mức độ hoàn

thành nội dung đăng ký

Page 5: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

6

3.1 Gán nhãn từ loại trong văn bản BAĐT (*) (4/2016-9/2016)

-  Hoàn thành gán nhãn từ loại thủ công cho tập dữ liệu BAĐT sẵn có, rút bỏ dữ liệu trùng lặp để làm dữ liệu huấn luyện và kiểm tra. Kích thước tập dữ liệu thu được gồm 11943 câu với  119940 từ.

-  Đã thử nghiệm, đánh giá kết quả gán nhãn từ loại theo các phương pháp học máy khác nhau trên tập dữ liệu BAĐT, có kết hợp với mô hình huấn luyện trên kho VietTreebank (dữ liệu báo chí tiếng Việt).

-  Đã tích hợp mô hình gán nhãn từ loại BAĐT vào các công cụ gán nhãn từ loại mã nguồn mở. Tất cả các công cụ thu được đều đạt độ chính xác trên 94%.

Hoàn thành nội dung đăng ký

3.2 Phân cụm từ trong văn bản lâm sàng (*) (4/2016-12/2016)

-  Hoàn thành gán nhãn cụm từ thủ công cho tập dữ liệu BAĐT sẵn có để làm dữ liệu huấn luyện và kiểm tra.

-  Đã thử nghiệm, đánh giá phân cụm từ theo các phương pháp học máy khác nhau trên tập dữ liệu BAĐT, có kết hợp với mô hình huấn luyện trên kho VietTreebank (dữ liệu báo chí tiếng Việt).

-  Đã tích hợp mô hình phân cụm từ BAĐT vào hai công cụ phân cụm từ mã nguồn mở. Các công cụ thu được đều đạt độ chính xác trên 90%, chỉ số F1 đạt trên 91%.

Hoàn thành nội dung đăng ký

3.3 Nhận dạng thực thể trong văn bản lâm sàng (*) (4/2016-3/2017)

-  Đã xây dựng mới bộ quy tắc gán nhãn phân loại các thực thể trong văn bản lâm sàng tiếng Việt, do có sự khác biệt giữa ngữ dụng tiếng Việt và tiếng Anh, và do hạn chế của bộ quy tắc của I2B2 cho tiếng Anh.

-  Đã đánh nhãn lại tập dữ liệu tiếng Việt của bệnh viện Vân Anh (VA) theo bộ quy tắc mới cho bài toán nhận diện thực thể.

-  Đã hoàn thành công cụ nhận dạng thực thể trong văn bản lâm sàng tiếng Việt,

Hoàn thành nội dung đăng ký.

Page 6: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

7

với chỉ số F1 đạt ~84% trên tập dữ liệu của bệnh viện VA.

3.4 Phân tích quan hệ đồng tham chiếu trong văn bản lâm sàng (*) (4/2016-3/2017)

-  Đã đánh nhãn tập dữ liệu tiếng Việt theo bộ quy tắc mới cho bài toán phân giải đồng tham chiếu.

-  Đã hoàn thành công cụ phân giải đồng tham chiếu cho văn bản lâm sàng tiếng Việt, với chỉ số F1 đạt ~91% trên tập dữ liệu của bệnh viện VA.

Hoàn thành nội dung đăng ký.

3.5 Trích rút quan hệ giữa các thực thể trong văn bản lâm sàng (*) (4/2016-3/2017)

-  Đã đánh nhãn tập dữ liệu tiếng Việt của bệnh viện VA theo bộ quy tắc mới cho bài toán trích rút quan hệ. -  Đã hoàn thành công cụ trích rút quan hệ

cho văn bản lâm sàng tiếng Việt, với chỉ số F1 đạt ~95% trên tập dữ liệu của bệnh viện VA.

Hoàn thành nội dung đăng ký.

Nội dung 4: Nghiên cứu phương pháp và xây dựng công cụ chuyển đổi văn bản lâm sàng từ các BAĐT thành các dạng tính toán được

TT Nội dung đăng ký Kết quả đạt được Mức độ hoàn

thành nội dung đăng ký

4.1 Dạng vector space với phương pháp gán trọng số mới có ngữ nghĩa (*) (4/2016-3/2017)

-  Đã phát triển phương pháp gán trọng số đo độ quan trọng của các từ của BAĐT trong mô hình không gian vector (VSM). Trọng số này sự kết hợp các trọng số của từ theo ba khía cạnh: (a1) tần xuất xuất hiện TFIDF, (a2) ý nghĩa y học xét theo sự nguy hiểm của bệnh, (a3) tình trạng bệnh tật của bệnh nhân. -  Đánh giá và tìm ra giá trị phù hợp của

các tham số của phương pháp khi so sánh trên 5 phương pháp học máy khác nhau. -  Đánh giá thử nghiệm trên 13026 BAĐT

của bệnh nhân trên 60 tuổi trong CSDL MIMIC2. Độ chính xác dự đoán được nâng từ 80% khi dùng TFIDF lên 85% với trọng số mới tính theo phương pháp đề xuất. -  Hai bài báo đã hoàn thành và nộp cho hai

tạp chí ISI: Artificial Intelligence in

Hoàn thành nội dung đăng ký.

Page 7: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

8

Medicine và International Journal of Medical Informatics của Elsevier.

4.2 Dạng chủ đề với biểu diễn các BAĐT theo chủ đề gắn với y nghĩa y học (*) (4/2016-3/2017)

-  Nghiên cứu cải tiến của mô hình chủ đề LDA khi phân biệt nghĩa khác nhau của cùng một từ (bài toán polysemy). Bài toán này không thể giải quyết trong trường hợp tổng quát, nhưng hy vọng có thể giải được trong lĩnh vực y học khi sử dụng UMLS. -  Đã thử nghiệm nhiều phương pháp đề

xuất khác nhau trong 6 tháng qua và thu kết quả thử nghiệm cuối.

Hoàn thành nội dung đăng ký.

4.3 Dạng thời gian với biểu diễn BAĐT theo sự kiện và quan hệ thời gian (*)

(4/2016-3/2017)

-  Đề xuất phương pháp bán giám sát hai giai đoạn (two-stage semi-supervised learning method) để trích rút các sự kiện và quan hệ có yếu tố thời gian. Ý tưởng cơ bản là từng bước khai thác các văn bản lâm sàng chưa chú giải để phát hiện thông tin thời gian và từng bước tăng kích thước của tập văn bản có chú thích. Từ đó cải thiện tính chính xác của khai thác thông tin theo thời gian. -  Phát triển mô hình CRF ngẫu nhiên có điều kiện cho các sự kiện phụ thuộc thời gian trên dữ liệu được chú giải với tính năng khác nhau ở cụm từ mức. Đạt F-measure 89,76% cho bài toán xác định sự kiện, và 79,95% cho trích rút biểu thức thời gian. -  Một bài đã được báo cáo ở hội nghị quốc

tế IEEE-RIVF 2016. Một bài báo khác đã nộp cho hội nghị quốc tế.

Hoàn thành nội dung đăng ký.

Page 8: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

9

Nội dung 5: Nghiên cứu phương pháp và xây dựng công cụ phân tích quan hệ bệnh-thuốc

TT Nội dung đăng ký Kết quả đạt được Mức độ hoàn

thành nội dung đăng ký

5.1 Tạo bảng tần suất từ BAĐT về hiệu quả dùng các loại thuốc (*) (4/2016-3/2017)

-  Phát triển một phương pháp trích rút tự động bảng tần xuất để kiểm định các giả thiết thống kê từ BAĐT. Đánh giá với BAĐT tiếng Việt từ CSDL của bệnh viện Vân Đồn.

Hoàn thành nội dung đăng ký.

5.2 Phân tích ý kiến trong BAĐT để đánh giá hiệu qủa dùng thuốc (*) (4/2016-3/2017)

-  Áp dụng phương pháp ở 5.1 để đánh giá hiệu quả sử dụng của các nhóm thuốc trên các nhóm bệnh nhân khác nhau. Kết quả này cho phép đánh giá được thực chứng lâm sàng (pragmatic clinical trial) của hiệu quả (effectiveness) dùng thuốc trong các tình huống thật, thay cho cách đánh giá khả năng (efficacy) của thuốc trong những điều kiện hạn chế như vẫn thường được làm. -  Đã viết và nộp một bài báo từ kết quả 5.1

và 5.2 cho tạp chí International Journal of Medical Informatics của Elsevier (ISI).

Hoàn thành nội dung đăng ký.

5.3 Phát hiện hiệu ứng phụ của thuốc (*) (7/2015-3/2016)

-  Bài báo trên tạp chí Current Pharma- ceutical Design Journal đã đăng ở Vol. 22, No. 23 (tháng 5, 2016) -  Xây dựng phương pháp xác định hiệu ứng phụ gồm hai giai đoạn, trong đó giai đoạn một với 03 bài toán cần giải: (1) Xác định trong BAĐT các từ nói về thuốc và hiệu ứng của thuốc, (2) Xác định quan hệ nhân quả giữa các cặp thuốc-hiệu ứng, (3) Xác định hiệu ứng từ các cặp nhân quả là positive (hiệu ứng mong muốn) hay negative (hiệu ứng phụ). -  Xây dựng cơ sở dữ liệu: (1) Thu thập tập

dữ liệu kết quả microarray của thuốc dữ liệu thử nghiệm (TCDD), (2) phân nhóm dược chất có cùng ảnh hưởng sinh học dược học ở mức độ phân tử nhằm tiến tới

Hoàn thành nội dung đăng ký.

Page 9: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

10

khai thác các thông tin dược chất từ BAĐT hay các dữ liệu dược chất bên ngoài khác. -  Xử lý dữ liệu: Phân tích dữ liệu

microarray đầu vào bằng các phương pháp toán thống kê. Thu được dữ liệu về độ tiết gene thứ cấp của thuốc, từ đó tìm kiếm được loạt dược phẩm khác có mức độ tiết gene tương đương (> 50%) so với dược phẩm thử nghiệm.

- Xây dựng mạng sinh dược: xây dựng thành công mạng dữ liệu sinh học dược học bao gồm protein, thuốc và thông tin phản ứng phụ của thuốc. Mạng dữ liệu được biểu diễn dưới dạng hình ảnh rõ nét, rõ tương quan.

- Tính toán mạng sinh dược: dùng các kỹ thuật tính toán trong mạng dữ liệu sinh dược, thu được kết quả ở mức khá tốt. Một phần kết quả đã đưa vào bài báo hội nghị quốc tế IEEE-RIVF 2016. -  Xác định một số giả thuyết về tác dụng

phụ mới suy sụp (Fall) và buồn ngủ (Sedation) khi sử dụng nhiều thuốc kết hợp.

5.4 Tìm khả năng mới của thuốc đã có (*) (4/2016-3/2017)

-  Xây dựng phương pháp hai giai đoạn, trong đó giai đoạn một với 03 bài toán cần giải: (1) Xác định trong BAĐT các từ nói về thuốc và hiệu ứng của thuốc, (2) Xác định quan hệ nhân quả giữa các cặp thuốc-hiệu ứng, (3) Xác định hiệu ứng từ các cặp nhân quả là positive (hiệu ứng mong muốn) hay negative (hiệu ứng phụ).

-  Tìm được lời giải cơ bản cho 02 bài toán đầu.

-  01 bài báo dựa trên kết quả này ở hội nghị quốc tế IEEE-RIVF 2016.

Hoàn thành nội dung đăng ký.

Page 10: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

11

B1.2 Nội dung chưa hoàn thành theo tiến độ đăng ký

TT Nội dung chưa hoàn thành Nguyên nhân Biện pháp khắc phục

02 bài báo ISI đang chờ kết quả Đã nộp 04 bái báo (đánh số 1-4 ở B2.1, phần danh sách các bài đã nộp đang chờ đánh giá)

Chờ kết quả trong các tháng 4-9.2017. Khi nào có kết quả sẽ đăng ký bảo vệ.

B2. Sản phẩm nghiên cứu (kèm minh chứng)

B2.1 Ấn phẩm khoa học Các bài [1], [2], [9] từ nội dung 2. Bài [10] từ nội dung 4.1, bài [3] từ nội dung 4.3. Bài [4] từ nội dung 5.1, bài [5], [6] từ nội dung 5.3, bài [7] từ 5.4 và [8] là nền tảng cho nhiều tính toán của các nội dung. Danh sách các bài báo đã công bố và có bài gửi kèm

1.   Ho Tu Bao, Le Ly, Dang Tran Thai, Siriwon Taewijit, Data-driven Approach to Detect and Predict Adverse Drug Reactions, Current Pharmaceutical Design Journal, Vol. 22, No. 23 (May 2016), 3498-3526 (ISI).

2.   Vo Thi Ngoc Chau, Cao, T. H., and Ho Tu Bao.Abbreviation Identification in Clinical Notes with Level-wise Feature Engineering and Supervised Learning. The 2016 Pacific Rim Knowledge Acquisition Workshop (PKAW 2016), LNAI 9806, pp. 1-15, August 22-23, 2016.

3.   Nguyen Dong Phuong and Vo Thi Ngoc Chau. Automatic de-identification of medical records with a multilevel hybrid semi-supervised learning approach. In Proc. of the IEEE RIVF International Conference on Computing and Communication Technologies (RIVF 2016), 2016, Hà Nội - Việt Nam.

4.   Moharasan Ganhdimathi, Ho Tu Bao. A semi-supervised approach for temporal information extraction from clinical text, IEEE International Conference on Research, Innovation and Vision for Future, RIVF 2016, Hanoi, November 7-9, 2016.

5.   Dang Tran Thai, Ho Tu Bao. Mixture of language models utilization in score-based sentiment classification on clinical narratives, 29th International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA/AIE 2016), 2-4 August 2016, Morioka, Japan, LNAI 9799, pp. 255–268, 2016.

6.   Pham Duy, Le Bao Khanh, Le Ly, Ho Tu Bao, System pharmacology: application of network theory in predicting potential adverse drug eaction based on gene expression data, IEEE International Conference on Research, Innovation and Vision for Future, RIVF 2016, Hanoi, November 7-9, 2016.

7.   Dang Tran Thai, Ouankhamchan Phetnidda, Ho Tu Bao. Detection of New Drug Indications from Electronic Medical Records, IEEE International Conference on Research, Innovation and Vision for Future, RIVF 2016, Hanoi, November 7-9, 2016.

Page 11: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

12

8.   Moharasan Ganhdimathi, Ho Tu Bao. Extraction of Temporal Events from Clinical Text using Semi-Supervised Conditional Random Fields. International Conference on Data Mining and Big Data (DMBD’2017), Fukuoka July 27 August 1, 2017.

Danh sách các bài báo đã nộp tạp chí/hội nghị và đang chờ đánh giá

1.   Vo Thi Ngoc Chau, Cao Hoang Tru and Ho Tu Bao. An adaptive semi-supervised learning approach to automatic abbreviation identification. Submitted to ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP) (SCIE).

2.   Matsuo Ryoke, Ho Tu Bao. Semantic Term Weighting for Clinical Texts, submitted to Artificial Intelligence in Medicine (SCI).

3.   Matsuo Ryoke, Ho Tu Bao. Semantic Term Weighting for Clinical Texts, submitted to International Journal of Medical Informatics (SCI).

4.   Ho Tu Bao, Hoang Khanh Hung, Dang Tran Thai. Drug effectiveness evaluation by pragmatic clinical trials using electronic medical records, submitted to International Journal of Medical Informatics (SCI).

5.   Nguyễn Văn Bính, Cao Hoàng Trụ, Hồ Tú Bảo, Nguyễn Đức Công. Tạo lập bệnh án điện tử: Bước then chốt trong ứng dụng công nghệ thông tin để nâng cao chất lượng khám chữa bệnh. Bài gửi Tạp chí Y học Thực hành.

6.   B.K. Le, Bao T.B, Le, L. Investigation of adverse drug reaction (adr) from electronic medical records (emr) for type 2 diabetes patients. In preparation.

B2.2 Đăng ký sở hữu trí tuệ .................................................................................................................................................................... Mô tả sản phẩm/kết quả nghiên cứu (căn cứ đề cương được phê duyệt) ....................................................................................................................................................................

Công nghệ/ giải pháp hữu ích đã chuyển giao công nghệ (kèm minh chứng)

TT

Tên công nghệ/ giải pháp hữu ích đã chuyển giao (sản phẩm chuyển

giao- Thông số kỹ thuật của sản phẩm)

Năm chuyển

giao

Đối tác ký hợp đồng

Ngày ký hợp đồng

Doanh thu từ hợp đồng

Quy mô

B2.3 Kết quả đào tạo (kèm minh chứng) Đã hoàn tất

Page 12: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

13

1.   Nguyễn Đông Phương. Lọc thông tin riêng trong bệnh án điện tử. Luận văn cao học ngành Khoa

Học Máy Tính. Trường Đại học Bách Khoa, ĐHQG-HCM, 2016. 2.   Đặng Trần Thái, Mixture of language models utilization in score-based sentiment classification on

clinical narratives, Master Thesis, Japan Advanced Institute of Science and Technology (JAIST). Tốt nghiệp xuất sắc với giải thưởng của Chủ tịch của JAIST. 9.2016.

3.   Lê Minh Trí và Trịnh Hưng Tín, Rút trích quan hệ về thời gian trong bệnh án điện tử. Luận án tốt

Đại học. Trường Đại học Bách Khoa, ĐHQG-HCM, 2017.

Đang hướng dẫn NCS với chủ đề về các nội dung đề tài  1.   Nguyễn Minh Hiệp. Nghiên cứu sử dụng phương pháp học máy cho việc gán nhãn từ loại tiếng

Việt. Trường Đại học Khoa học Tự nhiên, ĐHQG-HN. (Hướng dẫn: Nguyễn Thi Minh Huyền) 2.   Matsuo Ryoke, Xây dựng mô hình véc-tơ biểu diễn bệnh án điện tử với ngữ nghĩa y học, Japan

Advanced Institute of Science and Technology (Hướng dẫn: Hồ Tú Bảo). 3.   Moharasan Gandhimathi, Trích rút thông tin có yếu tố thời gian từ bệnh án điện tử, Japan

Advanced Institute of Science and Technology (Hướng dẫn: Hồ Tú Bảo). 4.   Hoàng Khánh Hùng, Xây dựng mô hình chủ đề trong y học, Japan Advanced Institute of Science

and Technology (Hướng dẫn: Hồ Tú Bảo). 5.   Đặng Trần Thái, Dự đoán hiệu ứng phụ của thuốc từ bệnh án điện tử, Japan Advanced Institute of

Science and Technology (Hướng dẫn: Hồ Tú Bảo).

B3. Hội nghị, hội thảo trong và ngoài nước đã được tổ chức, tham gia

TT Thời gian Tên hội thảo, hội nghị (chủ đề) Địa điểm Kết quả

1 19-22/4/2016 The 20th Pacific Asia Conference on Knowledge Discovery and Data Mining (PAKDD) 2016

Auckland, New Zealand

Chair of Steering Committee (Hồ Tú Bảo)

2 2-4/8/2016 The 29th International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA/AIE 2016)

Morioka, Japan

1 bài (bài số 4 ghi trong phần B2.1)

3 22-23/8/2016 The 2016 Pacific Rim Knowledge Acquisition Workshop (PKAW 2016)

Phuket, Thailand

1 bài (bài số 1 ghi trong phần B2.1)

4 7-9/11/2016 The IEEE International Conference on Research, Innovation and Vision for Future (RIVF 2016)

Hà Nội, Việt Nam

4 bài (các bài số 2, 3, 6, 7 ghi trong phần B2.1)

Page 13: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

14

Cán bộ được cử đi trao đổi HTQT về KH&CN (Hội nghị, hội thảo, tập huấn ngắn hạn) thông qua đề tài/dự án

TT Tên người được cử

đi Thời gian Địa điểm

Nội dung trao đổi

Kết quả thu được

1 2 3 4

Cao Hoàng Trụ Võ Thị Ngọc Châu Lê Thị Lý và 2 sinh viên

6-10/11/2016 RIVF 2016 Hà Nội

Tổ chức hội nghị Báo cáo Báo cáo

Hội nghị IEEE RIVF tổ chức lần thứ 12 ở Việt Nam

5 Cao Hoàng Trụ

August 20-25 Dang, T.T., Ho16).

PKAW 2016 Phukhet, ThailandJapan

Báo cáo Dang, T.T

Báo cáo và trao đổiang, T.T., Ho,

B4. Tình hình sử dụng kinh phí Kinh phí

Số tiền (triệu đồng)

Ghi chú

Kinh phí đề tài đề nghị ĐHQG-HCM cấp 885

Kinh phí cấp đến thời điểm báo cáo 885

Kinh phí sử dụng đến thời điểm báo cáo (Ghi rõ từng nội dung cụ thể như thuê khoán chuyên môn, mua sắm trang thiết bị, photo, in ấn,…)

126,788

TT Tên nội dung đã tạm ứng 1 Thuê khoán chuyên môn 126,788

Kinh phí đề nghị cấp tiếp

B5. Nhận xét và đánh giá kết quả đạt được so với yêu cầu B5.1 Về nội dung: Thành viên ở cả 5 nội dung đều tích cực hoạt động. Đảm bảo tiến độ theo kế hoạch ở các nội dung.

....................................................................................................................................................................

B5.2 Về sản phẩm: Đạt hoặc đang làm được số ấn phẩm đăng ký. Các sản phẩn khác cũng đang được thực hiện theo kế hoạch.

....................................................................................................................................................................

B5.3 Về tiến độ: Đề tài được thực hiện theo tiến độ đề ra.

.....................................................................................................................................................................

B5.4 Kiến nghị: Không có.

……………………………………………………………………………………………………………

Page 14: BÁO CÁO TÓM TẮT TÌNH HÌNH THỰC HIỆN ĐỀ …bao/papers/JVN/Application2018/R05-BAO...Quản lý Sinh học và Công nghệ Sinh học Điện – Điện tử Khoa học

15

Ngày 25 tháng 3 năm 2017 Chủ nhiệm

Hồ Tú Bảo