組員： H24933344 楊沛勳組員： H24933035 陳慧芳組員： H24936300 洪國棟...

組員： H24933344楊沛勳組員： H24933035陳慧芳組員： H24936300洪國棟

結合模糊集合理論與貝氏分類法之資料探勘技術

-應用於健保局醫療費用審查作業

大綱研究動機研究目的相關文獻研究架構研究方法研究過程系統評估系統成效比較研究限制未來發展

研究動機詐欺索賠的案件在國內已造成龐大的財務負擔，所以，結合資料探勘中模糊集合理論與貝氏分類法的技術，將能加強資料分類的正確性，以便為健保局節省更多的審查人力與時間，進而提高醫療費用的審查成效，抑制醫療資源之浪費。

研究目的利用資料探勘技術，建立一套分類模式，以協助健保局進行醫療費用審查的工作結合模糊集合理論與貝氏分類法，發展更佳的資料分析模式

找出醫療費用審查的關鍵因素利用本研究發展的資料探勘技術，輔助健保局進行醫療費用審查之業務

相關文獻資料探勘資料探勘的技術模糊集合理論貝氏分類法模糊貝氏分類法醫療費用申報審查作業

資料探勘資料探勘係企業藉由資訊技術的輔助，從大量的資料中不斷探索，以發掘隱藏在繁雜資料中的知識與規則，其過程如下：問題的定義資料收集和整合建立學習策略模式的訓練、驗證和測試結果分析

資料探勘─技術下表為資料探勘所包含的 4種技術，

資料探勘的技術─分類利用一些已經分類的資料 (歷史性資料 )來研究其特徵，然後再根據這些特徵對其他未經分類或是新的資料做預測。

相關技術：決策樹、區別分析、貝氏分類法、類神經網路、記憶基礎推理與模糊理論等。

模糊集合理論近似”推理”，具有不需經過精密繁雜的計算過程，仍能作出正確判斷的特色而發展出來的。它最主要的應用有：影像識別自動控制其他

模糊理論釋例─氣溫很高的程度在此定義下，氣溫三十五度的歸屬度為 1，而氣溫三十四度的歸屬度為 0.98。

貝氏分類法貝氏推論是在不確定情況下進行推測的有效工具。

主要方法是利用各類別已知的屬性機率值及各類別之事前機率，計算新案例於各類別的機率，最後比較各類別的機率，機率最大者則該案例分於此類別。

貝氏分類法難以決定概似密度函數的問題，因此，若屬性值是連續的，則其值只要稍微的變化就會對機率分配造成很大的影響，而且處理連續屬性值的密度函數很難定義且較為複雜。

模糊貝氏分類法貝氏分類法較難處理連續性屬性值的資料透過模糊理論先將連續屬性值轉成離散屬性值，以簡化計算計算的過程。

在利用糢糊貝氏分類法時，只要先定義各連續性屬性的模糊集合與歸屬函數，並利用過去的資料或專家的意見，找到必要的事前機率及條件機率，即可由公式〈 13〉〈 16〉計算出案件屬於各類別的機率。

醫療費用申報審查作業行政審查專業審查

如果能改變現行的審查作業流程，在專業審查之前先進行”可能異常之醫療費用申報案件”的篩選動作，將篩選後的”可能異常之醫療費用申報案件”送醫審會進行專業審查，不但可以減少專業審查醫師的工作量，將審查人力與資源投入較具爭議的案件審核上，又可真正達到異常管理的目標，進而提升專業審查效率。若能再配合資訊科技，如資料探勘技術的運用，將能縮短整個審查作業所需時間，另一方面也能大幅降低審查醫師的工作量與審查成本的支出。

研究架構

研究方法結合模式理論推導

主要以三角形的歸屬函數做為屬性值域的變換三角形的歸屬函數只須要三個點即可描述，而這三個點的值一變，即可描述變數中另一個語言項。

三角形模糊數相關運算簡單。

研究方法建置雛型系統系統評估方式

敏感度〈 sensitivity〉─評估實際是申報”異常”的案例，分類結果也是”異常”。

鑑別率〈 specificity〉─評估實際是申報”正常”的案例，分類結果也是”正常”。

本研究中較重視敏感度，當其值愈大則表示系統愈能偵測出醫療費用申報異常之情況。

TP（ True Positive）代表實際值是「異常」，而分類結果是「異常」。

TN（ True Negative）代表實際值是「正常」，而分類結果是「正常」。

FP（ False Positive）代表實際值是「正常」，而分類結果是「異常」。

FN（ TrueNegative）代表實際值是「異常」，而分類結果是「正常」。

建立醫療費用審查資料指標建立之方法

分成第一和第二階段研究對象與資料準備

基層醫療院所

研究過程資料整合與分析

第一階段：資料取得與初步指標建立第二階段：相關性探討與指標選定

研究過程系統發展方法

本研究之雛型系統是以主從式架構建立。

研究過程系統執行

將取得的醫療費用申報資料，分別依三種資料分割方式進行分析，最後再以結果較佳的資料分割方式，建立最後的雛型系統。隨機選取百分之八十的案件為訓練模式的資料，百分之二十的案件為測試模式的資料。

隨機選取百分之七十的案件為訓練模式的資料，百分之三十的案件為測試模式的資料。

隨機選取百分之六十的案件為訓練模式的資料，百分之四十的案件為測試模式的資料。

系統評估

系統成效比較迴歸邏輯分析

自變數：案件分類、科別、病患性別、部分負擔方式、給藥日份、醫師性別、藥費、診療費、診察費、藥事費。

應變數：審查結果。名目尺度：案件分類、科別、部分負擔二元尺度：病患性別、醫師性別、審查結果區間尺度：給藥日份、藥費、診療費順序尺度：診察費、藥事費

決策樹 ID3演算法輸入變數：案件分類、科別、病患性別、部分負擔方式、給藥日份、醫師性別、藥費、診療費、診察費、藥事費。

輸出變數：審查結果。名目尺度：案件分類、科別、部分負擔二元尺度：病患性別、醫師性別、審查結果區間尺度：給藥日份、藥費、診療費順序尺度：診察費、藥事費

研究限制模式發展方面

以三角形函數為主，未考量模糊集合中其他的歸屬函數。系統建置方面

只先開發一個雛型系統資料取得方面

取樣數量不夠多，在資料的完整性上有缺失。指標建立方面

專業審查指標難以定義，所以建立的審查指標具備的代表性不足，導致分析結果的敏感度不是很高。

未來發展由於本研究事先設定各屬性之間為獨立的，但事實上各屬性間會有個相依性存在，未來可再針對屬性間的相關程度設計另一個改良式的模糊貝氏分類法，以便也能分析相依屬性的資料。

組員： H24933344 楊沛勳組員： H24933035 陳慧芳組員： H24936300 洪國棟...

Documents

Transcript of 組員： H24933344 楊沛勳組員： H24933035 陳慧芳組員： H24936300 洪國棟...

組員： H24933344 楊沛勳 組員： H24933035 陳慧芳 組員： H24936300 洪國棟...

Documents

Transcript of 組員： H24933344 楊沛勳 組員： H24933035 陳慧芳 組員： H24936300 洪國棟...

組員： H24933344 楊沛勳組員： H24933035 陳慧芳組員： H24936300 洪國棟...

Transcript of 組員： H24933344 楊沛勳組員： H24933035 陳慧芳組員： H24936300 洪國棟...