Перельмутер А.В. Определение класса ответственности сооружений по нормам Украины
Определение курильщика по кардиограмме
-
Upload
- -
Category
Data & Analytics
-
view
538 -
download
3
Transcript of Определение курильщика по кардиограмме
ООппррееддееллееннииее ккууррииллььщщииккаа ппоо ккааррддииооггррааммммее
ааллггооррииттмм,, ззаанняяввшшиийй ввттооррооее ммеессттоо ннаа ссооррееввннооввааннииии
CCaarrddiiooQQvvaarrkk
ААллееккссааннддрр ДДььяяккоонноовв
ММооссккооввссккиийй ггооссууддааррссттввеенннныыйй ууннииввееррссииттеетт
ииммееннии ММ..ВВ.. ЛЛооммооннооссоовваа ((ММоосскквваа,, РРооссссиияя))
Соревнование CardioQVARK 2 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Соревнование CardioQvark
ППееррввыыйй ээттаапп ––2255..1122..22001155--0011..0033..22001166
РРааззррааббооттааттьь ааллггооррииттмм ооппррееддееллеенниияя ккуурряящщееггоо ччееллооввееккаа
ппоо ееггоо ккааррддииооггррааммммее
Обучающая выборка –– 110000 ккааррддииооггрраамммм ((5500++5500))
Контрольная выборка –– 225500 ккааррддииооггрраамммм ((6644++118866))
ещё:
ппррииззннааккии
ффииллььттрроовваанннныыее ккааррддииооггррааммммыы
Соревнование CardioQVARK 3 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Функционал качества
итоговая оценка решения –– ссууммммаа ммеесстт ппоо
ччууввссттввииттееллььннооссттии ((SSee))
ссппееццииффииччннооссттии ((SSpp))
1110
0100
1
0
10
xxa
xxa
yy
0111
11Sexx
x
1000
00Spxx
x
,
Соревнование CardioQVARK 4 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Бенчмарк – случайное решение
10 20 30 40 50 60 70 80 90 100
0.4
0.45
0.5
0.55
0.6
номер решения
(Se+
Sp)/
2
Соревнование CardioQVARK 5 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Бенчмарк – случайное решение
Соревнование CardioQVARK 6 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Критика функционала
ООдднноо рреешшееннииее яяввнноо ллууччшшее......
нноо ооннии ннаа ррааввнныыхх ммеессттаахх
ППоояяввлляяееттссяя ссооввссеемм ппллооххооее
рреешшееннииее,, нноо ттееппееррьь ххоорроошшееее ннаа
ввттоорроомм ммеессттее!!
П.С. ТТаакк вв ииттооггее ии ппооллууччииллооссьь...... ллууччшшееее рреешшееннииее ппоо ооццееннккее
ооррггааннииззааттоорроовв ххуужжее ппоо FF--ммееррее ии ррааззнныымм ууссррееддннеенниияямм SSee ии SSpp
Соревнование CardioQVARK 7 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Восстановление confusion matrix
1110
0100
1
0
10
xxa
xxa
yy
ччууввссттввииттееллььннооссттьь ии ссппееццииффииччннооссттьь::
0111
11
xx
x
,
1000
00
xx
x
,
ММыы ззннааеемм ччииссллоо ннууллеейй вв ннаашшеемм рреешшееннииии::
01000 xxa ,
аа ттааккжжее ччииссллоо ееддиинниицц
11101 xxa .
ИИммеееемм ччееттыыррее ууррааввннеенниияя ии ччееттыыррее ннееииззввеессттнныыхх::
1000
1101
11110
01110
1
1
1
1
xx
xx
axx
axx
Соревнование CardioQVARK 8 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Восстановление confusion matrix
ччууввссттввииттееллььннооссттьь ии ссппееццииффииччннооссттьь ддаанныы сс ооккррууггллееннииеемм
((ппооээттооммуу ммоожжеетт ббыыттьь оошшииббккаа ±±11))
ММоожжнноо ууззннааттьь FF11--ммеерруу рреешшеенниийй
ММоожжнноо ууззннааттьь ччииссллоо ккууррииллььщщииккоовв ннаа ккооннттррооллее
Соревнование CardioQVARK 9 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Общий подход
ппррееддооббррааббооттккаа ссииггннааллаа,, ввыыддееллееннииее ккааррддииооццииккллоовв
ггееннеерраацциияя ппррииззннааккоовв ((сс ппооммоощщььюю ррааззнныыхх ммееттооддоовв))
ссееллееккцциияя ппррииззннааккоовв
ннаассттррооййккаа ррееггрреессссоорраа
ввыыббоорр ппооррооггаа ии ффооррммииррооввааннииее ооккооннччааттееллььннооггоо ррееззууллььттааттаа
Генерация признаков
ФФууррььее--ааннааллиизз
ССииннггуулляяррннооее ррааззллоожжееннииее
ССттааттииссттииккии ((ннее ввоошшллии вв ффииннааллььннооее рреешшееннииее))
ППааррааммееттррыы,, ппррееддооссттааввллеенннныыее ооррггааннииззааттооррааммии
ппоо ВВ..ММ.. УУссппееннссккооммуу ((ннее ввоошшллии вв ффииннааллььннооее рреешшееннииее))
ВВееййввллеетт--ааннааллиизз ((ннее ввоошшллии вв ффииннааллььннооее рреешшееннииее))
Потом:
ссееллееккцциияя ппррииззннааккоовв ((ппоо 1100 иизз ккаажжддоойй ггррууппппыы))
ккллаассссииффииккаацциияя
Соревнование CardioQVARK 10 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Реализация
MMaattllaabb 22001122bb
PPyytthhoonn 33..55..00 ((AAnnaaccoonnddaa 22..44..00 6644--bbiitt))
Соревнование CardioQVARK 11 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Загрузка данных
файл _Обучающая выборка_.txt файл traininfo.txt | ФИО | пол | возраст |
1.1. Обучающая выборка (50 человек). Курящие.
BRA | М | 37 |
CZA | Ж | 31 |
KNN | М | 52 |
PPV | М | 32 |
SAE | М | 47 |
ZLS | Ж | 27 |
АТА | Ж | 46 |
...
BRA, 1, 37, 1
CZA, 0, 31, 1
KNN, 1, 52, 1
KVA, 1, 32, 0
PPV, 1, 32, 1
SAE, 1, 47, 1
ZLS, 0, 27, 1
АТА, 0, 46, 1
АШМ, 1, 22, 1
БАС, 1, 27, 0
БВА, 1, 44, 1
БДИ, 1, 33, 0
...
ннее ббыыллоо ппррооббллеемм сс ппууттааннииццеейй вв ииммееннаахх ффааййллоовв
((ллааттииннссккооее//ррууссссккооее ««CC»»))
Соревнование CardioQVARK 12 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Визуализация загруженных сигналов
1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2
x 104
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
время
уровень с
игн
ал
а
сигнал 8
сигнал 41
сигнал 1
Соревнование CardioQVARK 13 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Сигналы после использования фильтра низких частот
1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2
x 104
-0.35
-0.3
-0.25
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
время
уровень с
игн
ал
а
сигнал 8 после ФНЧ
сигнал 41 после ФНЧ
сигнал 1 после ФНЧ
% фильтр низких частот
function corrected = cardio_removelowerfrequencies(ecg, samplingrate)
fresult=fft(ecg);
fresult(1 : round(length(fresult)*5/samplingrate))=0;
fresult(end - round(length(fresult)*5/samplingrate)+1 : end)=0;
corrected=real(ifft(fresult));
Соревнование CardioQVARK 14 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Сигналы после использования фильтров низких и высоких частот
1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2
x 104
-0.35
-0.3
-0.25
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
время
уровень с
игн
ал
а
сигнал 8 после ФНЧ+ФВЧ
сигнал 41 после ФНЧ+ФВЧ
сигнал 1 после ФНЧ+ФВЧ
Соревнование CardioQVARK 15 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Что такое кардиограмма
Соревнование CardioQVARK 16 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Разведочный анализ данных
УУ ннаасс ппееррееввёёррннууттыыее ккааррддииооггррааммммыы
ГГллааввнныыее ввооллнныы,,
ппррееддооссттааввллеенннныыее ооррггааннииззааттооррааммии ккооннккууррссаа
Соревнование CardioQVARK 17 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Разведочный анализ данных
2 3 4 5 6 7 8
x 104
-0.02
0
0.02
0.04
0.06
0.08
0.1
время
уровень с
игн
ал
а
сигнал 50
сигнал после ФВЧ+ФНЧ
РРееззккооее ииззммееннееннииее ааммппллииттуудд
Соревнование CardioQVARK 18 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Разведочный анализ данных
2 3 4 5 6 7
x 104
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
0.25
время
уровень с
игн
ал
а
сигнал 42
сигнал после ФВЧ+ФНЧ
ССттррааннннооее ппооввееддееннииее ффииллььттррааццииии
Соревнование CardioQVARK 19 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Разведочный анализ данных
4.8 4.9 5 5.1 5.2 5.3
x 104
-0.1
-0.05
0
0.05
0.1
0.15
0.2
время
уровень с
игн
ал
а
сигнал 42
сигнал после ФВЧ+ФНЧ
ЕЕссллии ууввееллииччииттьь......
ээттоо ннее ооччеенньь ппооххоожжее ннаа ккааррддииооггррааммммуу......
Соревнование CardioQVARK 20 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Выделение кардиоциклов
1.45 1.46 1.47 1.48 1.49 1.5 1.51
x 105
-0.02
0
0.02
0.04
0.06
0.08
время
уровень с
игн
ал
а
сигнал
начала циклов (версия организаторов)
J-максимумы (вычислены автором)
ККооннццыы ооттррееззккоовв ооттддееллььнныыхх ккааррддииооццииккллоовв
ССттууддееннттыы ААММАА ииссппооллььззооввааллии ммааккссииммууммыы ооррггааннииззааттоорроовв......
ММннооггииее ббииббллииооттееккии ззддеессьь ннее ррааббооттааллии......
Соревнование CardioQVARK 21 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Выделение кардиоциклов
ИИддееяя ааллггооррииттммаа::
ГГллооббааллььнныыйй MMAAXX вв ооккрреессттннооссттии
РРяяддоомм еессттьь ооттррииццааттееллььнныыее ззннааччеенниияя
1.45 1.46 1.47 1.48 1.49 1.5 1.51
x 105
-0.08
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
0.08
0.1
время
уровень с
игн
ал
а
сигнал
начала циклов (версия организаторов)
J-максимумы (вычислены автором)
ККооннццыы ооттррееззккоовв ккааррддииооццииккллоовв ннаа исходном ссииггннааллее
Соревнование CardioQVARK 22 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Выделение кардиоциклов
6 7 8 9 10 11 12
x 104
-0.06
-0.04
-0.02
0
0.02
0.04
0.06
0.08
0.1
время
уровень с
игн
ал
а
сигнал
J-максимумы (вычислены автором)
ККооннццыы ооттррееззккоовв ооттддееллььнныыхх ккааррддииооццииккллоовв ннаа ппееррввоомм ссииггннааллее
ССааммооддееллььнныыйй ммееттоодд ааддееккввааттнноо ррааббооттааеетт......
Соревнование CardioQVARK 23 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Априорная оценка признаков
ДДлляя ппррииззннааккаа ),,( 1 mfff
)min()max(
)min(,,
)min()max(
)min(1
ff
ff
ff
fff mN
ЕЕссллии m
Nf ]1,0[ ввыыддааввааттьь вв ккааччеессттввее ооттввееттаа,,
ттоо ллооггииччнноо ккааччеессттввоо ппррииззннааккаа ооппррееддееллииттьь ккаакк
5.0|5.0),AUCROC(|)],AUCROC(1),,(max[AUCROC yfyfyf NNN
Апостериорная оценка признаков
ННаа ллооккааллььнноомм ккооннттррооллее –– ппррии ууддааллееннииии ппррииззннааккаа
Соревнование CardioQVARK 24 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки по В.М. Успенскому и К.В. Воронцову
ССииггннаалл ккооддииррууееттссяя ссллооввоомм,, n --яя ббуукквваа –– ззааввииссиитт оотт ззннааккоовв ввыырраажжеенниийй
nnnnnn TTRR 111 ,, ..
Соревнование CardioQVARK 25 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки по В.М. Успенскому и К.В. Воронцову
ВВссееггоо ввооззммоожжнныы 66 ((ннее 88)) ввааррииааннттоовв ззннааккоовв..
ВВыыччиисслляяееттссяя ччаассттооттаа ввссеехх ттррииггрраамммм ссллоовваа (( 21663 ттррииггрраамммм))..
ЕЕссллии ииссппооллььззооввааттьь ччаассттооттыы ббуукквв,, ббииггрраамммм ии ттррииггрраамммм::
258666 23 ппррииззннааккоовв..
Соревнование CardioQVARK 26 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки по В.М. Успенскому и К.В. Воронцову
0 50 100 150 200 250
0.5
0.52
0.54
0.56
0.58
0.6
0.62
0.64
0.66
номер признака
AU
C-R
OC
-качеств
о
признаки Успенского
случайные признаки
ККааччеессттввоо ппррииззннааккоовв
ППооддххоодд ппррооввааллииллссяя......
Соревнование CardioQVARK 27 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки, основанные на разложении Фурье
ППооссттррооееннииее ссппееккттррооггррааммммыы
РРааззббииввааеемм ннаа ннееппеерреессееккааюющщииеессяя ууччаассттккии
ДДлляя ккаажжддооггоо –– ДДППФФ
|||| ijhH ррааззммеерраа k513 ((ааббссооллююттнныыее ззннааччеенниияя ккооээффффииццииееннттоовв))
ППоо ээттоойй ммааттррииццее ссттррооииттссяя 551133--ммееррнныыйй ввееккттоорр ппррииззннааккоовв
),,,( 5131 ff
1
11, |)/log(|
1
1 k
jijjii hh
kf .
Соревнование CardioQVARK 28 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки, основанные на разложении Фурье
ММоожжнноо ррааззнныыее ффууннккццииии::
k
jiji h
kf
1
1
((ууссррееддннеенниияя ДДППФФ))
ААппррииооррннооее ккааччеессттввоо ттааккиихх ппррииззннааккоовв
ННоо:: ннаа ппееррввыыхх ппррииззннааккаахх ммааккссииммааллььннооее ппееррееооббууччееннииее!!
Соревнование CardioQVARK 29 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки, основанные на разложении Фурье
1
11, |)/log(|
1
1 k
jijjii hh
kf
((ииззммееннееннииее))
0 50 100 150 200 250 300 350 400 450 500
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
номер признака
значение п
ризн
ака
курящий
курящий
некурящий
некурящий
ЗЗннааччеенниияя ппррииззннааккоовв,,
ппооссттррооеенннныыхх ппоо ссппееккттррооггррааммммаамм ддлляя 44хх ссииггннааллоовв..
Соревнование CardioQVARK 30 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки, основанные на сингулярном разложении
11.. ФФииллььттрраацциияя ((ФФННЧЧ++ФФВВЧЧ))
22.. ННааххоожжддееннииее J --ммааккссииммууммоовв
33.. ВВыыддееллееннииее ннееппррееррыыввнныыхх ууччаассттккоовв ссииггннааллаа
),,,( 9991 iii xxx ,, Ji ..
44.. ФФооррммииррооввааннииее ммааттррииццыы X ррааззммеерраа k1000 ,, ггддее k –– ччииссллоо
ввыыддееллеенннныыхх ооттррееззккоовв,, вв ссттооллббццаахх ккооттоорроойй ззааппииссаанныы ввееккттооррыы
т9991 ),,,( iii xxx ..
55.. ВВыыппооллннееннииее ссииннггуулляяррннооггоо ррааззллоожжеенниияя ппооллууччеенннноойй ммааттррииццыы..
ВВыыччиисслляяеемм ттооллььккоо ппееррввыыее 33 ккооммппооннееннттыы ррааззллоожжеенниияя::
kVLUX 33331000 ..
Соревнование CardioQVARK 31 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки, основанные на сингулярном разложении
0 100 200 300 400 500 600 700 800 900 10000
0.05
0.1
0.15
0.2
0.25
0.3
0.35
номер строки матрицы |U|
значение э
лем
ента
в п
ервом
сто
лбце м
атр
ицы
|U
|
курящий
курящий
некурящий
некурящий
0 100 200 300 400 500 600 700 800 900 10000
0.05
0.1
0.15
0.2
номер строки матрицы |U|
значение э
лем
ента
во в
тором
сто
лбце м
атр
ицы
|U
|
курящий
курящий
некурящий
некурящий
0 100 200 300 400 500 600 700 800 900 1000
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
номер строки матрицы |U|
значение э
лем
ента
во т
реть
ем
сто
лбце м
атр
ицы
|U
|
курящий
курящий
некурящий
некурящий
Соревнование CardioQVARK 32 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки, основанные на случайном сингулярном разложении
11.. ФФииллььттрраацциияя ((ФФННЧЧ++ФФВВЧЧ))
22.. ГГееннеерраацциияя ссллууччааййннооггоо ммнноожжеессттвваа I ((оотт 11 ддоо 229900000000)),, 10000|| I ..
ППррооссттоо ддлляя ээккооннооммииии ввррееммееннии.. ЛЛууччшшее –– ввссее ттооччккии..
33.. ВВыыддееллееннииее ннееппррееррыыввнныыхх ууччаассттккоовв ссииггннааллаа
),,,( 9991 iii xxx ,, Ii ..
44.. ФФооррммииррооввааннииее ммааттррииццыы k1000 ррааззммеерраа k1000 ,, ггддее || Ik –– ччииссллоо
ввыыддееллеенннныыхх ооттррееззккоовв,, вв ссттооллббццаахх ккооттоорроойй ззааппииссаанныы ввееккттооррыы
т9991 ),,,( iii xxx ..
55.. ВВыыппооллннееннииее ссииннггуулляяррннооггоо ррааззллоожжеенниияя ппооллууччеенннноойй ммааттррииццыы..
ВВыыччиисслляяеемм ттооллььккоо ппееррввыыее 22 ккооммппооннееннттыы ррааззллоожжеенниияя::
kVLUX 22221000 ..
Соревнование CardioQVARK 33 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки, основанные на случайном сингулярном разложении
0 100 200 300 400 500 600 700 800 900 10000
0.01
0.02
0.03
0.04
0.05
0.06
0.07
номер строки матрицы |U|
значение э
лем
ента
в п
ервом
сто
лбце м
атр
ицы
|U
|
курящий
курящий
некурящий
некурящий
0 100 200 300 400 500 600 700 800 900 10000
0.01
0.02
0.03
0.04
0.05
0.06
номер строки матрицы |U|
значение э
лем
ента
во в
тором
сто
лбце м
атр
ицы
|U
|
курящий
курящий
некурящий
некурящий
Соревнование CardioQVARK 34 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Признаки, предоставленные организаторами
Фрагмент csv-файла, содержащий в названии "ucc": CZA_09-12-2015_02-27-
31_300_87302162855_1000hz_int16_I_ucc.csv
Фрагмент csv-файла, НЕ содержащий в названии "ucc": KNN_09-12-2015_13-16-
17_300_88649561808_1000hz_int16_I.csv
error, 0
quality, 48
spqrst, 115.801916104722240
spq, 14.190019818114955
sqrs, 41.586460006008991
sst, 59.911544840698710
-43.498732254252765
-43.316289798709320
-43.140302991464743
-42.993737422959335
-42.897042604584314
-42.862033117616917
-42.887039393198449
-42.954988907959326
-43.035577360470192
...
HR, 75, bpm
SDNN, 30, ms
CV, 3.7, %
SI, 120.3,
IRSA, 7,
NArr, 1.6, %
NN50, 10,
pNN50, 2.7, %
VLF, 12.4, %
LF, 86.2, %
HF, 13.8, %
TP, 1106, ms^2
VLF, 137, ms^2
LF, 834, ms^2
HF, 135, ms^2
LF/HF, 6.23,
IC, 8.0,
Соревнование CardioQVARK 35 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Статистические признаки
11.. ФФииллььттрраацциияя ((ФФННЧЧ//ФФВВЧЧ//сглаживание))
22.. ППррииззннааккии::
11)) ссррееддннееее ззннааччееннииее ссииггннааллаа
n
xxx n
21mean
22)) ссттааннддааррттннооее ооттккллооннееннииее
n
i
ni
n
xxxx
n 1
221
1
1std
33)) ддоолляя ппеерреессееччеенниийй сс ууррооввннеемм a ((ддлляя 0a ,, meana ,, stdmeana ))
1
|}0)()(|}1,,2,1{{| 1
n
axaxni ii
44)) ррааззннооссттьь ддооллеейй ппеерреессееччеенниийй сс ууррооввннеемм stdmeana ии stdmeana
Соревнование CardioQVARK 36 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Статистические признаки
ВВыыччиисслляяююттссяя ддлляя::
ссииггннааллаа ),,,( 21 nxxx
ммооддуулляя |)|,|,||,(| 21 nxxx
ппррооииззввоодднноойй ),,( 112 nn xxxx
ммооддуулляя ппррооииззввоодднноойй |)|,|,(| 112 nn xxxx
ии тт..дд..
5 10 15 20 25 30
0.5
0.55
0.6
0.65
номер признака
априорное к
ачеств
о п
ризн
ака
сигнал
ФНЧ
ФВЧ
ФНЧ+ФВЧ
ФНЧ+сглаживание
Соревнование CardioQVARK 37 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Классификация сигналов
РРееггрреессссиияя
ББииннааррииззаацциияя –– ссррааввннееннииеемм сс ппооррооггоомм
Зачем нужно решающее правило
ММааккссииммииззаацциияя ккааччеессттвваа
ДДввиижжееннииее ппоо ллииддееррббооррддуу
Соревнование CardioQVARK 38 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Классификация сигналов
ррееггрреессссооррыы::
sklearn.ensemble.RandomForestRegressor ((ссллууччааййнныыйй ллеесс)),,
sklearn.linear_model.SGDRegressor ((ллииннееййннааяя ммооддеелльь ++
ссттооххаассттииччеессккиийй ггррааддииееннттнныыйй ссппуусскк))
sklearn.ensemble.ExtraTreesRegressor ((""ээккссттррееммааллььнноо ссллууччааййнныыее
ддееррееввььяя""))
sklearn.linear_model.LogisticRegression ((ллооггииссттииччеессккааяя ррееггрреессссиияя))
sklearn.linear_model.Ridge ((ггррееббннееввааяя ррееггрреессссиияя))
Соревнование CardioQVARK 39 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Классификация сигналов
Алгоритм Параметры алгоритма
RandomForestRegressor
(n_estimators=100, criterion='mse')
max_features=5 max_features=10
(*1)
max_features=15
0.6949 / 0.7 0.72 / 0.72
0.67
0.7/ 0.69
SGDRegressor() С нормировкой
sk.preprocessing.normalize()
alpha=1.0 alpha=0.1 (*2)
alpha=0.01
0.3632 / 0.52 0.4124 / 0.52
0.3962 / 0.52
ExtraTreesRegressor(criterion='mse') n_estimators=20
max_depth=2
(*3)
n_estimators=40 max_depth=2
n_estimators=40 max_depth=1
0.6627 / 0.69
0.6175 0.6314 / 0.69 0.5994 / 0.69
GradientBoostingRegressor (n_estimators=1000, learning_rate=0.01,
max_depth=2, random_state=1,
loss='ls')
n_estimators=1000, max_depth=2,
n_estimators=1000, max_depth=1
n_estimators=100, max_depth=1
0.68 / 0.7
0.6928 /0.72
0.6048 (*4)
0.7467 / 0.75
0.5972
LogisticRegression() C=1.0
(*5)
C=0.1 C=0.01
0.6986 / 0.71
0.5467 0.6725 / 0.69
0.6794 / 0.69
Ridge(normalize=True) alpha=0.1
(*6)
alpha=0.01 alpha=0.001
0.6862 / 0.71
0.6316 0.6794 / 0.71 0.672 / 0.7
Соревнование CardioQVARK 40 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Классификация сигналов
(*1)
(*2)
(*3)
(*4)
(*5)
(*6)
Соревнование CardioQVARK 41 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Финальное решение
ЕЕщщёё ссееллееккцциияя ((!!))
sklearn.ensemble.GradientBoostingRegressor
nn__eessttiimmaattoorrss==11000000,,
lleeaarrnniinngg__rraattee==00..0011,,
mmaaxx__ddeepptthh==22,,
rraannddoomm__ssttaattee==110000,,
lloossss==''llss''
ППоорроогг ббииннааррииззааццииии == 00..888822
ООссооббееннннооссттьь:: ннеетт ссккррыыттоойй ((pprriivvaattee)) ттууррннииррнноойй ттааббллииццыы
Соревнование CardioQVARK 42 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Результаты
hhttttppss::////hhaabbrraahhaabbrr..rruu//ppoosstt//227799331199//
11.. ББееллааввиинн ВВллааддииссллаавв ССееррггееееввиичч МФТИ..
22.. ДДььяяккоонноовв ААллееккссааннддрр ГГееннннааддььееввиичч МГУ, ВЦ РАН..
33.. ИИссааккоовв РРооммаанн ВВллааддииммииррооввиичч ВлГУ..
44.. ББррююххаанноовв ИИллььяя ААллееккссааннддррооввиичч МГУ..
55.. ДДооккууккиинн ААллееккссааннддрр ААллееккссааннддррооввиичч,,
ССееннььккоо ООллеегг ВВааллееннттииннооввиичч,,
ЧЧууччууппаалл ВВллааддииммиирр ЯЯккооввллееввиичч ВЦ РАН..
114488 ккооммаанндд
ММГГУУ ((2288))
ММФФТТИИ ((2200))
ННИИУУ ВВШШЭЭ ((66))
ММГГТТУУ ииммееннии НН..ЭЭ.. ББааууммааннаа ((33))
ШШААДД ((22))
ВВЦЦ РРААНН ((44))
ИИППППИИ РРААНН ((33))
ИИММ ССОО РРААНН ((22))
ЯЯннддеекксс ((11))
Соревнование CardioQVARK 43 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Результаты
1 2 3 4 5 6 7 8 9 10
0.4
0.45
0.5
0.55
0.6
0.65
0.7
номер участника в итоговой таблице
качеств
о,
%
(Se+Sp)/2
FF-мера
F1-мера
Соревнование CardioQVARK 44 слайд из 45 Александр Дьяконов (Москва, МГУ)
Определение курильщика по кардиограмме 28 марта 2016 года
Выводы
ААллггооррииттмм ппоо рраассппррооссттррааннёённнныымм ккррииттеерриияямм ккааччеессттвваа ((SSee++SSpp,, FF--ммеерраа ии тт..пп..))
ппррееввооссххооддиитт ддррууггииее
ЛЛууччшшииее ппррииззннааккии::
ннаа ооссннооввее ФФууррььее--ааннааллииззаа,, ссииннггуулляяррннооггоо ррааззллоожжеенниияя,, ссттааттииссттиикк ии ссттааннддааррттнныыее
ппррииззннааккии ((ккааччеессттввоо FFFF>>00..6644))
ХХууддшшииее ппррииззннааккии::
ппоо ВВ..ММ.. УУссппееннссккооммуу ппррооввааллииллииссьь ((ккааччеессттввоо FFFF<<00..66))
ЕЕссллии ррааззнноорроодднныыее ппррииззннааккии,, ттоо ккааччеессттввоо FFFF~~00..774477
ССттааббииллььнныыее ааллггооррииттммыы ((ллооккааллььнныыйй ккооннттрроолльь == ттеесстт)) оосснноовваанныы ннаа ппооссттррооееннииии
ддееррееввььеевв.. ННоо ззааввииссиитт оотт ппррииззннааккооввооггоо ппррооссттррааннссттвваа!!
ННее ууддааллооссьь ((ддаажжее ннаа ллооккааллььнноомм ккооннттррооллее)) ппооллууччииттьь ккааччеессттввоо FFFF>>00..7755
FFFF == ((SSee++SSpp))//22