Acoustics speech Audio signAl processing lAbasap.hanyang.ac.kr/files/ASAP_brochure.pdf · 세부...

서울특별시 성동구 왕십리로 222 한양대학교 FTC 805호

Tel. 02-2291-0357 http://asap.hanyang.ac.kr

Acoustics speech Audio signAlprocessing lAb

ArtificiAl intelligence for signAl processing reseArch group

음성음향오디오신호처리연구실

인공지능신호처리연구그룹

장준혁 교수

Prof. Joon-Hyuk Chang

·한양대학교 융합전자공학부 교수

·IEEE/IEEK IT젊은공학자상 수상

·한국통신학회 신호처리연구회 위원장

·IEIE 영문저널 SPSJ 편집위원장

·한양대 전기정보통신연구소 부소장

·한국음향학회 이사 및 편집위원

지도교수

Contents

·최신음향기술워크샵 조직위원장

·LG전자 인공지능연구소 자문교수

·BK21 핵심사업팀 사업팀장

·한국연구재단 도약사업 책임자

·총 SCI 논문 게재 편수 107편

· 산업통상자원부 로봇음성인식 사업단장

클라우드 프론티어 2017 기조강연

AI컨퍼런스2017 기조강연

아시아 테크 서밋 2017 기조강연

2017 대한민국 기술사업화 대전 기조강연

03 지도 교수

04 ASAP 연구실 소개

06 연구분야 : 음성인식

07 연구분야 : 딥러닝

08 연구분야 : 음성 신호처리

09 연구분야 : 바이오 신호처리

10 국제 학술 활동 / 초청 세미나

11 즐거운 연구실 생활 / 한양대 AI스피커 플루토 시리즈

12 언론 보도

14 연구 인력

16 연구 시설

17 연구 활동 / 연구 장비

18 나의 연구실 생활

19 졸업생 현황

20 ASAP 연구실 멤버가 되면

21 주요 논문

22 출원 특허 / 등록 특허

23 국책 과제 / 산업체 과제

03

ASAP 연구실 소개 연구분야

음성인식

DeepLearning

인공지능

원거리 자연어인식을 위한 전처리, AM, LM

통합설계

음성신호처리

고성능 원거리 인식용전처리기술 통합개발

바이오신호처리

생체 신호를 이용한수면 상태 측정 기술혈압 측정 기술 개발

2005년 설립된 ASAP Lab은 장준혁 교수의 리드 하에 4명의 연구교수

와 20여명의 석박사 연구원들이 관련 분야 세계 최고의 연구실을 목표

로 음성인식, 음성 신호처리, 딥러닝, 바이오 신호처리 등 4개 분야에서

연구하고 있다.

현재 연구실은 과학기술정통부에서 ICT 기초연구실 및 도약연구실로,

산자부과제 수행 연구실, LG전자 타겟연구실로 지정 받았다. 연구실에

서는 자체 연구 외에도 “웨어러블 스마트기기를 이용한 딥러닝 기반의

음성 및 바이오 통합신호처리 기술 개발”, “자동차 환경에서의 딥러닝

기반 키워드 음성인식 통합시스템 개발”, “로봇용 free-running 임베디

드 자연어 대화음성인식을 위한 원천 기술 개발”을 포함한 15개의 국책

및 산학연구과제를 수행하고 있다.

2017년 현재까지 200여편의 논문과 40여개의 특허를 보유하고 있으

며 국내외 학술대회, 주요저널 등에도 활발한 논문 게재 등 활동을 하고

있으며, 지도교수인 장준혁 교수는 연구수행 외에 다양한 컨퍼런스에서

의 기조강연, 언론 활동 등을 통해 음성과 관련한 인공지능 분야의 기술

발전을 선도하고 있다.

0504

세부 연구분야

Deep learning structures, Ensemble learning, Multi-task learning, Reinforcement learning/Unsupervised model adaptation, Recurrent neural networks (LSTM-RNN), Convolutional neural networks, Unsupervised learning

딥러닝 기반 소음 분류 기술 Generative Adversarial Network을 이용한 Unsupervised 학습

Bi-directional LSTM기반 sound event detection 사운드 및 복합 환경 인식를 위한 Convolutional Neural Networks를 이용한 딥러닝 모델 설계

음성인식이란 사람이 말하는 음성 언어에서 특정한 특징들을 학습하여

그 내용을 텍스트로 변환하는 것을 말하며 speech to text (STT)라고도 한다.

딥러닝이란 뇌신경을 모방한 인공지능 알고리즘으로 여러 비선형 변환기법의

조합을 통해 높은 수준의 추상화를 시도하는 Machine Learning 알고리즘의 일종으로

정의되며, 큰 틀에서 사람의 사고방식을 컴퓨터에게 가르치는 기계학습의 최신 연구분야이다.

세부 연구분야

연구분야 음성인식 연구분야 딥러닝

한양대 자체 개발 AI 스피커 플루토

한국어 인식 Attention seq2seq결과

현대 자동차와 협업한 키워드 인식기

등록된 목소리인증기술

음성인식

Attention seq2seq

DNN

RNN CNN

GAN

화자인식

키워드 인식

음성인식, 키워드 인식, 화자 인식, 음성 향상, 딥러닝 기반 고주파 대역 확장, 딥러닝 기반 패킷손실

은닉 기술, 빔포밍 기술

논문 21편 특허 12건

LG 전자, SK 텔레콤, 현대 자동차, 삼성전자 와의 대기업 산학 과제 진행


LG 전자, SK 텔레콤, 현대 자동차, 삼성전자 와의 대기업 산학 과제 진행

연구 실적

연구 실적

0706

코골이 증상 검출 기술, 무호흡 증상 검출 기술, 수면 단계 검출 기술, 혈압 (이완기 혈압, 수축기

혈압) 측정 기술

음성 신호처리는 음성 및 음향 신호들을 수학적으로 모델링하고

실생활 잡음, 잔향, 에코 등 음성 인식률을 저해 시키는 요소들을 제거하고

이를 극복할 수 있는 기술을 개발하는 연구 분야이다.

바이오 신호처리는 생체 신호에 대한 데이터에 신호 처리를 적용하여

정보를 추출 및 도출하고, 주요한 인체 정보나 질환 정보등을

사용자에게 알려주는 기술을 연구하는 분야이다.

멀티마이크를 이용한 빔포밍기반의 잡음제거기술

딥리닝기반의 음성합성(Text-to-Speech)기술

• 레이더 및 마이크로폰의 비접촉식 센서를

이용한 DNN 기반의 코골이 기술 및

수면무호흡 검출 개발

• 기존 혈압 측정 방법은 수은 혈압계, 전자 혈압계

방식이 있는데, 모두 휴대하기 불편한 측정 방식

• 주기적인 혈압 측정을 위해 휴대성을 향상시키기

위해 스마트 손목 시계형 혈압 측정 기술을 개발

• 스마트 손목 시계에 내장된 PPG 센서와 ECG

센서를 이용한 DNN 기반의 혈압 추정 기술 개발

멀티마이크를 이용한 음원방향추정

자동차용 음성인식용 잡음 및 에코제거기술

잡음제거

음성합성

수면 연구 손목형 혈압 추정 기술음원방향 추정

음향기반상황인지, 잔향억제기술, 음향반향제거/억제, 음원방향추정, 음향출력자동조절, 크로스톡

제거, 다채널 오디오제어, 음악 검색


LG 전자, 넷마블게임즈, SK 텔레콤, 현대 자동차, 삼성전자 와의 대기업 산학 과제 진행


인바디, LG전자와 산학과제 및 공동 특허 출원

연구 실적

연구 실적

자동차 음성인식 전처리기술 개발

수면다원검사장비

세부 연구분야세부 연구분야

연구분야 음성 신호처리 연구분야 바이오 신호 처리

0908

Interspeech 2017, Stockholm

음성인식 세미나 (2017-10)

Google 김찬우 박사

ICEC 2017, Phuket

딥러닝 세미나 (2017-06)

한동대 최희열 교수

ASRU 2017, Okinawa

하계 워크샵 (2017-08, 인제)

학회 후 여정 (2017-01, 푸켓)

신년회 (2017-01)

동계워크샵 (2017-02)

음성언어처리세미나 (2017-06)

서울대 정민화 교수

NIPS 2016, Barcelona

신호처리 세미나 (2017-06)

경기대 이석진 교수

ICASSP 2017, New Orleans

화자인식기술세미나 (2017-02)

서울시립대 유하진 교수

EMBC 2017, Jeju

인공지능 세미나 (2017-07)

NEOSAPIENCE 김태수 대표

국제 학술 활동

초청 세미나

즐거운 연구실 생활

한양대 AI스피커 플루토 시리즈

ASAP 연구실에서는 음성인식 AI 스피커 플루토 3종을 자체 개발하였다. 플루토는 인터넷 연결 없이 자체적으로

딥러닝 연산 및 음성인식을 수행할 수 있는 GPU보드와 디스플레이, 마이크 4개와 스피커를 내장하여 원거리 화자인식

및 음성인식을 수행한다. 플루토는 자체 기술로 개발된 국내 최초의 독립형 AI스피커이다.

1110

언론 보도

2017-01-03 SBS CNBC 뉴스프리즘

2017-01-05 SBS CNBC 경제와이드

2017-01-25 Arirang TV


2017-07-14 The Korea Herald



2017-05-04 시사저널

2017-05-19 시사저널

2017-11-07SBS CNBC 뉴스프리즘

2017-11-16 Zdnet Korea

2017-11-21 조선일보

2017-03-06 조선일보

2017-03-22KBS

2017-04-14 시사저널

2017-08-29시사저널

2017-10-25 The Korea Herald

2017-10-28중앙일보

2017-05-19 시사저널

2017-06-12 Korea Joongang Daily

2017-06-20 ZDNet Korea

2017-11-27Tech M

2017-12-06The Korea Herald

2017-12-07SBS CNBC 뉴스프리즘

연내 화자인식하는인공지능 스피커 출시

'AI 스피커 시장 선점 놓고, 포털 vs 통신 ‘격돌'

AI와 인간의 삶

AI와 인간의 삶

구글 AI비서 '가장 우수‘ … 빅스비·시리보다 탁월

1312

연구 인력

Professors MasterCandidates

Under-graduate /Staff

Ph.DCandidates

변재완 교수

폴리테크닉대학 공학박사

SK텔레콤 부사장

이모아

딥러닝 음성인식

이문학


권오현

딥러닝 방향추정

김현철

음성 신호처리

박지환

음성 신호처리

LG전자 AI연구소

산학장학생

박태준

딥러닝 강화학습

양준영

화자인식 및 딥러닝

김재하 교수

KAIST 공학석사

파수닷컴 전무

이재홍


성예닮

딥러닝 음향인식

이윤진

딥러닝 사운드인식


산학장학생

김윤교

음향 신호처리

최단아

행정직원

박송규

음성 신호처리


산학장학생

황인영

음성인식/강화학습

SK텔레콤 AI연구본부

산학장학생

최정환

빔포밍 및 오디오딥러닝

노경진


송광섭

딥러닝

바이오 신호처리

이수정 교수

광운대 공학박사

바이오 신호처리 및 딥러닝

김태호

딥러닝 음향 및

레이더인식

김재훈


정구영

딥러닝

바이오 신호처리

박치현 교수

성균관대 공학박사

통신 신호처리

김소현

딥러닝 강화학습

양수명

딥러닝

이준모

음성합성

1514

연구 시설 연구 활동

연구 장비

• 다채널 USB 오디오 인터페이스 (Forcusrite, scarlett)

• 다채널 Firewire오디오 인터페이스 (Behringer)

• 모니터용 스피커 및 서브 우퍼

• 음향 측정기 (Phonic)

• 고성능 마이크 및 콘덴서 마이크 (AKG)

• Mouth simulator (Bruel & Kjaer)

• 딥러닝 학습용 워크스테이션 급 서버 (12대)

• 연구용 컴퓨터 (24대)

• 이동형 음성데이터 수집/분석용 노트북 (3대)

• 병렬처리를 위한 고성능 GPU (13대)

Fusion Technology Center 805호에 위치한 음성

음향신호처리연구실에서는 약 20여명의 연구원들이

음성인식, 신호처리, 음성 합성 및 화자인식 등의

연구를 수행하고 있다.

제1연구실

음성음향신호처리연구실

음성 DB 수집

기술 세미나

실험 결과 검토

청취실험

공업센터 별관 701-1호에 위치한 딥러닝연구실에서

는 딥러닝, 바이오 신호처리 등의 연구를 수행하고

있다.

제2연구실

인공지능신호처리 연구그룹

음성 인식 연구에서 다양한 음향 환경에 노출된 음성

데이타 확보가 매우 중요하다. 음향측정실에서는

다채널 스피커를 장비하여 다양한 음향 환경을 구성

할 수 있으며, 오디오 신호의 spatial processing을

거쳐 생성된 신호에 공간감, 입체감을 추가할 수도

있다. Bruel & Kjaer 社의 mouth simulator를

장비하여 기확보된 음성 DB를 다양한 음향 환경 및

공간 정보 하에서 재녹음 하여 공간 정보를 저장

오디오에 담아낼 수 있다.

음향 측정실

1716

나의 연구실 생활 졸업생 현황

저는 한양대학교 음성/음향/오디오 신호처리 연구실에서 딥러닝 기반의 음성인식 기술을 연구/개발하

고 있는 박사과정 3년차 황인영입니다. 학부 졸업 당시에, 향후에 누구나 할 수 있는 일 보다는 경쟁력

갖출 수 있는 일을 하고 싶다고 생각하여 취업보다는 대학원진학을 선택하게 되었고, 2013년에 연구실

에 합류하여 현재까지 화자인식, 음성구간 검출, 연속어/키워드 음성인식, 딥러닝 기반의 전처리 등의

머신러닝/딥러닝 기반의 신호처리 기술을 다루고 있습니다.

최근에 이슈 되고 있는 스마트 스피커의 음성인식에는 전처리 기술, 음향모델 기술, 언어모델 기술, 키

워드 인식기술이 필요한데, 우리 연구실은 이에 해당되는 모든 솔루션을 보유하고 있습니다. 이를 기반

으로 연구실에서 자체적으로 인공지능 스피커인 Pluto를 개발하는 과제에 참여하여 연속어/키워드 음

성인식 파트를 담당했는데, 실무적인 경험을 쌓을 수 있는 좋은 기회가 됐습니다. 또한, 상용화되어있

는 스마트폰/스피커 기반의 개인비서 시스템의 성능을 상호비교해보기도 했습니다. 특히, 우리 연구실

은 음성신호처리 관련 저명한 국제학술대회인 Interspeech, ICASSP, ASRU를 매년 참석하고 있는데,

이를 통하여 최신 기술 및 세계 여러 연구기관의 연구 동향을 파악하고 이에 대응하는 연구를 진행하

고 있기 때문에 항시 최신 기술을 다루고 있다고 볼 수 있습니다.

올해 상반기에 SK텔레콤에서 처음으로 모집한 AI 산학장학생에 지원했는데, 기술/임원면접에서 전공

관련 질문은 음성인식 기술 및 인공지능 개인비서 시스템에 대해서 잘 알고 있는지와 최신 경향을 잘

알고 있는지를 묻는 내용이었습니다. 연구실에서 계속해서 최신기술을 연구하고 관련 연구기관들의 연

구 동향을 분석했기 때문에 어렵지 않게 답할 수 있었으며, 이는 산학장학생 합격이라는 좋은 결과로

이어지기도 했지만 우리 연구실이 그만큼 경쟁력을 갖추고 있다는 것을 체감 할 수 있는 기회이기도

했습니다.

졸업하고 난 후에

안녕하세요, 저는 ASAP 연구실 졸업생 이봉기 박사입니다. 석사를

마친 후 음성인식 및 신호처리 분야의 최고 전문가가 되기 위해 박사

과정에 진학하였습니다. 장준혁 교수님 지도하에 전문 인재가 되기

위하여 부지런히 노력하였으며 연구활동 외에도 LG전자, 삼성전자,

국방부 등과의 산학 및 국책 과제를 수행하였습니다.

이러한 연구활동 및 자기계발을 통하여 전문성을 키워나갔고

Interspeech 등 여러 유수의 해외학회에서도 논문을 발표하기도 하

였습니다. 노력의 결과 전문연구요원으로 선발되어 군복무를 대체할

수 있었고, 재학 중에 LG전자 CTO 인공지능연구소 산학장학생에 선

발되어 생활비 보조와 연구 보조금 지원까지 받을 수 있어 더욱 더

연구에 매진할 수 있었습니다. 이는 졸업 후 입사와 이어져 현재는

LG전자 CTO 인공지능연구소에서 ASAP 연구실에서 수행했던 것과

관련된 연구업무를 진행하고 있습니다.

ASAP 연구실은 제게 발전의 기회이자 행운의 장소입니다. 학위 취

득과 전문가로 성장하는 것 외에도 대한민국 남자들이라면 누구나

하는 고민인 병역 문제도 해결할 수 있었고, 재학생 시절 산학장학생

으로 선발되어 취업 걱정 없이 연구에 매진할 수 있었습니다.

연구실 생활 하는 동안에 평생을 같이 할 수 있는 좋은 교수님과 선

후배들을 만난 것과, 함께하였던 추억을 얻은 것은 정말 큰 행운이라

고 생각합니다. 더불어 다양한 과제 수행을 통해 실무경험을 얻을

수 있었으며 이는 현재의 직장생활에 큰 도움이 되고 있습니다. 저의

이러한 행운을 다른 많은 후배들도 얻을 수 있기를 간절히 바랍니다.

인턴 체험기

저는 지난 6월부터 ASAP연구실에서 인턴으로 활동하며 얼마 전 석박통합과

정으로 대학원 진학을 결정하기까지 약 5개월 간 대학원 생활을 체험하며 느

낀 점을 적어보고자 합니다. 대부분의 학부 졸업반 학생들의 가장 큰 고민은

‘취직과 진학 중 무엇을 선택하느냐’일 것입니다. 3학년을 마칠 무렵의 저 역

시 같은 고민을 하고 있었고 회사와 연구실에서의 인턴활동 등을 통해 저만

의 답을 내릴 수 있었습니다.

인턴 활동을 통해 새로운 것을 찾아 배우고 과제에 참여하며 관련 분야의 공

부가 한층 성숙해지는 것을 느낄 수 있었습니다. 특히 연구실의 주요 연구 과

제인 음성 인식의 경우 딥러닝을 이용하기에, 관련 공부가 한층 재미있고 좀

더 공부하고자 하는 욕심이 생기는 분야입니다. 시판된 다양한 인공지능 스

피커들을 실험하고 연구실에서 직접 개발한 AI 스피커 플루토를 테스트하면

서, 연구를 통한 결과물이 실제로 나와 이웃의 삶을 개선 할 수 있다는 확신

이 들었으며, 이러한 일에 참여할 수 있는 것에 뿌듯한 기분을 느꼈습니다.

인턴을 하며 좋았던 점을 몇가지 꼽고자 합니다. 가장 먼저 연구실의 분위기

입니다. 모두가 열심히 연구에 몰입했을 때의 연구실은 마치 수능 시험장이

나 시험기간의 도서관과 같은 기분 좋은 긴장감이 감돌아 저 역시 이곳에서

열심히 공부할 수 있을 것이라는 생각을 했습니다. 또한 동기들과 선배님들

이 있기에, 함께 공부하고 배움을 청하면 혼자 공부하는 것보다 훨씬 효과

적인 연구 결과들을 창출할 수 있었습니다. 혹시 대학원 진학에 관심이 있는

학우라면, 입학을 원하는 연구실에서 인턴 활동을 해보는 것을 꼭 추천 하고

싶습니다.

황인영(박사과정 3년차)

이봉기 박사(졸업생)LG전자 인공지능연구소

이문학 (한양대 기계, 14학번)

대기업연구소

최재훈, 이봉기, 황승현,

이지혜, 서혜지, 방용경,

김상현, 표은종

대기업 사업부

김종웅

학교

한국교통대 임정수교수님

국책연구소

심재성

유학

이명인

12명

1918

• 전문 기술 능력 획득

• 고급 연구직 수행 가능

ASAP 연구실 멤버가 되면 주요 논문 최근 3년간, 2015~2017

ASAP Lab.전공분야

·음성인식

·인공지능

·딥러닝

·신호처리

·바이오

• 등록금 전액 지원

• 생활비 지원

• 과제인센티브 지원

• 국제학회참가지원

• 새로운 분야 개척 능력

• 빠른 기술 습득/응용 능력

• 유니크한 인재

• 나 = 하나의 기업

• 공학 커뮤니케이션 능력 향상

• 회사/사회에서 가치있는 인재가 되기 위한 훈련 과정

• 신기술 습득/구현/응용 능력 향상

• 필드에서의 주요 인맥 형성

• 산업 과제 및 연구 경험

• 최신 기술 습득 능력

• 발표 및 커뮤니케이션 능력

• 삼성, LG, 현대자동차, 현대모비스,

인바디 등 산학과제 참여 신기술습득

• 로봇음성인식사업단 등의 국책사업

연구원으로 참여기회

• 매년 상승하는 나의 몸값

• 기업에서 스카우트 제의 및

연봉 협상

• 세계적인 엔지니어와 맞겨루는 능력

혜택

박사

자기발전

석사

J. Park, J.-W. Kim, J.-H. Chang, Y. G. Jin, and N. S. Kim, "Estimation of speech absence uncertainty based on multiple linear regression analysis for speech enhancement," Applied Acoustics, Vol. 87, pp. 205-211, Jan. 2015.C.-H. Park, S. Lee, and J.-H. Chang, "Robust closed-form time-of-arrival source localization based on α-trimmed mean and Hodges-Lehmann estimator under NLOS environments," Signal Processing, Vol. 111, pp. 113-123, Jun. 2015.C.-H. Park, S. Lee, and J.-H. Chang, "Shrinkage-based biased signal-to-noise ratio estimator using pilot and data symbols for linearly modulated signals," IET Communications, Vol. 9, Iss. 11, pp. 1388-1395, Jul. 2015.S. Lee, S. Rajan, C.-H. Park, J.-H. Chang, H. Dajani, and V. Groza, "Estimated confidence interval from single pressure measurement based on algorithmic fusion," Computers in Biology and Medicine, Vol. 62, pp. 154-163, Jul. 2015.C. Lim and J.-H. Chang, "Efficient implementation techniques of an SVM-based speech/music classifier in SMV," Multimedia Tools and Applications, Vol. 74, Issue 15, pp. 5375-5400, Aug. 2015.B.-K. Lee and J.-H. Chang, "Packet loss concealment based on deep neural networks for digital speech transmission," IEEE Transactions on Audio, Speech, and Language Processing, Vol. 24, No. 2, pp. 378-387, Feb. 2016.C.-H. Park and J.-H. Chang, " Closed-form localization for distributed MIMO radar systems using time delay measurements," IEEE Transactions on Wireless Communications, Vol. 15, No. 2, pp. 1480-1490, Feb. 2016.S. Lee and J.-H. Chang, "On using multivariate polynomial regression model with spectral difference for statistical model-based enhancement," Journal of Systems Architecture, Vol. 64, pp. 76-85, Mar. 2016.B.-K. Lee and J.-H. Chang, "Novel adaptive muting technique for packet loss concealment of ITU-T G.722 using optimized parametric shaping functions, " EURASIP Journal on Audio, Speech, and Music Processing, Vol. 2016, pp. 1-12, Apr. 2016.I. Hwang, H.-M. Park and J.-H. Chang, "Ensemble of deep neural networks using acoustic environment classification for statistical model-based voice activity detection," Computer Speech and Language, Vol. 38, pp. 1-12, Jul. 2016.C.-H. Park and J.-H. Chang, "Closed-form two-step weighted-least-squares-based time-of-arrival source localisation using invariance property of maximum likelihood estimator in multiple-sample environment," IET Communications, Vol. 10, Iss. 10, pp. 1206–1213, July. 2016.C.-H. Park and J.-H. Chang, "Robust time-of-arrival source localization employing error covariance of sample mean and sample median in line-of-sight/non-line-of-sight mixture environments," EURASIP Journal on Advances in Signal Processing, Vol.2016 , pp.1-11, Aug. 2016.S. H. Huang and J.-H. Chang, "Optimally weighted maximum a posteriori probabilities based on minimum classification error for dual-microphone voice activity detection," Applied Acoustics, Vol. 113, pp. 221-229, Dec. 2016.J. Park and J.-H. Chang, "Second-order Volterra filter-based nonlinear clipping detector," Turkish Journal of Electrical Engineering & Computer Sciences, Vol. 24, No.6, pp.4849-4857, Dec. 2016.S. Lee, C.-H. Park, and J.-H. Chang, "Improved Gaussian mixture regression based on pseudo feature generation using bootstrap in blood pressure estimation,"IEEE Transactions on Industrial Informatics, Vol. 12, No. 6, pp. 2269-2280, Dec. 2016.C.-H. Park and J.-H. Chang, "Time-of-arrival source localization based on weighted least squares estimator in LOS/NLOS mixture environments," International Journal of Distributed Sensor Networks, Vol. 12, No. 12, pp. 1-13, Dec. 2016.S. Lee and J.-H. Chang, "Oscillometric blood pressure estimation based on deep learning," IEEE Transactions on Industrial Informatics, Vol. 13, No.2, pp. 461-472, Apr. 2017.S. Lee, S. Rajan, G. Jeon, J.-H. Chang, H. Dajani and V. Groza, "Oscillometric blood pressure estimation by combining nonparametric bootstrap with Gaussian mixture model," Computers in Biology and Medicine, Vol. 85, pp. 112-124, May 2017.S. Lee and J.-H. Chang, "Deep belief networks ensemble for blood pressure estimation," IEEE Access, Vol. 5, pp. 9962-9972, May 2017.C.-H. Park and J.-H. Chang, "Adaptive robust time-of-arrival source localization algorithm based on variable step-size weighted block newton method," EURASIP Journal on Wireless Communications and Networking, Vol.2017, pp.1-10, Jul. 2017.K.-Y. Chung, K. Song, K. Shin, J. Sohn, S. H. Cho, and J.-H. Chang "Noncontact sleep study by multi-nodal sensor fusion," Sensors, Vol. 17, No.7, pp. 1-17, Jul. 2017.S. Lee and J.-H. Chang, "Deep Boltzman regression with mimic features for oscillometric blood pressure estimation," IEEE Sensors, Vol. 17, No. 18, pp. 5982 - 5993, Sept. 2017.S. Lee and J.-H. Chang, "Deep learning ensemble with asymptotic techniques for oscillometric blood pressure estimation," Computer Methods and Programs in Biomedicine, Vol. 151, pp. 1-17, Nov. 2017.J.-W. Cho, J.-H. Park, J.-H. Chang and H.-M. Park, "Bayesian feature enhancement using independent vector analysis and reverberation parameter re-estimation for noisy reverberant speech recognition," Computer Speech and Language, Vol. 46, pp. 496-516, Nov. 2017.C.-H. Park and J.-H. Chang, "TOA source localization and DOA estimation algorithms using prior distribution for calibrated source," Digital Signal Processing, Vol.71, pp. 61–68, Dec. 2017.S. Lee and J.-H. Chang, "Spectral difference for statistical model-based speech enhancement in speech recognition," Multimedia Tools and Applications, Vol. 76, No. 23, pp.24917-24929, Dec. 2017.T.-J. Park and J.-H. Chang "Dempster-shafer theory for enhanced statistical model-based voice activity detection," Computer Speech and Language, Vol. 47, pp. 47-58, Jan. 2018.C.-H. Park and J.-H. Chang, "Sequential source localization and range estimation based on shrinkage algorithm," (to appear in) IET Signal Processing, 2017.H. Seo, M. Lee and J.-H. Chang, "Integrated acoustic echo and background noise suppression based on stacked deep neural networks," Applied Acoustics, 2017.

2120

출원 특허 최근 3년간, 2015~2017

등록 특허 최근 3년간, 2015~2017

국책 과제 최근 3년간, 2015~2017

장준혁, 대한민국특허, “모바일 장치에서의 오디오 신호 품질 측정”, 특허/공고번호: 10-2013-7020232, 2015. 5. 29

장준혁, 김종웅, 대한민국특허, “다중 선형회귀 분석 기반의 음성 존재 불확실성 추정 방법”, 등록/공고번호: 10-1543300, 2015. 8. 4

장준혁, 이봉기, 대한민국특허, “패킷 손실 은닉에서의 적응형 뮤팅 방법”, 등록/공고번호: 10-1551236, 2015. 9. 2

장준혁, 최재훈, 대한민국특허, “전력레벨 차이비율을 이용한 이격 듀얼 마이크 기반의 음성 활성도 검출방법 및 음성활성도 검출 장치”, 등록/

공고번호: 10-1559716, 2015. 10. 1

장준혁, 박지환, 대한민국특허, “볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법” 등록/공고번호: 10-1568937, 2015. 11. 6

장준혁, 이봉기, 대한민국특허, “G.722 코덱 패킷손실은닉 및 최급강하법을 이용한 적응형 뮤팅 시스템 및 방법”, 등록/공고번호: 10-1591597,

2016. 1. 13

장준혁, 이봉기, 대한민국특허, “딥신경망에 기초한 패킷 손실 은닉 방법 및 장치”, 등록/공고번호: 10-1591626, 2016. 1. 28

Joon-Hyuk Chang, U.S. patent (PCT), “Audio signal quality measurement in mobile device”, Patent number: US9300694, Mar. 29. 2016.

장준혁, 황인영, 김남수, 대한민국특허, “심화 신경망을 이용한 통계 모델 기반의 음성검출 방법 및 이를 수행하는 음성 검출 장치”, 등록/

공고번호: 10-1640188, 2016. 7. 11

장준혁, 양준영, 대한민국특허, “EVS 코덱 파라미터를 이용한 DNN 기반의 음성검출기술”, 등록/공고번호: 10-1704925, 2017. 2. 2

장준혁, 황인영, 대한민국특허, “음향 환경 분류를 이용한 심화신경망의 앙상블이 구성된 통계모델 기반의 음성 검출 장치 및음성 검출 방법”,

등록/공고번호: 10-1704926, 2017. 2. 2

장준혁, 황승현, 대한민국특허, “변별적 가중치 학습기법을 이용한 2 채널 마이크 기반의 음성 검출 방법”, 등록/공고번호: 10-1711302, 2017. 2.

22

최종석, 임윤섭, 김래현, 김재관, 서형호, 최규태, 박호진, 이현우, 권순일, 백성욱, 진석봉, 정희석, 진세훈, 장준혁 대한민국특허, “음성 / 음향

분석 기반 상황 판단 시스템 및 방법”, 등록/공고번호: 10-1799874, 2017. 11. 15

장준혁, 이지혜, 대한민국특허, “잔향 환경에서의 음성인식을 위한 결합 학습된 심화신경망 앙상블 기반의 음향 모델 및 이를 이용한 음성인식

방법”, 등록/공고번호: 10-1807948, 2017. 12. 5

Joon-Hyuk Chang, Jihwan Park, U.S. patent, “Nonlinear acoustic echo signal suppression system and method using Volterra filter”,

Patent number: US9536539 B2, Jan. 3. 2017.

Seung-Yeol Lee, Joon-Hyuk Chang, Song-Kyu Park, Tae-Jun Park, US patent, “Method of speech enhancement based on

distributed devices”, Application number: 62/104,959, Jan. 2015.

이강은, 장준혁, 전병용, 김현성, 송광섭, 박태준, 윤태현, 최성현, 최현철, 대한민국특허, “음성 신호 처리 방법 및 장치”, 출원번호: 10-2015-

0106774, 2015. 07. 28

박태준, 장준혁, 대한민국특허, “뎀프스터-셰이퍼 추론이론을 이용한 통계모델기반의 음성검출기 및 그 성능개선 방법”, 출원번호: 10-2016-

0094707, 2016. 07. 26

서혜지, 장준혁, 대한민국특허, “LSTM 및 심화신경망 기반의 음성 신호 처리 방법 및 장치”, 출원번호: 10-2016-0106135, 2016. 08. 22

심재성, 장준혁, 대한민국특허, “심화 신경망을 이용한 시간 및 주파수 간 상관도 기반의 음성 검출기 및 음성 검출 방법”, 출원번호: 10-2016-

0129031, 2016. 10. 06

이명인, 장준혁, 대한민국특허, “심화 신경망을 이용한 다채널 마이크 기반의 잔향시간 추정 방법 및 장치”, 출원번호: 10-2016-0171359,

2016.12.15

서혜지, 장준혁, 대한민국특허, “심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치”, 출원번호: 10-2017-0048574, 2017.04.14

노경진, 장준혁, 대한민국특허, “인공 잡음에 강인한 음성 대역폭 확장을 위한 심화 신경망 앙상블”, 출원번호: 10-2017-0081020, 2017.06.27

노경진, 장준혁, 대한민국특허, “생성적 대립 망 기반의 음성 대역폭 확장기 및 확장 방법”, 출원번호: 10-2017-0081024, 2017.06.27

노경진, 박치현, 장준혁, 대한민국특허, “다중 입출력 시스템에서 거리 추정값을 이용한 신호원 위치 추정 방법”, 출원번호: 10-2017-0083110,

2017.06.30

정구영, 송광섭, 장준혁, 대한민국특허, “손목 착용 웨어러블 기기용 딥러닝 기반 혈압 측정 기술”, 출원번호: 10-2017-0093419, 2017.07.24

박지환, 장준혁, 대한민국특허, “원거리 음성인식을 위한 음성전력의 조기성분 추정을 이용한 다채널 선형예측 기반의 실시간 잔향제거

알고리즘”, 출원번호: 10-2017-0097600, 2017.08.01

이봉기, 장준혁, 대한민국특허, “대립쌍 구조 기반의 생성모델을 이용한 향상된 패킷손실은닉 알고리즘”, 출원번호: 10-2017-0101766,

2017.08.10

노경진, 이봉기, 장준혁, 대한민국특허, “음성 신호 대역폭 확장 장치 및 방법”, 출원번호: 10-2017-0104925, 2017.08.18

이모아, 장준혁, 대한민국특허, “음성인식 방법 및 그 장치”, 출원번호:

• 음성, 음향 분석기반 상황판단 솔루션 기술개발 - 정보통신기술진흥센터

• 음성 복원 판단을 위한 음성판별기술 연구 - 국방과학연구소

• 보코더 특성분석 플랫폼 개발 - 국방부

• 사용자의 의도와 맥락을 이해하는 지능형 인터랙션 기술 연구개발 - 미래창조과학부

• 성문분석을 통한 실시간 화자검색 기술 개발 - 경찰청

• 로봇용 free-running 임베디드 자연어 대화음성인식을 위한 원천 기술 개발 - 한국산업기술평가관리원

• AI스피커 음성비서를 위한 지능형 음성신호처리 기술개발 - 정보통신기술진흥센터

• 웨어러블 스마트기기를 이용한 딥러닝 기반의 음성 및 바이오 통합신호처리 기술 개발 - 한국연구재단

2322

Acoustics speech Audio signAl processing lAbasap.hanyang.ac.kr/files/ASAP_brochure.pdf · 세부...

Documents

Transcript of Acoustics speech Audio signAl processing lAbasap.hanyang.ac.kr/files/ASAP_brochure.pdf · 세부...