컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요...

27
0 / 27 컨소시엄

Transcript of 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요...

Page 1: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

0 / 27

컨소시엄

Page 2: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

1 / 27

1 사업 개요

2 전체 일정

3 추진 경과

4 전문가위원회

I 사업관리

5 수행체계 및 인력투입계획

Page 3: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

2 / 27

1 언어자원구축

2 응용기능 분할도

3 UI 설계서

4 데이터 아키텍쳐

Ⅱ 주요 설계

5 API 명세서

Page 4: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

3 / 27

사업 관리Ⅰ

Page 5: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

4 / 27

1. 사업개요 - 개요

• 사업명 : 공공도서관 지원을 위한 전문용어 생성관리

및 의미검색 시스템 개발

• 사업기간 : 2009년 6월 1일 ~ 2009년 11월 30일

개요

목표

사업자• 주관사업자 : (주)오롬윈

• 컨소시엄 : 중앙대 산학혁력단

• 국가차원의 언어자원 시스템 공급

• 다양한 조직에 의미기반 검색기술 제공

• 언어자원 연구 및 활용의 극대화

Page 6: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

5 / 27

1. 사업개요 - 목적 및 추진전략

본 제안은 국가 지식 언어정보 제공 시스템을 구축하여 다양한 언어자원을 활용하고, 키워드가 아닌 의미기반으로 정보검색 환경을 개선하고 부가가치를 제고함으로써, 공공도서관의서비스를 획기적으로 변화시킬 뿐만 아니라, 의미기반 연구 개발 및 국가 산업 경쟁력을 제고함에 그 목적이 있습니다.

사업에 대한 이해

국가 R&D 과제 선정 단계에서부터 참여

의미검색 분야 사업 경험 활용

기반 기술의 이해

다국어 전문용어 자원 제공시스템 구축 기술 확보

RIA 기반 기술력 확보

언어자원의 이해

시소러스 구축 경험 풍부

언어자원 분야 전문가 투입

시소러스 구축도구 개발 경험

제안사 S/W 프로세스관리 체계 (Spice Level 2)에 의한 철저한 사업관리

추진전략

제안목표

핵심성공요소

제안의 목적

미래 지식시대를 위한 국가지식산업 경쟁력 제고

최적의 컨소시엄 단계별 전략수립추론을 통한 대규모언어자원 관리방안

RIA 기술 활용의미기반 검색 응용

국가차원의 언어자원 시스템 공급

다양한 조직에 의미기반 검색기술 제공

언어자원 연구 및 활용의

극대화

Page 7: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

6 / 27

1. 사업개요 - 범위 및 주요 특징

범위 및 역할

주요 특징

• 전체 사업 책임

• 대용량 언어자원 관리용 지능형

워크벤치개발

• 의미검색 기반 구축 및 각종 응용

서비스 구현

• 다양한 언어자원의 수집 및 구축

• 산학연 전문가 위원회 구성 및 운영

• 시소러스를 포함한 언어자원 관련

사업경험 보유

• 도서관 도메인 지식을 활용한 다양

한 SI사업 노하우 보유

• RIA를 이용한 전문 기술 보유

• 다수의 산학연 프로젝트를 성공적으

로 구축

• 연구기획을 통해 다양한 연구경쟁력

확보와 기술력 보유

• 언어자원 구축 전문가보유

Page 8: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

7 / 27

2. 전체 일정

추진 일정총 6개월의 일정계획 수립

전문가 위원회를 통한 사업 방향성 검토

구분 작업내용 6월 7월 8 월 9 월 10 월 11 월 12월 이후

사업관리 보고

개발환경

Setting

개발장비 및

환경구축

시스템

개발

요구분석

설계

구축

테스트

전개

언어자원 구축

현황 조사

언어자원 추출 필요시 반복

언어자원 구축 필요시 반복

언어자원 구조검수

전문가 협의회 전문가 협의회 1차 간담회(8/27) 2차 간담회 3차 간담회

착수보고 중간보고 완료보고

Page 9: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

8 / 27

3. 추진 경과

• 착수보고 (6/18-6/19)

• 분석단계완료 (7/15)

• 설계단계완료 (7/31)

• 실무자 모임 (8/27)

• 언어자원 구축에 관한 공동작업(9/3-9/4)

• 언어자원 네트워크 성능 튜팅 (9/1 ~ 9/11)

• 구현(7/10 ~ 현재) – 설계와 구현을 반복하여 구현

1. 주요 추진성과

• 검색 사이트 연계 구현(9/21 ~ 10/30)

• 전국도서관대회 참가 (10/28)

• 전문가 위원회 간담회

• 추출된 언어자원 반입 및 언어트리플 재구조화

2. 향후 계획

• 언어 구조 추출에서 구조간 충돌을 처리하기 위한 방안

• 공공 도서관 검색 사이트 연계시 OpenAPI서비스 방향 설정

3. 위험 요소

Page 10: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

9 / 27

4. 전문가 위원회

개요 – 실무자 모임 개최 (8/27)

KISTI 주제 발표

지능형도서관 기반기술 개발사업의 소개

전문용어를 이용한 의미기반 검색기술의 적용 및 활용방안 발표

주제 토의

공공도서관 또는 전문정보센터 이용자 요구사항 도출

시소러스 등 언어자원의 활용현황 및 필요성

의미기반 검색의 필요성 및 향후 서비스 가능성 논의

현재 KISTI가 개발중인 사업의 내용과 실적용 방안 협의 등

내용

공공도서관 또는 정보센터 이용자 요구사항

경제 분야의 분석업무를 위해 특정 도메인에 지원

일반도서관 이용자인 경우 서지사항을 알고 있거나 원하는 내용이 있는상태에서 소극적인 정보이용을 함

지능형도서관 기반기술 개발을 위한 전문가 운영위원회 개최

Page 11: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

10 / 27

4. 전문가 위원회(계속)

시소러스 등 언어자원의 활용현황 및 필요성

신조어나 관련용어를 수작업으로 구축하고 관리하는 업무가 철저히이루어지지 못해 활용부분이 부족한 상황임. 그러나 매우 중요한영역이어서 반드시 효율적으로 수행되어야 함

일반이용자에게는 언어적인 정보는 효용성이 적음. 그러나 흔히 잘못알 수 있는 표기상의 오류를 교정해 주는 기능이 필요할 것으로보임(예, 테크놀러지-테크놀로지-Technology)

의미기반 검색의 필요성 및 향후 서비스 방안

의미검색이 필요하긴 하나 인적,물적 지원이 어려움

여러 공공도서관의 현실적인 환경을 파악하여 지능형서비스의 모습을변화하여 적용할 필요가 있을 것임

국가언어자원 시스템 구축방안에 대한 의견

전문정보센터를 지원하기 위해서는 도메인의 특성을 잘 반영할 수있도록 전문성이 있어야 하며, 자원에 대한 분류정보가 반영되어야 함.

현재는 언어자원에 대한 필요성이 높지는 않지만 향후적으로필요하므로 단계적으로 활용이 될 수 있는 방안을 마련해야 함

국가도서관과 공공도서관에 대한 활용에 대해 지속적인 관심을 가지고추진

Page 12: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

11 / 27

5. 수행체계 및 인력투입계획

추진 체계사업의 특성을 반영한 부문별 최적화된 인력 투입

- 총 투입 M/M : 24.6MM (제안서 23.1M/M)

이사 변회균

중대 산학협 ㈜오롬윈

PM

언어자원 시스템개발

제안사

품질관리팀

사업수행 조직도 투입인력 계획

부문별 투입 공수

분야 전문가

전문가위원회

9.6MM 13MM

언어자원개발 시스템개발

2MM

PM

6월~7월 8월~11월

PM 1.5 MM→2MM (부분상주)

언어자원 9.6MM (비상주)

시스템 12MM (상주)

디자인 1MM(비상주) 추가

계 24.6MM

이사 이유승

사업총괄

디자이너

Page 13: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

12 / 27

주요 설계Ⅱ

Page 14: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

13 / 27

1. 언어자원 구축

1. 언어자원에서 주요 관련어 추출

대상 언어자원을 확인(국립중앙도서관, 국중)

언어자원에서 KISTI가 소장하고 있는 언어자원을 확인(교육, 일반, 예술)

해당 언어자원의 텍스트(아스키) 확보

2. 금년도 구축언어 자원 주제영역 선정

관련 용어 확보 방안 도출

관련 용어 확보 코퍼스 확보

3. 언어자원정리

후보 용어 추출

후보 용어 자동 연관 관계 설정

학습문서 확보: 학습문서 선정(교과서 개론, 위키피디어)

관계설정(KISTI 및 도정단 기설정)

추출 용어간 관계 설정 (국회도서관, 국립중앙도서관 등)

유사어 확보

Page 15: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

14 / 27

1. 언어자원 구축(계속)

4. 언어자원 구조화 (기계작업)

외부자원구조의 import: 구조반입; 대상 세종21, 남영준교수 소장 시소러스

용어 pivot 프로그램 운영

5. 언어자원 구조화 (수작업)

연구원 및 연구조원의 수작업 구조설정

필요: 구조화를 위한 플랫 폼

시소러스 관리기 (오롬 윈 제공)

6. 언어자원을 이용한 OA자원 검색효율성 검사

테스트 셋 확보(질의어 확보)

*) 5번 작업 10월 초까지 처리

*) 6번 작업 10월 말까지 처리

Page 16: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

15 / 27

2. 응용기능 분할도

용어검색시스템

용어검색관리 용어생성관리 네트워크관리

용어관계체크

용어관계생성

용어관계변경

네트워크분석

네트워크내비게이션

용어검색

용어검색이력

시스템

용어관계해제

용어관리이력

네트워크오류점검네트워크오류리스트

Page 17: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

16 / 27

2. 응용기능 분할도(계속)

용어검색

용어관계생성

용어관계해제

용어관계변경

네트워크분석

용어검색이력

네트워크오류점검

네트워크정보

용어관리이력

용어관계체크

검색정보

네트워크내비게이션네트워크정보

관계정보

관계정보

관계정보

중의어정보

네트워크정보

오류정보

네트워크오류리스트오류리스트정보

Page 18: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

17 / 27

3. UI 설계서

• 초기 화면

Page 19: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

18 / 27

3. UI 설계서(계속)

• 용어검색 화면 : 용어검색, 언어별제한검색, 질의확장검색, 검색이력

Page 20: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

19 / 27

• 용어생성관리 화면 : 용어간 관계 생성/삭제/변경, 히스토리 기능

3. UI 설계서(계속)

Page 21: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

20 / 27

•네트워크 관리 화면 : 네트워크 드로잉, 네트워크 중심성 분석/주제 분석, 용어간 유사도 분석, 용어간 관계삭제/변경

3. UI 설계서(계속)

Page 22: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

21 / 27

• 네트워크 관리 화면 : 두 개의 네트워크 비교, 용어간 관계 생성/삭제/변경

3. UI 설계서(계속)

Page 23: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

22 / 27

4. 데이터 아키텍처

• 용어검색 / 용어생성관리

• 네트워크

api_type keyword key_1 key_2 rule sub_rule id_num level

동의어검색 basic O

동의어검색+관련어확장 basic_rt O

동의어검색+관련어확장+관련어의동의어셋 basic_rt_exp O

관계체크 check O O

관계생성 create O O O O

관계삭제 delete O

관계변경 change O O O

중의어그룹생성 append_amb_grp O

중의어그룹하위노드검색 neighbor_search O

용어검색 / 용어생성관리변수

api_type keyword key_1 key_2 rule sub_rule id_num level

동의어검색 netbasic O

동의어검색+관련어확장 netbasic_rt O

동의어검색+관련어확장+관련어의동의어셋 netbasic_rt_exp O

원천네트워크검색 raw_network O O

네트워크변수

Page 24: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

23 / 27

5. API 명세서

1. 용어검색

- [동의어] 검색http://steak.kisti.re.kr/steak_interface_v1.py?api_type=basic&keyword=tv

- [동의어 + 관련어 확장] 검색http://steak.kisti.re.kr/steak_interface_v1.py?api_type=basic_rt&keyword=tv

- [동의어 +관련어 확장 + 관련어의 동의어셋] 검색http://steak.kisti.re.kr/steak_interface_v1.py?api_type=basic_rt_exp&keyword=tv

- 중의어그룹 하위노드 검색

http://steak.kisti.re.kr/steak_interface_v1.py?api_type=neighbor_search&keyword=tv||ambgrp01

[동의어 + 관련어 확장] 검색 중의어그룹 하위노드 검색

Page 25: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

24 / 27

5. API 명세서(계속)

2. 용어생성관리

- 용어관계 체크http://steak.kisti.re.kr/steak_interface_v1.py?api_type=check&key_1=tv&key_2=디지털tv

- 용어관계 생성

http://steak.kisti.re.kr/steak_interface_v1.py?api_type=create&key_1=tv&key_2=디지털tv&rule=RT&sub_rule=bt- 용어관계 변경

http://steak.kisti.re.kr/steak_interface_v1.py?api_type=change&id_num=96930&rule=RT&sub_rule=bt- 용어관계 해제

http://steak.kisti.re.kr/steak_interface_v1.py?api_type=delete&id_num=122831- 중의어그룹 생성

http://steak.kisti.re.kr/steak_interface_v1.py?api_type=append_amb_grp&keyword=tv

관계 체크 관계 생성 관계 변경

관계 해제중의어그룹 생성

Page 26: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

25 / 27

5. API 명세서(계속)

3. 네트워크검색

- [동의어] 검색http://steak.kisti.re.kr/steak_interface_v1.py?api_type=netbasic&keyword=tv

- [동의어 + 관련어 확장] 검색http://steak.kisti.re.kr/steak_interface_v1.py?api_type=netbasic_rt&keyword=tv

- [동의어 +관련어 확장 + 관련어의 동의어셋] 검색http://steak.kisti.re.kr/steak_interface_v1.py?api_type=netbasic_rt_exp&keyword=tv

- 원천 네트워크 검색 (level : 1~3)http://steak.kisti.re.kr/steak_interface_v1.py?api_type=raw_network&keyword=tv&level=1

동의어 원천 네트워크

Page 27: 컨소시엄 - KISTIoak.kisti.re.kr/files/workshop2_2.pdf4 / 27 1. 사업개요- 개요 •사업명: 공공도서관지원을위한전문용어생성관리 및의미검색시스템개발

26 / 27

감사합니다.

Q & A