데이터 재구성
데이터 분석
재구성 분석 proactive passive
분석 데이터
분석결과 / 보고서
Data Analyst
재구성 데이터
분석
해석 시각화 가공데이터 인사이트
분석결과 /보고서
Cleansing Data Modeling Adaptation Physical Architecture Fast Processing
Data Handling
Data Analysis
Data& Infrastructure
Insight& Report
Network Analysis Content Analysis Semi/Structured Data Un-structured Data
소셜 데이터
비정형 텍스트 데이터의 재구성
소셜 데이터의
Content Analysis를 위한
#SmartSMA #InsightReport
LG CNS SMA/CRM @ @
#과장
#분석파트장
#박사 #시맨틱웹
#온톨로지
#의료정보
#빅데이터
#공공데이터
#연구소
#소셜데이터
#텍스트 분석
#Linked Data
#Knowledge Base
재구성 데이터 데이터분석
Relating un-structured Data to
Ontology / Structured Knowledge
Semantic Annotation
Ontology Enrichment
Ontology Population
In Semantic Web Area
2007 2011
Linked Data
Currently
Realization of Ontology Enriched
From http://linkeddata.org/
Rich Snippets
Realization of Ontology Enriched
See https://developers.google.com/structured-data/
https://www.wikipedia.org/
http://www.yelp.com/ https://www.freebase.com/
Nearly Artificial Intelligence ≈ Answering Systems
Structured
Semi-Structured
Un-Structured
By Rich Snippets
Data Extraction, 자연어처리
저흰 주로 여기 있네요
Attachment
Attachment
Structured
Semi-Structured
Un-Structured
Not Here?
Why?
Approximately 90% of the world’s data is held in unstructured formats
90%
Structured Numerical or Coded Information
10%
Unstructured or Semi-structured Information
Possibilities ..
By http://www.oracle.com, 2012
No, Schema.org
http://schema.org/
No, Linked Data Cloud
From http://linkeddata.org/
Data Extraction 자연어처리
Scraping a.k.a. Focused Crawling
HTML Tag, DOM Handling
Instance Extraction
긍부정 분석
Topic Modeling (LDA)
Word Counting 모호성 해소
문서분류
What we do
Semi-Structured
Un-Structured
틀
From **전자 김치냉장고 마케팅분석 by LG CNS
From **전자 김치냉장고 마케팅분석 by LG CNS
From *** 녹즙 마케팅포인트분석 by LG CNS
From **카드 신규카드 마케팅 전략 by LG CNS
From (NIA-BC카드 빅데이터 시범사업) SixPocket 분석 by LG CNS
At SmartSMA ShowRoom - http://smartsma.co.kr
+
틀
데이터
Structured Data
Un-Structured Data
Know-How
LG CNS SMA/CRM @ @
Tools
데이터_crawling
ABcrawler by LG CNS Available at: https://www.odpia.org
틀_Data Modeling
틀
BM 소셜데이터 내부데이터 외부데이터
재구성_Defined Rules
SAS Content Categorizer http://www.sas.com/
재구성_After Parser
Morpheme Anal. User Dic.
Patterned Str.
Text Prism by LG CNS Available at: https://www.odpia.org
재구성_Machine Learning
WSD module by LG CNS & BilKE Lab(http://bike.sn.ac.kr)
시각화
가공데이터 인사이트
해석
분석_Where we create Values
www.odpia.org
Big Picture
Social Data in Classifications
Indexed Reputations
Tangible Tools Data, and Alliances
From 분석 갤러리 in https://www.odpia.org/
정돈된 데이터 Tools & Know-How
in
Q & A
감사합니다.
Self Q & A
근데 *G의 마케팅은 왜 그런가요?
Top Related