Learn

112/04/19 1

Learn Learn Question Focus and Dependency RelQuestion Focus and Dependency Relations from ations from Web Search Results Web Search Results for for

Question ClassificationQuestion Classification

Wen-Hsiang Lu (盧文祥 )[email protected]

Web Mining and Multilingual Knowledge System Laboratory, Department of Computer Science and Information Engineeri

ng, National Cheng Kung University

WMMKS LabWMMKS Lab

112/04/19 2WMMKS LabWMMKS Lab

Research InterestResearch Interest

Web Mining

NaturalLanguageProcessing

Information

Retrieval

112/04/19 3

Unknown Term Translation & Cross-Language Information Retrieval A Multi-Stage Translation Extraction Method for Unknown Terms Usi

ng Web Search Results

Question Answering & Machine Translation Using Web Search Results to Learn Question Focus and Depen

dency Relations for Question Classification Using Phrase and Fluency to Improve Statistical Machine Translation

User Modeling & Web Search Learning Question Structure based on Website Link Structure to

Improve Natural Language Search Improving Short-Query Web Search based on User Goal Identification

Cross-Language Medical Information Retrieval MMODE: http://mmode.no-ip.org/

WMMKS LabWMMKS Lab

Research IssuesResearch Issues


雅各氏症候群

112/04/19 5

Introduction Related Work Approach Experiment Conclusion Future Work

WMMKS LabWMMKS Lab

OutlineOutline

112/04/19 6


WMMKS LabWMMKS Lab

OutlineOutline


Question Answering (QA) SystemQuestion Answering (QA) System

1. Question Analysis: Question Classification, Keywords Extraction.

2. Document Retrieval: Retrieve related documents.

3. Answer Extraction: Extract a exact answer.


Motivation (1/3)Motivation (1/3)

Importance of Question Classification Dan Moldovan proposed a report [Dan Moldovan 2000]


Rule-based Question Classification Manual and unrealistic method.


. Need a large number of training data. . Too many features may be noise.

Machine Learning-based Question Classification

Support Vector Machine (SVM)


A new method for question classification.

Observe some useful features of question.

Solve the problem of insufficient training data.



Idea of Approach (1/4)Idea of Approach (1/4)

Many questions have ambiguous question words

Importance of Question Focus (QF). Use QF identification for question classification.


If we do not have enough information to identify the type of QF.

QF Dependency Verb Dependency Quantifier Dependency Noun

Question

Question Type

: Dependency Features : Question Type

: (Unigram) Semantic Dependency Relation

: (Bigram) Semantic Dependency Relation



Example



Use QF and dependency features to classify questions. Learning QF and other dependency features from Web. Propose a Semantic Dependency Relation Model (SDRM).


112/04/19 15


WMMKS LabWMMKS Lab

OutlineOutline


[Richard F. E. Sutcliffe 2005][Kui-Lam Kwok 2005][Ellen Riloff 2000]

Rule-based Question ClassificationRule-based Question Classification

5W(Who, When, Where, What, Why)Who → Person.When → Time.Where → Location.What → Difficult type.Why → Reason.


Several methods based on SVM. [Zhang, 2003; Suzuki, 2003; Day, 2005]

Machine Learning-based Machine Learning-based Question ClassificationQuestion Classification

KDAG Kernel SVMQuestion Feature Vector Question Type


Use a Web search engine to identify question type. [Solorio, 2004]

“Who is the President of the French Republic?”

Web-based Question ClassificationWeb-based Question Classification


Language Model for Question Classification [Li, 2002]

Too many features may be noise.

Statistics-based Question ClassificationStatistics-based Question Classification

112/04/19 20


WMMKS LabWMMKS Lab

OutlineOutline


Architecture of Question ClassificationArchitecture of Question Classification


6 types of questions Person Location Organization Number Date Artifact

Question TypeQuestion Type


We define 17 basic rules for simple questions.

Basic Classification RulesBasic Classification Rules


Architecture for Learning Dependency Features

Extracting Dependency Features Algorithm

Learning Semantic Learning Semantic Dependency Features (1/3)Dependency Features (1/3)


Architecture for Learning Dependency Features



Extracting Dependency Features Algorithm


..


Question Focus Question Focus Identification Algorithm (1/2)Identification Algorithm (1/2)

Algorithm


Example

Question Focus Question Focus Identification Algorithm (2/2)Identification Algorithm (2/2)


Unigram-SDRM

Bigram-SDRM

Semantic Dependency Semantic Dependency Relation Model (SDMR) (1/12)Relation Model (SDMR) (1/12)


Unigram-SDRM

P(C|Q) need many questions to train.


Q

Question

C

Question Type

P(C|Q)


P(DC|C): Collect related search results by every type.

P(Q|DC): Use DC to determine the question type.

Unigram-SDRM


C

Question

DC

Question Type

P(DC|C)Q

P(Q|DC)

Web search result


Unigram-SDRM

Semantic Dependency Semantic Dependency Relation Model (SDRM) (4/12)Relation Model (SDRM) (4/12)


Unigram-SDRM


Q={QF,QD}, QD={DV,DQ,DN}.

DV : Dependency VerbDQ: Dependency QuantifierDN: Dependency Noun


DV={ dv1, dv2, ,⋯ dvi}, DQ={ dq1, dq2, , ⋯ dqj}, DN={ dn1, dn2, , ⋯ dnk}.

Unigram-SDRM



Semantic Dependency Semantic Dependency Relation Model (SDRelation Model (SDRMRM) (8/12)) (8/12)

Parameter Estimation of Unigram-SDRM


Bigram-SDRM



Parameter Estimation of Bigram-SDRM

P(DC|C): The same as Unigram-SDRM P(QF|DC): The same as Unigram-SDRM P(dV|QF,DC), P(dQ|QF,DC), P(dN|QF,DC)

Nsentence(dv,QF): The number of sentence containing dv and QF. Nsentence(QF): Total number of sentence containing QF.



Parameter Estimation of Bigram-SDRM


112/04/19 41


WMMKS LabWMMKS Lab

OutlineOutline


SDRM Performance Evaluation

ExperimentExperiment

. Unigram-SDRM v.s. Bigram-SDRM

. Combination with different weights

SDRM v.s. Language Model. Use questions as training data

. Use Web as training data

. Questions v.s. Web


Collect questions from NTCIR-5 CLQA. 4-fold cross-validation.

Experimental DataExperimental Data


Result

Unigram-SDRM v.s. Bigram-SDRMUnigram-SDRM v.s. Bigram-SDRM


Example

For unigram: “ 人” ,” 創下” ,” 駕駛” are trained successfully.

For bigram: “ 人 _ 創下” are not trained successfully.

Unigram-SDRM v.s. Bigram-SDRM (2/2Unigram-SDRM v.s. Bigram-SDRM (2/2))


Different weights for different features

α: The weight of QF, β: The weight of dV, γ: The weight of dQ, δ: The weight of dN.

Combination with different weight (1/3)Combination with different weight (1/3)


Comparison of 4 dependency features



16 experimentsBest weighting: 0.23QF, 0.29DV, 0.48DQ.To solve some problem about mathematics. Example: QF and DV

α: The weight of QF

β: The weight of DV.

α=(1-0.77)/[(1-0.77)+(1-0.71)]

β=(1-0.71)/ [(1-0.77)+(1-0.71)]



Result

Use questions as training data (1/2)Use questions as training data (1/2)


Example

Use questions as training data (2/2)Use questions as training data (2/2)

For LM: “ 網球選手” ,” 選手為” are not trained successfully.

For SDRM: “ 選手” , ” 奪得” are trained successfully.


Result

Use Web search results as Use Web search results as training data (1/2)training data (1/2)


Example

For LM: “ 何國” are not trained successfully.

For SDRM: “ 國” , ” 設於” are trained successfully.

Use Web search results as Use Web search results as training data (2/2)training data (2/2)


Result

Question v.s. Web (1/3)Question v.s. Web (1/3)

Trained Question: LM can train QF of the question. Untrained Question: LM can’t train QF of the question.


Example of trained question

Question v.s. Web (2/3)Question v.s. Web (2/3)

For LM: “ 何地” are trained successfully.

For SDRM: “ 地” , ” 舉行” are trained successfully, but these

terms are also trained on other types.


Example of untrained question

Question vs. Web (3/3)Question vs. Web (3/3)

For LM: “ 女星” , ” 獲得” are not trained successfully.

For SDRM: “ 女星” , ” 獲得” are trained successfully.


Discussion

ConclusionConclusion

We need to enhance our learning method and performance. We need better smoothing method.

Conclusion We propose a new model SDRM which uses

question focus and dependency features for question

classification. Use Web search results as training data to solve the

problem of insufficient training data.


Further works in the future

Future WorkFuture Work

Enhance the performance of learning method. Consider the importance of features in the question.Question focus and dependency features may be

used for other process steps of question answer systems.

112/04/19 58

Thank YouThank You

WMMKS LabWMMKS Lab

Learn

Documents

Transcript of Learn