语义特征在评价对象 抽取与极性判定中的作用
description
Transcript of 语义特征在评价对象 抽取与极性判定中的作用
语义特征在评价对象抽取与极性判定中的作用
周红照 侯明午 颜彭莉 张叶青 侯敏 滕永林
中国传媒大学 国家语言资源监测与研究有声媒体中心
2013 年 11 月 18 日
◇ 引入语义特征的必要性◇ 语义特征的类型与功能◇ 系统运行流程◇ 实验结果◇ 结语
无论是统计还是规则的方法,都已经关注到了词性、词性组合、依存关系等语法特征在评价对象抽取与极性判定中的作用。 语法确实很重要,但并非“万能”,有些问题单纯依靠语法难以解决,例如:
① 新《笑傲江湖 》 力挺 东方不败。
②黄渤的舞 亮瞎 我的眼了。主—谓—宾
引入语义特征的必要性
语义特征
评价对象抽取(七)
功能:定位评价对象与评价因子的相对位置、确定评价对象左右边界、排除无关词语的干扰
极性判定(五)
上下文无关型:漂亮、优雅、和蔼可亲
上下文相关型:科学、效率、高低大小
数学是一门科学。()
他的方法很科学。()
语义特征的类型与功能
后指动词:评价对象总是后面的宾语。 (力挺、欣赏、鄙视: hzv)
前指动词:评价对象总是前面的主语。 (亮瞎、背叛、有助于: qzv)
① 新《笑傲江湖 》 力挺 东方不败。
②黄渤的舞 亮瞎 我的眼了。
当评价词语为名词性的、并且作定语中心语时,其语义指向(即评价对象)会随着其语义特征的不同而变化。
③这种人是(社会的败类)。
④# 毒玩具 # 这是(相关政府部门的耻辱)。
耻辱、毛病、劣迹 : qdn
当评价词语是受介词短语修饰的状语中心语时,其语义指向如何?
⑤PM2.5 对呼吸系统 危害很大。
⑥玩家 对锤子 ROM 很满意。
主 语 介词的宾语
原因: (危害∈非心理动词) || (满意∈心理动词)
⑦ 祖国越来越强大。希望
评价词语是评价句的必要非充分条件,包含评价词语的句子未必是评价句。评价消解词就是指像“希望”这样的可以消解掉评价词语的评价倾向的词。
( 1 )主观愿望类:希望、但愿、祝愿…… ( 2 )主观猜度类:猜、估计、不知道…… ( 3 )假设、让步类:如果、假如、就算……
意愿句 ≠ 评价句,无需抽取评价对象。
评价对象绝缘词:既不能单独充当评价对象,也不能充当评价对象的修饰成分的词。可以是某一整类词(叹词、语气词、拟声词、连词),也可以是某类词中的少量特殊词。
评价对象绝缘
词
动词
代词
名词
能愿动词
判断动词
遭受、致使类动词
称说、比况类动词
疑问代词
副词性代词
语义特殊名词
让、使、受到、引起、导致
谁、哪、如何、怎么、为什么
时候、详情
评价触发词:按照语用习惯,评价对象经常出现在一些特定词语之后,这些词语往往是一个评价的触媒,我们称其为“评价触发词”,评价对象通常紧跟其后。
⑦我觉得陈乔恩的东方不败演技不错。
⑧ # 曼联 VS皇马 # 个人认为纳尼的红牌不存在任何异议。
⑨ # 中国方言式英语 # 充分证明中国英语教育的失败。
青春、阳光、男人、科学
官僚、屌丝、娘、二、主观
素质、水平、道德、逻辑
高、低、大小、长、短
是……的问题难道……评价词
程度副词 + pxn = 0.75
程度副词 + nxn = -0.75
有 + ypn=0.5否定性副词 /动词 + ypn=-0.5
性价比 | 效率 | 水平 | 质量 + 高 = 0.5
成本 | 费用 | 风险 | 通胀 | 油耗 + 高 = -
0.5
是……的问题 = -0.5难道……评价词 = 评价词 ( -1 )
青春、阳光、男人、科学
官僚、屌丝、娘、二、主观
素质、水平、道德、逻辑
高、低、大小、长、短
是……的问题难道……评价词
程度副词+pxn = 0.75
程度副词+nxn = -0.75
有+ypn=0.5否定性副词 /动词+ypn=-0.5
性价比 | 效率 | 水平 | 质量 + 高 =
0.5
成本 | 费用 | 风险 |通胀 | 油耗 + 高
= -0.5
是……的问题=-0.5难道……评价词= 评价词 ( -1 )
语义词典示例格式示例 规模大小
语义特征 收词个数nxn 10
xjc 23
xlv 25
pxn 25
cfc 46
ypn 73
qdn 87
qzv 105
jyc 109
hzv 150
CUCsas 系统工作流程
CUCsas 倾向性分析系统运行流程
青春、阳光、男人、科学
官僚、屌丝、娘、二、主观
素质、水平、道德、逻辑
高、低、大小、长、短
是……的问题难道……评价词
程度副词+pxn = 0.75
程度副词+nxn = -0.75
有+ypn=0.5否定性副词 /动词+ypn=-0.5
性价比 | 效率 | 水平 | 质量 + 高 =
0.5
成本 | 费用 | 风险 |通胀 | 油耗 + 高
= -0.5
是……的问题=-0.5难道……评价词= 评价词 ( -1 )
CUCsas 系统工作流程
CUCsas 倾向性分析系统运行流程
评价对象抽取与极性判定规则举例:
*/hzv + #1:20[*/!(jyc|cfc|w)] + JSB = N2[obj,N1]
# 厨子戏子痞子 # 观众喜欢最后十分钟的民国风。
词词 词 词
钦慕演员的全力演出!这么多人盛赞查韦斯。不过,我很看好这个团队。新《笑傲江湖》力挺东方不败。# 锤子 ROM# 大家都认同小米了。看了锤子 ROM 发布会,我很佩服老罗的勇气。最鄙视那种起来看看比分骂骂裁判的伪球迷了。很喜欢金庸先生在新修版《天龙八部》中对王语嫣的改编。……
年份 队伍 评测项目微平均 宏平均
正确率 召回率 F值 正确率 召回率 F值
2012
CUCsas
评价要素抽取及极性判定
0.387 0.356 0.371 0.391 0.344 0.359
中位数评价要素抽取及
极性判定0.569 0.099 0.169 0.572 0.098 0.16
5
最好成绩评价要素抽取及
极性判定0.387 0.356 0.371 0.391 0.344 0.35
9
2013
CUCsas
评价要素抽取及极性判定 0.563 0.514 0.538 0.558 0.504 0.526
中位数评价要素抽取及
极性判定0.192 0.321 0.240 0.188 0.306
0.231
最好成绩评价要素抽取及
极性判定0.563 0.514 0.538 0.558 0.504 0.526
2012 、 2013 CCF评测中评价要素抽取及极性判断评测结果
实验结果 0.1670.167
如果说句法关心的是宏观性、一般性问题,语义则更多的涉及微观性、具体性问题,它使语言的研究走向了精密化。 评价对象抽取与极性判定这一语言工程的顺利开展,需要句法、语义相互配合,如果顾此失彼,可能很难取得理想的效果。
结语
谢 谢!