王小捷 智能科学与技术中心...

18
王小捷 智能科学与技术中 智能科学与技术中北京邮电大学 北京邮电大学

Transcript of 王小捷 智能科学与技术中心...

Page 1: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

王小捷

智能科学与技术中智能科学与技术中心

北京邮电大学北京邮电大学

Page 2: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

背景背景

问题问题

关注点关注点

Page 3: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

应用背景---网络

网络数据的多模态化产生的跨模态信息检索需求例如 以文检图◦例如:以文检图

◦需要在语言与图像之间建立关联需要在语言与图像之间建立关联

Page 4: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

应用背景---机器人

真实情景中的服务机器人需要同时处理视觉 听觉 语言 行为等信息理视觉、听觉、语言、行为等信息◦机器人要完整理解“你好,我是Tom”“把要完 解 ,我是桌上的红铅笔给我吧”之类的语句需要感知行为信息的参与。行为信息的参与。

Page 5: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

共性科学问题:◦如何建立基于感知信息的语言意义?

也即Lang age Gro nding问题也即Language Grounding问题

“红铅笔”的释义是该对象各种感知信息的综合

◦Grounded Language可能为上述问题提供一种解决途径

Page 6: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

人类存在解决这一问题的途径人类存在解决这一问题的途径◦一些基础的语言意义根植于感知体验

红色 铅笔 (视觉)红色、铅笔 (视觉)打、跑 (运动)粗糙 柔软 (触觉)粗糙、柔软 (触觉)香、臭 (嗅觉)静 嘈杂 (听觉)静、嘈杂 (听觉)

◦连续感知运动输入 模式 词(命名)◦人类的NLP不是NL自足的 只有具备这◦人类的NLP不是NL自足的,只有具备这些基础才能进行更多的NLP

Page 7: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

计算机器能否做到?如何能?计算机器能否做到?如何能?◦面向整个AI的大问题

基于Agent的AI定义

此刻关注点:此刻关注点:◦该问题的研究能给NLP带来什么?

◦该问题的研究里NLP能做什么?

Page 8: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

传统语言意义基于符号进行解释离散符号之间的互释 例如 词典释词◦离散符号之间的互释。例如:词典释词

一般NLP也不关注Grounding问题在 中进行◦在NL中进行NLP◦这种方式不能满足上述应用需求这种方式不能满足 述应用需求

Page 9: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

Language Grounding相关研究

ViTra系统 (Herzog 1994 )ViTra系统 (Herzog 1994 )

Page 10: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

Language Grounding相关研究

ViTra系统 (Herzog 1994 )ViTra系统 (Herzog 1994 )Cell (D.Roy 2000 )

Page 11: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

Language Grounding相关研究

ViTra系统 (Herzog 1994 )ViTra系统 (Herzog 1994 )Cell (D.Roy 2000 )Leonard系统 (Siskind 2000 )

Page 12: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

更多相关研究更多相关研究:◦D. Roy, E. Reiter. Connecting Language to y, g g g

the World. Artificial Intelligence. 167:1–12, 20052005.

R M G d d L L i◦ Ray Mooney. Grounded Language Learning. AAAI2013 Keynote Speech.

Page 13: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

该问题的研究能给NLP带来什么启发?◦NLP beyond NL

利用其它模态的信息来为NLP服务利用其它模态的信息来为NLP服务

一些研究示例d 利用图片进行◦Barnard2005利用图片进行WSD

◦ Chen2010基于情景信息进行多语言学习基于情景信息进行多语言学习

◦ Bruni2012利用图像+文本来构建词意义表示◦◦…

Page 14: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

要用视觉信息需要什么基础要用视觉信息需要什么基础◦ Bruni. Visual Features for Linguists: Basic

image analysis techniques for multimodally-curious NLPers. ACL2013 tutorial

Page 15: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

该问题的研究里NLP能做什么??◦?

做图像处理\机器人\机器学习的人干了什么?什么?◦ ImageNet 用WordNet标注\属性学习来克服语义鸿沟语义鸿沟

◦ Embodied机器人语言

◦文-图多模态深度学习

◦◦…

Page 16: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

该问题的研究里NLP能做什么?该问题的研究里NLP能做什么?◦扩展NLP的边界,加入感知信息,完成更复杂的任务 (网络跨模态检索)◦深挖NL的基础:Perception oriented◦深挖NL的基础:Perception oriented NLP (机器人语言习得)

Page 17: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

NLP b d NLNLP beyond NL◦NLP是自足的吗?NLP是自足的吗?

否,如同√5不能在整数域得到精确解,NLP任务不能在NL内得到彻底解决NLP任务不能在NL内得到彻底解决,因此,NLP需要超越NL。,

Page 18: 王小捷 智能科学与技术中心 北京邮电大学bj.bcebos.com/cips-upload/贵阳战略研讨会/NLP Beyond NL-王小捷.pdf应用背景---机器人 `真实情景中的服务机器人需要同时处

谢谢!谢谢!敬请指正!敬请指正!