7月11日,加州大学洛杉矶分校(UCLA)朱松纯(Song-Chun Zhu)教授访问海洋之神8590vip自动化研究所,并做客模式识别学术大讲堂,作了题为Beyond What and Where: Reasoning Function, Physics, Intents and Causality的报告。
报告伊始,朱松纯从计算机视觉能否解答小学生的题目到计算机能否辨别日常生活的细节,从有趣的生物学实验到人工智能从上世纪80年代开始的起起伏伏开始讲起,以非常浅显易懂的例子引导大家思考。
接着,朱松纯讲到了他眼中的计算机视觉应该是什么样:从1970年到1990年,计算机视觉主要以几何特征为主要媒介,从1990年到2010年,计算机视觉主要以表观特征为媒介,但这两类特征都只能解决诸如分类、识别、检测、定位等问题,和人类视觉系统所体现出来的“智能”相去甚远。他认为,在人类视觉系统中,看得见的几何和表观特征所占比例很小,大部分是看不见的东西,就像物理学里的暗物质(dark matter)和暗能量(dark energy)在物理世界总占据绝大多数一样,而这些看不见的东西起着最为核心的作用,朱松纯将这些“看不见的东西”归类为功能(function)、物理(physics)、动机(intents)和因果(causality)。这个观点一经抛出就激起了大家的兴趣,因为这是一个和当今主流研究手段完全不同的途径。
朱松纯进一步做了详细的讲解:功能是指场景中各个物体所提供的功能,比如椅子可以坐、杯子可以拿、人可以躺在床上等等,并且,这些具有不同功能的物体往往在尺寸上也是具有区别的,他也罗列了自己课题组在这方面的一些工作。物理指的是场景中物体之间的物理联系,这种联系可以以速率、相互受力关系、场等来体现,并以此来估计物体在场景中的稳定性。动机是指视觉中物体做某项行为的原因和做决定的判断依据,这些原因和依据就是朱松纯要建模的暗物质和暗能量。
接下来,朱松纯介绍了其坚持做了十多年的研究成果:与或图(And-Or Graph)。由于在图中每一个节点都包含了诸如空间、时间、因果等多个属性,他又介绍了联合推理方法。最后,朱松纯还介绍了目前存在的挑战和未来工作。朱松纯的讲解结合了许多很有趣的例子及其课题组坚实的工作基础,因此显得深入浅出,讨论环节与会者的提问也非常热烈。
朱松纯1991年毕业于中国科学技术大学,1994年和1996年先后获哈佛大学硕士和博士学位。目前任IEEE fellow,于2003年获得马尔奖(Marr Prize),并在1999年和2007年两度获得马尔奖荣誉提名(Marr Prize honorary nomination)。他还获得了Sloan基金颁发的学者奖(Sloan Fellow in Computer Science),NSF Career Award,ONR Young Investigator Award,Aggarwal prize(from the Intl Association of Pattern Recognition)和Helmholtz Test-of-time prize(ICCV2013)。
报告会现场