2005.10.30-11.01:周北海、刘壮虎出席“第二届心灵与机器论坛”。
多视角、多维度的人机语义研究
——2005“心灵与机器”杭州会议综述
10月30- 11 月 1 日 , 2005年“心灵与机器”全国学术研讨会在秋意阑珊的西子湖畔举行。此次会议由浙江大学语言与认知研究国家创新基地主办,北 京大学逻辑、语言与认知研究中心、中国科技大学计算机系、北京师范大学科学与人文研究中心、浙江师范大学法政学院协办,来自中国科学院、中国社科院以及北 京大学、南京大学、复旦大学、厦门大学、华中科技大学、中国科技大学、北京师范大学、华中师范大学、上海大学、汕头大学等20多个单位的30余位专家、学者进行了为期三天的主题发言和专题讨论。
本次会议是2004年厦门会议的继续,会议报告和讨论围绕“语义网与本体(the semantic web & ontology)──人-机语义研究”这一主题展开。会议在“心灵与机器”背景下,聚焦于语义网与本体,展开了关于意识、意义、认知的涉身性(embodiment)、感受性(qualia),脑机交互(BCI)、自然语言语义学及其应用、汉语的认知研究与形式处理等问题的深入探讨。
1 语义网是通向“全球通用”公共平台的关键性步骤
“语义网”(Semantic Web)概念是人工智能高度发展的产物,也是网络基本作用飞跃性的表现。“语义网”技术通过给网页文本附加语义信息并提供相应自动处理机制的方式,为机器在“理解”的基础上处理Web信息提供了一条有希望的新途径。
中国科学技术大学计算机系 陈小平 教授指出,近十年来,人机关系正在发生根本性变化,人际关系越来越多地借助于机器网络和人机关系得以实现。网络基本作用的改变体现了上述主要趋势,预期不久的将来将出现一个“全球通用”的公共平台,这个平台应具有两大特征:第一,它支持人机协作,机器在这个平台中的作用远远超过单纯的信息传送和信息显示;第二,它不仅支持知识传播、利用和生产,而且在此基础上支持其他形式的社会活动,比如成熟的电子商务、虚拟企业等等,他认为“人机语义”是实现这些功能的理论基础的核心概念之一,而“语义网”是通向上述公共平台的关键性步骤。 陈 教授进一步指出:在通向公共平台的进程中,围绕“人机语义”这个核心,莱布尼兹的“通用文字”理想正在展现新的形式和内容。正因为此类意义,人工智能与邻近学科如逻辑学、语言学、心理学、脑科学和哲学等学科之间的交互出现了新的内容。他还具体探讨了当前网络应用的主要形式──文档检索存在的困难和局限;语义网底层功能──本体引进;简要描述了下一代信息检索主流技术──回答问题的基本问题和目标;继而讨论了语义网高层功能,特别是作为其基础的“相对于规划的可证正确性”概念,并对莱布尼兹的“通用文字”设想在语义网时代的新内容和新形式进行初步勾画。
华中科技大学 陈刚 教授从哲学层面探讨了塞尔(Searle)的汉字屋(Chinese Room)思想实验与语义网之间的关系,他论述了塞尔的汉字屋实验试图表明语义和句法之间有差别的观点,计算机系统是纯形式的,所以是具有句法特征的,不可能具有语义特征,他通过对比分析汉字屋实验和图灵实验之间的区别说明:这两种实验之间得出不同结论的原因应归结为语义与意识的关系问题,所以,与其询问计算机系统中的字符是否有意义,不如追问这些字符对谁有意义; 陈刚 教授指出:计算机系统和语义网中的字符在输入端和输出端对人都是有意义的;然而,在输入和输出之间的字符处理过程对计算机本身是没有意义的,因为计算机没有意识,没有意向性。因此,如何引入新的逻辑推理和字符处理形式规则,从本质上提升目前机器系统的字符处理能力正是语义网技术的建设性意义之所在。
厦门大学 周昌乐 教授作了“面向自然语言处理的Ontology综述”的主题发言,探讨了人工智能的前沿──“本体与隐喻的关系”, 周 教授指出,“本体”(ontology)是人工智能界向哲学借用的一个术语,最初产生于知识工程的研究,关于本体,Studer给出了较完整的定义:Ontology是共享概念模型的明确形式化规范说明。包含四层含义:概念模型;明确;形式化;共享。某个应用领域的一个本体,是一种用于描述该领域的知识的概念体系。本体作为一种知识表示体系已成功用于信息检索等多个自然语言处理领域,因此,借助本体来处理隐喻现象是一个自然的想法, 周昌乐 教授等计划今后以此为科研方向。
现有本体通常由一组基本“范畴”以及它们之间的一些逻辑关系构成。语义网技术借助本体来表示网页文本的语义信息。利用本体提供的语义信息,机器可以自动地对网页文本(或其它文本)进行一定的推理,从而达到在一定程度上自动处理网页信息的目的。而“描述逻辑”(Description logic)作为本体表示和推理的逻辑基础与工具,得到了较充分的研究,SDRT理论在这种背景下应运而生。
2 自然语言语义学为语义网-本体研究提供可以借鉴的成果
自然语言处理的基础在于语义学的不断发展;在语义学的发展史上,逻辑一直起着奠基石的作用,在经过了Tarski、 Montague的经典静态语义学之后, Kamp & Reyle努力将语境参数引入逻辑形式描述,1991年以来,Asher教授等人在Kamp等人的DRT基础上,对语篇语义的形式描述进一步延伸和拓展到以话语片断为刻画单位,亦即SDRT──Segmented Discourse Representation Theory。
北京大学的 毛翊 博士(Asher教授的博士)和 周北海 教授称SDRT为“基于语篇结构的自然语言语义学”, 用历时的方法详细介绍、分析了SDRT的思想渊源和理论基础。 周 教授指出,SDRT是超越DRT的一种新的关于自然语言的语义理论。在形式化方法传统下,从静态语义学到动态语义学、从语义学到语用学, SDRT是在这些理论和发展的基础上产生的,关键的一步在于:SDRT看到了语篇中由语义内容形成的语段和相应的修辞关系, 由此揭示了线性的语句串中的非线性语义结构。 毛翊 博士(Asher教授的博士)和 周北海 教授对SDRT的应用前景作了总体分析。以语篇结构为中心,通过SDRS框图和右前侧限制条件等技术手段, SDRT可以更好地解释和处理自然语言中的多种难以解决的语言现象和问题,如代词指涉、动词短语省略恢复、融贯性判定、预设明示、语词歧义消除、隐意明晰等。具有显著的理论指导意义。
浙江大学 黄华新 教授及其博士生肖家燕作了“SDRT及其应用初探──话语解读的新视角”的主题发言,从SDRT的三个核心概念说起,即修辞关系(语篇结构)、右边界限制以及最大化语篇连贯性(MDC)原则,结合具体的自然语言实例,阐述了SDRT如何将语篇(话语)修辞结构处理为语境参数,参与语义的建构与表述,基于非单调逻辑的形式描述,以框图等方式,揭示线性语句跟进中语篇的非线性语义结构,更准确、精细地解读话语意义,解决时间结构、动词省略、预设、会话含义及指称(包括命题指称)等问题,并将SDRT的应用拓展到汉英翻译的评价中,通过初步应用表明:SDRT在汉语回指判断等话语解读中具有很强的可操作性及广阔的应用前景。
中国社科院的 邹崇理 教授多年来潜心于语言逻辑的前沿课题研究,作了“A Report on the Treatment for Discontinuous Quantifiers”主题发言。 邹 教授根据近期在美国宾夕法尼亚大学学习与研究情况,首先介绍了Clark教授两项有价值的研究成果:(1)把多元量词如“every…a different…”处理为与“more…than…”相似的非连续算子; (2) 经过某些调整,基于Lambek的后承演算,取得一种关于涉及到上述量词的句子的组合分析。 考虑到更多量化句子, 邹 教授认为, 对Clark的处理进行拓展和改进应该是合理的, 为了使处理更加清晰, 他因此构建了范畴类型逻辑的自然演绎的一类特殊系统,以显示整体过程。 邹 教授的报告充分展示了逻辑在形式语义学及意义的描述和计算中不可替代的作用。
复旦大学 熊学亮 教授探讨了“语义的性质和隐义的推导模拟”,在从内涵和外延角度定义语义一般性质的基础上,阐述了语言使用中言语隐义的运行特征,并就其中比较有代表性的隐义的句内和句间运作进行了形式模拟。 熊 教授指出,虽然Gibbs(2002)的研究与Carston(1993)、 Sperber & Wilson(1993)、Recanati(1993)的研究非常相近,但其结论是语义和语用的差别与“所说”与“所含”并不相关,对命题内容的语用充实导致形式语义学和形式语用学的产生,如话语表征论、情景语义学,因此,他认为与语言形式相关的含义是一般性质的,是在语言结构触发的直接语义上生成或与语言结构有关的含义或言语隐义,在此基础上,进行模拟并揭示隐义的若干特点。
上海大学的 程琪龙 教授的主题发言:“谓元?语义结构?概念框架”从认知连通可行性和认知操作可行性的角度出发,探讨概念框架和语义结构的理论和相互关系。通过关注概念语义的参与者和语义结构的谓元以及两者之间的异同;力图证明它们之间并非总是一对一的体现关系;证明概念框架表述的概念语义和语义结构表述的语法语义有必要在理论模式表述中分离开来。
华中师范大学 胡珀 老师作了“基于WordNet建立中文同义词词林的上下位关系”的主题发言,着重探讨利用现有的中文词汇资源,借助Wordnet的组织方式,在Wordnet的上下位语义关系的导航下,充实、完善《同义词词林》的上下位关系,以期建立中文概念网络。
此外,浙江大学语言与认知研究中心 陈宗明 教授等对汉语形式化提出了新的构想; 浙江大学王小潞副教授等尝试运用逻辑手段描述语言与思维(反向思维和发散思维);浙江大学的 金立 博士、李海波、徐慈华、吴恩锋等青年学者分别提交了“略论规约含义”、“汉语的认知研究与形式处理”、“隐喻表达与经济性原则”、“概念隐喻源域类型的多元性认知机制”等有关本议题的论文。上述主题发言和提交的学术论文分别从形式语义学、认知语义学及认知语用学、隐喻学等不同角度探讨了语义本体,使语义网研究进一步细化,并为人-机语义关系研究提供可以借鉴的成果和基础。
3 认知科学的哲学基础
认知科学是对心智、大脑、智能和行为进行多学科和跨学科的研究,它是21世纪一个重要的学科汇聚领域。
由于认知的符号主义范式的局限,上个世纪70年代以来,认知科学中出现了理解和研究认知涉身的、情境的和动力系统的诸多取向。北京师范大学的 刘晓力 教授以广阔的视角引出了“认知科学新进路的哲学基础”这一问题。尽管符号主义面临诸多困难,但她认为,不能简单否定、放弃这种范式,而应该更谨慎地理解“计算隐喻”。 刘晓力 教授认为:在认识的“交互隐喻”、“涉身隐喻”和“突现隐喻”的背后有着相似的哲学基础,概括起来就是现象学中的“生活世界”概念;这些哲学假定对传统认知理论关于心灵-世界的观念提出了深刻质疑,如果把“情境”、“涉身性”、“交互作用”、“动力系统”和“突现”这些概念所反映的不同侧面关联起来理解,我们似乎看到一幅更全面、更生动的认知科学的图景。
浙江师范大学的 郑祥福 教 授认为:西方哲学已经实现了语言研究与认知研究的两大转向;认识论的自然化是认知转向的开端,而认知转向则与人工智能的发展直接相联系;正如语言研究是计 算机发展的基础一样,认知研究是人工智能的基础;然而,要奠定这个基础,就必须解决四大哲学问题,即意向性问题、概念框架问题、语境问题和日常化认识问题。
北京师范大学的博士生孟伟从G. Lakoff的认知语言学出发分析了涉身性的三个层面:神经层面;现象学前反思层面;认知无意识层面,并讨论了涉身认知的意义问题。在随后的讨论中,与会者对“embodied”和“embodiment”的翻译提出了一些看法。浙江大学的 李恒威 博士等倾向于译为“具身的”。
浙江大学唐 孝威院士主持的“语言与思维讨论组”在为会议提交的《表征、感受性和言语思维》的报告中提出了关于“认知意义的起源”问题。他们认为:人不同于计算机,人 的认知不仅仅是表征的计算过程,它还牵涉人和世界之间的意向性意义的关联,即人的认知是具有意义的认知过程;在人的意识经验中,有一个“为我”的方面,即 感受性的成分,这是认知意义的最初起源;因此,人的思维活动是从表达某种意向性的意义开始的;人类意向意义表达的演化历史经历了不同的思维表达水平;人类 的言语思维是经历了动作思维、动作-意向思维之后发展起来的思维水平;在言语思维的水平,语义的加工(生成、存储和理解)和表达不是单一的过程,而是一个 由语法约束和语义生成两种力量促成的辩证运动。
4 意识问题
意识研究自上个世纪90年以来迅速升温。到2005年,ASSC(Association of Scientific Study of Consciousness)国际会议已经举办了9届。在本次“心灵与机器”会议上意识问题也受到与会者的强烈关注。探讨的论题主要有感受性、意义、意识的判据、脑机接口(BCI)等。
意识是一种主观性的实在现象。正是这个特点,使得意识成为一个真正的“难问题”(hard problem),因为意识的研究不仅要关注意识作为一种实在的现象的客观的方面,它还必须关注意识经验的个体性和意义的方面。感受性(“难问题”或“解释的鸿沟”)既是20世纪90年代以来推动意识研究蓬勃发展的中心问题,同时又是阻碍意识研究向前推进的一块磐石。
针对华中科技大学 陈刚 教授在“汉字屋与语义网”的发言中再次引出的如何判定智能体(agent)有无意识的问题,与会者形成了三方面的看法:(1)外在论的,即行为判定;(2)内在论的,即主观感受判定;(3)不可判定。
汕头大学的 刘西瑞 教授在“意义的诸方面”的报告中讨论了意义的实在性、意义的功能、意义的区分以及意义的各种理论。
浙江大学的 郑筱祥 教授介绍了当前脑机接口的研究现状。BCI的研究旨在建立一种新的交流系统,它通过提取脑电信号把人的意图转变成可控的信号用于某种输出设备。
这次会议的与会者具有不同的学术背景, 学者们从哲学、语言学、逻辑学、计算机科学、脑科学、信息科学等多学科交叉研究的视角,对人机语义及其互动进行多维度的探讨,体现了认知科学的思想观念和研究取向。可以说, 这是一次颇具前瞻性的学术研讨会。
(肖家燕 李恒威,浙江大学语言与认知研究中心)