【LLCC】6月18日詹卫东教授讲座:现代汉语构式的语义表征与构式知识库的构建
发布日期:2015-06-11 作者:
现代汉语构式的语义表征与构式知识库的构建
主讲人:詹卫东教授
时间:2015-06-18 15:10
地点:北大哲学系B114(地下)
简介: 传统的基于词汇语义组合的句义表示框架,在应用于真实语料的句法语义分析和内容理解任务时,虽可以覆盖一般的情况,但还是碰到不少问题,其中构式(construction)的语义该如何分析,就是一个很大的问题,是面向语义计算的语料库标注中需要解决的难题。本文在借鉴国外形式化构式语法理论研究(如Sign-based Construction Grammar以及基于框架网的构式语料标注研究(FrameNet Construction)基础上,探讨汉语构式的语义表征问题。本文把构式看作是词和短语之外的语言单位。作为基于语块(chunk)的语言单位,构式是对基于词的常规语法组合的必要补充。构式的语义描述,需要在语块中区分常项和变项,融汇词语与结构的语义模式、综合内部和外部的约束条件,进行分层描写,给出语义描述框架。
在语言工程层面,构式的知识描述更适合采用类似词库的方式。为此,我们收集了现代汉语1300多条构式,大体分为四种类型:(1)短语型构式;(2)复句型构式;(3)半凝固型构式;(4)实例化构式。现阶段重点分析了短语型构式(484条,占37%)的句法形式和语义构成特征,大体有六种情况:(1)异常组配(例如:那个紧张啊);(2)同型复现(例如:一天比一天严重);(3)成分省略(例如:糊涂得可以);(4)成分冗余(例如:像做贼似的);(5)语序异常(例如:老百姓一个);(6)论元结构异常(例如:跑了我一身汗)。在此基础上,本文通过示例方式,介绍目前初步提出的一个分层级描写构式语义的框架,包括:(1)字面义;(2)命题义;(3)指称义;(4)交际义。其中字面义对构式内部成分所属的基本概念范畴加以描写。命题义对构式所包含的基础谓词事件结构加以描写(还有待扩展到复合事件内部关系语义描述)。指称义则说明构成成分中名词性成分取内涵语义还是外延语义。交际义是构式语义描写的重点,对说话人的交际意图,构式适用语境,交际效果(如修辞色彩)等加以说明。
* 本文研究工作得到国家重点基础研究发展计划(2014CB3405042013),教育部人文社科重点研究基地重大项目(13JJD740001),国家社科基金重大项目(12&ZD175)和国家社科基金面上项目(12BYY061)资助,特此致谢。
主讲人简介: 詹卫东 男,1999年获北京大学博士学位后留校任教。现为北京大学中文系教授,计算语言学研究所副所长。主讲课程“现代汉语”“自然语言处理导论”“语言工程与中文信息处理”“计算语言学概论”等。主要研究领域为现代汉语语法、词汇语义学、语言知识工程、语文文字规范研究等。著有《面向中文信息处理的现代汉语短语结构规则研究》(清华大学出版社2000年),合编应用语言学教材《计算语言学概论》(商务印书馆2003年),主编《出版物上数字用法》国家标准(中国标准出版2011年)。
欢迎老师和同学们参加!
北京大学语言、逻辑、认知、计算跨学科论坛
发布时间:2015-06-11 20:00:57