Home» News» LLCC» 【LLCC】9月24日高懿博士讲座:基于概念知识库的问答系统构建方法研究

【LLCC】9月24日高懿博士讲座:基于概念知识库的问答系统构建方法研究

发布日期:2015-09-21 作者:
主讲人:高懿 博士
 

主持人:吴玺宏教授

时间:2015-09-24 15:10:00

地点:北京大学人文学苑哲学系B114 (地下)


标题:基于概念知识库的问答系统构建方法研究 


 
摘要:自1950年图灵测试被提出以来,许多研究者致力于问答系统的研究工作。 然而,自然语言在词语、句子、篇章等多个层面存在着歧义,这些歧义对于计 算机处理语言是一个很大的挑战。如何利用自然语言的结构有效处理各层面的 歧义,成为语言学、逻辑学、信息科学等多个领域研究者们共同关注的问题。 本文以认知语言学的相关研究为理论基础,结合自然语言处理领域的研究成果,针对限定领域的结构化数据,构建一个基于概念知识库的问答系统。

 
具体工作包括: 

 
第一,基于认知语言学关于概念和构式的相关理论,构建了概念库和构式 库。提出了一种基于概念整合的问题句分析方法,实现了问题句中各概念和概 念之间关系的语义表达,通过在概念知识库中的搜索获取相应的答案。实验结果表明,基于概念和构式的问题句分析方法能够达到与现有最好的系统性能相 当的水平。 
第二,基于范畴和范畴化的思想,在概念库中引入上下位关系。进而提出 了一种通过推理生成新构式的方法,实现了概念整合方法的扩展以有效利用新 构式。实验结果表明,基于范畴化思想的方法能够有效地提高系统对问题句的 分析性能,并显著提高系统的推广能力。 
第三,提出了一种从语料中自动学习构式的方法。该方法以概念整合方法 为框架,以问题-答案对为监督信息,通过抽取候选构式并检验答案,挑选出有 效的构式。进而实现了构式的自动范畴化。实验结果表明了该方法的有效性, 并可在一定程度上减轻人工标注的困难,从而为系统推广到其他领域打下了基础。
发布时间:2015-09-21 20:25:36