一、 报告概况
报告基于语言学领域在判定字符串合法性的角度介绍了几种自动机的基本原理。而在逻辑学领域,自动机的意义也十分重大,有许多重要的应用和理论问题,如识别无穷树的图灵机等,都是重要的研究课题。
二、 问答记录
Q:表示提问 A:表示回答 S:表示补充
刘壮虎Q:基于形式语法的自然语言计算机处理是经典做法,但也有完全抛开生成语法理论而基于统计学的自然语言处理。你在理论上更认同哪一者?
郑 植A:在计算机工程领域许多人采取一种实用主义的策略,测试结果更漂亮,正确更率高的做法普遍受到更多的欢迎。但工程实践与理论研究是两个层面的问题,理论上我认为基于生成语法的做法更多地触及到了语言的实质,因而我更赞同。它实现为工程技术时遇到的具体障碍和无法解决的具体问题并不能作为反对整个形式主义语言观的依据。而工程实践领域由于需要追求某种指标,因而采取了其他做法,这也是必要的,因而我也不反对。这种做法理论上比前者距离真理更远,但在我看来它可以看作是为达到某种现实的目的而进行的理论让步。就好像虽然相对论已经表明牛顿经典力学的基本观点是不正确的,但实际生活中仍然采用牛顿经典力学来解决物理问题。这不是因为牛顿经典力学更接近真理,而是因为它可以看做是理论为了应用而进行的合理简化和让步。因此,我们应该区分不同的目的:如果我们的目的是揭示关于语言的真理,那么我更赞同前者;如果我们的目的是让计算机处理得到更高的正确率,那么哪种做法的正确率高就采用哪种。
陈 波Q:你提到了语法独立性是形式语法的一个主要问题。那么形式语法理论还有什么重要的缺陷呢?
郑 植A:形式主义语言学认为,语言的本质是形式,支配语言的是基于人的语言能力的各种规则,因而要用数学的手段描述和刻画这些形式与规则。这样,人就在形式语言学理论中“隐退”了,人的主观性、意向性,以及认知和经验的特性不在形式主义语言学理论的考察范围之内。然而,随着认知科学、神经科学的兴起,以及后现代主义思潮的影响,20世纪后期以来人们越来越关注人在语言体系中的角色。许多观点认为,形式语法理论的最重要的理论缺陷就在于“人”的缺位,因而从根本上反对形式主义语言观。他们认为语法规则不是客观的和先天的,而是创造的和约定的。而这种创造与约定必然基于人的认知和经验特性。也就是说,对形式语法理论缺陷的最根本的批评实际上是语言根本观点上的分歧。不过,形式主义观点的特别之处,或者说强大之处在于,无论我们采用何种语言观,只要语言还是形式和意义的符号体系,那么形式主义的语言分析方法和数学化的工具总会有用武之地。
王海若Q:有没有与形式语法相关的语义理论呢?
郑 植A:乔姆斯基早先强调语法的独立性,但后来也意识到语法独立性带来的问题。于是他后来转向关注语音、语义等其他方面。到1965年,乔姆斯基建立起一个完整的生成语法系统,包括语类、转换、音系、语义4个子系统,各子系统之间有一定的顺序关系。每个子系统都有一套规则,规则之间有一定的使用顺序,像用数学公式一样,逐步推导出句子来,不同的规则推导出不同的句子。而到七八十年代,面对规则越来越繁杂的情况,乔姆斯基针对语义又提出了“管辖与约束理论”取代之前的规则系统,用更具一般性的管辖与约束原则来抽象概括具体的规则。
三、 徐超评论
口齿伶俐、演讲大方,语言流畅、声音洪亮,普通话不错;
讲的过程清晰明确,逻辑严谨,条分缕析,如福尔摩斯探案班向我们展现了形式语法和自动机的相关理论。
主要问题有:
1、超时了。
2、应该结合例子引入定义。
3、后面讲的消歧的例子重在统计,语料库训练,感觉跟前面的自动机的关系不大。