在“蒙太古语义学和机器翻译”报告中,朱水林教授主要从思想的层面勾勒出蒙太古语义学和机器翻译的整体构架。蒙太古相信人工语言可以与自然语言建立一一对应的关系,虽然自然语言具有模糊性、歧义性等等特点,但是人工语言却是精确的、无歧义的,这就为尽可能减少,甚至消除自然语言的歧义性指明了方向。
一、蒙太古语义学整体构架
具体地说,蒙太古语义学是用形式化方法研究自然语言内涵语义的理论。而内涵就是从可能世界到外延的函数,从而提供一种识别机制。大体的构架如下:
语形范畴 语义类型
│ 直 │ 直
↓ 接 形式化映射 ↓ 接
英语片语化 ───────────────→ 人工语言IL
(有歧义的) (无歧义)
(17条规则) 相应地有15条规则 间接 │
└──────────────────┐ ↓
间接 人工语言的语义学
图的左边是小范围内的,采用的是自然语言的片断。形成规则都是函数,由函数形成。与语形范畴相对应的是语义类型,这里的类型是分层的,它不仅有非逻辑常项,还有谓词、谓词的谓词,各式各样的各类的谓词的词项等等。类型也是函数。具体地在技巧上则引进了?-算子,从而较清楚地刻画高阶函数。从语形范畴到内涵逻辑类型的翻译也是用函数,其所依据的是弗雷格的外延可构成性原理,即表达式的总体外延由组成部分的外延通过运算而成,而且它的值是唯一确定的。
二、机器翻译
机器翻译是在源语言和目标语言之间所作的翻译。一般主要有两种方法:一种是理论方法,即基于语法或语义规则的理论方法;一种是基于语料库的经验方法,如统计、实例等等方法。
以蒙太古语义学为基础的机器翻译过程可以模型化为三个阶段:分析阶段、转换阶段和生成阶段。朱水林教授认为我们可以做在语义中可解决的部分,用形式语言逐步逼近自然语言,从而在相当程度上消除歧义。
中软公司的董亦农对报告作了精彩点评。点评后换种角度,从实际经验出发,现场展示了机器翻译过程中的难度和瓶颈。
在朱水林的报告、董亦农的点评和现场展示后,与会者就 “自然语言与形式语言到底差在哪里?”“是否还有一种很好的理论?”“作为逻辑工作者是否可以在其中找到切入点,做些工作呢?”等问题进行了讨论。
(许春梅)