原标题:系统中的对立--谈现代语言学的理论基础
上次来复旦大学中文系是 2008 年 1 月,是游汝杰教授和戴耀晶教授邀请的。这次来复旦戴耀晶教授已经不在了,我谨向这位英年早逝的优秀语言学家表示深切的悼念。我感谢祝克懿教授和蒋勇副教授的盛情邀请和周到安排,给我这个机会,今天再次来到复旦大学中文系与大家交流。
二十世纪是人类科学、技术、知识突飞猛进的世纪,人类这个世纪所取得的成就超过以往所有人类历史的总和,我认为这样说不是夸大之词。在人文社会科学领域里,如果要选取三到五个最有影响的理论或者学派,我想瑞士语言学家索绪尔的结构主义理论会名列其中;当然,另外还有弗洛伊德的精神分析也一定会入选。索绪尔本人是语言学家,但他的结构语言学理论影响所及,远远不只局限在语言学领域,他对二十世纪整个人文社会科学的进步,尤其是哲学、人类学、社会学、文学批评,甚至包括心理学和计算机科学都起到了非常重大的作用,可以说是二十世纪人类智力所取得的最辉煌的成就之一。说到人类智力取得的辉煌成就,我们知道所有的科学家、学者当中,最令人瞩目的有英国的牛顿,还有后来的爱因斯坦等人。他们大都有一个特点,就是他们所提出的影响了人类上百年或数百年的思想和理论,可以归结为几条非常简要的原理或公式,尽管简要,或者说正因为简要,它们具有普遍意义和普适功能,能用来描写和解释许许多多的现象。大家知道,牛顿的万有引力和三大运动定律说起来相当简单,有一定数学和物理功底的学生花点时间都能明白。但是,无论是宇宙之巨、还是原子之微,但凡只要是涉及到运动的自然现象,除了极宏观、超高速等以外,都一样遵守牛顿定律。所谓“大道至简”,说的就是这个道理。
说到语言学,二十世纪初,索绪尔提出结构主义理论,标志现代语言学的开端。索绪尔结构主义理论,或者说以索绪尔结构主义为理论基础的现代语言学有没有像牛顿的万有引力和三大定律这样表现形式上非常简单,但是意义非常深远、适用范围十分广泛的理论、原则或方法呢?我认为是有的,我把它归结为六个字:系统中的对立(opposition within the system)。语言成分在系统中的相互关联和对立关系,是决定语言成分价值的本质要素,这个思想,既是以结构主义为基础的现代语言学的理论核心,也是语言分析方法的核心。我们今天的讨论内容,就是集中在这六个字。我们先介绍索绪尔本人对有关理论问题的表述,然后以系统中的对立为主要分析手段,研究词、搭配(collocation)和句法结构三种语言单位的有关特征,以此为例,说明这六个字在当代语言学理论和方法中的重要地位。
索绪尔最重要的著作《现代语言学教程》是他去世后学生根据他的手稿和学生的课堂笔记完成的,有不同的版本,也有不少争议,原文是法语,后译成英语和其他语言。法语原文中同一个术语,英文中有时会有几种译法。我今天所据的版本是:Course in General Linguistics,byFerdinand de Saussure, edited by Charles Bally and Albert Sechehaye, 3rdedition, New York:Philosophical Library, 1959.我 2006 年发表于《当代语言学》第 2 期的文章《引进·结合·创新》谈到,我们现在学习和研究的现代语言学主要是西学,所有重要的理论、概念、方法基本上都是从西方引进的。作为中国人,我想没有人愿意看到这种状况,但这却是我们不得不面对的现实。要准确地理解和把握这些理论、概念和方法,我们应该尽量阅读原文著作,尤其是涉及到语义、语用学问题的时候。当然,汉语是我们的母语,是我们讨论学术问题、发表研究成果时所使用的主要语言,在学习和研究过程中,将这些外文词语翻译成汉语也是我们研究工作的一部分。但是,我们要随时提醒自己,翻译很难把一个词语在原文中的意义全面完整地表现出来。这不单是英语翻译成汉语的问题,任何翻译都会碰到这个问题。我们明天会讲到,有些重要的语言哲学论文,原文是用德文写的,翻译成英文也有不少争议。所以,我们用中文翻译一个外文词语时,记住我们只是希望尽可能地贴近这个词语的本义,近可能地符合它的内涵和外延,但完全严丝合缝地表现它的原义基本上是不可能的。在这种情况下有时不妨在括号里面附上原文词语,以便读者。
索绪尔在《现代语言学教程》中提出了几组极为重要的概念,主要有语言符号的“能指”(signifier) 与“所指”(signified)、语言符号之间的横向组合(syntagmatic) 关系与纵向聚合(paradigmatic)关系,共时语言学(synchronic linguistics)与历时语言学(diachronic linguistics)的区别和联系等等。这些重要概念的详细定义和具体运用,我相信大家在语言学导论课程中都已经学过,不需要我今天在这儿重复。我要讲的是索绪尔如何利用这些概念,向我们揭示语言和语言研究的核心奥秘。
首先,索绪尔认为,词语具有语义(signification),但更重要的是它们具有价值(value),价值不等同于语义,例如,法语中的“mouton”与英语中的“sheep”都表示“羊”的意思,但这两个词的价值不同,法语“mouton”还有“羊肉”的意思,而英语“sheep”没有“羊肉”的意思,“羊肉”用另外一个词 mutton 表达。索绪尔提出,语言只是一个纯粹价值构成的系统(language is only asystem of pure values. p.111);说得更具体一点,语言是由相互依存的成分构成的系统,其中各个成分的价值,完全从同时出现的其他成分那儿得出(language is a system of interdepen-dent terms in which the value of each term results solely from the simultaneous presence ofthe others. p.114);要理解一个词语的价值,必须把它与其他类似的价值加以比较,同与它构成对立关系的其他词语加以比较。该词语的内容,实际上只能由词语之外共现的所有其他成分所确定(one must compares it with similar values, with words that stand in opposition to it.
Its content is really fixed only by the concurrence of everything that exists outside it. p.115);价值由系统生成,当我们说它们相当于概念的时候,我们的理解是这些概念是纯粹起区别作用的概念,其本质特征并不取决于它们的正面内容,而是以反面的方式,由它们与系统中其他成分的关系所决定。用最精准的方法描述它们的特征,就是它们不是其他的成分(…values e-manating from the system. When they are said to correspond to concepts, it is understood thatthe concepts are purely differential and defined not by their positive content but negatively bytheir relations with the other items of the system. Their most precise characteristic is in beingwhat the others are not. p.117)。换句话说,要揭示语言成分的特征,最重要的不是说它是什么,而是说它不是什么。索绪尔还说,上面的这些话不但适用于词,而且适用于所有的语言成分,包括语法成分(everything said about words applies to any term of language, e.g. to gram-matical entities. p.116)。
我个人认为,索绪尔的上述思想,可以说是他的结构主义理论的精髓。如果说必须把索绪尔的结构主义理论思想凝练成一句话,那就是语言符号的价值,取决于它在语言系统中与其他成分的关系,主要是对立关系。索绪尔在书中用了很多比拟来说明他的这个核心观点。比如说下棋,少了一个马,我用这个瓶盖当作马,象棋能不能接着下下去?毫无问题。过了一会儿,又少了一个炮,我说用这个笔帽,这是我的炮,有没有问题?也没有问题。什么情况下会有问题?我少了一个马、一个炮,我说这个瓶盖是我的马、那个一模一样的瓶盖是我的炮,这就有问题了,为什么?没有对立,棋子彼此无法区分开来。所以,索绪尔的要点之一就是:语言成分的意义与它本身的发音或其他属性无关。用刚才下棋的例子,棋子是象牙的、铁的、塑料的还是木头的,同能否把这盘棋下下去没有任何关系,唯一有关系的是棋子必须在系统当中能够相互区别开来,相互产生对立。我们现在过了差不多一百年,也许有人会觉得这种观点卑之无甚高论,没有什么高深奥秘之处。但在当时,索绪尔的结构主义思想理论,的确是一个开创性的、里程碑式的成就。我们下一讲会讲到,西方的学术起源于古希腊,古希腊三大哲学家苏格拉底、柏拉图和亚里士多德都对语言问题有浓烈的兴趣。例如,柏拉图对语言问题做过许多研究,他的一个基本观点就是语言成分的意义可以从成分本身的物理属性中去寻找,同中国传统训诂学家所说的声训,有某些相通之处。到了索绪尔,他否定了从柏拉图到二十世纪初几千年以来许多学者认为理所当然的观点,为科学地实证性地研究语言本体奠定了理论基础。
索绪尔《现代语言学教程》重点讲的是音系学,主要分析对象是音位和词,词组和语法一笔带过。他本人认为,语法,也就是组词成句的方式,可以参杂许多个人因素,很难用科学方法加以研究。当然,这反映他的时代局限性。过去一百年来现代语言学的发展历史已经充分证明,不单是音系学,也不单是词汇学,句法、话语、以至于语义语用现象都能够用科学实证方法加以研究,所用方法最重要的理论基础就是他自己提出的“系统中的对立”这个思想。
语言是各种成分相互关联而组成的结构系统。词语意义最根本的特征同它的形式、包括语音、书面形式没有关系,而是由语言形式以外的东西所决定的,主要是由它在特定系统中,同其他语言成分的横向组合关系和纵向聚合关系所决定,这就是我们今天要讲的主要内容。
语言成分在系统中的关联与对立,这既是现代语言学的理论核心,也是语言分析的方法核心。
我们下面分析词、搭配和句法结构三种语言单位,就是要反复说明这条基本原理。既然系统中的对立是现代语言学的理论核心,也是语言分析的方法核心,那么语言分析最基本的方法就有两条:第一,确定系统的范围;第二,确定在该特定系统中呈对立关系和其他关系的所有相关成分和因素,并且确定这些关系的精准属性。说到这儿,有人可能会想到,这不就是音位分析的基本方法吗?不错,以索绪尔结构主义理论为开端的现代语言学研究正是从音位分析开始,然后逐步扩展到其他研究领域的,在这个过程中,音位分析的基本方法自然地、也相当有效地用来分析其他语言单位。随着分析单位的扩展,方法本身也不断地得到充实和发展,日益全面、深入、精细和有效。值得强调指出的是,在这个过程中,音位分析的基本原理、基本分析方法的核心成分---系统中的对立---始终没有变,从音系、词法、词组、句法、话语,再到语义、语用,所有语言分析都遵循这个核心原则和方法。
这两条基本分析方法说起来简单,但实际运用时会出现许许多多的复杂情况。例如,确定系统范围必须考虑到许多因素,时间、地域、语体等等都是界定系统范围的重要因素,辨析这些因素的作用和相互关系,往往不是一件容易做到的事情。同时,要找出系统中相互联系的有关成分,确定它们之间的关系,也常常会碰到一些棘手的问题,需要下很大的功夫,赵元任《音位标音法的多能性》揭示的复杂情况,在分析其他语言单位时也会时时出现。如果对这两条分析方法的原理有透彻的理解,对它们的实际运用有一定的经验,作为语言研究者,我们就基本上入门了。
我先举几个常识性的例子。大家知道,语音首先是一个声学概念,或是一个生理学概念,是物理声学、发声和听觉语音学研究的对象。语言学家也研究语音,重点是研究它在语言系统中的作用,主要是音素同音位的关系。音位不是一个物理概念,也不是一个生理概念,它是一个心理概念,同时也是一个社会概念。如何确定音位呢?主要看两个音素在特定语言系统当中,准确地说是否在最小比对(minimal pair)中呈对立关系,非常粗略地说,构成对立关系的两个音素就可以认为是属于不同的音位。
英语中有三个双唇塞音[p]、[ph]和[b],分属两个音位 /p/ 和 /b/,[p]和[ph]不在最小比对中呈对立关系,属于同一音位的变体。北京话有两个双唇塞音[p]和[ph],不送气清塞音和送气清塞音在最小比对中呈对立关系,所以有两个音位 /p/ 和 /ph/.[p]和[ph]在英语和北京话中语音特征相似,以它们是否在最小比对中呈对立关系为标准,我们确认这两个音素在英语和汉语中的不同价值。顺便说一句,上海话有三个双唇塞音,上海人比北京人更容易将英文[b]音发准。
再看超音段成分。我想学英文的和从事对外汉语教学的人都比较熟悉,英文疑问句的一个主要表现手段是升调。升调同什么对立?同降调对立。“You want this坭”与“You want this坨”,不必采用疑问句句式我们就知道这两句话意思不同,前者为疑问句,后者为陈述句。有些初学汉语的外国人说话怪声怪气:“你要这个坭”,用升调表示疑问。其实,汉语中表示疑问主要是通过语气词,升调和降调在两种语言中的价值是不一样的。英语中升调同降调对立,汉语中这种对立很不明显,说汉语的人较少使用英语那样的升调。两种语言还有一个重要的区别,汉语有完备的语气词系统,各种语气词之间,或是否使用语气词产生对立,以此表示形形色色的意思,是汉语语言学非常重要的研究领域。我上面说的这些都是常识,上过语言学入门课程的人都应该学过,我举这些例子就是做个引子,接着下面讲一些不是那么常识性的内容。
我们先从词汇语义学说起,分析几组词语的准确含义。
先看“Vice-Chancellor”这个词,在许多国家是大学校长的意思,但字面上的意思是副校长。我们校长来中国访问以前有时会碰到这个问题,我们校长来了,但对方大学出来一位副校长接待“,事先联系的时候给的职务名称是 Vice-Chancellor,不是副校长吗?”,我得解释这副校长就是正校长。为了少费口舌,我们校长现在的名片上有两个英文头衔“Vice-Chancellor &President”.“Chancellor”中文媒体往往一律翻译成“校长”,欠妥。在英国、澳大利亚、中国香港地区以及大多数英联邦国家的大学里,Chancellor 一般是个礼仪性的职位,正常情况下是虚职,不参与大学日常行政事务管理。1997 年香港回归前所有大学的 Chancellor 是一个人,英国派来的总督,现在也还是一个人,香港特别行政区行政长官梁振英。香港是双语社会,对种种名衔职称都有法定翻译“,Chancellor”不是“校长”,而是翻译成“校监”.在这些国家和地区的大学行政管理系统中,与“Vice-Chancellor”呈对立关系的不是“Chancellor”,而是“Provost”、“DeputyVice-Chancellor”,或者是“Pro-Vice-Chancellor”,意思是副校长。这是把一个英文词语看低了的例子,下面举一个看高了的例子。
“Vice President”,简称 VP, 一般理解和翻译为“副总统、副校长、副总裁”,是与“总统 / 校长 / 总裁”仅差一级的高层职位。但是,实际情况并非总是如此。在许多美国投资银行里,MBA毕业后工作三到四年,大都可以拿到 VP,一幢大楼里可以有上百个 VP,翻译成中文,都是“副总裁”.2008 年全球经济危机后,《人民日报》发过一篇报道,说是一位在华尔街投行工作的中国留学生,事业曾经十分成功,经济危机前 30 岁出头便升到副总裁的高位,经济危机后被裁员,现为了养家糊口,改行作导游,记者感慨道,这经济状况真是糟到惨不忍睹,堂堂副总裁都只能屈就导游了。其实要是知道 VP 在该系统中的真实价值,我怀疑记者是否还会这样大发感慨。在美国投资银行系统中,与 VP 相对立的职位不是 president,而是 analyst–associate–VP–director–managing director.如果 MBA 毕业后工作三四年一般能升到 VP,那我想大致相当于中国职场上副科长 / 科长的职位。三十多岁的前副科长 / 科长没工作了,改行做导游,有那么吸引眼球的新闻价值吗?也有人利用这些名称,刻意误导不明就里的人,那就更不足为训了。
下面一个例子是“lecturer”(讲师),这也是很有意思的一个词,因为中国大学、美国大学和澳大利亚 / 英国大学教职系统的不同,常常引起误解。美国大学系统一般采用双轨制,教学人员主要分属两大类,一是所谓 faculty,包括教授、副教授和助理教授,教学、科研、行政服务工作都得做。拿到博士学位后,先当助理教授 assistant professor,然后升副教授 associate professor,一般是终身聘任(tenure),最后升正教授 full professor;另外一类主要为单纯从事教学人员设立,主要有语言教师、艺术(钢琴、绘画)教师,往往还包括带同学做实验的教辅人员等等,他们的职称一般是 lecturer 讲师,或是 instructor,往上升就是 senior lecturer 高级讲师或 senior in-structor.这是两套不同的轨制,进入 lecture 轨制以后要换到 faculty 轨制,几乎不可能。中国大学系统里的“讲师”跟美国大学里的“lecturer”是两个不同概念,中国的讲师相当于美国的 as-sistant professor,拿到博士学位一般先当讲师,然后由副教授、教授一路升上去。澳大利亚西澳大学和 Bond 大学采用美国系统,其他大学则采用另外一套系统,教职分为 A、B、C、D、E 五级,A 级是 associate lecturer/senior tutor,给刚拿到博士学位、没有什么工作经历的人,相当于以前中国大学的助教。过三到五年,研究教学成绩比较好,升 B 级,称为 lecturer,相当于美国的 as-sistant professor;再升上去是 C 级 senior lecturer,相当于美国大学的副教授。美国大学和澳大利亚大学系统都有 lecturer / senior lecturer 讲师 / 高级讲师职位,但在各自系统中与它们呈对立关系的是完全不同的其他职位,因此,“讲师 / 高级讲师”在美国和澳大利亚大学系统中是两套完全不同的概念。
最后,我们系统地分析汉语“荤 / 荤菜”和英语的“meat”,以及这几个词语的互译。我对这个问题的兴趣源自一位专业翻译告诉我的一次误译,涉及到宗教人士,造成一个不大不小的事故。我后来专门对此做了一些研究,写了一篇文章《从结构主义语义学角度看“荤(菜)”与“meat”的释义和翻译》,发表在《翻译研究与跨文化交流》一书(台北书林出版社出版 2013 年,第 111-122 页)。下面我将这篇论文的要点作个简单的介绍。
先看两部公认为最好的汉英词典对“荤(菜)”的英译。北京外国语学院大学修订本《汉英词典》(外语教学与研究出版社 1995 年版):
荤 1. meat or fish;2. strong smelling vegetables forbidden to Buddhist vegetari-ans, such as onions, leeks, garlic, etc.
荤菜 meat dishes林语堂编《当代汉英词典》(香港中文大学电子版):
荤 1.meat as food, contrasted with 素 vegetables;吃荤 nonvegetarian,荤菜 a meatdish; 2. Adj. sharp-smelling 荤辛;3. Adj. sexy, indecent.
把“我不吃荤菜”翻译成“I'm a vegetarian”,素食者,自然没有什么问题。但如果只是参照上面两部词典对“荤菜”的英译,就会将这句话翻译成“I don't eat meat dishes”,这就可能出问题。
为什么?
再看两部汉语词典对“荤”的释义。北京商务印书馆 2005 年出版《现代汉语词典》第五版:
荤 1.指鸡鸭鱼肉等食物(跟‘素’相对);2.佛教徒称葱蒜等有特殊气味的菜;3.指粗俗的、淫秽的。
荤菜 用鸡鸭鱼肉等做的菜该词典中对“素”的相关释义是“:蔬菜、瓜果等食物,(跟‘荤’相对)。”台湾商务印书馆 1982 年出版《重编国语辞典》第六版:
荤 1.谓有辛臭气味的蔬菜;2.称肉食。
荤菜 肉食品的通称前面提到,确定系统中的对立成分说来容易,做起来往往相当复杂,有时候是因为系统的范围不容易界定,有时是因为对立的成份不容易确定。同一个词甚至可以在同一句话中跟不同的成分产生对立,这种现象随处可见。举个例子“中华民族是一个由 56 个民族组成的大家庭”“,中华民族”中的“民族”和“56 个民族”中的“民族”显然不是同一个层次上的概念,分别与不同的其他成分构成对立关系。上面两部汉语词典的释义中都用了“肉”这个词,但在《现代汉语词典》的定义中,“鸡鸭鱼肉”四个词是并列关系,“肉”同“鸡鸭鱼”对立,可以是猪肉、牛肉、羊肉等,由这四个词构成的并列词组与“素”对立。注意“鸡鸭鱼肉”四个词不能理解为偏正关系,说的不是“鸡肉、鸭肉、鱼肉”.在《重编国语词典》的释义中,“肉”是许多食品的统称,跟蔬菜对立,应该包括鸡鸭鱼等等。同一个词语可以用在不同层次上,分别与不同成分产生对立,这是语言现象复杂性的一个表现方面。
接着研究英语 meat 的释义。我查阅了最有代表性的六部英语词典,下面是有关释义:
1)Oxford English Dictionary(OED 1989):
3.a. The flesh of animals used for food; now chiefly in narrower sense = butch-er's meat, flesh n. 4, in contradistinction to fish and poultry. Also, local U.S., con-fined to certain types of meat, usu. Pork.
这种用法的 meat 同鱼和禽类对立。
2)Collins Cobuild English Language Dictionary(Collins 1987)MEAT: flesh taken from an animal that has been killed so that people cancook it and eat it.
ANIMAL: a living creature such as a dog, lion, monkey or rabbit, rather than abird, fish, reptile, insect, or human being.
根据这部词典的定义,meat 主要指哺乳动物的肉,禽类、鱼、爬行动物(如蛇、龟、鳄鱼等)等一般不算。
3)Longman Dictionary of Contemporary English(Longman 1978)MEAT: 1. the flesh of animals, apart from fish and birds, which is eaten; 2.
the flesh of animals, including birds but not fish, as opposed to their bones.
这本词典明确地将鱼和禽类排除在外。
4)Longman Dictionary of American English 4thedition(Pearson Education Limited 2009)MEAT: the flesh of animals and birds eaten as food, | red meat (=dark meatsuch as beef) | white meat(=pale meat such as chicken)这部词典将禽类包括在内。
5)The American Heritage Dictionary of the English Language 3rdedition (Houghton Mif-flin 1992)MEAT: the edible flesh of animals, especially that of mammals as opposed tothat of fish or poultry.
这部词典认为 meat 主要指哺乳动物的肉,同鱼和禽类相对。
6)Webster's New World College Dictionary 4thEdition(Wiley Publishing 2004)MEAT: the flesh of animals used as food; esp, the flesh of mammals, and,sometimes, of fowl.
主要指哺乳动物的肉,有时也可以包括禽类。
综上所述,所有六部词典都将鱼排除在 meat 之外,这应该没有什么争议。OED、第二、第三和第五部词典将禽类也一并排除在 meat 之外,但第四、第六部词典则认为 meat 有时候也可以指禽类。
回到我们开头讨论的英汉对译问题,我们现在可以得出结论,“荤菜”译为“meat dishes”,有可能引起误解。某人说“I don't want meat dishes”,你可以上鱼,或许还可以上禽类,因此,如果某人说“我不要荤菜”,你将这句话译成“I don't want meat dishes”,说英语的侍者完全可能给他上一条鱼,或是一块鸡肉,那就违背该人的意愿。如对方是持戒甚严的宗教人士,则可能会造成很大的误解与不悦。前面所说的误译,就是侍者根据译员所说的“I don't want meatdishes”,给一位前来出席正式招待宴会的居士端来一块鱼。
上面所举的所有例子都说明一个问题,要准确地理解有关词语的意义,首先要确定它所位于的系统范围,然后确定同它呈对立关系的其成分。
下面我们讨论搭配,英文是 collocation.我们在传统语法分析中区分各个层次,字、词、短语、句子、话语等等,由下而上,层层组合为越来越大的结构。这儿有个问题:搭配也是一个语言单位,但不容易归入我们习用的这些结构单位。事实上,汉语中还没有一个为大家所广泛接受的术语,用来专指这种语言单位,有人称之为“组合”,有人称之为“搭配”,我们现在就暂时用“搭配”这个术语。作为语法单位,词和短语的区别为,短语是词的语法组合,只要符合语法规则,不合语义和逻辑的词组合在一起都能构成短语,如“五条边的四边形”,而搭配既涉及到语法关系,又涉及到语义关系,最重要的是涉及到无法完全由语法和语义规律解释的习惯用法。例如,“小张嫁给了”,后面的宾语一般得是个男的,语法上有这个限制吗?没有,语法上可以是任何名词。再举个例子,“遛”如用作及物动词,后面一定是个动物,如“遛狗”、“是骡子是马,拉出来遛遛”.他带个孩子在街上散步,你不能说“他遛孩子”.语法上有这个限制吗?没有,但用作及物动词的“遛”,习惯上只能带某一小类宾语。一个词对哪些成分哪些词能与它同现,有一定的偏好,很难完全将其归之为语法或语义因素使然。通过不同语言的比较,我们可以对搭配缺乏充分理据看得更为清楚。汉语中说“违法”,英文相应的词语是“打破法律”(break thelaw);汉语说“刷牙”,英文中跟汉语一样“brush the teeth”, 但德语和意大利语用的动词是“polish”,就是“擦鞋”的那个“polish”,磨光擦亮,波兰语是“洗牙”,俄语是“清洁牙”;汉语说“吃药”,英语中的“药”medicine,可不是用来 eat 的,得说“take medicine”,这其中并没有多少理据可言。词语和习惯与它同现的语言成分,构成我们所谓的搭配。对说母语的人来说,搭配是习以为常的现象,大概是太习以为常了,在语言学研究中长期没有受到应有的重视,语言学家大都没太拿它当回事情。
相比其他许多语言现象,搭配问题的研究历史不长。最早提出这种现象值得深入研究的人是英国首位普通语言学讲座教授、伦敦学派的代表人物 J. R. Firth, 他在 1951 年发表的一篇文章“Modes of meaning”中建议使用“collocation”这个术语指称有关现象,并同时提出“搭配度”、“搭配性”(collocability) 的概念。这篇文章后来收入他 1957 年正式出版的论文集中(Pa-pers in Linguistics 1934-1951, Oxford University Press, pp. 190-215)。 Firth 文章中指出,有些词语因为惯常同其他某些词语连用,因此获得本身词义之外的其他意义。他首先举出的例子有“ass”,因为前面最常用的形容词是“silly”(蠢)、“obstinate”(顽固)、“stupid”(笨)、“awful”
(糟糕),结果该词单独使用时也通常附着这些负面的意思。Firth 指出,因这种搭配而获得的意义是词语在横向组合平面上的抽象现象,与从概念或思维的角度研究词语意义没有直接关系(meaning by collocation is an abstraction at the syntagmatic level and is not directly con-cerned with the conceptual or idea approach to the meaning of the words. p. 196)。Firth 的传人 M. A. K Halliday 1961 年发表的“Categories of the theory of grammar”一文给出了更为系统和准确的定义(该文收入 On Grammar,by M. A. K. Halliday, edited by J. Webster, 2002,London: Continuum, pp.37-94)。Halliday 认为,搭配涉及到的是词语在横向组合平面上的联系,可以在文本中定量分析为,成分 a、b、c 等在与成分 x 相距 n 个词语的位置上出现的概率(… the syntagmatic association of lexical items, quantifiable, textually, as the probability thatthere will occur at n removes (a distance of n lexical items) from an item x, the items a, b,c … p.61)。该文发表五十多年了,我认为上面这段文字仍然是对搭配现象最言简意赅的定义之一,非常准确,操作性很强,同时引进了纵向聚合关系平面上的因素。我们现在有了许多大文本的语料库,研究词语的搭配及搭配性的强弱就更方便了。
如何确定词语与其他某个成分是否构成搭配?如何决定词语之间搭配性的强弱?我们只能根据“系统中的对立”来回答这些问题。首先,我们确定系统的范围,可以是包含各种文本的综合语料库,也可以根据时间、地域、体裁、作者、内容等等划出有关文本的特定范围;呈对立的成分,一是词语 a 和词语 x 从单纯概率分布来看应该在一定间距内共同出现的次数,二是它们在文本中实际共现的次数。为了举例说明,我利用英国 Lancaster 大学的汉语语料库(Lan-caster Corpus of Mandarin Chinese),研究“吃”和“粥”这两个词与其他词语的搭配关系。该语料库目前开放给公众使用的部分共有 100 万字,由 500 篇文本组成,每篇文本约 2000 字。“吃”
在这 100 万字的语料库中一共出现了 478 次,“粥”出现了 18 次,我将共现间距定在前三个字或后三个字,结果请看下面的表格:
先看表中给出的词频,“吃”在 100 万字中一共出现了 478 次,“饭”出现了 100 次;接着是预期搭配频次,指的是如果单纯根据概率,“饭”在“吃”前三个字和后三个字间距内出现的预期次数应该是 0.286,一次都不到;再接着给出的是实际出现次数,高达 45 次,LL 是 390.42,说明预期出现次数和实际出现次数的差异绝对不是偶然现象,这组数据就是“吃”和“饭”构成搭配的坚实证据。正是文本中预期同现频次与实际同现频次的对立,决定了两个词语是否构成搭配,决定了它们搭配性的强弱。同理,“亏”在 100 万字的语料库中一共出现了 20 次,根据概率分布“,亏”在“吃”的前三个和后三个字以内出现的次数应该是 0.057 次,0.1 次都不到,但实际上出现了 10 次,LL 为 89.47,可见“吃”和“亏”也是搭配性很强的组合。其他三个与“吃”实际搭配次数最多的词分别是“粥”、“面条”和“药”.
根据该语料库的检查结果,与“粥”搭配性最强的有两个词,一是“吃”,二是“喝”,“吃粥”的搭配性反倒强过“喝粥”,这个结果同我的预想不一样。我的语感是北方人,尤其是北京人一般都说“喝粥”.我判断这个现象至少可能由两个因素造成,一是“喝粥”是个比较口语化的词语,该语料库所收文本以书面语语体为主,口语化程度不高;二是许多文本的作者为南方人。这再次提醒我们,分析系统中的对立成分时,该系统的范围和性质对于分析结果会有很大的影响。
搭配问题很值得我们深入研究,它有很高的实际应用价值,也有很重要的理论价值。先说实际运用价值,搭配在外语教学和计算机自然语言处理领域里占据十分重要的地位。我们读学生写的外语作文,一般只要五分钟,便能看出他们语言水平的高低。一般不是看语法,现在有语法检查程序(grammar checker)能自动改正语法错误,主要看词语搭配,一般情况下,没有十年二十年的功夫,很难达到接近本族人语感的那个水平。研究搭配问题,应该会大大有助于我们的语言教学。
IBM公司八十年代投入大量资金,研究包括机器翻译在内的计算机自然语言处理。研究人员当时主要分两大类,一是语言学家,二是计算机技术专家。语言学家一般走的是自五十年代开始的老路,根据语法/语义/词汇的有关规则,将文本分解成词、短语、句子等语言单位进行加工处理。计算机技术专家大都熟悉数据库技术和统计学工具,对语言学家的语法规则不感兴趣,惯用方法往往是利用统计学工具分析海量的双语数据库,以词语搭配和对应频率等统计数据为基础进行语言处理。语言学家所用方法进展缓慢,而随着计算机储存和处理能力的突飞猛进,基于大数据统计方法的语言处理系统效率越来越高,现在成了该领域里的主流,而基于传统语言规则的处理方法则被许多人摈弃。九十年代IBM负责机器翻译的Frederick Jelinek据说说过一句后来广为流传的话:“我每解雇一位语言学家,我的系统表现都会有所改善。”
迄今为止,语言学家所做的语言分析大都是集中在语法规则,如单位、切分、层次、组合、结构等等,侧重组字成词、组词成短语 / 句子 / 话语等逐层向上的规则。随着对搭配现象和其他语言现象(如构式语法 construction grammar 研究的问题)的深入研究,以及包括机器翻译、机器学习在内的计算机自然语言处理领域所取的成果给我们带来的越来越多的启发,我们也许有必要对语言学传统的研究途径作深入的反思,我们研究了多年的基于由小及大、层层组合原则的大量语言规律,到底在第一语言习得、语言使用、外语学习、计算机自然语言处理等等同语言有关的过程中起着什么样的作用,有许多问题值得我们重新思考。近一二十年来, 包括从事语料库研究在内的一些语言学家提出所谓“惯用语原则”(idiom principle)及类似的观点,为语言研究提供了许多新的思路。
最后,我们来讨论“系统中的对立”是如何用在句法分析中的,我们的分析对象是汉语中的主题句,又称双项名词句。
语法研究领域里有一些核心问题,这些问题的研究结果有助于深入理解许多其他相关问题,或是引出新的重要研究课题。具体某个语言里基本句式(canonical clause)和非基本句式(non-canonical clause)的区别就是这类核心问题之一。例如,肯定句和否定句相比,肯定句是基本句式,否定句是非基本句式。英语中主动句和被动句相比,主动句是基本句式,被动句是非基本句式;基本句式和非基本句式的区分标准不止一条,各个语言也可以有所不同。一般来说,非基本句式往往能转换为相应的基本句式,而基本句式则不总是有相应的非基本句式。
英语主题化句(topicalized sentence 或 topicalization) 指的是下列“NP+NP+VP”形式的句子(1)a 和(2)a:
(1)a This house, he likes very much.
b He likes this house very much.
(2)a That cake, Jack won't eat.
b Jack won't eat that cake.
英语主题化句是非基本句式,在纵向聚合关系平面上都有一个相对应的“NP+VP+NP”基本句式,即(1)b 和(2)b.在诸多语法理论模式里,主题化句由相应的基本句式转换而来,转换是个语法运作过程,所以有“主题化”这个术语中的“化”字。主题化句“NP+NP+VP”总是和一个相应的基本句“NP+VP+NP”呈对立关系,由此用来表示一些特殊的语义或话语功能,如对比等等。
我在《汉语双项名词句与话题 - 陈述结构》(《中国语文》2004 年第 6 期)一文中指出,同英语“NP+NP+VP”不同,汉语“NP+NP+VP”是一种非常普通的句式,有的著作将其称为“主谓谓语句”,有的称之为“宾语倒装句”,我采用的是“双项名词句”这一不带强烈理论内涵、相对中性的术语。我将这类句子归为七类:
(3)a 有的人,他活着别人就不能活。
b 这几本书你读得很仔细。
c 那几个人我见到了。
d 这笔钱你交学费。
e 那个角落我想放一盏灯。
f 啤酒你忘了付钱了。
g 小赵胆子大极了。
也有一些著作,尤其是用英文写的讲汉语的著作,把这类句子看作是汉语的主题化句,我不赞成这种观点。原因很简单,上面讲到,英语每一个“NP+NP+VP”主题化句都对应一个“NP+VP+NP”基本句,这种对立在汉语中基本不存在。上面例(3)中有哪几个句子第一个 NP 能够移到 VP 后面的?没有几个:a 句不行;b 句要移位就变成“你读得很仔细这几本书”,像初学汉语的外国人说的汉语,不合汉语语法;c 句移位成“我见到了那几个人”可以说;d 句移位成“你交学费这笔钱”,不通;e 句要变成“我想放一盏灯那个角落”,不太像中国人说的话;f 句变成“你忘了付钱啤酒了”,不能说;g 句移位后变成“胆子大极了小赵”,不合语法。能说这七个典型的“NP+NP+VP”双项名词句是经过主题化转换而来的吗?显然没有任何证据能支持这种观点,现代汉语里基本上不存在与“NP+NP+VP”双项名词句相对立的“NP+VP+NP”句。
《汉语双项名词句与话题-陈述结构》一文讨论的另一个发现是,汉语中虽然基本上不存在“NP+NP+VP”同基本句式“NP+VP+NP”的对立,但对双项名词句来说,存在“NP1+NP2+VP”和“NP2+NP1+VP”的对立、即第一个名词和第二个名词是否转换语序之间的对立。例(3)中除了两个 NP 同指的句,其他六句,第一个名词和第二个名词顺序都能颠倒。这就是说,有“NP1+NP2+VP”,一般就有相应的“NP2+NP1+VP”,两种句式在纵向聚合平面上呈对立关系。同英语主题化句一样,对立带来了新的意义,主要是对比意义。以上面例(3)b、d、g 三句为例:
(3)b 这几本书你读得很仔细。 →b' 你这几本书读得很仔细,那几本就读得不是太仔细。
d 这笔钱你交学费。→d' 你这笔钱交学费,那笔钱零用。
g 小赵胆子大极了。→g' 胆子小赵大极了,小李不怎么样。
两种句式比较,不带特殊意义的原句式是基本句式,带特殊对比意义的变换句式是非基本句式。
另外一个重要的问题是,两个 NP 以什么顺序在 VP 前出现构成基本句式?什么顺序构成非基本句式?该文发现,汉语双项名词句这种句式本身可以是汉语中的基本句式,也可以是非基本句式,取决于两个 NP 的语义属性以及它们在下面这个优先序列上的相对位置,如果 NP2在这个序列上位于 NP1的左边“,NP1+NP2+VP”构成基本句式,否则构成非基本句式。
施事 > 感事 > 工具 > 系事 > 地点 > 对象 > 受事我们用上面的 b 句来说明这条规律,原句式中,NP2“你”是施事,NP1“这几本书”是受事,在上面的序列中,NP2施事位于 NP1受事的左边,因此原句式是基本句式。变换后的句子中,NP2“这几本书”是受事,NP1“你”是施事,NP2受事在上面序列中位于 NP1施事的右边,因此变换后的句式是非基本句式。d 和 g 的分析类此。我在该文中逐一检验了所有相关的双项名词句,全都符合这条规律。如前所述,双项名词句基本句式和非基本句式是纵向聚合关系平面上的对立成分,通过分析呈对立关系的两种句式及其相互关系,我们对汉语双项名词句的构成和使用特点有了进一步的认识。
总结一下,我们今天首先介绍了索绪尔结构主义理论的要点,用“系统中的对立”概括索绪尔理论思想的精髓,接着以确定系统中的对立成分和因素为主要分析方法,选取了词、搭配和语法结构三种语言单位,通过分析它们在横向组合关系和纵向聚合关系平面上有关成分和因素之间的对立,揭示这些语言单位的语法、语义和语用特征。