一、引言
长期以来,语法教学占据了外语教学的核心地位,而伴随着语料库语言学的发展,研究者开始重新审视词汇在语言教学中的地位和作用〔1〕.当下,主流的外语词汇教学注重意义的方法(meaning-based approach) ,教师偏重外语词汇意义的讲解,而忽视其用法以及在使用中的意义建构; 在教学素材上,教师遵循理性主义(rationalism) 语言观,将内省生造的语句当作例句来讲解,而这种语句反映不出词汇真实的使用情况,而且授课时以教师单方面的讲解为主而较少与学生互动。这些都将制约外语词汇教学的合理性与效率。语料库语言学的发展带来了外语教学理念和范式的转变,语料库研究学者何安平认为,词汇教学是语料库资源和研究手段应用于外语教学时间最早和成果最多的一个领域〔2〕.在此本文拟探讨语料库驱动下的外语词汇教学的理论基础,并以英语词汇教学为例来分析语料库在外语词汇教学中的应用。
二、术语的界定
在语料库语言学阵营中存在若干不同的研究方法,主要包括语料库指导的方法(corpus-informedapproach) 、基于语料库的方法 (corpus-basedapproach) 以及语料库驱动的方法 (corpus-drivenapproach) .以上三种方法中对语料库的依赖程度不同,目的也存在一定差异〔3〕.语料库指导的方法间接地把语料库信息运用于教学尤其是教学材料的编写中,语料库主要起到指导性的作用; 而基于语料库的方法是一种"假设验证法"(hypothesis-testing) ,研究者根据现有语言理论提出假设,然后到语料库中寻找实例验证假设; 在语料库驱动的方法中,语料库处于绝对地位,研究者对语料库中的语言现象进行归纳分析,得出语言使用情况的假设或新的结论,因此该方法是一种"探索/描述法",基本程序是"观察-假设-归纳-理论整合".从以上分析可知,基于语料库的方法从某种意义上讲是传统研究的延续,只是其使用的数据是源自语料库中的真实数据。与之不同的是,语料库驱动的方法则摆脱任何已有理论,通过解读语料库中大量真实的数据来揭示语言鲜为人知的规律,因此这种方法体现了语料库研究崭新范式的精神实质。鉴于此,我们将语料库与外语词汇教学相结合的全新教学方法称为"语料库驱动的外语词汇教学".
三、语料库驱动的外语词汇教学理据
语料库驱动的外语词汇教学理据主要来自两个方面: 一是语料库语言学带来的崭新的语言观,包括基于频数的语言观和词项中心语言观; 二是现代教育理论中的建构主义教学观。
1. 基于频数的语言观
语料库语言学的研究成果为人们带来了有关语言本质和语言教学的新观念,其中包括基于频数的语言观,即语言使用的频繁程度影响语言的结构、意义和功能。对语言使用频数的关注体现了语料库语言学与乔姆斯基(Chomsky) 语言学对语言研究目的的不同见解,即有关"可能性语言"(languageas possiblity ) 还是"概率性语言 "(language asprobability) 的争论〔1〕.语料库语言学认为语言描述(或理论) 的目的是解释哪些语言现象是"很有可能的"(What is probable) ,换言之,其研究对象是"概率性语言",即研究语言的使用问题。而乔姆斯基语言学感兴趣的是哪些语言现象是有可能的(what is possible) ,其研究对象是"可能性语言",也就是语言能力或语言系统。由于乔姆斯基语言学以解释人们的语言能力或语言知识为研究目的,语言学家在阐明语言规则时就通常根据直觉和内省来自我构建语句,但他们不太关注创造的语句是否可能运用于现实语境。一些日常交流中几乎不可能出现的怪诞句子常被当作研究对象,如乔姆斯基着名的 Colorless green ideas sleep furiously 这例就经常被分析。这句话是符合语法的,但是这句话却违反语义规则而不可被接受。相对于乔姆斯基语言学注重语言能力的描写,语料库语言学认为语言系统是从具体的语言使用中概括获得,并通过语言使用具体呈现出来的,因此从语言系统及其使用两方面来进行语言描述就十分合理了。在语料研究方面,语料库语言学关注的是语言的运用,研究对象是反映语言实际使用情况的例句,这种对语言运用的重视也使得计算机语料库语言学为语言描写增添了概率分布的视角(distributive perspective) .语料库研究揭示出了不同词汇在语言中的使用频率存在巨大的差异这点,如为数不多的词汇占据了文本的绝大多数内容,而且越来越多的语料库研究证据显示了哪些词汇和语言现象是最有可能被语言使用者遇到的,从而最值得在教学上投入时间〔1〕.
可见,语言的分布信息可以影响外语词汇教学的内容,通过将精力集中于语言的常规使用而非例外,教师则可以帮助学习者提高外语习得的效率。事实上,受到"基于频数的语言教学观"的影响,国外研究者已经提出外语教学的"词汇大纲",认为外语教学首先要从目标语中最频繁出现的词汇及其最核心的意思和最常用的搭配入手〔4〕.
2. 词项中心语言观
与"基于频数的语言观"密切相关的是,语言的正常运用中存在相当数量重复出现的预制结构或型式,而且这些再现的语言型式具有"习语性"而非生成性。这表明在组合轴上,词汇的组合不仅依赖句法-语义规则,还要遵循语言社团潜在规定的制约因素。因此,Sinclair 提出了语义在文本中产生的两条原则: "开放选择原则 "(open-choiceprinciple) 和"习语原则"(idiom principle)〔5〕.前者认为语义构建是"空缺填补"(slot-and-filler) ,文本被视为一系列"空缺",由满足局部限制条件的词汇来填充,在每一处空缺几乎任何词都可能出现。而后者指出语言使用者具有大量的半预制性语块(semi-preconstructed chunks) ,尽管这些语块看似可以进行成分分析,它们却通常作为一个整体在使用。至于两者的关系,Sinclair 认为通常的文本大多是经历了非词汇化、通过"习语原则"的运用构成的,只是偶尔转向"开放选择原则".该论断的一个佐证是,语言中的高频词的词义往往难以确定,换言之,这些高频词的词义具有很大的附属性,导致人们只能谈其用法,不能谈其词义。因此,"习语原则"也改变了传统语法将单个词视为语言中最小表义单位的观点,取而代之的是词项(lexical item) 作为构建语言意义的最基本单位。
Sinclair 提出意义体现于多个词及语法结构共选(co-selection) 构成的短语(词项) 之中,因此词项(lexical item) 是一种高于单个语词、扩展性的语义单位〔6〕.五种类型的共选关系构成了词项的组成成分: 其中必选共选关系为核心词(core) 及语义韵(semantic prosody)〔6〕.核心词为研究者的观察中心,是不变的量。语义韵体现说话人/作者的态度、意图或感情取向,决定整个词项的意义以及其余四类共选关系的选择。其他三个可选共选关系包括:
(1) 词汇搭配(collocation) ,指核心词与其他词语的共现,通常前后间隔不超过 4 个词; (2) 语法搭配或类联接(colligation) ,指核心词与语法结构的共现,主要是语法词类的频繁组合; (3) 语义偏好(semantic preference) ,指与节点词共现的、具有相同语义特征的一组词,它关注惯常搭配词的语义特征或类别。Sinclair 提出了词项四层意义关系的描述框架: 第一层关系是词汇搭配,第二层关系是语法搭配或类联接,第三层关系是语义偏好,第四层关系是语义韵。以上四层关系抽象程度逐层递增,词语搭配关注的是与核心词搭配的单个的、具体的语词,类连接关注的是搭配词的语法类别,语义偏好关注语义的相似而不管词类如何,语义韵则散布于多个词的范围内,是形成整个词项意义的决定因素。
通过以上分析可知,作为语义的单位,词项打破了词汇与语法之间的隔阂,集结构和功能于一体〔3〕.在结构上,词项可以是惯例化的短语(conventional phrases,包括完全固定的习语和相对灵活的惯用词组,即词汇搭配和语义偏向) ,还可以包括非连续的语法型式(如 it is + adj. + that. . . 即语法搭配或类联接) ; 在功能上,词项还具有语用功能(即语义韵特征) ,包括抽象的说话人意图及交际功能。词项的提出使得传统上语法-词汇的对立得以消解,取而代之的是语法型式与词汇结合的词汇语法(lexical grammar)〔6〕.在外语教学上,"词项中心语言观"产生了词汇中心教学法这一理念〔7 ~8〕,其主要特点是在教学中要充分认识语言是通过结构功能一体的各种词项连缀而成的,而不是将孤立的单词或句子作为语言的基本学习单位。
3. 建构主义教学观
建构主义(constructivism) 教学观是在批判和发展传统教学观的基础上形成的。侯万春认为,建构主义理论的形成受到了瑞士儿童心理学家皮亚杰(Piaget) 的认知发展理论、维果斯基(Vygotsky)的历史文化心理学理论、奥斯贝尔(Ausubel) 的意义学习理论以及布鲁纳(Bruner) 的发现学习理论的影响〔9〕.皮亚杰用图式、同化、顺应、平衡四个基本概念来阐述个体认知结构的活动过程,他认为学习过程就是经由同化和顺应、不断产生新图式的过程。建构主义强调主体与客体相互影响的一元论观点,而"建构"作为建构主义理论的第一规则,由冯·格拉瑟斯菲尔德(Von. Glasersfeld) 在 1984 年提出。他认为人对知识的获取不是被动地接受,而是由认知主体主动建构的。这一观点表明认知的过程是主动的、是个体或个人的,而有意义的学习只能是根据个人的先前知识或经验,通过个人积极地探索来完成。
传统教学观则否定能动性和主动性在学习中的作用,不能认识到两者对学习者多方面的影响,如认知方式、学习动机、情感和价值观等。因此,传统教学中教师传授是主流模式,学生则是知识的被动的接受者,他们在学习过程中对知识的获取是机械的和被动的。建构主义突出学生在学习过程中的中心地位,这意味着学生将从被动接受外部刺激者和知识的灌输对象转变为主动参与、发现、加工信息的主体和知识意义的主动建构者。
与此同时,教师则由知识的传授者、灌输者转变为学生学习的指导者、促进者和活动组织者。就外语词汇教学而言,我们认为只有在教学中摒弃词义加例句这种注入式的方式,以学生为中心,让学生在教学中主动学习,主动构建自己的外语词汇语义和用法知识,才能提高外语词汇的运用能力。
语料库驱动的方法是一种"探索/描述法",受这种方法的影响,Johns 提出了"数据驱动学习"(DDL,data driven learning) 的理念〔10〕,将语言学习者作为研究者,教学遵循"观察-假设-归纳-理论整合"的程序,这符合建构主义教学观提倡的探索学习精神。
四、语料库驱动的外语词汇教学应用
语料库语言学和建构主义教学观为语言教学提供了新的理念,但任何语言教学理念的实施和应用都应该结合日常教学实际进行适应性协调。因此,语料库的资源和技术要进入课堂教学也必须经历教学加工。何安平认为语料库的教学加工有两个层面: 一是对语料库作为教学资源的加工,主要指利用语料库进行的教学活动设计; 二是语料库作为教学手段的加工,这涉及语料库辅助课堂教学的实施技术和教学效果评估等〔11〕.语料库驱动的外语词汇教学在实施时要考虑以上两个方面。
(一) 教学设计
语料库语言学倡导基于频数的语言观和词汇-语法合一的短语理念,而语料库特有的词频表、语境共现等技术手段为词汇深度知识的探究性学习提供了可操作、可观察的方法和步骤。以词频为基础,按照从词汇到短语的观察思路,我们可以利用语料库辅助外语词汇教学的以下几个方面: 1.词项教学; 2. 近义词辨析教学; 3. 指导学生利用语料库开展写作自主纠错。
1. 词项教学
词项理论揭示的是,意义的单位通常不是一个词,而是兼有形式和功能的多词单位。换言之,当语词表达某一意义时,它总会与某个词或某类词搭配,通常会出现在某种语法型式(pattern) 中,而且时常具有特定的语用功能。因此,外语词汇教学中孤立地教授语词的形、音、义以及少量词组是远远不够的,应该将重点放在反映词汇知识深度的典型用法(即语法型式或类联接) 与搭配上,进而观察、分析其语义韵。计算机语料库技术为以上词汇知识的实现提供了便利条件。语料库特有的语境共现界面能够批量地呈现目标词的使用语境,并由此带出目标词与周围的词共建短语词块的词汇搭配范式、语法范式、语义功能以及语用功能等。例如,教师在进行 brink 一词的"边缘"意义的教学时,可以检索 BNC(英国国家语料库。BNC 作为当代英语本族语语料库可以展示当代英语中词汇的真实使用情况) ,从而得到以下该词作为节点词的语境共现行(KWIC Concordance,即呈现节点词所在语境的索引行,见图 1) .
通过分析索引行,我们可以得出该词的典型用法和搭配,可知 brink 常用于 on/to the brink of 这一典型短语结构中,其搭配词往往表达的是不太好的事物,通常搭配 old age,bankruptcy,war,distraction等。因此可以断定该词往往表达消极的语义韵,使用这类词通常表示将有坏的事情发生。当然,在实际教学中,因英语本族语语料库很庞大,教师不可能对每个单词都分析,否则会大大增加备课量,因此有学者建议语料库检索可以和学习词典结合使用〔3〕.当代英语学习词典是利用语料库编纂而成的,词典提供了每个单词概括好的典型意义和用法,而且教师还可以利用语料库找到更为典型的例句,特别是那些适合学生实际水平的以及个性化的例句。
2. 近义词辨析教学
近义词辨析是外语词汇教学的一大难点。在传统教学中,教师通常采用"定义加描述"的方法对工具书中近义词定义的描述进行比较,并辅以翻译和少量例句来区分近义词。这种做法有一些弊端,因工具书的解释过于抽象,而且缺乏足够的实例,因此学习者很难真正把握近义词之间的区别,在产出方面更是难以做到胸有成竹〔12〕.但词义一般是通过语境体现出来的,因此分析语境是辨析近义词的有效方法。语境指在宏观上语词出现的语域,也指微观上语词所处的词汇句法环境。语料库所提供的丰富的实例、词频分布信息及其特有的语境共现功能,为近义词辨析及其教学提供了新的思路。
可用如下方法利用语料库进行近义词辨析: (1) 统计近义词在语料库不同语域中的词频分布差异;(2) 统计近义词的显着搭配词,通过其搭配规律,总结其类联接、搭配偏向以及语义韵等语言特征的差异,从而达到区分近义词的目的。例如,happen 与occur 是经常容易混淆的词,我们首先要考察这一组词在不同语域中的词频分布差异,利用 COCA(美国当代语料库) 的分语体检索功能可以得到答案。COCA 语料库可以提供检索词在 SPOKEN(口语语体) 、FICTION(小说语体) 、MAGAZINE(杂志语体) 、NEWSPAPER(报纸语体) 以及 ACADEMIC(学术语体) 五种语体中的出现频率。经查询可知,happen 在口语语体中出现的频率是每百万形符(token,相当于单词) 295. 05 次,在所有语体类型中最高; 而 occur 在学术语体中出现的频率是每百万形符(单词) 107. 04 次,在所有语体类型中最高.
因此,happen 主要用于口语体中,而 occur 则更多用于学术或正式文体中。
而且,我们还可以考察两个词的搭配差异。利用 Sketch Engine(A. Kilgarriff 设计的在线语料库索引工具) 的"词语速描"(word sketch) 功能,可以获取特定词的词汇搭配以及语法搭配特征。
在词汇搭配上,happen 的典型主语为 accident,incident,tragedy,attack,change 等; occur 的典型主语为 error,incident,death,event,thought,reaction,phenomenon 等。可以看出,happen 的搭配词通常是表现出消极趋向的语义词,而 occur 搭配的词在词义上则更为宽泛,且多为抽象名词。
在语法型式(pattern) 上,happen 主要用于三种结构: (1) happen + to + verb(如 And it happens tohave come all right. ) ; (2) it + happen(如 but it justhappened that there was also a scratch side ) ; (3 )happen + Prep + N / Pron + V-ing (如 So what ishappening to the tape being produced in Wrexham?) .而 occur 常用的三种结构是: (1) occur + Prep + N/Pron + V-ing (如 Or had that transition occurredwithout her noticing it?) ; (2) occur + Prep + wh-(如Similar strata occur in what is left of the WestphalianCoal. ) ; (3 ) there + occur (如。 . . there occurred ademocratization in funerary beliefs. ) ,可见两者在用法上也有差异。
语料库驱动的方法通常将近义词的区别以定量的方式呈现出来,因此在一定程度上比工具书中抽象的解释更能有效地区分近义词。在实践中,教师不用直接分析大型本族语语料库中提供的索引行,而是直接可以利用一些在线网络搭配程序进行简单查询,如可以用 Just The Word(一免费词汇搭配查询网站) 和 Sketch Engine 等进行查询,它们可以更为便捷地获取词汇的搭配信息。但应注意这些搭配程序通常是针对某个语料库开发的,语料库中的语料是否具有代表性会影响分析的结果。此外,在近义词辨析上,语料库驱动的方法与传统的辨析方法是相互补充的。语料库可以提供充足的实例来说明问题,能有效引导学生的自主学习; 传统的辨析工具(如纸质词典) 则突出对词语的定义、用法的阐释,因而在确认词语定义、总结归纳用法方面则更具优势。
3. 写作自主纠错语料库驱动的外语词汇教学还可以辅助学生解决外语写作中的词汇使用问题。其教学设计是,教师标注出学生习作中的词汇使用问题,学生则借助语料库索引行的例句,发现和总结错误的原因。在这种自主纠错过程中,语料库起到了旁观者和批判者的作用,因此 Tim Johns 将其称之为"观棋者"(Kibbitzer) 活动〔10〕.如学生作文中有以下句子:For my personal sense,Hester is a magnificent womanfighting for …… 教 师 在 批 阅 中 会 发 现 For mypersonal sense 表达不准确,于是将其标出反馈给学生,并指导学生学会检索语料库,以便自主纠错。
如在 Webcorp. 在线语料库以 for my personal sense为关键词进行检索会得到图 2 展示的结果。通过分析可以观察出 for my personal sense 经常和 of 搭配使用,表示某人对某物的理解,而非"在某人看来"之意。因而学生作文中误用了该表达,应该改为 For my part 短语。
在传统的学习活动中,学习词典的使用较之语料库驱动的外语词汇教学更为普遍,但学习词典存在两个方面的不足: (1) 典型例句不够。纸质学习词典由于受篇幅限制不能提供足够的例证,尤其是"复杂结构"例句收集的就更少。例如,in the sensethat 这一结构常见于正式的(或学术) 文体中,但在单语学习词典以及双语词典中都没有这方面的例证,学生只能查询语料库,或"有道在线词典"(该词典以网络抓取为技术支持,本质也是在线语料库) ,以获取足够的例证来把握这类结构的用法。(2) 滞后性。一些最新的词汇在普通词典甚至在传统语料库中很难检索到,即使检索到,也只有有限的例句。而 Web 语料库能够检索到最新的词汇,并提供丰富的语境〔13〕,因此,(网上) 语料库拥有传统词汇教学工具所不具有的优势,可以起到对学习词典的补充作用。当一些表达或语言点没有出现在学习词典(如: . . . cannot tell where . . . ends and. . . begins 等较为复杂的非连续性结构) 或没有充足的例证时,学生就可以检索语料索引行,从中得出正确的搭配和使用型式。而且,大多数语料库都支持通配符功能(wildcards) ,这就为查找外语表达式提供了极大的便利。
(二) 教学实施语料库驱动的方法为外语词汇教学提供了崭新的范式,但是将数据量庞大的语料库直接运用于外语教学中,还需考虑语料的适切问题。因为大型语料库在外语词汇教学方面仍有若干问题,如数据量庞大、语料来源混杂、不分难度和语言使用场合、教学加工费时费力〔14〕以及付费使用带来的共享困难〔13〕等问题。因此,在教学实施过程中,教师应该探索获取合适的语言素材的途径,这主要可从两方面进行: 1. 建立微型语料文本; 2. 自建个人教学语料库。
1. 创建教学微型文本微型文本(mini-text,minifile) 是通过检索工具从语料库中得到的包含一定数量索引行的文本,是大型语料库庞大的信息浓缩和聚焦〔3,11〕.获取微型文本的途径是进行科学抽样,即先对大型语料库进行检索,得到索引行后将其保存到一个文件中,然后从这些索引行中找出符合学生语言水平的典型的例句信息。在选取过程中,教师要考虑语例的词汇难度和语法难度,以适合学生的语言水平。选取的典型例句应该是少而精的、来自语料库,且涵盖各种词汇使用范式的索引行,将其保存为小型电子文本就可以应用于教学了。当然,必要时还可以对微型文本进一步加工,使每行语例具有完整的语义、调配索引行字体和颜色,以凸显局部语料特征,从而减少学生阅读负担。
在建设微型文本过程中,除了人工挑选索引行外,还可以利用语料库工具自动获取索引行。如Wilble 等就开发了 Lexical Difficulty Filter 工具,可以从真实的语料索引行中进一步筛选符合学生难度的例句〔14〕.受其启发,许家金等又开发了"基于语料库的例句提取工具(BFSU Sentence Collector1. 0 软件) ",该索引工具内置大学英语教材语料库与四级词表,能呈现含有检索词的整句; 另外用户可以根据句子长度和句子中的新词数(未出现在四级词表中的单词) 来筛选例句.索引工具的开发为微型文本的构建提供了便利,同时也促进了语料库成果向外语教学的转化。
2. 建设教师个人教学语料库个人教学语料库是为外语教师教学和其教学对象自主学习而建设的语料库。作为专门语料库(specialized corpus) ,个人教学语料库在外语教学中具有大型语料库无法比拟的优势,如: (1) 极强的教学针对性和实用性,语料的选择能充分考虑教学对象的需求; (2) 能及时更新尤其是时事、科技等语料; (3) 可灵活标注等〔11,15〕.因此,个人教学语料库比大型通用语料库更适合日常外语教学。
建设个人教学语料库核心要素是语料的选择、分类和整理。在语料选择过程中,教师可以考虑若干原则,包括语料的语域定位(口语、书面语) 、典型性(本族语者语料、题材的平衡等) 、时效性(反映当代语言规律) 、难度("可理解输入") 以及趣味性等〔16 ~17〕.至于语料的来源,则可以广泛取自报刊杂志、网页、电子文档以及电影字幕等资源; 收集的语料应按实际教学需要进行科学分类; 分类可适当参考一些大型语料库分类标准,但个人教学语料库有自己的特点,语料分类应以教师为主。此外,分类整理后的语料一般选择"纯文本"格式保存,文件名也应保持统一,并尽可能多地体现分类信息。为满足教师提取特定类型词汇的需求,在语料整理过程中还要进行语料的附码。考虑到个人教学语料库的实用性,除了提供常见的词性附码(Part-of-Speech tagging) 和句法附码 (Grammatical Parsing)之外,教师还可以根据教学需要并结合软件特点对部分语料做关于背景信息、主题或语篇类型、修辞等多方面的创造性标注。
此外,在教学实施中还应对教学效果进行评估。语料库应用外语词汇教学固然具有很多潜在优势,但是由于相当数量的学习者对语料库不甚了解,教学的效果势必会受到影响。因此,教师要定期对教学效果进行评估,以了解学习者在接触语料库时遇到的困难,进而分析原因并提出解决方案,这样才能不断提高语料库驱动方法的教学实施效率。例如,教师可以采取问卷调查或访谈的方式了解教学效果以及学生在使用语料库过程中遇到的困难。总之,探索语料库驱动的外语词汇教学不能止于理论探讨,更应解决实践应用问题,这样才能使这种新方法发挥最大作用。
五、结语
从理性主义到实证主义,语料库语言学的研究成果更新了人们对语言本质和语言教学的观念。
首先,语料库语言学对语言运用的重视为语言描写带来了概率分布的视角,从而揭示了语言的概率性特点。其次,语言的习语原则以及词项中心语言观推动了对意义单位的认识,消除了语言中词汇-语法的二分对立。此外,语料库驱动方法推崇的"探索/描述"法也符合现代教育理论倡导的建构主义教学观点。鉴于此,我们有理由相信语料库语言学将深刻影响外语(语言) 教学的内容和方法。但是,目前将语料库语言学直接运用到外语教学中还要解决若干实际问题,主要包括教学活动的设计以及实施,这也是亟待研究者和教师进一步思考的课题。