一、研究背景
作文是学习者语言产出的重要方面,对作文的评估一直是国内外研究的热点,而对英语学习者和母语者作文的比较研究也由来已久。有关作文研究多涉及词汇、句法和内容三个方面。词汇即词汇的丰富性,包括多样性、复杂性、密度和错误;句法,包括T单位平均长度(MLT)、从句平均长度(MLC)、从句与T单位的比率(C/T)和从句嵌入的量;内容,包括文章切题性、论点明确性、说理透彻性、篇章连贯性。
近年来,研究者针对以上三方面对作文质量进行了深入的研究。在作文词汇和句法的综合研究方面,研究方法主要有纵向研究和横向研究。纵向研究考察一段时期内学习者词汇和句法的指标发展情况,但前期研究并不一致。有研究显示经过一段时间,英语学习者词汇复杂度和T单位长度显示出进步;有研究显示英语学习者词汇复杂度退步,T单位长度增加。横向研究考察不同语言水平组学习者作文中的词汇和句法指标的分析比较。
研究显示不同语言水平学习者作文词汇复杂度和句法复杂性呈上升之势。李长生比较了中国大学生和瑞典大学生英语词汇复杂度和句法复杂性的差异,显示中国英语学习者在词汇复杂度指标上高于或接近于瑞典同龄学生,但在句法复杂度的诸多指标上,瑞典大学生的表现比中国学生突出。
有关语篇连贯性的研究也多采用横向研究,考察英语学习者和本族语作文在连接词使用上的差异。
结果显示英语学习者使用连接词的频率在总体上高于本族语者的使用频率,非英语专业学习者过度使用某些特定连接词现象突出。这些研究表明,国内外从词汇和句法或是从篇章连贯性角度作为变量的研究较多,而将三者结合在一起,综合考虑其与作文质量间关系的研究较少,三方面结合将学习者作文和母语者作文进行对比的综合研究几乎没有。
由于前期对学习者作文的研究方面多集中在语言水平方面,因此,本研究拟以大学英语一年级学生议论文和母语者议论文为语料,利用单因素方差分析调查非英语专业学生不同语言水平对作文的词汇、句法和篇章连贯性不同程度的影响,并和母语者作文进行对比研究,以期较全面的探索学习者作文各指标发展变化的模式。
二、研究设计
1.研究问题
本研究主要考察三大问题:(1)不同水平英语学习者间以及和母语者作文在词汇复杂度方面是否存在显着差别;(2)不同水平英语学习者间以及和母语者作文在句法复杂性方面是否存在显着差别;(3)不同水平英语学习者间以及和母语者作文在语篇连贯性方面是否存在显着差别。
本研究假设为随着语言水平的提高,学习者作文的不同层面即词汇复杂度、句法复杂性和语篇连贯性三个层面也会有相应提高,同母语者作文相比,在这三个方面均有显着差别。
2.数据收集与整理
本研究收集英语学习者和母语者作文两类数据。英语学习者数据来自某大学非英语专业2012级一年级四个自然班120个本科生的同一命题议论文,作文题为Taking Care of Yourselves。作文由学生在句酷网上提交,时间为30分钟,长度要求为120~200词。学生可在提交后按句酷提示修改拼写、部分搭配错误和语法错误,研究者最终获得的是学生修改约6次后的作文。母语者作文数据选自肖美玲等1999年着《美国大学生作文荟萃》和王秋海1999年着《美国大学生作文选》。两本书收录了议论文和记叙文两种体裁的美国大学生优秀作文,文章的难度适中,语言地道,表达规范,适于作为我国大学生作文的参照语料。根据研究需要,从中分别提取11篇和14篇共25篇议论文作为参照语料库,文字材料由研究者自行输入电脑。
3.研究变量的操作定义与计算
本研究涉及三个因变量:词汇复杂度、句法复杂性和语篇连贯性。词汇复杂度是词汇复杂性(lexical complexity)研究选用最多的变量之一。词汇复杂性分为表层和深层两个维度。表层词汇复杂性包括词汇复杂度和词汇多样性测量指标。鉴于学生水平,本研究只选用表层指标中的词汇复杂度作为测量指标。
词汇复杂度测量低频词在文本中的覆盖率,它的值由文本中低频词类型数和总标记数的比值得到。
为保证数据的准确性,在计算词型数时避免计算同一个词的不同词型数,本研究中所用的数据均由在线削尾处理软件(CST’s Lemmatiser)进行削尾处理,再进行人工核对,以减少在线削尾处理的错误。
同一个 词 的 不 同 词 型 数 只 算 一 个,如see,sees,saw,seen视为同一个词型。因为二语组为大一学生,本研究参考鲍贵的定义,低频词为词汇统计软件Range32中一级词表以外的词。计算词汇复杂度的公式为:词汇复杂度=低频词词型数×100/每个文本的总标记数。
句法复杂性选取长度指标。长度指标包含T单位平均长度和从句平均长度。本研究选取T单位长度(T-unit length),因为它是常用的测量口笔语句法复杂性的指标。
T单位长度是每个T单位的平均字数。
T单位可以是一个主句(独立句)或由一个主句加一个或多个从属句组成。本研究由两名教师对T单位进行手工标注,如果两人存在差异,即进行协商直到达成一致。计算公式是:每个文本的总词数/T单位总数。
语篇连贯性采用连接词的数量作为测量指标。
连接词是一种形式标记,能够比较明显地反映语篇连贯性,因其易于识别和检索的特点而成为语篇连贯衔接研究的切入点。本文参照Quirk和赵蔚彬连接词划分类型:列举/递进(for example,and,furthermore,similarly,in addition,etc.);转 折(but,however,on the other hand,nevertheless,etc);因 果 (Therefore,so,because,in a word,etc.);时间/条件 (then,after that,an hour later,until,when,if,etc.)。研究由两名教师按连接词分类对连接词进行手工标注。如果两人存在差异,即进行协商直到达成一致。语篇连贯性的测量公式为:连接词总数×100/每个文本的总词数。
4.语言水平操作定义
120个一年级本科生在作文提交后一周进行了期中考试,本研究中二语组语言水平依据该期中考试成绩进行分类。试卷题型包括一篇快速阅读10题、词汇结构单项选择题40题、三篇阅读理解15题和一篇完形填空20题,满分100分。依据成绩将语言水平分为三组:低水平组38人,考试成绩在37~63分之间(M = 53.05,SD = 7.40);中等水平组41人,考试成绩在64~73分之间(M = 68.39,SD =2.88);高水平组41人,考试成绩在74~89分之间(M =79.76,SD= 4.00)。单因素方差分析发现,三个组的均值有显着差异 (F=276.00,p<0.001)。Scheffe事后多重比较表明,低水平组的均值显着低于中的水平组(p<0.001),中等水平组的均值显着低于高水平组(p<0.001)。母语者作文选用了美国大学生的优秀作文,因此能够代表最高语言水平,称作母语组。
三、研究结果
1.二语学习者不同水平组与母语组作文质量不同层面的描述性统计词汇复杂度、句法复杂性和篇章连贯性随语言水平变化的描述性统计结果见表1。【表1】
图1显示二语组和母语组词汇复杂度、句法复杂性和篇章连贯性各指标均值随水平变化的趋势。
图(a)显示,词汇复杂度均值在二语低水平、中等水平组之间差异很小,低水平、中等水平组和高水平组间有差异,母语组相对于高水平组增幅很大,说明二语组内随着语言水平的提高,低频词的使用略有增加;母语组相对于二语组使用了更多的低频词。图1(b)显示句法复杂性在二语组内随语言水平总体呈上升趋势,但中水平组比低水平组略有下降,高水平组比低、中水平组上升明显,母语组句法复杂性比二语组明显升高,说明总体上二语组内随着语言水平的提高,作文句子平均长度增加;母语组作文平均句子长度更长。图1(c)显示,篇章连贯性上,连接词的使用数量在二语组内随语言水平呈微弱下降的趋势,低水平、中等水平组之间差异很小,高水平组比低中水平组下降较为明显,而母语组明显低于二语组,这说明二语组内随着语言水平的提高,连接词的使用减少,母语组作文中连接词使用更少。【图1】
2.二语学习者不同水平组与母语组作文质量不同层面差异的方差分析误差方差Levene齐性检验发现,词汇复杂度、句法复杂性和连接词使用的F统计量均未达到统计显着意义(F1=1.20,p1 >0.05;F2=0.38,p2>0.05;F3=0.79,p3>0.05),说明不同语言水平组的方差相等,满足了单因素方差检验的方差齐性条件。
单因素方差检验结果显示,四组在词汇复杂度(F1= 46.02,p1 <0.001)和句法复杂性(F2=18.59,p2 <0.001)方面有显着差异;在语篇连贯性(F3=2.41,p3 =0.07)上没有显着的差异。由此认为语言水平是影响作文词汇复杂度和句法复杂性变化性的重要参数,即语言水平越高,作文词汇复杂度和句法复杂性也越高;语言水平不是篇章连贯性的重要影响因素。
采用Scheffe检验法,对词汇复杂度和句法复杂性的事后多重比较检验结果见表2。词汇复杂度在二语组间均没有显着性差异,但二语组与母语组间均有显着差异(p <0.001)。句法复杂性在二语中等、高水平组间有显着性差异(p <0.05),低、中等水平组和低、高水平组间没有显着差异。二语组与母语组之间均有显着差异(p1 <0.001;p2 <0.001;p3 <0.05)。
四、讨论
根据以上研究结果,我们得出如下结论:(1)词汇复杂度方面,不同语言水平英语学习者作文不存在显着差别,但和母语者作文存在显着差别。(2)句法复杂性方面,不同语言水平英语学习者中等水平组和高水平组间作文存在显着差别,低、中等水平和低、高水平组间作文不存在显着差别。不同语言水平英语学习者和母语者作文在句法复杂性方面存在显着差别。(3)不同水平英语学习者和母语者作文各组在语篇连贯性方面均不存在显着差别。
本研究证明了当初的部分假设,即随着语言水平的提高,学习者作文的词汇复杂度、句法复杂性和语篇连贯性三个层面都有相应提高;词汇复杂度和句法复杂性同母语者作文相比有显着差别;但语篇连贯性层面同母语者作文相比无显着差别。
词汇复杂度体现了文本中低频词的覆盖率,低频词汇不是学习者在某个水平阶段熟练掌握的词汇,因此,写作中低频词的使用比率可以反映学习者产出性词汇量的相对大小。研究显示,二语组低、中等、高水平组间,词汇复杂度均值从16.77上升到18.71,但语言水平对词汇复杂度没有显着影响。而母语者词汇复杂度均值为29.54,远高于二语组,语言水平对词汇复杂度有显着影响。研究证实随着语言水平的提高,学习者确实会在写作中更多的选用低频词。二语组三个水平组间词汇复杂度无显着差异的原因可能是二语组学生均来自大一新生,水平虽有差异,但不明显。金曦雯对英语专业三年级学生习作分析也得出了语言水平对词汇复杂度无显着效应的结果。而母语者作文选择美国大学生的优秀习作,与我国大一新生的语言水平有明显差异,所以这时语言水平对词汇复杂度产生了显着影响。鲍贵将非英语专业大二学生、英语专业一年级研究生和英语专业高年级分为低、中等和高水平组,这三个组间水平差异较大,研究也得出了词汇复杂性最能区分三个水平组英语学习者的作文之间词汇使用的差异的结论。因此本研究表明语言水平必须达到一定差异后才可能会对词汇复杂度产生显着影响。
本研究中,句法复杂性随语言水平总体呈上升趋势,二语组中等、高水平组间有显着性差异,母语组与二语组间均有显着差异。
Crowhurst发现加拿大某中学6、10和12年级母语学生议论文中W/T值的平均值依次为13.78、15.17和16.06。本研究中二语组低、中等、高水平组和母语组的W/T平均值分别为11.92、11.78、13.24和15.56,基本呈直线上升趋势(不考虑统计显着性)。说明随着语言水平的提高,学习者作文句子长度增加。这与鲍贵和赵俊海得出的结论一致。从W/T值的平均值看,二语组里低、中等水平组值较低,高水平组也比加拿大某中学6年级的的议论文中的均值低,说明二语组无论是低水平或是高水平组作文句子长度都偏短,还有待进一步提高。二语组中高水平组与中等水平组句法复杂性有显着性差异,说明虽同为一个学校同专业的学生,但学生间水平参差,低、中水平组学生(约占总人数的65%的学生)作文句长亟待提高。而英语句子长度的增加需要通过从属句、名词化短语、动词不定式短语、分词结构或修饰语等的增加实现,说明学生这方面的语法运用能力缺乏。
语篇连贯性指标连接词使用数量随语言水平提高呈下降趋势(不考虑统计显着性),但二语组间与母语组间均没有显着性差异。这一方面与赵蔚彬、梁茂成和李响等研究的结果有相似,即中国学生作文中连词使用过多;但二语组与母语组间均没有显着性差异,说明连词作为一种形式上的标记,英语学习者经过学习已经能够掌握这种形式标记。另一方面说明,二语组随着语言水平的提高,学习者能意识到过多使用连接词并不利于文章连贯性;二语组间无显着性差异和李响研究一致,该研究发现英语专业四个年级学生在连接词使用的总量上差异不明显,说明英专学生在连接词习得上变化不大。但统计中也发现,二语组作文中but,so,and,because和although等连接词明显使用偏多,陈鹏研究也显示非英语专业学生不论英语水平高低,存在过度使用特定连接词现象,即二语学习者使用的连接词标记的质量还有待进一步提高。总的说来,在不考虑统计显着性情况下,随着写作者语言水平的提高,作文中低频词汇产出量更大,句子更长,连接词的使用减少,这说明学习者语言水平和其作文中的词汇和句法产出是紧密相关的,语言水平高的学生,产出词汇量更大,句子也写得更长;而句子长就意味着在相同字数的文章内句子的个数就少,因此使用的连接词就少。
五、结束语
本研究以不同水平英语学习者和母语者作文为数据,探索了语言水平对词汇复杂度、句法复杂性和语篇连贯性的不同影响。通过比较,我们得出随着语言水平的提高,学习者作文的词汇复杂度和句法复杂性相应提高,而语言水平对语篇连贯性没有影响。
研究的不足之处在于英语学习者均是刚入学的大一新生,同质性强;只研究了议论文体裁,各组样本较小,且由于受条件限制,两种语料库的语料量不一,这就在一定程度上影响了结果的可靠性。
词汇、句法和语篇连贯性只各选用了一个测量指标。未来的研究可扩大取样的范围,对不同体裁的作文选用更多指标进行研究。
参考文献:
[1] 鲍贵.不同课程水平英语学习者词汇复杂性研究[J].解放军外国语学院学报,2011(2):55-60.
[2] 王海华,周祥.非英语专业大学生写作中词汇丰富性变化的历时研究[J].外语与外语教,2012(2):40-44.
[3]WOLFE-QUINTERO K,INGAKI S,KIM H Y.Second Lan-guage Development in Writing:Measures of Fluency,Accura-cy & Complexity[M].Manoa:University of Hawaii Press,1998.
[4]ORTEGA L.Syntactic complexity measures and their rela-tionship to L2proficiency:A research synthesis of college-level L2writing[J].Applied Linguistics,2003(24):492-518.
[5] 文秋芳.“作文内容”的构念效度研究———运用结构方程模型软件AMOS5的尝试[J].外语研究,2007(3):66-71。