第三章 留学生汉语时间结构表述方式的显性偏误考察
第二语言的习得是一个创造性过程,偏误分析作为一种语言学习理论,其原理主要是对学习者习得第二语言时出现的偏误进行收集、描述和分类,并通过分析偏误原因得出结论,以使教师了解学习者对目的语的习得情况和学习程度等,还可以预测学习者产生偏误的原因,从而提出解决对策。
本章确定以留学生时间结构表述方式为研究对象,基于汉语时间结构表述方式的本体研究,以 Coder(1981)制定的偏误分析步骤为依据,选取 HSK 动态作文语料库和专项调查测试中的语料,考察留学生时间结构表述方式的习得状况,对语料中出现的时间结构显性偏误进行筛选、鉴别和汇总,证实汉语时间结构的表述在留学生的习得中存在着一定的规律性,并尝试运用现代汉语基础知识和时间结构偏误的类别属性对每一类有代表性的、多发性的偏误进行分析,为对外汉语中时间结构表述方式的教学提供相应的现实依据。
3.1 基于语料库和问卷调查的留学生时间结构显性偏误考察
一、HSK 动态作文语料库中的语料收集与处理
1. 语料来源:本文研究的语料来源于 HSK 动态作文语料库。该语料库是针对母语为非汉语的外国人在参加高等汉语水平考试(HSK 高等)中的作文答卷,设置的专门语料库,隶属北京语言大学的汉办科研项目。语料中留学生涉及各个不同的国籍,作文语料上万余篇,包括原始语料和标注语料两种版本,其语料的加工处理包括对字、词、句、篇章及标点符号的处理。
2. 语料的归类统计:本文将 HSK 动态作文语料库(以下简称“语料库”)中的10740 篇留学生作文语料进行穷举式检索,对原始语料中具有时间结构表述问题的句子,以及在标注语料中对有关时间结构进行偏误标注的句子,按照七类时间结构的遗漏、误加、误代、错序、杂糅的偏误类型对偏误语料进行归类并记录,最后以时间结构类型和具体的偏误类型为纵横项建立表格,将归类记录的偏误句子逐项统计,并录入汇总,计算相关的偏误率。
二、问卷测试的语料收集与处理
1. 问卷测试的目的和考察内容:留学生对时间结构的掌握情况在一定程度上也反映出了时间结构的特点。为验证和充实语料,对留学生习得时间结构的情况进行调查十分必要。笔者根据 HSK 动态作文语料库中的七类时间结构偏误情况,采用问卷测试的形式对留学生习得汉语时间结构的状况进行了调查,以考察语料库中出现的七种时间结构的各类典型偏误,在问卷测试中是否均有呈现;各类时间结构的偏误量及偏误率数据是否与语料库的统计情况具有相似性。
2. 测试材料的设计:本次调查问卷共设测试题 37 道,考察内容涵盖了七类时间结构,每类中的不同偏误类型各设置题目 1 道,共分选择、排序、翻译三种题型。选择题是根据语料中时间结构的遗漏、误加、误代和杂糅现象,对留学生可能出现的偏误进行预测,设置 A、B 选项;排序题是针对语料中出现的错序偏误进行设置的;对于易受语际影响而形成的偏误,且在英、汉表述中没有与研究相关的对应时间词时(避免提示),设置了英译汉的翻译题型。题目大多选取语料库中最具代表性和典型性的偏误句进行改写,为避免同类时间结构语法规则的干扰或提示,测试题目以随机顺序呈现。
3. 测试对象:来自山东师范大学国际交流学院和山东理工大学国际教育学院的留学生,汉语程度为 HSK 中级及以上水平,被测人数为 50 人,母语分别为英语、俄语和韩语,年龄在 18-28 岁之间,男女比例较为均衡。
4. 测试方式:本测试采取闭卷测试的方式,设定测试时间为 45 分钟,要求被测试者独立完成试题,不得查询相关资料或进行讨论,学生可向老师请教与测试相关但与测试结果无直接关系的问题并获得答复。
5. 语料的收集:2013 年 12 月,笔者向山东理工大学国际教育学院和山东师范大学国际交流学院的留学生发放调查问卷共 78 份,收回问卷 57 份。其中 5 份问卷的答题空缺率超过半数,2 分问卷存在明显的答案不合理情况,皆被视为无效问卷。因此,纳入本次偏误研究的有效问卷共计 50 份。
6. 调查结果统计:分别以时间结构的类型和具体的偏误类型为纵横项,设置表格1,录入对应的随机试题题号。将 50 份问卷随机进行编号和试题批阅,以测试者(问卷)的编号和试题题号为纵横项,设置表格 2,根据正确答案,对留学生的测试结果进行记录。以时间结构的类型和具体的偏误类型为纵横项,设置表格 3,根据表格 1中对应的试题题号,在表格 2 中进行错误答案的筛选,并进行偏误率的计算和录入。
本文充分利用上述语料对留学生习得时间结构的显性偏误进行研究,以保证语料的真实性与平衡性、调查结果的全面性与科学性。
三、语料整理说明:
在语料整理中,和本文研究对象无关的个别数据与语料库中的原始语料有所出入,为便于分析稍加改动,但不影响数据统计结论,可以代表留学生时间结构表述方式的偏误情况。
3.2 留学生时间结构表述方式的显性偏误分布
虽然留学生使用时间结构的语料较常用的时间词表述方式明显偏少,但从整体来看,在表达时间概念时,时间结构方式必不可少,使用的偏误率也较高;经具体分析每类时间结构的偏误数据,发现留学生对其的使用频率存在明显的不平衡性,且偏误情况较多、偏误类型多样。笔者对语料库和调查问卷中的时间结构偏误分别进行了数据汇总,详见表 3-1 和表 3-2.
笔者在语料库搜集到含有本文所研究的七类时间结构表述方式的偏误语料共计686 例,每类时间结构的具体偏误分布比率不尽相同,从 2.7%到 26.7%不均等分布,七类时间结构均有遗漏和误代的偏误分布,而误加、错序和杂糅的偏误类型在某些时间结构中未有分布,详见表 3-1.
笔者根据语料库的偏误分布状况,进行问卷的设计和调查后,其偏误率的呈现状况与语料库的分布情况总体来说较为相似。方位词组合的结构、数名词组合时间结构、“时/的时候”和介词框架的时间结构偏误数量在时间结构表述偏误占据较高比例;而名词性定中时间结构、形容词组合时间结构和指示代词组合的时间结构偏误比例较小。从偏误类型来看,语料库中的显性偏误以遗漏和误代现象最为显着,而调查测试的各类偏误在每类具体的时间结构中比例不同。详见表 3-2.