摘 要: 方言具有地域性、稳定性、反映性, 对方言的识别能有效刻画出犯罪者的地域属性和社会属性, 进而辅助案件侦查。然而, 从当前方言识别技术、运用主体以及方言本身的角度来看, 方言识别在侦查应用中存在许多困境。基于推进方言识别在侦查应用中的水平, 提升公安机关打击犯罪的能力的需要, 对方言识别侦查困境进行细致分析并提出可行的优化策略势在必行。
关键词: 方言识别; 侦查应用; 优化策略;
语言学应用于侦查领域, 产生了言语识别这一门新的刑事技术学科, 方言识别就是其中的一种, 它在为侦查提供线索和方向, 推动案件侦破方面发挥了巨大的作用, 其重要性日益凸显, 但其在侦查应用中却存在些许困境。因此, 对方言识别在侦查应用中的困境进行分析, 提出方言识别应用于侦查领域中的优化策略, 这对促进案件方言识别工作的科学化和高效化是十分有必要的。
一、方言识别的基本概述
(一) 方言识别的概念
方言, 又称“语言的地域性变体”, 也就是我们常说的地方话。目前, 我国汉语方言大体可分为七大方言区, 即北方方言、吴方言、湘方言、赣方言、客家方言、闽方言和粤方言。此外, 方言区可以分为若干个次方言, 每个次方言包括若干小片和方言点, 构成十分复杂多样。作为语言分化的结果, 它在语音、词汇、语法方面具有与其他亲属方言明显的差异性, 能反映出说话者的社群特征和个体特征, 且它的言语特征在一段时期内具有很强的稳定性。
方言识别, 就是利用方言的差异性、反映性以及稳定性, 根据言语人的方言口音特征或书面语特征, 来推断言语人地区或籍贯的一种刑事技术手段。它包括地域方言识别和社会方言识别两个方面。地域方言识别是基于不同地域分支下语言的差异性产生的, 社会方言识别则是基于社群的不同性质下语言的变体而产生的, 这包括由职业的不同、社会阶级的不同, 受教育程度的不同, 宗教信仰的不同等因素导致的语言的变体。对方言的识别工作可以从语音识别、词汇识别、语法识别三个层面开展, 语音即方音, 词汇可分为基本词汇和一般词汇, 语法即语句的组织规则, 包括词法和句法两大类。
(二) 方言识别的方法
1. 语音识别
汉语方言的差异性, 主要体现在语音的差异性上, 对汉语语音的识别是案件方言识别的重点, 一般来说, 语音识别工作包括:一是对平舌音和翘舌音的比较。比如北京话中的翘舌音“zh”“ch”“sh”与平舌音“z”“c”“s”有着明显的区别, 长沙话及大多数南方地区则都为平舌音, 没有“zh”“ch”“sh”的发音。二是对前鼻音和后鼻音的比较。北京话中金 (jin) 与京 (jing) 相区别, 但是在贵阳、武汉、昆明都为前鼻音“in”的发音, 在太原、南京则是后鼻音“ing”的发音。三是对边音和鼻音的比较。边音字即以“l”为声母的字, 鼻音字则是以“n”为声母的字, 在北京方言里边音和鼻音区分较为明显, 而长沙话则将二者混用, 比如说“南京”一般发成“蓝金”。四是对犯罪人的书面用语进行语音分析。方言语音的不同导致部分方言用字的不同使侦查人员从犯罪人的书面材料中进行语音识别成为可能, 如广州方言里的“真考” (巧) , 上海方言里的“好展” (转) 等。
2. 词汇识别
方言的词汇识别即对案件言语材料中具有地域性和社会性特征的词汇进行分析, 达到识别的目的, 并以此来判断犯罪人的籍贯或其社会身份情况。它包括对方言、隐语、黑话、俗语、方音字、特殊地名及区域常用字等的识别。一般而言, 词汇识别工作包括:一是对同形异义词的识别。比如“话”这个词, 在北方是名词, 但在广州, “话”字不仅可以作名词用, 还可以作动词“说”用。二是对同义异形字的识别。比如对萤火虫的叫法, 普通话叫做“萤火虫”, 厦门叫“火金姑”, 成都则叫“亮火虫”。三是对因地理环境的不同而形成的特殊词的识别, 比如普通话里的“洗澡”, 在广州话里说是“冲凉”, 在厦门话里则叫做“冲水”, 类似的还有广州话里的“唔” (不) “咗” (了) “细佬” (小孩) “云吞” (馄饨) 等。四是对从外地借入的词进行识别, 由于历史原因, 部分地区吸收了一些外来词并把它们逐渐演变成带有地域特色的方言词, 如广州的“巴士” (大巴) “的士” (小汽车) , 其来源就是来自于英语, 还有如厦门的“洞葛”, 来自于马来语, 这些都可以为我们进行方言识别, 进而为确定犯罪人的相关信息提供依据。
3. 语法识别
方言的语法识别就是通过对案件中的言语材料进行语法分析, 识别犯罪人的方言语法特征, 从而推断出犯罪人的籍贯、曾经生活过的地区或其文化程度的识别方法。语法识别工作主要从语序结构进行分析。北方话的状语常放在谓语之前, 如“多看一会儿电视”, 状语“多”在谓语的前面。而广州、潮州等地的方言正好与北方方言相反, 状语放在谓语之后。例如广州方言里的“帮我执下台唔该 (麻烦帮我收拾一下桌子) ”、潮州方言里的“食加一碗 (多吃一碗) ”都分别将状语“唔该”“加”分别放在谓语“帮”“食”之后。
二、方言识别在侦查中的作用
(一) 为侦查提供线索和方向
基于方言的差异性、稳定性和反映性的特征, 作案者在进行犯罪活动时遗留下来的言语材料往往能够体现出犯罪人的地域属性, 即犯罪人的籍贯, 居住地或者曾经流窜过的地区。通过对这些言语材料的分析和识别, 可以缩小案件侦查范围, 为犯罪侦查提供线索和方向。例如, 在2013年10月3日, 察右后旗锡勒乡的韩某在出门方便时被一个蒙面劫匪抢劫, 案发现场除了留有劫匪使用过的木棒、抽过的烟蒂等物证外, 再没有其他线索, 侦查工作难以展开。后来, 民警得知劫匪在作案时说了一句乌兰察布市当地方言“一推一个六二五”, 以此判断犯罪嫌疑人极有可能为察右后旗人。经过大量工作, 警方锁定了犯罪嫌疑人安某并将其抓获, 经审讯, 安某对抢劫韩某一事供认不讳。由此看来, 在侦查工作中, 不仅要对传统的物证材料进行收集, 还要对作案者的言语材料进行收集分析, 这样, 才能更好地为案件侦查提供线索和方向。
(二) 确定犯罪人的真实身份
作案者在犯罪时遗留下来的言语材料除了能够体现他的地域属性外, 还能体现出他的社会属性, 即犯罪人的文化水平、年龄、职业等。通过对这些信息进行分析整合, 能够很好地对作案者进行“画像”, 确定犯罪人的真实身份。在文化水平方面, 文化水平较低的人在书写过程中通常会不自觉的表露出其方言习惯, 易出现多错别字、标点符号单一且错误多的现象。在年龄方面, 年轻人用词一般追求个性, 内容多直来直去, 较少伪装。而反观中老年人作案, 在语言文字、内容上多带有伪装, 存在较为定性的思想体系。在职业方面, 则体现在各行各业所使用的行话、术语、黑话、隐语上。
(三) 为并案侦查提供依据
并案侦查, 是指侦查机关将疑似同一个犯罪主体 (同一个或同一伙犯罪嫌疑人) 所实施的若干起刑事案件合并起来开展侦查的措施。案件主体的同一性与案件的系列性是并案侦查的基本条件, 案件特征的相似性或者物证痕迹的关联性是准确认定并案侦查的前提。通过对不同时间、不同地点发现的言语材料的识别并结合相关案情, 仔细分析、认真比较, 看是否存在相似性或相同性, 并对相似的特征开展多方向、多层次的查询, 进而为并案侦查提供言语方面的依据。例如, 安徽省淮南市陈某手机被盗, 窃贼经常半夜打骚扰陈某家人。一个月后, 警方在当地抓获了疑似盗窃摩托车的石某, 在对石某进行审讯时, 民警发现石某说话的口音、语气与之前陈某家人提供的电话录音相似, 于是将两起案件进行串并, 后经侦查, 犯罪活动果然系石某所为, 石某交代了犯罪事实以及另外两起入室盗窃案。
三、方言识别的侦查困境
(一) 犯罪人言语的伪装性和混杂性突出
在公安实践中, 作案人在犯罪活动中的言语特征一般是矛盾的。一方面, 为了使犯罪更加隐密、混淆视听以及出于藏匿自身的需要, 作案人会对言语进行伪装, 改变正常的语言习惯。通过说另外一种方言、写别字、使用隐语、暗语、行话是犯罪人进行言语伪装的常用手法。另一方面, 由于人的社会性, 一个人的言语特征会随着他的居住地的变动、职业的变动、生活的改变等因素不断变化着。且因为我国经济在区域间发展的不平衡性, 加之现代交通运输技术的不断进步, 人口的流动性大大加快, 方言间的“交流”也日益密切, 这使得个人言语的混杂性更加突出。作案人在犯罪时, 他所表现出来的言语特征可能同时混杂了几个地方的方言特征。比如口音的混杂、方言词汇的混用、语法规则的变换等, 给案件方言识别工作增加了困难。
(二) 我国方言情况复杂多样
我国历史悠久、幅员辽阔, 形成了众多的地方方言, 加之特殊的国情和特定政策, 方言情况更加复杂多样, 这对案件方言识别工作无疑是一个巨大的挑战。首先, 我国方言种类构成复杂多样。我国汉语方言可分为七大方言区, 方言区又可分为若干个次方言, 次方言下面还有若干小片和方言点。方言不仅存在南北方的差异性, 有时同一城市不同区域的方言都不一样, 造成方言识别种属鉴定困难。其次, 人口迁徙和民族混居加速了方言的交流与融合, 一个地方的方言具有了其他地方或民族的语言特点。比如, “闯关东”时期, 受人口迁徙的影响, 东北方言吸收了大量的河北、山东方言词汇, 同时, 多民族聚居的地域情况使东北方言带有满语、蒙语、锡伯语、鄂伦春语等语言的特色, 使方言特征十分混杂, 极易误导方言识别工作的方向。最后, 普通话的推广使方言识别工作环境变得更加复杂。不同地方的人在说普通话时表现出来的言语特征可能十分相似, 且当言语人的普通话十分标准时, 侦查人员几乎不可能从言语检材中获取有价值的信息。
(三) 基层公安方言识别的专业性不足
地域性, 方言最显着的特征, 它是方言识别最重要的依据之一, 同时它也是方言识别工作最大的瓶颈, 这表现在侦查中就是基层公安方言识别的局限性, 即他们对本地方言比较熟悉, 对外地方言则欠缺专业性了解。作为案件方言识别技术的使用主体, 专业性不足问题很容易导致不知如何识别、识别难、识别错的情况发生, 当案犯是流窜犯时, 这种情况就显得更加突出。另外, 方言识别工作需要具备一定的语言学功底, 而公安工作的性质决定了他们对语言学知识的学习只能浅尝辄止, 加之基层工作强度大且并不是每一个案件都需要使用方言识别技术, 基层民警对语言学知识的学习就显得更加力不从心。缺乏了语言学知识作基础, 方言识别工作往往达不到应有的效果, 反而容易在主观的判断下造成重大失误, 把案件导向另外一个错误的方向。最后, 由于方言是不断变化发展的, 就要求办案民警在公安工作中不断关注新的研究动态, 学习新的方言识别理论, 掌握新的方言识别技术。但在实际情况中, 一些办案民警对方言识别技术的了解和运用仍局限于多年前学习的理论, 这就极易导致办案民警对方言的识别跟不上现实发展需要的情况, 造成侦查被动的局面。
(四) 当前公安领域的方言智能识别技术应用度不高
目前, 对于案件中出现的言语材料, 公安机关往往倾向于人工识别, 即利用课本的理论知识对言语材料进行识别或单凭多年来积累的经验进行方言识别。这种识别方法受识别者的主观意识的影响比较大, 缺乏十分的准确性。而基于智能化的方言识别技术却能利用其精确的算法和严格的程序设定将方言识别结果客观、合理、精确地呈现出来, 是方言识别发展的趋势之一。但是, 它在公安领域的应用度却并不高。形成这种情况的原因一是方言识别作为侦查手段的一种, 它的结果必须具有高度的准确性, 一旦稍有偏差, 可能会将侦查人员引向一个错误的方向, 而当前的方言智能识别技术还有待完善, 无法满足侦查办案的需要。二是目前的经济发展需求促使社会资源倾向于商品服务领域, 各公司的语音识别技术得到了巨大的发展, 如科大讯飞语音识别软件、迅捷语音云服务等, 而公安领域对言语智能识别技术的投入与研究开发则远远落后于各科技公司的投入与研究开发, 产出的科技成果也并不多, 这就在一定程度上限制了方言智能识别技术在案件侦查中的应用。
四、方言识别侦查应用的优化策略
(一) 挖掘言语人方言本质特征
由于犯罪人言语的伪装性和混杂性, 使得其言语特征归属存在明显的不一致。侦查人员这时就不能将犯罪人的言语特征进行简单的归纳总结, 必须利用各种识别途径, 深入挖掘其方言本质特征。虽然人的言语特征受居住地的变动、职业的变动、生活经历的不同会发生一些变化, 但是反映言语者言语习惯的本质特征并不会改变。侦查人员可以利用这一点, 对犯罪者的言语特征进行筛选, 保留那些稳定的、本质的言语特征, 去掉那些可伪装的、易变的非本质言语特征。这就要求识别人不仅要从语音、词汇、语法等方面开展识别工作并使各个部分相互验证, 还必须结合相关案情、案发现场情况、案发现场周围情况、痕迹物证等进行比较和分析, 最后挖掘出言语人的方言本质特征。
(二) 构建方言识别互助机制
我国方言情况复杂多样, 决定了公安机关对方言的识别工作不可能是单向的, 必须加强与外界的交流与协作, 这时, 构建方言识别互助机制就十分必要。方言识别互助机制, 指的是在方言识别过程中, 公安机关之间以及与其他机构之间为推定作案者的地域属性和社会属性而采取的协同配合行为。方言识别互助机制的构建在流窜性、跨区域性犯罪背景下具有更加重要的意义。对它的构建可以分为内部互助机制和外部互助机制。内部互助机制指的是不同地区公安机关之间的方言识别协作, 侦查人员可以将难以识别的方言检材放在专门的公安方言识别论坛上, 异地公安可以对这些方言检材进行识别, 当确定是自己所属辖区内的方言时, 可以立即与提供检材的公安机关进行线上联系和共同分析, 获取作案者的相关信息。外部识别机制指的是与语言学研究机构的方言识别协作, 由于方言的伪装性和混杂性, 有时异地公安机关也难以对作案者的方言检材进行识别。这时就必须借助专门语言学研究机构的力量, 通过与一些语言学研究机构建立保密、长期的合作, 使研究机构对方言检材进行专业化处理, 分离出能反映犯罪人言语习惯的本质特征, 并从中提取与犯罪人相关的信息, 为案件侦查提供线索和方向。
(三) 培养复合型公安语言学骨干
方言识别技术的运用主体是基层执法民警, 加强对基层执法民警的方言识别技术的普及度无可厚非, 但对方言识别技术的学习是一个大量、反复且基础性非常强的工作, 过度强调普及度不仅达不到预期的效果, 还会浪费大量的公安物力、财力和时间成本, 但对复合型公安语言学骨干的培养却是方言识别工作能够真正取得成功的关键之一。对他们的培养, 首先, 很好地解决了专业技术水平的问题。其次, 对专门人才的培养促进了公安内部的分工, 方言识别工作更加高效。最后, 它是现行体制下唯一具有现实可行性的方法, 大大节省了公安的物力、财力和时间成本。在培养机制构建上, 应该既注重对语言学和刑事侦查学相关理论和技术的教授, 还要注重对其他相关学科的教授, 如文字检验学、逻辑学、社会学、心理学等, 使对此类专门人才的培养成为一个系统的、综合的工程。另外, 他们还应掌握现今犯罪的特点和规律, 因为方言识别是一个主观与客观相结合的过程, 只有将理论与实践中犯罪的特点和规律相结合起来, 才能使方言识别始终处于良性循环中, 促进方言识别工作的科学化与高效化。
(四) 加强公安领域方言智能识别技术的开发
随着方言日益复杂化, 单凭课本理论和经验式的人工识别很难充分发挥方言识别在侦查工作中的作用, 粗放式的方言识别无疑是对公安资源的浪费。在这种情况下, 把方言识别工作的重点从传统的人工识别转移到智能识别上来显得极为迫切, 即通过加大对公安领域的方言智能识别技术的资金投入和技术研究, 构建出智能化的方言识别系统。实现这项任务的关键, 一是设立公安智能识别技术的专项研发项目并将它给委托给企业。同时, 可以利用民用语音识别技术成果, 缩短研究进程, 加快公安领域方言智能识别技术的研发和系统升级。二是充分利用地区警力优势, 建立地方公安的方言词汇数据录入机制, 并将这些数据上传到公安领域方言智能识别系统终端, 实现方言数据的储存、检索和共享。三是将把方言智能识别技术与方言识别的实践应用结合起来。将从案件中获取到的方言数据或分析总结及时录入到公安领域方言智能识别系统终端, 弥补单一的方言词汇录入形式的不足, 使方言识别更具实践操作性。公安机关还可以利用这些数据间的关联、对比实现案件的串并, 大大提高了侦查的效率。
公安实践中, 对方言的识别工作往往涉及多学科的运用, 它不仅需要深厚的语言学功底, 同时还要掌握刑事侦查学和其他学科的相关理论和技术, 作为侦查手段的一种, 它在公安实践中发挥着日益重要的作用。科学地运用方言识别技术不仅能为案件带来突破口, 提升侦查的效率, 更能节省警力资源和破案成本, 使公安工作朝着良性循环的方向发展。然而, 当前的方言识别工作正面临着许许多多的困境, 也将不断迎来新的挑战, 因为侦查工作中, 方言识别所识别的对象是复杂多样且不断变化的, 我们应当不断发现并分析问题、寻找识别对象的规律, 灵活地应对困境与挑战。
注释
1 刘萍, 王长亮, 王品肖.言语与犯罪[J].贵州警官职业学院学报, 2006 (3) :95-96.
2 岳俊发.言语识别与鉴定[M].北京:中国人民公安大学出版社, 2007:35.
3 嫌犯蒙而抢劫同乡一句方言助警方破案[EB/OL]. http://lawsocial. nmgnews.com.cn/system/2013/11/05/011201078.shtml, 2013-11-05.
4 许细燕, 杨辉解.侦查措施[M].北京:中国人民公安大学出版社, 2015:131-132.
5 淮南市公安局.淮南警方利用声纹技术破获刑事案, 在全省尚属首例[EB/OL]. http://www.ahga.gov.cn/jhjs/201511/26090543g31h. html. 2015-11-26.