12月1日下午,语料库研究沙龙第八次活动在北京语言大学成功举办。本次沙龙的主题为“全球汉语中介语语料库标注规范修订稿与标注中的问题探讨”,由北京语言大学老师张宝林、李桂梅和学生何星慧主讲。
张宝林老师就“全球汉语中介语语料库标注规范修订稿”做了详细的说明。这次的修订稿是为了增加标注规范的实用性和规范性。张老师强调了标注的基本原则是只标不改,这是为了保持原汁原味的中介语。另外,与HSK动态作文语料库的标注有所不同的是,这次的标注采用多版标注,即一篇语料会有字、词、句、标点符号四个版本的标注,采用“偏误标注+基础标注”的标注模式,把研究提升到表现分析,为对外汉语教学研究者提供更丰富有效的内容。张老师重点强调了生语料的重要性。他指出,在正式标注之前,只有严格对照了原始语料,保证生语料与原始语料准确无误,是真正的中介语,后期的标注才是有意义的。在对照原始语料时除了要处理错字和无法识别的字,还要进行断句处理,即要区分单句,在句末加单句标记,这是标注流程的一大改进。在一些细节问题上张老师也做出了说明,如为保证隐私,语料中的人名全部用xxx代替等。
李桂梅老师就越南语料标注中存在的一些问题进行了讲解,指出标注员们还应更加认真仔细,严格分析语法。何星慧同学就前期标注阶段大家提出的问题做了总结梳理,分为操作指南、专业知识层面的问题和待商议的问题三个部分。参会的老师学生也就一些待商议的问题进行了热烈讨论,提出了自己的见解。同时,在QQ讨论组线上的老师同学们也都积极的发言,加入到讨论之中。
语料库研究沙龙由北京语言大学“全球汉语中介语语料库建设和研究”课题组、语言科学院、语言政策与标准研究所联合举办,每月举办一期,每次活动围绕一个专题进行讨论,旨在及时、方便地开展学术交流,促进汉语中介语语料库建设与应用研究的发展。欢迎关注语料库建设与研究的专家学者和研究生同学提出自己感兴趣的论题,作为沙龙的研讨主题。
此次沙龙沿用QQ讨论组和现场文稿演示的方式,这样不仅可以集合集体的智慧,而且克服了地理位置的局限,给广大语料库建设者与爱好者提供了极好的了解与沟通互动的平台。无论身处何处,只要有兴趣,语料库沙龙都随时欢迎大家的加入。请大家密切关注我们的相关活动。
研究沙龙网页:http://www.hanyu123.cn/html/c7/889.html

