11月15日,"十二五"国家科技支撑计划"三方工程中国语言资源有声数据库技术规范与平台研发"(2014BAK04B00)在北京通过了由科技部社会发展科技司组织的专家验收。该项目由教育部组织,我校和江苏省高校科技发展中心、清华大学合作承担,项目秘书处设在我校。
该项目以语言学科学理论为指导,以已有汉语方言和少数民族语言的研究成果为基础,为建成世界上规模最大、语料最丰富、技术水平最高的语言资源有声数据库开展顶层设计,围绕语言资源调查、保存、展示、开发和应用的技术规范、技术工具和技术平台的开展研究。
项目研发的行业技术规范标准,研制的语言资源采录、加工和校验技术工具软件,以及建成的中国语言资源采录展示平台,已经全面投入应用,并发挥重要作用。2015年,教育部、国家语委发布《关于启动中国语言资源保护工程的通知》,启动中国语言资源保护工程,项目成果直接服务于语保工程调查和建库工作。截至2017年9月,本项目搭建的“中国语言资源采录展示平台”已完成31个省(区市)共计620个语言资源调查点数据的入库,共收录音、视频数量分别达到195万、141万条,数据总容量超过25TB,并仍在持续增加之中,为全面掌握语言国情、科学保护各民族语言文字和弘扬传播中华优秀文化做出了重要贡献。