您当前所在的位置: 首页 -> 北语头条 -> 正文

北语研究生团队远程助力语言战“疫”

发布日期:2020-02-26  作者:汉语国际教育研究院 点击量:

为帮助外地援鄂医疗队解决医患沟通方言障碍,助力武汉及湖北其他地市抗击新冠肺炎疫情,在教育部语言文字信息管理司指导下,北京语言大学、武汉大学、华中师范大学、清华大学、首都师范大学、广州大学,以及商务印书馆、科大讯飞股份有限公司、传神语联网网络科技股份有限公司和湖北省语言学专家和信息技术专家迅速组成“战疫语言服务团”。

汉语国际教育研究院研究生导师饶高琦博士带领汉语国际教育研究院和语言智能研究院的研究生团队,参加了“战疫”攻坚。他们夜以继日,两个不眠夜,投入到“战疫语言服务团”的研发工作中。参与制作并发布《抗击疫情湖北方言通》。《抗击疫情湖北方言通》,包括微信版、网络版、融媒体口袋书、即时翻译软件、在线方言服务、视频软件等多种形式。服务团根据语料库统计和医用场景调研,遴选了156个词和76个短句,完成了武汉、襄阳、宜昌、黄石、荆州、鄂州、孝感、黄冈、咸宁(咸安)、大冶、恩施11地的方言和普通话的对齐音频。

 

在会战过程中,团队完全体现了“在家办公”和“远程协助”。从2月10日中午建立至2月13日成果初步上线,所有团员彼此都没有见过。完全通过微信进行联络沟通。期间还通过微信群召开音频、视频会议,部署任务。和我校语保团队进行数据交换,主要在百度云和金山云上。9个团队生产数据,4到5个团队使用数据,专人进行版本管理,并编写了若干perl语言脚本,提高文件管理效率,使数据生产分发有条不紊。

在制备各方言录音脚本的过程中,饶高琦博士和汉语国际教育研究院、语言智能研究院的研究生们在短时间内,迅速构建了一个袖珍新冠肺炎诊疗语料库。以相关医学术语为种子,利用问诊网站和文艺作品等资源,快速构建口语化的,问诊和护理场景必备的语句。利用关键词计算的方法,追踪武汉封城以来的媒体关键词。此外汉语国际教育研究院李琪同学还录制了恩施方言数据。

后期,为提供多样化宣传,团队也使用一些多媒体软件,对现有音频数据进行了批量加工。这些也都是服务团远程协作完成的。

在方言通推进的同时,饶高琦博士还带领团队参与到探索灾难环境中“应急汉语”的方案设计与研发工作中。饶高琦博士带领汉语国际教育研究院的2019级硕士索梦瑶、马穆萨和语言智能研究院硕士迟翔宇承担了面向外籍人士的语言使用情况调研和应急用简明汉语的基础词汇、短句扩充,疾病预防文档的简化等工作。

我校还有来自语言智能研究院、汉语国际教育研究院和语言科学院的研究生“参战”,期间她们也都不同程度上发挥了自己的专业特长。

自媒体运营:比如“战斗”第一天,汉语国际教育研究院2018级的夏恩赏同学是语言学微信公众号“汉语堂”的值班编辑。及时制作并刊发了齐鲁医院医疗队制备武汉方言手册的新闻,在语言学界获得了不小的影响(半天阅读量破2万),帮助“战斗”烘托了舆论氛围。

自然语言处理:来自汉语国际教育研究院和语言智能研究院的2018级研究生邰沁清、钱青青同学,在短时间内构建了面向新冠肺炎诊疗和护理的小规模语料库。语料库规模虽小,但并不容易,除了时间紧迫外,还要特别注重每个词和短句对场景需求的覆盖性,这并不容易。为了提高语料库在宣传和科普方面的效能。同学们还爬取武汉封城以来的报刊数据,卫生部门的公告数据,用多种算法分析了每天的关键词,以保障语言服务的效能。

 

数据管理和多媒体技术:为配合抖音等平台的宣传,邰沁清、钱青青和李琪同学还一起对音频数据进行了批量后期加工,体现出了较高的效率。

方言信息处理:配合来自语言科学院语保团队的同学,饶高琦博士带领李琪、钱青青、邰沁清等同学为方言录音的顺利采集和服务提供了很多帮助。并直接录制了恩施州方言数据。时间紧,数据量大,但同学们在关键时刻都冲得上,顶得住。

总的来说,这次战疫行动,一来需要研究生同学们高度的责任感和战斗热情、战斗毅力(多次通宵);二来也证明,语言学+信息技术的培养路线是当今国家和社会急需的。

 

 

 

 

分享到:

热点新闻

热点专题