作为全球语音科学界最负盛名的年度会议之一——国际语音通讯协会年会(INTERSPEECH2024)于2024年9月1日~5日在希腊科斯岛举行,北京语言大学信息科学学院智能语音习得实验室硕士生刘晓旺的《A Study on the Information Mechanism of the 3rd Tone Sandhi Rule in Mandarin Disyllabic words》(中文翻译:《利用大语言模型优化计算机辅助发音训练中发音动作的文本反馈生成》)以及钟辉航的《Leveraging Large Language Models to Refine Automatic Feedback Generation at Articulatory Level in Computer Aided Pronunciation Training》(中文翻译:《普通话双音节词连上变调的信息机制》)被大会录用,并在大会做了海报展示。
INTERSPEECH是国际著名学术协会国际语音通讯协会(International Speech Communication Association,ISCA)的年度大会,主要关注人类语言科技研究的诸方面,涵盖了语音学、语言学、语音工程研究及应用的最新进展。本届会议以“Speech and Beyond”(翻译:语音与超越)为主题,内容涵盖语音科学、语音识别、语音合成、语音增强、自然语言处理等多个领域。
Interspeech 2024 开幕式
刘晓旺同学的论文摘要内容如下:
声调在汉语中具有重要的辨义作用。在普通话连上变调中,上声变为阳平是否以及在多大程度上带来语义的混淆?先前从声学和感知两方面的研究未形成一个统一的定论。本文从语言的交际功能出发,探讨了变调上声对言语交际的影响。文章从词汇和句子两个层面考察了变调后词汇最小对数量、词汇相似度以及句子信息损失的情况。研究发现,在词汇层级,T3T3与T2T3在两个规模不同的词典中形成的词汇最小对的数量都最少;在句子层级,当T3与T2混淆后,无信息损失的句子数量最多,信息损失均值和排名都最低,表明T3与T2混淆造成的交际风险较小。这一发现为解释普通话上声连读变调的机制提供了新的视角。
刘晓旺同学的论文海报(Poster)展示
钟辉航同学的论文摘要内容如下:
本研究探讨了利用大型语言模型(LLM)改进计算机辅助发音训练(CAPT)中自动文本反馈生成的潜力。具体而言,评估了两个因素对自动生成发音反馈有效性的影响:(1)使用发音属性信息增强GPT-4模型自动生成反馈的帮助性(2)使用特定构造的数据集对大语言模型微调效果的优化。通过每种方法产生的反馈文本由第二语言(L2)学习者根据可理解性和有用性进行评分。结果强调了使用LLM进行发音偏误自动文本反馈生成的潜力和加入发音属性特征的有效性。
钟辉航同学的论文海报(Poster)展示
北语智能语音习得实验室的多位在国外高校继续攻读博士学位的往届毕业生,以及就职于北京邮电大学的高迎明老师(原智能语音习得实验室成员)也参加了此次会议。
北语智能语音习得实验室在读学生、已毕业校友参会合影留念
北语智能语音习得实验室(Speech Acquisition and Intelligent Technology Laboratory, SAIT)在长期的科研实践过程中一直致力于为二语语音教学提供更多、更优秀的智能信息技术,在实验语音学、二语习得及中介语语音库、语音语言建模、计算机辅助发音教学、语音识别与合成、语音情感转换等多个领域开展了广泛研究,承担了国家自然科学基金、社科基金、国家语委、语合交流中心、北语梧桐平台,以及多项企事业单位横向委托等众多课题,在二语语音习得及智能语音技术领域取得丰硕成果。实验室的三位老师在语言智能与技术、计算机科学与技术和语言学及应用语言学等多个学科中均有丰富的科研及教学经历,均在多个国内外语音领域核心期刊及会议中担任审稿专家。
SAIT实验室师生们将继续深耕语音领域,为二语语音教学提供更多研究成果和先进技术,为有志于科研的同学们提供更优秀的平台,资助学生参与更广泛的国内外交流。
欢迎关注北语智能语音习得实验室公众号,获取更多资讯!
(责编:陈思远)