近日,国家自然科学基金委公布了2020年度国家自然科学基金资助项目名单。今年我校共申报8项,获批3项,立项率37.5%。立项项目均为信息科学部面上项目,分别为:信息科学学院荀恩东教授的“中文意合图的表征与生成方法研究”、外国语学部官群教授的“运用语言知识分布模型构建基于具身语义关联机制的数据库-语料库-词汇学习的AI优化系统”和信息科学学院罗智勇副教授的“汉语小句复合体结构自动分析研究”。
近年来,我校非常重视国家自然科学基金项目的申报工作,曾多次举办申报专题讲座与经验分享会。这些培训工作起到了很好的效果,广大教科研工作者申报积极性及科研热情有较大提高,今年是近些年获得国家自然科学基金项目最多的一年,也是立项率最高的一年。
项目简介:
1. 荀恩东教授的“中文意合图的表征与生成方法研究”
语义分析是自然语言处理的核心问题,实现对语言的语义理解,首先面对语义分析的表征问题。表征时需要考虑三个方面:语言学上要有普遍意义、可计算性和易应用性。项目拟从汉语意合特征出发,采用意合图表征语义分析结果,用其承载多层面语义信息。在可计算性方面,以块依存文法为核心,在块依存关系基础上生成意合图。在意合图落地应用方面,融合符号计算与参数计算,在结构化基础上,引入语义资源、领域本体知识,实现与应用问题的对接。
2. 官群教授的“运用语言知识分布模型构建基于具身语义关联机制的数据库-语料库-词汇学习的AI优化系统”
本项目是语言教育、认知科学与信息技术学科结合的结果,旨在构建人工智能优化学习平台。本研究技术基础是建立在官群教授国内外合作团队的系列前沿学术科研成果之上,即语言分布性模型,它是一种用于认知计算、语料库语言学和机器学习领域中最适宜优化的分布式语义技术。本项目针对人工智能前沿命题,如何将分布式语义技术用于与感知觉体验的具身语义各行为与神经指标关联,实现人脑和电脑最佳结合的语言智慧生成机制。力争解决当前语言类教材、教学和人工智慧学习平台缺乏人脑和电脑互为印证的,具有行为神经联动指标的、数据为基础实证为依据的科学系统。
3.罗智勇副教授的“汉语小句复合体结构自动分析研究”
汉语从文字、词语、小句到句子等都与印欧语言有很大的不同。在小句和句子层面,汉语缺少话语范畴中小句和句子界定的操作理论,因而更缺少小句和句子自动分析的模型和算法。研究表明:汉语句子的切分问题、以及由小句成分共享关系导致的文本远距离依赖问题,仍然是深度学习方法在深层次中文信息处理中面临的困难。汉语小句复合体结构自动分析拟在小句复合体形式理论的基础上,以标点句为基本单位,以话头话体关系为基本线索,以汉语小句话头共享模式为形式约束,将汉语小句二维邻接特征等远距离相关性规律融入到机器学习模型中,研究汉语句子的边界识别、小句复合体层次结构分析、小句复合体内部话头话体共享关系识别,以及汉语小句动态生成机制。该研究将获得汉语小句复合体结构自动分析的计算模型和算法,使得对于给定的书面文本,机器能自动切分出小句复合体,拆分出小句,以便支持中文信息处理的深入应用。