您当前所在的位置: 首页 -> 北语头条 -> 正文

我校两项国家自然科学基金项目顺利结项

发布时间:2012-05-16  新闻来源:科研处 

  日前,我校两项国家自然科学基金项目通过鉴定,顺利结项。这两项课题分别为:宋柔教授主持的题为《汉语跨标点句句法分析方法研究》的项目;王治敏副教授主持的题为《面向机器理解的汉语隐喻计算研究与知识库建设》的项目。

   宋柔教授主持的课题对汉语微观篇章结构进行了分析界定、得出了一系列全新的研究对象,并分析研究了这些对象的形式模型以及这种模型的本质属性,为计算机处理打下了坚实的基础。此课题的相关研究成果及课题组所标记的40万字的话题结构语料库对进一步深化我校在此领域的研究奠定了坚实的基础。王治敏副教授的课题对汉语隐喻的句法表现、隐喻知识库的构造以及对隐喻的自动识别进行了全面考察和探索。此课题所展开的全新探索和研究成果将为后续汉语隐喻的系统研究创造良好条件。

  近日结项的这两项国家级课题具有一定的跨学科性质,对我校的课题申请和科学研究具有一定的导向和带动作用。课题所取得的成果不仅充实了我校的科研成果,也彰显了我校在计算机语言处理领域的优势和未来的发展潜力。

  项目简介

  宋柔教授《汉语跨标点句句法分析方法研究》:

  汉语微观话题结构在汉语语法学界已经研究多年,主要讨论话题-评述结构和话题链,但可操作性不强,对实际语料的覆盖面有限,因而难以为汉语的计算机信息处理所使用。

  本课题对于汉语微观篇章结构界定出一系列全新的研究对象,归纳出关于这些对象的形式模型以及这种模型的本质属性,为计算机处理打下了坚实的基础。主要成果包括:

  (1)提出标点句、广义话题、话题结构、话题句的概念。

  (2)归纳出话题结构的静态的嵌套性和动态的堆栈性,提出对各种体裁语料覆盖面达90%的堆栈模型,进而扩充为覆盖面达95%的流水模型。

  (3)提出流水模型的重要属性:话题的不可穿越性和话题句的成句性。

  (4)标注了40万字的话题结构语料库。

  王治敏副教授《面向机器理解的汉语隐喻计算研究与知识库建设》:

  本课题以计算机理解与翻译为目标,探索汉语多种隐喻现象的识别理解等关键技术。研究内容主要有:⑴ 通过考察隐喻在语言不同层级的分布,建立以源域为核心的汉语隐喻知识架构体系。⑵ 利用大规模语料、已有的《现代汉语语法信息词典(GKB)》和中文概念词典(CCD)等基础资源,建造面向机器理解和对外汉语教学的汉语隐喻知识库。⑶ 采用机器学习和相似度推理的优化算法,实现大规模文本的隐喻知识获取,为构建大规模隐喻标注语料库提供技术支持,也为外国留学生学习汉语隐喻提供重要参考。本项目是一年期的预研项目,发表论文3篇(包括EI 2篇,核心期刊1篇),知识库1个。项目组经过多次研讨和论证,对汉语隐喻的句法表现、隐喻知识库的构造,以及对隐喻的自动识别进行了全面考察和探索,这些调研将为后续汉语隐喻开展系统研究创造良好条件。

分享到:

热点新闻

热点专题