我校汉语国际教育技术研究中心的团队在今年的7月举行的中文资源与评测国际会议(CLP2014)开放任务评测人物属性抽取项目中取得了第三名的优异成绩。并向大会提交了论文“An Introduction to BLCU Personal Attributes Extraction System”.
第三届中文资源与评测国际会议(CLP2014)由中国中文信息学会(CIPS)和国际计算语言学学会中文处理特别兴趣小组(ACL-SIGHAN)共同举办。本次大会共设有中文分词、中文拼写检查、简体中文句法分析和中文人物属性抽取四个开放任务。面向全球开放评测。这一评测是计算语言学和信息技术领域具有较大影响力的国际评测。
人物属性抽取任务旨在从非结构化文本中自动提取与人名实体相关的特定属性信息,比如该人物实体的出生日期、配偶、子女、教育、头衔等等。这一任务在信息抽取、事件跟踪、人名消歧等研究中有着重要作用。评测组织方提供对应于目标人物实体的文档集以及一个关于命名实体的知识库,该知识库含有命名实体的部分属性信息,参赛者需要从给定文本中将对应于人物实体的知识库条目中未填充的属性信息提取出来。文档集不限于新闻语料。
我校汉语国际教育技术研究中心团队牺牲暑期休息时间,积极准备,刻苦研发,在不到一个月的时间内利用中心的技术和资源积累研发了“北语人物属性抽取系统”。并在来自海内外的团队中一举夺得第三名的好成绩。值得一提的是这支团队中是由一名青年教师、一名在读硕士研究生和四名本科生组成。这样一支年轻团队在具有广泛影响力的国际评测中取得良好成绩,可成为我校学生科研实践活动的典范。
“北语人物属性抽取系统”综合了基于统计的自动标注模型、句法依存分析和规则过滤等技术,以在线百科资源为训练集,实现了对不同范畴25种人物属性的自动抽取,并取得了较好效果。带队教师于东博士表示将在继续完善该系统,并考虑在未来提供“北语人物属性抽取”的在线服务。
通过积极参加开放评测,我校学生科研,信息化建设和计算语言学的教训研究水平都得到了检验。以评测和实践需求为动力,汉语国际教育技术研究中心将进一步开展与其他教学科研单位的合作,共同推进我校语言科学信息化的发展进程。
带队教师:于东博士
团队成员:唐共波(硕士研究生);瞿琴;刘春花;田悦;易静