9月26日上午,“北京冬奥项目知识图谱资源及问答系统”发布会在北京语言大学举行。北京冬奥组委对外联络部副部长万学军、教育部语信司副司长刘宏、北京语言大学副校长张旺喜、中科院软件研究所副所长肖作敏、北京冬奥组委延庆运行中心副主任张双锁等领导及专家出席发布会。语言资源高精尖创新中心(以下简称“中心”)常务副主任杨尔弘教授主持发布会。


会上,项目负责人、中心特聘研究员、中国科学院软件研究所孙乐研究员详细介绍了“基于知识图谱的北京冬奥项目智能问答系统”的研发进展及成果特色。项目构建了大规模知识图谱,完整覆盖5类冬奥核心实体,设计多种类型的知识展示服务,研发了语音和文字两种输入方式的“智能问答平台”,提供实时便捷的冬奥会问答服务,为普及冬奥知识、宣传冬奥文化提供了全方位、立体化手段。杨尔弘教授指出,中心借助北京市教委“高精尖计划”,汇聚了一批高层次专家,打造了一批高水平创新平台,集中展示语言资源领域最新研究动向和创新成果,积极服务国家和北京市重大战略。

北京语言大学副校长张旺喜教授致辞。他首先感谢教育部、国家语委和北京冬奥组委的指导,感谢项目组专家的辛勤付出,冬奥项目知识图谱资源及问答系统特色鲜明、优势突出,期待项目再上一个更高的台阶。北京语言大学将汇聚全校资源,以“北京冬奥项目知识图谱资源”及“小奥智能问答系统”发布会为契机,为冬奥会提供精益求精、臻于极致的服务,为“智慧冬奥”理念和目标的实现,贡献北语智慧,献礼共和国七十周年华诞。

中科院软件研究所副所长肖作敏研究员在致辞中表示,项目立项之初,软件所高度重视,深感在普及冬奥知识、宣扬冬奥文化方面的责任重大。未来将继续在人、财、物方面给予项目研发团队大力支持,持续钻研技术、锻造品牌,研发更多的智能语言服务成果,全力以赴地服务好北京冬奥会,共同谱写“智能”新篇章。

教育部语信司副司长刘宏致辞。他首先充分肯定了项目成果,该项目丰富并完善了冬奥知识问答服务,本次发布的“北京冬奥项目知识图谱资源及问答系统”,是落实2017年《北京冬奥会语言服务行动计划》的又一重要体现。他认为,要继续加强多方合作,在体制机制方面进行大胆探讨与创新,各相关部门要继续发挥应有职能,切实为2022年北京冬奥会创造良好环境,彰显中国语言的独特魅力。

北京冬奥组委对外联络部副部长万学军在致辞中回顾了中心三个服务冬奥系列项目的设立及开展情况,冬奥组委高度重视科技和人工智能,今天的项目成果发布会适逢其时,“人类与计算机对话服务”将为北京冬奥会提供更加丰富的手段,提供更加多元的智慧,为世界奉上一届精彩、非凡、卓越的体育盛会。
与会领导及专家在倒计时主屏幕前,共同启动了“北京冬奥项目知识图谱资源”及“小奥智能问答系统”,国家语委、教育部语信司副司长刘宏宣布:“北京冬奥项目问答系统正式上线”。全场观众见证了这一重要时刻。这标志着继去年12月13日“冬奥术语平台”V1版正式交付北京冬奥组委使用后,中心项目组研发的实时便捷智能语言服务关键技术和系统成果于今天正式上线。
仪式结束后,项目组主要负责人接受多家主流媒体的专访。后续,项目研发团队还将继续对“北京冬奥项目知识图谱资源”及“小奥智能问答系统”进行完善,并围绕冬奥赛事组织、冬奥文化宣传的实际需求,持续发布更多的成果,为北京冬奥会的智能语言服务提供强有力的技术支撑。
附【立项背景】智能问答技术可以提供人与计算机之间的对话服务,是在北京冬奥会期间为广大与会人员提供实时便捷智能语言服务所需的关键技术。在教育部、国家语委与北京冬奥组委于2017年联合启动的“北京冬奥会语言服务行动计划”中,将“开展语言技术集成及服务”作为第一个重点项目,提出在跨语言术语服务平台上开发多语言服务系统和智能 APP,并将人机对话列为需要集成的关键技术之一。而规模化、关联化的知识图谱则是构建精准智能问答系统不可或缺的语言资源。为此,在教育部、国家语委和北京冬奥组委指导下,北京语言大学语言资源高精尖创新中心联合中国科学院软件研究所研发了“基于知识图谱的北京冬奥项目智能问答系统”项目,该项目以语言智能技术服务北京冬奥,普及冬奥知识、宣扬冬奥文化。本次发布的“北京冬奥项目知识图谱资源”及“小奥智能问答系统”为该项目的阶段性成果。
附【项目介绍】该项目立足于解决北京冬奥会语言服务中面临的“冬奥知识碎片化”、“知识展示单一化”、“服务手段智能化不足”三大核心挑战:
(1)“冬奥知识碎片化”
与冬奥会相关的知识分散在互联网的各个网站上,呈现出一种碎片化的局面。针对该挑战,项目组深入探索了各类数据挖掘与知识抽取、知识融合方法,从互联网上获取并融合国内外各类冬奥相关的知识资源,建设了一个包含179万知识点、完整覆盖5类冬奥核心实体(项目、赛会、运动员、比赛、参赛队)的北京冬奥项目知识图谱,为知识展示、智能知识问答等上层应用提供有力的资源支撑。
(2)“知识展示单一化”
现有服务大多通过文本和图片展示冬奥知识,形式单一,缺少关联和互动,难以深度呈现冬奥知识丰富的内部结构。为此,项目组设计了立体化、关联化的冬奥知识展示网站,针对不同用户、不同场景,提供了知识浏览、文本查询、结构化查询、全景交互等多种类型的知识展示方式,为普及冬奥知识、宣扬冬奥文化提供全方位、立体化的展示手段。
(3)“服务手段智能化不足”
当前最常用的搜素引擎大多采用关键字匹配,缺乏对语言的理解,导致结果不够精准,往往需要用户进行二次筛选。针对该问题,项目组基于大规模冬奥项目知识图谱研发了“小奥智能问答系统”。系统采用自主研发的国际前沿深度学习语义解析模型,构建了精准的问句分析引擎。“小奥智能问答系统”以微信公众号和小程序的方式提供服务,接受文本和语音两种方式的问句输入。