在2018年国家社科基金重大项目评审中,我校三项课题中标,实现了历史性突破。其中王治敏教授主持的“基于‘互联网+’的国际汉语教学资源与智慧教育平台”项目服务于中华文化走出去的国家战略,利用中文信息处理技术、模型构建技术、移动互联技术等多种技术及既有研究成果,探索面向汉语国际教育的基础词汇、基础汉字、核心语言点、分级阅读文本等资源的提取技术与研建方法,搭建国际汉语教学核心资源与智慧教育平台,以满足“互联网+”背景下的国际汉语智慧教育的现实需求。
Q1:您的项目充分体现了跨学科背景,利用了例如中文信息处理技术、模型构建技术、移动互联技术等多种技术及既有研究成果。您本科及硕士选择了中文系专业,博士则毕业于北京大学计算语言学研究所,您当初是在什么契机下选择跨专业,博士攻读这个专业呢?为您现在的研究项目又带来什么优势?
A1:我当时硕士毕业后去了信息产业部的一个研究所,中国电子信息发展研究院,在中文信息处理开放实验室做语言工程师,后来跟着数理逻辑专家孙怀民教授做英汉机器翻译系统,虽然是文科生,但是我的理科感觉还不错,再加上硕士有很好的现代汉语语法方面的训练,所以一不小心就成了机器翻译引擎的项目经理,跟着老先生调试规则系统,让我学到了机器翻译词法分析、句法分析、生成分析等最核心的技术,也学到了项目管理经验。正是因为自己的机器翻译工作经验,才让我有胆量报考北京大学计算语言学研究所,那一年俞士汶教授正好招收文科背景的学生,我希望自己不仅仅是做工程,还应该在理论上有进一步的提升,于是决定报考,当时竞争激烈,但是凭着自己的积累和准备,第一年就考上了北大,有幸成为俞先生的弟子。
计算语言学是交叉学科,我在博士期间除了学习计算语言学相关理论外,还选择了中文系的课程。陆俭明先生、袁毓林先生、郭锐先生都是我的老师。由于自己的跨学科背景,长期以来跟不同领域的人打交道,学科交叉,优势互补。我觉得跟来自不同学科背景的人会碰撞出火花,让自己的视野更加开阔。
Q2:您是在何时开始关注基于“互联网+”的国际汉语教学资源与智慧教育平台的?为什么会对这个项目产生兴趣呢?
A2:在2016年梧桐平台申请之初,我和我的团队小伙伴们觉得应该为汉语国际教育学科做些事情,我们就想到了要做这个学科最核心的“词汇”和“语法”这两项资源。之所以选择词汇-语法资源跟我北大的学习经历有关。我的导师俞士汶先生就是做资源出身的,导师在1986年承担了“现代汉语词语语法信息库”的“七五”科技攻关项目,北大中文系朱德熙、陆俭明和郭锐三位先生承担了“现代汉语词类”的“七五”国家社会科学重点科研项目。为了顺利而有效地完成这两项科研任务,双方采取了合作攻关的方式。当时在计算语言学研究所原有的电子词典的基础上,选了25000多个常用词语,由朱德熙、陆俭明、郭锐三位先生亲自逐个归类,逐个填写语法属性信息。
2003年我入学后有幸承担了“综合型语言知识库”之子任务,《现代汉语语法信息词典》8000词语及其各项属性信息的扩充任务,朱德熙、陆俭明、郭锐三位先生填写的词典信息是一个非常好的学习范本,让我体悟到一项资源完整的设计理念、资源架构以及对于不同词类的处理思路,学术观点等,《现代汉语语法信息词典》的知识资源构筑体系可以很好地应用在教学语法信息词典的构建方面,本投标课题中教学知识库的构建模式借鉴了《现代汉语语法信息词典》的核心思想, 2011年以《现代汉语语法信息词典》为核心的“综合型语言知识库”荣获中国国家科学进步奖二等奖。
除了基础研究,我还接触到了计算语言学最前沿的课题,导师的国家973项目。我负责其中一个子任务“汉语文本中隐喻的表现形式和内容指向分析”,并在此基础上完成了博士论文“汉语名词短语隐喻的识别研究”的撰写,对于前沿问题的研究需要更多自己的深入思考,并让我学会了如何发现问题和解决问题。2006年博士毕业后我选择了语言教学,开始了独立做研究的阶段。我尝试探索从大规模语料中提取常用词语的研究,并积累了一些词汇资源的提取经验。
北大求学经历了从基础到前沿,从理论到实践,让我更加意识到汉语国际教育背景下知识资源的重要性,一线教学需要什么?我们应该提供哪些好用的资源?这些问题的产生得益北大的训练,得益于老师对我的培养,所以感恩导师俞士汶先生。
另外,还要介绍一下我的梧桐团队,她们是闻亭、张俊萍、王鸿滨、曹彩虹、彭锦维、李靖华、王琳。我们这些小伙伴是汉语国际教育学部的精兵强将,有的是计算语言学背景,有的是语言学背景,有的是二语习得背景,他们有着丰富的课堂教学经验,有很多人参加过学校的教学基本功大赛和教学观摩课,获得过多项教学奖励,如果我们这些小伙伴做资源,一定会做好。后来我们有缘邀请到信科学院的赵慧周副教授加入团队,她是计算机出身,做过基于网络的信息系统,其中有很多与汉语教学相关。她的加盟让我的团队更加自信,因为可以把很多想法付诸实践。另外我们还有一个非常好的顾问,现在的北京师范大学的张维佳先生。
梧桐团队部分成员
我们做的资源不是想自己使用,我们是想让更多的人用起来,2016年“互联网+”的概念已经出现,我们希望这两项资源能通过“互联网+”的方式传播出去。
智慧教育平台研究是申报国家社科重大选题时,请教我的梧桐平台顾问张维佳先生,他给了我们非常好的建议,我们的选题不仅有“互联网+”,也有国家汉语教学资源,还要做智慧教育平台。
汉语国际教育以质量求发展,自然要问鼎于学科基础研究、教学资源建设以及师资队伍培养等常态化问题,其中学科基础研究是重中之重。从系统论出发,任何系统都有其系统构成的核心要素,汉语国际教学资源建设也不例外。因此,“互联网+”的汉语国际教育平台、教学产品,无论其平台如何搭建、产品如何研发,都绕不开“字词”、“核心语法”等基础资源的支撑。即使外向型学习词典的编撰,其首要难题也是优先解决符合学习者认知规律的字词分级问题。
这样我们的题目就有了“基于‘互联网+’的国际汉语教学资源与智慧教育平台研究”,我们的研究有了更高的目标,事业也进一步扩大。
Q3:您在2016年参与了一项北语梧桐创新平台项目,我认为和这次获得的国家社科基金重大项目有一定关联,这次项目的申报是您对之前项目的深入研究么?如果是,可否介绍您这两年在这个项目上的一些新的研究兴趣点?
A3:我的梧桐平台题目是“基于互联网+的汉语国际教育词汇-语法教学资源平台研究”,是
社科重大项目的基础。这两年来我们专注于词汇和语法资源,技术上有了重要进展。
首先是三年前我申请了一项专利,2017获批,这项专利就是如何在大规模语料中提取教学词语,效果不错,但是由于语料本身的局限性,我们日常生活中口耳相传的词语,在我的统计词表中排在中间位置。为了能提升这些基础词的排序,我觉得应该提取一线教师和学生大脑中的基础词汇(心理词表)。所以我们做了调查问卷,并在全国范围内开展调研,这份问卷调研难度很大,每一份问卷至少要50分钟,调研周期很长,但是我们团队做的资源并不是为了短平快,而是要真正做出一个好用的基础词库,经过2年多的收集,已经收集了1300多份调查问卷,这是非常珍贵的资料,是我们这个团队一起努力的结果。
目前我们做了先期实验,用309份问卷提取了基础词语,在台湾词汇语义学会议上发表了两篇文章,引起了很大的反响。有些出版社也对这个词表感兴趣,希望我们能尽快推出。目前技术上基本走通,将来把大规模语料提取技术与心理词表相结合,研发融合模型,开发基础词汇知识库。我们也开发了一个词汇管理平台,所有的词汇录入和统计工作全部实现在线管理。
Q4:您自己长期从事一线教学工作,也有许多做专题讲座等的经历。现在“互联网+”概念非常火热,在线教育平台层出不穷。在您看来,在线教育和面对面教学各有什么利弊?您觉得“互联网+”形式的在线教育平台会成为未来非中文母语者学中文的主要途径和趋势吗?
A4:在线学习教育平台和面对面教学完全不同,在线教育有两种方式,一种是通过互联网的环境把老师和学生联通起来,实时在线教学。第二种是教师采用录播方式,把录播好的课程放到网上提供学生。这两种教学的好处突破了时空限制,让学生随时随地在线学习。汉语国际教育是实践性非常强的学科,课堂教学需要老师根据学生反馈做出及时调整,哪怕是学生的一个眼神,一个表情,老师都能精准捕捉,进行针对性教学,而网络教学无法做到及时的沟通。
如果要问我在线教育平台的发展趋势,我想未来在线教育与面对面教学同时并存,在线教育会给学生更多的选择机会,是面对面教学非常好的补充。北京语言大学作为汉语国际教育的旗舰,在未来的在线教育、智慧平台建设方面应该有所考虑。