您当前所在的位置: 首页 -> 学术沙龙 -> 正文

商学院“经世·金融”大讲堂:大数据分析:文本数据处理详解

发布日期:2023-12-22  作者:商学院 点击量:

经世济民、金融论道。为进一步建设和提升学院学术氛围、完善实践体系,商学院全新升级的“经世·金融”大讲堂再次为大家带来新思路、新启发。12月18日下午,以“大数据分析:文本数据处理详解”为主题的金融专题讲座成功举行,此次讲座为2023年第27期,总第63期。我们有幸邀请到北京聚源锐思数据科技有限公司高级金融研究员赵阳老师为北语金融学子做此次讲座。

赵阳老师本科与研究生均均读于对外经济贸易大学,并分别取得了金融工程学学士与金融学硕士学位,目前担任锐思数据公司高级金融研究员,主要负责锐思数据产品线金融数据方面的分析与研究工作。拥有多年金融数据、统计数据的分析研究经验,主要参与的项目包括金融计算与建模云实验平台、金融量化投资平台等。

 赵阳老师首先向同学们介绍了获取论文代码的方法:包括国外AER,ECONOMETRICA、JF期刊代码的获取方法;以及国内目前要求作者提供代码和数据的六个期刊:《中国工业经济》、《经济学(季刊)》、《数量经济技术经济研究》、《世界经济》、《社会》、《管理世界》、《财经研究》的代码获取方法。接下来,赵老师进行了瑞思大数据综合教学与实训平台简介,介绍了大数据平台特色,并从课程内容、运行环境、编程语言和教学工具四个方面比较了大数据平台和金融建模平台的区别。紧接着,赵老师向我们简单介绍了文本数据的获取方法。其中,详细介绍了Common Crawl数据集。最后,赵阳老师向我们展示了财务报告分析可用的三种方法:词频统计、管理层语调、文本可读性;以及政府工作报告文本分析的三个方法:词云、TF-IDF和LDA。其中,赵阳老师着重强调了词频统计方法中的词典、停用词、词组等问题。

 赵阳老师的讲座内容丰富、详实,使得同学们对瑞思大数据综合教学与实训平台有了较深的了解,有助于同学们对公司年报以及政府工作报告的分析与理解。本次讲座在热烈的掌声中结束。“经世·金融”大讲堂将在今后继续为金融学子带来优质讲座资源,帮助同学们更好地了解金融热点问题,激发学习热情。

(责编:王隽毅)

分享到:

热点新闻

热点专题