供稿、供图:张婧 编辑:陈文婧
2024年4月9日下午,应bat365在线平台官方网站语言工程与认知计算工信部重点实验室邀请,计算语言学家、教育部语言文字应用研究所研究员冯志伟为我院师生作了题为“文理结合的新学科——数字人文”的学术讲座。本次讲座由重点实验室主任刘芳教授主持,bat365在线平台官方网站教师、珠海校区外语学院来校培训教师以及外国语言文学专业博士生、硕士生等我院师生参与了本次讲座。
冯志伟研究员首先以“何为数字人文”开场,阐释其是使用计算机技术和网络技术来研究传统人文学科的一门新型交叉学科。随后,冯志伟研究员介绍了数字人文发展的三个阶段。早期的数字人文研究主要是使用计算机来给书面文献编制索引,语言数据规模较小,处理对象是文本数据,处于“小规模的文本数据处理”阶段。随着机器可读的文本语料库数据的增多,数字人文研究出现了战略转移,开始从大规模的、真实的文本语料库中获取知识,进入了“大规模真实文本数据处理”阶段。万维网和计算机技术的发展使得数字人文的研究对象从电子文本逐步扩展到超文本、图形、音频、视频、网页、三维空间等多媒体形式,研究领域也从语言文字进一步扩展到文学、历史学、音乐、艺术等多个人文科学的领域,进入了“大规模的多媒体数据处理”阶段。
之后,冯志伟研究员深入分析了数字人文研究的四个层次。第一个层次是人文数据库或数据集的建设,一方面是把非电子化的人文资料加工转化为数字文本内容;另一方面是对非结构化的数字文本内容按照特定使用目的进行规范化标注著录。第二个层次是人文数字工具的开发与使用,一方面是设计或使用数字工具与平台来解决传统的人文问题,另一方面是设计或使用非人文领域研究方法的数字工具来理解和分析人文数据集。第三个层次在于人文研究方法和研究范式的创新,将人文学者较多采用的定性研究转为定性研究与定量研究相辅助的形式。第四个层次是人文领域和文化遗产的数字化重建。通过数字技术切入人文领域,对人类文化遗产的传承、传播、全球化和创新提供新的方法。
随后,冯志伟研究员讲述了国内外数字人文研究的几个实例,对各国数字人文的研究现状进行了说明并重点梳理了我国数字人文研究的发展情况,更加具象化地让大家了解如何使用数字人文技术来解决问题。最后,冯志伟研究员提出希望:“人文学者应当进行更新知识的再学习,掌握有关的数字化技术,对数字化的人文资料进行组织、标引、检索和利用,提高人文科学研究效率,实现文理融通,进一步推动新文科的建设”。
讲座结束,冯志伟研究员与现场师生就“机器翻译”、“熵值”等问题进行了互动、分享与交流。本次讲座对师生们进行数字人文研究有很大的启发,令参加讲座的师生受益匪浅。
主讲人简介:
冯志伟,计算语言学家,教育部语言文字应用研究所研究员、博士生导师、学术委员会委员,中国计算机学会高级会员,获中国中文信息学会会士荣誉称号,曾获中国计算机学会NLPCC杰出贡献奖、奥地利维斯特奖、香港圣弗兰西斯科技人文奖。
(审核:杨晖)