我校举办Python编程与语料库处理工作坊
7月22日-23日,我校举办Python编程与语料库处理工作坊。本次工作坊由国家语委中国东北亚语言研究中心(大连外国语大学)主办,我校科研处、研究生处、教师教学发展中心(教学评估中心)、《外语与外语教学》编辑部协办。工作坊特邀上海交通大学博士生导师雷蕾教授、四川大学锦城学院文举副教授莅临参加。本次活动吸引了来自北京外国语大学、国防科技大学、苏州大学、中山大学、上海师范大学、大连理工大学以及我校共百余位师生参加。
22日,文举副教授基于文科学习者视角,深入浅出地对Python编程基础知识——数据类型、条件与循环、列表与元组等进行细致讲解,并耐心辅导现场师生完成开发环境配置、语料存储与读取等工作。与此同时,文举副教授以实践应用为导向,进一步讲解语料获取与初步加工,包括分句和分词、词性赋码、词形还原、多文件读取、文本随机抽样等内容,重点讲解操作要领,辅以实践操作指导,帮助师生打下扎实的Python编程基础。
23日,雷蕾教授基于Python的语言数据科学方法,讲授编程与语料库处理进阶内容,包括Pandas数据处理工具、数据清洗、筛选、计算、语言数据科学绘图等,详细演示并耐心指导师生实操。在此基础上,雷蕾教授从语料库语言学的研究实际出发,讲授并示范演示语料库语言学常用的词汇、搭配、句法、情感等重要信息的提取和处理。
在为期两天的工作坊学习中,现场师生掌握了Python编程的基础知识,对基本的数据处理与操作有了更加直观和深入的了解。本次工作坊帮助语言研究者进一步掌握了语料库数据处理方法,提升其运用Python编程进行语言数据处理和分析的能力,为日后新文科背景下数字人文研究的开展奠定了良好基础。(钟宇红)