内容简介
《中国学生英语口笔语语料库1.0》(修订版)包括口语子库和笔语子库两大部分,在原SWECCL 1.0的基础上进行了改进和完善,增加了由课题组自行开发的多个研究工具,采用更为通用的mp3格式保存语音语料,并按照任务类型对口语语科进行了切分,同时对所有文本语料进行了清洁和整理。
口语子库的主要特色
包含1141位全国英语专业四级口试考生11410多分钟的语音资料;
语音转写文本按照口试中的不同任务类翌切分,便于研究的开展;
语音文件按任务类型切分,采用rap3格式保存,便于渊览、编辑和标注。
笔语子库的主要特色
包含3880篇学生英语作文文本,共计1255347个形符;
所有文本采用CLAWS4进行词性赋码,便于开展深度研究;
作文涉及16个不同题目,保证了语科库文本内容的多样性。
本项目为教育部人文社会科学重点研究基地北京外国语大学中国外语教育研究中心的资助项目。