北京电力高等专科学校学报(社会科学版)2012,Vol.29Issue(4) :618,620.DOI:10.3969/j.issn.1009-0118.2012.04.424

基于spider的高频新闻词汇语料库的构建及其在英语教学中的应用

邓丽芳 冯微峰
北京电力高等专科学校学报(社会科学版)2012,Vol.29Issue(4) :618,620.DOI:10.3969/j.issn.1009-0118.2012.04.424

基于spider的高频新闻词汇语料库的构建及其在英语教学中的应用

邓丽芳 1冯微峰2
扫码查看

作者信息

  • 1. 杭州师范大学钱江学院,浙江杭州310036
  • 2. 杭州网易技术有限责任公司,浙江杭州310052
  • 折叠

摘要

本文以VOA网站作为样本,构建了一个网络spider,以抓取VOA的新闻页面,然后通过对抓取页面进行清洗,获取有效文本,再通过去除停用词和词根还原的方式,对文本进行词频统计分析,构建了一个高频新闻词汇语料库.最后阐述了新闻词汇语科库在英语教学中的应用.

关键词

词频统计/语料库/spider/词汇教学

引用本文复制引用

出版年

2012
北京电力高等专科学校学报(社会科学版)
北京电力高等专科学校

北京电力高等专科学校学报(社会科学版)

影响因子:0.018
ISSN:1009-0118
参考文献量2
段落导航相关论文