国际汉语教学研究2024,Issue(3) :76-84.DOI:10.3696/j.issn.2095-798X.2024.03.009

基于Word2vec的二语教学"基本形式库"构建方法初探

Construction of a"Basic Form Corpus"for TCSOL Based on Word2vec

杨苛鑫 庄会彬 杨牧
国际汉语教学研究2024,Issue(3) :76-84.DOI:10.3696/j.issn.2095-798X.2024.03.009

基于Word2vec的二语教学"基本形式库"构建方法初探

Construction of a"Basic Form Corpus"for TCSOL Based on Word2vec

杨苛鑫 1庄会彬 1杨牧2
扫码查看

作者信息

  • 1. 山东大学文化传播学院
  • 2. 浙江大学外国语学院
  • 折叠

摘要

二语教学中,重视表达取向的"基本形式"观致力于构建一个"基本形式库".本文以微博语料库为例,将其中高频词设置为检索词,依据Word2vec训练的词向量进行检索,围绕检索词查找近似词来构成(准)等义组,继而进一步确定该组的"基本形式".本文初步提出了一种兼具可操作性和效率性的建设方法,作为人工建设"基本形式库"的辅助工具,并检索出了一部分基本形式(准)等义组作为前人研究的补充,为"基本形式"观理论进一步发展提供工具与思考.

Abstract

In second language teaching,the"Basic Forms"concept,which emphasizes semantic expression,aims to construct a"Basic Form Corpus".Taking the Weibo corpus as an example,this paper sets high-frequency words as search items and employs Word2vec-trained word vectors for retrieval.The(quasi-)synonym group is formed by searching for synonyms related to search items,further establishing the"Basic Forms"of the group.The paper proposes a preliminary method that combines operability and efficiency.As an auxiliary tool for constructing the"Basic Form Corpus",a subset of the basic form(quasi-)synonym group is retrieved to supplement previous studies,offering some suggestions for further research of the"Basic Form"approach.

关键词

基本形式/Word2vec/词向量/(准)等义组

Key words

Basic Form/Word2vec/word vector/(quasi-)synonym corpus

引用本文复制引用

出版年

2024
国际汉语教学研究

国际汉语教学研究

CHSSCD
ISSN:
段落导航相关论文