藏文自动排序研究综述
A Review on the Study of Tibetan Automatic Sorting
才让叁智 1仁青东主 2多拉 3洛桑嘎登 2仁增多杰4
作者信息
- 1. 西藏大学信息科学技术学院 西藏拉萨 850000;西北民族大学中国语言文学学部 甘肃兰州 730000;西藏大学藏文信息技术国家地方联合工程研究中心 西藏拉萨 850000
- 2. 西藏大学信息科学技术学院 西藏拉萨 850000
- 3. 青海师范大学藏语智能信息处理及应用国家重点实验室 青海西宁 810008
- 4. 西藏大学信息科学技术学院 西藏拉萨 850000;青海师范大学藏语智能信息处理及应用国家重点实验室 青海西宁 810008
- 折叠
摘要
藏文自动排序是藏语自然语言处理领域一项重要的基础研究工作,在词典编纂、信息检索和日常办公等方面具有重要的应用价值.藏文特殊的二维非线性组合方式、词法规则和词典排序规则使得藏文自动排序比其他语种的排序更加复杂.文章对已有研究提出的藏文自动排序方法、规则、算法和模型等进行了较为全面的分析与总结,为研究人员了解藏文自动排序中的构件识别、排序规则和方法以及优化藏文自动排序相关工作提供参考.
Abstract
Tibetan automatic sorting is an important research work in the field of Tibetan natural language pro-cessing,and it has practical applications in lexicography,information retrieval,and daily office work.Tibetan's unique two-dimensional nonlinear combination,as well as its lexical rules and dictionary sorting rules,make Ti-betan automatic sorting more complex and difficult compared to other languages.This paper comprehensively an-alyzed and summarized the methods,rules,algorithms,and models of Tibetan automatic sorting proposed in pre-vious studies,which provides a reference for researchers seeking to understand component identification,sorting rules,and methods in Tibetan automatic sorting and the optimization of Tibetan automatic sorting.
关键词
藏文自动排序/字符优先级/结构优先级/构件比较顺序Key words
Tibetan automatic sorting/character priority/structure priority/component comparison order引用本文复制引用
基金项目
国家自然科学基金项目(62266037)
西藏大学校级科研培育基金项目(ZDCZJH19-19)
西藏自治区自然基金项目(XZ202101ZR0108G)
省部共建藏语智能信息处理及应用国家重点实验室开放课题项目(2023-Z-006)
出版年
2024