首页|从网络获取香港法律双语语料库

从网络获取香港法律双语语料库

扫码查看
本文报告作者从网上获取香港法律英汉双语文本,利用法律文本的原有体系结构和编号机制进行子段级文本对齐,并将对齐结果进行XML标注,构建双语语料库的工作.文章表述上述工作的基本方法和技术.最终获得的双语语料库有10.4M英语词和18.3M汉字,是香港法律最全面最权威的文本,对于经验型的机器翻译研究具有特别价值.此工作也为我们进一步从网上探索和获取更大规模的双语文本打下坚实基础.

揭春雨、刘晓月、冼景炬、卫真道

展开 >

香港城市大学中文、翻译及语言学系,九龙,香港

双语语料库 文本对齐 子块对齐 XML标注

中国中文信息学会

中国计算机学会

中国人工智能学会

北京市语言学会

全国第八届计算语言学联合学术会议

2005-08-27

南京

自然语言理解与大规模内容计算

193-199

2005