首页|信息科学技术领域术语自动识别策略

信息科学技术领域术语自动识别策略

扫码查看
术语的自动识别是机器翻译、信息检索以及实现领域术语库的及时更新、建立互联网上术语信息服务的重要手段.本文结合"信息科学技术领域术语辅助提取及术语库的建设"项目的实践,介绍了作者正在研究之中的术语自动识别的总体策略,即:在提取阶段,把置信度较高的术语候选首先提取出来建造领域词库;在识别阶段对那些置信度不高的术语候选,结合更多的上下文信息和篇章结构信息进一步确认.通过术语提取和术语识别的分阶段进行,可以在保证识别准确率的前提下提高识别系统的运行效率.

穗志方

展开 >

北京大学计算语言学研究所,北京100871

术语提取 术语识别 自动识别 领域词库 计算语言学

北京大学

第二届中日自然语言处理专家研讨会

2002-10-30

北京大学

第二届中日自然语言处理专家研讨会

318-322

2002