国家学术搜索
登录
注册
中文
EN
首页
|
信息科学技术领域术语自动识别策略
信息科学技术领域术语自动识别策略
引用
扫码查看
点击上方二维码区域,可以放大扫码查看
原文链接
NETL
中文摘要:
术语的自动识别是机器翻译、信息检索以及实现领域术语库的及时更新、建立互联网上术语信息服务的重要手段.本文结合"信息科学技术领域术语辅助提取及术语库的建设"项目的实践,介绍了作者正在研究之中的术语自动识别的总体策略,即:在提取阶段,把置信度较高的术语候选首先提取出来建造领域词库;在识别阶段对那些置信度不高的术语候选,结合更多的上下文信息和篇章结构信息进一步确认.通过术语提取和术语识别的分阶段进行,可以在保证识别准确率的前提下提高识别系统的运行效率.
收起全部
展开查看外文信息
作者:
穗志方
展开 >
作者单位:
北京大学计算语言学研究所,北京100871
关键词:
术语提取
术语识别
自动识别
领域词库
计算语言学
主办单位:
北京大学
会议名称:
第二届中日自然语言处理专家研讨会
会议时间:
2002-10-30
会议地点:
北京大学
会议母体文献:
第二届中日自然语言处理专家研讨会
页码:
318-322
出版时间:
2002