首页|基于改进型Dotplotting的文本分割模型

基于改进型Dotplotting的文本分割模型

扫码查看
Dotplotting是文本分割领域的著名算法,本文在对Dotplotting算法改进的基础上,提出了MMS模型.原始的Dotplotting算法仅考虑了语义段落间相似度来进行分割,而MMS模型综合考虑语义段落内部相似度和语义段落间相似度两方面信息,认为段内相似度越大,段间相似度越小,则分割越理想.其他因素如语义段落长度和句子距离对相似度的影响也加入分割模型,来提高分割的准确率.实验结果表明,与原始Doplotting模型和Dotplotting框架下的其他模型相比,MMS模型取得了更好的Pk值评价性能.

叶娜、罗海涛、郑妍、朱靖波、张斌

展开 >

东北大学信息学院计算机软件所自然语言处理实验室,沈阳,110004

东北大学信息学院计算机应用所,沈阳,110004

文本分割 Dotplotting 段间相似度 段内相似度

中国中文信息学会

中国中文信息学会二十五周年学术会议

2006-11-21

北京

中文信息处理前沿进展——中国中文信息学会二十五周年学术会议

352-360

2006