【目的】利用文献的主题标引结果, 发现其中隐含的重要语义关系。 【方法】基于 MEDLINE 数据库中的 生物医学主题标引文献, 提出一种语义关系发现算法, 涉及主题词组配原则、主题标引规则以及基于加权标引词 和关系出现频次的优化方法等多个环节。 【结果】收集疾病与症状方面的实验数据对算法进行实验验证, 并结合 领域专家审核, 结果表明本文所发现语义关系的准确率可达到 95%以上。 【局限】本文所研究的语义关系发现算 法仅适用于具有主题标引结果的文献。 【结论】从大规模生物医学主题标引文献中发现中英文两种语言的语义关 系是有效可行的, 对其他领域语义关系的发现具有极高的借鉴意义。