摘要
作为一种对象选择与评价任务的通用任务,排名问题出现在了许多应用领域中。如果仅根据单一的评价标准去排名,这项任务就很简单。然而,在信息科技高度发达的今天,人们在制定决策时往往需要兼顾多重标准下的对象排名信息,以选出综合表现最好的对象,这个过程就是排名聚合,它也在过去的几十年中得到了广泛的研究。然而在实际应用中人们发现,许多原始排名信息是不准确的,往往是含有不同程度的随机误差或故意干扰的,这就将一系列问题摆在面前:这些不准确的排名信息对排名聚合效果有什么影响?什么样的排名聚合方法能克服这些影响?怎么针对性的提出能处理这种排名聚合问题的方法?这些正是排名聚合鲁棒性研究面对的问题。随着排名聚合研究的不断深入开展,作为排名聚合领域中的重要研究主题之一,排名聚合鲁棒性研究的重要理论意义和实际应用价值越来越得到学界的认可,成为迫切而又充满挑战的前沿研究课题。 本文以排名聚合理论为基础,充分利用网络科学、数理统计、矩阵论、实验仿真分析等交叉学科优势,围绕“怎么度量排名聚合方法的鲁棒性”、“怎么提高排名聚合方法的鲁棒性”这两个中心问题,系统深入地开展了面向随机误差和故意干扰的排名聚合鲁棒性问题的研究和应用。论文的主要研究工作及创新点如下: 1)提出了一个面向排名聚合鲁棒性的数据生成模型。以实际排名数据中两种典型不精确信息的类型及产生机理为出发点,分别构建了带有随机误差的排名列表生成方法和带有故意干扰的排名列表生成方法,并在此框架中提出了新的基于真实排名列表的排名聚合有效性评价指标。 2)提出了一种排名聚合方法鲁棒性测度指标。以排名聚合方法的随机误差鲁棒性测度为关键点,基于排名聚合仿真实验模型,构建了随机误差水平-排名聚合有效性曲线,提出了基于聚合有效性曲线的排名聚合方法鲁棒性测度指标。 3)提出了一种针对随机误差的鲁棒排名聚合方法。以带有随机误差的排名列表鲁棒聚合问题为落脚点,基于统计分析和网络科学,分别提出了输入排名列表随机误差水平评估方法和基于竞争图的抗随机误差鲁棒排名聚合方法。以排名聚合方法鲁棒性测度指标和仿真实验模型为分析工具,与几种典型排名聚合方法进行了聚合有效性对比分析,验证竞争图法针对带有随机误差的排名列表聚合鲁棒性。 4)提出了一种针对故意干扰的鲁棒排名聚合方法。以带有故意干扰的排名列表鲁棒聚合问题为落脚点,基于统计分析和网络科学,分别提出了排名列表可信度评估方法和针对带有故意干扰的完全排名列表鲁棒聚合方法、不完全排名列表鲁棒聚合方法。以排名聚合仿真实验模型为分析工具,与几种典型排名聚合方法进行了聚合有效性对比分析,验证两种方法针对带有故意干扰的排名列表聚合鲁棒性。 5)研究了六种典型应用背景下的排名聚合鲁棒性。分别以网页搜索、民主选举、课程评价、影视作品排名、商品排名和学生评教为应用背景展开了实证应用研究。