被引频次作为论文评价的基础性指标,受到学界的广泛关注和认可,其影响因素的研究有着探寻引用后背“推手”,甚至预测未来引用的独特研究意义。之前学界对被引频次的影响因素有着众多探讨,但影响因素的复杂性和多样性使得研究不具备完整的系统性。更为重要的是,由于大多数研究并未对论文质量进行替代或质量替代因素选取不当、方法选择和数据分类的单一以及研究样本量偏小等问题,造成同一因素在不同的研究中,结果完全不同甚至互相矛盾。本研究在前人研究的基础上,针对过去研究中的一些不足加以改进,以论文发表后评估作为研究视角,界定论文质量的替代方式,并选用多种回归模型验证被引频次影响因素,将被引频次的影响因素研究向前推进了一步。 为了保证研究的可靠性,数据的选择考虑引用窗口期、论文类型的影响以及各因素数据覆盖比例。研究选取经同行评议生物学医学Article类型的论文,共计11682篇。所研究的影响因素涵盖作者因素、期刊因素、替代计量因素、开放获取因素和质量替代因素五大类,共19个子因素。首先,在初步分析中运用分位数统计各影响因素与篇均被引频次之间的关系,判断影响因素在分位数中的引用分布情况,了解变化趋势。然后,通过相关性分析被引频次与因素、因素与因素之间以及因素内部的关联,判断被引频次和因素之间的关系。最后,在研究被引频次和因素之间的因果关系时,利用先前的相关性分析选取因素,论文质量替代采用两套方法,均基于论文发表后的同行评议分数,分别为F1000总分替代论文质量和选取同质量论文替代论文质量,并运用多元回归、主成分回归和分位数回归三种不同方法研究全数据、分学科数据和不同开放获取类型数据影响因素的表现情况。 我们发现替代计量因素中的Captures在所有影响因素中最为重要,期刊因素中的SNIP影响次之。合著者数量在作者因素中对被引频次的影响最大。第一作者发文量和第一作者H指数则属于无影响因素。研究得出的重要因素被进一步拓展含义和应用范围,所构建的新指标在作者评价方面有着良好表现,我们发现Captures是影响被引频次的重要因素,其背后的原因是学者将Captures作为论文质量判断后的储备,或者说是参考文献的储备,很可能被添加到自己投稿论文的参考文献中。Captures作为替代计量因素,影响形成周期短,远远快于引用发表周期。因此,将Captures作为后期引用的早期预测,并以Captures替代引用构建类H指数,有利于青年学者影响力的评价。 本研究的创新点如下:前人对被引频次的影响因素的研究,多局限在相关性分析,即探讨被引频次与影响因素之间的相关性。本研究不仅讨论了被引频次与各因素的关系、各因素间关系以及因素内部之间的关系,通过多元回归、主成分回归和分位数回归多种方法讨论被引频次与因素之间的因果关系。在因果关系研究方面,本研究创新的使用同行评议作为论文质量替代的标准,运用两套论文质量替代分类方法,使得作者因素、期刊因素、替代计量因素在回归中具有可比性,结果可靠性大为增加。本研究运用综合评价法将PlumX平台的Captures、Mentions、Social Media和Usage四大类替代计量指标计算得到综合指标与另一平台Altmetric.com中Altmetfics综合得分之间的相关性进行比较,为替代计量学方法间的比较提供了新视野。由于采用论文发表后同行评议分数替代论文质量并用多种回归方法验证,得到被引频次的重要影响因素具有可靠性和稳健性。本研究设计提出,以该替代计量因素构建的类H型指数,有利于青年学者的评价。