近日,信息学院王兴副教授的研究成果“The misuse of the nonlinear field normalization method: Nonlinear field normalization citation counts at the paper level should not be added or averaged”在信息资源管理/信息计量学领域国际顶级期刊Journal of Informetrics 2024年第3期上正式发表。山西财经大学信息学院为论文的唯一署名单位。该文是教育部人文社会科学研究青年基金项目“‘破五唯’背景下学科标准化方法的科学化及合理使用研究”(项目编号:22YJCZH180)的研究成果之一。
长期以来,非线性学科标准分因为进行了相加或者取平均值的计算从而一直被学界和科研评价实践界误用。该项研究证明了非线性学科标准分是不可以进行相加或者平均计算的,从而为今后可以更加科学合理地使用学科标准化方法以及相关的非线性数据提供了理论依据。
学科标准分(即根据不同学科的引文规律进行标准化变换以后的引文数据)是学界以及评价实践界最为常用的科研评价指标之一。经过非线性学科标准化方法变换后得到的标准分(即非线性标准分)是不能进行相加或者取平均值计算的。学界和评价实践界长期误用了非线性学科标准化方法:人们总是去将非线性标准分进行相加或者取平均值的计算。包括很多著名的科学计量学家也误用了非线性学科标准化方法。
该论文的主要研究工作之一就是融合数学与情报科学/数据科学,证明和解释了为什么经非线性标准化方法变换后的标准分是不可以相加的。数据相加的前提条件是数据的测量单位之间是等间距的。引文数据在进行标准化变换前,每一次被引(即测量单位)与每一次被引之间都是等间距的,这时的原始被引次数当然是可以进行相加计算的。引文数据在经过非线性标准化变换后,由于非线性标准化方法是一种不等间距的变换方法,这时变换后的每一个标准分与每一个标准分之间就不再是等间距的了,因而这时的非线性标准分是不可以进行相加计算的。论文对于将非线性标准分相加会造成的误差影响给出了一个通俗的例子:图1中由不等间距的非线性标准分组成的尺子A无法准确测量出箱子1和箱子2的长度,而由等间距的线性标准分组成的尺子B可以准确测量出箱子1和箱子2的长度。
图1 一个解释非线性标准分不可以相加的示例
实际上,非线性变换与非等间距变换是互为充分必要条件的,线性变换与等间距变换也是互为充分必要条件的。王兴博士历时近3年对这两个定理进行了证明。
该论文的第二个主要研究工作是对现有的学科标准化方法进行了归纳梳理,将现有的主流学科标准化方法梳理归类为“线性标准化方法”“非线性标准化方法”,以及“难以归类为线性还是非线性的标准化方法”这三种类型。这种梳理归类可以使得学界和评价实践界今后更好地分辨出哪种标准化方法是非线性标准化方法,从而避免将非线性标准分进行相加的错误。此外,本文也就“将非线性标准分相加会给评价实践带来多大的误差影响”这一问题进行了实验方面的探究,这是该论文的第三个研究工作。研究发现,线性可加的CNCI指标与非线性不可加的百分数得分平均值AP指标两者的评价结果差异较大。如果将百分数得分这种非线性标准分进行相加或平均,会给评价实践结果带来较大的误差。
图2 不同数据规模尺度下线性CNCI指标和非线性百分数得分平均值AP指标的相关性
上述三项研究工作为今后学界和评价实践界科学合理地使用学科标准化方法奠定了理论基础。此外,由于该项研究工作的数学证明是在整个实数域上对所有非线性数据的证明,证明结果适用于实数域上的所有非线性数据,并不仅局限于非线性学科标准化数据,因此,该研究工作对于数据科学、情报科学领域的其他相关研究工作也有着重要的启发意义。(信息学院 王兴、孙晓宁供稿)
附:
1.论文全文链接:
https://www.sciencedirect.com/science/article/pii/S1751157724000440
2.作者简介:
王兴,山西财经大学副教授,入选“山财学者”支持计划优秀青年人才。王兴博士长期致力于科学计量学、引文分析、学科标准化、科研评价等方面的研究工作。近年来,王兴团队的相关研究成果发表在Journal of Informetrics、Malaysian Journal of Library and Information Science、Current Science、ISSI 2021、ISSI 2019、ISSI 2017、《图书情报工作》等信息资源管理领域知名期刊及学术会议上。王兴团队曾于2020年就在Journal of Informetrics上发文,探索学科标准分在短时间引文窗口下的应用问题,受到了学界一定程度的关注。这些相关成果曾被“科学网”、知名科普公众号“林墨”转载或报道:
https://blog.sciencenet.cn/blog-1792012-1220859.html(林墨报道1)
https://blog.sciencenet.cn/blog-1792012-1082805.html(林墨报道2)