大四学生一年发表40多篇SCI论文,是新型学术不端吗?

■赵广立

最近,温州医科大学第二临床医学院大四学生洪某某,因大量、高频发表论文而引发关注。谷歌学术主页显示,洪某某自2024年7月以来已参与发表了近50篇论文,其中44篇发表于SCI收录期刊,仅以第一作者或通讯作者身份署名的文章就有数十篇。无论是发表数量还是产出速度,都远超人们对一名大四学生学术水平的正常预期。

细究不难发现,这些论文存在严重的“数据换皮+模型套用”的流水线作业痕迹。

科技自媒体“知识分子”指出,洪某某和他的合作者——大部分也是医学生,并没有在实验室做实验,而是基于公开的数据集或数据库,用几种固定的分析工具,从不同角度不断生成“新论文”。比如,多篇论文是反复统计某物质与某些疾病关系的“相关性研究”。作者的分析手段也很单一,例如,以“孟德尔随机化”作为主要分析工具的论文就有十几篇。

同样的数据库、相似的分析逻辑,只需更换疾病的靶点数据,就能像搭积木一样拼凑出多个“新成果”。如此“研究”,价值几何?一位大学教授的批评一针见血:这类“先在数据中寻找显著性,再为结果补写假设”的做法,并非源自清晰的科学问题;即便统计学上偶然成立,也只是随机巧合的产物。

不过,利用现有数据进行分析研究就是错吗?恐怕不能这样下定论。从数据中挖掘规律,本是一种研究范式。应该看到,这位学生展现的工具运用能力、整合数据开展分析研究的能力,在人工智能(AI)时代很有价值。若能正确引导,未必不能为以后的实验性、创造性研究奠定基础。

那么问题来了,这些基于公共数据库、靠固定分析方法批量生成的论文,既没有传统学术不端中的“抄袭伪造”,又符合相关规则要求,究竟应该是技术赋能下的“研究范式变革”,还是需要警惕的“新型学术不端”?进一步地,我们该如何评价这样的“研究者”?

要回答这个问题,不能仅看表面。或许此类行为并未构成传统意义上的学术不端,但这种低水平重复、套用模板批量生产论文的做法,会不可避免地挤占公共学术资源,对学术生态造成破坏,产生不良示范效应,应该坚决予以遏止。而学校对这类“学术投机”不加甄别地追捧,显然不妥。

特别是在生成式AI的时代,论文生产、学术评价以及二者的关系,正日益发生深刻的变化。近日发表于《科学》的一项研究指出,像ChatGPT这样的AI工具正在大幅增加论文产量,但并没有增加多少科学价值。此类文本数量的不断增加,也使同行评议、资金决策和科研监督变得更加复杂。作者担心,编辑和审稿人可能更难识别出有价值的投稿,而单纯的发表数量也不再能反映科学贡献。

模式化的流水线作业也好、生成式AI辅助也罢,它们的出现并非简单制造了一种新型学术不端,而是动摇了既有学术伦理赖以运作的技术根基。对此,中国人民大学全民阅读教育研究院院长郭英剑提出,AI时代的学术伦理重建“必须回到学术贡献本身”,生成式AI也并非学术伦理的终结者,而是一面迫使学术界重新思考“何为学术贡献”的镜子。

批量生产论文这类现象的背后,恐怕并不仅是个体行为是否失当失范——当高校将SCI论文数量与保研、奖励直接挂钩,当职称评定仍深陷“唯论文”的泥潭,就必然会催生“为发表而研究”的功利主义。类似温州医科大学在官网发布的“本专科学生发表SCI、SSCI、A&HCI收录刊物可获得4000元奖励”,客观上就为这种“流水线论文”提供了土壤。这与科技自立自强的时代呼声显得极不协调。

而这个代表性案例更像是大数据时代的一面“放大镜”,让我们更直观地看到,学术评价的指挥棒若指挥不当,研究者可能就此陷入“论文崇拜”、走向“学术投机”。而当“唯论文”的风吹到了本科生乃至中学生群体,高校等责任主体高喊的“破五唯”,就真的再也不能只是一句口号,而是要真刀真枪真破、必须采取实质行动了。

免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。

2、如因作品内容、版权和其他问题请与本站管理员联系,我们将在收到通知后的3个工作日内进行处理。