arXiv严打AI灌水论文:提交垃圾将遭一年禁投稿

针对日益泛滥的AI生成预印本问题,arXiv平台近期宣布新规:任何被认定为提交AI生成“垃圾”论文的作者,将被暂停投稿资格长达一年。此举旨在维护学术质量,但也引发关于审查标准和AI辅助写作边界的热议。

预印本平台arXiv一直是学术界快速分享研究成果的重要阵地,但近年来,随着生成式AI工具的普及,大量由AI草草生成的论文涌入平台,不仅质量低劣,甚至包含虚构内容与虚假数据,严重污染了学术生态。近日,一位arXiv版主在社交媒体上曝光了一项激进的新政策:一旦发现作者故意提交AI生成的“垃圾”论文,该作者将被处以暂停投稿资格一年的处罚。

从泛滥到治理:arXiv的无奈之举

据透露,这项政策并非突然出台。早在2023年,arXiv就已经开始要求作者明确标注是否使用AI辅助写作,但违规行为屡禁不止。到2025年下半年,平台每月需要处理的疑似AI生成论文数量已成倍增长,管理员耗费大量精力筛选和拒绝低质量稿件。这位版主在帖文中写道:“我们无法容忍作者将arXiv当作测试AI模型的游乐场。一次违规,全年禁投。这不是威胁,是规则。”

“我们无法容忍作者将arXiv当作测试AI模型的游乐场。一次违规,全年禁投。这不是威胁,是规则。”——arXiv版主匿名发言

虽然官方尚未正式发布完整细则,但已有消息称,判定标准将结合人工审核与AI检测工具。一旦被认定,作者名下所有待提交论文将被立即退回,且一年内不接受任何新投稿。这一处罚力度在arXiv历史上极为罕见,此前对于学术不端的最高处罚也仅是冻结账号数月。

“垃圾”的定义与争议

新规最核心的争议点在于:何为“AI生成的垃圾”?编者在分析时注意到,arXiv此轮打击重点并非所有AI辅助论文,而是那些“缺乏人类实质性贡献、内容明显空洞或错误、由AI完全代写且未经审阅”的稿件。然而,在实际操作中,完全由AI撰写但经过作者大量修改的论文是否会被误伤?使用AI进行语言润色是否算违规?目前尚不明确。

多位学者在社交媒体上表达了担忧:严格的“一刀切”政策可能误伤那些利用AI进行合法辅助研究的早期职业研究者。例如,那些英语非母语、依靠AI纠正语法错误的研究人员,会不会因为工具检测的高误报率而被误判?另一方面,支持者则认为,AI生成的“学术工业废水”已经让平台不堪重负,必须采取雷霆手段才能遏制抄袭、造假和低质量灌水。

编者按:治理AI学术污染需要平衡智慧

从更深层次看,arXiv的这项政策反映了学术出版界对生成式AI复杂态度的缩影。一方面,AI确实能够提升研究效率,帮助作者快速起草草稿、整理文献;另一方面,滥用的后果是信任危机——当审稿人面对一篇看似严谨却完全虚构的实验报告时,整个同行评议体系都将受到威胁。

我们观察到,在ChatGPT等大模型普及后的两年里,包括《自然》《科学》在内的顶级期刊相继更新作者指南,要求明确声明AI使用情况。但arXiv作为预印本平台的特殊性在于:它不进行常规同行评议,审核主要基于格式和基本的科学合理性。这使得AI生成内容的过滤更加困难。一年禁投令的威慑力或许能暂时减少明目张胆的灌水,但长远来看,平台仍需建立更精细的AI使用规范,并与学界共同探索人机协作的学术诚信底线。

本文编译自Ars Technica