ArXiv新规:全用AI写论文将被封号一年

预印本平台ArXiv宣布将严厉打击在科学论文中不加节制使用大语言模型的行为。新政策规定,若被发现完全依赖AI生成内容、未进行实质性人工贡献的作者,将被禁止提交论文一年。此举旨在维护学术诚信,遏制AI在科研写作中的滥用。ArXiv作为全球最大的预印本库之一,其新规可能引发学界对AI辅助研究边界的进一步讨论。

知名预印本存储库ArXiv近日宣布,将实施更加严格的政策以打击科学论文中不负责任地使用大型语言模型(LLM)的行为。根据新规,如果作者被认定完全依赖AI完成研究工作——即AI承担了从文献综述到结果撰写等全部核心任务——将面临为期一年的禁止提交新论文的处罚。

ArXiv是科学家们广泛使用的研究成果共享平台,尤其在物理、数学、计算机科学等领域拥有巨大影响力。近年来,随着GPT-4、Claude等大模型的普及,一些论文中出现了明显的AI生成痕迹,如重复性句式、捏造参考文献等。ArXiv此前的政策仅要求作者在论文中注明是否使用了AI辅助工具,但未能有效遏制滥用现象。

新规核心:区分合理使用与完全替代

据ArXiv官方博客文章,新政策明确区分了两种情况:一是将AI作为辅助工具(如润色语言、优化代码),这是被允许的;二是完全由AI生成研究内容,没有人类作者的实质性智力贡献。后者将被视为学术不端。ArXiv表示,他们将利用检测工具和人工审查相结合的方式发现违规行为,并且允许其他学者举报。

“我们并不反对使用AI,但科学论文必须反映作者的原始思考和实验。当AI成为事实上的‘作者’时,论文便失去了最根本的价值。”——ArXiv管理团队声明

值得注意的是,处罚力度相当严厉:首次违规者将被禁止提交论文12个月,同时已发布的违规论文可能被撤回。这一措施在预印本领域尚属首次,比许多传统期刊的规定更为严格。

行业背景:学术出版界的AI围剿战

ArXiv并非孤例。近年来,全球学术出版界已掀起一场针对AI写作的“围剿战”。《自然》(Nature)、《科学》(Science)等顶级期刊早已禁止将AI列为作者,并要求作者明确声明AI使用情况。预防印本平台也在跟进——今年早些时候,与PubMed Central相关的几个存储库开始要求作者提交AI使用声明。

但ArXiv的新规之所以引发更大关注,在于其独特的社区治理模式。作为非营利性平台,ArXiv依赖志愿者团队进行审核,此前一直相对宽容。此次转向强硬策略,反映了学界对AI侵蚀学术原创性的普遍担忧。

据TechCrunch记者Anthony Ha报道,一些研究人员私下表示,新规可能难以执行,因为“完全由AI生成”的界定标准模糊。例如,如果AI帮助生成实验设计思路,人类再进行验证,这算不算“完全替代”?ArXiv表示将制定详细指引,并鼓励作者主动披露。

编者按:当AI成为“代笔”,谁为研究负责?

ArXiv的新规本质上在回答一个根本问题:在科学研究中,人类的核心价值究竟是什么?笔者认为,AI可以成为强大的加速器,但绝不能成为“假作者”。一个可以预见的趋势是,未来所有学术平台都会要求更透明的AI使用记录——类似软件开发的版本控制。或许,科研论文的“署名”方式也会演变,比如区别“构思者”“执行者”和“AI工具”。但无论如何,对创造性和责任性的坚守,是科研共同体不可退让的底线。ArXiv的“铁腕”政策虽可能引发短期争议,但长远看,有助于厘清AI在学术界的角色边界。

本文编译自TechCrunch