一个新平台欢迎人工智能撰写和评审的论文

作者: aeks | 发布时间: 2025-12-16 14:02 | 更新时间: 2025-12-16 14:02

学科分类: 信息与通信工程 网络空间安全 计算机科学与技术 软件工程

在大多数科学出版物中,人工智能(AI)参与合著的论文并不受待见,但在一个名为aiXiv的新开放平台上,这类论文却得到了接纳。该平台完全拥抱AI:既接受AI撰写的作品,也接受人类撰写的作品,还会利用内置的AI评审工具进行基线质量筛选,并根据聊天机器人的反馈指导作者修改。aiXiv的创建者之一、曼彻斯特大学AI与商业专业的博士生黄国伟表示:“AI生成的知识不应被区别对待,我们只应关注质量——而非谁创作了它。”

目前该平台尚处于早期阶段,11月中旬更新后仅托管了几十篇论文和早期提案。但许多研究人员认为,它有望缓解不堪重负的人类同行评审系统,该系统因合法及违规使用AI导致的论文数量激增而压力巨大。俄勒冈州立大学计算机科学荣誉退休教授托马斯·迪特里希指出:“自动化科学领域必须承担起评估自身研究的责任。”

不过,迪特里希等人提醒,aiXiv和其他对AI友好的尝试不可避免地要应对科学领域长期存在的挑战,比如欺诈性研究和肤浅的同行评审。他说:“这些模型越来越擅长模仿科学研究的样子,但不一定能成为更优秀的科学家。它们如何确保研究是真实的?”

目前,科学出版商在如何处理AI的问题上几乎没有达成共识,而AI正在许多领域推动论文产出。许多期刊(包括《科学》杂志)仍完全禁止AI生成的稿件,另一些则允许AI辅助写作,但要求披露。

预印本服务器也感受到了压力。arXiv因可疑论文增多,于10月宣布将不再托管计算机科学评论和立场文件,除非它们已通过同行评审。迪特里希担任该服务器计算机科学部门主席,他表示:“自动化的AI撰写文档确实破坏了arXiv的模式。”

另一些机构正转向AI工具本身。运营bioRxiv和medRxiv的非营利组织openRxiv上月表示,面对可能由AI辅助的论文激增,将添加AI评审工具以快速生成对预印本的反馈。但这些服务器与大多数会议和期刊一样,仍禁止将AI系统列为作者,这种立场无意中促使研究人员在不披露的情况下使用AI。黄国伟称这种缺乏透明度“完全不可接受”。

这也是他与多伦多大学、牛津大学、清华大学等机构的合作者共同创建aiXiv的原因之一。该平台还与新加坡Bohrium、中国DP Technology等科技公司有合作,自称是首个“面向AI时代可扩展科学产出的结构化同行评审和迭代出版基础设施”。

稿件提交后,五个“智能体”(经过调优可自主完成任务的大型语言模型)会评估其新颖性、技术合理性和潜在影响。系统包含反欺诈措施,例如可检测作者是否试图在稿件中植入隐藏指令以获取有利评审。若五个智能体中有三个建议接受,作品就会被发布。作者可根据智能体的反馈修改并重新提交,进入新一轮评审。创建者在8月的预印本中称,初步测试表明这种迭代循环能提高AI生成论文的质量。黄国伟补充说,aiXiv的基础设施可支持数千份提交,通常1-2分钟就能生成评审结果,而传统同行评审则需要数月甚至数年。

到目前为止,该网站的提交内容五花八门,从非传统物理理论到利用“热舒适度测试”评估AI感知能力的研究。多伦多大学AI研究员张鹏松表示,该网站目前并未正式“接受”论文,而是所有提交内容都在发布,同时平台正对AI评审工具进行优化实验。

其他地方的早期实验表明这个问题可能很棘手。10月的Agents4Science会议首次让AI同时担任第一作者和评审员,结果喜忧参半:评审系统擅长发现数值不一致或参考文献不匹配,但对论文的新颖性和影响往往给出过于乐观的评价。斯坦福大学生物医学数据科学家、该会议组织者詹姆斯·邹表示,与结构严密的会议相比,预印本服务器的内容“异质性更强,漏洞更多,更难发现”。

人们将密切关注aiXiv能否避免这些问题。哥本哈根大学生物伦理学家塞巴斯蒂安·波尔斯达姆·曼补充道:“他们必须保持警惕,确保aiXiv不会成为垃圾场。如果该平台与低质量论文数量挂钩而非科学严谨性,将使整个AI主导的研究领域失去合法性,并拖累所有优秀的AI研究。”

aiXiv的创建者们仍持乐观态度。张鹏松提到,团队收集了尚未发表的数据,对比了aiXiv的智能体评审与10月某大型机器人会议上30篇论文的人类评审结果。他称AI评审员的分数与人类基本一致,在某些情况下还能提供更详细的反馈。

波尔斯达姆·曼表示:“至少,关于AI评审和AI科学的许多问题在当前系统中也存在,AI只是迫使这些问题暴露出来。”卡内基梅隆大学计算机科学家尼哈尔·沙阿对此表示同意,他说aiXiv的出现只是加速了关于如何更好地“追踪来源并以可验证的方式证明人们(或AI)确实做了实验”的讨论。沙阿认为AI大量参与研究几乎是不可避免的结果,aiXiv提出的问题不会消失。“无论这个平台成功与否,他们已经开启了一场精彩的讨论,这本身就值得称赞。”

DOI: 10.1126/science.zjy3i9z

标签: AI同行评审 AI生成论文 aiXiv 预印本服务器