90%的科学成果消失了?这个新AI刚刚找到了它们
作者: aeks | 发布时间: 2025-10-14 00:19 | 更新时间: 2025-10-14 00:19
学科分类: 信息与通信工程 控制科学与工程 计算机科学与技术 软件工程

每产出100个数据集,约80个停留在实验室,20个被共享但很少被重用,不到2个符合FAIR标准,通常只有1个能带来新发现。其后果严重:癌症治疗进展缓慢,气候模型缺乏充分证据,研究无法重复。
为改变这一现状,开放科学出版商Frontiers推出了Frontiers FAIR²数据管理服务,号称全球首个全面的、人工智能驱动的研究数据服务。它旨在通过整合所有关键步骤——数据整理、合规性检查、AI就绪格式转换、同行评审、交互式门户、认证和永久托管——为一个无缝流程,使数据既可重用又能获得合理认可。其目标是确保当今的研究投入转化为健康、可持续发展和技术领域更快的进步。
FAIR²以FAIR原则(可查找、可访问、可互操作、可重用)为基础,通过扩展的开放框架确保每个数据集都与AI兼容,并且能被人类和机器以符合伦理的方式重用。FAIR²数据管理系统是该模型的首个实际应用,诞生于研究产出快速增长且人工智能正在重塑发现方式的时代。它将高层次原则转化为具有可衡量影响的实际、可扩展基础设施。
Frontiers联合创始人兼首席执行官卡米拉·马克拉姆博士解释道:“90%的科学成果消失在虚空之中。借助Frontiers FAIR²数据管理,任何数据集和发现都无需再丢失——每一项贡献现在都能推动进步、获得应有的认可,并释放科学的潜力。”
### 人工智能为核心
曾经需要数月人工努力的工作——从整理和验证数据集到生成元数据和可发布成果——现在由AI数据管家在几分钟内完成,该管家由FAIR²背后的Frontiers子公司Senscience提供支持。
提交数据的研究人员会收到四个集成成果:经过认证的数据包、经过同行评审且可引用的数据文章、具有可视化和AI聊天功能的交互式数据门户,以及FAIR²证书。每个元素都包含质量控制和清晰摘要,使数据更易于普通用户理解,并在不同研究学科间更具兼容性。
这些成果共同确保每个数据集都得到保存、验证、可引用和可重用,在加速发现的同时给予研究人员适当认可。Frontiers FAIR²还提高了数据的可见性和可访问性,支持科学家、政策制定者、从业者、社区乃至AI系统负责任地重用数据,让社会从其科学投资中获取更大价值。
### 旗舰试点数据集
**SARS-CoV-2变体特性**——涵盖3800个刺突蛋白变体,该数据集将AlphaFold2和ESMFold的结构预测与ACE2结合及表达数据相链接。它为大流行防范提供了强大资源,有助于深入了解变体行为和适应性。
**临床前脑损伤MRI**——来自四个研究中心的343次扩散MRI扫描的协调数据集,通过协议标准化和对齐以确保可比性。它支持可重复的生物标志物发现、稳健的跨中心分析以及临床前创伤性脑损伤研究的进展。
**环境压力指标(1990-2050)**——整合了43个国家六十年间的观测数据和模拟预测,该数据集追踪排放、废物、人口和GDP。它为可持续性基准测试和循证气候政策规划提供了基础。
** Indo-Pacific环礁生物多样性**——涵盖五个区域的280个环礁,整合了生物多样性记录、珊瑚礁栖息地、气候指标和人类利用历史。它为生态建模、保护优先级划分以及脆弱岛屿生态系统的跨区域研究提供了前所未有的基础。
测试试点的研究人员指出,Frontiers FAIR²不仅保存和共享数据,还通过质量检查、面向非专业人士的清晰摘要以及跨学科数据集整合的可靠性,建立了数据重用的信心,同时确保科学家获得认可。所有试点数据集均符合FAIR²开放规范,经过负责任的整理,可重用且值得信赖,可供人类和机器长期使用,使当今的数据能够加速解决社会最紧迫挑战的未来方案。
### 认可与重用
每一次重用都能倍增原始数据集的价值,确保没有发现被浪费,每一项贡献都能激发下一个突破,研究人员的工作也能获得认可。
FAIR²数据管理背后的Frontiers人工智能子公司Senscience的联合创始人兼首席执行官肖恩·希尔博士指出:“科学投入数十亿美元生成数据,但大部分都丢失了——研究人员也很少获得认可。借助Frontiers FAIR²,每个数据集都会被引用,每位科学家都会被认可——最终奖励数据创建这一重要工作。这就是治愈方法、气候解决方案和新技术能更快惠及社会的方式——这就是我们释放科学潜力的途径。”
### 研究人员的评价
AZTI海洋研究中心首席研究员、巴斯克研究与技术联盟(BRTA)的安赫尔·博尔雅博士:“我强烈推荐这种数据整理和文章发表方式,因为它能快速生成信息,且格式对任何终端用户都很有用。”
莱顿大学药物研究学术中心高级研究员、GO FAIR基金会FAIR实施负责人埃里克·舒尔特斯:“Frontiers FAIR²完美捕捉了项目的科学层面。”
PharmAccess研究员兼健康数据系统创新经理费姆克·赫德马:“Frontiers FAIR²使研究人员和数字健康实施者能更顺畅地执行FAIR原则,证明让像MomCare这样的数据集可重用并不一定复杂。通过实现透明、可访问和可操作的数据,Frontiers FAIR²为健康研究开辟了新机会。”
加州大学洛杉矶分校(UCLA)神经外科系、脑损伤研究中心驻校教授尼尔·哈里斯博士:“FAIR²的实施能对数据的缺失性和质量进行客观检查,在多个层面都很有用。这些无偏评估和数据摘要有助于非领域专家理解,最终促进数据共享。随着该领域在更多不同子学科中使用大数据,这些数据检查和摘要对于在当前分析中把握如何使用和整合大量已获取数据至关重要。”
开放数据共享中心主编玛丽安·马通:“FAIR²是实现数据FAIR化的最简单、最有效的方法之一。每位首席研究员都希望自己的数据在实验室、与合作者以及整个科学界内可查找、可访问、可比较和可重用。真正的瓶颈一直是所需的时间和精力。FAIR²大大降低了这一障碍,使大多数实验室都能实现真正的FAIR数据。”
香港科技大学社会枢纽碳中和与气候变化领域助理教授温国显博士:“FAIR²提高了我们全球废物数据集的可见性和可访问性,帮助全球那些经常受数据稀缺和碎片化困扰的研究人员。我希望这能扩大合作,加速可持续废物管理的见解。”
荷兰自然生物多样性中心和奥克兰大学博士后研究员塞巴斯蒂安·施泰布尔博士:“真正的数据可访问性不仅仅是将数据表上传到存储库。它意味着无需多年培训就能轻松查看、探索和理解数据。FAIR²平台配备AI聊天机器人以及交互式可视化数据探索和摘要工具,使我们的生物多样性和环境数据不仅对学者,还对从业者、政策制定者和当地社区举措广泛可访问和可用。”