作者: aeks | 发布时间: 2026-01-29 18:04
开发一种能跨文本、图像、视频等模态学习和生成的统一算法是人工智能的核心挑战。尽管下一个标记预测推动了大型语言模型发展,但其在多模态领域应用受限,扩散模型和视觉-语言组合框架仍占主导。本文介绍Emu3,一类仅通过下一个标记预测训练的多模态模型,性能媲美特定任务模型,无需扩散或组合架构,还能生成高保真视频、实现视觉-语言交错生成及机器人操作建模,为统一多模态智能奠定基础。
作者: aeks | 发布时间: 2026-01-29 15:02
学科: 动力工程及工程热物理 环境科学与工程 管理科学与工程 计算机科学与技术
旧金山非营利组织“全球能源监测”发现,特朗普政府在鼓励数据中心建设的同时放松电厂和油气开采污染管控,这可能导致美国温室气体排放增加,即便部分跟踪项目未建成。
作者: aeks | 发布时间: 2026-01-29 12:03
AlphaGenome是一种深度学习模型,能从100万碱基DNA序列中预测数千种功能基因组数据,达到单碱基分辨率,涵盖基因表达、染色质可及性等多种模态。它在26项变异效应预测评估中25项优于现有模型,可助力解读非编码变异机制,并提供预测工具。
输入您的推广码,获取专属推广链接: