标签: 多模态模型

该标签下共有 2 篇文章

多模态大模型如何学会“猜下一个词”

作者: aeks | 发布时间: 2026-01-29 18:04

学科: 人工智能 控制科学与工程 计算机科学与技术

多模态大模型如何学会“猜下一个词”

开发一种能跨文本、图像、视频等模态学习和生成的统一算法是人工智能的核心挑战。尽管下一个标记预测推动了大型语言模型发展,但其在多模态领域应用受限,扩散模型和视觉-语言组合框架仍占主导。本文介绍Emu3,一类仅通过下一个标记预测训练的多模态模型,性能媲美特定任务模型,无需扩散或组合架构,还能生成高保真视频、实现视觉-语言交错生成及机器人操作建模,为统一多模态智能奠定基础。

标签: Emu3模型 下一个标记预测 多模态模型 统一学习框架 视频生成

AI×机器人×八元素催化剂:3个月筛出900种配方,性能暴涨9.3倍!

作者: aeks | 发布时间: 2025-10-04 22:32

学科: 化学工程与技术 控制科学与工程 材料科学与工程 计算机科学与技术

AI×机器人×八元素催化剂:3个月筛出900种配方,性能暴涨9.3倍!

本文介绍了一种名为CRESt的多模态机器人平台,结合大模型与自动化实验,3个月内筛选900多种催化剂,发现八元合金催化剂在甲酸氧化反应中性能提升9.3倍。

标签: 人工智能 多模态模型 机器人实验 材料发现 电催化剂