一款AI黑马正在重塑游戏设计的规则
作者: aeks | 发布时间: 2025-12-04 10:01 | 更新时间: 2025-12-04 10:01
尽管许多AI模型能生成文本、图像和视频,但腾讯的混元(Hunyuan)系列模型却能“构想”出3D物体和交互式场景。消息人士称,腾讯的这些模型已被另一款腾讯游戏《全民卡丁车》(GKART)的开发者以及一些独立开发者所使用。腾讯对此拒绝置评。
“游戏行业需要大量投入,”消息人士表示,“以前设计一个角色可能需要一个月时间。现在只需输入一段文字,混元模型就能在60秒内给出四个选项。”
这一消息是一个早期信号,表明那些能够理解并重建物理世界的AI模型可能会成为游戏设计中的标准配置。除了生成游戏内容外,这些模型还能推动更先进的虚拟现实和增强现实技术发展,并帮助机器人学习新技能。
“如今3D视觉研究确实呈爆发式增长,”普林斯顿大学研究生亚历山大·雷斯特里克(Alexander Raistrick)表示,他正致力于研究生成3D内容的新方法。“有许多‘杀手级’应用:包括内容创作、自动驾驶,以及增强现实领域涉及的一系列问题。”
雷斯特里克补充道,视频游戏是3D AI模型的一个显而易见的应用领域。“输出3D网格模型(一种表示3D物体的标准方式)是游戏开发中最基本且常用的工作,”他说。
但是,与其他创意领域一样,使用AI创作视频游戏也存在争议。人们对AI导致失业的担忧日益加剧。一些开发者认为,含有AI生成内容的游戏应该进行标注。另一些人则表示为时已晚:这项技术在行业内已经无处不在。
腾讯于7月发布了HunyuanWorld 1.0,这是一款能生成交互式场景的模型。几个月前我对其进行了测试,探索了一个看起来像是乐高电影中的场景——一片色彩鲜艳的积木山谷向远方延伸。最近,我一直在试用一个更基础的模型Hunyuan 3D,它可以生成3D物体。我用它生成了一些非常精美的自定义《龙与地下城》角色用于3D打印。10月,腾讯发布了HunyuanWorld的新版本,用户可以上传视频来生成3D场景。
腾讯的混元模型反映了AI研究领域正在发生的更广泛转变。许多专家认为,AI模型要取得进一步发展,需要对物理世界有更深入的理解。正因如此,并非只有腾讯在开发原生3D AI模型。微软、Meta、Stability AI和字节跳动等公司都推出了3D模型,但混元模型在某一此类工具排名榜单中位居榜首。
许多初创公司也在这一领域开展着有趣的工作。World Labs由斯坦福大学计算机科学家李飞飞(Fei-Fei Li)创立,她在现代AI的构建中发挥了关键作用。该公司开发了一款名为Marble的工具,能够生成完全一致且持久的3D场景。这对于即时生成游戏或为机器人提供可靠的训练数据可能很有用。
3D AI也是学术研究的一个热门领域。斯坦福大学的一个名为“3D全才”(3D Generalist)的项目使用大型语言模型(LLM)来决定如何用新物体修改场景。普林斯顿大学的研究生雷斯特里克正在开发一种使用代码生成3D场景的方法,这种方法能让大型语言模型以更强大的方式生成场景并与之交互。而像谷歌DeepMind的SIMA 2等项目则展示了AI智能体如何与虚拟世界交互,创造新的游戏玩法。
随着具备3D能力的AI变得越来越重要,在众多渴望在该领域胜出的中国AI企业中,腾讯可能会成为日益重要的参与者。除了开发一些全球最受欢迎的视频游戏和电影外,腾讯还运营着微信——一款在中国无处不在、功能广泛的聊天应用。腾讯还有自己的聊天机器人“元保”(YuanBao),已集成到微信中。但在日益3D化的AI世界里,腾讯的视频游戏开发能力可能会为其带来独特优势。