独家:Adobe新AI技术可改变配音中的情绪

作者: aeks | 发布时间: 2025-10-29 21:39 | 更新时间: 2025-10-29 21:39

学科分类: 信息与通信工程 网络空间安全 计算机科学与技术 软件工程

独家:Adobe新AI技术可改变配音中的情绪
独家:Adobe新AI技术可改变配音中的情绪

Adobe将其称为“修正型AI”,这是该公司今日晚些时候在MAX Sneaks展示会上演示的众多功能之一,该展示会是更大型年度MAX会议的一部分(Adobe支付了我参加MAX会议的部分差旅费)。Sneaks是Adobe展示其正在研发的未来技术和原型的平台,其中许多功能最终会在数月内整合到Adobe全套创意套件中。

今年MAX大会期间,Adobe发布了Firefly的生成式语音功能,该功能不仅允许用户使用多种预设语音,还能添加情感标签来改变语调。而这项修正型AI功能则将该功能融入了更实用的工作流程——无需使用完全由AI生成的语音,用户可以修饰现有的语音表演。

Adobe的李·布里梅洛还向我展示了AI如何提取单个音轨的不同部分来创建多个音轨。名为“纯净录制”(Project Clean Take)的Sneaks原型目前最多支持五个音轨,但它能分离人声、环境噪音、音效等。AI模型分离音轨的精确度令人惊讶。在一个示例中,Adobe展示了有人在吊桥前讲话,吊桥钟声完全盖过人声,运行AI模型后,钟声消失了;更棒的是,用户还能通过单独调整这些分离音轨的音量将钟声重新调回。

在另一个示例中,Adobe演示了这对在公共场所拍摄的创作者有何用处,尤其是当背景中有受版权保护的音乐时。众所周知,在YouTube等平台的自动系统中,未经授权使用音乐很容易导致版权警告。演示中,Adobe的AI模型能分离音乐,用Adobe Stock中的相似音轨替换,并添加效果以赋予其原音轨的混响和氛围,这一切只需点击几下。

这些功能利用AI解决视频编辑和创作者的日常问题,帮助修复受损音频或省去重新录制人声表演的时间和麻烦。Adobe在Sneaks展示会上还将展示新的生成式AI功能。对于音效设计师,该公司向我展示了其AI模型如何自动分析视频并添加音效,据称这些音效均由AI生成且可安全商用。

Adobe的奥里奥尔·涅托加载了一段包含几个场景和旁白但没有音效的短视频。AI模型分析视频并将其分解为场景,为每个场景添加情感标签和描述,然后生成音效。例如,AI模型识别到闹钟场景,便自动创建了闹钟音效;识别到主角(此处是一只章鱼)开车的场景,便添加了关门音效。

不过这些功能并非完美无缺。闹钟声不够真实,在两个角色拥抱的场景中,AI模型添加了不自然的衣服摩擦声,效果不佳。但Adobe无需手动编辑,而是使用类似ChatGPT的对话界面描述修改需求。比如在汽车场景中没有车内环境音,用户无需手动选择场景,只需通过对话界面让AI模型添加汽车音效,AI便能成功找到场景、生成音效并完美放置。

这些实验性功能目前尚未推出,但通常会逐步整合到Adobe套件中。例如,Photoshop中的“和谐融合”功能(能自动将素材以准确的色彩和光线融入场景)去年在Sneaks展示,现已纳入Photoshop。预计这些新功能将于2026年某个时候推出。

Adobe宣布这些功能的几个月前,视频游戏配音演员结束了近一年的罢工,以争取AI相关保护——当游戏开发商想通过AI重现配音演员的声音或形象时,公司需获得同意并提供披露协议。配音演员长期以来一直在为AI对行业的影响做准备,而Adobe的新功能(即便并非从头生成旁白)也再次标志着AI正推动创意产业发生转变。

标签: AI音频视频功能 Adobe MAX Sneaks 人工智能音效 创意产业