启动人工智能创业公司,你需要了解的那些事

作者: aeks | 发布时间: 2025-12-14 10:13 | 更新时间: 2025-12-14 10:13

学科分类: 工商管理 管理科学与工程 计算机科学与技术 软件工程

现实比她预想的要困难得多。最近,我与伯恩斯坦(Bornstein)及其首席技术官玛丽亚·别洛乌索娃(Maria Belousova)共进早餐,了解她的初创公司Daydream。该公司获得了谷歌风投等风险投资机构5000万美元的投资。谈话意外转向,两位女士向我讲述了将人工智能系统的魔力转化为人们真正觉得有用的东西时所面临的惊人困难。

她的故事有助于解释一些现象。我2025年的第一期通讯曾宣布,2025年将是“AI应用之年”。尽管确实有很多这类应用,但它们并未如我预期的那样改变世界。自2022年底ChatGPT推出以来,人们对人工智能的“绝技”感到惊叹,但多项研究表明,这项技术尚未显著提升生产力(编码领域是个例外)。2024年8月发表的一项研究发现,20个AI企业试点项目中,有19个未产生可衡量的价值。我确实认为生产力提升已近在眼前,但所需时间比人们预期的要长。倾听像Daydream这样努力寻求突破的初创公司的故事,让人看到一丝希望:坚持和耐心或许真能带来突破。

时尚达人的挫折
伯恩斯坦最初向风投机构的推介看似理所当然:利用人工智能解决棘手的时尚难题,为顾客匹配完美服装,顾客会乐于为此付费(Daydream从中抽成)。你可能觉得搭建过程很简单——只需接入ChatGPT等模型的API就能顺利启动,对吧?嗯,并非如此。签约265多家合作伙伴(涵盖从精品店到零售巨头的200多万种产品)反而是容易的部分。事实证明,即便是满足“我需要一条巴黎婚礼穿的裙子”这样简单的请求,也异常复杂。你是新娘、婆婆还是宾客?什么季节?婚礼有多正式?你想传递什么风格信号?即便这些问题都解决了,不同的AI模型对此类问题的看法也各不相同。“我们发现,由于模型缺乏一致性和可靠性,再加上幻觉问题,有时模型会遗漏查询中的一两个要素。”伯恩斯坦说。在Daydream漫长的测试版中,有用户会说:“我是矩形身材,但我需要一条能让我看起来像沙漏身材的裙子。”模型却会展示几何图案的裙子。

最终,伯恩斯坦明白她必须做两件事:推迟应用原计划2024年秋季的发布(尽管目前已可使用,但Daydream在技术上仍处于测试阶段,直至2026年某个时候),并升级技术团队。2024年12月,她聘请了Grubhub前首席技术官别洛乌索娃,后者又带来了一支顶尖工程师团队。在激烈的人才争夺战中,Daydream的秘密武器是有机会解决一个极具吸引力的问题。“时尚领域非常有吸引力,因为它涉及品味、个性化和视觉数据,”别洛乌索娃说,“这是一个尚未解决的有趣难题。”

此外,Daydream必须解决两个问题:首先解读顾客的需求,然后将他们有时奇特的标准与商品目录中的产品匹配。比如用户输入“我要参加前夫和他新婚妻子出席的成人礼,需要一条复仇裙”,这种情况下,准确理解需求至关重要。“在Daydream,我们有‘购物者词汇’和‘商家词汇’的概念,”伯恩斯坦说,“商家用类别和属性描述商品,而购物者会说‘我要去这个活动,在屋顶举办,和男朋友一起’。如何在实际运行时将这两种词汇融合?有时需要多次对话迭代。”Daydream意识到仅靠语言是不够的。“我们使用视觉模型,能更细致地理解产品。”她说。顾客可能会分享特定颜色,或展示要搭配的项链。

伯恩斯坦表示,Daydream随后的全面整改取得了更好的效果(不过我试用时,搜索“黑色礼服裤”,结果除了黑色款,还出现了米色运动款——毕竟还是测试版)。“我们最终决定从单一模型调用转向多个模型的组合,”伯恩斯坦说,“每个模型负责特定任务:一个处理颜色,一个处理面料,一个处理季节,一个处理场合。”例如,Daydream发现,就其用途而言,OpenAI模型非常擅长从服装角度理解世界;谷歌的Gemini虽然稍逊一筹,但速度快、精度高。

从一开始,Daydream就明白人工智能需要人类的帮助。用户常请求查看海莉·比伯(Hailey Bieber)风格的服装。Daydream没有完全依赖AI,而是让团队人工创建了满足这一需求的裙子系列,足以让模型理解还有哪些服装能满足此类需求。当“田园风”这类突发潮流出现时,团队会立即行动创建相关系列。伯恩斯坦现在相信,经过额外的努力和大量耐心,她走在正确的道路上。

谁是南希?
伯恩斯坦告诉我,其他AI初创公司的同行也面临类似挑战。Duckbill是一项利用AI高效提供个人服务的服务,类似人类助理。首席执行官梅根·乔伊斯(Meghan Joyce)表示,Duckbill的计划一直是结合人类和AI协助,其中AI代理是真正的差异化优势。经过三年努力,她说Duckbill终于取得了预期成果,但缺点是她从没想过这需要三年时间。

“AI方面的挑战比想象中大得多,”她说,“模型是在数字内容上训练的,我们花了1000万次真实世界互动,才达到与现实行动相关或具备相关知识的程度。”一个长期问题是,大型语言模型往往对自身能力过度自信。Duckbill的系统要求AI模型将复杂任务交给人类,但模型却总爱“不懂装懂”。在一次测试中,AI代理被要求模拟给医生办公室打电话预约的流程。尽管实验只要求演示步骤,但模型却宣称已和一位名叫南希的 receptionist 通了电话并完成预约。“我们四处查证:真的打电话了吗?谁是南希?”乔伊斯说,“模型如此笃定,甚至让我们开始怀疑自己。”但根本没有南希,也没有预约。“幸好这只是原型阶段。”乔伊斯说。

AI初创公司遇到的另一个问题是:尽管它们专注于特定领域的服务,但所授权的模型却随时愿意参与各种话题的对话,很难判断对话何时偏离相关性。“我们原以为人们只会问某些特定问题,我们在这些问题上做得很好。”Mindtrip首席执行官安迪·莫斯(Andy Moss)说,该公司提供AI“旅行伙伴”服务。当用户提出团队未考虑过的问题时,对话就可能跑偏。“我们必须围绕这些问题进行设计调整。”他说。

我采访的三位首席执行官都表示,经过大量努力和人才投入,他们终于走上了正轨。但他们的经历对那些时间表过于乐观的AI初创公司是个警示。这也是我改变时间表的原因。现在我认为,人工智能可能要到2026年才能迎来转折点,显著提升世界生产力,或者稳妥点说,2027年。

标签: AI创业公司 AI应用 AI模型挑战 人工智能生产力 人机协作