再见GPT-5,你好通义千问
作者: aeks | 发布时间: 2025-12-27 21:04 | 更新时间: 2025-12-27 21:04
Rokid的高科技眼镜采用了中国电商巨头阿里巴巴开发的开源大语言模型Qwen(全称“通义千问”)。虽然Qwen并非全球最顶尖的AI模型——OpenAI的GPT-5、谷歌的Gemini 3及Anthropic的Claude在多项智能基准测试中得分更高,且它也不是首个尖端开源模型(Meta 2023年发布的Llama才是),但Qwen及深度求索(DeepSeek)、月之暗面(Moonshot AI)等其他中国模型,因性能优良且易于调整,正越来越受欢迎。据AI模型与代码平台HuggingFace数据,今年7月其平台上中国开源模型下载量已超过美国模型。深度求索曾以远低于美国竞品的计算量推出尖端大语言模型引发关注,而模型查询路由平台OpenRouter称,Qwen全年人气飙升,已成为全球第二大热门开源模型。
Qwen能满足先进AI模型的多数需求,如Rokid用户可借助它识别内置摄像头拍摄的产品、获取地图导航、起草消息、网页搜索等。由于Qwen可轻松下载和修改,Rokid托管了为自身需求微调的版本,且网络中断时,智能手机等设备也能运行其小型版本。我在访华前曾在MacBook Air安装小型Qwen练习基础普通话,发现像Qwen这样中等规模的开源模型,在许多场景下性能堪比大型数据中心的“庞然大物”。
Qwen等中国开源模型的崛起,恰逢过去12个月一些知名美国AI模型表现失准。2025年4月Meta发布的Llama 4性能未达LM Arena等热门基准测试水平,令开发者转寻其他开源模型;8月OpenAI的GPT-5也未达预期,用户抱怨其语气冷淡、存在简单错误。尽管OpenAI同月推出开源模型gpt-oss,但Qwen等中国模型因投入更多资源更新、工程细节公开度高而更受欢迎。
顶级AI会议NeurIPS上数百篇论文使用Qwen,Laude研究所(倡导美国开源模型的非营利机构)联合创始人安迪·康温斯基(Andy Konwinski)表示:“很多科学家用Qwen,因为它是最佳开源模型。”他指出,中国AI公司秉持开放理念,定期发表论文分享工程与训练技术,与美国大公司日趋封闭(怕泄露知识产权)形成鲜明对比。Qwen团队一篇关于训练中提升模型智能的论文,还获评今年NeurIPS最佳论文之一。
众多中国企业用Qwen开发产品,如中国电动汽车巨头比亚迪已将其集成到新车载智能助手;美国企业如Airbnb、Perplexity、英伟达也在使用,甚至曾是开源先驱的Meta据悉也用Qwen辅助新模型研发。康温斯基认为,美国AI公司过度专注在数学、编码等狭窄基准测试中争优势,忽视模型实际影响,“当基准测试脱离现实应用,就会陷入错位困境”。
Qwen等模型的崛起表明,衡量AI模型的关键不仅是智能度,更在于其被广泛用于构建其他事物的程度。以此标准,Qwen及中国开源模型正崭露头角。