标签: 人工智能可靠性

该标签下共有 2 篇文章

研究发现:ChatGPT 经常把科学知识说错,比你想象的还多

作者: aeks | 发布时间: 2026-03-22 14:02

学科: 信息资源管理 工商管理 新闻传播学 计算机科学与技术

一项新研究测试ChatGPT判断商业领域科学假设真假的能力,发现它虽能流畅作答,但正确率仅约80%,且重复提问时常给出不同答案(一致性仅73%);尤其难识别错误陈述(仅16.4%准确),实际推理能力远不如人类——提醒公众:AI会‘说人话’,未必真‘懂道理’。

标签: AI一致性测试 AI表面流畅性与真实理解 人工智能可靠性 商业决策中的AI风险

我让谷歌的“自动浏览”AI助手接管Chrome浏览器,结果并不太灵

作者: aeks | 发布时间: 2026-03-03 12:07

学科: 人工智能 网络空间安全 计算机科学与技术

谷歌推出AI自动浏览工具Auto Browse,能让AI代用户点击网页完成订票、购物、规划行程等任务。但实测发现:它虽能执行多步骤操作,却缺乏常识判断(如选相邻座位)、易误解指令、安全性存疑,目前远未达到可靠替代人工的程度。

标签: AI自动浏览 人工智能可靠性 人机协作上网 生成式AI局限性 谷歌Gemini