该标签下共有 2 篇文章
作者: aeks | 发布时间: 2026-03-22 14:02
学科: 信息资源管理 工商管理 新闻传播学 计算机科学与技术
一项新研究测试ChatGPT判断商业领域科学假设真假的能力,发现它虽能流畅作答,但正确率仅约80%,且重复提问时常给出不同答案(一致性仅73%);尤其难识别错误陈述(仅16.4%准确),实际推理能力远不如人类——提醒公众:AI会‘说人话’,未必真‘懂道理’。
标签: AI一致性测试 AI表面流畅性与真实理解 人工智能可靠性 商业决策中的AI风险
作者: aeks | 发布时间: 2026-03-03 12:07
学科: 人工智能 网络空间安全 计算机科学与技术
谷歌推出AI自动浏览工具Auto Browse,能让AI代用户点击网页完成订票、购物、规划行程等任务。但实测发现:它虽能执行多步骤操作,却缺乏常识判断(如选相邻座位)、易误解指令、安全性存疑,目前远未达到可靠替代人工的程度。
标签: AI自动浏览 人工智能可靠性 人机协作上网 生成式AI局限性 谷歌Gemini