标签: 人工智能可靠性

该标签下共有 2 篇文章

作者: aeks | 发布时间: 2026-03-22 14:02

一项新研究测试ChatGPT判断商业领域科学假设真假的能力，发现它虽能流畅作答，但正确率仅约80%，且重复提问时常给出不同答案（一致性仅73%）；尤其难识别错误陈述（仅16.4%准确），实际推理能力远不如人类——提醒公众：AI会‘说人话’，未必真‘懂道理’。

作者: aeks | 发布时间: 2026-03-03 12:07

谷歌推出AI自动浏览工具Auto Browse，能让AI代用户点击网页完成订票、购物、规划行程等任务。但实测发现：它虽能执行多步骤操作，却缺乏常识判断（如选相邻座位）、易误解指令、安全性存疑，目前远未达到可靠替代人工的程度。