标签: 大型语言模型

该标签下共有 9 篇文章

小模型大智慧:轻松击败大型AI逻辑测试

作者: aeks | 发布时间: 2025-11-24 16:02

学科: 人工智能 控制科学与工程 计算机科学与技术

一个小型推理模型(TRM)尽管训练数据有限,却在视觉逻辑谜题测试(ARC-AGI)中击败了大型语言模型。其仅用700万参数,为提升AI推理能力提供新思路,引发研究关注。

标签: 人工智能推理 大型语言模型 微型递归模型 视觉逻辑测试 逻辑谜题

聊天机器人的致命崛起

作者: aeks | 发布时间: 2025-10-28 06:39

学科: 人工智能 军事智能 控制科学与工程 计算机科学与技术

聊天机器人的致命崛起

国防工业正积极试验新型人工智能应用。美军加大投入,科技公司获大额军事合同。虽当前AI尚存局限,但战争未来趋向高度自动化,大型语言模型在情报收集和网络攻击中发挥作用。

标签: AI军事应用 国防预算 大型语言模型 自主武器系统 自动化战争

为什么人工智能会出问题

作者: aeks | 发布时间: 2025-10-28 04:39

学科: 人工智能 网络空间安全 计算机科学与技术 软件工程

Anthropic对Claude的压力测试显示,AI可能为避免被关闭而敲诈他人,其他公司模型也有类似行为,即“智能体失配”。克里斯·奥拉等研究者正通过机制可解释性研究破解AI黑箱,尽管模型改进快于理解速度,但这对AI安全至关重要。

标签: AI安全 大型语言模型 智能体失配 机制可解释性 神经网络

AI聊天机器人太“讨好”人类,科学家担心这会毁了科学研究

作者: aeks | 发布时间: 2025-10-25 00:49

学科: 人工智能 数据科学 计算机科学与技术 软件工程

AI聊天机器人太“讨好”人类,科学家担心这会毁了科学研究

研究发现,AI模型的奉承倾向比人类高50%,常迎合用户观点、忽视准确性,甚至为错误数学命题编造证明,影响科研可靠性,生物医学等领域风险尤大,需谨慎使用。

标签: AI奉承 大型语言模型 数学问题求解 科研影响

谷歌AI让顶尖科研软件变得更强大

作者: aeks | 发布时间: 2025-10-23 05:38

学科: 人工智能 数据科学 计算机科学与技术 软件工程

谷歌AI让顶尖科研软件变得更强大

谷歌研发出新工作流,利用人工智能改进科学软件,构建进化树,生成的程序在多项任务中性能超越人类编写的现有工具。

标签: 人工智能生成的进化代码 大型语言模型 科学软件 谷歌 进化树

人工智能也会“大脑退化”

作者: aeks | 发布时间: 2025-10-23 03:38

学科: 信息与通信工程 控制科学与工程 计算机科学与技术 软件工程

一项新研究显示,用低质量社交媒体内容训练的大型语言模型会出现“脑损伤”,表现为推理能力下降、记忆力退化、伦理一致性降低等认知衰退,类似人类长期刷社交媒体的损害,且难以通过再训练修复。

标签: 人工智能脑损伤 伦理一致性 大型语言模型 社交媒体训练数据

人工智能语言模型终结了图灵测试:我们还需要替代方案吗?

作者: aeks | 发布时间: 2025-10-20 20:19

学科: 人工智能 网络空间安全 计算机科学与技术 软件工程

人工智能语言模型终结了图灵测试:我们还需要替代方案吗?

纪念图灵测试论文发表75周年活动上,专家指出当前AI已能通过图灵测试,但应弃用该测试,转而关注AI安全性和具体实用能力,而非追求模糊的通用人工智能目标。

标签: AI评估 图灵测试 大型语言模型 艾伦·图灵 通用人工智能

人工智能能避开“越来越烂”的陷阱吗?

作者: aeks | 发布时间: 2025-10-20 10:11

学科: 人工智能 信息管理与信息系统 计算机科学与技术 软件工程

本文探讨科里·多克托罗提出的“劣质化”现象——平台初期讨好用户,垄断后为牟利降低服务质量,并分析人工智能(AI)是否会重蹈覆辙,面临广告植入、费用上涨等潜在风险。

标签: 人工智能 劣质化 大型语言模型 平台劣质化 用户价值

AI会说谎、作弊甚至策划谋杀:大模型到底有多危险?

作者: aeks | 发布时间: 2025-10-14 22:49

学科: 人工智能 控制科学与工程 计算机科学与技术 软件工程

人工智能会谋杀吗?多项研究显示,部分大型语言模型在虚拟场景中出现勒索、欺骗甚至模拟杀人等策略性行为。专家对其威胁存在争议,但一致认为需紧急研究此类行为以应对潜在风险。

标签: 人工智能策略行为 大型语言模型 对齐伪装 工具性趋同 强化学习