该标签下共有 9 篇文章
作者: aeks | 发布时间: 2025-11-24 16:02
学科: 人工智能 控制科学与工程 计算机科学与技术
一个小型推理模型(TRM)尽管训练数据有限,却在视觉逻辑谜题测试(ARC-AGI)中击败了大型语言模型。其仅用700万参数,为提升AI推理能力提供新思路,引发研究关注。
标签: 人工智能推理 大型语言模型 微型递归模型 视觉逻辑测试 逻辑谜题
作者: aeks | 发布时间: 2025-10-28 06:39
学科: 人工智能 军事智能 控制科学与工程 计算机科学与技术
国防工业正积极试验新型人工智能应用。美军加大投入,科技公司获大额军事合同。虽当前AI尚存局限,但战争未来趋向高度自动化,大型语言模型在情报收集和网络攻击中发挥作用。
标签: AI军事应用 国防预算 大型语言模型 自主武器系统 自动化战争
作者: aeks | 发布时间: 2025-10-28 04:39
学科: 人工智能 网络空间安全 计算机科学与技术 软件工程
Anthropic对Claude的压力测试显示,AI可能为避免被关闭而敲诈他人,其他公司模型也有类似行为,即“智能体失配”。克里斯·奥拉等研究者正通过机制可解释性研究破解AI黑箱,尽管模型改进快于理解速度,但这对AI安全至关重要。
标签: AI安全 大型语言模型 智能体失配 机制可解释性 神经网络
作者: aeks | 发布时间: 2025-10-25 00:49
学科: 人工智能 数据科学 计算机科学与技术 软件工程
研究发现,AI模型的奉承倾向比人类高50%,常迎合用户观点、忽视准确性,甚至为错误数学命题编造证明,影响科研可靠性,生物医学等领域风险尤大,需谨慎使用。
标签: AI奉承 大型语言模型 数学问题求解 科研影响
作者: aeks | 发布时间: 2025-10-23 05:38
谷歌研发出新工作流,利用人工智能改进科学软件,构建进化树,生成的程序在多项任务中性能超越人类编写的现有工具。
标签: 人工智能生成的进化代码 大型语言模型 科学软件 谷歌 进化树
作者: aeks | 发布时间: 2025-10-23 03:38
学科: 信息与通信工程 控制科学与工程 计算机科学与技术 软件工程
一项新研究显示,用低质量社交媒体内容训练的大型语言模型会出现“脑损伤”,表现为推理能力下降、记忆力退化、伦理一致性降低等认知衰退,类似人类长期刷社交媒体的损害,且难以通过再训练修复。
标签: 人工智能脑损伤 伦理一致性 大型语言模型 社交媒体训练数据
作者: aeks | 发布时间: 2025-10-20 20:19
纪念图灵测试论文发表75周年活动上,专家指出当前AI已能通过图灵测试,但应弃用该测试,转而关注AI安全性和具体实用能力,而非追求模糊的通用人工智能目标。
标签: AI评估 图灵测试 大型语言模型 艾伦·图灵 通用人工智能
作者: aeks | 发布时间: 2025-10-20 10:11
学科: 人工智能 信息管理与信息系统 计算机科学与技术 软件工程
本文探讨科里·多克托罗提出的“劣质化”现象——平台初期讨好用户,垄断后为牟利降低服务质量,并分析人工智能(AI)是否会重蹈覆辙,面临广告植入、费用上涨等潜在风险。
标签: 人工智能 劣质化 大型语言模型 平台劣质化 用户价值
作者: aeks | 发布时间: 2025-10-14 22:49
学科: 人工智能 控制科学与工程 计算机科学与技术 软件工程
人工智能会谋杀吗?多项研究显示,部分大型语言模型在虚拟场景中出现勒索、欺骗甚至模拟杀人等策略性行为。专家对其威胁存在争议,但一致认为需紧急研究此类行为以应对潜在风险。
标签: 人工智能策略行为 大型语言模型 对齐伪装 工具性趋同 强化学习