Thursday, July 31, 2025

人类轻松应对AI常失误测试或成通用人工智能突破关键

必读文章

Image 0

人工智能在近年来取得了长足进步,诸如对话流畅性、阅读理解和复杂物理计算等任务,AI的表现已超越人类。但是,那些对人类来说简单甚至有趣的问题,却常常成为AI难以攻克的难题。这反映了人工智能与真正的人工通用智能(AGI,Artificial General Intelligence)仍存在显著差距。

AGI 的核心能力在于「泛化」和适应能力,即 AI 能够在仅获得少量信息后,适应全新的未知情境。这种能力是人类学习的基础,而目前的 AI 模型还远未达到这一水平。

Image 1

ARC基准测试:衡量智能的独特方法

由AI研究员弗朗索瓦·乔莱特(François Chollet)于2019年开发的“抽象与推理语料库”(Abstraction and Reasoning Corpus,简称ARC)是一种用于评估AI泛化能力的创新测试。ARC通过一系列小型彩色网格拼图来考察解决者是否能揭示隐藏规则并将其应用到新的网格中。这类测试考验的是学习的样本效率和逻辑推理能力,而不仅仅是知识储备。

基于ARC测试的ARC大奖基金会目前已成为行业权威,其创新性测试已被所有主要AI模型广泛应用。基金会近期宣布推出新一代测试“ARC-AGI-3”,这一版本将彻底改变测试形式,以互动性视频游戏为核心来评估AI代理的学习和适应能力。

ARC大奖基金会主席、AI研究员兼创业者格雷格·卡姆拉特(Greg Kamradt)在接受《科学美国人》的采访中,深入解析了ARC测试如何衡量智能差异,揭示了目前AI面临的挑战,以及为何这些问题对于深度学习模型极具挑战,却被许多普通人轻松解决。

人工通用智能的定义与挑战

“我们对智能的定义是学习新事物的能力,”卡姆拉特解释道。“AI已经可以击败人类棋手,或在围棋水平上超越人类。但这些模型无法泛化到全新领域,例如去学习一门语言或掌握驾驶技能。这意味着它们仍然局限于特定范围内的学习能力。”

Image 2

卡姆拉特进一步区分了两种对AGI的定义。一种技术导向的定义是,AI是否能够达到与人类相匹敌的学习效率,比如在没有预设训练数据的情况下学会驾驶或解决问题。另一种观察性的定义则是,是否可以找到人类能够解决但AI无法解决的问题——只要这个条件存在,我们就还没有实现AGI。

为什么ARC测试对AI困难重重?

卡姆拉特指出,ARC测试的独特之处在于开发的任务必须可由普通人类解决。这完全不同于其他测试中经常出现的超高难度学术问题。“我们并不是想证明AI比人类更聪明,因为这一点已经显而易见了。但相比之下,AI缺乏人类的泛化能力,这正是ARC测试所试图衡量的核心。”

在最近的ARC-AGI-2测试中,基金会邀请了400名参与者进行实验。这些任务对人类来说相对简单,但对于AI却极具挑战性,展现了AI在学习样本效率上的差距。尽管参与者平均得分达到66%,团队的集体智慧却能够解答所有问题,而AI至今仍难以达标。

“人类可以通过一两个例子快速掌握小技能,这是AI目前无法做到的事情,”卡姆拉特补充道。“人类的学习算法在效率和灵活性上仍然领先于AI。”

Image 3

ARC-AGI-3:将测试引入互动环境

ARC-AGI-3测试引入了全新的互动形式,借助视频游戏来评估AI代理。这些视频游戏是二维像素化谜题,分为多个关卡,每个关卡设计用于教授一项特定技能。玩家需要通过计划行动序列以完成关卡,从而展示对所学技能的掌握。

卡姆拉特解释道,与传统的静态问题形式不同,视频游戏测试环境可以更真实地模拟动态决策场景。“传统的AI测试基本上是无状态的——问题问答的单向形式无法评估诸如探索和规划能力。而ARC-AGI-3将通过互动视频游戏对这些高阶智能能力进行考验。”

初期结果显示,现有的AI系统尚未通过ARC-AGI-3中的任何一关。而这些视频游戏对人类来说并非难题。

人工智能研究的新领域与机遇

尽管AI的能力已在很多领域超过人类,但ARC测试敲响了关于AGI发展进程的警钟。卡姆拉特指出,这不仅是技术挑战,更是重新定义智能的机会。“我们需要清楚分辨,当前AI的强项是什么,而未来又需要克服哪些关键弱点。”

ARC-AGI-3的推出标志着测试前沿的革新,也提醒我们距离真实的人工通用智能还有一段路。然而,这些挑战将推动科学家和工程师深入探索机器学习领域的新边界,为AI的发展注入新的动力。

(本文根据采访内容整理,部分细节已编辑优化以确保表达的准确与流畅。)

Image 100


[硅基科学网出品] [人工智能泛化能力] [ARC测试与AGI挑战] [AI学习效率差距] [人工通用智能发展趋势] [刘智勇频道] [真机智能] [机器姬智能体] [机器洞察网] [AI之星网] [风投高科网] [猛虎财经网] [硅基科学网] [人形纪元网] [黄金广告位]


📚 【精品资源】添加关注『硅基科学网微信公众号』,即可免费获取完整版《刘智勇频道第五卷》


- Advertisement -spot_img
  1. 人工智能不断进化,但它也提醒我们,只有人类保持思考力和创造力,才能把握未来!

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -spot_img
最新新闻

实验室成功培育超硬六方钻石

“当人类以智慧重塑自然的奇迹,突破的不只是科学的界限,更是未来无尽的可能。” — 六方晶钻石启示
- Advertisement -spot_img

更多类似的文章

- Advertisement -spot_img