斯坦福HAI《2025年人工智能指数报告》精华
作者: Stanford HAI (斯坦福人工智能研究院)
编译:Felix,PANews
斯坦福 HAI 近期发布了长达 456 页的《2025 年人工智能指数报告》。以下是人工智能趋势的一些关键要点:
1. 人工智能变得比想象的要强大得多
在新的基准测试 MMMU、GPQA 和 SWE-bench 中,人工智能的表现大幅提升:得分分别提高了 18.8%、48.9% 和 67.3%。除了基准测试外,人工智能系统在生成高质量视频方面取得重大进展,在某些情况下,大型语言模型(LLM)甚至在限时的编程任务中超越了人类。
注:
MMMU 是一个精心设计的新型基准,专为大学水平的多学科多模态理解和推理而设,旨在评估基础模型在广泛任务中的专家级多模态理解能力。
GPQA 是一个具有挑战性的数据集,包含 448 道由不同领域专家编写的高质量且难度极高的多项选择题。在相应领域拥有或正在攻读博士学位的专家,准确率仅为 65%,而技能高超的非专家验证者尽管平均花费时间超过 30 分钟且可不受限制地访问网络,准确率也只有 34%。
SWE-bench 是一个用于评估大型语言模型(LLM)在从 GitHub 收集的真实世界软件问题上的表现的基准。
2. 人工智能更高效、更易获取且更经济实惠
参数更少的小型人工智能模型的能力日益增强:在短短两年内,参数数量减少了约 100 倍,但其在大规模多任务语言理解(MMLU)测试中的得分仍超过 60%。
开源模型与闭源模型之间的差距也在缩小,在某些基准测试中,性能差距从 8% 降至仅 1.7%。
此外,从 2022 年 11 月到 2024 年 10 月,达到 GPT-3.5 水平的系统的推理成本下降了 280 倍以上。在硬件层面,成本每年下降 30%,而能源效率每年提高 40%。
高级人工智能的门槛正在迅速降低。更不用说像 DeepSeek 这样的稀疏模型的开发,在专家混合(MoE)的结构下,只有相关的参数会被激活以回答用户的查询,使整个事情更加高效。
的确,随着规模更小但能力更强的 AI 模型不断涌现,AI 模型训练的要求降低了,成本效益高的分布式训练有望在未来十年成为主流。目前有一些顶尖项目正在基于不同的理论框架开展相关研究。
3. 人工智能正日益融入日常生活
2023 年,美国食品药品监督管理局(FDA)批准了 223 款人工智能辅助医疗设备,而 2015 年这一数字仅为 6 款。在道路上,自动驾驶汽车已不再是实验品:美国最大的运营商之一 Waymo 每周提供超过 15 万次自动驾驶服务,而百度的 Apollo Go 无人驾驶出租车车队如今已在中国多个城市投入运营。
4. 企业在人工智能领域的投资大幅增加,推动创纪录的投资和应用
人工智能在商业中的应用也在加速:2024 年,78% 的组织正在使用人工智能,而前一年这一比例为 55%。与此同时,越来越多的研究证实,人工智能能够提高生产力,并有助于缩小整个劳动力队伍中的技能差距。
事实上,随着人工智能导致客户期望值呈指数级增长,现有解决方案会在一夜之间显得过时,从而使现有企业失去适应的机会,产品市场匹配崩溃的情况会更频繁地发生。
5. 尽管全球对人工智能的乐观情绪上升,但亚洲人对人工智能更为乐观
在中国(83%)、印度尼西亚(80%)和泰国(77%)等国家,大多数人认为人工智能产品和服务利大于弊。相比之下,在加拿大(40%)、美国(39%)和荷兰(36%)等地,乐观情绪仍远低于此。
不过,这种态度正在转变:自 2022 年以来,一些此前持怀疑态度的国家的乐观情绪显著增长,包括德国(增长 10%)、法国(增长 10%)、加拿大(增长 8%)、英国(增长 8%)和美国(增长 4%)。
6. 人工智能在科研中的影响力日益增强,已成为推动科学进步的重要驱动力
人工智能日益增长的重要性在重大科学奖项中有所体现:两项诺贝尔奖分别授予了在深度学习(物理学)和将其应用于蛋白质折叠(化学)方面做出贡献的研究,而图灵奖则表彰了在强化学习方面的开创性贡献。
显然,人工智能正以指数级、出乎意料的速度飞速发展,这对大多数人来说意义非凡。因此,人工智能安全也变得越来越重要。虽然人工智能让伪造变得更容易,但密码学则让伪造变得更加困难。期待着那些能够利用区块链的原生属性(可验证性和透明性)来构建这一领域实用解决方案的加密项目。
相关阅读: 专访a16z创始人Chris Dixon:人工智能与加密技术的交汇
SoonChain Redefines Health Economy Via AI in Latest Partnership with ZenithRing
The collaboration between SoonChain and ZenithRing aims to redefine the health economy, letting user...
Ethereum Metrics Reveal Critical Support Level – Can Buyers Step In?
Ethereum is trading above the $1,600 mark after a turbulent period marked by heightened volatility a...
$467M BTC Withdrawn From Exchanges in 24 Hours: What This Means for the Bitcoin Market
Just from yesterday alone, over $467 million BTC was withdrawn from exchanges. This shows investors’...