mt logoMyToken
ETH Gas
EN

Siri独立成App,苹果AI终于不再只做“润色工具”

Favoritecollect
Shareshare

十年后,Siri终于从系统浮层里走了出来。

6月8日的WWDC上,苹果预览了iOS 27、macOS 27等新一代操作系统,几乎所有的软件更新都指向同一件事:AI正在从辅助功能变成系统级的交互入口。最显眼的变化是Siri从一个呼之即来的语音浮窗,变成了一个拥有独立图标的App,支持iCloud同步对话历史,形态上第一次向ChatGPT这类独立AI应用看齐。

上一代Apple Intelligence把Siri限制在系统层的被动响应里。它能帮你润色文字、总结通知,但没法跨应用办事,也记不住你上回问过什么。这一次,苹果试图把Siri从一个“听得懂你”的助手,升级为一个“能替你动手”的代理。这场AI更新的辐射面远不止Siri本身。从相册的空间重构修图,到Safari自动帮你盯商品降价,再到密码管理应用替你登录网站并改掉弱密码,系统角落里几乎到处是新的AI能力。

Siri有了独立入口,对话终于能记住上下文

Siri变成独立App,首先要解决的是“用户去哪找AI”这个问题。

过去,Siri的入口分散在语音唤醒、侧边按钮和锁屏长按之间,缺少一个固定的视觉锚点。ChatGPT和Gemini以独立App形态占据用户桌面之后,Siri的无形状态反而成了一种劣势:用户不知道它到底能做什么,也不习惯反复打开一个没有界面的工具。

有了独立App和对话历史iCloud同步,体验完全不同了。用户在iPhone上让Siri分析一份合同的关键条款,中午在Mac上继续追问细节,Siri能记住上下文。这建立了一个长会话资产,也让Siri在功能认知上更接近“一个能持续对话的AI”,而非“一个回答单次问题的语音工具”。

底层驱动引擎也换了。Wired和多家科技媒体在现场确认,苹果已启动第三代Apple Foundation Models,并与Google Gemini达成了多年深度合作,利用Gemini技术定制开发下一代模型。2024年WWDC时,苹果的合作方还是OpenAI,Siri可以在特定场景下调用ChatGPT。两年后,合作伙伴名单上加入了Google。苹果在基座模型上不再单一依赖某家第三方,选择了一条更灵活的多方定制路径。

从“帮你查一下”到“帮你办妥”

上一代Apple Intelligence的核心能力是理解和生成内容。它能总结长消息、重写邮件语气、从照片库里找出特定图片。但它无法跨应用做事。这是两代产品之间最根本的分界线。

新版Siri AI通过App Intents框架和Spotlight个人数据索引,实现了跨应用上下文理解和任务执行。苹果官网给出了几个典型场景:Siri能从邮件里提取酒店预订确认号,从信息App里找到朋友推荐过的餐厅并直接预订,甚至在通话过程中自动从邮件里抓取验证码显示在Phone应用界面上。

这个名为Call Context的功能让用户不需切屏、不需手动搜索,Siri在通话界面直接弹出需要的那串数字。它解决的是一个具体且高频的痛点:接电话时需要同时查看短信或邮件里的信息,手忙脚乱。

密码管理App的升级同样指向这一点。新版Passwords不仅能检测弱密码和重复密码,还能代理用户自动导航至对应网站、完成登录,然后生成一串强密码并保存。改密码这件事的繁琐程度众所周知,大部分用户选择不改。苹果把这件事交给AI代理去做,降低的是用户的安全维护成本。

Safari也塞进了类似的能力。新增的Notify Me功能可以监控指定网页的变更,比如某件商品降价、某个页面补货,然后主动推送通知。用户在后台等就行,不用隔三差五手动刷新。另一个更彻底的功能是用自然语言描述需求,让AI直接生成一个自定义浏览器插件。用户说“帮我把这个网页里所有表格自动高亮显示金额超过500的行”,Safari就会生成对应插件来完成这件事。这等于给普通用户开了一条零代码定制浏览器的通道。

Shortcuts快捷指令应用也获得了同样的自然语言化改造。“Describe a Shortcut”允许用户只写一句“每天早上8点自动播报今天的日历安排和天气”,AI就能自动组装出对应的快捷指令步骤。这些改动指向同一个目标:把原本只有高级用户或开发者才会用的系统功能,压到普通用户说一句话就能搞定的门槛。

相机装上Siri,扩图和透视重构一起进相册

Visual Intelligence在本次更新中大幅扩展了覆盖范围。相机应用里新增了一个“Siri模式”,用户可以对准餐厅账单让Siri算出AA每人多少钱,Siri识别图片内容后直接通过Apple Cash发起分账请求。对准一本书查评价,对准食物显示营养成分,这些场景和Google Lens多年来的功能路径高度重合。

区别在于苹果把这个视觉理解能力铺到了更多设备上。iPad截图后可以直接用Siri分析,Mac上通过快捷键调起,Vision Pro也能调用。相机不再是唯一入口,苹果在构建的是一个覆盖所有设备的通用视觉理解层。

相册应用也拿到了两个基于AI的新功能:Spatial Reframing空间重构透视和Extend扩图。扩图即AI在照片边缘自动生成扩展内容。Spatial Reframing则有实质差异,它利用空间计算模型来改变照片的透视关系,不是简单裁切或拉伸,而是重新计算画面中物体的前后关系。苹果在发布会上用一张侧面拍摄的建筑照片做了演示,经过处理后画面变成了正面正视的角度。目前官方尚未公布该功能对非建筑类场景的处理效果,但从技术路径看,这比普通生成式扩图多了一步空间理解的计算。

Image Playground的升级则是另一个维度。第一代只能生成卡通风格或插画风格的图像,这次直接支持了照片级真实图像生成。由于对算力要求较高,苹果把它放在了Private Cloud Compute云端运行,而非设备端。每生成一张图片都会强制嵌入SynthID隐形水印,用于标识AI生成内容。同时该功能设置了每日使用限制,具体配额在正式版中会随iCloud+订阅方案有差异,目前尚未披露具体数字。

硬件门槛和地区限制是绕不过去的现实

AI功能的支持范围远比系统更新的支持范围窄。

iOS 27的兼容设备从iPhone 11起步,但Apple Intelligence和Siri AI的核心功能仅限iPhone 15 Pro及以上机型、M1及以上芯片的iPad和Mac。部分更高级的功能,比如更具表现力的语音和高阶听写,还需要更新的硬件:iPhone Air、iPhone 17 Pro系列,或者12GB以上统一内存的M4 iPad和M3 Mac。

地区限制同样严格。受欧盟《数字市场法案》影响,Siri AI在欧盟地区的iOS和iPadOS上暂不可用。中国大陆则因监管要求暂不支持Apple Intelligence。照片级图像生成这类基于PCC云端的AI功能,在有地区限制的市场也一并被锁。对于长期习惯苹果全球统一体验的用户来说,这种按地区和设备双重切割功能的做法可能会带来困惑。

苹果AI这一年:跳票交了学费,合作名单换了

2024年WWDC,苹果首次推出Apple Intelligence概念时,Siri被描绘成一个能深度理解个人数据并跨应用执行任务的智能助手。但这些功能随后数次推迟交付,用户发起虚假宣传集体诉讼,苹果最终支付了2.5亿美元和解金。

这段经历直接影响了本次发布的内容密度和承诺谨慎程度。一年前画过的饼,现在必须端上桌。

整个2025年,苹果在消费级AI功能的发布上明显放慢了节奏,外界将其称为苹果AI的“Gap Year”。期间,苹果重新调整了AI部门的组织架构,为2026年的集中大改版做内部准备。据Yahoo Finance报道,苹果2026年的资本支出计划为140亿美元。和亚马逊、微软动辄数千亿美元的AI基础设施开支相比,这个数字显得克制。苹果不参与算力军备竞赛,依赖自有芯片生态和端侧计算来做差异化。

最值得注意的变化是合作伙伴的转向。2024年Siri接入的外部模型是OpenAI的ChatGPT,到了2026年,苹果与Google Gemini建立多年深度合作,利用Gemini技术定制开发下一代Apple Foundation Models。这种从单一合作到多方并行、从直接调用到深度定制的路径变化,反映出苹果在基座模型上不再愿意绑死在单独一家第三方身上。对用户来说,这意味着Siri背后的模型能力来源更加多元,也有可能在特定任务上切换不同模型的长处。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup