微软Build 2026开发者大会一口气发七款自研模型，“Agent优先”时代到来

作者丨李海伦，腾讯科技

编辑丨徐青阳

美国当地时间6月2日，微软Build 2026开发者大会在旧金山梅森堡拉开帷幕。此次大会主题聚焦于前沿AI技术的实战应用，微软发布了一系列覆盖自研AI模型、智能体应用、操作系统安全、开发者工具、云服务及新型硬件平台的产品与更新。

在2025年的开发者大会，微软确立了“AI智能体时代”方向，发布了Copilot Studio多智能体编排、Windows AI Foundry，并宣布全面支持Model Context Protocol，GitHub Copilot 推出编程智能体 Coding Agent。

在微软的叙事中，2025年解决的是“智能体时代，该用什么标准和框架”，2026年聚焦的是“如何用自家的模型和产品，真正跑起来”——模型层补上了能挑大梁的自研主力，产品层把智能体从演示推向了系统、硬件和云的全栈落地。

这次发布会，核心发布可分为六个板块：MAI自研模型家族、以Scout和GitHub Copilot应用为代表的智能体生态、Windows系统级AI安全沙箱MXC、面向开发者的Surface RTX Spark Dev Box与系统优化、Project Solara新型智能体设备平台，以及包括Microsoft IQ、Rayfin、ASSERT、ACS等在内的开发者工具与治理框架。

01 七款模型从零训练，拒绝蒸馏

整场主题演讲以微软CEO萨提亚·纳德拉的愿景陈述为主线徐徐展开。他抛出“智能体优先”的战略框架后，各业务线高管依次登台，推出具体产品把这套框架落到实处。

在大会上，苏莱曼宣布推出七款由微软AI内部开发的全新模型，统一归入MAI家族。

他将MAI的使命描述为构建一台“爬山机器”，通过持续投入计算量、更优数据和更精准评估，实现循环往复的自我改进，让用户始终保持在技术前沿。

训练计算规模方面，苏莱曼指出，用于训练前沿模型的计算量已增长一万亿倍，预计未来三年内还将再增长一千倍。微软所有MAI模型均“从零开始进行爬山，零蒸馏”，不依赖第三方模型输出进行训练。

微软AI部门负责人苏莱曼介绍七款自研模型

具体模型如下：

旗舰推理模型MAI-Thinking-1 ，这是一个中型模型。微软表示，它在关键的软件工程测试中，性能可以跟市面上最好的模型打平。在盲测对比中，人类评判员对它的偏好程度跟Sonnet 4.6不相上下。这个模型是从零开始、用干净数据训练，未使用第三方模型蒸馏。

编程模型MAI-Code-1-Flash ，是一个推理高效的agentic编码模型，拥有50亿参数，专为GitHub Copilot、VS Code和微软技术栈量身定制并深度集成。微软表示其可与Haiku媲美但成本更低。

文生图模型MAI-Image-2.5及其超高效Flash变体，支持文生图和图像编辑，微软称其在Arena评分上超越了谷歌Nano Banana Pro。

转录模型MAI-Transcribe-1.5 ，具备SOTA级别准确性。据称速度比竞品模型快五倍，内置支持43种语言的领域特定术语识别。

语音生成模型MAI-Voice-2 ，提供高质量、自然听感的语音生成，支持15种语言，能够根据短样本适配声音，具备防滥用保护措施。其Flash变体即将推出，以更低成本实现同样功能。

所有模型共享相同的数据规范、基础设施和评估框架。除了在Azure Foundry上分发并为微软第一方产品优化外，这些模型还将在Open Router以及Fireworks和Baseten上向开发者提供。开发者首次能够自行调整模型权重。

在会上，纳德拉介绍了Microsoft Frontier Tuning，一种让企业用自身工作数据定制模型的方法。其逻辑是，最有价值的数据不是通用语料，而是智能体在企业里执行任务的真实轨迹、步骤和决策。

微软CEO纳德拉介绍Frontier Tuning

这套机制把MAI模型接入实际业务流程，让模型在真实环境中边做边学。苏莱曼说：“你正在构建自己的模型：在你的环境中，用你的数据训练，由你控制。你的机构知识会成为模型的一部分，并且只属于你。”

效果方面，微软为Excel调整的MAI模型与GPT-5.4水平相当，同时效率提高10倍。麦肯锡采用Frontier Tuning后，MAI在所有测试模型中实现最高胜率，成本降低约10倍。

在医疗健康领域，微软宣布与梅奥诊所合作，共同打造一个用于医疗保健的前沿AI模型。该模型将梅奥诊所的临床专业知识、去标识化的临床数据和纵向洞察，与微软的基础AI能力结合。

微软同时透露，MAI模型正与自研的Maia 200芯片进行协同设计，通过软硬件联合优化已实现1.4倍的效率提升。

02 智能体生态全面落地

微软在大会上宣告了向“Agent优先”的宏大转型，旨在自动化知识工作者使用软件的方式，将AI助手植入日常办公交互中。

Scout是此次发布的核心智能体产品。这款被称为“永远在线”的AI Agent，构建于OpenClaw框架之上，可在Microsoft Teams中像人类同事一样交互。

Scout能浏览用户的工作消息、日历和电子邮件收件箱，自动完成任务、重新安排冲突会议，并起草听起来很专业的回复。用户可在Teams中直接向它发送指令，也可以为它命名。

微软新任命的企业副总裁奥马尔·沙欣解释了Scout的设计理念：“你的公司本质上就是雇佣了你的助理。拥有私人助理的全部意义在于，当你不在工作时，他们还在工作。”

Scout通过微软Frontier计划提供，需要GitHub Copilot订阅。微软正测试一款Scout桌面应用，将向选择“前沿”功能访问权限的订阅用户推出。在微软内部，沙欣说销售部门是使用该工具最大、增长最快的群体。

GitHub Copilot桌面应用是另一项重要发布。 GitHub首席产品官马里奥·罗德里格斯（Mario Rodriguez）介绍，这是一款“构建在GitHub之上的、Agent原生的桌面体验”。

通过统一的“My Work”视图，开发者可看到跨连接仓库的动态工作，包括活动会话、议题、拉取请求和后台自动化。每个会话在其自己的Git worktree中运行，并行Agent互不干扰。应用具备Agent Merge功能，可带领拉取请求完成审查、检查和合并。Canvas界面用于人机之间的双向交互，开发者可检查、引导和验证Agent代表自己执行的工作。

GitHub Copilot应用面向Windows 11、Windows 11 on Arm、Mac和Linux提供技术预览版，需要GitHub Copilot订阅，未来将向Copilot Free用户开放。该应用支持云端和本地沙箱、代码审查，两者均附带策略支持。

在智能体安全治理方面，微软发布了Agent控制规范（ACS），这是一个新的开源标准，旨在为开发者提供更一致、更细粒度的方法来控制AI Agent的行为。ACS让开发、合规和安全团队能够为Agent定义策略文件，规定Agent可以做什么、绝对不能做什么、何时需要人类批准，以及应记录哪些证据供审查。

ACS作为一个SDK发布，附带LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernel、Microsoft.Extensions.AI、MCP工具等的插件。由于策略可写成单个文件，可以与Agent捆绑在一起，跟随Agent穿越不同框架和环境。

ASSERT（Adaptive Spec-driven Scoring for Evaluation and Regression Testing）是另一项测试工具。这是一个开源框架，通过使用AI将对目标、策略或预期行为的高级自然语言描述，转化为结构化的评分测试。

ASSERT接收关于AI模型预期行为的简明语言描述，生成可接受与不可接受行为集合、问题场景和测试用例，针对目标系统运行测试并评分。它还能记录AI系统所采取的路径，包括中间操作和工具调用，以便开发者检查失败位置。

03 Agent越自主越危险，微软用MXC在系统层划红线

随着AI Agent日益强大和自主，微软识别出一个关键问题：Agent越自主越有用，让它不受护栏约束地在企业网络上运行就越危险。微软官方博客将此描述为一个“多层系统问题”，Agent与人类、工具、应用、模型以及其他Agent之间的每一次交互“都会暴露新的攻击面，并引入不同的故障模式”。

针对这一问题，微软推出了Microsoft Execution Containers（MXC），这是一个内置在Windows操作系统本身的、由策略驱动的执行层。微软Windows和设备执行副总裁帕万·达武鲁里强调，这对于使AI Agent具有商业可行性至关重要，它们“围绕安全性、包含、隔离和让用户控制”，将使Agent对普通消费者和企业部署来说足够安全。

微软CEO纳德拉介绍系统级安全沙箱MXC

MXC本质上是一个SDK和策略模型，嵌入在Windows和Windows Subsystem for Linux中，提供微软所称的“可组合的沙箱频谱”。该频谱范围从轻量级进程隔离（已被GitHub Copilot的命令行界面采用），延伸到微型虚拟机、Linux容器，以及在Windows 365上运行的完整云实例。

该系统将Agent的执行与用户的桌面、剪贴板、用户界面和输入设备分离开。每个Agent被绑定到一个身份，要么是本地ID，要么是由Microsoft Entra支持的云预配身份，确保Agent的每一个动作都可被归因、审计和治理。

MXC现已提供早期预览版。与微软企业安全栈集成的Agent 365将于2026年7月推出预览版，将Entra身份服务、Intune设备管理、Defender威胁防护和Purview数据治理能力层叠到MXC之上，使IT部门能集中管理Agent隔离。

在合作伙伴方面，OpenAI、英伟达、Manus、Nous Research（Hermes Agent制造商）以及OpenClaw开源项目已宣布在MXC上构建。

值得一提的是，OpenClaw的合作，是创建者彼得·斯坦伯格（Peter Steinberger）主动联系微软表达合作兴趣，最终这事发展成了全面的平台级伙伴关系。

04 三项更新，让Edge的AI"不联网也能跑"

微软Edge浏览器也获得了本地AI能力升级。微软表示，自Build 2025引入Phi-4-mini后，团队根据网页开发者反馈扩展了端侧AI能力。

第一项是Aion-1.0-Instruct，一个比Phi-4-mini更小、更快、更高效的本地小语言模型。它可在GPU和CPU能力较弱的PC上运行，现以开发者预览版提供，将于7月登陆Hugging Face。

第二项是语言检测和翻译API，随Edge 148版本提供。这两个API由Edge内置的端侧AI模型驱动，用于JavaScript，允许网站和浏览器扩展识别文本语言并在语言对之间翻译。微软称其“提供快速、高质量的翻译，支持超过145种语言，并针对网络上的翻译工作负载进行了优化”，此服务免费。

第三项是通过Web Speech API实现语音识别，在Edge Canary和Dev频道中以实验形式提供。该API帮助开发者将语音或音频输入整合到网站和浏览器扩展中，在设备本地运行，也可基于云端语音转文本和文本转语音服务作为后盾。

05 开发者工具与云服务迭代

在数据智能层面，微软发布了Microsoft IQ，把此前各自独立的四个上下文源合并成Agent的共享基础。

微软Fabric首席技术官阿米尔·内茨打了个比方：《黑客帝国》里那些绿色代码瀑布不是装饰，而是构建那个世界的地基。他说，“我们在数据世界做的事，就是给Agent造一个基于数据的现实”。

Microsoft IQ的四个上下文源分别为：Work IQ，捕获组织日常运作方式，利用电子邮件、文档、会议和日程安排；Foundry IQ，管理机构知识，策划和索引知识库；Fabric IQ，通过数据对业务的实时运营状态进行建模，定义基于Fabric实时智能的实时信号所锚定的实体、关系和业务规则，该功能预计在未来几个月正式发布；Web IQ，添加来自网络的实时全球上下文。

有了这套上下文体系，Agent就不再是一个只会执行命令的工具，而是一个了解公司运转情况的虚拟员工。

光有共享的“地基”还不够。当Agent开始生成应用时，每个应用都需要一个后端，如果放任不管，这些应用就会在上下文层之外形成新的数据孤岛。为此微软发布了Rayfin，一个开源SDK和CLI，它把Agent构建的应用直接部署到Fabric平台作为受治理的生产后端，应用数据默认进入统一的OneLake数据湖，再反馈回Microsoft IQ，而不是在外部堆积。

微软把它定位为Supabase和Neon的竞争对手，核心区别就是治理：所有应用都走同一套数据和合规通道。内茨说这是个双向过程，Agent建应用时从企业的数据规则里取信息，应用跑起来产生的数据又反过来更新这套规则，下一个Agent就能用上最新的东西。

微软同时推出的WSL容器功能，让开发者能在Windows上直接创建和管理Linux容器，微软还给它配了命令行界面和API，允许在本机Windows应用里运行Linux容器，这个功能将在未来几个月提供公开预览。

为了不让开发者在环境配置上浪费时间，微软还发布了Windows Developer Configurations，可以快速设置一台新机器并套用开发者优化配置，自动安装WSL、PowerShell 7和Visual Studio Code，同时在文件资源管理器里启用Git版本控制并显示隐藏文件。

06 两款新硬件，把AI重活拉回本地端

这场Build不只是模型、Agent和开发工具的软件秀，硬件也没缺席。当AI计算越来越吃算力、Agentic工作流又需要持续不断地跑，微软索性把目光投向了开发者手边的设备，与其每次都去租昂贵的云GPU，不如让这些活儿直接在本地机器上完成。

Surface产品公司副总裁安德鲁·希尔宣布了两款新设备：

Surface RTX Spark Dev Box是一款紧凑型开发者PC，搭载NVIDIA RTX Spark超级芯片，结合NVIDIA Blackwell RTX GPU和NVIDIA Grace CPU，提供高达1 Petaflop的AI算力，配备128 GB统一内存。

该设备采用铝制机箱兼作散热器，专为长时间运行的训练任务、大模型推理和复杂Agentic流程设计。设备预装Windows 11 Pro，并在镜像层面为开发者预配置：深色主题、为开发简化的任务栏、移除小部件、开启“请勿打扰”模式、开发者模式已启用、PowerShell 7为默认Shell。WSL 2已配置好GPU直通和CUDA支持，VS Code、GitHub Copilot、Git、Python和Node.js均已安装。

安全方面，Surface RTX Spark Dev Box建立在符合微软零信任原则的芯片到云安全之上，包括Secured-core PC架构、BitLocker加密和Microsoft Defender保护，并可与Entra ID和Intune集成实现大规模管理和治理。

希尔解释称：“开发者构建软件的方式正在发生根本性变化。AI模型的能力和复杂性日益增长，Agentic工作流需要持续的计算能力，而且即便是那些不需要最先进模型的任务，每一次迭代也可能产生云端成本”。

另一款Surface Laptop Ultra专为开发者、创作者和技术专业人士设计的高性能笔记本电脑，已经于早些时候推出，两者共同代表Surface的下一步：为构建未来的人们打造专用设备。Surface RTX Spark Dev Box将于今年晚些时候在美国上市，仅在Microsoft.com独家销售。

07 让设备运行AI Agent而非应用的新平台

微软应用科学部门负责人史蒂维·巴蒂什介绍了被称为Project Solara的内部项目。

这是一个从芯片到云的新平台，基于Android而非Windows，旨在让设备运行AI Agent而非应用。巴蒂什解释其出发点：“界限正在崩塌。你不一定需要传统的应用模式。你不需要传统的方式来开发体验。”

首批两款概念设备已在Build大会上展示：

桌面中心设备，放在PC旁边，响应语音命令，通过面部识别登录用户，呈现当天最紧急的事项。连接显示器后可变成一台在云端运行的完整Windows机器。

可穿戴工牌设备，重新构想了标准员工ID卡。一键按下指纹即可唤醒Agent，轻触可录制和转录对话，内置摄像头让Agent能根据用户所见采取行动。

在医疗保健演示中，这款工牌运行了为医护人员设计的Agent，能扫描患者二维码、记录和转录就诊过程、记录生命体征并开出处方。在另一个应用中，内置摄像头扫描了写着办公室改造创意的头脑风暴板，并提出了添加绿植的建议。

巴蒂什表示，微软不会自己生产这些设备，而是设想硬件制造商和其他行业合作伙伴将这些参考设计转化为自己的产品，每个都针对特定行业、公司或场景。

08 量子芯片升级，可靠性提升千倍

微软还发布了下一代拓扑量子芯片Majorana 2。

相比前代Majorana 1，这次的核心变化是超导体材料从铝换成铅，这一调整使量子比特可靠性提升1000倍，平均量子比特寿命达到20秒，部分实例可持续一分钟。

其他技术路线的量子比特寿命通常仅微秒级。基于这一进展，微软将可扩展量子计算机的预期实现时间缩短一半，目前预计在2029年前达成。

该芯片的研发全程使用了Microsoft Discovery平台的Agentic AI能力。AI智能体承担了制造管理、量子态自动化测量和跨学科数据分析等任务，将原本数周的测量周期压缩了几个数量级，并从近二十年积累的数据中识别出人类难以察觉的关联。

微软技术院士切坦·纳亚克说：“Agentic AI几乎渗透到我们所做的一切事情中。”但他强调AI只提供指导，“始终是科学家在回路中”。

Microsoft Discovery平台也于本次大会正式发布，这是一个面向前沿研发的组织级平台，允许研究人员部署由人类指导的自主Agent团队，进行假设生成、实验优化和理论验证。微软同时推出了Microsoft Discovery应用的早期预览版，个人可免费下载，使用GitHub Copilot账户在本地运行。