你的位置：越来越好玩在线听 > 新闻动态 > 微软自研图像模型再降价 41%, 当纳德拉开始用“毛利率”定义AI模型

微软自研图像模型再降价 41%, 当纳德拉开始用“毛利率”定义AI模型

发布日期：2026-04-30 06:24 点击次数：166

4月15日，微软正式发布MAI-Image-2-Efficient，这是其旗舰文生图模型MAI-Image-2的低成本、高速度变体。新模型定价为每百万输入token5美元、每百万输出图像token19.5美元，较MAI-Image-2的33美元输出定价下降约41%。

微软声称，该模型在NVIDIAH100硬件上运行速度快22%，每GPU吞吐量效率提升4倍，延迟表现优于谷歌Gemini3.1Flash、Gemini3.1FlashImage及Gemini3ProImage三款模型平均40%（基于p50中位数基准测试）。

这是微软AI超级智能团队（MAISuperintelligenceteam）自2025年11月公开亮相以来推出的一整套模型矩阵中的最新成果，也是该团队首次实现旗舰模型发布后不到一个月即推出优化变体的“初创公司式”迭代节奏。而这一切的背后，是微软与OpenAI曾经定义生成式AI时代的合作伙伴关系正在出现明显裂痕。

双模型策略：Efficient与Flagship

微软将MAI-Image-2-Efficient定位为“生产线工具”，目标场景包括产品摄影、营销创意、UI样机、品牌资产管道和实时交互应用。该模型能够干净地处理标题和标签等短文本，适用于批处理环境的严格延迟和预算约束。

而MAI-Image-2则继续担任“精密仪器”角色——当需求涉及最高级别的照片级真实感、复杂风格化（如动漫或插画）或更长更复杂的图像内文字时，企业客户仍需选择旗舰模型。

这种分层配对策略并非微软首创。OpenAI的GPT模型梯队、Anthropic的Haiku-Sonnet-Opus产品线、谷歌的Flash-Pro区分，都采用了类似的定价逻辑。但在图像生成领域，单张图像的成本经济学可能决定规模化部署的成败。

据报道，该模型已在Arena.ai（原LMArena）图像生成排行榜上位列第三，仅次于谷歌Gemini3.1Flash和OpenAI的GPTImage1.5。评测者指出，MAI-Image-2的照片真实感是“真正的优势”，文字渲染能力“超出预期地一致处理复杂排版”。在某些直接对比中，MAI-Image-2甚至在图像质量和文字渲染上超越OpenAI的GPTImage1.5——尽管在排行榜上仍居其后。

但原模型也存在显著限制：生成间隔30秒冷却时间、原生界面每日15张上限、仅支持1:1宽高比、缺乏图生图功能，以及会屏蔽无害创意提示的激进内容过滤。此次Efficient版本是否继承或放宽这些限制，微软在公告中未予说明。

微软-OpenAI联盟松动

但这次发布不能孤立理解，特别是当下微软与OpenAI关系已经出现明显裂痕。

4月12日，OpenAI新任首席营收官DeniseDresser向员工发送了一份内部备忘录。据报道，备忘录在批评竞争对手Anthropic的同时，也提到“我们与Microsoft的合作是我们成功的基础，但它也限制了我们在企业所在的地方与他们相遇的能力，对很多企业来说，那个地方是Bedrock”。备忘录称，自2月底宣布与Amazon合作以来，来自客户的入站需求“坦率地说令人震惊”。

微软早在2024年7月底的年度报告中（10-K表格）已将OpenAI列入竞争对手名单。而OpenAI则通过CoreWeave、谷歌和甲骨文多元化其云基础设施，减少对微软Azure的依赖。

MAI模型家族是微软这一战略脱钩最具体的表达。当微软能够以每百万输出token19.5美元的成本用自研模型生成生产级质量图像时，继续授权OpenAI图像模型并与其分享收入的算盘就会发生戏剧性转变。每一个达到生产质量的MAI模型，都是微软可能从OpenAI资产负债表移至自己账下的项目。

此前，3月17日，据微软官方博客披露的全面重组中，将消费者和商业Copilot业务统一至单一领导团队，JacobAndreou升任Copilot执行副总裁直接向纳德拉汇报。关键的是，MustafaSuleyman（微软AICEO，主导组建MAI超级智能团队）的角色也被重新聚焦。纳德拉在给员工的信中写道，公司正在“加倍投入超级智能使命，用人才和算力构建在评估、成本削减（COGSreduction）和前沿推进方面产生实际产品影响的模型”。

“COGSreduction”这一企业黑话直指经济动机：每节省一美元授权费用，就直接流入毛利率，即降低每生成一张图所消耗的算力、推理和运营费用。

为什么便宜快速的图像生成至关重要

还有一个维度让此次发布具有战略意义，且可能是最重要的一个：AIAgent的崛起。

据报道，微软正在测试将类似OpenClaw的功能集成到Microsoft365Copilot中，构建可长时间执行多步骤任务的always-onagent。公司已推出CopilotCowork（在Microsoft365应用内行动的agent）、CopilotTasks（完成多步骤个人生产力任务的agent）和Agent365（纳德拉重组备忘录中提及）。预计将在6月的Build大会上展示这些agent能力。

在Agent世界——AI系统不仅回答问题，还能自主执行复杂工作流——图像生成成为agent可编程调用的基础组件，而非用户手动交互的独立产品。一个构建营销活动的企业agent可能需要生成数十张产品图片、创建社交媒体素材、制作演示图形，并在无人干预的情况下迭代设计概念。

这种工作流的经济学完全由per-tokenpricing（按token计费）和延迟支配，而这正是MAI-Image-2-Efficient优化的核心。如果微软对Copilot的愿景涉及在日常大型工作流中例行调用图像生成的agent，那么这些agent需要的图像生成必须足够快以不造成瓶颈、足够便宜以在每天数千次调用时不破坏成本预测。

4倍效率提升和41%价格削减不只是漂亮的营销数字——它们是微软押注公司的Agent未来的架构要求。

此次发布仍有若干关键问题未解答。

微软未披露MAI-Image-2-Efficient是否解决了评测者在原模型中指出的宽高比限制和激进内容过滤。公司也未说明质量与速度的权衡是否在复杂提示下涉及可见的质量下降——公告中将“生产就绪质量”和“旗舰质量”互换使用，但任何类型的蒸馏模型通常都涉及某种质量让步。

MAIPlayground目前仅在美国等选定市场可用，欧盟可用性列为“comingsoon”。Copilot集成正在进行但未完成。通过Foundry的企业API虽已上线，仍处于早期部署阶段。

但轨迹明确无误。在MAI超级智能团队宣布后不到五个月，微软已推出一个旗舰图像模型、三个其他基础模型，以及现在的成本优化生产变体——所有这些都在重组整个Copilot组织、应对与最重要AI合作伙伴的破裂关系、并为可能重新定义企业生产力的Agent功能奠定基础的同时完成。

对于这家在生成式AI时代前两年主要转售他人技术的公司而言，微软现在正在做一些它很久未在AI领域做过的事：按照自己的时间表、以自己的价格、交付自己的工作——并挑战市场跟上。（本文首发钛媒体APP，作者|硅谷Tech_news，编辑|秦聪慧）

下一篇：没有了上一篇：“新塍大米”碳标签发布

微软自研图像模型再降价 41%, 当纳德拉开始用“毛利率”定义AI模型

热点资讯

推荐资讯

推荐资讯

热点资讯