来源:市场资讯
(来源:AI信息Gap)
本周 AI 快讯 | 1 分钟速览
01 DeepSeek V4-Pro API 永久降价 75%,内部组建代码智能体团队对标 Claude Code :5 月 31 日折扣到期后价格直接锁定原价 1/4,输入 0.435 美元/百万 token;据报道已组建 Harness 团队主攻代码 Agent, 字符幻觉事件同周得到官方回应。
02 阿里发布智能体旗舰 Qwen3.7-Max,GPQA 和 HMMT 双双超越 Opus 4.6 Max :GPQA Diamond 92.4、HMMT 97.1 均为全场最高;API 定价 2.50 美元/百万 token 输入,不到 Opus 4.7 的六分之一;千问 App 已免费接入。
03 智谱 GLM-5.1 高速版发布,API 输出 400 tokens/s 刷新全球上限 :Artificial Analysis 标准评测成本对比中智谱 544 美元排名最低,低于 DeepSeek 的 1071 美元和 OpenAI 的 3357 美元。
04 腾讯「马维斯」操作系统级 AI 助手三端上线,Ardot 设计智能体同周公测 :Windows、Mac、Android 同步开放,系统层直接操控桌面应用和文件;Ardot 一句话生成可编辑设计稿,一键导出前端代码。
05 谷歌 I/O 2026 连发十余弹,Gemini 3.5 Flash 首日 GA,配额改制后 9 倍上调 :Gemini 3.5 Flash 编程和 Agent 基准全面超 3.1 Pro,输出速度 4 倍于 GPT-5.5;Gemini Spark 个人智能体发布,AI Ultra 降至 100 美元/月;配额从次数制改算力制引发用户投诉,累计上调 9 倍。
06 OpenAI 大重组,Brockman 统一 ChatGPT / Codex / API,Sora 关停 IPO 冲刺 :5 月 16 日三条产品线合并,Sora 关停,多名高管离开或调岗;最快 5 月 22 日提交机密 IPO 申请,估值预期逾万亿美元;Q1 营收 57 亿美元领先 Anthropic 约 10 亿,但利润率 -122%。
07 OpenAI 推理模型独立攻克 80 年几何猜想,数学家验证原创性 :推翻 Paul Erdős 1946 年提出的猜想,通用推理模型非数学专用;剑桥 Timothy Gowers 等多位顶级数学家独立验证并撰写伴随论文。
08 Karpathy 加入 Anthropic 预训练团队,3 亿美元收购 Stainless 切断竞对 SDK :OpenAI 联合创始人 5 月 19 日入职,将用 Claude 加速预训练研究;Stainless 为 OpenAI、谷歌等生成 SDK,收购后 hosted 产品全部关停;Claude Code 快速模式默认切到 Opus 4.7。
09 SpaceX S-1 揭秘,Anthropic 每月支付 12.5 亿美元算力,Cursor 600 亿收购期权 :算力合同至 2029 年总价近 450 亿美元,覆盖 22 万 GPU;Cursor 母公司 Anysphere 600 亿美元收购期权写入招股书;xAI 部门 Q1 营收 8.18 亿美元,运营亏损 24.7 亿。
10 Cursor Composer 2.5 上线自研模型,月之暗面 K2.5 底座逼近 Opus 4.7 :SWE-Bench Multilingual 79.8%(Opus 4.7 为 80.5%),标准定价 0.50 美元/百万 token 输入,仅为 Opus 4.7 的十分之一;底座 Kimi K2.5 开源模型,85% 算力用于后训练。
01|DeepSeek「V4-Pro」永久降价 75%,组建 Harness 团队正面对决 Claude Code
5 月 22 日 DeepSeek 官方宣布,V4-Pro 模型 API 的 2.5 折优惠将在 5 月 31 日到期后直接锁定为原价的 1/4,不再恢复原价。调整后输入价 0.435 美元/百万 token,输出 0.87 美元/百万 token,全线缓存命中成本同步砍掉 90%。即便按调整前的原价算,V4-Pro 已比 GPT-5.5 便宜约 98%,永久降价后价格差距进一步拉开。V4-Pro 总参数 1.6 万亿,每次推理激活 490 亿,是目前参数量最大的开放权重模型。

三天前(5 月 18 日)腾讯云的 AI 设计平台 Ardot 进入公测,定位「AI 驱动的产设研协作平台」,输入一句话即可生成可编辑设计稿,支持一键导出前端代码。马维斯管系统层操控,Ardot 管设计到开发的交付,两款 Agent 产品同一周公开。
05|谷歌 I/O 2026 连发十余弹,「Gemini 3.5 Flash」首日可用,配额改制 9 倍上调
5 月 19 日 I/O 开场,Sundar Pichai 先亮出一组数字,谷歌月处理 token 总量超 3200 万亿,同比增长 7 倍,Gemini App 月活突破 9 亿。当天发布的 Gemini 3.5 Flash 直接 GA,Terminal-Bench 2.1 跑出 76.2%,编程和 Agent 基准全面超过上代旗舰 3.1 Pro,输出速度 4 倍于 GPT-5.5。Gemini Omni 实现全模态输入输出,用户可以用一句话修改视频中的角色和背景。Gemini 3.5 Pro 正在内部使用,6 月上线。

产品侧最大的发布是 Gemini Spark,定位 24 小时在线的个人 AI 智能体,运行在独立虚拟环境中,可自主操作 Gmail、日历等应用。配套的 AI Ultra 订阅从 250 美元/月降至 100 美元/月,包含 Spark 测试资格和 20TB 云存储。谷歌还联合亚马逊、Meta、微软发布了 AI 电商协议 UCP,为 Agent 购物制定通用接口标准。
I/O 结束后,配额争议的讨论热度反而超过了新模型。谷歌将 Gemini 计费规则从「每日提示次数」改为「按算力计费」,付费用户在密集编程和多媒体任务中频繁触顶,遭遇 5 小时冷却和周额度锁定。社交媒体上投诉集中爆发,谷歌紧急将配额提高 3 倍,随后又追加 3 倍,累计上调 9 倍。DeepMind 的 Varun Mohan 公开承认付费用户「几次工作会话就可能耗尽周配额」,并两次重置了全部付费计划的配额。
06|OpenAI 大重组,Brockman 统一三大产品线,关停「Sora」冲刺 IPO
ChatGPT、Codex、API 三条产品线,一夜之间合并为一。5 月 16 日 OpenAI 宣布大规模重组,联合创始人兼总裁 Greg Brockman 正式接管全部产品战略,取代因病休假的 AGI 部署负责人 Fidji Simo。Brockman 在全员备忘录中表示将建设「一个统一的 Agent 平台」。视频生成产品 Sora 同日关停,原因是算力消耗与营收严重不匹配,此前规划中的 10 亿美元迪士尼投资也因此告吹。产品负责人 Kevin Weil 和技术负责人 Bill Peebles 离开,COO Brad Lightcap 被调至「特殊项目」。

重组的直接推力是 IPO。据报道,OpenAI 最快于 5 月 22 日向 SEC 提交机密招股书,Goldman Sachs 和 Morgan Stanley 担任主承销商,上市窗口瞄准今年秋季,估值预期逾万亿美元。同期披露的数据显示 Q1 营收 57 亿美元,领先 Anthropic 约 10 亿,但调整后经营利润率为 -122%,每赚 1 美元要亏 1.22 美元。ChatGPT 周活 9.05 亿,低于 2 月峰值 9.2 亿,用户增长开始放缓。
IPO 前最大的法律障碍也在同一周扫清。5 月 19 日加州联邦陪审团在不到两小时审议后驳回了 Elon Musk 对 OpenAI 的全部诉讼请求,理由是全部索赔已过诉讼时效。产品侧,5 月 22 日 ChatGPT for PowerPoint 以 Beta 形式上线,Mac 版 Codex 新增 Appshots 功能,支持将桌面窗口画面直接传给 AI。
07|OpenAI 推理模型攻克 80 年「Erdős 猜想」,剑桥数学家认证原创性
1946 年,匈牙利数学家 Paul Erdős 提出一个问题,在平面上放 n 个点,最多能有多少对距离恰好为 1?近 80 年来数学界普遍相信方格点阵已经接近最优解。5 月 20 日 OpenAI 宣布,一个通用推理模型在无人引导下找到了一族全新构造,证明方格点阵并非最优,并给出了严格的数学证明。关键突破在于模型将问题关联到代数数论,一个与几何看似无关的分支。普林斯顿教授 Will Sawin 随后将改进幅度量化为指数增益 δ ≥ 0.014,虽然数字看着小,但这是多项式级的提升,意味着单位距离对的增长速率严格超过方格点阵能达到的任何构造。

剑桥大学数学家 Timothy Gowers 评价「此前没有任何 AI 生成的证明接近过这一水平」。Noga Alon、Melanie Wood 等多位顶级数学家参与了独立验证并撰写伴随论文,完整的期刊同行评审仍在进行中。这个证明的特殊性在于它来自通用推理模型,没有专门针对数学训练或搭建搜索框架。七个月前 OpenAI 时任副总裁 Kevin Weil 声称 GPT-5 解决了 10 道 Erdős 问题,事后被证实只是重新发现了文献中的已知结果,被 Yann LeCun 和 Demis Hassabis 公开嘲讽。这次 OpenAI 带上了外部数学家的独立验证和完整背书。
08|Karpathy 加入 Anthropic,3 亿美元收购「Stainless」切断竞对 SDK
「Personal update: I've joined Anthropic.」5 月 19 日 Andrej Karpathy 在社交媒体发布了这条消息。这位 39 岁的 OpenAI 联合创始人、前特斯拉 AI 总监当周入职 Anthropic 预训练团队,直接汇报给团队负责人 Nick Joseph,将组建一个用 Claude 本身加速预训练研究的小组。此前已有 Workday CTO、Instagram CTO、Box CTO 等多位高管以个人贡献者身份加入 Anthropic,Karpathy 是迄今最高调的一位。

前一天(5 月 18 日)Anthropic 以超过 3 亿美元收购 SDK 生成工具 Stainless,后者服务于 OpenAI、谷歌、Cloudflare 等数百家公司,自动将 API 规范转化为 TypeScript、Python、Go、Java 等多语言 SDK。收购后 Anthropic 将关停 Stainless 的全部 hosted 产品,竞对需要另寻替代或自行维护。同周 Claude Code 快速模式默认模型从 Opus 4.6 切到 Opus 4.7,代码迭代速度提升 2.5 倍;Claude Design token 上限翻倍;企业版推出 Managed Agents 自托管沙箱,Agent 可在私有网络运行而无需暴露公网端口。据报道,Anthropic 正在洽谈新一轮至少 300 亿美元的融资,估值可能超过 9000 亿美元,若落地将首次超过 OpenAI。
09|SpaceX S-1 揭秘,Anthropic 每月 12.5 亿美元算力合同,「Cursor」600 亿收购期权
每月 12.5 亿美元,合同期至 2029 年 5 月。SpaceX 5 月 20 日向 SEC 提交的 S-1 招股书首次披露了与 Anthropic 的算力交易细节,全合同总价接近 450 亿美元。Anthropic 获得超过 300 MW 算力和 22 万块英伟达 GPU,覆盖 Colossus 1 和配备 GB200 的 Colossus 2,任一方可提前 90 天通知终止。交易背景是 xAI 旗舰产品 Grok 近几个月用量持续走低,空闲出的算力被转租给了竞争对手。SpaceX IPO 目标估值 1.75 万亿至 2 万亿美元,Musk 通过双层股权结构持有 85.1% 投票权。

招股书还披露了一桩更引人注目的交易。今年 4 月 SpaceX 与 Cursor 母公司 Anysphere 签署算力加期权协议,SpaceX 持有以 600 亿美元收购 Anysphere 全部股权的期权,若放弃收购则须支付 100 亿美元退出费。签约时 Cursor 正准备以 500 亿美元估值关闭一轮 20 亿美元融资,被 SpaceX 截胡。xAI 部门 Q1 营收 8.18 亿美元,运营亏损 24.7 亿美元,同季 AI 基础设施投入达 77 亿美元。从 2025 年 1 月估值 25 亿美元到如今 600 亿美元的收购期权价,Cursor 在 16 个月内翻了 24 倍。
10|Cursor「Composer 2.5」上线,月之暗面 K2.5 底座逼近 Opus 4.7
SWE-Bench Multilingual 79.8%,距 Opus 4.7 的 80.5% 只差 0.7 个百分点。5 月 18 日 Cursor 上线 Composer 2.5,底座是月之暗面开源的 Kimi K2.5,万亿参数 MoE 架构,每次推理激活约 320 亿参数。Cursor 在此基础上投入 85% 的总算力用于后训练,核心改进包括文本反馈强化学习(在失败的工具调用处给局部提示,取代只在最终结果给奖励)和 25 倍于前代的合成训练数据。标准模式定价 0.50 美元/百万 token 输入、2.50 美元输出,是 Opus 4.7 的十分之一。

今年 3 月 Composer 2 上线时,一位开发者在 API 响应中发现了 kimi-k2p5-rl-0317 的模型标识符,引发社区对信息透明度的批评。这次 Cursor 在公告首段就写明了底座来源。Composer 2.5 在 CursorBench v3.1 上以 63.2% 反超 Opus 4.7 的 61.6%,但在 Terminal-Bench 2.0 上两者几乎持平(69.3% vs 69.4%),GPT-5.5 则以超出 13 个百分点的优势领先。Cursor 同时宣布正在用 xAI Colossus 2 的百万 H100 等效算力从头训练一个更大的模型,未给出时间表。
我是木易,Top2 美国 Top10 CS 硕,现在是 AI 产品经理。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110894