DeepSeek 要发大招了，梁文锋署名新论文！暴力优化AI架构-工信会

> 自媒体 > （AI）人工智能 > DeepSeek 要发大招了，梁文锋署名新论文！暴力优化AI架构

DeepSeek 要发大招了，梁文锋署名新论文！暴力优化AI架构

来源：新浪财经

2026-01-04 19:17:22

137

管理

来源：市场资讯

（来源：新智元）

标题：mHC：Manifold-Constrained Hyper-Connections

链接：https://arxiv.org/abs/2512.24880

在这篇论文中，DeepSeek提出了流形约束超连接（mHC），将矩阵投影到约束流形上优化残差连接空间，从而确保稳定性，彻底颠覆了传统AI架构认知——

可以扩大残差流通道宽度（residual stream width），而在算力和内存上的代价却微乎其微。

毕竟，残差流通道宽度一直是扩展模型的「烦人瓶颈」。

这波操作，也再次展现了DeepSeek典型的风格：对同行的温和降维打击——

你们两年时间都在打磨微结构，调整DS-MoE？挺可爱哈。

来看看我们怎么玩：把一个理论上看起来还不够成熟的高级原语，直接做实，顺手解锁游戏下一关。

他们在论文中写道：「我们的内部大规模训练实验进一步验证了mHC在大规模应用中的有效性。」

随后，通过如下方式得到最终满足约束的映射：

原文图6：mHC相比基线的扩展特性。 (a) 计算扩展曲线：实线展示了不同计算预算下的性能差距。每个点代表模型大小和数据集大小的特定计算最优配置，从3B和9B扩展到27B参数。(b) Token扩展曲线：3B模型在训练期间的轨迹。每个点代表模型在不同训练token数下的性能。

理想情况下，单层映射应满足双随机约束，即前向信号增益与后向梯度增益均等于1。

然而，为提升计算效率，实际实现中使用的Sinkhorn-Knopp算法必须限制迭代次数，这次实验中为20次。

因此，如下图(a)所示，后向梯度增益会略微偏离1。在下图(b)所示的复合映射情况下，偏离有所增加但仍保持有界，最大值约为1.6。

原文图8：可学习映射的可视化，展示了HC（第一行）与mHC（第二行）的代表性单层及复合映射。每个矩阵通过对选定序列内所有token取平均计算得出。y轴和x轴上的标签分别表示前向信号增益（行和）与后向梯度增益（列和）。

更多详情请参阅原论文。

参考资料：

https://arxiv.org/abs/2512.24880

https://x.com/teortaxesTex/status/2006628917428334631

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

让AI像程序员一样工作：ChatGPT新功能太强了

AI中的DeepSeek 使用技巧

相关文章

梅赛德斯将推“小号”G级越野车，或2027年亮相

【网通社快报】梅赛德斯-奔驰计划推出一款更紧凑的“Baby”G-Class，作为..

定位华为乾崑阿维塔首款全场景运动轿车，阿维塔06T外观公布..

IT之家 2 月 5 日消息，今天上午，阿维塔通过官微公布了“华为乾崑阿维塔..

一汽全新中级轿车将上市，定名为悦意08，车长4920mm，两种动力..

近日，一汽奔腾发布最新消息，旗下的“奔腾悦意”新能源序列升级为独立的..

20-30万闭眼入！5款中大型轿车实测大公开

想买20-30万的中大型轿车，空间大、科技感足，又怕踩坑？今天给大家唠唠5..

2025轿车销量TOP10，自主逆袭合资，大众仍保住3车席位

漫哥又来扒销量榜了，2025年的国内轿车市场势头还是不错滴，全年轿车零售..

新车 | 1.5T插混动力/掀背式轿车，smart精灵#6 EHD官方测试谍照..

文：懂车帝原创李烁[懂车帝原创产品] 日前，smart精灵#6 EHD官方测试谍..

超50%部件更新！奔驰新一代S级轿车正式亮相！黄仁勋宣布将与奔驰在L4级自动..

每经记者：董天意每经编辑：余婷婷1月30日，梅赛德斯-奔驰（以下简称奔..

10万左右新车燃油版轿车，家用这五款最值得买

有粉丝说推荐一下10万左右的新车轿车，不选SUV，不选新能源电车混合动力..

年轻人买轿车不用买太贵，2026有“真香价”的3款轿车，高价低配..

买燃油轿车，不想买太贵的，大多人都想买低价高配的，而且低价位的车还是..

关于作者

呼唤(普通会员)

文章

2027

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

DeepSeek 究竟是个啥？一文带你看明白

2025/02/08

02

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

03

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

04

这怕是全网最强的 DeepSeek 图片教程吧，赶紧收藏了！

2025/02/09

05

AI 界黑马DeepSeek 超详细介绍

2025/02/09

标签云

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体112331

@2022 All Rights Reserved

浙ICP备19035174号-6 技术支持：千寻网络

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索