henry 发自 凹非寺量子位 | 公众号 QbitAI
DeepSeek V4,已经开始逼着海外开发者为它修专属高速公路了。
发布才两周,开源圈里,第一批V4原生基础设施已经冒了出来。
而且,不是那种在现有框架上套一层壳的“小修小补”。
不是通用GGUF加载器;不是llama.cpp的wrapper;甚至压根不支持别的模型。
它只干一件事:
把DeepSeek V4 Flash,在Mac上跑到极致。

可以说,这波,Mac库存又被DeepSeek清了一遍。
鲸鱼,确实值得。
专为V4 Flash打造的本地推理引擎4月24日,DeepSeek发布V4系列。其中,V4 Flash是效率型号:284B总参数、13B激活参数、100万token上下文。
这样的体量,过去几乎默认属于云端。
而antirez想做的,是把它塞进一台Mac。于是,ds4.c诞生了。

你准备好在本地跑V4了吗?
一个模型一个推理框架这件事,也在开发者圈炸出了一个更大的讨论:
未来会不会变成——一个模型,一个推理框架?
Hacker News上一条高赞评论提了一个有意思的方向,如果开始针对精确的GPU加模型组合构建超优化推理引擎呢?
GPU越来越贵,如果去掉足够多的抽象层,直接针对精确的硬件和模型编码,可能能优化很多。
这条路的代价也很明显。同一条评论指出,一旦模型过时,一切从头来过。

真名Salvatore Sanfilippo,1977年出生于西西里岛。2009年创建Redis,主导这个项目十一年,2020年离开。

离开时他写过一段话,说自己写代码是为了表达自己,代码是一件制品而不只是有用的工具。他宁可被记住为一个糟糕的艺术家,也不愿被记住为一个好程序员。
2024年底他回到Redis,担任evangelist角色。
除了Redis之外,他还写过Kilo(不到1000行C代码的文本编辑器)、dump1090(航空ADS-B信号解码器)、linenoise(readline的微型替代品)。
他还在玩Flipper Zero,写了RF协议分析工具,把Asteroids移植到上面。2022年他出了一本科幻小说《WOHPE》,主题是AI、气候变化、程序员,以及人类和技术的互动。
他个人主页第一行写的是,「我把大部分专业时间花在写代码和写小说上。」

关于Redis的诞生,他在个人主页里写了一段:
我老婆说,Redis的前几年我大部分代码都是坐在马桶上写的,用一台MacBook Air 11寸。我真希望能说她错了,但她正好说得完全对。
这种调性贯穿了他做的所有项目。小、精确、自成一体。
ds4.c也是同一个路子。
看一下他在ds4 README里关于macOS bug的那段备注,能立刻感觉到这个人的味道。
ds4有一个CPU推理路径用于正确性验证,但当前版本的macOS在虚拟内存实现上有一个bug,跑CPU推理会导致内核崩溃。
他写道,记住了吗?软件都很烂。我没法修复CPU推理来避免崩溃,因为每次都得重启电脑,一点都不好玩。
然后加了一句,如果你有胆量,来帮我们。
他在个人主页里还留了一句话:
现代编程正变得复杂、无趣,全是要粘合的层。它正失去大部分美感。大多数程序员既不在面对编程的艺术面,也不在面对编程的高级工程面。
从Redis到ds4.c,十五年过去,antirez还是那个antirez。
只不过这一次,他开始给AI修路了。
参考链接[1]http://invece.org/[2]https://github.com/antirez/ds4[3]https://news.ycombinator.com/item?id=48050751
本文来自微信公众号“量子位”,作者:量子位,36氪经授权发布。
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110233