中国算力的「效率革命」,比让存储扩充生产线还有效

一个反直觉的事实:中国AI公司正在用更少的内存,跑出差不多的效果,论文是开源的,这可能会让海外御三家 OpenAI、Anthropic、gemini 的推理成本降低一个量级,毛利提高,同时对内存的需要也降一个量级。

DeepSeek的MLA架构、KV缓存优化以及各类模型量化技术为例,这些动作直接且大幅地降低了推理阶段的显存占用量和带宽需求,单位Token的生成成本断崖式下跌。智谱的超高速推理,阿里和小米千问的缓存计费直接砍到十分之一。这些动作的本质是什么?都是在算法压缩效率,算力被利用到了极致。

但市场在用旧地图找新路

美股AI 还在不断堆资本开支,提前锁定大额的产能和算力,7000 亿资本开支足够让整个 AI 上下游的产业链狂欢。这个逻辑没错,对算力和内存需求确实还很大,增长也很快。但问题是,它忽略了另一条曲线,中国对算力优化的效率提升空间,同样大得惊人。

所有人都在赌「卖水人」能持续赚钱,但没人注意到挖金矿的人突然学会了循环用水。

如果中国AI公司把内存使用效率再压缩50%,那么靠资本开始撑估值的存储股,叙事还成立吗?

好像整个市场没人认真计算中国在算法层的效率革命,到底能省下多少内存

但是客观来说如果推理成本和内存使用率压缩50%,可能带来的是AI Agent全天候高频API调用、AI 落地应用的大爆发。单次用量少了,但总调用频次如果增加10倍,总体内存和算力的绝对需求依然是暴增的。

中国算力比让存储扩充生产线还有效,可能会打破原有头部厂商的垄断溢价,这是目前需要留意的风险,以及算力效率这条路到底能走多远,能否持续进步优化。

不确定的是,这个「未被计价」的窗口期有多长。也许三个月,也许一年。$MU

#在币安广场聊传统金融

MU
MUUSDT
1,008.11
+2.86%