近期,英伟达的黄仁勋罕见的在个人博客发表了一篇长文《I Is a 5-Layer Cake》,也是近10年来发表的一篇,在2016年,黄仁勋就发表了一篇长文叫《用GPU加速AI:一种新的计算模型》,2016年当时的英伟达0.8美元,现在是130美元,涨了160倍。
在2016年黄仁勋就在那篇文章中说了未来的AI需要的架构,以及GPU是怎么取代CPU的计算范式转变。
10年前,你别说看懂AI了,大部分都根本不信AI能这么快就出来,当时大家应该和我的感受一样,AI还在概念阶段,离真正的应用还早呢!
但是没想到的是,仅仅过了10年时间,AI目前已经火出圈了,大模型的发布,openclaw智能代理的出现真在颠覆现有的社会,形成新的产生力的结构转变!
所以这篇黄仁勋的长文一定要好好的仔细研究,因为里面其实有很多财富密码,毕竟黄是现在的AI教父了,对AI的理解应该是顶尖的。
所以和一个厉害的人学习,你如果没有能力面交,那么看他写的东西其实是最:省钱的方法!
因为你一毛钱没花,你就看到了行业顶尖“大佬”的思想和想法,其实就相当于和他沟通交流了!
下面给我的译文和对应思考:
AI 是当今塑造世界最强大的力量之一。它不仅仅是一个聪明的应用程序,也不是一个单一的模型;它是一种基础设施,就像电力和互联网一样。
AI 运行在真实的硬件、真实的能源和真实的经济体系之上。它将原材料转化为大规模的智能。未来,每一家公司都会使用 AI,每一个国家都会建设 AI。
如果想理解为什么 AI 会以这样的方式发展,最好的方法是从第一性原理出发,看看计算领域到底发生了哪些根本性的变化。

从“预先编写的软件”到“实时智能”
在计算机发展的绝大多数历史中,软件都是预先编写好的。
人类先描述一个算法,计算机再去执行它。数据必须被精心结构化,存储到表格中,并通过精确的查询语句进行检索。
因此,SQL 成为了不可或缺的工具,因为它让这种计算模式能够正常运转。
但 AI 打破了这种模式。
这是人类历史上第一次拥有一种计算机,它可以理解非结构化信息。
它能够:看懂图像,阅读文本,听懂声音,理解其中的含义,它还能根据上下文和意图进行推理。
最重要的是:它可以实时生成智能。
每一次响应都是全新生成的。每一个答案都取决于你提供的上下文。
这不再是软件从数据库中检索已有指令,而是软件在按需进行推理并生成智能。
正因为智能是在实时生成的,支撑它运行的整个计算技术栈也必须被重新发明。
AI 作为基础设施
从产业角度来看,AI 可以被理解为一个 五层技术栈(five-layer stack)。
能源(Energy)
最底层是 能源。实时生成智能,需要实时产生的电力。
每一个生成的 token,本质上都是:电子在流动,热量在被管理,能量被转化为计算。
在这一层之下没有任何抽象层。
能源是 AI 基础设施的第一性原理,也是决定系统能够产生多少智能的根本约束。
芯片(Chips)
能源之上是 芯片。
芯片是专门设计的处理器,用于在大规模条件下高效地把能量转化为计算能力。
AI 的工作负载需要:大规模并行计算,高带宽内存,高速互联。
芯片层的进步,决定了 AI 能扩展多快,以及智能会变得多便宜。
基础设施(Infrastructure)
芯片之上是 基础设施。
这一层包括:土地,电力输送,冷却系统,数据中心建设,网络系统,以及把成千上万处理器组织成一台机器的调度系统。
这些系统本质上是 AI 工厂。它们并不是为了存储信息而设计的,而是为了制造智能。
模型(Models)
基础设施之上是 模型。
AI 模型可以理解多种类型的信息,例如:语言,生物,化学,物理,金融,医学,以及现实世界本身。
语言模型只是其中的一种。目前最具变革性的研究,正在发生在:蛋白质 AI,化学 AI,物理模拟,机器人自主系统。
应用(Applications)
最顶层是 应用层,也是 经济价值真正产生的地方。
例如:药物研发平台,工业机器人,法律 AI 助手,自动驾驶汽车。
自动驾驶汽车,本质上是 AI 应用被装进一辆机器中。
人形机器人,本质上是 AI 应用被装进一个身体中。
底层技术栈是一样的,只是最终呈现出的形态不同。
这就是所谓的 “五层蛋糕”(five-layer cake):
能源 → 芯片 → 基础设施 → 模型 → 应用
每一个成功的应用,都会向下牵动整条产业链,从应用层一直延伸到最底层——为其提供电力的发电厂。
而我们才刚刚开始这一轮建设。目前投入的资金只有几千亿美元,但未来仍然需要建设数万亿美元规模的基础设施。
在全球范围内,我们已经看到:芯片工厂,计算机组装工厂,AI 工厂(AI 数据中心),正在以前所未有的规模被建设。
这正在成为人类历史上最大规模的基础设施建设之一。
支撑这一建设浪潮所需要的劳动力规模也极其庞大。
AI 工厂需要:电工,水管工,管道安装工,钢结构工人,网络技术人员,设备安装人员,运维人员
这些都是技术型、收入较高的工作岗位,而目前市场上严重短缺。
参与这场变革,并不一定需要计算机科学博士学位。
与此同时,AI 也正在推动整个知识经济的生产力提升。
以放射学为例:
AI 现在已经可以帮助医生读取医学影像,但对放射科医生的需求依然在持续增长。这并不是一个矛盾。
放射科医生的真正职责是照顾病人。阅读影像只是其中的一个环节。
当 AI 承担越来越多的重复性工作时,医生就可以把更多精力放在:医学判断,与患者沟通,医疗护理
医院因此变得更高效,可以服务更多患者,也会雇佣更多人。
生产力带来更多能力,能力带来增长。
过去一年发生了什么变化?
在过去一年里,AI 跨越了一个重要的门槛。
模型的能力已经足够好,可以在大规模场景中真正发挥作用。
推理能力提升了,幻觉(hallucination)明显减少,对现实信息的对齐与落地(grounding)能力也大幅提高。
这是第一次,基于 AI 构建的应用开始真正创造现实的经济价值。
目前,在以下领域的 AI 应用已经展现出明显的产品与市场匹配:药物研发,物流,客户服务,软件开发,制造业
而这些应用的发展,又会强力拉动它们之下的每一层基础设施。

开源模型在这一过程中扮演着至关重要的角色。
如今,世界上大多数 AI 模型都是免费的。研究人员、初创公司、企业,甚至整个国家,都依赖开源模型来参与先进 AI 的发展。
当开源模型达到技术前沿时,它们带来的改变不仅仅发生在软件层面,还会激活整个技术栈的需求。
DeepSeek-R1 就是一个非常有力的例子。
通过让一个强大的推理模型被广泛获取和使用,它加速了应用层的采用,同时也提升了对以下资源的需求:模型训练,基础设施,芯片,能源!
也就是说,它把需求从应用层一路向下传导到整个 AI 技术栈。

这意味着什么
当你把 AI 看作一种关键基础设施时,它所带来的影响就变得非常清晰。
AI 的起点也许是 Transformer 架构的大语言模型(LLM),但它远不止如此。
它是一场工业级的变革,正在重塑:能源的生产和消费方式,工厂的建设方式,工作的组织方式,以及整个经济增长的模式。
之所以开始建设 AI 工厂(AI 数据中心),是因为智能如今需要实时生成。
芯片正在被重新设计,因为效率决定了智能能够以多快的速度扩展。
能源变得至关重要,因为它决定了系统究竟能够产生多少智能的上限。
而应用之所以加速发展,是因为底层模型已经跨越了一个关键门槛——终于可以在大规模场景中真正发挥价值。
这一技术栈的每一层,都在相互强化、相互推动。

这就是为什么这轮建设规模如此之大,也为什么它会同时影响如此多的行业。
这也是为什么它不会局限于单一国家或单一行业——每一家公司都会使用 AI,每一个国家都会建设 AI。
我们仍处于早期阶段:很多基础设施尚未建立,很多劳动力尚未接受培训,很多机会尚未被实现!
但方向已经非常明确。AI 正在成为现代世界的基础性基础设施。
而我们现在所做的选择——建设速度、参与广度,以及部署的责任感——将决定这一时代最终会成为什么样子。
好的,上面就是完整的译文,我觉得这篇是老黄对于整个AI行业变革的一个强心剂,有点回应了之前那篇AI鬼故事《智力过剩》文章,虽然AI的出现确实让写代码,诊断更便利,但是也同样节省了人们大量时间,比如举例说的医生有大量时间去做护理和关怀。而且会需要更多的蓝领,因为需要更多的底层基建,这个是目前AI没有做到的。
还有文中反复提及的这5层机构,每一层级的推动都是下次层更大推动,所以从第一性原理触发,未来越是底层越是珍贵,那么最底层的就是能源!
目前美国的电力有巨大缺口,今日我也查了很多关于美股的能源公司,很多都涨幅惊人。而且之前币圈很多大佬都已经开始投底层能源类项目(孙宇晨买了电力公司,今日CZ发布yzi labs投资了底层机器人公司),所以接下来我会把美股的能源类项目研究一遍,紧跟老黄步伐,紧跟时代!
$NVDAon

