#DeepSeek冲击全球算力 DeepSeek是一家中国的AI初创公司,近期因其推出的DeepSeek-R1模型在全球范围内引起了巨大关注。这个模型以其卓越的性能和低廉的成本,对全球算力市场产生了显著冲击,特别是在大型语言模型(LLM)领域。DeepSeek-R1模型的推出不仅影响了算力需求,还对相关公司及投资机会和风险产生了重要影响 。
DeepSeek-R1模型的核心特点包括强大的推理能力、低成本和高效率。它在数学、代码、自然语言推理等任务上表现出色,性能可媲美甚至超越了一些顶尖模型。此外,它的训练成本仅为560万美元,远低于其他公司开发AI模型的成本 。
DeepSeek的崛起对全球AI算力需求产生了重大影响。其大模型DeepSeek-V3具有6710亿总参数和370亿激活参数,在14.8万亿token数据上进行预训练,展现了强大的语言理解与生成能力。这使得它在自然语言处理和代码生成领域表现突出,能够生成高质量、逻辑连贯的文本和代码 。
DeepSeek的成功也在金融市场上引起了轩然大波。1月27日,由于对AI盈利能力和行业对高科技芯片需求的信心产生动摇,美股市场出现了大幅下跌,纳斯达克100指数期货一度跌5%,半导体股也出现暴跌 。此外,DeepSeek的技术突破也在一定程度上挑战了美国在AI领域的技术霸权,导致英伟达等芯片巨头的股价大幅下跌 。
总的来说,DeepSeek的崛起不仅展示了其在AI领域的实力,也预示着全球AI算力市场和技术竞争格局的重大变化。