为什么DeepSeek被称为”很内耗的人工智能”?
近期,中国AI公司DeepSeek(深度求索)在全球AI领域掀起巨大波澜。它不仅成功挑战了OpenAI等科技巨头,还因其极低的训练成本被称为”很内耗的人工智能”。那么,DeepSeek究竟是怎样做到低成本高效益的?
与传统AI公司不同,DeepSeek在算力、算法和团队管理上都采取了极点优化的策略。它仅用2000多块显卡、558万美元的训练成本,就打造出媲美全球顶级水平的R1模型。相比之下,OpenAI等公司的训练成本动辄上亿美元。这种”极简主义”模式,让DeepSeek在AI领域独树一帜。
DeepSeek的低成本策略怎样实现?
DeepSeek的成功离不开其在算法上的创新。不同于美国科技巨头依赖”堆算力”的行为,DeepSeek通过软件优化,大幅降低了硬件需求。R1模型的训练仅用了53天,成本不到其他顶级模型的特别其中一个。这种高效能比,让市场震惊。
顺带提一嘴,DeepSeek采用开源策略,对终端用户免费开放,API定价仅为OpenAI的百分其中一个。创始人梁文锋曾表示,即使在这样的定价下,公司仍能保持合理利润。这种商业模式不仅吸引了大量用户,也让DeepSeek在竞争中占据优势。
年轻团队怎样助力DeepSeek高效运作?
DeepSeek的团队结构也是其”内耗”模式的关键。公司140名员工中,90后占比超75%,95后占50%以上。梁文锋推崇”高潜力年轻人”策略,认为应届博士生比资深工程师更能适应前沿技术。
团队管理上,DeepSeek实行扁平化极客文化,资源分配”无上限”,鼓励创新。R1模型的技术思路就是一名年轻员工的”突发奇想”,梁文锋为其组建团队,最终跑通技术路线。这种灵活机制,大幅降低了组织内耗,提升了研发效率。
DeepSeek模式对AI行业意味着什么?
DeepSeek的崛起,打破了AI必须依赖天量算力的固有认知。它的”低成本、高效率”模式,直接冲击了美股科技股,英伟达、Meta等公司股价因此大幅波动。经济学家甚至认为,DeepSeek可能成为”美股泡沫的最大威胁”。
未来,如果更多AI公司效仿DeepSeek的”内耗”策略,全球AI产业格局或将重塑。中国AI能否借此实现弯道超车?让我们拭目以待。