DeepSeek-R1：颠覆AI格局的低成本开源推理大模型

author 今天 5 抢沙发

默认

摘要： 中国AI初创公司DeepSeek发布的推理大模型R1，以其低廉的成本（仅为OpenAI同类模型的3%-5%）和开源模式，在AI领域引发巨大震动。R1在多项第三方基准测试中超越了Me...

中国AI初创公司DeepSeek发布的推理大模型R1，以其低廉的成本（仅为OpenAI同类模型的3%-5%）和开源模式，在AI领域引发巨大震动。R1在多项第三方基准测试中超越了Meta Llama 3.1、OpenAI的GPT-4o和Anthropic的Claude Sonnet 3.5，性能卓越。

R1的成功秘诀在于其独特的训练方法。它摒弃了传统的监督微调（SFT）方式，转而采用纯强化学习（RL），这不仅降低了成本，也避免了SFT中数据集固有的缺陷，最终实现了显著的性能提升。虽然在模型后期引入少量SFT以修正一些缺陷，但RL的成功证明了其在训练大模型方面的巨大潜力。

DeepSeek以有限的资源（约550万美元）和相对较少的GPU数量（5万块），便训练出了性能如此强大的模型，这与OpenAI等巨头动辄数百万GPU的投入形成了鲜明对比。其开源策略进一步降低了使用门槛，使小型组织和研究人员也能参与到AI竞争中，实现了AI技术的民主化。

R1的成功对企业AI战略产生了深远影响。企业现在拥有了OpenAI等昂贵专有模型的低成本替代品，许多公司可能需要重新评估与专有AI提供商的合作关系。开源模式的成功也证明了其在AI发展中的重要性，Meta首席AI科学家Yann LeCun对此表示赞赏。

DeepSeek的成功，也引发了人们对OpenAI等公司巨额投资回报的质疑，以及对AI技术发展方向的思考。虽然R1并非完美无缺，其他公司很快会学习并改进，但其低成本、高性能和开源的特性，将会极大地惠及消费者和初创企业，并给传统的AI巨头带来巨大的挑战。

打赏