DeepSeek：低成本AI大模型引发的全球科技地震

author 今天 3 1条评论

默认

摘要： 近日，中国人工智能初创公司DeepSeek凭借其低成本、高性能的AI大模型R1引发全球科技界震动。R1模型在训练成本仅600万美元的情况下，性能堪比OpenAI的o1模型，而Ope...

近日，中国人工智能初创公司DeepSeek凭借其低成本、高性能的AI大模型R1引发全球科技界震动。R1模型在训练成本仅600万美元的情况下，性能堪比OpenAI的o1模型，而OpenAI等巨头的训练成本高达10亿美元。这一突破性进展，令OpenAI首席执行官萨姆·奥尔特曼盛赞DeepSeek R1开创了“AI大模型算力新范式”。 DeepSeek R1的横空出世，不仅使其应用登顶苹果中国及美国区应用商店免费下载榜，更在全球范围内引发了对高成本AI研发模式的质疑，导致纳斯达克指数暴跌，英伟达市值蒸发近5890亿美元。投资者开始担忧科技巨头们的巨额AI投资是否合理，并对即将到来的财报季充满焦虑。 DeepSeek的成功并非偶然。其团队通过高效的训练流程和数据压缩策略，最大化地利用了相对低性能的AI加速器，实现了低成本高性能的突破。DeepSeek在除夕当天还发布了新的开源多模态AI模型Janus-Pro和JanusFlow系列，进一步巩固了其在AI领域的领先地位。Janus系列模型在多个基准测试中超越了DALL-E 3等闭源模型，其低成本优势更加凸显。 DeepSeek的成功也引发了美国政界人士的关注。特朗普在公开演讲中表示，DeepSeek的技术为美国AI行业敲响了警钟，美国需要更加专注于竞争以保持领先地位。总而言之，DeepSeek的出现不仅挑战了传统AI行业的成本模型，也对美国在AI领域的科技霸权构成威胁，预示着未来AI发展可能进入一个低成本、高效率的新时代。其带来的影响仍在持续发酵，对全球科技产业格局的重塑具有深远意义。

标签：人工智能 AI大模型 DeepSeek R1 OpenAI