DeepSeek:低成本AI大模型引发的全球科技地震
摘要:
近日,中国人工智能初创公司DeepSeek凭借其低成本、高性能的AI大模型R1引发全球科技界震动。R1模型在训练成本仅600万美元的情况下,性能堪比OpenAI的o1模型,而Ope...
近日,中国人工智能初创公司DeepSeek凭借其低成本、高性能的AI大模型R1引发全球科技界震动。R1模型在训练成本仅600万美元的情况下,性能堪比OpenAI的o1模型,而OpenAI等巨头的训练成本高达10亿美元。这一突破性进展,令OpenAI首席执行官萨姆·奥尔特曼盛赞DeepSeek R1开创了“AI大模型算力新范式”。 DeepSeek R1的横空出世,不仅使其应用登顶苹果中国及美国区应用商店免费下载榜,更在全球范围内引发了对高成本AI研发模式的质疑,导致纳斯达克指数暴跌,英伟达市值蒸发近5890亿美元。投资者开始担忧科技巨头们的巨额AI投资是否合理,并对即将到来的财报季充满焦虑。 DeepSeek的成功并非偶然。其团队通过高效的训练流程和数据压缩策略,最大化地利用了相对低性能的AI加速器,实现了低成本高性能的突破。DeepSeek在除夕当天还发布了新的开源多模态AI模型Janus-Pro和JanusFlow系列,进一步巩固了其在AI领域的领先地位。Janus系列模型在多个基准测试中超越了DALL-E 3等闭源模型,其低成本优势更加凸显。 DeepSeek的成功也引发了美国政界人士的关注。特朗普在公开演讲中表示,DeepSeek的技术为美国AI行业敲响了警钟,美国需要更加专注于竞争以保持领先地位。 总而言之,DeepSeek的出现不仅挑战了传统AI行业的成本模型,也对美国在AI领域的科技霸权构成威胁,预示着未来AI发展可能进入一个低成本、高效率的新时代。其带来的影响仍在持续发酵,对全球科技产业格局的重塑具有深远意义。
发表评论