蛇年除夕夜,硅基流动创始人袁进辉没有留在饭桌上,而是抓紧时间与技术团队开会,解决DeepSeek模型在国产芯片上的适配问题。经过三天三夜的努力,他们联合华为和DeepSeek,在2月1日上线了基于国产芯片服务的DeepSeek-V3和DeepSeek-R1。此时,距离DeepSeek AI智能助手登顶中美两国App Store免费应用榜还不到一周。
过去三年,每年春节前后都会迎来一波AI热潮。2023年,ChatGPT引爆了国内大模型创业热;2024年,视频生成模型Sora震撼所有人;今年,主角变成了DeepSeek。这家低调但技术开放的中国公司改变了AI大模型的世界格局。
2024年底及2025年初,DeepSeek发布新一代MoE模型V3以及推理模型R1,凭借高性能、低训练成本和对齐OpenAI o1两项表现,迅速走红。截至2月8日,DeepSeek国内APP端日活为3494万,海外APP端日活达3685万,直追ChatGPT。
这一变化首先冲击了Meta,其Llama系列模型曾是全球开源大模型的领头羊。如今,DeepSeek用更低的成本做出了更好的模型并免费开源,让Meta处境尴尬。随后英伟达也受到冲击,市场担忧DeepSeek带来的低成本模式会减少算力需求,导致英伟达市值一夜蒸发近6000亿美元。