杨植麟和梁文锋论文“撞车” 技术路线不谋而合_网络热点_资讯_微发商务网

杨植麟和梁文锋论文“撞车” 技术路线不谋而合

   2025-02-20 08:16:06 金融界微发商务网21
核心提示:在AI领域,技术创新与突破一直是各大厂商和研究机构竞相追逐的焦点。近日,DeepSeek的梁文锋与月之暗面的杨植麟因各自发表的论文“撞车”而引发广泛关注

在AI领域,技术创新与突破一直是各大厂商和研究机构竞相追逐的焦点。近日,DeepSeek的梁文锋与月之暗面的杨植麟因各自发表的论文“撞车”而引发广泛关注。同时,DeepSeek迅速崛起让月之暗面陷入尴尬境地,甚至有消息称月之暗面已大幅降低广告投放。

2月18日,DeepSeek与月之暗面几乎同时发布了最新论文,主题都是挑战Transformer架构的核心注意力机制,旨在使其更高效处理更长上下文。DeepSeek的论文提出名为NSA的新架构,在基准测试中表现出色,准确率相同或更高,处理64k标记序列时速度提高至11.6倍,训练更高效且所需算力更少。

月之暗面的论文则提出了MoBA架构,使用将“词”变成块的方法,并设计了一套可以自由切换全注意力和稀疏注意力机制的方式,给现有全注意力模型更多适配空间。这两篇论文展示了两位创始人在技术领域的深厚功底,揭示了AI大模型技术发展的新方向。清华大学教授章明星指出,两篇论文都指向了可反向传递的learned sparse attention。

与此同时,DeepSeek凭借其强大的技术实力和精准的市场定位迅速崭露头角。据报道,DeepSeek在几十天内达到3500万DAU,这一成绩令业界震惊。相比之下,月之暗面虽然推出了Kimi等产品,但在用户增长方面显得力不从心。尽管投入大量资金进行广告投放,但效果不佳,一年多时间仅获得不足千万量级的日活数据。

DeepSeek的崛起给月之暗面带来了巨大压力。一方面,DeepSeek的技术实力和市场表现削弱了月之暗面的技术优势;另一方面,DeepSeek的迅速扩张也挤压了月之暗面的市场份额。在此背景下,月之暗面不得不重新审视自己的市场定位和技术路线。团队计划重新训练基础模型,同时关注应用层机会,如参考OpenAI的DeepResearch产品方向。尽管月之暗面拥有多模态能力、资本储备和品牌余温等优势,但在竞争激烈的AI市场,留给它的时间窗口正在缩小。

从行业影响来看,DeepSeek的爆发重塑了中国大模型赛道。资本逻辑从过去的“烧钱换估值”转向关注技术性价比与商业化闭环;生态链重构,百度、腾讯等大厂纷纷接入DeepSeek的开源模型,闭源玩家生存空间被挤压;技术平民化趋势显现,算法创新降低了对进口硬件的依赖,国产芯片能效比提升。在这样的环境下,月之暗面面临巨大挑战,如何在开源生态、成本控制或垂直场景中找到新支点成为破局关键。

 
免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。 微发商务网对此不承担任何保证责任, 微发商务网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张(包括但不限于侵犯著作权、商业信誉等),请与我们联系并出示相关证据,我们将按国家相关法规即时移除。

本文地址:http://cn.wlchinahc.com/news/wfmy902397.html

收藏 0打赏 0
 
更多>同类资讯
今日资讯
推荐图文
点击排行

网站首页  |  付款方式  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  RSS订阅
免责声明:本站所有信息均来自互联网搜集,产品相关信息的真实性准确性均由发布单位及个人负责,请大家仔细辨认!并不代表本站观点,微发商务网对此不承担任何相关法律责任!如有信息侵犯了您的权益,请告知,本站将立刻删除。
友情提示:买产品需谨慎
网站资讯与建议:3123798995@qq.com 客服QQ:3123798995点击这里给我发消息3123798995点击这里给我发消息