搜索历史清空

DeepSeek V4来了、携手华为及寒武纪,梁文锋被曝打破“从不融资”铁律

瑞财经 吴文婷 2026-04-24 16:33 1.2w阅读

瑞财经 吴文婷 千呼万唤始出来。

4月24日,DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。

据官方介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。

模型按大小分为pro和flash两个版本,DeepSeek-V4-Flash是更快捷高效的经济之选。

官方称DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。

与此同时,华为发文表示,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。

据其指出,昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeek V4模型推理部署。

寒武纪发文表示,寒武纪已基于vLLM推理框架完成对深度求索公司最新开源模型285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro的Day 0适配,适配代码已开源到GitHub社区。

值得关注的是,曾让无数投资人吃了闭门羹的DeepSeek,近期陆续传出开放融资的消息。

4月22日,关于腾讯与阿里巴巴正就投资DeepSeek展开洽谈的消息刷屏。据媒体报道,腾讯控股和阿里巴巴集团正在洽谈投资DeepSeek。一位知情人士透露,DeepSeek的目标估值已从最初的至少100亿美元上调至逾200亿美元(约合人民币1365亿元),融资规模亦可能随之扩大。

业内人士指出,这是DeepSeek成立以来的首次外部融资,标志着DeepSeek创始人梁文锋长期坚守的“不引入外部资金”立场出现重大转变。

公开资料显示,DeepSeek(深度求索)成立于2023年,由量化私募巨头幻方量化创立,总部位于杭州,核心研发团队位于北京。该公司以开源大模型和极致性价比著称,曾于2025年初引爆全球AI圈,其创始人梁文锋以极致低调闻名。

据《2025新财富500富人榜》,40岁的梁文锋,首次上榜即晋级前十,持股市值达1846.2亿元。

重要提示: 本文仅代表作者个人观点,并不代表瑞财经立场。 本文著作权,归瑞财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ruicaijing@rccaijing.com

相关文章

24小时热门文章

最新文章