传媒:DeepSeek带来的AI变革

研究机构:华福证券 研究员:杨晓峰,甄熙茹 发布时间:2025-02-01

  投资要点:

  一、用户量:海外加速出圈,迅速登顶全球下载榜单

  1、网页端:重度用户为主,DeepSeek在24年12月26日推出V3(对标GPT4o),因其显著的性能,用户迅速开始增长,同时在1月20日发布R1(对标GPT-o1)后,进一步出圈。

  2、APP端:大众用户为主,R1推出后,追平GPT-o1,迅速出圈海外。根据点点数据,从DeepSeek在美国下载排名从1月22日的201名,迅速在1月27日登顶第一名;根据七麦数据,截止1月30日,DeepSeek在168个国家位居下载榜第一名。

  二、DeepSeek偏好激进性创新:架构(MOE+MLA)+精度(FP8)

  1、MOE架构创新:相比过去主流模型的MOE专家模型停留在8~16个,而DeepSeek每个MoE层包含1个共享专家和256个路由专家,有助于降低模型推理时激活的参数量。

  2、MLA架构创新:MLA通过联合压缩键值矩阵为低秩向量,将多个头的键值信息融合,使推理时仅需缓存少量低秩向量,大幅降低KV缓存需求,减少内存占用。

  3、训练特色:突破大模型训练固定思维(一般模型权重和梯度使用FP16,优化器参数使用FP32),敢于尝试在低精度FP8的模式下训练大模型,并且该尝试同样出现了较好的效果。

  三、DeepSeek开源对AI应用和AI终端的影响:产品力竞争时代

  DeepSeek从V3到R1,将进一步推动全行业大模型的提升,更快的追赶GPT4o和GPT-o1;同时成本的下降,有助于AI应用和AI终端的普及。未来行业竞争将进入“产品能力竞争”,巨头的流量优势将进一步凸显。

  四、DeepSeek对推理成本的影响:用户规模和使用频次

  未来推动推理成本增加的核心因素:用户规模和用户使用频次的增加。根据Grok创始人,过去60年,每10年计算成本降低约1000倍,但人们的购买量增加了10万倍,总支出反而增长了100倍。

  五、投资建议

  AI全球竞争时代来临,看好以为DeepSeek为代表的中国大模型的崛起,尤其看好AI应用和AI终端的落地。预期未来推理成本仍将显著增长,全球AI竞争背景下,国产替代是算力增长核心。

  风险提示

  AI竞争激烈,AI发展不及预期

查看研报原文

行业研究

华福证券