AI动态跟踪系列(四):DeepSeek引发广泛关注,大模型应用落地将加速

研究机构:平安证券 研究员:闫磊,付强,黄韦涵,王佳一 发布时间:2025-02-06

  平安观点:  

  DeepSeek-V3和DeepSeek-R1陆续发布,国产大模型能力已可比肩海外领军大模型。2024年12月26日,杭州AI公司深度求索(DeepSeek)正式发布DeepSeek-V3大模型首个版本并同步开源。根据DeepSeek网站信息,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T tokens上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet相当。在训练成本方面,根据DeepSeek发布的技术文档论文信息,DeepSeek-V3的训练时长为2788K个H800GPU小时,训练花费约为557.6万美元。2025年1月20日,DeepSeek正式发布复杂推理类大模型DeepSeek-R1,性能对齐OpenAI o1正式版。以DeepSeek系列大模型为代表的国产大模型性能已可比肩海外领军大模型,且成本更低。

  DeepSeek系列大模型引发全球广泛关注,海内外巨头科技公司及云服务平台厂商已相继接入。2025年1月15日,DeepSeek推出AI助手DeepSeek App。2025年春节期间,DeepSeek系列大模型火爆出圈,引发全球广泛关注。根据新浪财经2月1日引用彭博社信息,DeepSeek的AI助手在140个市场中成为下载量最多的移动应用。根据Appfigures的数据,DeepSeek的推理人工智能聊天机器人在1月26日登上苹果公司App Store的榜首,并自那时以来一直保持全球第一的位置。同时,全球也开始了对DeepSeek大模型的复刻。以港科大团队为例,港科大助理教授何俊贤的团队,只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练。当前,海内外巨头科技公司及云服务平台厂商已相继接入了DeepSeek大模型,部分AI应用领域相关企业也已开始了DeepSeek大模型的部署和应用。DeepSeek大模型获得了全球的广泛关注,认可度持续提升。我们认为,DeepSeek大模型的开源、低成本和高性能将大幅降低大模型的获得、部署和应用成本,将加快大模型在B端和C端应用场景的落地。另外,DeepSeek大模型的出圈将对全球大模型产业的竞争格局产生重要影响,将对海外领军大模型厂商的领先性产生冲击,并同时将对算力的未来发展产生重要影响。

  DeepSeek大模型的出圈预计不改算力整体需求向上的态势,但推理和端侧算力有望增长更快。DeepSeek在算法效率和计算成本方面有着较大的优势,短期内可能对训练算力的增长有一定的平抑效应,但是不改AI算力整体需求长期上升的态势。AI作为全球智能化发展的主要抓手,大模型当前已应用于端侧、教育、金融、办公、传媒、医疗、智能汽车、企业服务等多个应用场景,应用领域广阔。DeepSeek低成本而且开源的解决方案,大幅降低了AI在各行各业应用的技术和成本门槛,为AI的产业化落

  地提供了更快的路径。推理和端侧的算力需求增长潜力非常大。同时,较低训练成本以及开源的DeepSeek,有望带来更低的大模型开发和使用门槛,基于该大模型开发的主体可能更多,也一定程度上为训练算力需求提供了支撑。DeepSeek并不是压缩了算力市场,反而为算力市场增加了更多的想象空间。DeepSeek也在积极与国产AI算力平台合作。DeepSeek大模型与国产AI芯片适配的逐步成熟,将加快推动国产AI芯片在国内大模型训练端和推理端的应用,加快国产AI芯片产业链的成熟,为国产AI芯片产业带来发展机遇,同时加快我国大模型产业的发展。

  投资建议:DeepSeek-V3和DeepSeek-R1等DeepSeek系列大模型的陆续发布,表明国产大模型能力已可比肩海外领军大模型。我们认为,DeepSeek大模型的开源、低成本和高性能将大幅降低大模型的获得、部署和应用成本,将加快大模型在B端和C端应用场景的落地。DeepSeek大模型的出圈,短期内可能对训练算力的增长有一定的平抑效应,但预计不改算力整体需求向上的态势,而且推理和端侧算力有望增长更快。DeepSeek大模型与国产AI芯片适配的逐步成熟,将加快推动国产AI芯片在国内大模型训练端和推理端的应用,加快国产AI芯片产业链的成熟,为国产AI芯片产业带来发展机遇,同时加快我国大模型产业的发展。我们坚定看好AI主题的投资机会,标的方面:1)国产算力基础设施方面,推荐浪潮信息、中科曙光、紫光股份、神州数码、海光信息、龙芯中科,建议关注寒武纪、景嘉微、软通动力、华勤技术;2)端侧算力方面,推荐恒玄科技、兆易创新,关注乐鑫科技、瑞芯微;3)算法方面,推荐科大讯飞;4)应用场景方面,强烈推荐中科创达、恒生电子、盛视科技,推荐金山办公、德赛西威、万兴科技、福昕软件,建议关注同花顺、拓尔思、彩讯股份、卫宁健康。

  风险提示:1)AI算力供应链风险上升。2)国产大模型算法发展可能不及预期。3)大模型产品的应用落地低于预期。

查看研报原文

行业研究

平安证券