通信:25年度春节期间AI新闻信息汇总-DeepSeek引领效率模型潮流,中美AI竞赛提速

研究机构:上海证券 研究员:刘京昭,杨昕东 发布时间:2025-02-07

  主要观点

  背景介绍

  春节期间,人工智能题材新闻密集发酵,DeepSeek于海外广受关注、话题讨论持续火热;海外模型陆续推出,中美AI竞赛步入白热化阶段。我们认为,相比于2024年度,AI模型、机器人本质上已获得显著的技术突破,商业化落地进程进一步加快,投资逻辑日益清晰。

  分析与判断

  一、国内层面:Deepseek横空出世,开源助力模型弯道超车

  DeepSeek全球爆火,R1模型性能强劲。中国AI公司深度求索发布DeepSeek R1,性能直接对标ChatGPT o1正式版,并使用MIT协议开源、支持免费商用、无需申请授权。1月26日,DeepSeek于AppStore免费应用下载榜上排名第一,并于2月2日登顶全球140个市场的应用商店下载榜。

  我们认为,DeepSeek R1技术突破主要体现在创新性训练路径、系统性工程优化和开源生态构建三大维度:1)训练路径优化:R1并未局限于规则驱动的数学模型或算法,而是成功地将强化学习带来的强大推理能力泛化到其他领域;2)系统性工程创新:美国AI公司Anthropic CEO Dario Amodei指出,DeepSeek团队在“键值缓存(Key-Value cache)”的管理上以及推动“混合专家(MOE,mixtureof experts)”方法的使用上进行创新性改进;3)开源协同生态搭建:开源模型可吸纳更宽广、更多元的社区参与到AI开发中,并增强透明度与责任感,研究人员可以深入检查模型的训练数据,如若发现存在偏见或者侵权可及时进行反馈。

  DeepSeek模型技术生态加速全球化布局,国内外云服务及硬件平台接入实现双向突破:1)全球技术生态突破:1月31日,DeepSeek-R1作为NVIDIA NIM微服务预览版上线开发者平台,被官方认证为"最先进高效的大语言模型";DeepSeek-R1同步登陆Amazon Bedrock与SageMaker平台;2)国产化技术协同创新:硅基流动基于华为云昇腾云服务首发DeepSeek-V3/R1生产级推理服务,通过自研推理引擎优化,实现与全球高端GPU部署同等性能的模型响应效率。

  二、海外层面:模型大厂动作频频,AI竞赛加速推进

  OpenAI发布o3-mini系列模型,商业化路径持续探索。OpenAI正式推出新一代推理模型o3-mini系列,包含low、medium、high三个版本,在定价策略与成本优势方面,o3-mini输入/输出定价分别为1.10美元/百万token和4.40美元/百万token,较o1-mini降低63%,较满血版o1大幅缩减93%,成本优化显著;在性能突破与场景适配方面,o3-mini在数学、编程领域能力超越o1-mini,响应速度提升24%,重大错误率下降39%,在基准测试中表现突出,但安全性测试仍存改进空间。

  OpenAI获2900亿新融资,市值突破2万亿。OpenAI本轮计划融资规模达400亿美元,对应投后估值突破3000亿美元,仅次于SpaceX。核心融资进展及战略影响如下:1)软银拟投资150亿至250亿美元,可能成为最大单一支持者;2)此次融资将加速技术研发,拓展市场,并可能改变行业竞争格局。

  xAI即将发布Grok-3,下周亮相推理能力力压OpenAI。Grok-3AI模型已开始内部测试,预计下周正式发布。测试显示其表现优于o1和DeepSeek R1模型。

  投资建议

  建议关注:芯片/服务器:浪潮信息、中科曙光、工业富联、寒武纪、海光信息、中芯国际;AI模型端:科大讯飞、金山办公、拓维信息、拓尔思;端侧AI布局:广和通、移远通信、美格智能等。

  风险提示

  国内外行业竞争压力;国际格局变动、贸易摩擦加剧风险;新技术落地和商业化不及预期。

查看研报原文

行业研究

上海证券