投资要点:
1、据雷锋网消息,1月20号,DeepSeek团队推出了全新开源模型DeepSeek-R1,一夜之间模型就在Github上收获了4k+star,引爆大模型领域。
2、据新浪财经报道,当地时间1月31日,美国总统唐纳德·特朗普在白宫接见了英伟达创始人兼首席执行官黄仁勋,讨论了美国的人工智能政策、对中国先进人工智能(AI)GPU的出口管制以及美国的技术和人工智能领导力。有报道称,拜登政府正在考虑阻止英伟达对华特供的H20HGX销往中国,这可能会使英伟达损失约100亿美元的收入。
性能对标OpenAI o1正式版,DeepSeek下载量火爆:DeepSeek成立于2023年7月,是一家由中国知名量化私募巨头幻方量化创立的人工智能公司,致力于开发高效、高性能的生成式AI模型。自成立以来,公司发布了多个开源模型,包括DeepSeekCoder、DeepSeekLLM、DeepSeek-V2、DeepSeek-V3和DeepSeek-R1。2025年1月20号,DeepSeek团队推出了全新开源模型DeepSeek-R1,并同步开源模型权重,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。此次,DeepSeek在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,参数从小到大分别为1.5B、7B、8B、14B、32B以及70B,其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。DeepSeek-R1API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元。据华尔街见闻2025年2月1日报道显示,自1月20日DeepSeek-R1模型正式发布以来,DeepSeek已于1月26日同时登顶苹果AppStore和谷歌PlayStore全球下载榜首,上线18天内,累计下载量已突破1600万次,在覆盖的140个市场中持续保持领先地位。
国产大模型迅速崛起,端侧爆发有望再加速:2025年1月28日,国产大模型DeepSeek发布了全新的Janus-Pro多模态大模型,正式进军文生图领域。在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E3,还超越了StableDiffusion、Emu3-Gen等热门模型。Janus-Pro是一款统一的多模态理解与生成框架。其架构通过解耦视觉编码的方式,显著提升了模型在不同任务中的适配性与性能。根据DeepSeek的报告,Janus-Pro在多个基准测试中表现优异,尤其是在文生图的生成能力上,其准确率达到了80%和84.2%,超越了OpenAI的DALL-E3等竞争对手。JanusFlow则是一款通过生成流与自回归语言模型融合的框架。它的设计理念是实现视觉理解与生成的统一,能够在理解任务中表现出色,同时生成高质量的图像。JanusFlow的极简架构使得其在训练和推理过程中更加高效,适合大规模应用。我们维持之前的观点,AI在端侧设备应用普及是大势所趋,也是正向促进AI技术向前发展演进的必要环节,知识蒸馏、剪枝、量化等模型小型化技术在逐步成熟,AI在云、边、端全方位发展的时代已至。
建议关注:海光信息、龙芯中科、寒武纪-U、瑞芯微、星宸科技、晶晨股份、全志科技、恒玄科技、泰凌微、中科蓝讯、北京君正、炬芯科技、地平线机器人-W、乐鑫科技、富瀚微、安凯微、国科微等
风险提示:技术演进轨道与产业生态尚未定型风险;对前瞻重点技术产业化进程敏感性不强风险;内容生态建设不及预期风险;下游需求不及预期风险;产品研发不及预期风险;市场竞争加剧导致盈利能力下降风险。