计算机行业周报-全球AI产业跟踪:Nvidia发布6.3万亿Token大型AI训练数据库

研究机构:甬兴证券 研究员:李行杰,夏明达 发布时间:2025-02-05

  核心观点

  Nvidia:发布6.3万亿Token大型AI训练数据库

  据IT之家,近日英伟达宣布推出一款名为Nemotron-CC的大型英文AI训练数据库,总计包含6.3万亿个Token,其中1.9万亿为合成数据。Nemotron-CC的开发过程中使用了模型分类器、合成数据重述(Rephrasing)等技术,最大限度地保证了数据的高质量和多样性。同时他们还针对特定高质量数据降低了传统的启发式过滤器处理权重,从而进一步提高了数据库高质量Token的数量,并避免对模型精确度造成损害。

  Adobe:推出新款生成式AI工具

  据IT之家,近日Adobe宣布推出一系列全新的生成式AI工具,旨在自动化处理劳动密集型生产任务,例如批量编辑图像和翻译视频演示文稿,其中包括“Firefly Bulk Create”应用,该工具允许用户一键快速调整多达10,000张图像的尺寸或替换所有背景,从而避免繁琐的逐张编辑操作。

  Salesforce:称微软Copilot使用率低

  据IT之家,近日Salesforce首席执行官马克・贝尼奥夫表示基于客户反馈,微软Copilot并未给客户带来变革性的体验,使用率极低,客户更倾向于ChatGPT等工具的情况。

  科大讯飞:深度推理模型X1发布,唯一全国产算力训练

  据IT之家,近日讯飞发布星火深度推理模型X1,讯飞星火4.0Turbo底座能力迎来全新升级,同时首发星火语音同传大模型。X1为国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型,与通用大模型相比,讯飞星火X1号称在解题过程更接近人类的“慢思考”方式,且用更少的算力,“实现了业界一流的效果,多项指标国内第一”。技术上,其中文数学能力国内第一;应用上,已落地教育、医疗等多个真实场景。

  投资建议

  Nvidia发布训练数据库、讯飞发布深度推理模型,AI训推两端持续升级迭代;Adobe发布新款Gen AI工具,AI应用渗透率有望继续提升,我们看好AI全产业链景气提升,建议关注IaaS层投资机会,标的方面建议关注MSFT、GOOGL、META、AMAZON等标的。

  风险提示

  产业发展不及预期、政策推进力度不及预期、国产替代不及预期

查看研报原文

行业研究

甬兴证券