一、DeepSeek-R1对标OpenAIo1正式版,知识蒸馏技术,让小模型也能“聪明”推理
1月20日,DeepSeek正式发布一系列DeepSeek-R1模型,包括DeepSeek-R1-Zero、DeepSeek-R1和DeepSeek-R1-Distill系列。DeepSeek-R1模型推理能力优异,基准测试表现与OpenAI-o1-1217相当,且API服务定价远低于OpenAI同类产品。
此前,DeepSeek-R1-Zero在技术路线上实现了突破性创新,成为首个完全摒弃监督微调环节、完全依赖强化学习训练的大语言模型。在此基础上,DeepSeek-R1对R1-Zero进行了改进。通过引入冷启动数据,并历经推理导向强化学习、拒绝采样、监督微调以及全场景强化学习的多阶段训练,充分发挥了强化学习的自学习和自进化能力。
DeepSeek团队深入探索了将R1的推理能力蒸馏到更小模型中的潜力,发现经过R1蒸馏的小模型在推理能力上实现了显著提升,甚至超过了在这些小模型上直接进行强化学习的效果,证明了R1学到的推理模式具有很强的通用性和可迁移性,能够通过蒸馏有效传递给其他模型。这些结论为业界提供了新的启示,即对小模型而言,蒸馏优于直接强化学习,大模型学到的推理模式在蒸馏中得到了有效传递。
二、模型迭代、Agent升级、端侧AI推新三方共振下,AI应用商业化空间或不断打开
DeepSeek-R1API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,远低于可比大模型API服务。DeepSeek-R1的高性价比API定价有助于开发者在使用后加速模型的功能迭代,从而解决目前模型存在的不足。
开源证券认为,DeepSeek-R1基于强化学习再次让“低成本+高性能”大模型成为可能,并有望引领模型往开源方向发展,强大的推理能力或助力其在教育、办公、科研领域应用加快落地;豆包、阶跃星辰大模型不断升级语音、情感、视觉理解及生成等多模态能力,在社交陪伴、影视、教育、电商、广告等领域商业化或加快;智谱、OpenAI不断推动Agent成为AI应用落地的重要工具。模型迭代、Agent升级、端侧AI推新三方共振下,AI应用商业化空间或不断打开。
三、相关上市公司:实丰文化、天娱数科、引力传媒
实丰文化:公司近期与灵优智学(深圳)科技有限公司合作宣布达成战略合作,双方将在AIGC智能玩具领域展开全面合作,共同开发新一代智能玩具产品。
天娱数科:公司控股子公司山西鹏景科技有限公司已获得今日头条授权的巨量引擎全国地区除独代范围以外综合代理商、巨量千川电商营销服务商资质,主要服务于国内在线教育、网络服务、金融保险、电商等行业重点客户,能够为客户的各类产品提供基于短视频广告的推广方案制作、创意素材创作、投放运营优化、电商营销推广、大数据跟踪检测等精准数字营销服务。
引力传媒:公司取得了多家优质移动媒体的独家代理权或核心代理权,与今日头条、抖音、知乎、网易云音乐、乐动力、课程格子、雪球、携程、马蜂窝等超过两百家的优质移动媒体建立了长期渠道合作关系。公司内部自研上线“核力AI”的1.0版本、已具备“营销文案 生成”、“图片识别与生成”及“数字分身复刻及驱动”等功能应用。目前公司已明确完善在 AIGC 方向的「1+2+4」布局规划,并与外部技术公司联合打造“营销与电商”垂类大模型,共同推动 AI多模态产品应用场景落地。
![](https://cdnjs.cls.cn/www/20200601/image/column-name-20026.png)
![](https://cdnjs.cls.cn/www/20220401/money-icon-03.png)
![](https://cdnjs.cls.cn/www/20200601/image/column-down-away.png)
![](https://cdnjs.cls.cn/www/20200601/image/latest-article.png)
![](https://cdnjs.cls.cn/www/20220401/column-case-change-icon.png)
![](https://cdnjs.cls.cn/www/20200601/image/trial-reading.png)