再见ChatGPT!Deepseek爆火海外 霸榜美区App Store下载榜
原创
2025-01-27 03:09 星期一
财联社 刘蕊
①国产AI模型Deepseek R1一经发布便轰动海内外AI圈;
②目前,Deepseek应用已经登顶苹果中美两区免费APP下载榜,在美区超越ChatGPT;
③Deepseek已经在海外社交平台上引发热议,不少科技爱好者直言其已经成为OpenAI和Meta的有力竞争对手。

财联社1月27日讯(编辑 刘蕊)1月20日,国产大模型公司杭州深度求索正式发布DeepSeek R1模型。这一模型展示了在数学、编程和推理等关键领域的表现甚至能媲美OpenAI的最强推理模型o1,但其API调用成本却低了90%-95%。

仅仅一周时间,这一最新模型的优越表现和超低成本就让整个硅谷都慌了神,轻而易举地轰动了海内外AI圈。

随着DeepSeek热度不断攀升,1月26日,DeepSeek应用一度因用户流量暴增,出现服务器短暂繁忙甚至“崩溃”的情况。1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

image

苹果美区应用商店免费APP下载排行榜

中信证券研报指出,DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本,推理成本的降低,将是AI应用普及的前奏。预计模型性价比持续提升下,国内AI应用依托丰富生态和成熟流量加速各领域落地。其中,Agent模式有望以更长的任务流程、更好的场景理解、更高的自主能力,成为所有互联网用户的数字助手,在企业管理、教育、办公、金融等领域展现应用价值。

DeepSeek获海外科技大佬超高评价

DeepSeek之所以爆火,一方面是由于它以更低的训练成本取得与OpenAI o1相当的性能,可谓十足的“物美价廉”;另一方面,它作为一款开源模型,采用MIT许可协议,支持免费商用、任意修改和衍生开发等。所以也难怪众多科技家大佬都对DeepSeek予以了超高评价。

DeepSeek-V3在仅使用2048块H800 GPU的情况下,完成了6710亿参数模型的训练,训练成本仅为557.6万美元,远低于其他顶级模型的训练成本(例如GPT-4的10亿美元)。因此,一些人认为,DeepSeek可能会颠覆英伟达在AI硬件领域的主导地位。

上周三,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在达沃斯世界经济论坛上表示:“DeepSeek 的新模型非常令人印象深刻,他们不仅有效地开发出一种开源模型,实现了推理时间计算,而且计算效率极高…我们应该非常认真地对待中国的发展。”

Meta首席AI科学家、图灵奖得主Yann LeCun表示,DeepSeek的成功,并不应该被看作中国的人工智能“超越了美国”,而应看作“开源模型正在超越专有模型”。

LeCun写道:“DeepSeek 受益于开放研究和开源…他们提出了新的想法,并在其他人的工作基础上构建了这些想法。因为他们的工作是公开的和开源的,所以每个人都可以从中受益。”

英国《金融时报》指出,DeepSeek 的成功颠覆了“AI研发必须依赖巨额投入”的传统认知,证明精准的技术路线同样可以取得优异的研究成果。更重要的是,DeepSeek 团队对技术创新的开放和分享,让这家公司成为了挑战了OpenAI、Google和Meta等老牌公司主导地位的异常强劲的竞争对手。

目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。

image

引发科技圈人士热议

事实上,除了科技大佬和媒体,DeepSeek也已经在海外热爱科技的大众人群中掀起热潮。

在社交平台X上,DeepSeek已经成为热门话题。一位科技爱好者在X发布一篇贴文名为“再见ChatGPT!”的贴文,直言DeepSeek最新模型才发布五天,世界已经被其潜力所震惊。这篇贴文获得了超过8000个转发和超5万点赞。

image

另一位科技圈人士用电影《钢铁侠》的片段制作了meme动图,嘲讽“硅谷就是个骗局”,因为DeepSeek的开发成本相比于众多美国AI巨头可谓微不足道,如同是在山洞里面用一堆破铜烂铁造出来的钢铁侠。

image

还有人在这张meme图中反派角色头上PS了META和扎克伯格的头像,暗讽DeepSeek的出现把META和扎克伯格打的措手不及。

image

事实上,相比于OPENAI的ChatGPT,META旗下的开源AI模型Llama系列的确是DeepSeek最直接的竞争对手。

据悉,随着DeepSeek爆火,Meta生成AI小组和基础设施团队的经理和工程师已开设了四个作战室来学习DeepSeek的工作原理:其中两个动员起来的小组正在试图了解幻方如何降低训练和运行DeepSeek的成本;第三个Meta研究小组正在试图弄清楚幻方可能使用哪些数据来训练其模型;第四作战室正在考虑基于DeepSeek模型属性重构Meta模型的新技术。

收藏
80.7W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
评论(34)
cls-13917884个月前 · 湖南
这盘砸的啧啧啧😶 幻方大显神威
(26)
回复0条回复
cls-18797164个月前 · 广东
deepseek,空头加速器
(17)
回复1条回复
sg05回复cls-18797164个月前 · IP未知
(1)
回复
这是一点都不藏起来了
cls-lu4cov4个月前 · IP未知
这个破玩意直接导致算力集体崩盘…
(10)
回复1条回复
sg05回复cls-lu4cov4个月前 · IP未知
(1)
回复
挺有意思的,希望不是空头砸盘的利器
不穿牛仔裤4个月前 · IP未知
等着吧,算力还是绝对王者,deepseek只是个学生,算力还是老师
(10)
回复1条回复
cls-75l5mf回复不穿牛仔裤4个月前 · IP未知
(1)
回复
只是顺带的,没有生命力
玉树975214个月前 · IP未知
这标题起的吓人,直接再见了。
(7)
回复1条回复
初心initialheart回复玉树975214个月前 · 河北
(2)
回复
遥遥领先是常态😬 
cls-19531714个月前 · IP未知
吹牛逼,搞得模型只有文字是的,去生成视频和图片看看,有的算力能不能比gpt小
(6)
回复0条回复
gjdzgdsb4个月前 · 江苏
幻方到底是空头大哥,md
(5)
回复0条回复
金刚经4个月前 · 北京
算力相关的铜连接 光模块 ,寒武纪这样的也跌了。deepseek训练包括视频和图像吗?还是纯文本?如果包括视频还这样,那西方的大力出奇迹的底层逻辑就够呛了
(5)
回复2条回复
Marco518回复金刚经4个月前 · 甘肃
(2)
回复
只要你问我答的文字版,像是360搜索的简化版。下载试了下删了,跟豆包那些大模型差的不是一星半点
金刚经回复Marco5184个月前 · 北京
(0)
回复
豆包一直用,比较好用
cls-13991274个月前 · 江苏
豆包和deepseek两款都下载了,两者比较一下,还是豆包好用
(4)
回复1条回复
Marco518回复cls-13991274个月前 · 甘肃
(1)
回复
对,Ds一般般吧,下载量多只是图新鲜,效果还是比不上豆包,Kimi这种模型
荷韵一林4个月前 · IP未知
银行股一涨其他的股就跌了,翘翘板效应!
(4)
回复0条回复
cls-18671884个月前 · IP未知
利好银行?
(4)
回复0条回复
cls-13638874个月前 · 河南
事出反常必有妖
(3)
回复0条回复
cls-13608604个月前 · IP未知
再加个屁
(2)
回复0条回复
Marco5184个月前 · 甘肃
功能太少,就是一问一答的互联网文体搜索解答,像是搜索软件的升级版
(2)
回复0条回复
爽猫4个月前 · IP未知
中国高科
(2)
回复0条回复
cls-a7t6wg4个月前 · 广东
怀疑豆包和deepseek具有情商了,而gpt还停留在智商和逻辑阶段
(2)
回复1条回复
顿悟股道回复cls-a7t6wg4个月前 · IP未知
(0)
回复
cls-u7eoq44个月前 · IP未知
伤了人心!
(2)
回复0条回复
cls-13630304个月前 · IP未知
呵呵
(1)
回复0条回复
cls-18697404个月前 · IP未知
NVida哭😭一下
(1)
回复0条回复
cls-k066dp4个月前 · 福建
怎么跟perplexity那么像
(1)
回复0条回复
cls-gk73tn4个月前 · IP未知
不信
(1)
回复0条回复
cls-nq4mg04个月前 · 香港
利好就是利空,现在都在大跌
(1)
回复0条回复
cls-sgvm4g4个月前 · 广东
先知先觉的早上已经开盘抄底算力了
(1)
回复0条回复
镜子4个月前 · 天津
厉害啦
(0)
回复0条回复
枫林晚6664个月前 · IP未知
能吵起来也是对面夸大其词,想要补助
(0)
回复0条回复
香菜也4个月前 · IP未知
跟浏览器一样,就是懒的自己去找标准答案了,他自动给你生成
(0)
回复0条回复