剑指AI算力霸主英伟达 Cerebras发布自研超算训练的开源大模型

关于我们网站声明联系方式用户反馈网站地图帮助

注册|登录

首页

电报

话题

盯盘

VIP

FM

投研

下载

头条

A股

港股

环球

公司

券商

基金·ETF

地产

金融

汽车

科创

品见

剑指AI算力霸主英伟达 Cerebras发布自研超算训练的开源大模型

原创

环球市场情报

2023-03-28 16:57 星期二

财联社史正丞

今天过后，在谈到AI大模型训练芯片时，上榜的不止有英伟达的H100和A100，还有“大如盆”的WSE-2。

财联社3月29日讯（编辑史正丞）当地时间周二，硅谷AI芯片公司Cerebras Systems发布7款类似于GPT的大语言模型。除了发布开源大模型外，展现了一条不用英伟达GPU、不接OpenAI接口也能实现“大模型自由”的道路。

（来源：公司官网）

单纯从数据来看，这次Cerebras发布的7个大模型参数量介于1.11亿至130亿之间。作为对比，谷歌的多模态视觉语言模型PaLM-E具有5620亿个参数；同样在本月发布的GPT-4模型虽然尚未公布确切数据，但有媒体援引内部人士透露，参数量大约是GPT-3（1750亿）的6倍。

按照目前人类对AI的认知，模型越大，最终能够满足的需求就更加复杂。当然，规模较小的模型也有自己的用武之地，例如可以配置在手机、智能音箱中。同时也有研究显示，规模较小的模型如果经过多次训练，准确率反倒能变得更高。

但如同上文所述，Cerebras本身是一家芯片公司，所以训练模型用的是自家的Andromeda AI超级计算机，其中部署了16套CS-2系统。非常具有记忆点的是，Cerebras生产的AI芯片WSE-2的尺寸约为英伟达A100芯片的56倍，核心数量达到85万个，同样是A100芯片的123倍。这块芯片使用的是台积电7nm工艺，售价超过200万美元。

（来源：Cerebras芯片）

所以周二发布的多款模型，本身也是Cerebras向AI算力霸主英伟达发出的战书。在OpenAI的ChatGPT点燃全球科创圈子的热情后，虽然有许多芯片公司试图撬动英伟达牢牢占据的市场，但取得实际成果的并不多。许多知名企业，也通过直接用英伟达的全套服务来训练自家的AI产品，从而快速取得成绩。

面向潜在的客户，Cerebras也强调自己的芯片具有训练时间短、同等预算下准确率高等优点，是目前世界上已经公开的大模型中生产性价比最高的方案。公司CEO Andrew Feldman也确认，使用Cerebras训练出来的模型，未来也能在英伟达的系统中继续训练和定制化。

多少有些嘲讽OpenAI发布GPT-4后不再开源的做法，Cerebras也在周二宣布公司训练出来的7个大模型全部在Apache-2.0许可的条件下向研究社区开放，包括模型本身、训练算法和权重，以此打造行业开源的标杆。

Cerebras表示，任何人只需要向这些高度精准的预训练模型输入一定数量的数据，就能以很少的工作量，开发出功能强大垂直行业应用程序。

收藏

阅103.48W

我要评论

欢迎您发表有价值的评论，发布广告和不和谐的评论都将会被删除，您的账号将禁止评论。

发表评论

评论（10）

快乐的小金鱼2年前 · 河南

垃圾

(0)

回复0条回复

股市捞金女2年前 · 河南

我的GPT-6.0已经升级好，让她做饭，洗衣服，拖地，生孩子样样都会！你们都GPT会吗

(0)

回复1条回复

王多魚回复股市捞金女 2年前 · 上海

(0)

回复

？？？您是在描述尊夫人吗？这样说未免太不尊重她了吧

倔强的小小周2年前 · IP未知

国产自研AI小模型要遍地开花了

(0)

回复0条回复

倔强的小小周2年前 · IP未知

这玩意儿把代码拷贝下来，每个公司都搞一个，然后用共享云计算平台来训练，那岂不是云计算共享平台赚翻了

(0)

回复0条回复

倔强的小小周2年前 · IP未知

这个好，每个行业搞个特定的AI，比大模型训练成本低太多，好好好

(0)

回复0条回复

cls-17376352年前 · 北京

我们又要遥遥领先了

(0)

回复0条回复

150687353662年前 · 浙江

数据

(0)

回复0条回复

超凡大师王家宝2年前 · 浙江

国内软件商狂喜

(0)

回复0条回复

迎难而上2年前 · 广西

不用GPU也不接Al接口，利空伙

(0)

回复0条回复

要闻

股市

04-02 07:30 星期三

日本央行行长警告：特朗普“对等关税”恐重创全球贸易和经济

04-02 09:10 星期三

朱啸虎：中国AI的爆发点在应用场景端，需要“走出技术”

04-02 08:19 星期三

9城30项目入选业内专家：车网互动引发车载储能技术变革

04-02 08:31 星期三

信达证券：当下的风格变化至少会持续2-3个月

04-02 04:59 星期三

小米客服回应：SU7电池双供应商随机装，事故车电池待查

04-02 06:57 星期三

商业航天产业爆发，龙头企业集体备战可回收火箭首飞

04-02 06:22 星期三

财政部注资有何影响？低利率环境怎么应对？邮储银行高管这样说

04-02 07:03 星期三

ChatGPT闯入一条危险赛道：新图像生成功能极擅长伪造收据

04-02 05:13 星期三

全球Q1富豪榜变化：巴菲特跃居第五大富豪黄仁勋跌出千亿美元俱乐部！

04-02 06:53 星期三

中信证券：外骨骼机器人落地场景丰富，市场空间广阔

关联话题

环球市场情报

10.86W 人关注

+ 关注

4.58W 人关注

+ 关注

1.36W 人关注

+ 关注

9199 人关注

+ 关注