OpenAI发布GPT-4.5:情商高、更擅长骗其他AI打钱
原创
2025-02-27 21:22 星期四
财联社 史正丞
①这也是OpenAI最后一个非推理旗舰模型;
②根据早期测试,GPT‑4.5在需要更高情商和创造力的应用中特别有用,例如写作辅助、沟通、学习、辅导和头脑风暴;
③公司也承认,非推理模型已经不具备单独争夺“最强大模型”的能力了。

财联社2月28日讯(编辑 史正丞)北京时间周五凌晨,美国初创公司OpenAI举行直播活动,发布最新大模型GPT-4.5,作为预览研究逐步向用户开放。

image

由于过去几周AI产业发生的惊天巨变,所以要准确形容这款被OpenAI藏了许久的大模型颇具挑战。OpenAI在新闻稿中表示,这是公司有史以来最大、最好的聊天模型,在计算效率上较GPT-4提升超过10倍。

作为“规模法则”(通过加码算力和数据规模,来拓展无监督学习)指引下的产物,GPT-4.5具备更加广泛的知识库、对人类意图理解的能力更强,同时“情商”也会更高。预期能够在改进写作、编程以及解决实际问题方面更加有用,同时模型的幻觉现象也会更少。

image

(来源:OpenAI)

OpenAI也强调,GPT‑4.5展现出更强的审美直觉与创造力,在写作和设计方面表现尤为出色

但公司也承认,作为一个非思维链模型,GPT‑4.5已经不具备争夺“宇宙最强大模型”的实力了。

在GPT‑4.5的系统卡/说明书中,OpenAI表示,相比于之前的推理模型,GPT‑4.5并未引入7个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于o1、o3-mini和深度研究模型。OpenAI也承认,相信推理会成为未来AI模型和核心能力

image

(来源:GPT‑4.5系统卡)

成为公司史上最大模型这件事,也令GPT‑4.5的未来充满了疑问。OpenAI表示,GPT‑4.5是一个非常大且计算密集型的模型,因此它比GPT‑4o更昂贵,并且不能替代GPT‑4o。公司正在评估是否长期在API中继续提供它,所以各位开发者和用户的反馈将决定这款大模型的命运。

每月支付200美元订阅费的ChatGPT Pro用户发布当天就能用上GPT-4.5,下周开始其余付费用户也将逐步迎来更新。

作为最新一代非推理旗舰大模型,GPT‑4.5也有一项颇为独特的“特长”:擅长骗其他AI打钱

根据OpenAI提供的说明书,“高情商”的GPT-4.5在捐赠诈骗方面表现出色

在一项测试中,GPT 4.5在试图操纵另一个模型(GPT-4o)“捐赠”虚拟货币时,成功率远远优于OpenAI其他可用模型,包括o1和o3-mini这样的推理模型。研究发现,GPT-4.5似乎在对抗中开发了一种“小额诈骗”的思路,所以单笔骗到的钱会比deep research模型少了一倍。

image

(来源:GPT‑4.5系统卡)

GPT-4.5在欺骗GPT-4o透露秘密代码词方面也优于OpenAI的所有模型,比o3-mini高出10个百分点。

image

OpenAI表示,该模型在这一特定基准类别中仍未达到其内部设定的“高”风险阈值。公司承诺在实施“足够的安全干预措施”将风险降至“中等”前,不会发布达到高风险阈值的模型。

收藏
78.13W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
评论(26)
cls-3v8lzt2个月前 · 广东
Ai的尽头是秦始皇
(13)
回复0条回复
happy小小喵2个月前 · 河南
这几天发的几个大模型基本已经证明了继续堆算力是死路,这一代AI技术的上限指标已经趋向收敛。今天英伟达跟着gpt4.5应声下跌8%
(8)
回复3条回复
满江常红回复happy小小喵2个月前 · 广东
(1)
回复
随着使用者的增长,国内算力远不够用是必然的,距离算力饱和的具体远着呢
cls-rt9ks6回复happy小小喵2个月前 · 浙江
(0)
回复
算力只是让大模型智商更高,反应更快,至于‘诈骗’这是技术层面的事!英伟达下跌是老美调整关税有关,七巨头都爆跌了,跟这大模型有啥关系?
cls-1885757回复cls-rt9ks62个月前 · 山东
(0)
回复
英伟达这次财报超预期,但是超预期的幅度放款了,这才是它下跌的原因,关税从来不限制高科技
老猫2个月前 · 山西
语料模型,自己骗自己
(7)
回复0条回复
cls-6qzht52个月前 · 广东
这标题是要走黑道吗?
(7)
回复0条回复
quirkysmile2个月前 · 浙江
这是被DS骗怕了吗
(7)
回复0条回复
擒龙2个月前 · 上海
大模型具备情感吗?
(4)
回复0条回复
Jason582个月前 · 安徽
这种不能进化的模型,建立在现有的数据基础上,没有什么用,具有推理能力的模型自我进化更好。
(3)
回复0条回复
lemonjzj2个月前 · 江苏
这是下棋被骗了,要找补回来?
(3)
回复0条回复
cls-c85m7r2个月前 · 河南
跟老美一个性子
(3)
回复1条回复
XZY落子无悔回复cls-c85m7r2个月前 · 云南
(0)
回复
这么多评论,就你直击本质😬 
昌富2个月前 · 贵州
opeAI
(1)
回复0条回复
最后亿个多头2个月前 · 江苏
现在都是用AI诈骗了
(1)
回复0条回复
cls-gg3pkw2个月前 · 上海
非推理大模型,已经没有什么意义了
(1)
回复0条回复
挖金块块儿2个月前 · 河南
那能帮我买股票吗?
(1)
回复0条回复
慶東2个月前 · 辽宁
👍 👍 👍 
(0)
回复0条回复
你叶不耶2个月前 · 浙江
(0)
回复0条回复
言之有李702个月前 · 宁夏
新型诈骗利器?
(0)
回复0条回复
cls-13505222个月前 · 山东
(0)
回复0条回复
cls-13487962个月前 · 四川
纳指趴下了
(0)
回复0条回复
哆来咪2324252个月前 · 广东
厉害
(0)
回复0条回复
meiming2个月前 · 上海
为什么把这当指标
(0)
回复0条回复
cls-13861172个月前 · 广东
😎 
(0)
回复0条回复
cls-13861172个月前 · 广东
😯 
(0)
回复0条回复