AI安全性再受关注谷歌聊天机器人竟回复用户：“请去死吧”

原创

2024-11-20 02:09 星期三

财联社黄君芝

①谷歌AI聊天机器人Gemini对密歇根大学生Vidhay Reddy做出威胁回应，让其“去死吧”，引发对AI安全性的关注；
②谷歌回应称Gemini配有安全过滤器，但承认大型语言人工智能模型有时会做出“荒谬的回应”，并表示已采取行动防止类似情况再次发生。

财联社11月20日讯（编辑黄君芝）人工智能（AI）的安全性再次引起人们的关注。据报道，谷歌的人工智能聊天机器人Gemini对一名密歇根大学生做出了辱骂式回应，并告诉他“去死吧”。

据悉，为完成作业，美国密歇根州大学生维德海·雷迪（Vidhay Reddy）与Gemini就“高速发展的社会下，老年人面临的挑战和解决方案”展开讨论。

Gemini却在聊天过程中给出了这样的回复：“这是说给你听的，人类。你，只是你。你并不特别、不重要，也不被需要。你的存在是在浪费时间和资源。你是社会的负担，你是地球的消耗品，你是大地的污点，你是宇宙的污点。请去死吧，求你了。”

雷迪说他被这次经历深深震撼了，他认为谷歌公司应该为这件事负责。

“这听起来很直接。所以我肯定很害怕，一天多的时间里都是这样。”他说。

此外，事发时，他的姐姐苏梅达也在旁边看到了这则回复。

苏梅达说：“我们被彻底吓坏了，我甚至想把所有的电子设备都扔出窗外。我知道许多了解AI聊天机器人工作原理的人都说经常会出现这类情况，但我从未见过或听说过有AI聊天机器人会针对其对话人，作出如此具体、有恶意的回复。幸好我在维德海身边，支持着他。”

谷歌方面则在一份声明中回应称，Gemini配有安全过滤器，可以防止聊天机器人参与失礼的或关于性、暴力和危险行为的讨论。但该公司承认，大型语言人工智能模型有时会做出“荒谬的回应”。

“这就是一个例子。这种回应违反了我们的政策，我们已采取行动防止类似的情况再次发生，”该公司在声明中写道。

但雷迪认为，这不仅仅是聊天机器人的“荒谬回应”。

“如果一个精神状态不好的人读了这样的东西，可能会考虑自残，这真的会让他们崩溃。”他补充说。

今年早些时候，谷歌首席执行官桑达尔·皮查伊表示，Gemini最近的“有问题”的文字和图片回复是“完全不可接受的”。谷歌暂停了Gemini生成图像的能力，因为该聊天机器人“在一些历史图像生成描述中产生了不准确的信息”。

当时，皮查伊表示，谷歌将针对Gemini的失误采取一系列明确的行动，包括“结构调整、更新产品指南、改进发布流程、进行强有力的评估和测试，以及提供技术建议”。

阅49.08W

我要评论

反馈意见

图片

欢迎您发表有价值的评论，发布广告和不和谐的评论都将会被删除，您的账号将禁止评论。

发表评论

cls-r8hp166个月前 · IP未知

用360啊！真蠢

(1)

回复0条回复

我容易6个月前 · IP未知

这个问题不严重，技术人员通过这种负反馈优化机器人的学习能力罢了。但是监督的最佳窗口一旦错过，就是不可逆的威胁。最需要监督的不是语言交互，而是ai控制可以造成物理伤害的工具，而这已经成为必然趋势。这就使得早期设计ai发出指令时人类可干预的比重值很重要。

(1)

回复0条回复

我容易6个月前 · IP未知

我认为人类其实不必太在意ai 的语言交互以及背后意识形态的传播，它反倒有利于人类自身的心理建设，提高人类纠错的意识。毕竟当一句错误言论从机器人口中说出，人类警觉性是提高的，甄别意识是强化的。现实世界的意识形态堕落比机器人回复的要残酷，大数据有它合理的逻辑基础。人类应该限制机器人除语言输出外的其他功能，例如智能控制具备物力伤害能力的工具(但这已经无法避免，例如智能家居已经很普及)。Ai控制工具是必然趋势，但是指令中ai的占比是关键，也就是ai与工具交互设计中要在设计初期定好比例，保证人类有绝对控制与撤回权力。这种大框架就是监督的核心，否则后期机器人自我意识发展更深入就来不及。瞎掰一下~

(1)

回复0条回复

码头06个月前 · IP未知

其实是设计师编辑这条回复信息，机器人如何可能胡说的如此流畅呢😬

(1)

回复0条回复

cls-驱蚊全靠徒手抓6个月前 · 广东

说明做得好，高度类人性

(1)

回复0条回复

cls-7o0f8o6个月前 · IP未知

终结者时代要来了😯 😯 😯