在面对人工智能时,“将替代的恐惧转变为增强的兴奋”。
今年以来,针对人工智能(AI)给人类带来潜在危机的话题一直争议不断,更有多领域权威专家联合发起“人工智能或将致人类灭绝”的风险警告声明。而包括近期好莱坞爆发“抵制AI侵入”的大罢工在内,越来越多人担忧AI的崛起和发展将影响人类社会,特别是在多个领域中取代人工。不过,根据一项最新发布的研究结果显示,起码在幽默感方面,目前的人工智能似乎还比不上人类。
这一最新研究论文发表在上月刚结束的第61届计算语言学协会年会(ACL2023)官方收录的论文集(第一卷:长论文)中,也是本届ACL获奖的三篇年度最佳论文之一。ACL是自然语言处理领域最具影响力的国际学术会议。该得奖论文题为“Do Androids Laugh at Electric Sheep? Humor ‘Understanding’ Benchmarks from The New Yorker Caption Contest”(译:机器人会笑话电子羊吗?基于《纽约客》漫画标题比赛的幽默“理解”基准)。
图片来源:Caitlin Cook/Cornell University
目前,基于大型神经网络(人工智能的一种形式)的发展,短时间内生成上千甚至上万条笑话是可以实现的。而本篇论文探讨的是,这么“会说笑话”的人工智能是否真正理解得了其中的幽默。研究人员利用美国知识、文艺类综合杂志《纽约客》漫画标题比赛(The New Yorker Cartoon Caption Contest)中数百个参赛作品作为测试数据,以此向人工智能模型发起三项任务挑战:将笑话与漫画进行匹配(匹配任务,Matching),识别获胜标题(质量评估任务,Quality Ranking),以及解释为什么获胜标题是有趣的(解释任务 Explanation Generation)。
本次研究对人工智能发起的三项任务挑战(论文图片2);漫画作者为Robert Mankoff(上)和 Mick Stevens(下)
本次论文的主要作者、来自艾伦人工智能研究所(Allen Institute for AI,AI2)的研究科学家Jack Hessel博士指出,人类挑战人工智能模式的理解方式是为它们建立测试,无论是选答式测验(multiple choice test)还是其他带精度的评估。如果特定模型最终在测试得分中超越了人类,人们还是会想“好吧,这是否意味着它真正理解呢?”Hessel博士表示,机器不能做到“真正的理解”的说法是站得住脚的,因为理解从来都是人类的事情。“但无论机器是否理解,它们在这些任务中的表现仍然令人印象深刻。”
研究数据选取自《纽约客》14年间超过700场的漫画标题比赛,包括每一场比赛的一幅未配文漫画、比赛入围作品以及由《纽约客》编辑评选出的三名候选作品。Hessel博士表示,《纽约客》作品有趣的地方是,图片与标题之间的关系是间接、幽默,且引用了许多现实生活中的实例和规范,这也使得“理解”在此次研究任务中更为复杂。
漫画作者为David Sipress,标题为《太好了,你人还在——除非‘死期’将至,否则我不会做完所有事情”》©David Sipress
基于此,如研究团队所指,三项任务的复杂程度是逐渐进阶的,其关键在于测试AI能否理解图像与文本标题之间的复杂性,以及那些经常基于人类经验和文化的间接且有趣的隐喻。研究人员还使用了多模态和单一语言两种模式进行测试,前者基于像素(计算机视觉),直接对漫画图像开启挑战;而后者则基于描述即采用对视觉场景进行多方面的描述,以模拟人类水平的视觉理解。
两种不同类型的人工智能模型均需要完成三项任务(论文图片一);漫画作者为Drew Dernavich,得奖标题作者Bennett Ellenbogen
在研究过程中,匹配任务需要AI从所有比赛的获胜标题中,选择出对应特定比赛的正确获胜标题。质量评估任务中需要AI在同一比赛的入围作品中识别出候选名单和非候选名单。而解释任务则需要AI自由生成文本,说明高质量文本(获胜标题)是如何与漫画相关的。但研究发现,两种类型的模型均在挑战所有三个任务上存在困难,且AI与人类之间的差距颇大。
例如,在匹配任务中,研究期间最好的多模态模型(62%)的性能比人类(94%)低30个精度点;即使提供了真实的视觉场景描述,人类撰写的解释在超过2/3的任务表现中也要优于机器(基于GPT-4模型的few-shot多样本模板)。换言之,就本次研究表明,即使已经有像ChatGPT这类先进的人工智能模型不断进步并逐渐缩小差距,但在理解幽默这一方面,就目前来说,人类明显要优于人工智能。
研究过程中,不同人工智能模型在处理匹配和质量评估任务时的结果之一(论文图表二);漫画作者为Joe Dator
面对这一结果,研究人员在论文中写道,“虽然AI可能还不太能理解所谓的幽默,但它可能是幽默家们用来集思广益的协作工具。”事实上,AI浪潮已是大势所趋,无疑会给人类社会带来一些颠覆性的影响。尤其自去年底ChatGPT此类生成式人工智能掀起“全民AI热”,急速激发了各类创作者之间的争论:有人将其视为一种威胁,会将人类取而代之;但也有人认为是一种协作手段,以期增强创造力。
总部位于纽约的人工智能初创公司Type首席执行官Stew Fortier认为,人工智能确实存在两极化的本质,但他本人对内容创作中人工智能的看法非常明确,即人工智能是一种增强辅助工具而非“人类的替代品”。该公司主打人工智能文档编辑辅助工具Type.ai。
“一个常见的误解,特别是关于人工智能方面,是认为它是一种旨在取代人类的工具”,Fortier强调道,但基于他的实践经验,人工智能是一种“半意识状态下的头脑风暴助手”,是帮助创作者更有效地表达想法的第二个大脑。他希望人们在面对人工智能时,“将替代的恐惧转变为增强的兴奋”。
图片来源:futureofworknews.com
与此同时,一些大型创作平台也通过发布新条例,在肯定人类创作者的重要性同时,鼓励其无需完全抗拒人工智能。今年6月,美国录音学院(The Recording Academy)宣布对格兰美奖进行一系列规则修订,其中包括允许音乐作品中使用人工智能进行创作,但明确只有人工创作者部分才能得奖,例如若一首歌曲中人类负责编曲作词、人工智能负责主要演唱献声,则允许其在作曲类而非演唱类中参赛;同时还再三强调,“不包含人类创作者的作品不符合任何类别的参赛资格”。
对此,美国录音学院首席执行官及主席Harvey Mason Jr.表示,只要人类创作者献出了最低程度上的贡献,就都是有意义的行为,他们就会允许拥有提名或得奖的资格。“我们不希望看到技术取代人类的创造力。我们希望的是确保技术能够让人类的创造力得到增强、美化或增色。这就是为什么我们在(接下来的)这次颁奖周期中采取了这一特殊立场(即允许涉及人工智能创作的歌曲拥有参赛资格)。”
普罗米修斯、雅典娜与第一个人类,插图采用生成式人工智能工具制作而成
图片来源:Brunello Cucinelli
“对于人工智能的恐惧,不仅仅是因为人类的使用方式,更是因为这让人想起普罗米修斯将火作为礼物带给人类之前,人类在面对闪电时,那种对于未知的恐惧。”意大利奢侈品牌创始人Brunello Cucinelli在近日致公众的《关于人工智能与人类智慧的一封信》中写道,“我很难想象一个机器人或人工智能系统能够感受到真正的情感或深刻的感受;机器人能够仰望天空,或者体会到情感,并从自己的眼中涌出真实的泪水吗?”感受人类真实的情感,充满幽默感,至少现在人工智能还远不似人类。