泉果视点 | 人工智能的“幻觉”与“未来”
2023-03-29 11:28 星期三
泉果基金
那些会成为爆炸性头条的人工智能领域的进展,现在则很快就会被新的进展淹没。

生成式机器学习(Gen ML)、生成式人工智能(AIGC)、大规模语言学习(LLM),你最近应该没少遇到这些词汇,甚至容易搞混,由于事情发展得过于迅速,人们都还来不及约定一个统称。

放在以前,那些会成为爆炸性头条的人工智能领域的进展,现在则很快就会被新的进展淹没。由于不需要置办新装备,只要基本原理被人们理解,这些创新会在瞬间释放出惊人的创造力。而公众泡沫般的炒作速度,也让各方对人工智能领域的进展表现出完全不一样的态度。

01堪比互联网出现的“奇点”?

其中最不激进的观点认为,这是机器学习的第二次浪潮,只是比第一次大很多。哪些可以自动化?软件能够做什么?这些传统认知,都因此发生了进一步转变。换句话说,这改变了科技行业的运作方式。

比尔·盖茨的观点则更进一步,他将这种改变比作网络第一次出现在大众面前,特别是七十年代末在施乐帕罗奥多中心公司(PARC)第一次看到图形用户界面。他认为,从现在起,将改变我们与计算机的互动方式。今天你想让计算机做事,需要使用已经存在的软件,如果不存在,你可以自己创建简单的工具或者无代码的应用程序。如果两者都不能解决你的需求,你才需要学习写代码。而有了生成式机器学习,平时使用的自然语言就成了你的代码,而那些即使会写代码也无法解决的任务,也有望得到解决。

也有些人认为,自动化将带来严重的社会影响,但他们可能忘了客户管理巨头Salesforce出现二十年后也就只有20~25%的企业工作流转到云端。

最激进的观点认为,我们正走在最直接也最清晰通往人工通用智能的道路上,即机器学习的发展方向就是更多的数据和更大的模型。现在是GPT-4,到了GPT-5和GPT-6就会出现自发的自我意识,GPT-7可能就可以自动运行企业的财务和人力资源软件比如Workday。到了那个时候,原则上没有什么是人类可以做而计算机不能做的。

02风险与机会之“幻觉”插件

在人工智能中,“幻觉”是指人工智能做出的一种自信的反应,训练数据并不能为其提供依据。

例如,对特斯拉一无所知的产生“幻觉”的AI会选择一个它认为合理的随机数字作为年收入,比如136亿美元,但却没有任何迹象表明这是它自己想象的产物。幻觉的另一个例子是人工智能或聊天机器人会忘记自己的身份,声称自己是人类。

Open AI正在通过插件解决这一问题,插件不仅能让机器人浏览网络,还能与特定网站互动,让其他各类服务成为ChatGPT的“眼睛和耳朵”。有一个官方插件连接了ChatGPT 和 Wolfram|Alpha,两者都基于自然语言,但多年来在人工智能领域一直是两条不同的路径,前者是统计派,后者是符号派。得益于Chat GPT的成功,我们有机会将两种方法结合起来。Wolfram|Alpha 擅长充分利用其结构化、高精准的知识将某事转化为精确计算,被视为ChatGPT补短板的最佳选择。其他的插件包括旅游类(Expedia和Kayak)和订餐类(OpenTable)等。

image

图1. 两类人工智能的路径走到了一起;来源:网络

目前插件每次下载的次数受限,但可以想象未来会有更多,而且某些插件在客户认知的基础上会成为默认插件。

03风险与机会之开放与被开放

ChatGPT的开放让程序员、分析师、作家等各行各业发现与人工智能结合的巨大好处,以及如果不学习使用这些工具(GPT-4,MidjourneyV5,Copilot)可能面临的劣势。

但随着危险信号越来越多,Open AI开始变得越来越不开放:人们在上面没有阻拦地获得如何洗钱的建议、订购与已知化合物特性相匹配的危险化学品,生成更高质量的以假乱真的照片和视频等等。虽然处在风口浪尖的GPT-4没有公布技术细节,但这并不会阻止竞争对手公布源代码、不断想办法突破技术限制,拒绝开放源代码的时间窗口在不断缩小。

人工智能领域的快速发展使人们的认知和洞见不断提高,比如根据这样一条推文(Jeremiah Lowin),在B2C(面向个人服务)领域,人工智能是“往大里搞”,给一个简单的提示,生成图片、文章、代码;而在B2B(面向企业服务)领域,人工智能的路径刚好相反,输入大量的自有数据和知识,提炼出最相关、最具操作性的解决方案。

总之,“如果你希望有一个喘息的机会来吸收所有新技术,那是不可能的”!

补充阅读

在这里,特别介绍一款即将推出的办公软件——Copilot 。

image

我的(阅读)目标是博学和应用:我希望能够在写作时参考前人的最佳观点;我希望能够做出决定,并通过我所读过的人的视角来看世界。简而言之,我想尽可能充分地分享人类智力和情感不断提升的水平。如果一个人有好的记忆力固然好,而Copilot比记忆宫殿技术甚至天才级的智商还要优秀。

在豪尔赫·路易斯·博尔赫斯(Jorge Luis Borges)的短篇小说《巴比伦图书馆》(The Library of Babel)中,他创造了一个无限的图书馆,包含了所有书呆子都想读的书:一本能准确预测你的未来的书,一本能把量子力学和广义相对论统一起来的书,一本能揭示其他星球上外星生命的社会学的书,一本能准确地确定爱的含义和人性的核心的书,一本能包含一个真正的道德体系的书。但同样,也正是由于这个图书馆包含所有可能的书,它也包含了很多胡言乱语,使得浏览整个图书馆的知识成为一项不可能完成的任务,换句话说,它包含了宇宙的秘密,凡人无法使用。

image

图2.巴比伦图书馆来源:《巴比伦图书馆》插图

大型语言模型(LLMs)在很大程度上类似于巴比伦塔。当人工智能在试图回应你的提示时,如果以知识库为基础,你将得到更高质量的结果。这就是为什么如果你花了很多时间来精心梳理个人图书馆——无论是书籍、文章、视频还是电影——所有这些前期投入都会大大改善你的Copilot体验。

首先,Copilot创造了一个可信赖的信息基础。其次,由于你的过往阅读信息与你正在思考的问题有关,访问你的个人知识库将有助于它返回与你实际相关的结果。

以下是Copilot需要克服的一些限制:

①语境窗口的限制。像GPT-4这样的模型在给定时间内只能读取一定数量的信息。上下文窗口越大,它可以调用更多的信息来完成查询。GPT-4的上下文窗口比GPT-3的大8倍,所以这一点正在显著改善。

②隐私和IP问题。许多用户将对上传笔记和日记感到犹豫不决,这是有道理的。当前的AI体验可以在你的手机或笔记本电脑上运行,而不是强迫你把数据发送到云端API上完成时,会极大刺激使用。

以下是它可能的工作方式:

每当你触摸键盘时,人工智能就会下载并整理你曾经读过的所有内容,并使用这些知识的总和来帮助你完成你想要完成的任务。

① 它将存在于你的电脑和手机上、在你使用的每个应用程序中。保存任何你想记住的东西都会非常容易,只要截图,或粘贴一个URL,或上传一个文件,或发送一个文本,你正在看的任何东西都会被保存下来。

② Copilot会在适当的时候将这些信息“带回来”给你。举个例子,可能会从你十年前读过的一本书中找到完美的引文,以帮助你提炼你想要表达的观点。或者,它可能会给你提供“反方”观点和论据,或者甚至可能改变你对一个正在考虑的话题的看法。

在过去的10年里,我花了相当精力研究大脑和心理各种模型——试图将科学、行为经济学和文学的精华应用到日常工作中,以尝试做出更好的决定。问题是,创建一个心理模型的清单并不能真正帮助你特别好地应用它们。现在如果你在挣扎着做一个决定,Copilot可以建议你把问题倒过来想,它使心理模型变得实用和可操作——而不仅仅是愿望。

收藏
90.16W
我要评论
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
要闻
股市
关联话题
0 人关注