智谱出圈 AI助理从0到1 我们离“贾维斯”还有多远?
原创
2024-11-02 00:35 星期六
科创板日报 宋子乔
①科技巨头致力于开发AI助理,让AI能自主操作手机、像人一样完成复杂的推理任务;
②随着应用场景落地,更大的商业空间正在酝酿中;
③与人们期待的“贾维斯”相比,现今的AI助理们,脑子远远不够用;
④技术上的问题需要时间解决,围绕AI助理落地,还有一系列非技术因素。

《科创板日报》11月2日讯(编辑 宋子乔) “你好,贾维斯。”“随时为您效劳,先生。”

漫威电影《复仇者联盟》中,钢铁侠与AI智能管家贾维斯的亲密互动,呈现了一个高级智能体该有的模样。

当下,大模型对复杂任务的推理能力增强、视觉处理能力提高、计算机控制能力展现,加之更流畅的人机交互,为高级智能体的发展提供了更好的基础。

智谱AutoGLM为代表的AI助理工具,只需接收文字/语音指令,就可以模拟人类操作手机、解决日常琐事,目前可支持微信、淘宝、美团、大众点评、小红书、高德地图、12306、携程等App的常规跨页面操作,在订票、点外卖等日常场景中充分解放用户双手,这在资本市场掀起一阵硬件智能化风潮。

微软、谷歌等科技巨头同样在畅想科幻电影照进现实的画面,致力于开发AI助理(AI Agent),让AI能自主操作手机、像人一样完成复杂的推理任务——

微软近期低调开源了AI工具OmniParser,其可帮助用户创建个性化智能体,以操作个人计算机;10月22日,微软宣布在Dynamics 365中集成10个自主AI Agent,支持OpenAI最新模型o1,具备自主学习能力,可自动执行跨平台复杂业务;9月,微软推出了一款名为Windows Agent Arena的基准框架,同样属于AI助理开发范畴。

据The Information报道,谷歌计划在12月预览其大型动作模型“Project Jarvis”,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。

10月22日,Anthropic为大模型Claude迭代了新功能——Computer Use,让AI可以像人一样操控电脑。Claude3.5 Sonnet是首个支持计算机控制的模型,能够模拟人类操作计算机,包括移动光标、点击按钮和输入文本。

苹果选择将Siri与ChatGPT集成,实现更智能的人机交互,另有网友发现苹果已经默默发布了Ferret-UI的两个实现版本(分别基于Gemma 2B和Llama 8B),这是苹果今年5月发布的一个可让AI理解手机屏幕的技术。

华为则公布了一项可让AI像人类一样操作手机的新研究成果,相关团队提出了一个手机控制架构:Lightweight Multi-modal App Control(轻量级多模态应用控制,简称LiMAC)。

OpenAI也开源了多功能协同AI Agent——Swarm,可创建多个智能体协同工作,以更高效地完成任务。其GPT o1模型增强了推理能力,使其在复杂问题的解决和用户交互的自然性方面均有显著进步,亦使其更加适用于AI Agent场景。

值得注意的是,近日,OpenAI CEO阿尔特曼在一次互动访谈中分享了自己对AI助理的看法。他认为,AI助理能够像一个聪明的同事一样,与用户一起合作完成项目。阿尔特曼同时提及AI助理的定价——该服务不是按接入AI助理的个数付费,而是根据回答问题所需的计算量定价。

巨大商业空间酝酿中

AI助理的应用场景涵盖B端和C端,可扮演智囊、管家、代理人等多重角色。

作为个人助理,它可以进行日程管理、信息查询、任务自动化;在制造业、物流、医疗、教育等领域,通过自主学习和优化,AI助理可实现智能监控、数据分析、流程优化、决策支持、互动交流等高级功能。

对于使用者而言,企业可用它实现降本增效,个人可用它提高工作、生活效率。

随着应用场景落地,更大的商业空间正在酝酿中。对于AI助理服务的提供方、搭载AI助理的硬件生产商、连接AI助理的应用方,新的盈利模式有望从中孕育——

接入AI助理的手机会不会销量更好?手机厂商是选择自研AI助理还是接入第三方服务?与第三方开展合作的模式是什么?将如何分成?当你需要买东西,AI助理会打开哪个电商平台?引流依据是什么?

产业端,苹果、荣耀、三星等终端厂商近期开始发力、落地基于AI助理技术的边端AI功能。其中,近日上线的荣耀Magic7系列首发YOYO智能体,荣耀CEO赵明对YOYO助理说了一句话,便成功下单2000杯咖啡。据介绍,Magic 7系列搭载的AI助理,其智能水平达到L3等级,不仅可完成帮忙发文件、智能填表、购物比价等基础操作,并且可根据用户指令完成关闭自动续费、购买饮品、规划旅行路线及订票等多项跨应用操作。

在硬件厂商言必称AI的时代,AI助理或成为终端智能化的突破口。

中信证券表示,AutoGLM等终端AI助理技术将带来更短路径的交互形式,接受语音指令并自动完成复杂操作的能力将为消费者带来极大便利,其有望成为AI终端的亮点功能并吸引消费者升级换代

华泰证券也表示,AI助理是通往AGI的核心基础,AI助理落地带来多个层次的产业机遇,其中,Agent+终端有望推动人机交互变革,除了在终端销售量价方面的变化外,可能对终端应用的商业模式产生更加深远的影响

另外,AI助理与具身智能/人形机器人、区块链、5G等技术将碰撞出怎样的火花?将如何帮助构建智能体社会与群体智能?这些问题一同成为了描绘产业蓝图的画笔。

沉浸于未来构想之时,更冰冷的问题立于当下:AI助理到底有多少用处?

AI助理还没有那么“聪明”

与Siri、小爱助理、天猫精灵、小度等“前辈”相比,AutoGLM等AI助理的确更加人性化、响应更精准、能处理更复杂的任务、学习能力更强。

其中,交互性、自主操作这两大亮点让AI助理出圈,比如AutoGLM只需用户一个吩咐就能网购、点外卖、订高铁票,甚至发微信、抢红包、评论朋友圈、整理笔记并生成攻略、总结论文。

但与人们期待的“贾维斯”相比,这些AI助理们的脑子还远远不够用。以智谱AI为例,尝鲜者反映的典型问题包括:

需要更加精细化的指令,不会比价,AutoGLM为你买的东西可能不是最优价格;无法很好地应对突发情况,如广告弹窗等;能打开的App有限,据了解,目前AutoGLM可适配微信、淘宝、美团、小红书、大众点评、12306、携程、高德地图共8款应用。

Claude的Computer Use存在类似的问题。一个有意思的案例是,某工程师使用该工具给整个团队点外卖,未指定具体要吃什么,接到任务的Claude仅用1分钟就下单了披萨,3个披萨共花掉95美元,一则网友吐槽被推上首条评论位:3个披萨95美元是犯罪。

image

这意味着,尽管AI助理可以为你省去操作步骤(打开App,点选页面),但它并不能完全自主地、“完美地”解决问题,用户依然需要做思考、参与决策

结语:我们和高级智能体之间仍有很远的距离

技术上的问题需要时间解决,围绕AI助理落地,还有一系列非技术因素,比如数据隐私与安全问题、自主决策的伦理困境、责任归属问题、算法偏见与歧视等。

安全是一个重要议题。为了实现更深度的操作,AI助理需要获取用户手机的无障碍权限、与企业其他系统(如ERP、CRM)集成,实现信息共享和协作。

隐私泄露的情形如何避免?拥有高自由度的AI如果做出了错误判断,问题的责任方是谁?

如何在便利与安全之间找到平衡,将是未来AI助理发展必须面对的挑战。

收藏
158W
我要评论
图片
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
评论(51)
cls-am2f2g7个月前 · IP未知
电广传媒
(11)
回复0条回复
cls-13974917个月前 · IP未知
智谱ai,新节点新主线!
(8)
回复3条回复
cls-yta7ot回复cls-13974917个月前 · IP未知
(1)
回复
韭菜
oneki回复cls-13974917个月前 · IP未知
(0)
回复
韭菜
炒神回复cls-yta7ot7个月前 · IP未知
(0)
回复
你有票吗?就乱叫
王狮虎7个月前 · 山东
炒新不炒旧,首都在线
(5)
回复4条回复
cls-081v9r回复王狮虎7个月前 · IP未知
(0)
回复
我劝你上华策,首都还得震两天
cls-upnda4回复王狮虎7个月前 · IP未知
(0)
回复
股性太差,资金不认可,最正宗的走成这鬼样,周一割肉走人
天行健64回复cls-081v9r7个月前 · IP未知
(0)
回复
华策也行,也没怎么涨,但是还是看好首都在线的生态合作,底层算力,国产适配,也和华为有合作了
王狮虎回复cls-upnda47个月前 · IP未知
(0)
回复
是,有点差,都没怎么涨,主要是爆发第一天让量化害了,不过还是看好首都在线是核心
酩焱7个月前 · IP未知
豆神科技
(5)
回复0条回复
张杰887个月前 · IP未知
华策影视
(3)
回复0条回复
王狮虎7个月前 · 山东
首都在线
(3)
回复0条回复
王狮虎7个月前 · 山东
首都在线,低位核心
(3)
回复1条回复
天行健64回复王狮虎7个月前 · IP未知
(0)
回复
首都在线,没怎么涨
cls-18077747个月前 · IP未知
周一跑路就对了
(3)
回复0条回复
炒神7个月前 · IP未知
电广传媒周一又是涨停!
(2)
回复0条回复
终结者7个月前 · IP未知
蓝色光标,已经明牌与智谱深度合作。
(2)
回复0条回复
cls-uzqgn27个月前 · IP未知
没事有大力的韭菜支持呢,放心发展
(2)
回复0条回复
天行健647个月前 · 山东
智能体!未来趋势!我看内侧了,非常实用,首都在线!低位核心
(2)
回复0条回复
点滴7个月前 · IP未知
AI想象力丰富,题材空间大
(1)
回复0条回复
cls-15189697个月前 · IP未知
涨完了,找人接盘了
(1)
回复0条回复
火星男爵777个月前 · IP未知
小作文来了 板块太拉夸 这是牛市,都这么拉胯
(1)
回复0条回复
oneki7个月前 · IP未知
“小爱同学!”“我在~”“播放嘎子抗日神剧!”“好的,下面为您播放好莱坞大片《老潘血战茅台镇》~”
(1)
回复0条回复
cls-17801127个月前 · IP未知
人工智能必须强大
(1)
回复0条回复
cls-18912117个月前 · IP未知
小作文来了
(1)
回复1条回复
cls-081v9r回复cls-18912117个月前 · IP未知
(0)
回复
要信早信,反应快的吃肉,慢的买单
点滴7个月前 · IP未知
智普Ai人工智能新的增长点
(0)
回复0条回复
cls-吉财运7个月前 · 浙江
下周新的热点概念
(0)
回复2条回复
cls-直冲一万点回复cls-吉财运7个月前 · 山东
(0)
回复
已经炒了好几天了[doge]
cls-iamznzzz回复cls-吉财运7个月前 · 福建
(0)
回复
下周就接盘
cls-吉财运7个月前 · 浙江
新热点[兔子]
(0)
回复0条回复
cls-18552587个月前 · IP未知
剑桥科技
(0)
回复0条回复
江南烟雨蒙蒙7个月前 · IP未知
这不是助理,这是隔壁老王……相当于当年王宝强助理,李代桃僵的角色😬 
(0)
回复0条回复
cls-9wgt8e7个月前 · IP未知
这是找接盘侠了,周一莫伸手😏 😏 😏 
(0)
回复0条回复
金刚经7个月前 · IP未知
没真正收益的。
(0)
回复0条回复
cls-15015567个月前 · IP未知
高科技🙂  🙂  🙂  🙂  
(0)
回复0条回复
cls-x975op7个月前 · IP未知
都是埋伏狗兑现党
(0)
回复0条回复
cls-17801127个月前 · IP未知
科大讯飞
(0)
回复0条回复
黑白人生?7个月前 · IP未知
创意信息,华宇软件
(0)
回复0条回复
阿飞7个月前 · IP未知
呼家楼的努力!
(0)
回复0条回复
cls-jmng9t7个月前 · IP未知
都拉几个板了找人接盘了,现在目前有预期的就是华为mate70手机概念
(0)
回复0条回复
点滴7个月前 · IP未知
牛市有风口干就是了
(0)
回复0条回复
Joker807个月前 · IP未知
电广传媒冲!
(0)
回复0条回复
炒神7个月前 · IP未知
电广传媒周一涨停
(0)
回复0条回复
小卡拉密7个月前 · IP未知
电广传媒
(0)
回复0条回复
史木四7个月前 · IP未知
吹你大爷的票,让大家去高位接盘?
(0)
回复0条回复
cls-edbiwq7个月前 · IP未知
ai就是未来
(0)
回复0条回复
俺必胜7个月前 · IP未知
均普智能不是已经出了贾维斯2号了
(0)
回复0条回复
cls-13898127个月前 · IP未知
利好对现
(0)
回复0条回复
cls-yta7ot7个月前 · IP未知
还在这吹呢
(0)
回复0条回复