苹果智能海外上线 国产厂商押注AI 欲与之一战
原创
2024-10-29 19:21 星期二
科创板日报记者 黄心怡
①苹果计划在12月份推出新一批AI功能,包括将ChatGPT服务集成到Siri中,以及推出更强大的图像生成工具,何时能够在中国市场使用还尚未确定。
②国内安卓阵营厂商也接连发布了端侧AI和操作系统方面的一系列升级。业内人士表示,在AI方面国内“并没有落后多少”。

《科创板日报》10月29日讯(记者 黄心怡)今日,苹果智能(Apple Intelligence)终于在海外上线。苹果计划在12月份推出新一批AI功能,包括将ChatGPT服务集成到Siri中,以及推出更强大的图像生成工具。不过,Apple Intelligence何时能够在中国市场使用还尚未确定。

近日来,国内安卓阵营厂商也接连发布了端侧AI和操作系统方面的一系列升级,各种AI智能体、AI OS的概念铺天盖地袭来。

可以说,苹果智能尚未落地中国市场的窗口期,正促使国产手机厂商进一步以AI卖点来加码旗舰机型的竞争。各家手机厂商都明确要做系统级AI,要做AI OS、做好AI智能体。

IDC中国研究经理郭天翔对《科创板日报》表示,安卓阵营和苹果在AI方面的思路类似,都是注重端侧模型、智能体的概念。“在AI方面国内并没有落后多少。”

▌智能体能否干掉APP?

作为 iPhone 的语音助手, Siri 可以通过语音指令进行简单操作。但由于过去的回答主要基于搜索引擎,智能程度非常有限,并没有能取代手机的APP交互模式。随着大模型的发展,以Siri为代表的手机助手有望变得更有智商,从语音助手升级为AI智能体。比如想要预定酒店行程,不需要再打开APP,而是直接与AI智能体对话来完成。

谈及智能体是否会取代APP,荣耀CEO赵明认为,大概率是往这个方向发展,但是相当长的时间内,APP和智能体肯定是一个长期共存的方式。“这涉及到一个使用习惯的问题,还有各种意想不到的体验障碍的问题,所以一定是相当长的时间内并存,或者长期可能并存。”

作为智能体交互模式的第一步,AI识屏已开始在国内安卓手机上落地。最新发布的OPPO Find X8上线了一键问屏功能,能智能解析屏幕信息,并根据内容与用户互动,提供相应的解答和操作。

“举个例子,平时拍摄的景点照片,直接一键让AI识别并回答这是哪、背后有什么故事。看上去很简单,但背后涉及到全国3A级以上16000个景点,差不多百万级的数据来做专项训练。“OPPO AI中心产品总监张峻表示。

荣耀则发布搭载智能体的AI操作系统MagicOS 9.0。赵明介绍,现在智能体可以模拟人来点击屏幕、阅读理解屏幕,进行慢思考、找到关键的信息,然后进行相应的操作。目前可分为“自动驾驶”的智能体以及与应用交互的智能体两大类。

“自动驾驶的智能体,无需第三方的介入,首先对用户意图进行分析理解。比如说帮我点杯喝的,智能体能理解意图背后的这些信息和逻辑,对意图场景进行分解之后,变成可执行的指令,最终实现了点咖啡的操作。另一种则需要应用方进行协同。比如,荣耀跟中国移动的灵犀大模型。在查询手机话费的余额、充50块钱话费的过程当中,调用了灵犀的型进行接管。上述两种智能体未来一定是并存的,会有需要生态介入的部分,也有一些操作可以自动进行。”

对于未来AI交互在手机上的发展,多名业内人士认为,符合直觉、最直接的方式,会最终占据主流。

郭天翔表示,识屏交互属于AI手机一种新的交互方式,更便于用户的使用,降低学习成本。从目前看,未来AI交互还是会以最直接最简单的方式为主,从人的本能出发。

OPPO首席产品官刘作虎也认为,符合直觉是最基本的AI理念

“我每周都会开AI专项会,一直灌输一个概念:不管是什么,首先是符合直觉。我们看到很多可能炫技的东西,看似很简单,其实背后的技术要求很高。就像一键问屏,怎么识别用户的意图、识别屏幕,里面涉及很多的分流技术。但技术最终都要回到用户做产品。比如使用导航时,打开就有地址,直接一按就到目的地,AI时代就是直觉更加高效,这是最基本的AI理念。”

▌端侧模型:难点在体验和性能的平衡

大模型要装入手机,在前景无限的同时,挑战并存。手机上有限的算力决定了端侧模型不能过大,但小参数的模型在能力上又受到局限。

郭天翔表示,现在端侧模型已经不再过于强调模型参数的大小,而是追求使用体验、占用内存以及功耗之间的平衡

刘作虎坦言,端侧模型对性能要求很高,不管是性能还是内存的要求都非常高。所以如何持续优化架构、高能效发挥芯片潜能,仍是很漫长的路

“目前还有很多事情可以做。比如对平台的散热,可能大家会觉得很简单,其实很难。还有怎么做好底层内存的调用等等。说实话,AI在手机行业还是刚刚开始,接下来大家会看到非常多的AI变化。”

张峻透露, OPPO即将推出新的端侧架构AI LoRA,来降低内存等资源的占用。

“端侧AI最大的瓶颈是手机计算资源的使用。比如同时在手机上实现三个功能的端侧化,正常而言要占用三个相应的资源。假使把模型比做火车头,上了三个模型就意味着需要三个火车头再加车厢。而LoRA架构采用了基模型+应用模型的模式。只需要一个基模型,即只有一个火车头。后面的应用模型,相当于三个车厢,像左轮手枪一样,可以轮换。当需要什么模型,就上什么车厢,这样的内存峰值占用,可以节约75%。”

▌AI手机后时代:智能体将取代更多人工操作

对于大模型的发展,业内普遍保持短期审慎、长期乐观的态度。在端侧的落地亦如是。

刘作虎分析,AI时代的变化非常快。“过去对手机操作系统,我们是按半年、一年来做规划。而AI时代,一定不是这样。谁能知道一年后,AI是什么样子。AI产品甚至不是每三个月规划,应该每个月去规划。模型变化太快,技术超出想象速度。坦白讲,我自己都有很大的紧迫性。”

刘作虎强调,在AI时代做产品就是要快跑。“你一定要去跑,跑得要快,不然要落后,要紧跟技术的变化

近日,中国信息通信研究院发布了全球首份《终端智能化分级研究报告》,将终端智能化水平分为五个等级L1-L5,智能化等级越高,终端自主参与度越高,人的参与度越低。L1级和L2级具备一定智能化,可以完成单类型任务。L3级和L4级逐步从感知识别复杂意图到识别潜在意图。L5级具备全面智能化,能够自主规划完成全类型任务。

赵明表示,当前终端智能化水平处于L3的水平,要通往下一个L4、L5的阶段,所需的时间会更长一点,需要更多的积累。

“今天我们可以实现用户理解类别达到950项。未来,一定能够涵盖手机诸多的运行,把现有在传统手机上需要更多人干预的地方,逐步都消除掉。现在,一句话拨打手机电话没问题,微信视频也可以了,点咖啡也能做到。再往下一步,要实现更多、更模糊的指令,以及更复杂的关系之间的理解。”

收藏
64.49W
我要评论
欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
发表评论
要闻
股市
关联话题
4.34W 人关注
1.98W 人关注