苹果智能海外上线国产厂商押注AI 欲与之一战

原创

2024-10-29 11:21 星期二

科创板日报记者黄心怡

①苹果计划在12月份推出新一批AI功能，包括将ChatGPT服务集成到Siri中，以及推出更强大的图像生成工具，何时能够在中国市场使用还尚未确定。
②国内安卓阵营厂商也接连发布了端侧AI和操作系统方面的一系列升级。业内人士表示，在AI方面国内“并没有落后多少”。

《科创板日报》10月29日讯（记者黄心怡）今日，苹果智能（Apple Intelligence）终于在海外上线。苹果计划在12月份推出新一批AI功能，包括将ChatGPT服务集成到Siri中，以及推出更强大的图像生成工具。不过，Apple Intelligence何时能够在中国市场使用还尚未确定。

近日来，国内安卓阵营厂商也接连发布了端侧AI和操作系统方面的一系列升级，各种AI智能体、AI OS的概念铺天盖地袭来。

可以说，苹果智能尚未落地中国市场的窗口期，正促使国产手机厂商进一步以AI卖点来加码旗舰机型的竞争。各家手机厂商都明确要做系统级AI，要做AI OS、做好AI智能体。

IDC中国研究经理郭天翔对《科创板日报》表示，安卓阵营和苹果在AI方面的思路类似，都是注重端侧模型、智能体的概念。“在AI方面国内并没有落后多少。”

▌智能体能否干掉APP？

作为 iPhone 的语音助手， Siri 可以通过语音指令进行简单操作。但由于过去的回答主要基于搜索引擎，智能程度非常有限，并没有能取代手机的APP交互模式。随着大模型的发展，以Siri为代表的手机助手有望变得更有智商，从语音助手升级为AI智能体。比如想要预定酒店行程，不需要再打开APP，而是直接与AI智能体对话来完成。

谈及智能体是否会取代APP，荣耀CEO赵明认为，大概率是往这个方向发展，但是相当长的时间内，APP和智能体肯定是一个长期共存的方式。“这涉及到一个使用习惯的问题，还有各种意想不到的体验障碍的问题，所以一定是相当长的时间内并存，或者长期可能并存。”

作为智能体交互模式的第一步，AI识屏已开始在国内安卓手机上落地。最新发布的OPPO Find X8上线了一键问屏功能，能智能解析屏幕信息，并根据内容与用户互动，提供相应的解答和操作。

“举个例子，平时拍摄的景点照片，直接一键让AI识别并回答这是哪、背后有什么故事。看上去很简单，但背后涉及到全国3A级以上16000个景点，差不多百万级的数据来做专项训练。“OPPO AI中心产品总监张峻表示。

荣耀则发布搭载智能体的AI操作系统MagicOS 9.0。赵明介绍，现在智能体可以模拟人来点击屏幕、阅读理解屏幕，进行慢思考、找到关键的信息，然后进行相应的操作。目前可分为“自动驾驶”的智能体以及与应用交互的智能体两大类。

“自动驾驶的智能体，无需第三方的介入，首先对用户意图进行分析理解。比如说帮我点杯喝的，智能体能理解意图背后的这些信息和逻辑，对意图场景进行分解之后，变成可执行的指令，最终实现了点咖啡的操作。另一种则需要应用方进行协同。比如，荣耀跟中国移动的灵犀大模型。在查询手机话费的余额、充50块钱话费的过程当中，调用了灵犀的型进行接管。上述两种智能体未来一定是并存的，会有需要生态介入的部分，也有一些操作可以自动进行。”

对于未来AI交互在手机上的发展，多名业内人士认为，符合直觉、最直接的方式，会最终占据主流。

郭天翔表示，识屏交互属于AI手机一种新的交互方式，更便于用户的使用，降低学习成本。从目前看，未来AI交互还是会以最直接最简单的方式为主，从人的本能出发。

OPPO首席产品官刘作虎也认为，符合直觉是最基本的AI理念。

“我每周都会开AI专项会，一直灌输一个概念：不管是什么，首先是符合直觉。我们看到很多可能炫技的东西，看似很简单，其实背后的技术要求很高。就像一键问屏，怎么识别用户的意图、识别屏幕，里面涉及很多的分流技术。但技术最终都要回到用户做产品。比如使用导航时，打开就有地址，直接一按就到目的地，AI时代就是直觉更加高效，这是最基本的AI理念。”

▌端侧模型：难点在体验和性能的平衡

大模型要装入手机，在前景无限的同时，挑战并存。手机上有限的算力决定了端侧模型不能过大，但小参数的模型在能力上又受到局限。

郭天翔表示，现在端侧模型已经不再过于强调模型参数的大小，而是追求使用体验、占用内存以及功耗之间的平衡。

刘作虎坦言，端侧模型对性能要求很高，不管是性能还是内存的要求都非常高。所以如何持续优化架构、高能效发挥芯片潜能，仍是很漫长的路。

“目前还有很多事情可以做。比如对平台的散热，可能大家会觉得很简单，其实很难。还有怎么做好底层内存的调用等等。说实话，AI在手机行业还是刚刚开始，接下来大家会看到非常多的AI变化。”

张峻透露， OPPO即将推出新的端侧架构AI LoRA，来降低内存等资源的占用。

“端侧AI最大的瓶颈是手机计算资源的使用。比如同时在手机上实现三个功能的端侧化，正常而言要占用三个相应的资源。假使把模型比做火车头，上了三个模型就意味着需要三个火车头再加车厢。而LoRA架构采用了基模型+应用模型的模式。只需要一个基模型，即只有一个火车头。后面的应用模型，相当于三个车厢，像左轮手枪一样，可以轮换。当需要什么模型，就上什么车厢，这样的内存峰值占用，可以节约75%。”

▌AI手机后时代：智能体将取代更多人工操作

对于大模型的发展，业内普遍保持短期审慎、长期乐观的态度。在端侧的落地亦如是。

刘作虎分析，AI时代的变化非常快。“过去对手机操作系统，我们是按半年、一年来做规划。而AI时代，一定不是这样。谁能知道一年后，AI是什么样子。AI产品甚至不是每三个月规划，应该每个月去规划。模型变化太快，技术超出想象速度。坦白讲，我自己都有很大的紧迫性。”

刘作虎强调，在AI时代做产品就是要快跑。“你一定要去跑，跑得要快，不然要落后，要紧跟技术的变化。

近日，中国信息通信研究院发布了全球首份《终端智能化分级研究报告》，将终端智能化水平分为五个等级L1-L5，智能化等级越高，终端自主参与度越高，人的参与度越低。L1级和L2级具备一定智能化，可以完成单类型任务。L3级和L4级逐步从感知识别复杂意图到识别潜在意图。L5级具备全面智能化，能够自主规划完成全类型任务。

赵明表示，当前终端智能化水平处于L3的水平，要通往下一个L4、L5的阶段，所需的时间会更长一点，需要更多的积累。

“今天我们可以实现用户理解类别达到950项。未来，一定能够涵盖手机诸多的运行，把现有在传统手机上需要更多人干预的地方，逐步都消除掉。现在，一句话拨打手机电话没问题，微信视频也可以了，点咖啡也能做到。再往下一步，要实现更多、更模糊的指令，以及更复杂的关系之间的理解。”

阅64.66W

我要评论

反馈意见