近日,字节跳动发布了全新一代豆包手机助手的技术预览版。这个豆包手机助手,跟手机厂商深度融合,具备了视觉感知、长期记忆以及直接动手操作的能力。它在屏幕上生成一个悬浮窗,模拟你的一切操作,完成你的指令。你对着手机说完这句话,不用打开任何APP,后台已自动完成美团、淘宝、京东的比价,弹窗确认后直接跳转支付。
用户询问车停在哪里时,它能调出用户上次拍摄的车位照片并附带楼层指引;当需要取快递时,它能读取短信历史并报出取件码;甚至当用户询问高铁座位号时,它能自动翻找12306的购票记录并告知准确位置。
该消息发酵后,中兴通讯A股强封板涨停,成交额超140亿元。港股同步走强,盘中一度涨超10%。消费者对这款手机也非常有兴趣,中兴官方商城已经售罄,闲鱼上二手售价4200~4999元,比官方售价高出上千。
不难判断,未来各家都会推出自己的AI助手。这种AI新入口,给未来的商业竞争,带来了巨大的不确定性,机遇和挑战并存。理解这一点,还得从底层技术谈起。
首先,AI助手的基础,是大模型的分析信息、与人交互的能力。这个能力可以让AI根据用户的指令去收集、分析信息,通过文字、语音、图片,给用语音、文字、图片给出结论。
其实,这些能力之前的手机也并不是完全不具备。如果价格、评分、评价等信息标准化、结构化了,并通过API接口提供,那么,无需大模型,也可以给出对比的结论。所谓 API接口,指不同软件系统间交互的标准协议,通过预定义的通信规则,实现功能调用和数据共享。
但是,各家APP显然不会通过API,提供这种标准化、结构化的API数据接口。恰好相反,各家会采取技术手段,避免自己的数据被“爬虫”爬取。这也是为什么消费者有时候会遇到真人校验。而通过技术手段,破解API接口,绕过安全防护机制,非法获取他人计算机信息系统中的数据(如用户信息、商业数据等),可能触犯《中华人民共和国刑法》第二百八十五条,构成非法获取计算机信息系统数据罪或提供侵入计算机信息系统程序罪。
而大模型的意义恰好就是能处理非结构化数据,理解复杂语境。一方面,当用户说“找个安静的咖啡馆写东西”,AI能结合位置、环境噪音、用户习惯等多维度信息进行判断,并通过语音与用户持续沟通。这就提升了人机交互的自然度与方便程度。
更重要的是,在另一方面,AI大模型与手机厂商合作,用系统密钥打包并烧录进手机ROM,获得诸多底层权限,才可以像操作系统原生部件一样,跨应用操作。再加上AI助手可以凭借处理非结构化数据的能力,从屏幕获取数据,就可以让AI助手绕过各家的API,直接获得这些APP的数据,并模拟用户手指,操作这些APP。这是一个法律的新问题。
也就是说,以前各个APP直接向用户提供信息,现在,用户说:AI助手,你去帮我读取,然后帮我决策。所以,AI手机助手的实质,就是有能力获得“读屏”“模拟手指”这类底层权限,进而绕过各家APP的屏障。这才是最关键的一点。
有了这个能力,AI助手就可以做很多事。比如,可以进行跨电商平台比价、在各家电商之间,帮你算哪个便宜,哪家送得最快。显而易见,在这些操作中,AI助手就可以在一定范围内,引入自己的倾向性。AI可以告诉消费者,这家便宜5毛,但另一家送得更快;它也可以反过来说,这家虽然送得更快,但另一家便宜5毛。它还可以说,这家便宜5毛,那一家送得更快,但有一家新开的,或评分不错,你要不要尝试一下?
这种诱导,未必是侵害消费者利益,因为对消费者来说,便宜5毛钱;送得更快;尝试一下新味道,三者是同等效用的,并没有被损害。但这对整个外卖、餐饮乃至电商生态来说,是颠覆性的。
2013年上映的科幻爱情片《Her》,讲述了未来世界中,信件撰写人西奥多与人工智能操作系统萨曼莎之间的情感故事。萨曼莎没有实体,仅凭声音与西奥多建立了超越传统的亲密关系。不难想见,一个和用户有情感连接的AI助手,对未来的商业版图的影响是巨大的。
做一个有趣的比喻,如果说消费者是皇帝的话,各个APP的各种促销、广告、补贴就像臣子,臣子要影响到皇帝的心智,要见到皇帝,都得通过AI这个贴身太监的许可。
但风险也随之产生,比如,现在很多银行的APP在检测到读取屏幕时,就提示用户,手机开着屏幕共享,请关闭。银行APP的这个提示,并不是提前做好,用来抗拒手机AI助手的,而是为了应对电诈的。
AI要作为一个助理存在,必然要获取很多包括“读屏”在内的高敏感权限。这就像现实中的助理一样,要展开工作,必然需要了解雇主的很多敏感信息。从这个角度,AI通过“读屏”等权限,把所有APP连接在了一起,打破了沙盒机制。所谓沙盒机制,是计算机的一种安全机制,为运行中的程序提供的隔离环境。当AI助手,某种程度上打破了这个沙盒,成为一个“超级应用”,风险也由此产生。
这相当于把所有信息都放到了同一个篮子里。大厂商当然会做到规范,但事情总有万一,一旦泄露,就是系统性风险。以前金融、聊天、图片、支付、健康等信息,分别在不同APP,如今都在一个超级应用AI中。
除此之外,对敏感权限的授权,还会造成消费者的警惕性下降。
伴随互联网、智能手机的发展,这个趋势其实一直都存在。比如,以前用数码相机拍一张照片,放到电脑上观看,全过程相片不会被第三方看到。但现在,如果想用手机发一张图,或修一张图,或提取其中的文字,你就必须接受让第三方读取你的相片。
手机操作系统也做出了相应的改变,设定了单次授权,App每次只能访问用户主动选择的单张照片,无法自动批量获取或遍历所有照片。但这就意味着你每次都得选两次,这种不方便,最终就会让用户授权第三方读取整个相册。
以前一个陌生人,翻你电脑上的相册,你会高度敏感。但现在,当很多软件都要求读取相册,读取通讯录的时候,用户的警惕性就下降了,就会不假思索地同意第三方读取整个手机相册。未来,当手机AI助手,普遍性地读取整个屏幕,用户对这类授权的警惕性就会下降。这就给金融诈骗打开了方便之门。读屏和通过api获得信息不同,它覆盖整个手机屏幕的全部信息,这就意味着,AI手机用户虽然授权,但他的联系人、聊天对象、快递收件人,都一并被读取了信息。
根据国家互联网金融风险分析技术平台发布的监测数据显示,截至2020年2月底,已发现互联网金融仿冒网站4.8万个,受害用户达12万人,互联网金融仿冒APP 2801个,下载量3343.7万次。 未来AI手机助手普及,电诈份子只需做一个假的AI助手,用户也会不假思索地进行各种高敏感权限授权,然后犯罪分子就能拿到受害者的全部金融信息。AI手机带来方便、高效的同事,也会提高黑灰产的效率。
目前,消费者、监管、各家厂商,面对这一即将到来的冲击,还未完全准备好,有待未来在落地、普及的过程中,逐渐演化。围绕隐私、数据安全、商业利益,AI助手将成为各方博弈的焦点。
AI助手,可以称之为手机的灵魂,也是手机厂家由硬转软,更直接接触整个移动互联网商业生态的一个机会。手机厂家肯定不愿意交给第三方。在2025年第39周,中兴、魅族、努比亚、三星等品牌累计占据5.66%的市场份额。由此可见,努比亚的市场份额已经很小了,所以,会选择深度绑定。但其他手机品牌,肯定不愿意轻易交出自己的灵魂。
在应用层面,基于安全、商业利益等原因,“APP们”也会抵抗AI手机助手。比如,银行APP,基于金融安全的需求,就拒绝“读屏”。但是消费者仍然是巨大的推动力。比如,一个抗拒读取屏幕的银行APP,消费者可能就拒用,转向另一家银行。而对于提供同质化、标准化产品与服务的商业模式来说,挑战就更大。
《her》这部电影,拍摄于2013年,电影设定的故事发生时间却恰好是2025年,地点是上海。12年前的科幻元素已成为现实。这使《Her》不仅是一部科幻片,更像是一个现实的预言。手机、互联网公司、用户、监管,即将迎来20年未有之大变局,而这个变局会决定今后更长时期的商业、manbetx20客户端下载 、社会面貌。
(本文仅代表作者本人观点,责编:闫曼 man.yan@ftchinese.com)