WWW.KEGFUUK.CN
标签聚合 邱晓芬

/tag/邱晓芬

36kr.com · None · tech

文|邱晓芬 编辑|苏建勋 2026年,全球的具身智能机器人创业者不约而同将目光方向调转向深水区:家庭。 点燃这份热情的,是近期行业里闪烁着的一丝丝Scaling Law苗头—— 先是硅谷具身智能公司Generalist AI在GEN-1模型上验证了确定性,当他们给机器人喂进海量数据后,精细操作任务成功率竟从64%提升到了惊人的99%; 随后,硅谷当红的具身智能独角兽公司Sunday Robotics也试图解决家庭场景数据难关,不仅推出Umi手套数据采集方案,还直接将机器人Memo送进家庭做家务(收拾餐做、冲咖啡、叠衣服),因此吸引了大量的资本押注。 在大洋彼岸的中国,近期闯入家庭机器人领域的创业者中,还有一个熟悉的身影——许华哲。 “两年内,中国将会出现可用的家庭机器人”,他对于行业的判断,同样乐观且激进。 作为“伯克利归国四子之一”、清华大学交叉信息研究院助理教授,2023年,许华哲曾加入「星海图」任前首席科学家兼联合创始人,一起将这家公司打造成中国具身智能领域的明星公司。 不过,在这家公司估值冲破200亿、融资近30亿的巅峰时刻,许华哲又选择“单飞”并创办了全新的具身智能公司「破壳机器人」。 此次重新出发,他想做的是能在家庭场景干活的、真正有泛化性的具身智能机器人。 △ 许华哲 其实,想做一个家庭机器人公司并不是近期偶然的想法。初高中时的他读完《乔布斯传》后,内心便萌生创办一家伟大To C公司的种子。此后,在清华、伯克利、斯坦福的一路升学中,他一直深耕机器人强化学习方向,梦想便是把机器人送入千万家庭。 他理想中的家庭机器人,虽然不是无所不能,却能完成上一代机器人(比如扫地机、洗地机)无法完成的复杂任务,比如能进行更精细的清洁工作、有条理的完成诸如洗衣收纳的长序列、多步骤任务串联。 在他看来,这种创业方向的选择,也带有强烈的审美洁癖。许华哲直言,泛化性的本质是一种“美与影响力”——用最简洁优雅的模型,解决人类复杂的生活问题,并真正将AI转化为生产力,而非仅仅替代低端劳动力。 从更理性的层面,切入To C家庭场景也包含着许华哲的商业判断。在他看来,当前大量机器人厂商将人形机器人送进工厂,完成传统机械臂就能完成的上下料、搬运箱的工作,本质上只是在用新的人性在做旧时代的事情,机器人没有发挥出真正的通用性。 他认为,真正的AGI应该在家庭场景中诞生、运用,因为家庭场景任务比工厂场景更混乱随机,且数据丰富,恰恰是训练通用模型的最佳土壤。 因此,为了追赶时机,在创业的短短一个月内,新公司「破壳机器人」已经完成了融资、核心团队组建、具身模型的训练、以及硬件迭代工作。 《智能涌现》独家获悉,破壳机器人近期完成数千万美元天使轮融资,由云启资本领投,并获得顺为资本、弘晖基金等一线美元基金,小米战投、星海图等知名产业方,以及BV百度风投、英诺天使基金、水木清华校友种子基金、东方嘉富等一线市场化基金的支持。 快速得到资本押注,也因为许华哲在关键技术路线上有一些不同的选择。 为了实现泛化,在关键技术路线方面,他的选择也略显反常识。他完全放弃了行业主流的VLA(视觉-语言-动作)基座模型方案,转而构建一种能直接输入和输出“视频-动作”的 世界模型 。 在模型结构上,他也提出了独特的“ UAG架构 ”,用并联式预训练替代过去的瀑布式级联,并将强化学习贯穿预训练与部署全过程,实现了训练效率的五倍提升。 打好模型基础之余,在数据与硬件层面,他也通过UMI、外骨骼和第一人称视角三层方案采集高质量数据,形成从任务定义到数据、模型、本体的闭环迭代。 据许华哲透露,「破壳机器人」第一代 32B参数规模的具身世界模型 已完成首轮训练,正处于数据迭代的关键爬坡期。在硬件层面,「破壳机器人」为数据采集量身定制的手套硬件已迭代了五六个版本。 近期,《智能涌现》与许华哲聊了聊,以下是交流实录(略经摘编) 为何出走「星海图」? 《智能涌现》:为什么选择离开星海图,创立一家新的机器人公司? 许华哲:这个想法其实酝酿了很久。在2023年8、9月份,我就开始和高继扬聊,加入星海图。但经过了两年,到去年11、12月份,我已经基本决定要离开了,真正办完手续是在今年,创立「破壳机器人」是最近一个月的事情。 离开的原因主要是因为我内心一直想做一些To C的、真正泛化的通用机器人。 《智能涌现》:既然一直想做To C,为什么一开始不直接做To C方向机器人的创业呢? 许华哲:原因是多方面的。2023年我加入星海图时,也考虑过要不要自己创业,但那时我刚从美国读完书回来,在叉院工作才一年左右,要自己开公司lead一摊事,还要兼顾教职,挑战很大。 那时星海图和其他一些具身智能公司也邀请我加入,我觉得先加入一个优秀的团队做联创,是一个更稳妥的选择,而且当时星海图的宣传里也提到大概是“让机器人服务千万人类”的话语,这和我的一部分想法是吻合的。 《智能涌现》:您现在新公司虽然只成立一个月,都有哪些进展? 许华哲:团队方面,目前有20人左右,AI侧有一些天才少年,硬件侧有很多做过To C量产交付的工程师。我们还在火热招聘中。 在技术上,我们的AI模型在“动得快”、“泛化强”、“成功率高”三个维度都有较好的前期积累,能让机器人完成某些复杂任务时达到接近100%的成功率。 我们第一代32B的模型已经完成了第一次训练,但还需要数据量的迭代才能展现出更好能力。我们的硬件手套也已经迭代了五六个版本。 第一个月要处理公司注册、选址、装修等各种事务。能跑出这个速度,我觉得还是比较快的。 《智能涌现》:您这次创业,和第一次创业时心态有什么不同? 许华哲:最大的不同是心态上更踏实、也更敢了。第一次创业前,我会担心,我没上过班怎么给别人“班”上?我没做过生意怎么办,没跟投资人、政府打过交道怎么办? 在星海图的两年,我接触过这些事,“没打过就硬打,没上过就硬来”,其实最终结果也挺顺利的,太多的顾虑没必要,出来混最重要是先出来。这次心理上更从容。 《智能涌现》:在2023年和2026年两个节点创业做家庭机器人这件事,区别大吗? 许华哲:区别挺大的。首先是硬件本体,这三年中国的硬件供应链打磨得更好了,有了更多能用的机器人,2023年时可能只能用工业臂; 第二是数据,2023年时机器人的数据几乎是0,现在网上开源数据就有几十万小时,还出现了大量的数据供应商,虽然数据质量和跨本体适配还是问题,但丰富度已经不可同日而语。 第三是融资和市场认知,2023年要做To C机器人可能很难融资,大家给的时间缓冲也更少。今天起步比2023年更好。 AGI应用于家庭,工厂是上一代技术的领地 《智能涌现》:一直想做To C的机器人,背后的触发点是什么? 许华哲:首先,一个核心思考是,我们做机器人到底在做什么?机器人是人类自古以来的追求,我们在海底捞、酒店、工厂都见过机器人,但如果我们只是用人形的外壳去工厂拧螺丝、搬箱子,那本质上还是在做旧时代的事情。 这一代机器人最核心的不同在于它的通用性。 通用性该用在越混乱、越需要通用能力的地方。那答案就是家庭,或者广义的服务场景。我认为,通用的AGI(通用人工智能)应该用在家里。 第二,从个人偏好来说,做有品牌的事情是可以做得足够大、有梦想的。伟大的公司很多是To C的,比如苹果、小米。 第三,从数据角度看,通用性需要有丰富的数据,混乱的家庭场景恰恰能提供丰富的数据。如果你的数据源头错了,就得不到正确的模型。 基于这三点,我觉得做To C机器人是一件正确的事,我自己也特别感兴趣。 《智能涌现》:您认为AI模型什么时候可以支撑做家庭To C机器人? 许华哲:我的预测比较乐观激进,我认为 两年内 会出现可以用起来的机器人。它不是万能的,但会是一个有完善产品定义、能做相当多通用事情的机器人,但它会有一些明确不做的事,比如抱婴儿、烧热水。 《智能涌现》:机器人进家庭能做的事情都包括哪些?能否举一些例子? 许华哲:分两类。 一类是本身很难的任务, 比如更精细的清洁,比如清洁墙角霉点、擦掉干涸的饭汤、剥橘子、剥虾等等。 另一类是 长序列、多步骤任务的串联。 举个例子,一个完整的洗衣流程是——把脏衣服放进洗衣机、倒洗衣液、启动,然后机器人可以去做别的事,它会在监听到“洗完了”的声音后,把衣服拿出来放进烘干机,启动烘干,最后再把衣服拿出来叠好放进衣柜。 现在的机器人能做任何一个单一步骤,但没有机器人能像人一样,从头到尾,带着这些“任务间的缝隙”把它完成,我认为两年后的机器人能有这个能力。 《智能涌现》:家庭和工厂场景,最大的区别是什么? 许华哲:家庭和工厂某种程度上都是“混乱”的,但是本质上不同。工厂的混乱更多是“管理混乱”,比如东西乱扔、人走来走去,但它具体干的活,比如上下料、装配是高度确定性的。 家里的混乱是任务本身的混乱, 比如衣服是团成一团的,杯盘狼藉需要收拾,这种混乱是需要通过工作去恢复秩序的。工厂的很多混乱并不需要去恢复。所以,这是两种完全不同性质的“混乱”。 《智能涌现》:您认为当前做家庭To C机器人,最大挑战是什么? 许华哲: 机器人进家庭的逻辑和落地To B不同。 To B的账很难算,因为工厂给人形机器人干的活价值很低,一台二三十万的机器人可能相当于一个人三四年的工资,还要考虑可靠性、维护,很难回本。再加上工厂里采集的数据可能过于专化。 To C的账不是简单的“替代人力”计算。它更像 科技潮品+家庭助手+管家 的复合体。用户买它,是购买一种先锋的生活方式、极致的便利,就像二十年前大家买车一样。我们考虑的是,当用户有一笔预算时,是买辆车还是买个能改变生活的机器人。 所以,关键是产品体验要足够好,价值感知要足够强。价格区间我们内部还在讨论,但肯定会是五位数起步。 追求泛化,也是追求美和影响力 《智能涌现》:所以To C并不是您离开星海图后才有的想法,而是一贯的想法? 许华哲:是的。我从小就想做To C,想创业。初高中的时候读《乔布斯传》、《迪士尼传》,读完了就很想创业,做一个像谷歌一样的公司,后来选电子系也是想要做IT,大学还修了管理学双学位,就是为了创业做铺垫。 后面去了伯克利、斯坦福,也是一直在做强化学习和机器人,后来还做了一些触觉相关的研究,也是在机器人大类里。 我博士毕业时(2021年),主要就是找教职还有找投资人聊,看看有没有创业机会,当时普遍观感是,下一代技术还远,这一代技术就是做扫地机、餐馆机器人,但是和AI关系不大,没看到特别匹配我专业技能的创业机会。 《智能涌现》:你判断一件事情做与不做,或者谈论你对某件事是否感兴趣时,你的标准是什么? 许华哲:一个是美,这件事要能给我带来好的审美体验。另一个是影响力,我们学术圈有一个词叫impact追问。 美,更多是个人体验,我做这件事创造出来的东西是优雅、简洁的,就像简单的公式能描述复杂的现象,泛化性的本质也是美;影响力意味着,我做的这件事要能对世界产生足够大的影响,改变人们的生活方式。 现在我们被迫用巨大的参数量来描述世界,是因为我们还没找到AI领域的牛顿定律, 我相信大模型只是一个中间状态。 我的博士生涯是带着“AI一定存在一个优美理论”的心理开始的,但后来发现理论越来越解释不了AI,这是一个痛苦但必须接受的过程。 所以现在我的使命是追求简洁和影响力,如果有另一个公式(而不是AI模型)能描述机器人与世界的所有交互,我会觉得它更好。 《智能涌现》:这次创业你希望找到什么样的合作伙伴?你会更欣赏什么样的公司文化? 许华哲:我对合作伙伴和团队文化有三个核心要求—— 极致: 我很喜欢戴密斯·哈萨比斯那本传记里的描述,里面说,一个人做事要做到什么程度,就像跑马拉松撞线后,有个救护车把你拉走了,但是你最后没死。虽然有点夸张,但是我觉得做事极致投入,永远想更进一步,是很重要的。 坦诚: 对自己、对同事、对事情绝对坦诚。不会因为不会而装会,搞砸了就承认,不要为了面子影响效率。 利他: 公司里有很多“缝隙”,如果每个人都只盯着自己的KPI,这些缝就没人填。对于初创公司,需要每个人在有余力时主动填缝,这种利他性长期看对个人和团队成长都有益。 (作者注:戴密斯·哈萨比斯(Demis Hassabis)是英国著名人工智能科学家、Google DeepMind 联合创始人兼CEO、神经科学家,被誉为“AlphaGo之父”。) 我很欣赏段永平的“本分文化”,也欣赏前段时间一篇报道中提到的,Kimi“没有部门墙”的协作模式,我倾向于弹性、扁平的组织,很赞同黄仁勋、亚马逊那种鼓励一线员工直接向老板直接发邮件反馈问题的文化。 做全新物种的家庭机器人 《智能涌现》:很多To C的机器人是曲线救国,先从陪伴场景切入,但是感觉你们的您的产品路径和其他家很不一样。 许华哲:完全不一样。他们做的是陪伴,核心能力是大模型提供的对话能力和娱乐。我们追求的 核心是物理世界的通用交互和干活能力。 我们的机器人是“家庭助理”,要能实际处理家务,所以在技术上,我们需要非常强的模型能力来保证通用性,但是很多家庭陪伴机器人是没做基础模型的。本质上,我们和他们是两个不同的品类。 《智能涌现》:你们最主要的技术的差异点是在模型侧吗? 许华哲:我们的一大亮点我们的模型能 用好强化学习 。过去机器人对强化学习的使用一般停留在单机的后训练上,但是其实强化学习上有很多自己独特的东西。 第一个就是价值函数(value function)。 价值函数 可以对数据质量进行评估,让模型知道哪些数据好、哪些次优、哪些失败。数据带着权重,去让模型学习。 它带来的好处有两个,一是可以让模型学得更精准,二是可以理解失败的边界,这样模型就能够知道紧邻着成功的失败长什么样,让强化学习去把这些失败因素排除掉; 第二是,强化学习能同时在多个任务上保持高成功率高速度,而不过度拟合到单一任务。 第三是,强化学习也可以突破人类数据上限。以前我们用人采集的数据去做某件事,数据是什么样的,机器人就能做到怎么样的,甚至会更差,因为机器人是跟着数据学习的。 但是强化学习就是根据数据以及后续的自我改进,持续突破自己的上限,最终可能做出比人类示范数据更好的表现,上限更高。 《智能涌现》:你们的强化学习只用在后训练上吗? 许华哲:我们的预训练也会用离线的强化学习。预训练现在还是有一些卡点的,比如说模型的选择上有很多种,市面上有用VLA+VLM的,也有世界模型的,还有VLWAM,就是VLM后面再内嵌一个世界模型。 《智能涌现》:那你们还是用VLA的路线吗? 许华哲:现在模型的路线还远远没有收敛,我们的选择是 世界模型结合原生的机器人模型,不是用VLA的路线。 《智能涌现》:现在的世界模型有很多派别,有的人用的是偏3D视频的方向,有的又是偏向于世界仿真,你们对世界模型的理解方式是什么? 许华哲:我们输入的是视频和动作,在训练和推理的时候,输出的也是视频和动作。这些视频和动作里面是遵循物理规律的真实世界的数据。 《智能涌现》:你们做这些事情的过程中,遇到的最大的挑战是什么? 许华哲:要训练大模型所需的Infra (基础设施)是一个挺大的卡点,因为我们想做一个32B的大模型,要支撑比较大的数据量,GPU 集群的并行效率、数据吞吐都是一个很大的挑战和壁垒。 《智能涌现》:在模型侧你们提到了一项“UAG”架构,这个怎么理解? 许华哲:UAG(Unconditioned Action Guidance)是我们的一种模型训练架构。 相对于传统的瀑布式级联的模型训练方式,我们采用的是一种并联的方式,核心思想是 先对动作进行预训练,然后再对所有的动作做整体联合的训练,做一个动作预测器,然后再将动作预测器和视觉模型一起进行联合训练。 背后的原理是,一个小时的图片、视频是巨大的,但是一个小时的动作很少,可能就是一系列关节的运动,也就是一堆小的浮点数。 这种方式可以最大程度保留基础模型的泛化能力,同时大幅提升训练效率, 估计至少5倍以上。 《智能涌现》:数据也是你们新公司的亮点,你们大概有哪些方案? 许华哲:我们的数据方案主要分三层—— ①外骨骼数据采集: 提着机器人手臂直接操作,精度高,反馈更直接; ②UMI方案: 让人戴一个和机器人手部构型完全一样的“硬手套”进行操作,好处是没有机械臂的负担,采集效率高,数据量大。手套做硬是为了保持和机器人手的一致性,确保人能做的动作机器人都能做; ③第一人称视角人类数据: 在头上戴一个摄像头,记录人日常干活的视频。这是从人的视角(Ego-centric)采集海量自然行为数据。 《智能涌现》:这些采集方式其他家也在探索,你们最大的不同点在哪? 许华哲:采集的数据,表层方法可能相似,但内核有本质不同。比如umi手套是否打磨得足够好,足够通用?采集的数据质量如何保证?以及如何清洗和处理这些数据,提升数据质量? 我们一个很大的不同是,我们会大量使用评估数据,就是机器人自己做测试和探索的时候,自己在动的数据。这样的数据某种意义上是更“差”的数据,因为里面会有失败、会有次优。但是这种“差”其实也是“好”,会让模型更知道任务的目标是什么。 另外,手套的设计细节,比如摄像头位置、佩戴舒适度、是否适应不同手型等等,都需要针对家庭任务精心打磨,我们手套的构型设计是面向家庭任务,追求通用性的。我们会在8月末左右给大家看到我们和现在所有的形态都不一样的数采系统。 《智能涌现》:但是现在出来创业会不会太晚了?现在具身智能行业的融资环境怎么样? 许华哲:市场热度还可以,投资人还是比较有热情的。和之前比,投资人更懂了,大家被市场教育过一轮,所以会问得更细。 关于创业出来是否太晚,我认为——在技术没有收敛的今天,仍然有巨大的机会。同时,因为我们更晚,所以我们的时间压力更小、负担更小,但是各种基础设施比如本体等也更加成熟了。另一方面,走向通用家庭机器人,其实才刚上半场。虽然后发,但是谁能先至,也未可知。 封面来源|企业官方 end

36kr.com · None · tech

文|邱晓芬 编辑|苏建勋 《智能涌现》独家获悉,自变量机器人已经于三月底至四月初完成近20亿元B轮融资,领投方为小米战投和红杉中国。 不久前,美团、阿里和字节分别在A轮、A+轮、A++轮领投或独投自变量机器人。截至目前,自变量已成为国内唯一一家同时被四家互联网大厂投资的具身智能企业。 对此,自变量方面暂无回应。 小米战投在具身智能机器人领域已落子,近两年公开的投资项目包括纬钛机器人(触觉传感)、曦诺未来(灵巧手)、萝博派对(本体)、章鱼动力(模型)。 除了对外投资布局,小米自己的机器人产品也正在快速推进中。不久前,2026年4月,小米机器人CyberOne已进入小米汽车工厂进行真产线实习,核心目标是跑通汽车制造中的柔性装配环节 。 在模型方面,2026年2月,小米也已经开源了视觉-语言-动作(VLA)模型 Xiaomi-Robotics-0。 有知情人士向《智能涌现》分析,不同于行业里“微调开源模型”的选择,自变量是国内极少数坚持完全自研具身智能基础模型的公司,并且一直坚持走端到端路线。 具体而言,在其自研的“WALL-A”模型中,自变量 将视觉、语言、触觉与动作信号,统一映射为一种连续的高维Token序列 。这些统一的语言会被放进单一的Transformer架构中,实现多模态联合输入与同步输出。 自变量联合创始人、CTO王昊去年年底接受《智能涌现》采访时曾表示,这种原生多模态的统一表征方式,有助于减少跨模态传递时衍生的信息损失问题,不仅能让机器人更直接感知物理世界,还能保证机器人在动态环境中实现感知、决策与操作的同步进行。 “‘微调’路线的问题在于,一旦上游不再开源,或者基础模型能力飞跃,可能会导致所有微调工作被颠覆,无法形成数据闭环和规模效应”,王昊表示。 而端到端统一架构,将为具身基础模型的scaling up奠定基础,未来,随着参数规模与高质量交互数据的显著增加,模型的泛化能力,尤其是零样本泛化将得到进一步加强。 在基础技术布局之外,今年以来,自变量在商业化方面也快速推进。 2026年3月, 自变量与58到家合作,推出了首个机器人进家庭的商业化保洁服务 ,将具身智能技术规模化引入民用家庭场景。近期,这一服务将在不同城市分别上线。 未来,依托58到家覆盖全国的“数字家庭场景库”,自变量的基础模型迭代将获取真实、多样化的数据来源,形成“落地即训练”的数据飞轮效应。 据《智能涌现》了解,除了家庭服务场景之外,自变量机器人未来还将进入工业制造、物流到养老场景,推动具身智能技术在真实场景中落地。 end

36kr.com · None · tech

文|邱晓芬 编辑|苏建勋 2026年,AI正在加速从云端落地到端侧。近期,模型厂商和手机厂商都在背后开始发力—— 3月下旬,国内几大手机厂商几乎同时推送了端侧AI的大规模更新,把原本仅限于旗舰机的AI能力下放到中端和千元机市场。自此,端侧AI终于成为大部分智能手机的标配。 到了4月初,谷歌发布开源模型Gemma 4系列,通过架构创新显著降低了端侧AI部署门槛,让AI能力首次真正下沉至手机、IoT等边缘场景中。 尽管当前行业里对端侧AI落地方向的探索五花八门,但众多非共识中唯一的共识是,AI手机依旧是短期内端侧AI最佳的落地形式。 而此前在2025年,在全球AI浪潮下,荣耀已发起了一场转型,从一家智能手机制造商向AI终端生态公司转型,并且计划用五年时间在AI领域投资百亿美金。 荣耀AHI战略 在过去的探索中,荣耀一步步构建起了自己的AI打法——在操作系统侧,荣耀发布了原生、自进化的AI智能体操作系统MagicOS。在AI Agent产品侧,荣耀推出了核心载体YOYO智能体。“YOYO建议”、“一句话打车”,“一句话购物比价”等都是荣耀手机上特色的AI功能。 转型的迫切,也体现在组织管理层面。2025年,荣耀在研发侧重构了组织架构,设立了AI&软件部门,整合操作系统、AI产品、互联网产品等团队,进一步构建荣耀AI核心竞争力。 如果体验荣耀最新的旗舰机Magic V6,可以发现AI手机的体验已经有了本质区别。 在过去,AI在手机上更多是不痛不痒的“问答”功能,而在荣耀Magic V6上,手机逐渐有了向生产力演进的趋势——比如, “AI会议参谋” 功能,能够在会前提醒用户、会中实现AI托管、会后一键生成结构化会议纪要和待办事项等等;在“AI文档智能体”上,用户还可以实现“拍照转文档”,“拍照即编辑”。 AI会议参谋 荣耀MagicOS AI产品专家李向东向《智能涌现》分析,背后反映了未来的AI手机的三个迭代方向。 首先,AI手机将支持Agent自动执行,相当于长出了“手”和“脚”。与此同时,手机是用户最高频使用的硬件终端,AI手机也会有专属的知识库和记忆系统,实现“越用越懂你”。在未来,AI手机大概率是千人千面的。另外,未来AI手机也将支持多模态交互,从过去的语音文字,向视频、照片甚至是具身智能延伸。 在李向东看来,未来AI手机的迭代,也会带来用一场颠覆性的改变,比如人机交互模式、甚至是重构过去手机上的流量分配逻辑。 近期,《智能涌现》与李向东聊了聊他对于AI手机和端侧AI的理解、以及荣耀在AI上的思路,以下是交流实录(略经摘编) AI手机将重构一切 《智能涌现》: 如果概括来讲,你认为未来的AI手机相比目前的手机,最大的不同会是什么? 李向东: 主要有三点根本性变化。首先是 越用越懂你, 手机将会给用户提供高度个性化的服务,AI手机将会是千人千面的。 其次, 人机交互范式从“人适应GUI”转变为“系统主动服务于人”。举个例子, 我们现在的“YOYO建议”,会对你的航班飞行旅程做全流程主动提醒,这就是主动服务的雏形。 最后,未来的AI手机将具备强大的自动执行能力。 AI能像秘书一样,理解用户复杂、级联的需求并拆解任务工作流、自动完成任务,用户只需做选择题或反馈意见。 《智能涌现》: 今年也有很多厂商在水下布局AI手机,你认为2026年这个行业有哪些值得关注的重点趋势? 李向东: 首先是 智能体与自动执行, Agent能力将会与手机场景的深度结合; 其次,AI手机上也会开始强调全局记忆 ,手机将 基于全局的长上下文记忆,落地“越用越懂你”的个性化服务。 最后是多模态交互,AI手机上将 结合视觉、语音、文字的融合交互与服务,比如前段时间荣耀发布了HONOR Robot Phone,它能“看你所看,听你所听”,进行陪伴式讲解并生成总结,这也代表了多模态的未来方向。 《智能涌现》: 在自动执行这个方向,手机厂商在推进中会有难点吗,因为现在大量的用户数据都存在于各大APP里。 李向东: 这确实是个生态问题,不过从客观上讲,这是 终端厂商相比APP厂商和大模型厂商更有优势的地方。 因为APP厂商只知道用户在自家应用内的习惯,而大模型厂商只在用户使用时才能了解需求,但是终端厂商却能全天候、跨应用地理解用户。 我们也在和大型APP厂商推进战略合作,大家的目标都是在保护用户隐私基础上,为用户提供更好体验,实现商业共赢。 《智能涌现》: 但是未来的AI手机可能会重塑手机里现有的流量分配逻辑吗? 李向东: 这是 毋庸置疑的 。当前的商业模式是应用厂商、大模型厂商和终端厂商等,各展所长、共同竞争,相对稳定。 但随着AI的发展,尤其是以用户意图为中心的AI自动执行与主动服务趋势推进,必然会 重塑原有的商业模式和流量分配,各方终将达成新的平衡,重塑过程需要各方探索与磨合。 《智能涌现》: 智能体出现之后有很多厂商在探索AI手机,比如模型厂商、互联网厂商还有手机厂商。不同背景的厂商做这个方向,你认为各自的优劣势是什么? 李向东: 模型厂商的优势在于大模型基座能力、算力和推理技术,对硬件的理解和投入、以及对终端消费行业的积累可能不足。 终端厂商的优势在于对终端消费者的深刻理解、以及积累的海量用户、软硬件一体化的能力,还具备了成熟的消费品操盘经验,但无法像大模型厂商那样去All in基座模型研发。 各方所长、投入焦点不同,大家也会基于自身优势去做融合与合作,共同服务好用户。 一家手机厂商的AI决心 《智能涌现》: 荣耀在AI上一直持续投入,如果要梳理的话,大概可以分为几个阶段? 李向东: 荣耀对AI的深耕可追溯至2016年第一代Magic系列智能手机、Magic Live智慧引擎的诞生。到2020年,荣耀进入AI核心探索阶段。 2020年到2023年,我们是在进行整体的平台级AI部署与AI战略布局阶段,当时我们基于MagicOS 7.0发布了平台级AI,基于Magic Live智慧引擎提供了 基于意图识别的人机交互体验; 2024年上半年,我们发布了MagicOS 8.0及端侧AI能力 “任意门”功能。任意门基于业界首个端侧意图识别框架,允许用户通过简单的拖拽,跨应用快速调取所需服务。也是在这一年,荣耀对意图识别框架和端侧AI四层架构做了清晰定义,用AI重构了 操作系统和端云协同 ; 到2024年下半年,我们已经洞察到了整个行业开始有迈向AI智能体的技术趋势,开始探索智能体帮用户自动执行任务的功能; 到2025年,我们 全面迈向智能体和AI自进化 ,不仅发布了我们基于端侧的AI智能体三层架构,还发布了最新的魔法家族大模型。 从2020年到2025年,荣耀完成了整个AI技术底层架构、核心战略的奠定,近期OpenClaw和Hermes智能体的热度,也印证了荣耀在技术路径上投入的价值与前瞻性。 《智能涌现》: 从产品的层面,我们发现在新发布的荣耀Magic V6上,AI的体验上好像比以前更丰富了,比如会有很明显的AI个性化服务,和用户也有了更深的情感链接,好像更《HER》了。 李向东: 是的。在荣耀Magic V6上,我们精准瞄准了 目标人群。 我们经过调研发现, 他们的核心痛点是高频会议与文档处理,所以我们打造了完整的AI会议参谋体验,包括会前提醒、会中分人转写与实时总结、还有会后自动生成精准纪要和待办。 另外,我们还针对目标人群推出了文档智能体,让纸质文档可以一键转成可编辑文件。 还有,我们针对投资人群做了“AI情报官”,用户可以在手机上定制信息主动推送,这些都基于真实场景解决了用户痛点。这背后本质的理念是, 让AI从玩具变成了生产力工具。 《智能涌现》: 荣耀也完成了从手机厂商向“AI终端生态公司”的转型,体现在架构上,荣耀去年也成立了专门的AI一级部门,把AI提到很高的战略高度。在这个部门出现的前后,荣耀在做AI上有哪些主要区别? 李向东: 区别还是很显著。在成立前,AI是操作系统部门下的二级板块,主要聚焦OS内的智慧引擎和AI平台。 成立后 ,打通OS、AI、互联网、生态等关键模块,在AI上的投入更聚焦、更系统化。 《智能涌现》: 为不同硬件匹配不同的AI功能,有没有一些例子? 李向东: 以我们的 旗舰机荣耀 Magic V6为例,其算力强、配置高,是打造AI核心竞争力的重点。我们会将行业前沿方向,如智能体(Agent)自动执行、全局记忆、多模态交互等,集中在旗舰机上使能和发力。 对于 中低端机型 ,用户核心诉求是流畅、不卡顿、长续航。我们也提供了一套 系统级的轻量化AI Native解决方案。 这套方案重构了OS,通过AI技术让系统更轻量化,从而在芯片和存储相对有限的中低端手机上,也能实现接近旗舰机的流畅丝滑体验。这项能力也提升了大量中低端机型用户的体验和用户黏性。 《智能涌现》: 荣耀如何决定某一个AI功能做与不做,背后的决策逻辑是什么? 李向东:我们的核心逻辑从“AI能做什么”转向“AI应该做什么”, 根本目标是让AI“越用越懂你”,更好地服务用户。所以我们具体围绕三个方向布局: 首先是针对不同硬件产品的目标用户需求,规划功能。比如,我们为荣耀Magic V6的商务人群打造了 “AI会议参谋”和“文档智能体” 的功能; 其次,我们也围绕核心AI产品“YOYO”作产品拓展, 目标是让用户实现“万事找YOYO”; 最后,我们也将AI Agent深度融入MagicOS,实现主动服务和自动执行,如 YOYO建议、任意门。 我们会舍弃那些 用户使用复杂、频率不高、学习成本高 ,或当前AI准确率不足、需要大量三方适配的功能,追求AI与产品、用户需求的紧密结合,提供闭环、好用的体验。 《智能涌现》: 你们做了不少有特色的AI功能,比如任意门等等。你们内部会如何评估某一项AI功能是否真正为用户提供了真实价值,也就是现在大家常说的PMF(产品市场适配度)? 李向东: 这是我们擅长的领域。我们拥有成熟的To C消费品评估体系,具体会分三个层面操作: 首先,针对不同硬件,我们前期会针对目标人群的核心场景去规划功能,并通过用户共创、以及后调(如用户满意度)来做验证。 其次,针对核心AI产品“ YOYO”,我们采用的是互联网产品快速迭代模式,比如A/B测试、用户反馈、日活等维度,来评估AI功能的表现; 最后,针对MagicOS的原生AI体验,我们在系统级应用中注入AI后,比如闹钟、任意门等功能,我们也会持续观察用户使用率、满意度和留存率。通过分层分级的验证体系,我们会确保AI功能能真正解决目标用户痛点。 手机厂没做“豆包手机”,不是能力不够 《智能涌现》: 我很好奇你怎么看待“豆包手机”? 李向东: 豆包手机是一次 重要的行业探索, 它的亮点在于打通系统底层能力,实现了泛化的跨应用的Agent自动执行和后台任务处理。 同时,它的成功也有特定背景,包括基于手机厂商的合作,获取系统级权限,并以不计成本的大模型及算力投入打造标杆场景。 《智能涌现》: 手机厂商一直在讲AI手机的故事,但是也有很多人提出疑问,为什么类豆包手机不是手机厂商最先做出来? 李向东: 其实类似于豆包手机的想法我们很早就考虑过,目前还没有商用落地。主要是 终端厂商考虑问题的逻辑不同。 手机厂商的立场首先是 保证用户体验, 我们面向海量用户,必须确保功能的稳定、闭环和普适性,任何体验上的瑕疵都可能引发大规模用户不满。 其次是成本考量。 当海量用户高频调用AI服务,Token的成本是终端厂商必须考虑的可持续性问题。对于大模型厂商而言,AI产品走向规模化时,也必然面临成本压力,未来可能转向限次使用或付费模式,进而影响用户体验。 所以,类豆包手机最早不是由手机厂商做出来,这不是能力问题,而是 商业逻辑和对用户体验的标准及要求不同。 尽管豆包手机的探索具有启发性、小龙虾全球爆火,但AI发展刚刚开始,远未到终局。 《智能涌现》: 系统级的GUI Agent路线,会是AI手机未来的雏形吗? 李向东: 它是一次很重要的探索,但它不一定是最终形态,因为它目前仍是基于APP来执行,但未来AI Native的系统和手机, 可能会打破当前APP的格局 ,转向用户所需即服务的模式。 举个例子,未来用户订机票可能不再需要打开特定APP,只需说出需求,AI在理解用户意图及偏好后,直接呈现机票信息卡片,让用户决策付款,对于用户来说,无需关心服务来自哪个应用。我认为这可能是一种更长远的形态。 《智能涌现》: 你认为OpenClaw的出现对AI手机产生了什么影响? 李向东: OpenClaw的火爆验证了智能体Agent与自动执行的价值,其实,荣耀也一直在布局这个方向,比如我们打造了荣耀龙虾宇宙“YOYO Claw”,它可以支持手机控制荣耀PC、Pad等跨设备部署,或三方云、三方设备部署的小龙虾进行任务执行,实现生态养虾,并注重安全性。 OpenClaw的出现说明行业正从“AI问答”阶段进入“AI自动执行”阶段, 这正是我们关注的核心方向。 《智能涌现》: 现在也有很多厂商在探索手机之外的全新品类,你认为未来的核心入口硬件可能会具备什么重要的特点?以及你更相信什么品类最终能胜出? 李向东: 目前确实是 百花齐放、共同探索 的阶段,我认为一个成功的AI Native终端��类,必须具备的特点是能高效且低成本解决用户核心痛点,具体而言可能具备三个特征—— 首先它是能够做到物理世界与数字世界感知的融合, 具备摄像头、麦克风等传感器后,实现多模态感知,并可以做到拟人化交互。比如,HONOR Robot Phone可以在用户逛博物馆的时候,摄像头看到文物,就可以给用户进行拟人化的讲解。 其次是具备 长上下文记忆与个性化预判,会 基于用户历史习惯提供个性化服务; 最后,是具备 自动执行与主动服务能力, 能跨设备、跨生态执行用户的要求。 现在手机仍然是AI的核心载体,其他设备多为手机的辅助,端侧AI探索的方向还没收敛。 但最终哪个形态能胜出, 取决于其提供的AI智慧化体验能否在价值层面实现跨代领先。 《智能涌现》: 到现在感觉各家手机厂商在AI上的做法都不太一样,但也慢慢形成自己的特色和打法了。你会怎么评价荣耀在AI手机浪潮中的身位和战略? 李向东: 其实本质上具体的AI功能只是“相”,是一个外在呈现,如果比喻成一颗大树,这些只是差异化竞争的一个“枝干”,但本质大家还是要考虑 AI与终端结合将给用户带来什么核心价值。 荣耀的主航道非常清晰,沿着 主动服务、Agent自动执行、个人知识库、多模态交互 这几个方向持续发力,迭代沉淀,我认为只要坚持沿着创造用户价值的主航道前进,就能笑到最后。 《智能涌现》: 我们两年前和手机厂商的高管聊,大家会说AI还没有真正撬动用户购机,到现在这个情况有变化吗? 李向东: 出现了积极变化。前几年,AI更多是卖点而非买点,但从2025年开始,经过我们的新机用户调研, AI已能进入购机考量因素的TOP 4,在部分机型中,比如荣耀Magic V5、Magic V6,甚至已经进入TOP 3。 这得益于我们将AI特性聚焦在目标用户的核心痛点和场景,并做到了体验闭环。当然,目前在一些机型中,排名第一的购机因素可能仍是硬件特性,如折叠屏的轻薄、长续航,但AI已成为越来越重要的决策因素。 封面来源|企业官方 end end