文 / AI小荷尖角 · 智能的物理真相 系列④
一、春晚舞台:从“伴舞”到“主角”,宇树科技的飞跃
2026 年央视春晚,最震撼的瞬间并非来自人类舞者,而是来自一群机器人。在节目《武bot》中,宇树科技(Unitree Robotics)的 G1/H2 人形机器人集体亮相,上演了一场精彩的武术秀。
它们不再是笨拙的陪衬,而是绝对的主角:
高难度动作:连续360°后空翻、单手倒立旋转、甚至完成了高难度的“鲤鱼打挺”。
群体协同:18台机器人动作同步率高达99.9%,落地误差控制在厘米级,没有任何一台摔倒或卡顿。
环境适应:在舞台灯光、地面光滑的复杂环境下,依然稳如泰山。
回顾宇树科技一年间的快速飞跃,让人震惊:
2025 年:人形机器人 H1 登台,能走能跳,还能旋转手帕,但动作略显僵硬,需要预设轨迹,甚至下场时需要人来搀扶,被戏称为“提线木偶”。
2026 年:G1/H2横空出世,不仅动作流畅如人类武者,更具备了实时动态平衡能力。
仅仅一年时间,它们从需要搀扶下台的笨重模样,变成了实实在在的武术大师。
除了宇树科技,今年春晚也有银河通用、松延动力等多家公司的参与。但这份光鲜背后,藏着行业尚未突破的诸多困境。特斯拉 CEO 马斯克近期指出的三大核心难题,正是这些困境的写照。
二、光鲜背后:具身智能的真实现状
打开B站,小红书,随便搜下“宇树春晚同款机器人”,瞬间就将我们拉回了残酷的现实。在春晚上大放异彩的机器人,实际上不具备任何自主能力,无法在真实物理世界中智能行动,需要靠遥控器来操纵。它不具备任何帮助人类生活的能力,甚至可能需要人类来“照顾”。一次不小心的摔倒,甚至可能导致其突发“抽搐”。
现实之中,无论是宇树科技还是松延动力的机器人,看起来更像一个“大号玩具”,其主要用途也多限于商业汇演,距离真正走进我们的日常生活还很遥远。
对比来看,银河通用的机器人虽然没有类人的双脚,但其手的灵活度和操作能力更胜一筹。
马斯克眼中的三大核心难题
春晚的掌声,掩盖不了具身智能行业的现实焦虑。马斯克曾概括了阻碍机器人普及的三座大山:真实世界智能、手的自由度与灵巧性、规模化制造。
1. 真实世界智能:从“预先编排”到“即兴发挥”
什么是真实世界智能?
简单来说,就是机器人面对非结构化环境时的适应能力。
舞台上的机器人:像是在“背剧本”。地面是平的,灯光是不变的,障碍物是固定的。它只需要按部就班地执行代码。
真实世界的机器人:需要“即兴表演”。地面可能有水渍,光线可能忽明忽暗,突然跑出一只猫,或者有人不小心撞了它一下。
目前的机器人缺乏这种“常识”和“泛化能力”。它们无法像人类一样,忽略无关细节,聚焦关键目标,并在毫秒级时间内做出正确决策。没有真实世界智能,机器人就永远只是温室里的花朵,无法在风雨中生存。
2. 灵巧手:被忽视的“最后一公里”
在三大难点中,“手的自由度与灵巧性”常被大众忽视,却是决定机器人能否走进日常生活的关键。
我们可以通过一组对比,清晰看到这种巨大的鸿沟:
| 维度 | 👐 人类双手 | 🤖 特斯拉 Optimus Gen3 | 🇨🇳 宇树 G1/H2 | 🚀 银河通用 (Galbot) |
|---|---|---|---|---|
| 形态路线 | 生物进化 | 双足人形 | 双足人形 | 轮式 + 人形上身 |
| 自由度 (DoF) | 27+ (灵活可控) | 22 (接近人手) | 11–12 (灵活度有限) | 12-15 (专注操作) |
| 触觉感知 | 数百万神经末梢(纹理/温度/湿度) | 电子皮肤 + 六维力传感(分辨率 1mm) | 数十个压力传感器(仅基础力度) | 高精度力控 + 视觉融合 |
| 驱动方式 | 肌腱驱动(柔顺/爆发力强) | 腱绳驱动(轻量化/响应快) | 电机驱动(刚性大/易损物) | 电机 + 谐波减速器(高精度/高负载) |
| 核心优势 | 全能自适应 | 通用移动 + 操作 | 高动态运动能力 | 极致稳定的精细操作 |
核心差距在于:人类的手是“触觉主导”,闭眼也能感知世界;而机器人的手目前仍是“视觉主导”,一旦光线变化或物体被遮挡,就会不知所措。
马斯克曾直言:“手部设计比机器人其他所有部分加起来都难。”因为它不仅需要极高的自由度,还需解决执行器、传感器的小型化与高精度难题。
3. 规模化制造:成本与能耗的博弈
此外,规模化制造也是制约行业发展的关键瓶颈。
成本:目前 Optimus 单机成本约5万美元,宇树 G1 系列控制在10-20万元区间,银河通用要接近70万元,距离家庭普及的“白菜价”差距依然很大。
能耗:高强度表演5分钟的耗电量,可能相当于人类跑步1小时。续航问题,限制了机器人的工作时长和可能性。
除了马斯克提到的三点,小编认为机器人还需要一双“真正的眼睛和耳朵”,能够感知物理世界,并把信息压缩、处理,最终生成与物理世界交互的指令。这样才能拥有真正的智能,而不是依靠预定程序或遥控来“耍酷”。
三、中美对决:宇树科技 vs 特斯拉 Optimus
在具身智能的赛道上,中美两国走出了截然不同的路径。
🇨🇳 中国方案:百花齐放,务实落地
宇树科技(双足路线):
策略: 小步快跑,聚焦场景落地。不追求一步到位的通用 AI,先聚焦商业演出等场景。
优势: 供应链成熟,零部件国产化率超90%,成本控制极强。
现状: 动态平衡能力突出,已实现规模化商用,但在精细操作上仍有差距。
银河通用(轮式路线):
策略: 扬长避短,专注操作。放弃难以攻克的双足平衡难题,利用轮式底盘实现稳定移动,将算力集中在上半身灵巧操作上。
采用「双足+轮式」的方案。本质上是都是在用更确定的工程路径,换取 更快进入真实场景、尽早跑通应用闭环。
优势: 在物流分拣、实验室自动化等场景中,操作精度和稳定性远超双足机器人。
现状: 成本较高,主要面向 B 端高端市场,是“专用型”具身智能的代表。
🇺🇸 美国方案:特斯拉 Optimus
策略:愿景先行,聚焦通用智能。
核心打法:依托FSD的海量数据,训练通用“大脑”,追求极致的泛化能力,试图从根本上解决真实世界智能难题。
核心优势:算法先进,Optimus Gen3手部已达22自由度,能完成系鞋带等精细操作,灵巧性领先。
现状:仍处内部测试阶段,量产推迟,成本高企(约2万美元),规模化制造是最大短板。
四、升华总结:当机器人突破瓶颈
人类的未来将走向何方?
春晚的《武bot》表演落幕了,但具身智能的浪潮已不可逆转。
当前,机器人仍受困于三大难点,暂时只能在特定场景发挥作用。但我们可以大胆畅想,一旦这些难题被逐一突破,人类的社会图景将发生前所未有的改变。
这种变革将重塑劳动力市场:短期内,重复性体力劳动将率先被机器人接管;中期随着成本优势确立,蓝领岗位将面临结构性替代;长期来看,人类将从繁重劳作中解放,转向更高难度的价值创造,从而彻底重写“工作”的定义。
具身智能的发展,可能是“机器人取代人类”的战争,也可能是人类与“硅基劳动力”共存的新开端。
当前的瓶颈是挑战,也是契机——它倒逼我们重新思考教育的本质、分配的制度,也让我们有机会重新定义自身的价值。
欢迎留言讨论:
你认为未来的人类还需要工作么?普通人的价值在哪里?
AI小荷尖角 · 智能的物理真相 穿透喧嚣,看见真实 关注我们,一起了解AI的方方面面。
本文首发于公众号「AI小荷尖角」:原文链接
-------------本文结束,感谢您的阅读-------------
评论列表
发表评论