黑料吃瓜在线-黑料正能量网-黑料爆料不打烊入口
  • 黑料吃瓜在线-黑料正能量网-黑料爆料不打烊入口
  • 网站首页
  • 安博电竞
    企业简介
  • 产品展示
    产品一类
    产品二类
    产品三类
    产品四类
  • 新闻资讯
  • 成功案例
  • 安博体育APP
主页 > 成功案例 >

2025实体智能行业年度回顾:从先锋亮相到理性进

发表时间:2025年12月29日浏览量:

撰文:Vicky 编辑:陈茜 智能体是2025年最大的“泡沫”吗?年初,玉树突然迈出了一大步,发布了售价5900美元的R1人形机器人。要知道,就在一年前,业界普遍认为人形机器人的最低成本仍为2万美元至3万美元。玉树此举等于直接违背了整个行业的价格预期。紧接着,Figure AI的估值从2024年的26亿美元增至390亿美元,增长了15倍。投资者名单就像科技界的奥斯卡奖:微软、OpenAI、Nvidia、贝佐斯、英特尔、三星。资本市场疯狂押注实体智能的未来指日可待。但与此同时,特斯拉号称生产了 5,000 辆 Optimus,但实际上只组装了约 1,000 辆,然后就按下暂停按钮并进行了重新设计。马斯克大胆宣称“特斯拉80%的价值将来自“我的擎天柱”在现实面前显得有些尴尬,这一冷一热,确实有点让人摸不着头脑。智能已经进化到什么程度了?本文将从算法、硬件、数据、资本、主要玩家路线等几个方向为大家一一讲解。01什么是具身智能?为什么会在2025年爆发?在讨论行业现状之前,我们先来明确一下什么是具身智能。如果说ChatGPT是一个“能说话”的AI,那么体现智能就是一个“能做”的AI,它的核心是VLA,Vision-Language-Action,视觉-语言-动作模型,它把三个东西整合到一个神经网络中:视觉:看到当前的场景;语言:理解工作的目的和感知;行动:发出具体的控制指令。有什么不同来自传统机器人?例如,传统的工业机器人就像一个演员,只能说出固定的台词。你对它进行编程并一步步执行;但具身智能机器人更像是一位懂得即兴创作的艺术家。它了解环境的变化并能独立做出决策。例如,如果你要求它折叠毛巾,传统机器人每次都需要将毛巾放在完全相同的位置。但内置的智能机器人会识别到:哦,这次毛巾又皱又歪,那我调整运动轨迹,毛巾还是可以折叠的。 Dyna Robotics是硅谷一家炙手可热的具身智能公司。它成立仅一年。目前其A轮融资已达1.2亿美元,融资金额达6亿美元。投资者包括英伟达。 “折叠毛巾”任务是第一个让 Dyna 出名的演示。 York Yang Dyna Robotics 的联合创始人 VLA 简单的意思就是我们使用 VLM模型的大领域作为“主干”(核心),但是当我们最终输出结果时,我们将这个结果转换成可以在机器人领域使用的动作。对动作的直观理解是,比如我想把这条手臂移动到某个坐标点。其实大家对VLA诟病最多的是:为什么需要L(Language,意为“语言”)?因为过去很多传统的机器人算法都是纯粹基于视觉的。但如果你仔细想想,你的大脑实际上会创造出类似语言的东西来告诉你在一项长期任务中第一步要做什么,第二步要做什么。 L的作用是针对一些非常复杂的任务,它可以用大语言训练很多逻辑对象(来处理)。例如,如果你想喝水,它会知道你需要找到一个杯子或瓶子。这是大型语言模型可以直接提供给你的东西。使用VLA的主要目的是为了更好地整合语言和视觉。否则,如果你只有Vision,你能做的任务只能是短期的,你无法做任何需要推理的长期任务。所以这就是我们如此专注于引入语言组件的主要原因。这是一次质的飞跃:机器人不再是执行固定程序的机械臂,而是可以通过视觉-语言-动作的集合来理解、计划和适应的智能体。嵌入式智能并不是一个新概念。为什么到了2025年就突然爆发了?这有三个原因。首先,大模型本身正在成熟。无论是OpenAI还是其他公司最近发布的大型模型,能力的提升更多的是在增量演进中可见,而不是早期从GPT-3.5到GPT-4的跨越式跳跃。在此背景下,大模型的通用能力已经稳定,足以作为embedde可靠的核心能力层d 智能系统。 ChatGPT 证明大型语言模型能够理解复杂的指令并做出推理规划。这组功能可以转移到机器人上:你说“帮我准备早餐”,它可以计划一个多步骤序列,例如“先取鸡蛋,然后打鸡蛋,然后煎鸡蛋”。其次,算力价格再次减半。随着芯片厂商不断推出性能更强的新一代芯片,等效算力的单位成本呈现长期下降趋势。通常每隔几年,获得相同算力所需的成本就会下降到之前价格的一半。到 2023 年,租用 NVIDIA H100 GPU 的价格仍然很高。如今,云服务的算力价格战愈演愈烈,大型模型的存储成本也大幅降低。以前只有顶级公司才能玩得起的游戏,现在初创公司也能玩了。三、硬件设备应用链已经成熟。机器人硬件部件整体成熟度较高。尤其是在去年仿人机器人热潮的推动下,投入了大量的资金和工程资源用于主要关键部件的研发,包括电机、减速器等关键部件。随着相关技术的不断成熟,成本也随之降低。玉树直接将价格提高到5900美元。目前业界普遍认为在2万-3万美元范围内即可实现规模化生产。成本曲线的急剧下降让商业化不再是幻想。这三种力量的叠加,推动着智能从实验室走向商业化的前夜。但这并不是盲目乐观,而是基于技术成熟度的理性判断。那么,目前嵌入式智能的能力边界在哪里,它能做什么? 02今天机器人能做什么?章2.1 可以做什么我们先来说说可以做什么:在工业和商业场合已经有实际应用。折叠毛巾和衣服看起来很简单,但Dyna的机器人可以在24小时内折叠700条毛巾,成功率高达99.4%。现在,它已成为酒店和洗衣房真正的生产力。他们的主模型包含各种场景数据,例如切割蔬菜和水果、食物准备、早餐清洁和物流分类。在宝马集团的宝马工厂,mFigure 的 ga 机器人使装配和物料搬运变得简单。 Agility Robotics 的 Digit 在仓储和物流场景中移动箱子。 1X还将向瑞典巨头EQT交付多达10,000台1X Neo人形机器人,该机器人将主要用于制造、仓储和物流等工业场景。更不用说亚马逊已经部署了 100 万台专业机器人,几乎超过了其 156 万员工的数量。这些不是演示,它们是真实运行的商业项目。就是“理性前行”——不求全能,但求实用。第2.2章:目前有哪些任务正在克服但尚未实现,以及领先企业目前正在解决哪些任务?示例:一项相对困难的任务,例如做早餐。这是一项“长期工作”,需要计划多个步骤:取食材、切菜、摆盘、生火、炒菜。每一步都必须精确执行,力度必须控制。你不能用手打破鸡蛋或切蔬菜。 Dyna 的最新演示表明,它已经克服了制作早餐的长期任务。图中还展示了两台机器人协同工作的演示,一台机器人负责运送工具,另一台机器人负责操作。家用是有用的,但是稳定性还是不行,最难的是做家务。灯光的变化、家庭成员的摆放位置e 具有固定照明、固定物体位置和标准化流程的“非结构化环境”的所有挑战。但家是一个完全不同的故事。而且作业还有一个致命的要求:零容错。机器人在工厂里分解零件,损失得到控制。打碎碗或伤害屋内某人属于意外事故。自变量机器人CTO 王浩 例如,机器人在执行任务时,桌布上有一个小皱纹,你的杯子可能不稳定,可能有一个透明物体反射光线,它只是干扰相机等等。人们实际上可以根据直觉和丰富的经验立即适应这些微小的物理变化。然而,由于它们是高度数据驱动的,大规模的AI模型很难适应,它会感受到这些新的挑战。因此,机器人进入家庭的技术门槛高于机器人进入家庭的技术门槛。演员。但这并不意味着它遥不可及。 York Yang Dyna Robotics联合创始人我们认为第一阶段肯定是我们目前正在开发的一些市场,比如商业服务和商业用途的一些人工部分,就是和人一起完成一些任务,比如一些情况。但我们觉得家庭使用确实已经不远了,不需要一个完整的、多功能的AGI。您可能只需要一些工作即可进入家庭场景。先让机器人在房子周围工作,然后通过迭代模型逐渐让它发展出更多的能力。 Siyempre, kung ang a只要我们的硬件成本在普通家庭能够承受的范围内,我们就可以优先考虑。比如我会先把叠衣服的功能卖给家庭,然后再逐步拓展一些其他的功能。所以这个时间线应该不会太远,大概1到2年左右。这就是“逻辑开发”——而不是等待机器人b成为科幻电影里的全能管家,在上市之前,都是从明确用户真正需要的功能开始,逐步迭代。 03虽然2025年的技术突破会面临很多挑战,但2025年确实有一些技术突破值得关注。业内人士诚实地告诉我们,每一次突破都不是革命性的,而是真正的进步。 3.1 突破点一:双系统架构流行。许多公司已经开始采用所谓的“系统1+系统2”架构。系统1是“快速思维”,负责反射性动作,例如抓取和移动。其特点是参数数量少、响应速度快。它可能只有8000万个参数。系统2是“慢思考”的,负责复杂的规划,例如“做早餐”等多步骤任务,具有大量参数,可能有70亿个参数。本实验室分部或者类似于人脑:伸手去拿球是一种自然反应,但计划一顿饭需要仔细考虑。图AI的Helix模型就是这种架构的代表作品。他们与OpenAI“分道扬镳”后,在两周内迅速推出了这款自研模型,它创新性地利用单个神经网络控制整个上半身35个自由度,还可以同时控制两个机器人的协作。这个架构的成功证明了基础机器人模型和大语言模型的Scaling Law可以是不同的——并不是越大越好,而是要找到合适的参数分配策略。第3.2章突破点2:合成数据革命 为什么机器人数据如此昂贵?原因很简单:由于人们一天只有24小时,收集真实的运营数据太慢且昂贵。 NVIDIA 的解决方案使用模拟器来生成合成数据。第 780 章11小时内生成000条操作轨迹。相当于 6,500 小时或连续九个月的 pshow 人。虽然合成数据与真实数据存在差距,但至少解决了“数据短缺”的问题。愤怒。但这里有一个重大的技术权衡。 York Yang Dyna Robotics联合创始人因为我们之前和很多构建大型语言模型的人交谈过,他们发现面向语言的数据,即使它使用了大量低质量的数据,比如一堆文本,中间有一个广告,然后是文本,它仍然可以用这些数据训练出更好的模型。因为模型找到足够的数据后,会自动过滤广告。但目前,我们觉得机器人的规模化大部分来自于相对高质量的数据。如果这里包含很多复杂的数据,机器人模型可能不知道我要关注哪里,所以在hagain效果不是那么好。 3.3 突破三:跨机器人属化能力物理智能π0模型和开源OpenVLA模型可以控制不同的机器人。同一套模型或技术可以有效地用于不同形状和硬件配置的机器人,而无需针对每种类型的机器人进行重新训练。这称为跨机器人泛化能力。这很重要。过去,每种类型的机器人都需要单独的训练模型,成本昂贵。现在,一种模型可以适配多种机器人,数据可以共享,成本也显着降低。但技术难点也很明显:不同机器人的动作空间差异很大,手臂长度不同,关节数量也不同。如何通过 mModel 来控制它?能够在完全陌生的环境中工作并不是100%完美,但这是一个很大的进步。第3.4章突破四:多机协作 图中展示了使用单个神经网络来协调协作两个机器人的协作。创新性地利用单个神经网络控制整个上半身35个自由度,还可以控制两个机器人的协作。听起来很简单,但真的很难。两个机器人必须相互配合,时间、力度、位置都要精确同步。它可能在未来的工厂环境中有用,但仍处于验证的早期阶段。这些技术突破都不是颠覆性的,但每一项都在稳步进步。这就是 2025 年的意义所在:不再进行炫酷的演示,而是继续朝着可验证、可衡量和可操作的方向发展。技术突破是一回事,但行业中还存在一些未翻越的大山。对这些问题的清醒认识对于“理性发展”是绝对必要的,也使目前的具身智能处于大爆发的前夜。 04 未解决的关键问题第4.1章问题1:数据困境 首先是数据困境。 ChatGPT 使用数万亿个代币进行训练,相当于将整个互联网的文本喂给它。但有关机器人操作的数据极其匮乏。谷歌训练了 RT-2 模型,花了 17 个月在真实厨房收集了 13 万条数据。场景泛化能力仍然有限。为什么要计算机器人?收集数据有这么难吗?由于真正的机器人需要在真实环境中工作,每条数据都需要花费金钱和时间,并且错误可能会损坏设备。这不像文本数据,可以通过爬虫检索。因此,大多数基本的机器人模型仍然依赖于少量的真实数据和大量的模拟合成数据来为强化学习/自观察方法提供动力。柯立一明,体智能研究员 如果一个人的寿命假设为100年,我们可以计算为100万小时。我感觉好像没人有100万的数据集据我所知或从我所看到的公开信息来看,狮子小时。这是我的猜测。我认为,当我们收到相当于一个人一生的身体经历的100万小时的数据时,我想我们可以稍后开始探索。如果说数据是机器人的“石油”,那么这口井还没有打完。第4.2章问题2:模拟与真实的差距在虚拟世界中训练机器人非常便宜,并且可以同时运行数以万计的模拟器。但虚拟世界永远不等于现实世界。仅仅因为您擅长赛车并不意味着您实际上可以驾驶 F1。现实世界中的摩擦、柔软度和光线变化过于复杂,模拟只能再现部分真实的物理特性。剩下的就是机器人从模拟器到现实世界的“水土不服”的由来。 NVIDIA 的 Genesis 和 Isaac 模拟器正在努力缩小这一差距,但要完全消除这一差距还需要时间。第4.3章问题3:实施例间隙 人手有 27 个关节,能够感知压力、温度和纹理。好的机器人的手通常只有 15-22 个关节,其传感器也不太复杂。虽然完全模拟了人体运动的轨迹,但效果却是不同的。人类可以轻轻地捡起鸡蛋,但机器人可以用力压碎它们。 York Yang Dyna Robotics联合创始人 首先,如果想要人手和机器人手能够顺利移动,它们需要非常靠近。这就是为什么现在很多人工作效率很高,非常接近人类的自由。这件事本身就是一件非常困难的事情。其次,无论有多接近,都不完全相同。因此,机器人数据和人类数据之间仍然会存在差距。这就是我们所说的体现差距。这种实施例差距在学术界和工业界普遍被认为是一个难以解决的问题。因此,这样的数据传输效率会比较低。甚至如果你收集了很多数据,如果只有30%或50%可用,你的总价值必须乘以可能性的数量,所以这是它的一个明确的限制。这意味着特斯拉使用大型 YouTube 人类视频来训练 Optimus 的方法面临着重大的技术挑战。这就是为什么特斯拉对1000台之后进行了重新设计。理想很美好,现实却很单薄。第4.4章问题4:可靠性 ChatGPT给出了错误的答案,用户只是一笑置之。如果机器人移动不当,可能会弄坏东西并伤人。这是一个质的区别。具身智能在真正进入工厂和家庭之前必须达到非常高的可靠性。该标准比大型语言模型更严格。第4.5章问题5:成本困境 目前,人形机器人的价格需要降至2万美元左右,才能在物流等领域具有足够的吸引力。但价格下降需要大规模生产生产。大规模生产需要大量订单。大订单需要足够低的价格。这是一个循环困境,需要有人先打破僵局。玉树5900美元的定价是打破这一僵局的尝试,但能否引发价格战并带动整个行业削减成本还有待观察。认识到这些困难并不是悲观,而是理性。这是肯定的,因为人们已经认识到初创公司存在这些瓶颈,其中包含在其爆炸前夕的智能。 05关键参与者及技术路线第5.1章硬件巨头:Tesla和Figure 这组公司包括Tesla和Figure。他们的做法是整合软件和硬件来创建数据闭环。特斯拉利用FSD在自动驾驶技术方面的积累,将视觉感知和路径规划能力转移给Optimus,也可能利用工厂的生产线来积累数据。前工程设计博士导演米兰·科瓦奇直言:“我们只是从一个带轮子的机器人变成了一个有腿的机器人。”但现实比想象的要复杂。只实现了5,000套目标的五分之一,重新设计不得不暂停。这表明,即使像特斯拉这样的老牌企业也必须在体现差距面前低头。图与OpenAI“决裂”后,独立开发了Helix模型,掌控了自己的技术路线。两周内推出的 Helix 型号表明他们拥有卓越的技术。 15倍的估值涨幅也证明资本市场认可这条路线。但他们只在商业上部署了几十个。该演示非常令人兴奋,并且规模扩大仍在进行中。第二个流派就是我们提到的Physical Intelligence和Skuid AI。第5.2章 AI公司:PI和Skild AI与众多同时押注硬件的机器人初创公司不同。这些公司的策略是模型优先和跨平台适应。物理智能的π0模型不依赖于特定的硬件,可以适应不同的机器人。他们的逻辑是:首先提升模型的能力,然后硬件才能选择最优解。另一个是 Skild AI,这是一家致力于构建基本机器人模型的软件公司。 Skild AI的主要方向也是创建一个与特定机器人形态无关的通用基础模型。它可以适应不同的机器人平台和应用。使用场景来适应和定制。今年7月,Skild AI推出了通用机器人系统Skild Brain,并发布了演示视频,展示了该机器人能够完成拾取餐具、上下楼梯等操作。最近,软银和英伟达计划对其投资10亿美元,使其估值达到140亿美元。 5.3 生态平台:NVIDIA、Google 第三类是面向平台谈生态。 NVIDIA 提供模拟器和计算能力基础设施,推出了GR00T N1并开源,但如果你想使用它,你必须使用整个NVIDIA生态系统。 Google持续投入学术研究,RT系列模型影响了整个学术界。他们为整个行业提供“水、电、煤”。谁能制定行业标准,谁就掌握了生态。这三种路线都是渐进的。没有哪一个派别具有绝对的优势;一切都是反复试验、重复和调整。 06 总结与展望 未来还在未来,不远又回到了开头的问题:嵌入式智能是泡沫还是未来?答案是:到2025年,具身智能将从“先锋出现”走向“理性进步”。技术上,大模型+机器人的组合已经成功实现,但还远未成熟。数据的主要问题,概括性ty 和可靠性尚未解决。如果用“GPT时刻”来比喻,自变机器人CTO王浩认为,我们已经到了GPT-2的水平。王浩,自变量机器人CTO,我认为我们处于GPT-2阶段。事实上,我们现在知道扩展它是唯一可靠的路径,所以我们需要在这个阶段徒劳地积累数据,提高模型的规模,同时构建一个真实的、包含的基础设施。我的猜测是,我们将在 1 到 2 年内达到 GPT-3 级别。请注意,这是 GPT-3,而不是 GPT-4。这并不是一个花哨的判断。因为研究人员可以看到这个规模带来的改进,所以路径和目标更加清晰明确。业务方面,行业场景已开始试点,仓储、制造、服务业都有实施案例。但大规模商用可能还需要2-3年。 York Yang Dyna Robotics 联合创始人 我们自己的目标是,明年ear我们希望能够在商业场合有比较大规模的部署。我们将拭目以待,看看是否有时间在家里使用它。这个时间应该不会太远,大概1到2年左右。在投资中,可以说泡沫与机会并存。有的企业价值上涨,有的停产,有的烧光了所有的钱,破产了。开源机器人公司 K-Scale Labs 因融资失败而倒闭,而Figure AI 则拿走了现金并倒闭。同时出现两个极端,说明市场出现分化。虽然具身智力的长期趋势是确定的,但短期变化却是巨大的。而具身智能的第一个“杀手级”应用场景将是什么?可以是家政、仓储物流、或者餐饮清洁服务。而且无论是什么场景,都已经有重磅玩家组织起来。嵌入式智能不是“是否会发生”的问题而是“何时”。 2025 年,我们正处于这场革命的开端。业界不再只是展示炫酷的演示,而是开始验证技术、打磨产品、寻找实地情况。特斯拉的停产并不是失败,而是重新设计,寻找更可靠的路径。 Figure AI 估值飙升不仅仅是资本炒作,而是他们像 Helix 一样取得了出色业绩的事实。戴娜开始叠毛巾。它不是一个小结构,但它积累了数据飞轮并培养了学习模型的能力。物理智能部分开源π0,并不是因为不够开放,而是为了在商业利益和技术共享之间找到平衡点。这种在现有基础上的持续改进无疑是该行业日趋成熟的标志。 2025年,智能产业已从“画饼”演变为撸起袖子做面团。这个馅饼正在以可衡量的方式逐渐成为现实。注:部分图片来源于网络【本程序不构成任何投资建议】【视频播放频道】国内:bilibili |腾讯|视频账号|西瓜|油条|百家帐号 | 36克|微博 |虎秀海外:Youtube 联系我们:[email protected] 【主创团队】 主管 |洪军 陈茜撰稿|Vicky编辑|陈茜编辑|Jacob操作|王子勤孙泽平朱杰 特别声明:以上内容(如有,包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。 注:以上内容(如有,包括照片和视频)由网易号用户上传发布,网易号为社交媒体平台,仅提供信息存储服务。
上一篇:俄罗斯称已控制库皮扬斯克,并正在清理并通过 下一篇:没有了
黑料吃瓜在线-黑料正能量网-黑料爆料不打烊入口

黑料吃瓜在线-黑料正能量网-黑料爆料不打烊入口

  • 广东省广州市天河区88号
  • 400-123-4567
  • [email protected]
手机:13988999988

安博电竞

  • 企业简介

产品展示

  • 产品一类
  • 产品二类
  • 产品三类
  • 产品四类

新闻资讯

安博体育APP

Copyright © 2024-2026 黑料吃瓜在线-黑料正能量网-黑料爆料不打烊入口 版权所有

网站地图

友情链接: