谁来啃下全球汽车制造业“[最后15%难题”

  更新时间:2026-01-21 06:22   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

因此第二个维度是任务因此行业已大量采用专用自动化设备

<p class="f_center"><br></p> <p id="48ODBM7H">出!品|虎嗅科)技组</p> <p id="48ODBM7I">作者|陈伊凡、李一飞</p> <p id="48ODBM7J">编辑|苗正卿</p> <p id="48ODBM7K">头图|视觉中国<br></p> <p id="48ODBM7M">“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「42」篇文章。</p> <p id="48ODBM7O">在上海或深圳的任何一家现代化新能源汽车超级工厂里,都能看到这样一种充满讽刺意味的“技术断层”景象。</p> <p id="48ODBM7Q">在冲压、焊接和涂装车间,成百上千台巨大的工业机械臂,以微米级的精度在火花飞溅中翩翩起舞,将自动化率推向了近乎完美的99%。然而,当你进入总装车间,画风突变——这里依然是人类的主战场。数以百计的工人像工蜂一样围着流水线,在狭窄的车厢内弯腰、下蹲,进行着插接线束、拧紧螺丝、安装内饰等繁琐操作。</p> <p id="48ODBM7S">这就是困扰全球汽车制造业的“最后15%难题”。 在这里,自动化率断崖式下跌,从99%骤降至不足15%。对于传统的工业机器人来说,一根柔软线束的随机晃动、一个螺丝孔位的微小偏差,都是无法逾越的认知天堑。</p> <p id="48ODBM7U">这是一个被视为“灯下黑”的工业痛点,如今成为了光象科技战略推演的起点,这正是光象科技要解决的问题。</p> <p id="48ODBM80">2024年夏天,中国风投界正沉浸在人形机器人的巨大泡沫中,许多创业者都在向投资人兜售“通用大脑”的故事。</p> <p id="48ODBM82">创始人兼CEO张涛和他的联合创始人李升波坐在投资人的对面,在叙述和推演中,他们亲手推翻了那套通用具身大脑或平台的叙事初稿。“我们判断,人形机器人的真正落地,可能还要十年。”</p> <p id="48ODBM84">这种推演,是张涛从自动驾驶行业十年沉浮中提炼出的血泪教训。过去十年自动驾驶的发展道路,不乏先驱折戟沉沙的故事,也诞生了特斯拉这样的破局者。</p> <p id="48ODBM86">当年,自动驾驶概念方兴未艾,Waymo等公司一上来就瞄准了L4、L5级别的完全无人驾驶(Robotaxi),试图一步到位地解决所有长尾问题。然而,为了追求极致的安全与泛化,这些公司陷入了无休止的模块化堆叠与安全冗余设计的泥潭,导致成本高企、落地遥遥无期。</p> <p id="48ODBM88">后来者的特斯拉,选择了一条看似升维的路径:从L2级别的辅助驾驶(NOA)切入。NOA距离无人驾驶更远,但它是一个在当时技术能力与用户体验之间找到最佳平衡点的产品。正是通过在L2层面的大规模落地,特斯拉积累了宝贵的数据,反过来推动了技术向L4的演进。</p> <p id="48ODBM8A">张涛认为,当下的具身智能行业正处于自动驾驶十年前的那个十字路口,试图一步到位,极有可能重蹈Robotaxi的覆辙。光象科技选择了一条“特斯拉式”的渐进路线:避开双足人形机器人的机械复杂性,避开家庭场景的非标混乱,转而切入一个既有足够复杂度、又能实现商业闭环的垂直场景——汽车制造。</p> <p id="48ODBM8C">张涛有一张具身场景落地的四象限分析框架。</p> <p class="f_center"><br>张涛的四象限图<br></p> <p id="48ODBM8H">传统的工业机器人停留在“标准环境+简单任务”的左下角,而光象科技的目标是从这里出发,向“标准环境+复杂操作”的右上角进军。</p> <p id="48ODBM8J">张涛认为,在工厂场景中,真正的痛点在于那些需要手眼配合的柔性作业,比如在狭窄空间内精准地将异形接插件推入接口,这才是“智能化”区别于“自动化”的根本所在。</p> <p id="48ODBM8L">而承载这一智能化的核心,是一个叫做GOPS的平台,是一个针对具身机器人的模型构建系统,也可以理解为一套机器人的“养成系统”,有了GOPS平台之后,机器人可以快速学会一个新技能,也可以高效的把一个技能直接复制到下一家车厂。</p> <p></p> <h5>场景选择的方法论:一张四象限“战略图”</h5> <p id="48ODBM8O"><strong>虎嗅:2024年你们开始筹备的时候中国的具身智能特别火,但那个时候你们选择落地工业场景,尤其是先从汽车制造入手,有没有经过一些讨论?为什么没有选择一些更热门的人形机器人赛道?</strong></p> <p id="48ODBM8Q"><strong>张涛:</strong>我们判断,完全通用的人形具身智能机器人,其真正落地的周期并非市场预期的三五年,而至少需要十年以上。</p> <p id="48ODBM8R">这一判断源于我们在自动驾驶领域的过往经历。回顾自动驾驶的发展历程,从概念兴起、资本涌入到创业潮爆发,初期焦点都集中在L4、L5级的Robotaxi上。但经过约十年的发展,行业对技术路径产生了分歧:是渐进式地从L1、L2过渡,还是一步到位做L4?市场检验表明,直接从L4切入并非最优解。</p> <p id="48ODBM8S">那些一上来就主攻L4的公司,为满足安全要求,在模块化策略和兜底方案上投入了巨大资源,这反而阻碍了他们探索真正可泛化的技术路径。而这条路径,恰恰是被特斯拉探索出来的。特斯拉并未直接做L4,而是先推出了NOA(导航辅助驾驶)。</p> <p id="48ODBM8T">在我们看来,NOA是自动驾驶发展史上极具里程碑意义的产物。因为它在当时的技术能力与用户体验之间,找到了最佳的产品匹配点。自动驾驶所追求的全场景通用与泛化,其技术难度绝非两三年能攻克,确实需要十年甚至十五年的长周期积累。</p> <p id="48ODBM8U"><strong>虎嗅:工厂场景中,上一波非大模型的人工智能已经落地了很多工业机器人,加入大模型之后,会有什么不同?有带来什么根本性的变化吗?</strong></p> <p id="48ODBM8V"><strong>张涛:</strong>首先需要厘清一个概念:传统工业机器人属于“自动化”范畴,而我们现在做的具身智能属于“智能化”,两者存在本质区别。</p> <p id="48ODBM90">自动化的核心在于“预编程”。 它要求将工艺流程拆解并预设动作,机器人仅需机械地重复指令。因此,其核心指标是“重复定位精度”。但这一模式存在两大瓶颈:一是难以执行复杂的动作组合;二是缺乏抗干扰能力,一旦环境或操作对象发生细微变化,预设程序便无法应对。</p> <p id="48ODBM91">智能化的核心在于“实时感知与反馈”。 它能基于实时观测到的环境与对象状态,动态调整操作。从技术原理上讲,自动化属于“开环控制”,而智能化则是“闭环控制”,这是两者的根本差异。</p> <p id="48ODBM92">未来的工厂形态不会是智能化完全取代自动化,而是自动化、智能化与人工长期并存。目前的工厂中,自动化与人工占据主导,智能化占比极低;未来的趋势是自动化比例将维持稳定,智能化将大规模替代目前的人工岗位,仅保留少量必要的人工环节。</p> <p id="48ODBM93">虎嗅:团队的大部分成员都有自动驾驶经验,但反而我们没有选择自动驾驶这个场景。</p> <p id="48ODBM94">张涛:这个问题很简单,核心在于时机。如果在2024年或2025年再成立一家新的自动驾驶公司,从现实角度看,几乎无法生存。</p> <p id="48ODBM95">这主要基于两点原因:第一,自动驾驶的资源与人才聚集期早在十年前。那时入局,才能获取足够的资源支撑至今;而今天,无论是资本市场还是客户,都不会再给新公司这样的机会窗口。</p> <p id="48ODBM96">第二,自动驾驶与具身智能存在本质差异。自动驾驶的目标场景非常集中(如道路交通),这种高度集中的属性必然导致市场向头部少数几家公司集中。</p> <p id="48ODBM97">相比之下,具身智能则是另一套逻辑:首先,处于早期阶段,机会更多。当前具身智能在技术路线和商业模式上均未收敛,大家都在探索通向未来的通用方案,这意味着市场充满了挖掘空间。</p> <p id="48ODBM98">其次,场景多样,难以垄断。我们判断,具身智能未来不会像自动驾驶那样高度集中。因为其应用场景极其多样,且单一场景的成功不只依赖某项单一技术。</p> <p id="48ODBM99">具身智能的落地形态不局限于人形机器人,很多场景并不需要人形。更重要的是,要在垂直场景中通过具身智能产品创造价值,竞争要素是多维度的:不仅要有模型智能和本体硬件能力,还需要对场景特性的深度认知、软硬件的精准匹配,乃至商务渠道等非技术能力。</p> <p id="48ODBM9A">这些综合因素决定了,在众多的垂直场景中,每个领域都有可能诞生一两家站稳脚跟的公司,未来不可能有一家公司能够垄断所有的具身智能场景。</p> <p id="48ODBM9B"><strong>虎嗅:决定做具身之后,又是如何推演,决定从汽车制造的场景切入?</strong></p> <p id="48ODBM9C"><strong>张涛:</strong>我当时自己画了一张四象限图,这个图的核心是回归具身智能的本质。具身智能本质上就是“智能体在某种环境下完成某项任务”,基于这个核心,我们把具身智能按两个维度拆分。</p> <p id="48ODBM9D">我将分析维度拆解为“环境”与“任务”两轴。</p> <p id="48ODBM9E">第一个维度是环境,我们把环境分为标准环境和非标环境。标准环境就像结构化道路、工厂这类场景;而形态各异的家庭、野外则属于非标环境;第二个维度是任务,分为移动和操作两类不同任务。</p> <p id="48ODBM9F">画完之后能看到,四象限左下角对应的是当前已经相对成熟的机器人应用,比如工业机器人、扫地机、AGV这些。这类应用的特点是,通常在简单、标准化的环境下,完成移动类任务或非常简单的操作类任务。而我们做具身智能,核心是希望从四象限的左下角往右上角推进,也就是逐步过渡到非标环境,同时攻克复杂的操作类任务,这是我们未来的核心方向。</p> <p id="48ODBM9G">但具体怎么选场景,我们主要从技术维度判断,核心是两个层面:一方面要寻求技术突破,比如过去做移动类任务,现在要向操作类任务突破;另一方面要考虑短期内落地的可能性,不能让技术面临的挑战过于复杂。</p> <p id="48ODBM9H">举个例子,环境是非标的,任务又非常复杂,最典型就是家务场景,家务场景的落地必然需要较长周期。</p> <p id="48ODBM9I">我们认为更好的选择是一个维度是——要么在标准化场景下做复杂操作,要么在非标环境下做简单移动。</p> <p id="48ODBM9J">前者最典型的就是在工厂里做柔性作业,比如装配、上料这些;后者比如野外无人机救援、扫图、搜索等。这两个方向既能保证较好的落地可能性,又能推动技术进步,是比较务实的选择。</p> <p id="48ODBM9K">当然,如果资金和信心足够,一上来挑战最难的也可以,但我们觉得这更适合大厂,对一家创业公司而言不够务实。</p> <p id="48ODBM9L">选择汽车场景首先是因为我们确实有深厚的汽车行业背景,但这只是其中一个方面。在深入布局汽车场景之前,我不仅调研了汽车制造,还花了大量精力考察了3C制造、芯片制造、零部件制造这些工业场景,最后判断汽车制造是更好的选择。</p> <p id="48ODBM9M"><strong>虎嗅:芯片制造和零部件制造的场景为什么不适合具身智能切入?</strong></p> <p id="48ODBM9O"><strong>张涛:</strong>芯片与零部件制造的特点是对象复杂度相对较低,因此行业已大量采用专用自动化设备,覆盖了80%甚至90%的制造流程。既然绝大部分工序已通过自动化解决,具身智能若重复介入则毫无意义;而剩余10%-20%的“边角任务”虽然有价值,但技术实现难度极高。</p> <p id="48ODBM9P">以芯片厂为例,通常是一人看管多台设备,工人的职责包括辅助上下料、质量抽检及设备故障处理等。若此时投入机器人,或许能分担一半以上的简单工作,但对于设备故障排查这类需要灵活决策与精细操作的核心任务,机器人暂时无法胜任。</p> <p id="48ODBM9Q">这就导致了一个商业悖论:生产商引入了机器人,却无法真正替代人工,原有工人依然无法撤离产线。无论从成本控制还是生产协作角度考量,这种投入都不划算。</p> <p id="48ODBM9R">汽车制造的优势在于,首先,汽车是非常复杂的消费终端,会拆解成上百项甚至上千项工艺。</p> <p id="48ODBM9S">经过几十年的发展,汽车制造工艺已经相对成熟,并且自然形成了合理的工艺划分。它会把能靠自动化解决的问题集中放到一类工艺里,这类工艺全是机器人操作,不需要人工介入;而自动化做不到的部分,就全部留给人工,不会出现人和机器人频繁穿插协作的问题。</p> <p id="48ODBM9T">另外,即便是留给人工的部分,也做了很好的工艺拆分,比如产线明确了每个工人在一个工位上的作业时间和任务,这些任务相对标准化,很适合用机器人替代。</p> <p id="48ODBM9U">这种清晰的工艺边界与高度标准化的任务属性,恰恰为具身智能机器人的前期落地提供了最理想的土壤。</p> <p id="48ODBM9V"><strong>虎嗅:决定从汽车场景切入做垂类具身这件事之后,团队做的第一件事情是什么?是找融资、搭团队还是研发?</strong></p> <p id="48ODBMA0"><strong>张涛:</strong>不是,最早做的是把场景摸透。大概两到三个月左右我们自己以及早期团队成员会进驻车厂,扎根在车厂里面,跟车厂的工艺人员、质量人员、规划人员做充分的沟通交流,把这个场景里所有工位的现状、任务、性能、工艺参数、环境约束所有信息都收集起来,再做充分的梳理。然后基于梳理的结果,判断我们到底要做一款什么样的机器人,解决什么样的问题。</p> <p class="f_center"><br>光象科技的团队在现场进行实验和调试 图片由张涛提供<br></p> <p id="48ODBMA6"><strong>虎嗅:这两到三个月里,大家从一线观察回来后有哪些是你们之前没想到的问题?</strong></p> <p id="48ODBMA7"><strong>张涛:</strong>我们在深入一线调研后,发现了两个意料之外的关键洞察,彻底改变了我们对汽车制造场景的刻板印象:</p> <p id="48ODBMA8">第一,自动化率存在巨大的“结构性断层”。外界普遍认为汽车制造是自动化程度极高的红海场景,整体自动化率确实达到了70%。但如果将四大工艺拆解来看,冲压、焊接和涂装的自动化率均已超过95%,唯独总装环节的自动化率呈现断崖式下跌,不足15%,部分产线甚至仅有5%到10%。虽然我们直观上知道总装环节用人多,但未曾预料到这一落差会如此巨大。这更有力地证明了总装环节是具身智能最大的增量市场。</p> <p id="48ODBMA9">第二,复杂的人工操作具有极强的“技能收敛性”。总装车间工位密集(通常单条产线约300个工位),我们最初担心每个工人的操作千差万别,机器人难以全面替代。但在具体分析了上千项工艺后,我们发现这些繁杂的工作其实具有极强的共性。经过归纳,覆盖这数百个工位所需的机器人核心技能,最终可提炼为不超过十项。</p> <p id="48ODBMAA">这意味着,我们不需要为300个工位开发300种机器人,只需掌握这十项通用技能即可。这种意料之外的任务聚焦特性,极大地降低了技术落地的复杂度,为智能化改造提供了切实可行的路径。</p> <p id="48ODBMAB"><strong>虎嗅:这种判断其实也需要你们对大模型的能力边界有一套很明确的benchmark,你们内部的benchmark是什么?</strong></p> <p id="48ODBMAD"><strong>张涛:</strong>我们会先明确场景里的核心挑战是什么,汽车装配中有两类占用工时很高的典型操作,一类是“拧紧”,简单说就是拧螺丝;另一类是“插接”或者“卡接”,包括线束、结构件、内饰、橡胶件等等的插接、卡接,这两类就有明显差异。</p> <p id="48ODBMAE">先看拧紧,这是个非常精细的动作。要完成汽车装配中的拧紧,需要先有拧紧机构,再配合一套能精细调整机构姿态、方位、力度、力控的模型。</p> <p id="48ODBMAF">在评估这一场景时,我们首先判断执行机构的成熟度。幸运的是,传统自动化设备中通过伺服机构驱动的拧紧枪已经非常成熟。</p> <p id="48ODBMAG">因此,我们的落地策略不是重新发明轮子,而是选择直接沿用成熟的伺服执行机构,将其控制权交给智能化模型。通过模型来精细调整机构的姿态、方位和力度,再配合机器人的通用运动能力,即可快速形成可行的落地方案。</p> <p id="48ODBMAH">换一个场景——插接或卡接操作,难度就大很多了。首先要明确末端执行机构的形态:用夹爪、吸盘,还是灵巧手;不同的操作对象需要不同的末端执行机构,比如单说插线束,汽车里的线束接插件型号很多,有长有圆,还要考虑力度、尺寸、形状,目前甚至找不到一款通用的执行器能精准抓住这些接插件并且能清晰感知接插过程中的力反馈。这种情况下就不只是模型的问题,还需要设计适配的终端执行器,甚至不同的插接场景可能需要不同的执行器。如果用通用灵巧手来做这件事,当前灵巧手的力量和感知能力又不足以完成通用化任务。最终会受到多方面制约:感知受限、操作能力受限、模型能力也受限,这件事就会变得非常复杂。</p> <p id="48ODBMAI">因此,插接场景面临的是感知受限、执行受限与模型受限的三重制约。解决这类问题,单靠大模型是不够的,必须同步进行末端执行器的硬件创新,系统复杂度远超拧紧操作。</p> <p><br></p> <h5>拒绝“搬箱子”的虚假繁荣</h5> <br><p id="48ODBMAJ"><strong>虎嗅:在通用具身领域,数据是很大的瓶颈,尤其是和物理世界交互的过程中,这个方向面临数据问题是怎么解决的?</strong></p> <p id="48ODBMAK">张涛:工业场景里的数据问题尤其麻烦,因为这个场景下几乎没有现成数据。不像家务场景,还能从网上找些视频或操作数据,这也是最大的挑战。</p> <p id="48ODBMAL">目前解决数据问题有几类方案:一是合成数据,通过仿真生成数据;二是遥操采集数据;三是用动捕捕捉人的操作数据,还有看视频提取数据等等。</p> <p id="48ODBMAM"><strong>虎嗅:我们选择了哪条技术路线?</strong></p> <p id="48ODBMAN"><strong>张涛:</strong>我们目前采用的是融合方案,没有单一依赖某一种数据来源,而是把仿真合成数据和遥操数据结合起来用。</p> <p id="48ODBMAO">但从长期来看,我们认为在汽车制造这类工业大制造场景下,仿真合成数据是更有价值的数据来源。原因有两点:一是工业场景的操作对象本身就有非常精细的三维数模,精度很高,我们可以直接用这些数模构建仿真数据来源;二是工业场景里的对象形态一致性比较好,大部分是刚体,不像家庭场景有毛巾、衣服、流体等多种柔软体、流体,对仿真引擎的精度要求更友好。所以我们更倾向于多使用仿真数据。</p> <p id="48ODBMAP">但就目前而言,单独用仿真数据还是有较大问题,因此会把仿真数据和真实场景的真机遥操数据配合使用。目前是按一定比例搭配,未来希望让仿真数据发挥的作用越来越大,真机数据的占比越来越小。</p> <p id="48ODBMAQ"><strong>虎嗅:为什么是仿真数据要占比更高?</strong></p> <p id="48ODBMAS"><strong>张涛</strong>:其实核心是仿真数据和真机数据在数据分布上的差异。这一点大家也经常提到,工业仿真和真实场景的差异性小一些,但差异依然存在。差异可能来自几个方面:一是模型建得不准;二是仿真引擎本身能力受限,当然还有其他各类原因。</p> <p id="48ODBMAT">我们的天然优势能让这两方面的差异变小,但变小不代表没有,所以差异是客观存在的。不过我们也在积极探索解决办法,比如如何在这个场景下建立更准确的仿真模型,如何与仿真引擎做好配合,以及在模型训练时如何通过最优的随机化去覆盖这些差异的影响。通过这些手段尽可能减小仿真与真实场景的差异,但这需要一个过程。</p> <p id="48ODBMAU"><strong>虎嗅:工业场景包括汽车领域的具身或机器人应用,不少厂家其实都在尝试。我们在收集这个行业的数据,他们也可以收集这个行业的数据,大家都说自己有行业数据,那我们的竞争壁垒是在哪里?</strong></p> <p id="48ODBMB0"><strong>张涛:</strong>我觉得还是有一些差异的。首先是他们是否按照真实落地的思路在做这件事,还是仅仅作为宣传pr的手段,这两者在方法和结果上有本质区别。如果是面向落地,那么汽车的背景就非常重要,只有真正懂汽车,理解汽车制造,才能做出有价值的技术和产品。</p> <p id="48ODBMB1">另一方面,车厂本身是否愿意跟我们做充分的配合,这其实也是一个比较大的挑战。因为这是一个非常前沿的事情,意味着在前期对车厂而言,它并不会从中获得什么真正的受益,反而会占用它的资源。这可能就需要利用我们在行业里的一些资源或渠道,才能跟他们达成紧密的配合。</p> <p id="48ODBMB2">其次,要做成这件事还是需要依赖较强的技术能力,尤其是端到端模型的能力。今天真正把端到端模型在自动驾驶等领域做成、做好的,其实并没有多少。</p> <p id="48ODBMB3"><strong>虎嗅:现在看到有很多公司也在做汽车制造场景的具身机器人,他们做的怎么样?怎么看这样的竞争?</strong></p> <p id="48ODBMB4"><strong>张涛:</strong>实话说,目前行业的现状是“演示(Demo)热闹,落地(Deployment)为零”。我们走访了国内绝大多数车厂,反馈非常一致:至今没有看到任何一家具身智能或人形机器人公司,能真正进入产线、跟上严苛的生产节拍。</p> <p id="48ODBMB5">过去汽车制造场景相关的PR内容里能看到一些特点,那些视频里,机器人几乎都在做搬箱子的动作。</p> <p id="48ODBMB6">但这恰恰暴露了当前通用人形机器人的窘境。首先,搬箱子属于物流环节,规模化的物流早已被AGV、AMR或无人叉车解决,遗留的线边搬运等任务又不需要专人完成,所以做这个对核心制造(如质量提升、效率优化)的价值贡献较低;其次,大家扎堆展示搬箱子,是因为更有价值的精密装配工作,他们目前的机器人根本做不了。</p> <p id="48ODBMB7">根本原因在于“通用人形机器人”与“汽车制造场景”存在严重的不适配, 这主要体现在两个方面,首先是构型鸿沟(硬件层面),双足人形并不适合工厂。汽车制造要求连续工作4-8小时,双足机器人仅维持站立就高耗能,续航是硬伤;再加上双足行走的稳定性与定位精度远不如轮式底盘,导致其在工业现场“既不耐用也不好用”。</p> <p id="48ODBMB9">其次是模型鸿沟(软件层面),汽车制造对可靠性、节拍和效率的要求极高。而目前的具身大模型更多强调自主决策与泛化能力,却缺乏工业级的精度与响应速度。这种“聪明但手慢”的模型,无法通过产线的验收。</p> <p id="48ODBMBA">综合这些原因,目前具身智能在汽车制造场景的落地情况并不理想。而我们的差异化优势就在于,我们是一家兼具前沿模型能力和汽车工业背景的具身智能公司,无论是本体设计、模型设计,还是训练方案,都会和场景做深度匹配,确保所有技术能力都具备场景know-how,最终做出真正能落地的产品,而不是把一款所谓的通用机器人直接放到场景里,看它能做什么。</p> <p><br></p> <h5>极致效率背后的“平台思维”</h5> <br><p id="48ODBMBB"><strong>虎嗅:你之前在阿里高德待过,有商业化落地的经验,过去的工作经历中,哪一段对您影响更大?这段经验,会不会有一些方法论或者know-how可以运用到这次创业当中?</strong></p> <p id="48ODBMBC"><strong>张涛:</strong>帮助确实比较大。比如我读研究生时做的是导航方向,进入阿里高德后也做导航,但两者差异很大。</p> <p id="48ODBMBD">我们在导航领域处于行业头部位置,在高效、极致效率的产品落地方面做了很多探索。举个例子,当时我们要对接国内几乎所有车企,一年下来有将近几百个车型或项目需要落地。如果每个项目都投入大量人力去适配,成本根本不可估量。所以这里的核心是B端打法和思路。</p> <p id="48ODBMBE">首先要做好用户分层,什么样的用户投入什么样的资源,用标准化产品、定制化产品还是其他形态满足需求,这是很重要的战略判断。</p> <p id="48ODBMBF">其次,我们要靠自己的产品形态引领用户迭代更新,而不是完全被动响应用户的零散反馈,有自己的主线产品路线,路线迭代方向要与用户需求匹配。</p> <p id="48ODBMBG">第三,平台能力建设特别重要,就是能不能用一套极致效率的平台实现极致效率的交付。当时我们投入了很重的研发资源,花了两年左右时间打造了一套平台,能做到只用四个研发人员,一年就能交付几百个项目。</p> <p id="48ODBMBH"><strong>虎嗅:因此你们要做GOPS平台。</strong></p> <p id="48ODBMBI"><strong>张涛:</strong>我们最终要通过端到端模型化的方式实现刚才说的智能化,这里的关键就是怎么高质量高效率的训练出场景可用的模型,并且在不同产线不同工位间快速迁移,GOPS平台核心就是解决这个模型构建问题的。</p> <p id="48ODBMBJ"><strong>虎嗅:这是你的第一次创业吗?</strong></p> <p id="48ODBMBK"><strong>张涛</strong>:不是,我之前也做过一次创业,时间稍微早一点。跟汽车整车的电子电器有关系。</p> <p id="48ODBMBL"><strong>虎嗅:那段创业经历有没有印象比较深的事情?</strong></p> <p id="48ODBMBN"><strong>张涛:</strong>当时我们做的事情其实就是今天特斯拉这套集中式的电子电气架构。只不过我们当时做这件事的时候还太早,虽然判断对了方向,但除了我们能把技术做出来之外,整个市场环境和上下游供应链都没准备好。</p> <p id="48ODBMBO">大概十几年前,中国汽车制造的状态可以总结为“大而不强”,整车厂在这个模式里,其实缺少对核心技术、核心零部件以及其他核心技术能力的掌控,更多依赖供应商,尤其是国外的头部供应商,话语权比较弱。所以由整车厂主导的电子电器架构变革在需要供应商适配时遇到很大的阻力。</p> <p id="48ODBMBP">后来特斯拉把汽车的这套体系完全重构了一遍,这跟我们之前的思路其实非常一致。一方面是特斯拉引领了这个趋势;另一方面,现在的整车厂话语权也越来越强,能够推动供应商做相应的改动,在这种情况下,我们当年想做的事就变得越来越可行了。</p> <p id="48ODBMBQ"><strong>虎嗅:把这件事的经验迁移到现在做的具身智能项目上,怎么判断技术生命周期的发展,进而规划在产业化起飞前几年提前介入的?</strong></p> <p id="48ODBMBS"><strong>张涛:</strong>这件事的经验和我们现在做具身智能的思路有很大关系。比如,我们一上来不选择完全通用的人形机器人或通用具身大脑的路线,就是受这个经验的影响,如果要十几年后才能成,现在就投入所有资源去做,很可能会走不到最后。</p> <p id="48ODBMBT">一方面要考虑短期内实现商业闭环迭代;另一方面,在商业闭环迭代的过程中,我们的技术路线、积累的数据和技术,又能支撑我们未来走向通用具身智能的时代,这就是我们现在做的事。之所以选择工业场景落地,同时又把大量精力放在GOPS平台建设上,核心就是这个原因。这个平台的作用,就是吸收我们当前落地过程中所有的数据和技术,为未来做通用具身智能这个长期目标做支撑。</p> <p class="f_center"><br></p> <p class="f_center"><br></p> <p id="48ODBMC5">本文来自虎嗅,原文链接:https://www.huxiu.com/article/4828093.html?f=wyxwapp</p>

编辑:孙亚军