在过去的一年里,具身智能(Embodied AI)与大型语言模型(LLM)并驾齐驱,共同成为了市场瞩目的焦点,而通用机器人领域何时迎来其标志性的“iPhone 时刻”,成为了业界内外广泛探讨的热点话题。拾象团队,作为深度洞察科技前沿的先锋,过去一年中持续追踪并剖析通用机器人及其基础模型(Foundation Model)的演进轨迹,现将我们的研究成果以开源形式呈现,以期为行业贡献一份独特的视角与洞见。
相较于LLM的迅猛发展,通用机器人的进步无疑是一条更为漫长且充满挑战的征途。在这条征途上,那些由明星研究者与连续成功创业者携手打造的团队,凭借其卓越的创新能力和市场洞察力,更有可能获得市场的青睐,从而获取充足的资金与资源支持,加速其研发进程。
值得注意的是,全球顶尖的Embodied AI研究者资源稀缺,这一现状使得该领域的竞争尤为激烈且高度依赖于人才。因此,我们特别对赛道内关键企业的人才储备进行了深入剖析,旨在揭示这些企业背后的智力资本与竞争优势。
在谈及通用机器人领域的佼佼者时,特斯拉(Tesla)无疑是不可忽视的存在。作为AGIX Index组合中的核心成员,特斯拉不仅在自动驾驶系统(FSD)和无人驾驶出租车(Robotaxi)领域取得了显著成就,更在近期于德州Giga工厂部署了两台Optimus-Gen2机器人,实现了自主执行任务的重要突破。这一系列综合布局,不仅彰显了特斯拉在物理世界实现通用人工智能(AGI)方面的雄心壮志,也使其成为了推动该领域发展的关键力量。
综上所述,通用机器人领域的“iPhone 时刻”虽尚待时日,但在明星团队、顶尖人才以及像特斯拉这样的行业巨头的共同推动下,我们正逐步接近这一激动人心的历史时刻。未来,随着技术的不断成熟与应用的持续拓展,通用机器人有望成为改变人类生活方式的重要力量。
01.
行业总结
行业背景
Robot Learning 和通用机器人
Robot Learning,作为人工智能与机器人学深度融合的璀璨明珠,专注于探索机器人如何借助先进的学习算法掌握新技能、适应多变环境的前沿领域。其核心使命,便是驱动机器人自主学习以胜任广泛的决策控制任务,这正是迈向“通用机器人”这一宏伟愿景的关键所在。通用机器人,作为当代科技追求的圣杯,象征着机器人能够像人类一样,在未知与挑战中展现出高度的适应性与灵活性。
相较于传统机器人控制模式,Robot Learning 引领了一场革命。传统方法,依赖于精确建模、细致规划与严格控制的串联流程,虽能在结构化环境中确保机器人运动的稳定与高效,却难以逾越复杂多变、非结构化现实世界的重重障碍。手动编程虽能迅速响应特定需求,但面对多任务、不可预见场景及动态环境的挑战时,其局限性便显露无遗。
正是这些局限性,激发了Robot Learning研究的蓬勃兴起。它借鉴了人类通过持续学习适应复杂环境的能力,旨在赋予机器人同样的智慧与灵活性。在复杂多变的非结构化环境中,让机器人能够自主探索、学习并优化其行为,成为机器人科学领域亟待攻克的核心难题。
近年来,Robot Learning与通用机器人研究从学术象牙塔走向产业前沿,吸引了资本市场与业界的广泛关注。这一转变,得益于一系列标志性事件的推动:2021年8月,Tesla震撼发布Tesla bot,以其前卫的设计理念和对未来的大胆展望,为Robot Learning的应用前景注入了强心剂;紧接着,自2022年末以来,Google陆续发布SayCan、RT-1、RT-2、RT-X等一系列机器人基础模型(foundation model)相关研究成果,不仅深化了理论探索,更为实际应用开辟了广阔道路;而ChatGPT的横空出世,更是激发了全球对AI赋能机器人的无限遐想,微软、Meta等科技巨头纷纷跟进,不仅点燃了市场对机器人领域“ChatGPT时刻”的热烈期盼,也极大地提振了通用机器人技术发展的信心与热情。
综上所述,Robot Learning正以不可阻挡之势,引领机器人技术迈向新的高度,为构建更加智能、灵活、适应性强的通用机器人体系奠定坚实基础。
机器人的 Foundation Model
Robot Learning,通俗而言,正是在深耕机器人领域的“Foundation Model”构建之路。拾象团队自2023年初以来,紧密追踪该领域的最新进展,通过深入分析与洞察,得出了以下核心结论:在high-level层面,机器人技术已经取得了显著的进展,趋近于成熟阶段。这具体体现在感知能力的精准提升、规划策略的智能优化以及自然语言交互的流畅自然上,使得机器人能够更加精准地理解环境、高效规划行动路径,并与人进行顺畅的沟通。
然而,尽管在high-level层面取得了长足发展,当前的主要瓶颈却集中在low-level层面,尤其是manipulation(操纵控制)这一关键环节。操纵控制作为机器人与外界环境直接交互的桥梁,其性能的高低直接影响到机器人执行任务的能力与效率。在这一领域,机器人需要更加精细、灵活且鲁棒的控制算法,以应对复杂多变的物理环境和动态变化的任务需求。
因此,拾象团队认为,未来Robot Learning的研究重点应聚焦于low-level层面的操纵控制技术的突破与创新,通过不断优化控制策略、提升控制精度与稳定性,推动机器人技术向更高水平迈进,最终实现机器人在各种复杂场景下的广泛应用与普及。
机器人 Foundation Model 的定义和特点
机器人基础模型的全景展望与挑战
在机器人技术的宏伟蓝图中,一个集大成者的基础模型正逐步显现,它融合了机器人所需的顶层感知、深刻理解与高级推理能力(high-level),以及底层精细执行、与物理世界无缝交互的控制能力(low-level)。这一模型,不仅是技术深度的体现,更是对机器人全面智能化的一次深刻探索。
泛化性的双重维度:泛化性,作为衡量机器人智能水平的关键指标,具有双重含义。其一,它要求机器人能够灵活适应非结构化环境,准确无误地执行任何复杂指令与动作,展现其环境适应力与任务执行能力。其二,它期望一个统一的基础模型能够跨越硬件界限,无缝适配各类机器人平台,实现软件与硬件的和谐共生。
自然语言交互的桥梁:随着技术的进步,人类与机器人之间的界限正被自然语言交互的桥梁所打破。如今,人们可以像与同伴交流一样,用自然语言轻松下达指令给机器人,这种前所未有的互动体验,极大地扩展了机器人的应用领域与使用便利性,也标志着人机交互进入了一个全新的时代。
Foundation Model for Robotics:学术与产业的共鸣:在学术界,这一领域常被冠以Embodied AI与Robot Learning之名,而在产业界,它则被视为通用机器人软件部分的核心。这一共同语言,不仅促进了学术研究与产业实践的深度融合,也加速了机器人技术向更广泛、更深入的应用场景拓展。
high-level与low-level的并进与瓶颈:近年来,high-level层面的技术进展日新月异,尤其是随着LLM(大型语言模型)scaling law的验证,为机器人智能水平的提升提供了强大动力。然而,low-level层面的控制能力却成为制约机器人全面智能化的瓶颈。为了突破这一瓶颈,科研人员正积极尝试通过多元化的数据(如机器人数据、多模态数据、仿真数据)来优化底层算法,但不同技术路线对数据的需求与配比存在显著差异,导致研究进展不一。
市场热情与理性反思的交织:2023年上半年,无论是学术界还是产业界,都对通用机器人的“ChatGPT时刻”抱有高度期待。Google RT-2的发布更是如同催化剂,引发了通用机器人浪潮的汹涌澎湃。然而,随着时间的推移,尤其是进入第三季度后,市场对于这一领域的看法开始趋于理性。虽然大量创业公司获得了大额融资,新公司如雨后春笋般涌现,但一些早期探索者却遭遇了技术瓶颈,尤其是在low-level问题上遭遇了严峻挑战。
冷静与保守的共识:硅谷的核心研究者与产业巨头开始重新审视low-level问题的复杂性。他们发现,仅仅依靠scaling law和互联网大数据,难以在短期内实现技术突破。相反,现实世界的机器人数据才是推动技术发展的关键。然而,这类数据的稀缺性、收集难度与高昂成本,使得技术进展显得尤为艰难。同时,部分研究者指出,机器人的foundation model需要全新的架构与底层算法突破,才能在现有基础上实现质的飞跃。
长远视角下的理性展望:从时间维度来看,通用机器人的实现可能是一个长期而艰巨的任务。尽管过去一年软件层面的技术进步显著,但距离在家庭或工厂等复杂场景中实现完全通用的目标仍相去甚远。当前许多令人瞩目的机器人demo,大多是在相对结构化的环境中展示,其实际操纵能力与泛化能力仍有待提升。面对这一现实,我们需保持耐心与理性,继续深耕技术,逐步推动机器人技术向更加智能、更加通用的方向发展。
在通用机器人软件领域的探索中,Google与Tesla无疑占据了前沿阵地,但两者在通往通用机器人的路径选择上展现出了截然不同的策略与愿景。
Google秉持的信念是构建一个无远弗届的机器人Foundation Model,这一模型旨在成为跨形态硬件的万能钥匙,无论面对何种场景,都能展现出卓越的通用性和强大的泛化能力。这正是对上文所述机器人Foundation Model理念的深刻践行,旨在通过统一的软件框架,解锁机器人潜能的无限可能。
相比之下,Tesla则采取了一种更为务实且精细化的路径。Tesla认为,一个普适性的Foundation Model虽然理论上能够适配多种硬件,但在实际应用中可能面临稳定性不足、难以达到商业化落地及大规模部署标准的挑战。因此,Tesla更倾向于采取一种软硬件协同进化的策略:首先明确定义硬件规格与产品形态,随后针对这些特定硬件深度定制并优化算法,巧妙融入AI能力。通过这种紧密耦合的软硬件迭代方式,Tesla旨在确保每一款机器人产品都能在实际应用中表现出色,实现技术与市场的双赢。
两家公司的不同路径,反映了它们对于通用机器人未来发展路径的深刻洞察与独到见解。Google追求的是技术的普适性与前瞻性,而Tesla则更加注重技术的实用性与商业化落地。两者虽道不同,却均为推动机器人技术迈向新的高度贡献着不可或缺的力量。
重要问题
除了技术路线和 timing,关于通用机器人还有几个重要问题:
1. 场景
通用机器人领域所面临的核心挑战之一,便是缺乏成熟且刚性需求的应用场景。从技术的视角审视,构建并训练一个能够胜任多样任务的通用机器人基础模型,其基石在于海量数据的滋养。然而,数据的源泉恰恰依赖于大规模机器人的实地部署与应用,这种部署又必须建立在能够充分展现机器人价值、激发市场需求的明确场景之上。唯有如此,才能吸引客户的大规模采购,进而形成数据收集与应用优化的良性循环,这一飞轮方能启动并加速旋转。
自动驾驶领域的成功泛化,为我们提供了宝贵的启示:其背后是汽车出行这一历史悠久、需求稳固的基石场景作为支撑。汽车作为既存且成熟的产品,其市场需求与产品形态均已高度成熟,为自动驾驶技术的快速发展铺设了坚实的道路。
反观通用机器人领域,目前尚缺乏这样一个自然涌现、刚性需求的场景,同时产品形态也处于不断探索与定型的阶段。当前,业界正积极在多个潜在场景中试水,如安防巡检、工厂自动化、家庭与酒店清洁、超市零售的拣货补货,以及药房的自动化配药等,多数企业选择从B端市场切入,以期在特定领域内实现突破。
另一种观点认为,场景的发掘未必非得由机器人企业单独承担。关键在于打造出色的产品定义,提升机器人的智能化水平,同时控制成本,确保市场竞争力。当机器人产品以足够高的性价比进入市场,或许用户自身就能发现并利用其创造出前所未有的、富有价值的应用场景。这一理念强调了市场导向与产品创新并重的重要性,为通用机器人的未来发展开辟了新的思路。
2. 机器人数据
机器人数据匮乏,是制约通用机器人技术发展的一大障碍,尤其是指那些直接反映机器人与现实世界交互的宝贵数据。为了克服这一难题,除了直接将机器人部署至实际生产环境进行使用外,科研人员与产业界还探索了多种创新的数据收集途径,以期在保障数据质量的同时,降低收集成本并提高效率。
人类远程操控(Teleoperation):这一方法允许人类通过远程或现场操作的方式,引导机器人执行任务。在此过程中,机器人能够全面捕捉来自摄像头(camera)的视觉信息、马达(motor)的运动数据,以及执行动作(action)的详细记录。此类方式收集的数据因其全面性和直接性,往往能够带来最佳的训练效果,但相应地,其成本也最为高昂。今年备受瞩目的开源项目ALOHA,便是这一方向上的杰出代表,展示了人类远程操控在数据收集方面的巨大潜力。
通用操控接口(Universal Manipulation Interface, UMI):作为一种更为经济高效的数据收集策略,UMI通过精心设计的接口与手持夹具,实现了对人类操作意图的捕捉与转译。这一过程无需机器人直接观看数据,而是通过算法反推机器人应如何执行相同任务。UMI不仅降低了数据收集的成本,还简化了操作流程,为通用机器人技术的普及与应用提供了新的思路。
纯视觉数据收集:另一种尝试则是通过佩戴特殊眼镜或采用类似设备,仅依靠视觉信息来收集数据。这种方法在学术界虽被认可为一种可行的数据收集途径,但其局限性也不容忽视。纯视觉数据虽然能够捕捉丰富的场景信息,但在缺乏其他传感器数据(如力反馈、运动轨迹等)的情况下,可能难以全面反映机器人与环境的真实交互状态,从而影响训练效果。
综上所述,机器人数据的收集是一个复杂而多元化的过程,需要科研人员与产业界不断探索与创新,以找到最适合各自需求的解决方案。随着技术的不断进步和成本的逐步降低,相信未来机器人数据的收集将更加高效、全面,为通用机器人技术的发展提供强有力的支撑。
3. 多模态对机器人的影响
多模态技术在机器人研究领域的影响深远,其核心价值尤为凸显在多模态理解层面,相比之下,多模态生成技术目前尚未对机器人研究产生直接的显著影响。多模态理解对机器人的革新作用,主要聚焦于视频数据解析的深化,使得机器人能够借助对视频内容的深入理解,汲取知识并习得复杂动作技能。这一趋势正引领着行业前沿,Google与Tesla等科技巨头均在此领域深耕细作,致力于通过融合海量视频数据与少量现实世界数据,共同驱动机器人Foundation Model的训练与优化。
此路径的探索,旨在构建一个能够跨越不同感知模态(如视觉、听觉等)界限,实现深层次、全方位理解的机器人智能体系。若此路径得以成功验证并广泛应用,多模态理解无疑将为机器人Foundation Model注入强大动力,显著提升其环境适应性、任务执行能力及自主学习能力。届时,机器人将能够更加灵活地应对复杂多变的现实场景,实现更高效、更精准的交互与服务,开启智能机器人时代的新篇章。
投资思考
以上是从技术和产业视角进行分析,从投资视角看,我们对机器人重要细分赛道的投资机会判断如下:
1. 通用机器人:
当前,通用机器人行业呈现出三足鼎立的格局,主要可分为以下三大类公司:
-
全栈式解决方案提供商:这类公司不仅深耕于硬件设计与制造,同时也在软件开发领域展现出强大的实力,实现了软硬件一体化的全面覆盖。特斯拉(Tesla)、1X以及Figure等公司便是这一阵营的杰出代表。它们以创新的姿态,推动着机器人技术在硬件创新与软件智能化方面的深度融合,为用户提供了从底层硬件到上层应用的全方位解决方案。
-
软件主导型创新企业:专注于Robotics Foundation Model的研发与优化,或是更加聚焦于软件技术实力的提升,这类公司以其深厚的软件技术积累为核心竞争力。Physical Intelligence等公司是这一领域的佼佼者,它们致力于构建高效、泛化能力强的机器人软件平台,通过不断迭代升级算法与模型,为机器人赋予更强大的智能与灵活性,推动机器人技术向更高层次发展。
-
硬件专长型公司:在此类公司中,硬件实力成为了它们最鲜明的标签。这些企业专注于机器人硬件的设计与制造,不断突破技术瓶颈,提升产品的性能与可靠性。它们凭借在硬件领域的深厚积累,为机器人行业提供了坚实的基础支撑,同时也是推动机器人技术创新与产业升级的重要力量。
这三大类公司各有千秋,共同构成了通用机器人行业丰富多彩的发展生态,推动着整个行业不断向前迈进。
•软硬一体公司:
这类公司怀揣着打造具备通用性、多任务执行能力的机器人愿景,致力于通过自主研发或整合现有硬件资源,融合先进的人工智能技术,实现机器人的智能化升级。它们所追求的机器人形态多样,以人形机器人为主流方向,同时也不乏轮式、四足结合双臂与灵巧手的创新设计,以满足不同应用场景的需求。这样的追求要求团队具备卓越的软硬件综合开发能力,能够跨越技术界限,实现技术创新与应用的深度融合。
从商业模式来看,这些公司聚焦于向B端或C端市场推出集成了智能功能的完整机器人解决方案,旨在通过技术创新引领市场变革,满足多样化的市场需求。然而,这一宏伟目标的实现并非易事,它们当前正处于研究探索的初级阶段,面临着诸多技术挑战与不确定性。
从投资视角审视,这类公司虽蕴含巨大的商业价值潜力,但同样伴随着极高的实现难度与风险。研究阶段的低层次问题尚待解决,且其解决时间难以预测,即便技术瓶颈得以突破,从实验室研究到大规模商业化的转化仍需历经产品定义、场景适配、量产准备、成本控制、全球市场投放(GTM)等多个复杂且耗时的阶段。因此,对于投资者而言,在此阶段介入可能意味着承担较高的不确定性和较低的资本效率。
鉴于此,对于团队而言,除了必须具备坚实的产品创新能力、深厚的AI技术功底、高效的供应链管理能力以及敏锐的市场拓展能力外,强大的融资能力亦成为其在这场持久战中的关键筹码。团队需精准把握资本市场动态,有效沟通项目愿景与潜力,以吸引并维持稳定的资金支持,确保项目能够穿越漫长的研发周期,最终实现从理论到市场的成功跨越。
•纯软件公司:
这类公司专注于深耕机器人领域的Foundation Model研究,致力于构建机器人智能的基石。它们的商业模式独具匠心,通过向硬件制造商或综合型技术企业提供API接口,或采用项目合作的方式,将研究成果转化为实际价值。这类公司的核心团队往往汇聚了来自Google DeepMind机器人团队、斯坦福大学、伯克利大学等全球顶尖Embodied AI实验室与学术机构的精英,他们不仅拥有深厚的学术背景,更具备将前沿理论转化为实践应用的能力。
尽管在科研道路上,这类公司同样面临着诸多挑战与不确定性,包括上文所述的低层次问题、技术瓶颈等,但凭借其顶尖的人才团队与强大的研发实力,它们无疑是解决这些问题的最有力候选者。
然而,与Google、Tesla、Nvidia等科技巨头相比,这类创业公司在资源与基础设施方面可能略显不足。因此,它们不仅需要团队具备出色的融资能力,以持续支撑研发与运营,还需在发展过程中不断加强工程实施与基础设施建设,确保研究成果能够顺利转化为市场可接受的产品与服务。
从投资角度来看,这类公司在美国市场展现出了较高的投资价值。其核心投资逻辑聚焦于人才,即全球顶尖的Embodied AI研究人才。鉴于该领域人才资源的稀缺性,以及美国市场良好的并购环境,随着更多大企业与传统企业纷纷将目光投向Embodied AI领域,这些创业公司被收购的可能性也随之增加。这一趋势与自动驾驶和大型语言模型(LLM)领域的收购热潮不谋而合,为投资者提供了潜在的丰厚回报机会。
• 纯硬件公司:
在这一蓬勃发展的领域中,中国公司以其独特的竞争优势脱颖而出,成为最具活力的玩家群体。科研市场作为目前最为成熟且产品市场契合度(PMF)高的领域,正享受着中国供应链与制造能力的双重红利。得益于这一优势,众多中国公司能够迅速响应市场需求,以高性能与低成本并重的机器人硬件产品,赢得全球顶尖机器人与AI实验室的青睐,实现了技术与市场的双赢。
从投资视角审视,专注于硬件极致优化的公司无疑具备了一定的投资价值,它们通过技术创新与成本控制,构建了坚实的竞争壁垒。然而,要进一步挖掘其增长潜力,关键在于探索并开拓更多元化的应用场景与商业化路径。毕竟,科研市场虽具吸引力,但其规模终究有限,随着市场参与者数量的增加,竞争态势趋于激烈,单个企业所能占据的市场份额面临压缩风险。
此外,国际关系的复杂多变也为部分高价值市场的进入设置了障碍,导致这些市场的规模可能在未来出现萎缩。面对这一挑战,许多原本以硬件实力见长的公司正积极寻求转型,向软硬一体化、综合型企业的方向发展。它们通过加强软件研发、AI技术集成与解决方案创新,旨在提升产品的智能化水平与应用场景的广泛性,从而在未来的市场竞争中占据更有利的位置。
综上所述,对于投资者而言,在关注硬件实力突出的公司的同时,更应重视其拓展新市场、新应用的能力以及向综合型企业转型的潜力,以把握行业发展的长期趋势与投资机会。
2. 特定场景下的非通用机器人
在机器人技术的探索与应用中,通用性与垂直场景化构成了两大并行不悖的发展思路。相较于追求全面泛化能力的通用机器人,专注于垂直场景的机器人展现出了更高的确定性与不容忽视的价值潜力。历史上,手术机器人、仓储机器人、扫地机器人等成功案例已充分证明了这一点,它们虽非通用型设计,却能在特定领域内精准解决实际需求,实现高效运作。
这些垂直场景下的机器人,无需跨越广泛的应用边界,也不必追求形态上的全能性,而是聚焦于某一特定场景,通过深度定制与优化,确保在该领域内达到最佳性能与效果。这种精准定位不仅降低了技术实现的难度与成本,还极大地提升了机器人的实用价值与市场竞争力。
随着AI、LLM(大型语言模型)、多模态等前沿技术的融入,机器人领域正迎来新一轮的变革与机遇。这些新技术的加入,不仅为原有垂直场景下的机器人带来了显著的性能提升与价值增值,如通过AI优化算法提升手术机器人的精准度与安全性,通过LLM增强仓储机器人的智能调度与沟通能力等;同时,也催生了众多全新的应用场景与可能性,如基于多模态交互的家用服务机器人、融合AI与物联网的智能制造机器人等,这些新场景的探索与挖掘,正逐步拓宽机器人技术的应用边界,引领行业向更加智能化、个性化的方向发展。
因此,在关注通用机器人技术发展的同时,我们同样应高度重视垂直场景机器人的创新与升级,以及新技术融入后所带来的场景价值提升与新场景挖掘,这将是推动机器人行业持续繁荣与发展的重要动力。
3. 机器人领域的 Scale AI
当前,机器人Foundation Model的发展正遭遇一个核心瓶颈——机器人数据的匮乏。随着机器人技术的日益受到瞩目,众多企业纷纷涌入这一领域,加速推进研发进程,对高质量机器人数据的需求也随之呈现出井喷式增长。这一现状不仅凸显了数据在推动机器人技术突破中的关键作用,也预示着机器人领域有望迎来类似“Scale AI”这样的数据驱动型创新巨头的崛起机会。
在构建这样一家机器人领域的“Scale AI”时,理想的团队构成需兼具多方面的能力与专长。首要的是,团队中必须拥有精通运营管理的专业人才。他们需具备构建并维护高效数据收集、处理及管理体系的能力,同时擅长人力资源规划与团队管理,确保数据流动的顺畅与团队运作的高效。这类人才的存在,是支撑起整个数据生态稳健运行的关键基石。
此外,团队还需吸纳深刻理解通用机器人技术的研究者。他们不仅要对工业界与学术界的最新动态保持高度敏感,精准把握市场需求与科研前沿,还需具备将这些洞察转化为实际行动的能力,持续跟进并满足来自不同领域的多元化需求。这样的研究者,将是团队在数据收集与应用创新方面的重要智力支撑,推动团队在复杂多变的机器人市场中保持领先地位。
综上所述,一个理想的机器人领域“Scale AI”团队,应当是运营与科研并重的复合型人才集合体。他们将以数据为核心驱动力,不断探索并拓展机器人技术的应用边界,为行业的持续繁荣与发展贡献重要力量。
02.
海外重要公司 Mapping
在当前通用机器人领域的广阔蓝海中,除了Tesla的Optimus项目外,众多企业仍处于相对早期的探索阶段,这意味着整个行业充满了无限可能与待挖掘的潜力。正如前文所述,这一时期的投资决策,往往对创始团队的成员背景给予了格外的重视,视其为评估项目前景与潜力的关键指标之一。
随着通用机器人领域的持续升温,其独特的魅力吸引了众多来自不同领域的佼佼者纷至沓来。其中,不乏在学术界享有盛誉的明星研究员,他们以其深厚的理论基础与前瞻性的科研视野,为行业注入了新的活力与灵感;同时,也有连续创业者的身影,他们凭借丰富的创业经验与市场洞察力,为项目的商业化路径铺设了坚实的基石。
鉴于此,我们对行业内重要公司的核心成员背景进行了详尽而细致的梳理,旨在通过这一方式,更深入地理解这些企业背后的驱动力与核心竞争力。我们相信,通过对核心团队成员专业背景、行业经验及创新能力等多维度的综合考量,能够更准确地把握行业脉搏,为投资决策提供有力的支持。
Tesla
Tesla的机器人团队,无疑是当前业界中综合实力最为强劲、战略规划最为清晰的佼佼者。他们深谙“量体裁衣”之道,坚信一个通用的Foundation Model难以完美适配所有硬件的多样性,因此,Tesla采取了独树一帜的发展路径:先精心雕琢硬件与产品形态,随后依据特定硬件的特性,量身打造并融入AI算法,实现软硬件的协同进化与同步迭代。这一策略不仅彰显了Tesla对于技术细节的极致追求,也预示着其在机器人领域的深远布局与前瞻视野。
Tesla的机器人项目——Tesla Bot,亦被亲切地称为Optimus,正是在Elon Musk的卓越领导下诞生的通用双足人形机器人杰作。自2021年初次亮相以来,Optimus便以其创新的设计理念与宏伟的愿景,迅速吸引了全球的目光。如今,这一项目已迈入第二代,Optimus Gen2不仅在技术上实现了质的飞跃,更在公众面前展现了其令人瞩目的成长与蜕变。
2023年12月,Optimus Gen2首次在公开场合进行演示,其卓越的表现赢得了业界的广泛赞誉。随后,在本月的WAIC大会上,Optimus Gen2再次惊艳亮相,进一步巩固了其在机器人领域的领先地位。市场普遍将Optimus Gen2视为机器人领域的“iPhone”雏形,这不仅是对其技术创新与设计美学的肯定,更是对其未来市场潜力的无限憧憬。
相较于Gen1,Optimus Gen2在性能上实现了显著提升:步行速度提高了30%,重量减轻了10公斤,行走模式更加稳健流畅。这一系列的改进,得益于Tesla团队对执行器与传感器的全面自主设计与制造,以及对机器人双手功能的深度优化。新一代的双手设计,不仅承重能力更强,还能执行更为精细复杂的操作任务,展现了Optimus Gen2在实用性与灵活性上的双重飞跃。
Tesla预计,到2025年,Optimus将正式开启量产之旅,首批超过1000个机器人将入驻Tesla工厂,承担起繁重而精确的生产任务。而更为长远的目标,则是将这款革命性的机器人产品推向个人消费市场,让每个人都能享受到科技进步带来的便利与乐趣。这一愿景不仅体现了Tesla对于未来生活的美好构想,也预示着机器人技术即将迎来的全面普及与深刻变革。
The Bot Company
The Bot Company 是 Cruise 前 CEO Kyle Vogt 在今年 4 月创立的。公司定位是一个针对家庭场景的通用机器人平台,目前正在开发用于做家务的机器人。成立一个月后,公司即完成了 1.5 亿美金融资,投后估值 5.5 亿美金,由 Nat friedman、Daniel Gross、Nabeel 领投,其他投资人还包括 Stripe CEO Patrick Collison,Elad Gil 等。
在The Bot Company的璀璨阵容中,除了来自自动驾驶领域的重量级人物Kyle Vogt担任CEO外,技术核心Paril Jain更是以其在Tesla的卓越成就吸引了广泛关注。作为前Tesla高管,Paril在Autopilot团队中担任了至关重要的角色,负责规划、模仿学习以及强化学习(RL)等前沿领域,为Tesla的自动驾驶技术奠定了坚实的基础。
创始团队的其他核心成员同样星光熠熠,他们大多拥有Cruise、Tesla及世界顶尖学府MIT的深厚背景,成员间不仅专业能力出众,更因多年的并肩作战而建立了深厚的默契与信任。这种独特的团队组合,无疑为The Bot Company注入了强大的创新动力与执行力。
谈及CEO Kyle Vogt,他是一位不折不扣的连续创业者与成功投资者。自2013年至2023年,他引领Cruise成长为自动驾驶领域的佼佼者,并在2016年促成Cruise被通用汽车以10亿美元的高价收购。而在更早之前,他还与伙伴共同创立了Twitch,这一平台最终在亚马逊的青睐下以11亿美元的价格成功易主。作为天使投资人,Kyle Vogt的眼光同样独到,他投资了超过40家初创企业,其中7家已顺利实现退出,展现了其在识别并扶持创新项目方面的非凡能力。
Paril Jain,作为CTO及联合创始人,其职业生涯同样令人瞩目。在Tesla的任职期间(2021年10月至2024年3月),他不仅领导了规划部门,还深入参与了模仿学习与强化学习团队的工作,为Tesla的自动驾驶技术贡献了关键力量。这样的技术背景与实战经验,无疑将为The Bot Company在家庭场景通用机器人平台的开发上提供强有力的技术支持与战略指导。
Figure
基本信息
Figure AI 成立于 2022 年,目标是设计可以应用于人类环境的通用型机器人,让机器人可以执行各种不同的任务,可为制造、物流、仓储和零售等多个行业提供帮助。
CEO Brett Adcock 是一位连续创业者,有 20 年的创业经验,在过去 15 年中一直在创建软件和硬件公司。2022 年,在上一家公司 Archer 在纽交所上市 9 月后,Brett 创立了 Figure。
Figure 目前有 80 名全职员工,团队成员主要来自波士顿动力、Tesla、Google、Standford、Lucid、Apple、IHMC 机器人实验室以及丰田等顶尖企业和高校。
产品
Figure公司矢志不渝地追求着开发能够执行广泛通用任务的机器人的宏伟目标,并已自豪地推出了其先进的人形机器人产品。
这款人形机器人以其卓越的规格参数令人印象深刻:重达60千克的坚固身躯,却拥有惊人的20千克有效载荷能力;身高设定为便于交互的5英尺6英寸;以及高达1.2米/秒的灵活移动速度,确保了其在各种环境下的高效作业。更令人赞叹的是,其单次运行时间长达5小时,为长时间任务提供了可靠保障。
尤为值得一提的是,该机器人展现出了超凡的负重能力,能够轻松举起重达30公斤(相当于约66磅)的物品,这一性能远超美国职业安全与健康管理局所规定的人类员工合法举重的上限——51磅,彰显了其在力量方面的卓越优势。同时,Figure公司正积极研发能够以人类水平精准操作物品的双手,旨在进一步拓宽机器人的应用边界。
在动力系统的选择上,Figure公司独具慧眼地采用了电动马达作为机器人的动力源。这一决策不仅基于电动马达在续航时间上的显著优势,更是为了克服以往人形机器人普遍面临的连续工作时间短的瓶颈。Figure的机器人仅需短短15分钟的充电时间,便能获得1.5小时的工作时长;而充电40分钟,更是能支持其连续工作4小时之久,轻松满足每日8小时的工作需求。此外,该机器人还配备了自动停靠充电功能,确保了能量的持续供应与作业的无缝衔接。
在商业化进程中,Figure公司深谙市场规律与行业差异,精心规划了三大重点行业作为通用机器人开发的战略方向。根据各领域的成熟度与需求紧迫性,公司在产品路线图上设定了明确的优先级。短期内,Figure将重点聚焦于满足2B场景下日益增长的劳动力需求,通过提供高效、智能的机器人解决方案,助力企业实现生产效率与竞争力的双重提升。
1. 初期:2B 场景劳动力
在公司初创阶段,我们将战略性地聚焦于美国那些深受劳动力短缺困扰的企业领域,特别是制造业(坐拥1300万个亟需填补的工作岗位)、物流业(面临200万个岗位空缺)、仓储与配送中心(亟需500万名员工)以及零售业(高达3200万个职位亟待填补)。这些领域不仅是经济活动的核心驱动力,也是自动化与智能化转型的迫切需求点。
尤为值得一提的是,我们已将3PL(第三方物流)仓库确定为首个机器人部署的标杆场景,这一决策基于以下几方面的深思熟虑:
-
环境稳定性:相较于变幻莫测的室外环境,室内仓库为机器人提供了免受风雨侵袭、阳光暴晒等自然因素干扰的理想作业空间,极大地简化了硬件设计的复杂性,确保了机器人运行的稳定性和可靠性。
-
信息结构化优势:仓库环境以其高度的结构化著称,从货物的SKU编号、存放位置、重量、尺寸到运输计划等关键信息均已实现数字化管理。这种信息的透明化不仅便于机器人精准执行任务,还极大地提升了作业效率与准确性。
-
高效的无人化运作:仓库作业流程高度成熟,从货物拆箱到打包发货,每一环节都可通过管理系统发出精确的机器指令实现全程自动化。这种高度的无人化作业模式不仅减少了人工干预,还降低了人为错误的风险,为机器人技术的快速落地与广泛应用提供了肥沃的土壤。
-
迫切的行业需求:仓储业作为全美工人流失率最高的行业之一(流失率高达37%,远超全国平均水平的3.6%),长期面临着缺勤率高、工伤频发等严峻挑战。这一现状不仅严重制约了行业的可持续发展,也为企业带来了巨大的成本压力。因此,引入机器人技术以缓解劳动力短缺问题,成为了仓储业转型升级的必由之路。我们的机器人解决方案正是针对这一痛点量身定制,旨在通过科技的力量为仓储业带来前所未有的变革与提升。
2. 中长期:居家养老服务
在全球范围内,共计拥有约23亿户家庭,而老龄人口数量已攀升至7亿之众,这一庞大的群体对于高质量的居家养老服务需求日益增长。展望未来,我们公司怀抱远大理想,旨在让人形机器人成为人类生活中的得力助手,不仅限于家务琐事的处理,更将涉足跑腿服务等多元化领域。然而,我们必须清醒地认识到,将居家服务作为这一愿景的初始落脚点,尽管愿景美好,却并非短期内实现规模化量产的捷径。
居家服务的复杂性与非标准化特性构成了首要挑战。每个家庭的环境布局、生活习惯乃至个性化需求均大相径庭,这种高度的非标准化使得机器人难以通过简单的“一刀切”方案来适应所有场景。因此,在追求规模化量产的过程中,我们必须面对并克服这一技术与应用上的双重难题。
此外,居家场景中人的存在更是对机器人技术提出了更为严苛的要求。避障技术的精准度与可靠性直接关系到家庭成员的安全,而人机交互的流畅性与自然性则是提升用户体验的关键。同时,考虑到老年人群体的特殊性,机器人还需在安全性方面达到更高的标准,确保在任何情况下都能为老年人提供安全、可靠的服务。
综上所述,虽然居家服务市场潜力巨大,但基于当前的技术水平与市场需求特点,我们公司认为将人形机器人直接应用于居家服务领域并不利于其快速规模化量产。因此,在推进这一长期目标的过程中,我们将采取更为稳健的策略,优先在标准化程度较高、技术门槛相对较低的领域进行布局与探索,逐步积累经验与技术优势,为最终实现人形机器人在居家服务领域的广泛应用奠定坚实基础。
3. 长期:太空经济
公司着眼于浩瀚宇宙的未来,矢志成为太空探索领域的坚实后盾。鉴于太空探索的极端危险性与挑战性,机器人以其卓越的适应性和在恶劣环境下的稳定表现,无疑将成为推动太空经济蓬勃发展、实现大规模劳动力替代的理想选择。尽管这一宏伟愿景尚需时日方能全面实现,但公司已迈出坚定的步伐,向着星辰大海进发。
在商业模式的探索与创新上,Figure 展现出了前瞻性的视野与灵活性。鉴于当前机器人技术的单机成本依然高企,且全面成熟的应用场景尚待开发,公司独辟蹊径,选择了订阅与租赁相结合的商业模式,而非传统的整机销售方式。这一策略巧妙地降低了用户的单次使用成本,使得机器人服务更加贴近市场需求,也更容易被广大用户所接受。
在费用设定上,Figure 精心规划,旨在为用户带来高性价比的机器人服务体验。公司设定的年收费区间为每台机器人5万美元至10万美元不等,这一价格区间不仅与当前一名人类工人的年度成本基本持平,更充分考虑到了机器人远超人类的工作效率与耐力。以一个普通仓库运营为例,假设工人平均时薪为23美元,每日工作8小时,每月工作22天,则年度工资总额约为4万8千美元。而机器人则能以其超过人类两倍的工时,持续不断地为仓库运营贡献力量,尤其是在蓝领工人短缺、薪资水平持续攀升的美国市场背景下,机器人的经济性与实用性愈发凸显,直接激发了市场对于机器人服务的强烈需求。
综上所述,Figure 以其独特的商业模式与前瞻性的市场布局,正稳步迈向太空探索与机器人服务的新纪元,致力于为用户带来更加高效、安全、经济的智能化解决方案。
Figure 融资历史
1X
基本信息
1X 创立于 2014 年成立,开发人形机器人软硬件,机器人拥有近似于人类的能量密度、体型和运动范围,可以在商业安全、零售、物流和医疗保健公司部署,未来将会在消费级部署。
公司发展历史
1X,由挪威创新先驱Bernt Øivind Børnich于2014年匠心创立,最初以Halodi Robotics之名,怀揣着打造通用型机器人以应对全球劳动密集型挑战的宏伟愿景启航。历经数年深耕细作,公司于2018年震撼发布革命性产品——Revo1,这款机器人搭载了全球领先的超大扭矩重量驱动伺服电机,以其独特的低齿轮比设计,精妙模拟人类肌肉的自然运动模式,标志着机器人技术的一大飞跃。
为了进一步拓展全球影响力与技术创新边界,1X于2019年在美国旧金山设立了第二个总部,这一战略举措不仅加速了公司的国际化进程,也为深入探索北美市场奠定了坚实的基础。
进入2020年,1X携手行业伙伴Everon,共同开启了商业应用的新篇章,双方签订了一项重大合作协议,计划在美国众多商业建筑中部署150至250台机器人,执行夜间守卫任务,展现了1X机器人在安防领域的巨大潜力与商业价值。
时间来到2022年,1X迎来了发展的又一里程碑。公司与全球领先的人工智能研究机构OpenAI建立了深度合作关系,标志着1X正式迈入人工智能与机器人技术深度融合的新时代。通过引入先进的语言模型和具体的学习算法,1X的机器人不仅能够精准理解用户以自然语言提出的需求,还能在不断学习与优化中自主执行任务,实现了从“机器”到“智能伙伴”的华丽蜕变。这一突破不仅极大提升了机器人的智能化水平和用户体验,更为机器人技术在更广泛领域的应用开辟了无限可能。
产品
EVE(左)和 NEO(右)
EVE(已上市)
EVE,一款独树一帜的仿人机器人,凭借其独特的双轮行走方式,在物流枢纽与工厂车间等工业前沿大放异彩。它不仅能够深刻领悟自然语言之美,更精通于物理空间的精准导航,现已优雅步入市场舞台。在工厂自动化、制造业后勤支持及建筑安全巡逻等多个维度,EVE均展现出非凡的能力,作为高效助手,它在约70家先锋企业与组织中部署,从容应对搬运重物、开启门禁、订单履行等繁重工业任务,同时在结构化与非结构化环境中穿梭自如,尽显智能风采。
在学习机制上,EVE开创性地采用了观察学习法,通过细致观察人类操作示范,迅速掌握并复制新任务的工作流程,展现了惊人的学习能力。其内置的人工智能引擎更是赋予了它理解自然语言指令的能力,使得人机交互更加自然流畅。借鉴自动驾驶技术的先进理念,EVE的数据收集方式摒弃了传统的编码与预设算法路径,转而采用VR Teleop技术,让操作员引领机器人亲身体验现实世界场景,从而直观评估任务难度与可行性,随着数据量的累积,EVE不断解锁新技能,智能水平日益精进。
在硬件构造上,EVE展现了高度的自主创新能力,其核心硬件组件几乎全由团队自主研发设计。其动力系统采用了一系列创新的无齿轮电机,这些电机在提供强劲动力的同时,有效避免了传统齿轮带来的重量负担与效率损失,实现了与人类肌肉相近的80%力量密度,确保了机器人的灵活性与高效性。此外,定制的内部电缆设计大幅减少了传感器数量,不仅降低了制造成本,更为机器人内部结构优化提供了宝贵空间,进一步提升了整体性能。
在通用性与适应性方面,EVE的设计充分考虑了人机协作的重要性。它能够自主执行巡逻等常规任务,但在遇到复杂或意外情况时,如门被意外阻挡,EVE能够智能地请求人类协助,这一设计不仅增强了其在实际应用中的实用性,更构建了一个宝贵的数据反馈循环,促进机器人不断自我学习与进化,以适应更加多变的环境与挑战。
NEO(开发中)
NEO,一款集尖端科技与人性化设计于一身的双足人形机器人,正稳步穿梭于工作场所与温馨家庭的开发前沿。与EVE的轮式行走不同,NEO以稳健的步伐行走,展现出更加灵活与自然的移动能力。尽管其最高速度与电池续航能力相较于EVE略逊一筹,且身形更为紧凑,但NEO所配备的机械臂却达到了前所未有的高度,赋予了它执行多样化、高精度任务的非凡能力。
在工业领域,NEO以其卓越的安全性能、高效的物流处理能力、精准的制造工艺控制、以及对复杂机械设备的熟练操作,成为了安全、物流、制造及操作等多个关键环节的得力助手。它的智能不仅限于车间与仓库,更承载着对未来生活方式的深刻洞察——长远规划中,NEO将化身为家庭生活中的贴心伴侣,无论是日常的清洁整理,还是为家庭成员提供温馨关怀,都将是其展现价值的舞台。尤为值得一提的是,1X公司正积极探索NEO在辅助行动不便人群方面的潜力,旨在通过科技的力量,为更多人带去便利与希望。
此外,NEO还支持远程操控功能,这一特性极大地扩展了其应用场景与灵活性,无论是远程监控、紧急响应还是跨地域任务协作,都能游刃有余。NEO的诞生,不仅是机器人技术的一次重大飞跃,更是对未来智能生活无限可能的积极探索与实践。
融资历史
Physical Intelligence
在充满无限可能的2024年3月,Physical Intelligence 横空出世,携带着前所未有的雄心壮志——致力于打造一款能够无缝适配所有硬件的通用机器人基础模型(Foundation Model),誓要成为机器人领域的璀璨明星,与OpenAI并肩引领智能革命的新篇章。这家新兴企业不仅承载着技术的梦想,更承载着对物理智能未来无限憧憬的愿景。
Physical Intelligence之所以能够迅速吸引全球目光,其核心优势在于其汇聚了行业顶尖的精英团队。其创始人Sergey Levine,作为robot learning领域公认的领军人物,以其深厚的学术造诣和前瞻性的创新思维,为公司的技术研发注入了不竭的动力与灵感。他的加入,无疑为Physical Intelligence奠定了坚实的科研基础与行业影响力。
在资本市场的热烈追捧下,Physical Intelligence成功完成了首轮融资,募集到了高达7000万美元的巨额资金,这一壮举不仅彰显了市场对公司潜力的高度认可,更为其未来的发展注入了强大的资本动力。此轮融资的估值更是达到了约4亿美金的惊人水平,充分展现了Physical Intelligence在机器人领域的巨大潜力和广阔前景。
此次融资的领投方为Thrive Capital,这一知名投资机构以其独到的眼光和卓越的业绩,为Physical Intelligence的发展提供了强有力的支持。同时,OpenAI、Sequoia Capital、Khosla Ventures、Lux Capital等业界巨擘的纷纷跟投,更是为Physical Intelligence的未来发展增添了无限可能。这些顶尖投资机构的加入,不仅为Physical Intelligence带来了宝贵的资金支持,更带来了丰富的行业资源与战略指导,助力其在机器人领域不断突破、持续创新。
展望未来,Physical Intelligence将继续秉承“让机器人更智能、更通用”的核心理念,不断探索物理智能的边界与极限。我们相信,在Sergey Levine等杰出领导者的带领下,在强大资本与资源的支持下,Physical Intelligence定能在机器人领域书写出属于自己的辉煌篇章!
核心创始成员情况
PI(Physical Intelligence)的创立,无疑是机器人领域的一次璀璨绽放,其背后的灵魂人物——创始人Sergey Levine,不仅是robot learning领域的全球翘楚,更是以其深厚的学术造诣与广泛的影响力,引领着行业前行的方向。Sergey不仅拥有Berkeley电子工程与计算机科学系副教授的显赫头衔,更是Soft-Actor Critic(SAC)这一革新性强化学习算法的联合缔造者,其Google Scholar上的高被引次数(超过12.9万次)便是其卓越贡献的最佳证明。他的科研热情与卓越成就,如同磁石一般吸引着全球顶尖人才的目光。
PI的核心团队汇聚了来自Google机器人团队的精英力量,其中包括Sergey在内的Chelsea Finn、Karol Hausman、Brian Ichter等,均是在Google这一robot learning领域最强研究实验室中熠熠生辉的明星。他们不仅各自在领域内拥有举足轻重的地位,更因共同的愿景与激情汇聚一堂,致力于将PI打造成为机器人领域的OpenAI。
Chelsea Finn,斯坦福大学计算机科学与电子工程系的杰出助理教授,其IRIS实验室在通过大规模机器人交互推动智能发展方面取得了显著成果,她本人亦在DeepMind担任研究科学家,持续探索智能行为的边界。Karol Hausman,作为Google RT系列论文的核心领导者,以及在DeepMind和斯坦福大学的双重身份,他对机器人操作与深度强化学习的深刻理解,为PI的技术创新提供了坚实支撑。Brian Ichter,则在Google DeepMind Robotics team深耕多年,专注于移动机器人系统的长期规划与执行,其研究成果为PI在复杂环境中的应用奠定了坚实基础。
此外,Lachy Groom作为Stripe的早期成员与成功的天使投资人,以其敏锐的洞察力和强大的融资能力,为PI的快速发展注入了强劲动力。而Suraj Nair与Quan Vuong,作为斯坦福大学与加州大学圣地亚哥分校的杰出代表,也在各自领域展现了非凡的才华与潜力,为PI的团队增添了更多活力与可能性。
综上所述,PI的团队构成不仅彰显了其在robot learning领域的深厚底蕴与顶尖实力,更预示着其未来在机器人技术创新与应用拓展上的无限可能。随着Sergey等核心成员的持续影响力与号召力,我们有理由相信,未来几个月内,将有更多该领域的杰出researcher与工程师加入PI的大家庭,共同书写机器人领域的崭新篇章。
Skild AI
Skild AI,这家创立于2023年的创新先锋企业,自诞生之日起便肩负着开发革命性机器人foundation model的重任,旨在赋能各类机器人——从灵活的人形机器人到稳健的四足机器人,乃至更多未来形态的机械伙伴,引领智能自动化新时代的到来。
在2023年7月,Skild AI凭借其前沿的技术愿景与卓越的团队实力,成功吸引了红杉美国与Lightspeed这两大顶级风投机构的青睐,共同领投了其种子轮融资,为公司的快速发展奠定了坚实的资金基础。而仅仅不到一年的时间,即2024年4月,Skild AI再次迎来里程碑式的融资盛事,成功募集到高达3亿美元的新一轮资金,投后估值飙升至惊人的15亿美元。此次融资汇聚了包括Coatue Management、Lightspeed Venture Partners、Ryan Wilson、Sequoia Capital、General Catalyst以及Menlo Ventures等在内的众多国际知名投资机构,充分彰显了市场对Skild AI未来发展潜力的高度认可与期待。
Skild AI的辉煌成就,离不开其创始人——来自卡内基梅隆大学(CMU)的两位杰出教授Abhinav Gupta与Deepak Pathak的卓越领导。两位教授不仅在人工智能领域拥有深厚的学术造诣,更曾在Meta Platforms携手合作,共同探索AI技术的无限可能。正是这样的背景与经历,为Skild AI注入了强大的科研基因与创新活力,使其能够在机器人foundation model的开发道路上不断突破,引领行业前行。
•Abhinav Gupt
自2009年8月起,Abhinav Gupta教授便在卡内基梅隆大学(CMU)的机器人研究所担纲重任,致力于通过构建前沿的自监督学习、终身学习及交互式学习系统,不断拓展学习的边界与深度。他的研究不仅推动了机器人技术领域的理论创新,更为实际应用开辟了广阔空间。
自2018年4月至2022年5月,Abhinav Gupta教授在Facebook担任研究经理一职,期间他展现出了卓越的领导力和创新能力。在匹兹堡,他亲手创立了一个充满活力的研究实验室,并在Facebook AI Research内部组建了一支专注于机器人技术的精英团队。在他的引领下,该团队在自监督学习、触觉传感、机器人导航与操纵等多个前沿领域取得了突破性进展,为机器人智能化发展贡献了重要力量。
此外,Abhinav Gupta教授还以其深厚的学术功底和丰富的行业经验,在多个知名机构担任兼职顾问。在2016年9月至2018年3月期间,他作为科学顾问加入了Allen Institute for AI (AI2),为PRIOR团队提供战略指导,并与多个前沿研究项目紧密合作,其中包括了广受赞誉的Charades数据集和AI2 Thor项目的开发。他的专业见解和独到见解,为这些项目的成功实施提供了重要保障。
同时,在2016年1月至2018年3月期间,Abhinav Gupta教授还担任了谷歌的兼职顾问,专注于计算机视觉和大规模视觉学习领域的研究。他亲自指导了一系列重要项目,并领导了一个利用JFT-300B图像数据集学习大型模型的开创性工作。这一项目的成功实施,不仅推动了计算机视觉技术的发展,更为人工智能在更广泛领域的应用奠定了坚实基础。
综上所述,Abhinav Gupta教授以其卓越的学术成就和丰富的行业经验,在机器人技术、计算机视觉及人工智能等多个领域均取得了显著成就。他的贡献不仅体现在理论研究的创新上,更在于将前沿技术成功应用于实际项目中,推动了相关领域的快速发展。
•Deepak Pathak
Deepak Pathak博士深耕于计算机视觉、机器学习及机器人技术的交叉领域,其研究深受动物认知机制与生物学原理的启迪,旨在探索并创造出能够比肩人类,在复杂多变环境中展现出卓越泛化能力的智能机器人。他的工作不仅跨越了技术的边界,更触及了人工智能与自然界智慧交汇的深刻议题。
在创业与学术的双重舞台上,Deepak Pathak同样展现出了非凡的才华。作为VisageMap Inc.的联合创始人,他勇于开拓,将前沿技术转化为实际应用;而在微软的研究实习经历,则为他日后的科研工作奠定了坚实的基础。
在Meta AI Research的宝贵一年里,Deepak Pathak与业界巨擘Jitendra Malik并肩作战,共同推进了人工智能研究的前沿。随后,他又在加州大学伯克利分校与知名学者Pieter Abbeel紧密合作,担任访问博士后,进一步拓宽了学术视野,深化了研究深度。
自2020年起,Deepak Pathak博士在卡内基梅隆大学计算机科学学院担任助理教授,同时作为Robotics Institute的重要成员及机器学习部门的杰出贡献者,他继续引领着人工智能与机器人技术的融合创新,为培养下一代科研人才、推动科技进步贡献着自己的力量。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.iotsj.com//kuaixun/3513.html