科大师兄拉你进产业,探索具身智能奇点时刻

6月13日,周五晚上,中国科大高新校区图书馆阶梯教室灯火通明,四位具身智能领域的创业者和投资人校友,与上百位科大校友和同学,热烈讨论了3个多小时。

他们是发起人阿尔法公社创始合伙人、CEO许四清 (8105校友)、诺亦腾机器人创始人戴若犁 (9705校友)、逐际动力创始人张巍 (南科大教授,9910校友)、北京中关村学院、中关村人工智能研究院具身学部主任陈凯 (原微软亚洲研究院首席研究员,0700校友)。

一周半前,在秀丽的深圳锦绣科学园,戴若犁拉着他的天使投资人、师兄许四清,邀请张巍和一位机器人大厂一号位校友,探讨如何破局。大家一致认为,具身智能奇点尚未出现。“探索未知领域,这应该是科大的强项啊”,于是几位校友谋划回母校拉人。

几位校友当场提出:我们带个头,一起回科大,一起发挥科大学生数理基础扎实的优势,组团寻求突破,不再单打独斗,打一场“具身智能的群架”。

图片

13日晚六点,主持人许四清(8105校友)宣布论坛开始,“今天来现场的师弟师妹们真的赚到了,在座的每个校友都可以拉你进产业”。

是的,这个领域,产业走在了学界的前面。

戴若犁:机器人数据“是个好生意”

在进入机器人数据赛道之前,戴若犁 (9705校友)所在的诺亦腾公司已经占到动作捕捉行业份额的70%。

图片

戴若犁坦言,自己从服务于电影、游戏行业的动作捕捉(动捕)领域进入机器人数据赛道,是被动被“抓进来”的。

转折点是2023年,国际的顶尖机器人公司突然提出上百套动补设备的采购需求,而以往电影公司或影视公司是按照项目购买,一般几套,最多十几套。

最开始这个询价让他有点疑惑,但后来的进展让他意识到用typo设备产生训练数据,已经成为具身智能行业的刚需,催生了“机器人的数据是一个好生意”的判断。

对于数据的稀缺性,戴若犁表示,大语言模型的语料不同,物理世界的交互数据极度稀缺,无论是硬件销售、数据服务还是直接的数据授权,都成为了巨大的市场。

他总结了机器人数据的“四象限”理论,提出了获取机器人数据的四种主流方法:

真实本体遥操 、基于人体动作捕捉的数据、基于虚拟本体、合成/互联网数据。

图片

戴若犁将具身智能数据分为四层金字塔结构。底层是海量的、低精度的泛化信息;顶层是高质量、高成本的真机数据。每一层都有其价值,也对应不同的商业模式。他认为,在机器人真正大规模部署前,服务于研发阶段(R&D)的数据生意是完全可以成立的。

张巍:做具身智能时代的“iPhone + iOS”

逐际动力是具身智能创业明星之一,最近刚完成了一笔5亿元的融资,创始人张巍(9910校友)的演讲很“科大”,上来就给具身智能下了个严谨的定义:“让机器代替人完成改变物理世界的任务”。

图片

他强调,技术上最难的是与物理世界的交互,而商业上最难理解的是“代替人”和“任务”这两个词的深刻内涵,上一代机器人创业公司很多失败于此。

张巍将机器人本体(形态)和小脑(底层控制器)类比,认为两者是强耦合的。他将主流形态分为四种,并指出:机械臂和轮式机器人是已知问题,行业已非常成熟(甚至“卷”);而双足和人形机器人是“未知变量”,是最近一年才变得可行,但还远未做好,这正是最大的创新机会所在。

对于自己领导的人形机器人公司逐际动力,张巍明确公司定位是做具身智能时代的“iPhone + iOS”,专注于打造高性能、可靠的本体(iPhone)和与之强耦合的小脑(iOS)。不是提供终端解决方案(Solution),而是做平台(Platform)。

张巍将当前行业状态比作“莱特兄弟时刻”:大家都能让飞机飞一下,看起来差不多,但离造出安全可靠有用的飞机还差很远。这意味着行业远未到同质化内卷的阶段,产品细节和工程能力的差异巨大,充满了机会。

陈凯:不是具身需要智能,而是智能需要具身

陈凯(0700校友)将通用具身智能定义为物理世界的AGI,这个浪潮的真正引爆点是谷歌PaLM-E模型的发布,它证明了可以用一个统一的大模型来拆解和执行开放世界的任务,解决了传统机器人需要为每个任务硬编码的难题。

图片

陈凯用“四个超越”来描绘未来图景:

通用具身智能超越人类的感知能力(传感器本身已超越人眼)。

通用具身智能超越人类的认知推理能力(大模型已证明)。

通用具身智能超越人类的操作运动能力(特定任务上已实现)。

通用具身智能超越人类的统筹协调能力(多智能体协同)。

陈凯认为,具身智能领域充满了开放性问题,相比已经白热化的大语言模型,这里的每一点技术进步都可能孕育巨大的商业机会,是学术界和产业界最好的“切入点”,也是创业的黄金赛道。

许四清:产业革命来了,不要进大厂,“小作坊”可以干大事

许四清(8105校友)用2008年金融危机后的数据证明:经济下行周期内,是天使投资和创业的黄金时代。

他给出了一面阿尔法企业人像墙,历数在很多人“躺倒”的过去两年里,阿尔法公社“反周期”出手的高段位创始项目,除了智象未来的梅涛、在场的戴若犁等校友,还有光帆科技、清智元视等,这些项目2025年成为AI应用领域被投资人围猎的“当红炸子鸡”。“我们的角色,是与创始人一起,探索科学领域的突破如何商业化”。

图片

他认为中国是具身智能的主场: 权威报告显示,在过去20年新增的机器人相关专利中,中国申请的数量占78%。这个领域里,若干年后中国从反光镜里看硅谷将是大概率事件。

许四清晒了一张图,即LLM开山名作《Attention Is All You Need》原著论文,历数Google Brain主导的8位作者每一位的去向。到2024年9月,最后一位离开了Google,8位无一例外,都去创新公司了。“阿尔法公社公众号每周有一份AI投资研报,这几位多数的去向,我们都在过去1年多的文章里提到过”。

图片

他大声向在场的科大师弟师妹们喊话:“事实明确,逻辑清晰:工业界的机会多于学界,产业革命来了,职业起步要毫不犹豫地选择工业界。进工业界不要进大厂,创新的“小作坊”可以干大事,这张图就是最好的证明。”

会后很多校友围住许四清问东问西,他私下透露:从统计结果看,阿尔法公社投资的创业者,科大和清华校友占比最高。“很多科大校友创业,都会来阿尔法公社试试水温”。

圆桌对话与问答:问题尖锐,回答犀利,不拘一格

圆桌对话,不拘一格,成了一场大讨论,麦克风被抢。

图片

许四清师兄不客气地”挑战“戴若犁:Gartner预测说几年内仿真数据将超越物理数据,成为主导,你担不担心到时候失业?”,戴若犁很硬气:仿真世界是“用规则写成的”,模型学到的也只是规则。真实数据是“根基”,仿真数据是“增量和美化,我们完全可以推动这个,而且两者一起做”。

张巍很冷静,指出行业目前很浮躁:都在比谁第一个做出demo,像“莱特兄弟飞了一下”。高校不应卷入这种工程竞赛,学界的真正价值在于深入理解背后的原理,做的是从“莱特兄弟”到“波音飞机”的理论奠基工作,这需要深度思考。

张巍还打趣说,戴师兄的数据业务是个好生意,似乎师弟们不知道逐际动力起跑超快,已经融了5个亿。

图片

陈凯被许师兄当众“逼”出了一个猛料:他准备拉着近10位少年班同学创业,瞄准模型,团队高手如云。原来他不是作为学者,而是作为创业者被邀请来的。

师兄弟们一致认为应该回合肥干点事情,戴若犁和张巍二话不说开始“抢地盘”,要在阿尔法公社的科大硅谷创新单元建立实验室和研发团队,并向在场的师弟师妹们发出了热情的邀请,一起在具身智能领域大干一场。

高潮中,活动结束。

鸣谢:本次活动在科大校友总会、科大硅谷服务平台有限公司、科大硅谷校友事务部的指导下完成,诚表谢意。