离开OpenAI和导师一起创业他们要让机器人不编程也能像人一样干活
两个月前,陈曦离开工作了一年半的OpenAI,和同事段岩、张天浩一起创立了Embodied Intelligence。
上周, Embodied Intelligence 宣布获700万美元种子投资,本轮融资由Amplify Partners领投,峰瑞资本(FreeS)、Lux Capital、SV Angels、11.2 Capital以及A.Capital跟投。
三个年轻的华人,成为硅谷冉冉升起的新星。
从左到右分别为陈曦(首席执行官)、Pieter Abbeel(总裁及首席科学家)、段岩(首席技术官)、张天浩(研究科学家)
拉上导师一起创业
Embodied Intelligence 之所以成为投资人争相的宠儿,离不开三个创始人的背景。
创业前,三人是OpenAI Pieter Abbeel 教授实验室的同事,从事前沿领域如模仿学习、强化学习、无监督学习以及元学习的研究工作。
OpenAI 是由特斯拉CEO Elon Musk 于2015年12月联合诸多硅谷大亨建立的人工智能非营利组织,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。
2016年6月21日,OpenAI 宣布了其主要目标,包括制造“通用”机器人和使用自然语言的聊天机器人。OpenAI研发主管Ilya Sutskever、OpenAI CTO Greg Brockman 硅谷知名创业加速器Y Combinator总裁 Sam Altman 以及连续创业家 Elon Musk 等人联合发表博文称:“我们正致力于利用物理机器人(现有而非OpenAI开发)完成基本家务。
OpenAI 聚集了世界级的工程师和科学家,其中就包括Pieter Abbeel。Pieter Abbeel 在人工智能领域非常有名,其在伯克利的实验室引领了诸多近期机器人学习领域的突破性进展,包括让机器人学会整理衣物,行走(仿真环境),以及通过反复试错或者VR示范数据来学习视觉驱动的操纵物体的技能。
Pieter Abbeel
CEO陈曦向雷锋网表示,最近五年学术圈有非常多突破,主要归结到深度学习的成功,和深度学习跟像强化学习领域的结合。于是,在完成自己的博士项目后,便拉上同事段岩、张天浩一起创立了Embodied Intelligence,而导师Pieter Abbeel 也加盟了这个新团队任总裁和首席科学家。
无需编程,机器人可自然学习新技能
基于创始人们在模仿学习、强化学习、无监督学习以及元学习等领域的研究成果,Embodied Intelligence 开发了一款软件,可让任何人通过在虚拟现实(VR)设备里示范教学来让机器人获得新的技能。这些示范数据会被用来训练深度神经网络,而训练完毕的智能使用强化学习进一步改进。通过这套流程,机器人可以轻松地学会广泛的技能。
传统的机器人编程非常耗费时间,只有专业人员才能进行。Embodied Intelligence 提供的智能模块可以接入任何市面上的机器人,让它们可以自然地学习新的技能,无需编写晦涩难懂的代码。
CEO陈曦向雷锋网进一步解释这项技术:
第一步是通过人类的演示进行学习,但这个要比简单的复制要复杂,因为人类演示是很难把所有的变化都覆盖到,所以学习的结果是需要泛化的能力,就算是人类示教没有演示到的情况下也能完成任务。
第二步是机器人可以进行自我学习,具体的学习方法叫做深度强化学习(Deep Reinforcement Learning), 这个是通过机器人自己试错来进行,可以找到比示教更优的方案。不过不是所有场景都需要这一步,对于不少场景来讲,做到跟人的示教一样快,一样好就可以了。
在他们发布在youtube的视频中,他们使用这种方法训练一个两臂机器人从桌上拾起球或者打绳结。Embodied Intelligence 团队们戴着 VR 头显,拿着动作,不断地在数字世界中向机器人展示如何完成任务。然后,机器人可以从这些数据中学习。
技术太前沿短时间无法落地?
一般来说,学术圈和工业圈的技术差距在5年左右。对于深度强化学习落地到工业圈,雷锋网咨询了几位机器人领域创业者,他们均表示目前确实有很大进展,尤其是Pieter Abbeel 在这个领域更是领军人物做出了突出贡献,不过要落地到工业圈,需要8到10年。
对此,陈曦向雷锋网回应了一句哈哈。对于是否有落地困难的问题,陈曦表现地很乐观,表示如果从硬件上面来讲,其实这个公司早两年还真做不了,运算能力(GPU)最近两年翻了好几倍,然后消费级的VR设备也是最近才开始普及。而工业机器人方面,则是已经成熟很久了;而从难度来讲,之所以选这个就是因为团队有能力可以做出来。
从左到右分别为Pieter Abbeel(总裁及首席科学家)、陈曦(首席执行官)、段岩(首席技术官)、张天浩(研究科学家)
“第一,我们做的东西真的跟产业中所有看到过的解决方案,不过是市面上的还是在研发的都完全不一样。我们应该是极少数使用端到端学习(end-to-end learning)的公司,这个应该解释了为什么会有人说我们做的很学术。
第二是看这个技术本身,最主要的落地门槛在于实际应用中的可靠性。在学术界中端到端学习出来的算法一般是70-90%的成功率左右,这个离工业应用肯定是有一定距离的。但我们团队最近的研究成果显示只用30分钟的示教数据,就可以在很多场景里面达到90%的成功率。那么我们认为,运用更多示教数据和进一步的算法优化,我们是可以达到工业的要求的。”
作为唯一的国内投资方,峰瑞资本创始人李丰对于这个项目给予了高度评价,
“人工智能发展到今天,真正用到决策智能的人工智能项目是很少见的。Embodied Intelligence做的机械臂的控制包括通过有监督学习做无序抓取,是一项有挑战的事业。不过,Embodied Intelligence的创业团队,包括 Peter Abbeel,是行业中做人工智能最的研究者和创业者。且这件事是适合中美制造业国情的,应用潜力巨大。”
陈曦向雷锋网表示目前已有跟数个工厂和系统集成商合作,已经确认了一些具体场景,接触下来是发现能够应用的地方很多,接下来希望挑一些有代表性的,能体现他们方案不一样的地方。
“pick and place(抓取)是比较大的一块,但是比较简单的环境下面的pick and place就不是我们关注的了,因为其他解决方案也能做到。我们主要关注一些传统方法难以解决的问题,例如抓取的原料是deformable (可变形的),像电线,数据线之类的wire bundle (导线束)。
除去抓取之外,我们也会看需要很多contact (物体间接触)的场景,例如说assembly(装配)。这也是传统来讲很难解决的问题。例如kitting(物料配送),从物料仓库捡取原件到一个kit(套件)里面,然后会被运到总装线上。这个kitting的步骤,如果是刚体的抓取是比较简单的。有很多现成的方案只需要一个CAD模型,然后会match(匹配)到3D摄像机里面的point cloud(点云数据),然后计算抓取点。但是像电线这样会变形的东西,这样的现有方法就不足够了,因为电线有太多种变形的可能,match 3d point cloud to fixed model(匹配3d点云到固定模型)的方法就很难完成了。
定性来讲的话,是任何通过手动编程难以完成的场景都会是很好的candidates(候选者),比较有代表性的有刚刚说的deformable objects picking(可变形的物体抓取)。或者assembly 类型的场景。但是我们没有讲太具体的场景,因为是under NDA(保密)。抽象来讲的话,只要是人可以遥控机械臂完成的工作,我们都可以从示教中学习。也就是说如果是需要硬件上的创新(就算由人来控制一个机械臂,也是不能完成的)的场景,就不是我们的关注范畴。
对于我们方案来讲,不管是刚体的抓取还是柔性物体的抓取,学习方法是完全一样的。唯一的不一样可能是因为物体是柔性的,有更多的variations(变化),而需要更多的训练数据。”
陈曦向雷锋网表示,目前项目都在朝着预期进展,“如果说有什么意外的话,那应该是应用场景比想象中要多,这些是很多在学术界比较难接触到的。”
接下来,陈曦希望在国内也找一些早期应用场景。