行业快讯 | 达闼黄晓庆在某内部会议上的讲话

慧聪酒店网 2022-11-02 10:31 来源:网络

我在通信行业工作了30年,为什么要做机器人? 在机器人行业我可以为大家做什么呢?下面给大家讲讲达闼的故事。2014年,习近平总书记在两院工作会议上脱稿讲了,“机器人是制造业皇冠顶端的明珠,研发制造应用是衡量一个国家科技创新和高端制造业的重要标志”。达闼从2015年成立到现在,我们都在做机器人。在去年12月,工信部发布的《“十四五”机器人发展规划》,说我国要成为全球机器人技术的创新策源地,高端制造的聚集地和集成应用的新高地。看起来我们做对了!

上世纪60年代人类就开始做机器人,那时候美国有一个公司做了一个六轴机械手,为了更好地售卖,就叫了机器人(Robot),一个产业就这样诞生了。到现在,机器人产业也进入了第五代,即5G时代。第一代我们做出机械手臂,那个时候智能水平比较低,只会条件反射。到了第二代,我们把它叫做协作机器人,上世纪八九十年代出现了,比较著名的企业就是优傲,瑞典公司。我们中国有很多新创的公司都是以他们的产品作为模型。然后出现了第三代AGV时代,虽然不太标准化,但是可以在确定的、可控的物流场景工作。今天AGV是非常大的产业,包括我们的扫地机器人也是某种程度的AGV。九十年代末到本世纪初,核心在2004年左右,美国国防部高技术研究局推动了自动驾驶,当时开始是军事用途,现在变成强大的商业用途,汽车自动驾驶出现了。作为第四代机器人,它开始有了大脑,这个大脑是局限在汽车里面不是很大的大脑,比如第一代谷歌自动驾驶机器人里面,采用了16台服务器,汽车是用的丰田的普锐斯,汽车大概三五千到五万美元左右,16台服务器接近三十万美元,所以服务器太贵,放在汽车里,但是还是无法完全自主驾驶。而真正实现完全自主,不需要人类的自动驾驶,它有独立的思考能力,可以解决问题,独立完成工作,肯定就需要巨大的计算能力,这就是把大脑放在云端的机器人架构,即第五代机器人。

我们过去叫达闼科技,现在是达闼机器人,总部在上海,北京、深圳、成都等地都有研发中心。达闼机器人在今年上海人工智能世界大会推出了新的云端大脑操作系统海睿5.0 版本,也推出了新的人形智能机器人小姜(Cloud Ginger)2.0,同时也给大家打开了一个彩蛋,就是我们期待在2025年推出的人形双足机器人“七仙女”。

为什么要采用云端大脑的机器人架构呢?人类大脑是有1000亿神经元的机器,而这个机器只有1500克重,耗电大约40瓦。如果我们人类用我们已知的技术,就是半导体,来造一个“人类大脑”,会发现它的耗电和神经元比相差一亿倍,结果大脑耗电就有可能会大一百万倍到一亿倍。这说明大自然的“计算机”非常牛。另一方面,我们身体靠中枢神经即大脑,通过我们的交叉神经把所有的控制信号传到全身,然后把所有的身体器官的感知信号又传回大脑,这也是一个网络,这个网络就是人体神经网络,类似计算机网络,是传信号的网络。这个网络平均速度是大概每秒150-300米,在我们全身传遍平均100多毫秒,最远的就是大脑到大脚趾头是最长的神经通路需要300毫秒,最短的从眼睛传到大脑,大概30毫秒。任何一个物体晃动的速度快过30毫秒,我们眼睛就看不见,所以电影并不是连续的,24帧的电影在晃悠,你以为是连续的,是因为我们神经网络太慢了,反应不过来。相比较而言,无线电和光信号传输速度可达每秒30万公里,是神经网络的10亿倍。所以,我们可以把机器人大脑放在远离机器人身体的云端,通过5G通信网络连接到机器人身体,同样可以实现实时控制。

为什么我们叫达闼?因为达闼是英文“Data”拼音成中文的,而Data是美国很著名的科幻片《星际迷航》里面一个著名的机器人的名字。我们Data体现在云网端融合计算,我们设计的云端大脑有非常独特的能力,就是数字孪生的世界,有了这个环境,我们的编程就从非常复杂的物理运动,变成非常简单的游戏设计了。

未来机器人神经网络需要一个新的网络安全架构,这个新的网络架构是和互联网隔离的,机器人和自己的云端大脑的连接也要非常安全,互相都不能干扰,这个技术我们叫做内联网技术,我们已经在4G和5G网络上面建立了内联网技术,它代表了工业互联网发展非常重要的目标:安全、快捷。

下面简单总结一下,一个云端大脑包含了三大主要的能力:

一、 想象空间。和我们人类一样,机器人要有一个想象的空间,这个想象空间就是机器人的数字孪生元宇宙。比如我来到香格里拉,我如果从前来过香格里拉,我心里就有一个香格里拉,你告诉我去什么地方,我就可以自己去,如果从来没有来过,我完全不知道,我需要人带,所以在人类大脑里面,也有一个元宇宙,我们去过地方的记忆。所以机器人也需要元宇宙,就是机器人共享的数字孪生元宇宙,我们人类元宇宙很难共享,但是云端机器人脑袋就太能共享了,全世界的机器人都能共享,一个机器人学会了,所有机器人学会,这就是科技给我们带来未来。

二、 实现多模态通用智能。简单地说,多模态大模型给我们带来震撼,就是不用编程也可以编程,你把足够多的知识,通过足够多的训练和学习方法,建立起巨大的人工智能神经网络模型,这个神经网络模型可以帮你回答任何的知识,甚至可以帮你搬运物品,可以帮你解决很多问题,甚至可以吟诗、作画,过去我们把这个东西叫智能,这一天真的来临了,它的突破点就是谷歌的Alpha GO。你想当一个机器人的自我迭代围棋算法,在一个计算机里对垒了1500万次以后,下棋水平就超过了人类,人类无法解释它是怎么下棋的,人类也没有解释自己是怎么下棋的,所以把这个叫智能。

三、 生态。达闼提出了云端机器人就是人类的第三台计算机。因此,我们要为它设计出一个计算机操作系统和应用开发环境,类似于Windows、Android的一个开发环境和生态,让在里面开发应用的人有工具可用,让开发完应用的人有地方可以变现,这样就形成了生态。这三个重要组成部分,形成了云端大脑操作系统,即我们的海睿OS和RDK(机器人开发套件)。

简单解释一下多模态、多模型,这是目前人工智能领域最火热的领域,这是为什么大家要做算力,做算力中心,做大数据、大网络、大存储的核心根本原因。人类首先可以矢量化所有的自然人,任何知识在N维度的空间,都可以把任何一句话,任何一个事实描述给矢量化进行表达,然后通过一个神经网络模型,就可以得出人类知识,这个叫泛化。比如我想吃饭,我很想吃饭,我真的很想吃饭,可以泛化成空间的矢量,矢量长度决定需求的长度,所以这种矢量化的方式成为我们今天自然语言处理的最重要的技术,这个技术我们叫做变压器(Transformer),不是我们电工领域的变压器,是最新的人工智能的神经网络研究成果。

过去这五年我们人工智能技术发生了非常翻天覆地的变化,我们把这样的技术用来分析和研究图像、研究运动、研究抓取,这就是多模态。自然语言是文字为基础的,声音、图像、运动,甚至包括我们已知的所有传感器都可以进入,把所有的数据都矢量化的通用表达,是最普遍的方法,你把图画成N个小块,每个小块命名,再编号,也是一个矢量,但你要很多方法做矢量化,归根结底就是矢量化。

到目前为止做任何应用都需要请软件工程师,我们要给开发工具让他学习使用。比如Android,有IDE,Windows有Windows SDK ,有Mac OS 、Mac SDK。让所有编写软件的人都成为牛人,我们也给它爱称叫他们“程序猿”,就像猴子一样聪明,住在树上,每天不回家。

我们要为机器人行业提供一个新的编程方式,就是示范学习、模仿学习,直接向人类学习。我会让机器人就像徒弟向师傅学习一样,这个时候变成需要很少的编程甚至不需要编程,就可以编出机器人的应用,比如我是烹饪大师,我就示范给让机器人烧饭,这放油、盐、糖,再炒几下,你再指点指点,就行了,这样未来都是可能的。各位,我们面临的未来就是我们每个人都需要编程,而又不需要实际上去编程的,你把你的技艺通过示范传授给机器人,那个机器人就是你的数字孪生了,它以后帮你干活,你在家收钱就行了。

当然我们人类还需要一个功能,这个功能很重要,就是让很多机器人协同起来干一件事儿,人类之所以是人类,就是我们人类可以通过语音,通过社会结构组织起来干一件事情。动物太缺乏这样的能力,有云端大脑,让机器人组织起来协同太容易了,编程不就结束了吗。所以你们发现了云端大脑就是协同,天生的协同。

有了系统才能走向机器人的理想世界,机器人的理想世界就是我们在旁边,让机器人干活,人类不愿意干的工作都交给机器人,脏活、累活、苦活、没有尊严的活、危险的活给机器人,人类管理控制和教机器人干活就行了。

我们将来会有无数各种各样的机器人,所以我们要研究一些技术,让各种各样的机器人有效接入云端大脑,所以我们研究出云端机器人的标准控制单元(RCU),实际它就是特殊的5G手机,通过它把各种各样的机器人接进云端大脑。

这样的生态就形成了类似于我们互联网时代,由运营商、应用开发商、人工智能提供商和机器人本体的制造商来形成的强大的新的云端机器人生态。这个生态会让机器人的应用开发者有了变现能力,人工智能算法开发者有了变现能力,让我们做机器人本体的人变成造手机了,规模化生产,这样的生产是我们期待的生态,这样的生态在未来五到十年,就会蓬勃发展起来。

近两年我们举办了各种各样生态大赛。大学生设计大赛,这里面机器人工作,这些动作都是大学生做出来的。所以你可以想象任何一个人,任何一个大学生都可以通过我们的工具变成云端机器人应用开发者。

为了完成这样一些重要的生态产业的发展,我们必须和伟大的企业合作。生态方面我们有多所大学、鹏城实验室,上海浦江实验室等等。我们还要推动做本体的产业和我们合作,推动和他们对接,更多的推动特色产品。

我在2015年立下一个愿景,就是“2025,机器保姆”,按照这样的时间表,我们目前还是有效的往前推进,还有一个口号,叫“2035,全球都有”。

早在2019年就推出了我们研发和制造的第一台人形智能机器人”小姜”(CloudGinger),她比她的前辈Pepper强很多,它可以做优美的舞蹈,基本的抓取,基本的运动。当时我们推出来,它的负重能力不够,大概一公斤。

前段时间,在上海世界人工智能大会上推出了小姜的2.0版本,我们为她设计了抓取能力,可以到五公斤。同时,我们给她增加了关节,让她的手可以完成人类的动作,人类的手是唯一的在动物界里,拇指可以和其他的所有食指对接,可以捏东西,其他所有动物都不能做。

当然除了人形机器人以外,我们也为行业提供各种类型的特种机器人做清洁、巡检、安防等等,这些都在云端大脑指挥下。所以我提出如果机器人可以帮助人类省一半的钱,那它就是最好的助手。比如农业采摘,如果机器人有足够低的成本,销量能达一百万台。

那我们怎么造出聪明能干的人形双足机器人,从计算机角度看这个问题:首先,我认为人类是350个关节的动物,如果造一个人形机器人,肯定关节是多的,关节多意味着不能采用传统工业机器人的控制方法,要让所有关节都有控制器。第二,关节数量会很多,可能超过60个。第三,系统总的扭力、平均水平一定要很高的水平,所以我们说大概惯量密度4600Nm/kgm2。最后关节反应速度很重要,要在十毫秒以下,它应该是直驱或者准直驱的驱动执行器系统。

最后给大家提供一个远景,根据预测到2050年全球机器人数量会到一百亿,这里面肯定有相当的数量是在中国,到2035年中国就有3.1亿老年人,他们都需要机器人保姆。到了2050年这个市场会到30万亿美元规模,是今天通讯行业和汽车行业的总和还要多三倍,这样伟大而且充满想象力的市场,肯定是中国产业界,中国高科技产业界志在必得的。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。