忆海原识发布类脑计算平台,下一代AI突破

机器之心报道

演讲:任化龙

编辑:杜伟

近日,在WAICAI开发者日上,忆海原识创始人兼CEO任化龙发表主题演讲《类脑计算的发展与关键技术》。演讲中,他夯实细致地介绍了类脑智能的特点以及与传统技术的对比,以及忆海原识自主研发的Ocean类脑计算平台。

以下为任化龙的演讲内容,机器之心进行了不改变原意的编辑、整理:

忆海原识专注于灵巧手和类脑智能,推动机器人产业赋能生活服务和工业生产,解放人类的生产力。

忆海原识团队起源于年,当时在研发灵巧手本体,后来发现智能才是机器人最大的瓶颈。于是任化龙选择去斯坦福深造,却发现所学传统智能技术存在明显理论短板。

人工智能的突破口在哪里?答案就在人脑,不需向外索求。

深度学习已经遇到瓶颈

不可否认,人工智能发展至今已取得瞩目成就,在计算机视觉、计算机听觉、自然语言处理、自动驾驶等领域都已获商业应用,但每个领域也尚存不少短板。

计算机视觉方面,目前以深度学习为主。深度学习采用数学优化作为内核,需要大量样本训练,泛化能力较弱,不能对事物、情景抽象概括理解,例如不能理解左图中奥巴马的搞笑举动。

计算机听觉方面,假设在一个非常嘈杂的鸡尾酒会上,很多人在说话,夹杂着觥筹交错的酒杯声。那么,你怎么主动选择听哪个声音呢?这就是主动注意力。还有像人的说话、唱歌有音色和音调,甚至说话过程中有语气等,这些为传统智能技术所忽略。

至于服务机器人,目前缺少灵巧的手,所以没办法进行灵巧操作。而运动规划仍需要给定轨迹或者给出精确的目标坐标(X、Y、Z)。机器人无法自己进行决策,也不具备像人一样的情景记忆。

自动驾驶就更不用说了,在封闭场景还好,但是到了开放环境仍然面临一系列挑战,包括可解释性和鲁棒性较弱、复杂路况下适应能力弱、需要大量重复训练但性能提高有限等。

可见,目前人工智能感知能力有限,更不要说认知能力,深度学习确实遇到了瓶颈。

从生物脑到类脑计算

前面提到了好多次认知,那什么是认知呢?我先抛出一个问题,谁还能记得上一个演讲的全部内容、全部画面,甚至每一句话?大家应该记不得了,因为人并不是像摄像头一样把每一段情景都录下来。

但是如果让你总结概括,是不是可以呢?比如你可以用少于10句话去概括,甚至可以进一步精简到用一句话概括。这就是认知。学习和记忆、抽象和归纳就是人有的认知,这些对于机器人以及计算机来说仍然非常困难。

人脑的认知行为是非常灵活的,比如下图中五官的位置关系是怎样的,是不是已经错乱了,没有准确的顺序?再看它的色调和纹理,跟真实的人脸也有区别吗?那么我们把它识别成什么呢?

如果从这幅画的作者来讲,我们知道它是毕加索的一副名画;从内容上讲,我们知道这是一张扭曲的人脸。如果想要识别它扭曲在哪里,可能是鼻子和眼睛的位置是错乱的。所以,我们对任何一个确定的输入,识别理解成什么样取决于认知需要。这种多元化的解读就是人脑的认知所带来的灵活性,这些也是目前人工智能所不具备的。

人工智能怎么突破前述瓶颈呢?天地宇宙赋予我们人身,古人通过内观发现人的身体有气脉,因而发展出了中医,而人的大脑是目前唯一的通用智能系统,因此大脑是最好的设计蓝本,我们应该向内借鉴,不需向外求索。

借鉴生物脑的智能技术可以用在视觉、听觉、语言、理解、决策、运动控制等各个维度,解决服务机器人和自动驾驶的关键瓶颈。从这个思路可以演变出很多具有相关性,但又有一些不同的学科和技术路线。

那么类脑计算是什么呢?它是由生物脑启发的人工智能技术,强调实用,不追求把大脑中每一个生物细节都进行模拟,具有广阔应用前景。

脑仿真就是一种精细度较高的模拟,不一定追求实用,更多的是探求生物物理层面的机理。

神经拟态芯片,利用介于数字和模拟混合信号的方式来实现人工神经元,集成进芯片里,大幅度节省芯片的功耗。

计算神经科学可以看作是类脑计算的前身,它大量使用数理方法对脑机制进行理解,很多模型都是抽象的,不一定追求实用。

脑机接口也是近些年兴起的领域,主要解决人和机器、大脑和机器之间的交互。

下图提供了一目了然的对比:类脑计算可以通过算法、软件、硬件实现;神经拟态芯片如IBM的TrueNorth;脑仿真如欧盟的人类脑计划,通过对多种生物脑中特定脑区的脑切片进行重构得到脑模拟模型;计算神经科学如经典的脉冲神经元模型和传统脉冲神经网络;脑机接口如马斯克的Neuralink。

类脑计算如何借鉴大脑呢?它有两个关键特征,一个是技术特征,另一个是应用面。技术特征上高度借鉴了生物脑中关键的生物机制,比如不再使用深度神经元模型,而是使用脉冲神经元模型,甚至比脉冲神经元更复杂的模型。

类脑计算的学习机制也不再依赖数学优化,无需误差反传和梯度下降,而主要利用可塑性进行训练,由此局部性更好,学习效率更高,配合生物脑中特殊的神经环路可以快速地实现举一反三。类脑计算也不再严格区分学习和推理这两个过程,很适合实时在线学习。由脉冲神经元构建出微环路,再由微环路构建多脑区的脑网络,这样就可以实现类脑神经网络模型。

类脑计算面向的问题是更高级的认知任务,不再是简单的识别和分类。比如抽象与归纳、推理与决策、知识与常识都属于认知,想象与创造、情感、同理心、道德,甚至人特有的直觉与审美属于高级认知现象。

忆海原识类脑计算体系

类脑计算具体怎么做呢?回顾忆海原识的探索历程,我们是从机器人本体开始,因为脑中包括视觉系统、记忆系统、运动控制系统在发育与训练过程中离不开人体或者说机器人本体跟外部世界的不断互动。后来逐渐积累类脑智能的理论,并在这些理论指导下逐渐实现了一系列类脑神经网络模型。再后来发现这些模型规模比较庞大,运算效率又成为新的问题,于是研发了类脑加速平台,走了一个完整的技术链条。

回顾深度学习的发展历史,其实也是一样的。最早从理论出发,然后出现了多层神经网络,解决了训练问题,再然后出现了一系列关键构造(如CNN、RNN、池化),后来又出现了诸如Caffe、TensorFlow等深度学习加速平台。类脑计算的发展也一样要循序渐进,一步一步扎实地走。

类脑神经网络初窥

神经网络是怎么工作的呢?我们先来看人眼视网膜,它是视觉神经通路的第一关,却又往往被传统计算机视觉所忽略。

再仔细看,视网膜的内部构造非常丰富和复杂,从第一层的感光细胞到后面的双极细胞、水平细胞、无长突细胞和神经节细胞,它们分成了若干层,每层里面还有亚层。这些细胞之间进行充分的信息沟通和互动,能够产生多种重要作用,包括但不限于调整对比度、图象锐化、边缘检测和形成初步色感等。

实际上,视觉的处理过程并不仅局限于视觉皮层,其实在视网膜就已开始了。下图为视网膜模型的处理效果,最左边是输入图象,中间是它提取出来的边缘,最右边形成了初步的色感(形成了三种不同的主要色调)。

这里我们只借鉴视网膜内部的生物机制就可以实现,完全不需要数学优化、误差反传和大量的训练,效果仍然很好。

我们再来看更高级的部分「视觉皮层」。视觉神经系统有丰富发达的机制,它的神经通路与其他脑区高度互联,比如视觉皮层可以连接到运动皮层,和空间感有关;它还连接到颞叶,对物品进行识别;它还连接到中颞叶构造(包括海马体),形成情景记忆。情景记忆又可以进行抽象和归纳,再反哺视觉皮层的训练,使视觉训练效率非常高。

我们举个例子,受益于四通八达的神经通路,视觉系统可以进行丰富灵活的信息处理。如下最左图给大家一种立体感(存在视错觉);中间图有ABC三个位置,尤其是A和B在明亮上是同一个色阶,但在不同的阴影照度和对比下,就可能被人眼识别成不同的结果;还有最右图中有几种颜色的螺旋呢?其实如果去掉背景干扰信息,可以发现它的螺旋线只有绿色。

也就是说,人脑对立体感、明亮感、色彩感以及其他诸多种感觉都存在相对性与整体性,能够在丰富的信息空间中进行灵活处理,处理方式和结果取决于认知需要和对比。

在下图中,大家可以看到远山之间存在层次感,能够分辨近景与远景。在这种图像之中,你可以结合视觉注意力选择

转载请注明:http://www.abuoumao.com/hykh/6078.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: 冀ICP备19029570号-7