大杂烩首页 > 大杂烩 > 五花八门 RRS

浅谈机器人大脑

发表时间:2016-09-23 16:56:02 点击:769 回复:0

机器人2025 联盟:【疯人院】 - 成员

+关注 传呼
  • 使用道具

    醒目灯

    请选择要设置的颜色:

    大救生圈

    使用该道具可将帖子置顶到:

    大杂烩

    时效:6小时

    救生圈

    使用该道具可将帖子置顶到:

    大杂烩

    时效:30分钟

    月灵符

    请输入楼层数:

    照妖镜

    请输入楼层数:

    神圣之眼

    该道具可显示帖子内所有匿名用户,但仅使用者本人能看到:

    水婴之眼

    该道具可将帖子内的匿名发言用户恢复为正常显示昵称,并以红色醒目显示,为匿名终结者,且所有人都可以看到!

    幻灵九峰尽

    请输入回复置顶区的楼层数:

    匿名符

    请输入楼层数:

    使用
  • 只看楼主

#机器人大脑;人工智能;深度学习#

  大脑在人类的身体当中承担了指挥和协调的作用,首先通过你的视觉、听觉、嗅觉、味觉、知觉等方面将外界信息收集并通过神经传递到你的大脑,大脑经过分析思考后作出指示,再通过神经传递给你的四肢等处以执行指令,大脑就是人体的中央机构。

然而,机器人的最重要的核心则是机器人的大脑,一般采用计算机控制系统(PC机、嵌入式计算机系统等),简单的可采用单片机系统。机器人的大脑由集成电路组成,主要负责信息处理,发布指令的功能,支配着整个机器人机体的正常运作。

机器人大脑的深度学习

可通过计算机系统实现人机对话的交互型机器人的大脑表现了更高一些的智力,表现在于它不仅具有机器人在一般情况下的决策能力,更具有与外界交换信息模拟人类对话的能力。  

人会捕捉他人的动作并加以记忆,并以观察与模仿再次重现该动作。同时,人也会在此过程中理解对方的动作意图,进行“学习”这项高级的精神活动。“拟人化”就是将此过程归纳并泛化,以便于让人理解非人者的动作行为。拟人化行为通过将非人的东西视为人类,记忆并解析其行为,然后再以模仿的方式重现其特征并传达给其他人。  

荷兰乌得勒支大学医学中心神经学家马特因·范登赫费尔发现,较聪明的大脑神经元之间似乎存在更多高效网络———换句话说,在大脑不同区域之间传递信息所需的步骤较少。一个族群的智商差异大约有1/3 是由此决定的。机器人自主学习的过程也就是在不断提高其神经网络的效率的过程。  

近年来“深度学习”逐渐成为机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来识别图像、声音和文本等数据。  

在许多情形中深度为2的神经网络就足够表示任何一个带有给定目标精度的函数。但是其代价是图中所需要的节点数(比如计算和参数数量)可能变的非常大。理论结果证实那些事实上所需要的节点数随着输入的大小指数增长的函数族是存在的。  

我们可以将深度架构看做一种因子分解。大部分随机选择的函数不能被有效地表示,无论是用深的或者浅的架构。但是许多能够有效地被深度架构表示的却不能被用浅的架构高效表示。  

大脑有一个深度架构。例如,视觉皮质得到了很好的研究,并显示出一系列的区域,在每一个这种区域中包含一个输入的表示和从一个到另一个的信号流。这个特征层次的每一层表示在一个不同的抽象层上的输入,并在层次的更上层有着更多的抽象特征,他们根据低层特征定义。  

深度学习认知过程逐层进行,逐步抽象。在实际中的例证是很常见的,如人类层次化地组织思想和概念;人类首先学习简单的概念,然后用他们去表示更抽象的;工程师将任务分解成多个抽象层次去处理。  

目前研究者们正在将深度学习用于机器人对语言的情绪识别,在这之前应用最广的情绪分析是“词袋(bag of wodrds)”模型,并没有将词序列入考虑范围。词袋中的词汇被标记为正面或负面的,通过计数来评估整个句子或段落的含义是正面还是负面。将词汇单独分析的方法并不准确,必须将其放入到越来越大的结构中。研究者抽取了12000个句子,并将其粗略分割为214000个词组,每个词组被标记为负面、中立或正面(数字表示),计算机科学家称这些数字化的表述为“特征表示”,类似于人脑理解概念和定义的方式。如何分析和组织这些被标记的数据才是NaSent算法的核心。  

以下通过对两个句子的分析来理解这个算法: Unlike the surreal Leon, this movie is weird but likeable. 

Unlike the surreal but likeable Leon, this movie is weird.  

这两个句子中使用的词汇完全相同,“词袋”模型分析显然不会得到正确的结果。NaSent算法首先会为每个句子构造文法树,如下图所示:




如上图所示“surreal but likeable Leon”是一个正面词组,但“this movie is weird”是负面的,整个句子得到的分析结果也是负面的。  

相比之前模型80%的准确率,NaSent的准确率达到了85%。

机器人时代的最强大脑会由这些公司打造吗?


人工智能技术在物联网、机器人时代会产生什么样的影响,哪些公司会因此受益?

1、AI会成为物联网时代的基础设施,万物互联迈向万物智能

万物互联迈向万物智能,分为三个阶段实现:

1)、硬件联网:硬件接入互联网,获取云端信息,远程操控,互通互联

2)、硬件智能交互:人可以与硬件直接通过语言交流,通过语言获取各种服务

3)、硬件智能化:硬件具备学习、感知、决策的能力,会了解主人的性格、情绪和习惯,具备云端大脑,具有决策能力,能够更好的为主人服务

在此过程中,人工智能技术将作为一种基础设施推动智能硬件从联网进化为智慧,“机器”进化为“机器人”,最终推动万物互联迈向万物智能时代。

2、语音交互技术成为物联网时代核心管网,最重要的交互方式之一

从技术层面上讲,人工智能技术主要包括:语音识别、自然语言处理、计算机视觉;人工智能成为物联网时代最重要的基础设施之一,相关核心技术就是组成基础设施的核心管网。

PC时代最重要的交互方式是键盘,智能机时代最重要的交互方式是触屏,物联网(机器人)时代,语音交互将成为最重要的交互方式之一。这意味着未来整个机器人生态链,从上游的芯片、方案到终端产品研发,从系统底层机器人OS,到上层UI,应用开发,数据存储,内容呈现等等从都必须围绕语音交互这种新的交互方式。无疑,掌握语音交互核心技术(唤醒、远距离语音识别、语义理解等)的平台级公司未来会发挥巨大的价值。

目前,语音交互技术在一些领域已成为刚需,市场规模呈现爆发式增长态势,总起来有几条较为清晰的脉络:

1) 语音交互技术的应用从下游终端往上游方案商、芯片走,形成软硬一体化解决方案,出货量数量级倍增。

2) 从车载、智能家居(音频)、玩具等垂直领域场景率先爆发,出货量达百万级别,语音交互成为标配。

3) 语义识别需求爆发,与内容(场景)紧密结合

语音识别需求爆发,语义识别(自然语言理解)需求随之爆发。语音识别是将一段音频变成文本,但这段文本是什么意思,就需要进行语义解析。当智能硬件(机器人)“能听会说”之后,更重要也更难的是让其和人一样学会“理解”和“思考”,而且这种“理解”和“思考”一定要与特定领域和场景相结合。 决定人和人之间差别的是“大脑”,对智能硬件也是如此。

目前语音技术的应用场景和产品还不够多,当未来亿万家庭中的数十亿设备以语音交互作为主流交互方式,这条管道像太平洋那么粗时,人工智能时代就真正来临了。

3、国内现状

国内语音技术产业界分为三股势力(不考虑BAT等巨头):

1)、做语音助手起家:聚熵智能、图灵、出门问问

聚熵智能:推出国内第一个中文siri产品—智能360,全球第一个推出Home AI智能产品-小智超级音箱,比亚马逊Echo早半年,2015年推出小智管家机器人和Home AI云平台,后者让智能设备具备从感知到认知的能力,关键能力包含:音乐,智能设备互联互通,生活服务以及机器深度学习等,想打造机器人时代的“Google”。

图灵(虫洞):推出虫洞语音助手,虫洞语义云,图灵机器人等产品,图灵机器人是一款机器人大脑,可为智能化软硬件产品提供中文语义分析、自然语言对话、深度问答等人工智能技术服务。

出门问问:推出语音助手—出门问问,中文语音智能交互手表Ticwatch,以及中文语音交互智能手表操作系统Ticwear,支持中文语音交互,周边热点查询、语音打车等多样本地服务,前几天刚推出针对车载领域的—开车问问。

2)做语音识别起家:讯飞、云知声、思必驰

讯飞:国内语音巨头,既做语音技术提供方(讯飞语音云开放平台),也提供软硬一体化方案,也开发产品(讯飞语点、开心熊宝、叮咚音箱等)

云知声,思必驰:做语音技术提供方,同时提供软硬一体化方案(车载、智能家居、机器人领域)。

3)、巨头前人工智能负责人创办企业:地平线机器人、杭州灵伴科技有限公司

地平线机器人:前百度深度学习研究院创始人余凯2015年8月创立,推出面向自动驾驶的”雨果“平台,面向智能家居的”安徒生“平台,号称要做“机器人时代的英特尔”,使“智能硬件”变“机器人”。

杭州灵伴科技有限公司:前阿里M实验室负责人Misa 创办,团队实力强劲产品:语音陪伴机器人rokid,号称要做“机器人时代的苹果”。

4、小结

1) 人工智能技术拐点临近,它的影响将无所不在,加速推动万物互联迈向万物智能。

2) 未来所有的智能硬件,都将进化为“机器人”,拥有“大脑“和”智慧“。

3) 语音交互成为智能硬件(机器人)时代最重要的交互方式,并将深刻影响产业变革。

4) 语义识别需求爆发,语义识别的平台级公司会有巨大的价值。中文语音识别对国外巨头而言难度不大,但由于语言文化壁垒,针对中文语义解析,必然是中国企业做的最好。

5) 未来的AI之王必然属于创业公司,也许机器人时代的“最强大脑”将诞生在他们中间,但巨头的影响无处不在。以上列的三股势力,几乎每家背后都有巨头声影。

人工智能领域的专家或机器人生态的构建者将胜出

● 国内服务机器人市场鱼龙混杂,当下机器人概念火热,很多简单的机械结构或组合也号称是机器人厂商,如“Walking Pad”、仅会运动的机械玩具等,此类并不能称为真正的机器人。机器人的“大脑”将决定其功效和等级。

● 此外,机器人的发展亦不能闭门造车。硬件厂商应在可行范围内开放自己的底层,以连接更多设备,纳入更多开发者丰富其系统和应用,形成生态。

● 值得关注的公司类型如机器人相关的基础硬件升级、人工智能有突破的厂商、功能型服务机器人、娱乐/教育型机器人。

文章素材图片来源网络,由机器人2025编辑部编辑
发表时间:2016-09-23 16:56:02

快速回复

发表回复

回复
楼主的其他的文章 more
  • 神回复
  • 我要发帖
  • 使用道具

    醒目灯

    请选择要设置的颜色:

    大救生圈

    使用该道具可将帖子置顶到:

    大杂烩

    时效:6小时

    救生圈

    使用该道具可将帖子置顶到:

    大杂烩

    时效:30分钟

    月灵符

    请输入楼层数:

    照妖镜

    请输入楼层数:

    神圣之眼

    该道具可显示帖子内所有匿名用户,但仅使用者本人能看到:

    水婴之眼

    该道具可将帖子内的匿名发言用户恢复为正常显示昵称,并以红色醒目显示,为匿名终结者,且所有人都可以看到!

    幻灵九峰尽

    请输入回复置顶区的楼层数:

    匿名符

    请输入楼层数:

    使用
  • 返回顶部