当前位置:主页 > 关注 > 科技 > 正文

轻量级架构:智能语音专用芯片的另类路径 | 智东西公开课

2018-10-27 22:09 来源: 编辑:

核心提示

原标题:轻量级架构:智能语音专用芯片的另类路径 | 智东西公开课 本文根据中天微资深设计经理、智能语

原标题:轻量级架构:智能语音专用芯片的另类路径 | 智东西公开课

本文根据中天微资深设计经理、智能语音平台负责人劳懋元,在「智东西公开课」的超级公开课中天微专场第1讲《轻量级的RISC架构如何实现端测智能语音应用》 上的系统讲解整理而来。

从2015年起,智能语音芯片已经演进了三代。时至今日,CPU+DSP+NPU架构逐渐成为智能语音专用芯片未来的趋势。但中天微探索出通过轻量级的RISC架构来实现端侧的智能语音应用。为了解决RISC在做一些人工智能或者深度神经网络应用时存在的算力不足的缺陷,中天微提出融入DSP的并行计算能力,即在一个短流水级的CPU基础上,把DSP 128位宽的SIMD并行处理能力融进来,使得新款CPU能够被应用在智能语音等轻量级人工智能上。这是一个有些另类的创新路径,中天微也希冀得到更大范围的认可和采用,从而更快地搭建起以智能语音为核心的人工智能生态。

主讲环节

劳懋元:今天主要从四个方面来分享:首先,从对市场的观察和理解切入,之后会慢慢深入到对智能语音芯片的理解以及我们所取得的一些成绩;其次,从技术原理本身出发,RISC中的一些细分,以及在重的架构和轻的架构之间如何去取舍;最后分享一下智能语音TURNKEY方案。

一、智能语音市场现状分析

从市场的角度来看,谈到智能音箱,时间点要回溯到2015年下半年。当时Amazon推出了第一款智能音箱Echo,从此拉开了整个智能音箱的序幕。当时间过渡到2016年,智能音箱有了进一步的发展,第二大势力Google就出现了,推出了Google Home。市场资料表明,到目前为止,国外市场上,Amazon和Google基本上是七三开的两强局面。相对来说,国内在技术研发上会稍微滞后一些。整体爆发出现在2017年,俗称“百箱大战”,几十将近一百个智能音箱纷纷出现。到今年上半年,阿里巴巴推出了一款新的比较小巧的智能音箱,叫做天猫方糖,直接把智能音箱的价格杀到了89元的低价区间。同样,大家也能看到,小米也有类似低价的智能音箱出现。从2018年开始,整个市场的趋势不是以量取胜,而是逐渐开始低价渗透,以及开始比拼各家生态的打造。从最新的市场统计来看,目前全球范围主要有四家,分别是Amazon、Google、阿里巴巴以及小米。

看完智能音箱的发展史,我想跟大家探讨一些问题:

第一,相比于传统音箱,智能音箱还是音箱吗?还是更准确地说是人工智能助手,或者是未来智能家庭的总控,亦或者是互联网企业称之为的流量入口?

第二,智能音箱是否代表着整个智能语音未来的市场?是不是也会像手机、平板或者PC这种单一品项的一种状态?

我认为不是的。智能语音其实是一种交互方式,可以被应用在各种类型的设备当中。从我个人对市场的判断来说,它才是一个真正意义上的超级大饼,会涉及到更多的细分领域。因此,对智能语音这项技术的研究以及成熟方案的推动是非常有意义的。这也是中天微从2016年年初就建立团队投入资源,并且持续两年半的时间一直在做这件事情的初衷。

接下来跟大家分享一些除了智能音箱,其他搭载着智能语音功能的产品。首先是家电,不管是大家电还是小家电都会带有语音功能,比如空调、微波炉或者油烟机等产品也陆续出现。今年上半年,阿里巴巴也推出了真正远场智能语音的电视机;第二,在儿童玩具市场上,不管是儿童故事机或者是一些称之为儿童陪伴型的机器人玩具,我们也能看到智能语音交互的方式。它让孩子与玩具之间有一个非常好的互动;第三,在穿戴式设备上,比如儿童手表、智能手表等都加装了语音交互功能,使得小孩子用语音操作变得更加方便;第四,一些母婴类的摄像头上也加装了这样的功能。

除了以上四个之外,还有很多领域正在做进一步的尝试,去创造一些新的场景,以及在怎样的一个场景之下会使用到智能语音交互的方式,我们可以期待和预期到在未来会有更多的一些产品出现。这也是我前面说的超级大饼。

简单总结一下,智能语音是一种崭新的人机交互方式,更贴近于人类自然的一种交流方式,会带来一场可以称之为交互方式的升级,亦或者是产品的升级,并且波及到的产品领域和范围,将会远远超过之前所有的产品。

二、智能语音芯片不同架构解读

现在从技术的角度来展开一下,先回顾一下几个技术点。

首先是RISC,精简指令集计算机的缩写。既然有一个叫做精简指令集,对应的一定有一个叫做复杂指令集。比较广为人知的如Intel或者AMD x86型CPU都是复杂指令集的,而中天微的C-SKY CPU或者ARM CPU都是精简指令集的CPU。

RISC诞生于上世纪80年代,从名字可以看出,既然叫精简指令集,那么指令数量就比较少。它的特点是指令的格式、执行周期是一致的,一般都采用流水线技术;从存储架构上来说,一般会用冯诺依曼架构。冯诺依曼架构可以简单理解为,它会把程序段跟数据段都存在同一个地方,本身的计算核心是算术逻辑单元ALU。有几个比较知名的地方,首先是斯坦福大学,另外一个是加州大学伯克利分校,他们在RISC方面有着非常大的贡献。特别值得提到的是加州大学伯克利分校,有一位非常著名的教授叫做David Patterson。他是RISC体系的创始者,在上世纪80年代就已经在做RISC项目。最近非常火热的RISC-V是在2010年开始研发的新项目,希望能够做成一个开源的指令体系,背后也有非常多国内外一些大企业在积极推动。中天微最近也发布了第一款基于RISC-V指令集的CPU核。另外,大家比较熟悉的还有MIPS、 IBM的Power PC。

讲完RISC,我们再来聊一下DSP。很多电子专业毕业的人,在学生时代都学过一门课叫做DSP——数字信号处理。该技术也是诞生于上世纪80年代。数字信号处理的特点是把自然界的模拟信号转成数字信号,再通过专门的数字信号处理器去进行一些复杂的处理。因此,它的出现主要是针对一些快速实时性数字信号的处理。同样,它也是采用流水线技术,强调计算能力,所以会使用一些如SIMD这样的存储技术,会用哈佛结构把数据和程序分开。在这个领域中,大家比较熟悉的可能是德州仪器、Freescale以及Motorola等这些企业,现在能提供DSP IP的也有两家,一家是CEVA,一家是Tensilica。

相对于前两者来说,NPU(神经网络处理器)是一个比较新的概念。AI也是这两年突然变得非常火热,很多人开始去研究神经网络,甚至去设计神经网络处理器。我们也非常幸运能够处在这样的一个时代,刚好赶上了神经网络发展这一波浪潮。神经网络处理器到目前为止,还没有一个非常准确的定义,包括体系架构或者指令架构,目前来说是百花齐放,没有一个统一的标准。大家比较熟悉的,如Google和NVIDIA。Google推出了TPU,NVIDIA一直把GPU技术用在神经网络的一些训练以及推断上。国内现在比较出名的有寒武纪,麒麟970中也用了寒武纪的NPU;还有地平线,在智能驾驶,语音方面也有非常独到的成绩。因此,目前国内从事神经网络以及相关技术研究的企业也是非常的多,NPU最终会变成一个什么样的统一标准,大家可以拭目以待。