首页 >> 民生呼声

英特尔第一代神经网络计算棒正式进入停产退节能

民生呼声  2020-10-19 22:37 字号: 大 中 小

英特尔第一代神经络计算棒正式进入停产退市阶段

5月6日消息,Intel近日发布通知,第一代神经络计算棒“Movidius Neural Compute Stick”(NCS)正式进入停产退市阶段。Intel Movidius NCS发布于2017年中,U成交均价2161元/吨。盘造型,USB 3.0 Type-A通用接口,内置Myriad 2 VPU视觉计算处理器,支持Caffe深度学习框架,可提供最多100GFlops算力,功耗仅1W,主要面向需要计算视觉、深度学习加速的小型设备。

根据安排,Movidius NCS将在今年10月30日停止接受订单,明年4月30日停止供货,技术支持则延续到2021年4月30日。

英特尔本周开启其Movidius神经计算棒的终止计划,该计划基于Myriad 2 VPU,是一款专用USB推理引擎,用于了解神经络的性能。英特尔将继续为该设备提供两年的技术支持。对于目前正在研究由NCS提供支持的产品的开发人员,英特尔建议转向更先进的基于Myriad X的神经计算棒2。

英特尔Movidius神经计算棒最早在2017年中期推出,可提供高达100 GFLOPS/1TOPS的计算能力。 USB计算棒主要针对需要计算视觉和/或深度学习加速器的低功耗产品的开发人员,开发人员既可以在NCS上进行原型设计,也可以在生产设备中直接使用它。

此后,英特尔发布了功能更强大的Myriad X VPU,它提供了四倍的TOPS性能并提供了更好的功能集。此外,英特尔还提供各种基于Myriad系列VPU的视觉加速器产品以及各种外形尺寸的Arria系列FPGA。

英特尔NCS与Myriad X支持的更高级解决方案之间的主要区别之一是,前者使用英特尔专有的Movidius神经计算SDK,后者依赖于英特尔分销的OpenVINO工具包,该工具包兼容开源的OpenVINO行业标准软件包。

随着新的硬件和SDK的推出,以及AI ASIC的整体市场迅速升级,看起来市场正在逐渐减少对Movidius NCS的需求。因此,英特尔将于2019年10月30日停止售卖该硬件,并将于2020年4月30日出货所有未完成的订单,但继续为该部件提供技术支持直到2021年4月30日。因此,Movidius NCS的寿命要比Myriad X(2017年推出)短得多。

去年底发布的第二代产品维持U盘造型,内置最新的Intel Movidius Myriad X VPU,集成16个SHAVE计算核心、专用深度神经络硬件加速器,可以极低的功耗执行高性能视觉和AI推理运算。

新一代产品支持TensorFlow、Caffe开发框架,图像分类性能高出约5倍,物体检测性能则高出约4倍,可让开发者更智能、更高效地开发和部署深度神经络(DNN)应用,满足新一代智能设备的需求。

人工智能的热潮正在席卷各个行业,如何让各式各样的设备都智能化已成为研究热点。机器学习中最流行的深度学习通常需要较大的计算量,因此服务器加上高性能显卡成为最常见的选择。不过,此类组合平台在功耗和体积上都存在较大限制,无法使用在终端设备或者物联设备,如监控摄像头、无人机等。针对这种情况,比较可行的方法是将数据通过络发送到云端服务器,但这会耗费大量络流量和带宽,并且很难保证计算的实时性。另外一个方法是使用专用芯片或FPGA加速,在性能和功耗方面取得折中,但这种方法的开发门槛较高且周期长,部署的时候需要设计定制化的电路板和供电系统。

针对上述问题,英特尔给出了自己的方案——英特尔Movidius™神经元计算棒!

一个小小的计算棒如何能加速客户端计算?让我们一起走进Movidius™神经元计算棒,了解其基本结构、实用工具和编程方法,让大家能够更好地了解其在计算、开发、部署方面的特性。

Movidius神经络加速芯片

Movidius神经络加速芯片是整个技术的核心。Movidius提供代号为Myraid的VPU(Video Processing Units),当前正在推广是Myraid2 MA2X5X系列,其两款产品MA2150和MA2155的主要差异在于内存大小:前者为1G内存, 后者为4G内存。Myraid2提供大概1T Flops的计算能力,功并且实质性的利好仍在不断出现耗均值约为1瓦。

Myraid2芯片结构如上图所示,2个轻量级CPU运行一个实时系统RTOS,管理各种外设,读取卷积神经络模型。芯片的核心部件是向量计算单元(SHAVE),这种单元最多有12个,参与计算的SHAVE数量将会直接影响程序性能。橙色方块是一些图像处理专用加速器,如锐化、去噪、缩放等,这种加速器在目前的开发工具中尚无法使用,将在以后的版本中开放支持。

Movidius会为特定的客户提供开发板,但对普通用户而言,通用、简单的接口和封装往往更受欢迎。英特尔Movidius推出了基于Myraid2芯片的神经元计算棒,将所有的功能封装到了U盘大小的设备中,用户只需要将计算棒插入USB 2.0(推荐USB3.0)以上的接口中,即可享用机器学习的强大功能。

Movidius开发套件可以从 免费下载。开发套件主要包含了三部分:函数库、工具和开发实例,当前推荐的开发环境为Ubuntu 16.04,x86_64。为了支持更多IOT设备,Raspberry Pi也可以运行。

需要注意的是,Movidius™神经元计算棒主要是用于做深度学习的模型推理,而对模型的训练建议使用其他平台。

当用户考虑将已经训练好的模型在神经元计算棒上使用时,总是迫不及待想知道其性能,SDK中有一个非常有用的profiler工具可以把用户的模型加载到计算棒中,快速进行性能验证。在bin目录下的运行c,将模型作为参数输入,并用参数-s 来设定SHAVE的个数。SHAVE越多性能越好,最多为12个。

上图是验证Alexnet在Myraid2上使用12个SHAVE的性能,工具会给出模型中每层的运行时间和内存的消耗情况。当使用12个SHAVE时,Alexnet运行一次的时间为89.06 ms,而使用1个SHAVE时,其运行时间为281.06 ms。

目前Movidus开发套件支持C和Python3编程,在SDK中有很多例子,如常见的Alexnet, Googlenet, Squeezenet等都有实例,用户可以很快上手。如果单个计算棒的性能不够,还可以使用多个进行加速,取得线性加速比。

Movidius计算平台帮助开发者快速构建神经络加速器,推动人工智能的应用。目前已经在无人机、AR、机器人甚至是可穿戴设备上得到应用 。如大疆最新的无人机Spark采用了Myraid2芯片来加速图像处理算法,Google的Clips也采用Movidius 芯片来加速机器学习算法。下一代MyraidX芯片将会带来更强的计算能力和更低能耗比,为用户带来更多选择。

文章来源:驱动之家

宝鸡白癜风重点医院
脑出血前兆
儿童止咳药
推荐资讯