引言深度神经网络是目前人工智能领域的研究重点.在图像分类[1]、语音识别[2]等领域,深度神经网络以其远超传统算法的精度,成为了目前最广泛采用的算法之一.然而,目前的计算平台所能够提供的计算能力和能量效率与深度神经网络所需要的巨大计算量之间存在着很大差距.以一个大型的卷积神经网络(CNN)模型VGG-19[3]为例,该模型包含超过500MB的模型参数,针对一张224×224的图片进行一次分类,需要390亿次浮点计算.这意味着运行神经网络的过程需要较高的功耗或较长的时间.因此,在很多应用场景下,部署神经网络很难满足应用的速度需求或超出平台的功耗限制.

