AI芯片需求将推动这个“老”架构复兴!

半导体业长期以来是将存储与处理器分别设计配置,即便是芯片内的嵌入式存储,其电路区块也是与处理单元各自分立,并让两区块间透过总线传递存取信息。

而所谓的存储内处理器(Processor In Memory, PIM)(图1),或称存储邻近处理器(Processor Near Memory, PNM)、存储内运算(In-Memory Compute, IMC)等,则是在芯片电路设计时即以存储的矩阵存储电路为基础,再行加搭起运算电路,使存储与运算电路几乎融为一体。

1.左图为现行处理单元与存储间有读写(Fetch提取、Store存入)的瓶颈,右图为PIM作法可消除运算与储存间的传输瓶颈。资料来源:IBM



深度学习需要的运算量不断提高,特别是在支援自驾车应用上,2017年NVIDIA提出自驾车运算平台DRIVE PX PEGASUS,宣称合并两张DRIVE PX PEGASUS可获得320TOPS(8位元整数)的人工智能推论运算力,目标在于支援ADAS标准最高的Level 5自驾层级,即各种路况与情境下均能全程自动化驾驶不需人为介入,然代价是500瓦功耗,对汽车电瓶亦是不小负荷。

由于传统方式提升运算(特别是深度学习运算)效能日益困难,因此产业开始尝试回望PIM技术。PIM技术因存储电路与处理电路两者紧邻,传输距离短,可 快速传递运算,而深度学习所需要的「网状层次连接、节点加权运算」亦容易以PIM方式实现,存储内储存的信息即是节点的权重(Weight,或称特征权重),运算 后的结果再向更深层的节点传递,进行相同的乘积累加运算(简称乘加运算Multiply Accumulate, MAC),最终得到深度学习的运算结果。

以PIM方式实现深度学习运算,理论上可比传统作法更轻易达到效能提升,且是以省电方式提升,即TOPS/Watt表现佳(类同于每瓦效能Per Watt Performance的概念),若坚持传统作法估计只能以更大的功耗代价带来些许提升。


2.IBM运用相变存储储存神经网络中的权重  资料来源:IBM

首先为存储类型,PIM必须以一种存储电路为基础发展其执行处理电路,以Mythic与Syntiant而言均是以嵌入式NOR Flash电路为主,IBM则以相变存储 (Phase-Change Memory , PCM)为基础(图2)。由于重新启动的PIM技术着重在神经网络运算,因此业者也积极尝试各种新型存储以支援执行运算设计,而不限定使用已 大宗运用的存储,如考虑MRAM/STT MRAM、RRAM/ReRAM等,新兴与利基型存储于PIM领域具有发展机会。



  江苏时代全芯存储科技股份有限公司(AMT一直专注在相变存储领域,且与IBM保持紧密的合作关系,AMT的林仲汉博士(Dr. Chung Lam)曾担任IBM研发中心PCM项目负责人13年, 现正领导AMT各地研发中心的科学家和工程师研发基于相变存储技术(PCM)的神经网络AI芯片。

END


文:新电子

排版:张乐辰

扫描二维码

关注我们





2019年8月7日

企业动态