AI芯片需求将推动这个“老”架构复兴！

半导体业长期以来是将存储与处理器分别设计配置，即便是芯片内的嵌入式存储，其电路区块也是与处理单元各自分立，并让两区块间透过总线传递存取信息。

而所谓的存储内处理器(Processor In Memory, PIM)(图1），或称存储邻近处理器(Processor Near Memory, PNM)、存储内运算(In-Memory Compute, IMC)等，则是在芯片电路设计时即以存储的矩阵存储电路为基础，再行加搭起运算电路，使存储与运算电路几乎融为一体。

图1.左图为现行处理单元与存储间有读写(Fetch提取、Store存入)的瓶颈，右图为PIM作法可消除运算与储存间的传输瓶颈。资料来源：IBM

深度学习需要的运算量不断提高，特别是在支援自驾车应用上，2017年NVIDIA提出自驾车运算平台DRIVE PX PEGASUS，宣称合并两张DRIVE PX PEGASUS可获得320TOPS(8位元整数)的人工智能推论运算力，目标在于支援ADAS标准最高的Level 5自驾层级，即各种路况与情境下均能全程自动化驾驶不需人为介入，然代价是500瓦功耗，对汽车电瓶亦是不小负荷。

由于传统方式提升运算(特别是深度学习运算)效能日益困难，因此产业开始尝试回望PIM技术。PIM技术因存储电路与处理电路两者紧邻，传输距离短，可快速传递运算，而深度学习所需要的「网状层次连接、节点加权运算」亦容易以PIM方式实现，存储内储存的信息即是节点的权重(Weight，或称特征权重)，运算后的结果再向更深层的节点传递，进行相同的乘积累加运算(简称乘加运算Multiply Accumulate, MAC)，最终得到深度学习的运算结果。

以PIM方式实现深度学习运算，理论上可比传统作法更轻易达到效能提升，且是以省电方式提升，即TOPS/Watt表现佳(类同于每瓦效能Per Watt Performance的概念)，若坚持传统作法估计只能以更大的功耗代价带来些许提升。

图2.IBM运用相变存储储存神经网络中的权重资料来源：IBM

首先为存储类型，PIM必须以一种存储电路为基础发展其执行处理电路，以Mythic与Syntiant而言均是以嵌入式NOR Flash电路为主，IBM则以相变存储 (Phase-Change Memory , PCM)为基础（图2）。由于重新启动的PIM技术着重在神经网络运算，因此业者也积极尝试各种新型存储以支援执行运算设计，而不限定使用已大宗运用的存储，如考虑MRAM/STT MRAM、RRAM/ReRAM等，新兴与利基型存储于PIM领域具有发展机会。

江苏时代全芯存储科技股份有限公司（AMT一直专注在相变存储领域，且与IBM保持紧密的合作关系，AMT的林仲汉博士(Dr. Chung Lam)曾担任IBM研发中心PCM项目负责人13年，现正领导AMT各地研发中心的科学家和工程师研发基于相变存储技术（PCM）的神经网络AI芯片。

END

文：新电子

排版：张乐辰

扫描二维码

关注我们

2019年8月7日

ꂃ上一篇：无

ꁹ下一篇：无

企业动态