2023年12月11日发(作者:)

存算一体AI芯片

存算一体AI芯片

近日,三星电子在顶级学术期刊 Nature 上发表了全球首个基于 MRAM(磁性随机存储器)的存内计算研究,A crossbar array of

magnetoresistive memory devices for in-memory computing,January 2022。

存内计算由于毋需数据在存储器和处理器间移动,大大降低了 AI 计算的功耗,被视作边缘 AI 计算的一项前沿研究。

新计算架构填补MRAM空白

存算一体化技术路线,处于多种存储介质百花齐放的格局。根据存储器介质的不同,目前存算一体芯片的主流研发集中在

· 易失性存储器,如SRAM、DRAM

· 非易失性存储器,如RRAM,PCM,MRAM与闪存等

比较成熟的是以SRAM和MRAM为代表的通用近存计算架构,通常采用同构众核的架构,每个存储计算核(MPU)包含:

· 计算引擎(Processing Engine, PE)

· 缓存(Cache)

· 控制(CTRL)

· 输入输出(Inout/Output, I/O)

非易失性的RRAM(电阻式随机存取存储器)和PRAM(相变随机存取存储器)是存内计算最常用的两类存储器。对比其他存储器:

· MRAM磁阻内存在运行速度、寿命、量产方面都有明显优势

· 功耗也远低于传统DRAM

· 具有非易失的特点,即断电不会丢失数据

不过一直以来,MRAM磁阻内存很难用于内存内计算,因为在标准的内存内计算架构中无法发挥低功耗优势。

三星电子的研究人员构建了一种基于MRAM的新存内计算架构,填补了这种空白。通过结构创新,实现了基于MRAM(磁阻随机存取存储

器)的内存内计算(In-Memory Computing),进一步拓展了三星的下一代低功耗人工智能芯片技术的前沿领域。

三星研究团队设计了一种名为“电阻总和”(resistance sum)的新型内存内计算架构,取代标准的“电流总和”(current-sum)架构,成功

开发了一种能演示内存内计算架构的MRAM阵列芯片,命名为“用于内存内计算的磁阻内存交叉阵列”(crossbar array of

magnetoresistive memory devices for in-memory computing)。

这一阵列成功解决了单个MRAM器件的小电阻问题,降低功耗,实现了基于MRAM的内存内计算。在执行AI计算时,MRAM内存内计算可

以做到98%的笔迹识别成功率、93%的人脸识别准确率。

论文研究并非和基于其他存储器的存内计算架构竞争。到目前为止,没有一种存储器类型在电子产品中占据绝对主导,因为不同类型的存储

器各有自身的优点和缺点。基于不同存储器的存内计算也可能发展成不同的架构。三星电子通过填补基于MRAM存储器的存内计算架构空

白,有助于存内计算发展。

如下图所示,这里缓存可以是SRAM、MRAM或类似的高速随机存储器。各个MPU之间通过片上网络(Network-on-Chip, NoC)进行连

接。每个MPU访问各自的缓存,可以实现高性能并行运算。基于高速缓存的通用近存计算架构

基于MRAM的存算一体主要有两种方案:

· 第一种方案是利用辅助外围电路,跟上述SRAM存算一体类似,如图(a)