存算一体技术
1.存算一体基本原理
冯·诺依曼计算机体系架构,计算与存储一直相互分离。大数据时代,以数据为中心的数据密集型技术成为主流系统设计思路,
不再仅限于数据的计算和加工,更看重的是对数据的“搬运”,从根本上消除不必要的数据流动,即计算与存储的融合(存算一体)。
在传统计算机里,存储模块是为计算服务的,设计上会考虑存储与计算的分离与优先级。
目前,存算一体包括计算型存储、存内计算、3D堆叠和类脑计算,但究竟哪一种可行,没有定论。
1)现在最为火热的存内计算技术,存内计算的核心思想很简单,就是把带权重加乘计算的权重部分存在内存单元中,
然后在内存的核心电路上做修改,让读出的过程就是输入数据与权重在模拟域做点乘的过程,相当于实现了输入的带权重累加,即卷积运算。
由于卷积运算是深度学习算法中的核心组成部分,因此存内计算非常适合AI,实现AI芯片的存算一体与算力突破。
不同于传统的数字电路计算,存内计算是用模拟电路做计算,这对存储器本身和存内计算的设计是一个全新的、需要探索的领域。
2)随着数据量的加大,功耗、存算之间的通信等需要变革,以通信的硬件实现工艺看,是采用光互联技术还是采用3D堆叠的新型封装实现高性能互联。
3)AI芯片公司还是存储芯片公司,存算一体技术应该由谁来做?
AI芯片公司来做,技术方向更多偏向于计算型存储或类脑计算。
由存储公司来做,存内计算方向则会更容易被发展和推动。
4)大脑就是一个典型的存储计算系统,仿照人脑的仿生系统是最有可能颠覆现有技术。
通过将电子元件编程为离散阻值状态,将不同权重的电子元件相互卷积,建立一个类似突触和神经元的系统,即神经拟态计算,又被称为类脑计算。
尽管类脑遥不可及,退回到现有的芯片设计上,存算一体的挑战也是十分之多,如器件方面,现有的浮栅器件存储就不适合存内计算;
在芯片的工艺上,存算一体的设计和流片周期都将会很长,甚至连现有的EDA工具,目前尚没有支持存算一体设计的。
总体来看,存算一体广泛分布在存储、计算等领域里。
2. 降低成本,市场驱动存算一体
1)可以发现存算一体的未来商用发展前景是极其不明晰的。但看向应用端,存算一体的市场发展驱动却是非常强烈的。
2)随着速度和性能要求的不断提高,如果按现有设计方法,通过不断增加处理器数量来研制超算,体型和规模会越来越大,
数据在存储器和处理器之间进出所耗费的功率会越来越多。
3)以现有技术研制的E级超算功率高达千兆瓦,需要一个专门的核电站来给它供电,其中50%以上的功耗都来源于数据的“搬运”,
本质上就是计算与存储的分离设计所致。
4)可行的技术方案包括
存储器更靠近计算器,减少数据行进距离;
让高性能存储器向三维扩展而不是朝二维延伸;
超算与闪存的结合等。