PaperNotes
PaperNotes copied to clipboard
Eyeriss: A Spatial Architecture for Energy-Efficient Dataflow for Convolutional Neural Networks
论文贡献:
-
针对CNN,提出了新型的数据流模式,row-stationary, 挖掘数据重用的潜力,最小化了数据移动过程中的能量消耗
-
按照数据移动的能耗,将加速器的存储分成四个层级,off chip-DRAM, global buffer, i/o FIFO, RF,越常被重用的数据,存储的层级越低,访问的开销越小。

-
传统CNN加速器架构只针对权重或者累加和进行数据的重用。而eyeriss可以通过配置,实现不同存储层次上的权重和累加数据的重用,避免了反复写回片外存储带来的巨大开销

-
加速器上有两个时钟,一个是global buffer访问内存的时钟,一个是PE做计算的核心时钟。区分开来的好处是可以异步访问内存,方便预取
-
每个PE上都有一个状态机,当操作数就绪时,每个PE可以立即执行运算操作,而无需等待所有PE就绪。
思考:
- Eyeriss 提出的四层存储结构很好地降低了数据移动的开销
- 每个PE上的状态机也避免了PE数量过多,导致等待其他PE就绪时间过长
- 论文通篇围绕 提高数据重用 而设计,目的性强,没有冗余结构