meton-robean
meton-robean
https://carrv.github.io/2020/papers/CARRV2020_paper_3_Xu.pdf
https://dl.acm.org/doi/pdf/10.1145/3079856.3080255 重点介绍了流加速器的通用设计框架,也包括了软件层面如何做出修改适应加速器。
[PuDianNao: A Polyvalent Machine Learning Accelerator](https://dl.acm.org/doi/pdf/10.1145/2786763.2694358)
一个基于Rocket和BOOM的 脉动矩阵加速器 PDF: https://arxiv.org/pdf/1911.09925.pdf  探究: - 不同参数配置(bus 协议, 数据流模式(权重固定WS还是输出固定OS),PE 数目,内存容量,矩阵pipeline深度, 系统参数,stratchpad容量, stratchpad bank数目,数据类型)对加速器的影响,可以利用generator的可配置性方便生成。 - 基于RocketChip的RoCC接口 - 使用FireSim 进行全系统(Linux)仿真
PDF: https://arxiv.org/pdf/1903.06495.pdf
参考: [能效优先:eyeriss CNN加速器的设计思路](https://zhuanlan.zhihu.com/p/91864795)
[Architectural Specialization for Inter-Iteration Loop Dependence Patterns](http://www.csl.cornell.edu/~cbatten/pdfs/srinath-xloops-micro2014.pdf) [会议ppt](https://apps.dtic.mil/dtic/tr/fulltext/u2/1000290.pdf) 这个项目没有开源,但是公布了benchmark: https://github.com/cornell-brg/xloops-bmarks 创新点是根据循环的分类,自定义两种指令,其实本质是: 不是简单的新加指令,而是从**指令的角度去看待,给指令增加一点新的语义信息**,可以看做是一种**语义标签**,来使得后面的加速硬件可以识别循环内那几条特殊标记的指令,从而调度循环加速。 参考借鉴点是其对各种**循环的分类角度** 以及 对循环内的**某些指令的区分**(例如特别区分了循环中用于地址计算的 迭代计算指令 ,标记为addi.xi)
[The Hwacha Microarchitecture Manual, Version 3.8.1](https://people.eecs.berkeley.edu/~krste/papers/EECS-2015-263.pdf)
[Centrifuge: Evaluating full-system HLS-generated heterogenous-accelerator SoCs using FPGA-Acceleration](https://people.eecs.berkeley.edu/~qijing.huang/Centrifuge_ICCAD.pdf) **高层次综合生成verilog, 和firesim的结合**
[FireSim PAPER](https://sagark.org/assets/pubs/firesim-isca2018.pdf) https://github.com/firesim/firesim