一种负载均衡的LSTM硬件加速器设计
查羿,潘红兵
A load balanced LSTM hardware accelerator design
Yi Zha,Hongbing Pan
表 1
不同平台进行稀疏矩阵向量乘运算的性能比较
Table 1
Performance comparison of sparse matrix vector multiplication operations on different platforms
CPU
GPU
ESE
本设计
167.6
14.5
5.36
6.68
运算时间(μs)
1×
11.56×
31.27×
25.09×
加速比
38
202
41
7.10
功耗(W)
1×
5.32×
1.07×
0.18×
功耗比
1×
2.17×
29.22×
139.3×
能效比(加速比/功耗比)