一种负载均衡的LSTM硬件加速器设计
查羿,潘红兵

A load balanced LSTM hardware accelerator design
Yi Zha,Hongbing Pan
表 1 不同平台进行稀疏矩阵向量乘运算的性能比较
Table 1 Performance comparison of sparse matrix vector multiplication operations on different platforms
CPU GPU ESE 本设计
167.6 14.5 5.36 6.68 运算时间(μs)
11.56× 31.27× 25.09× 加速比
38 202 41 7.10 功耗(W)
5.32× 1.07× 0.18× 功耗比
2.17× 29.22× 139.3× 能效比(加速比/功耗比)