- Years
- 2025(1)
- 2023(1)
- Indexed by
- 中国科学引文数据库(CSCD)(1)
- 中国科技论文与引文数据库(CSTPCD)(1)
- 北京大学中文核心期刊目录(北大核心)(1)
- Journals
- 计算机工程与科学(1)
- 计算机科学与探索(1)
- Languages
- 汉语(2)
- Keywords
- 数值线性代数(2)
- 高性能计算(2)
- Cholesky分解(1)
- E级计算(1)
- 混合精度(1)
- 通用图形处理器(GPGPU)(1)
- :P.261-262,2.
- Authors
- 伍思琦(1)
- 何连花(1)
- 张少帅(1)
- 徐顺(1)
- 石璐(1)
- 邹高远(1)
- 金钟(1)
- :P.261-262,2.
Issue(2):P.261-262,2.
- Issue(2):P.261-262,2.
- Issue(2)
Issue(2):P.261-262,2.
- Issue(2):P.261-262,2.
- :P.261-262,2.
- Issue(2):P.261-262,2.
2 :P.261-262,2.
- 面向E级计算的线性代数解法器研究综述CSCDCSTPCD
- 基于Tensor Cores的新型GPU架构的高性能Cholesky分解北大核心Issue(2):P.261-262,2.稠密矩阵乘法(GEMMs)在Tensor Cores上可以实现高度优化.然而,现有的Cholesky分解的实现由于其有限的并行性无法达到Tensor Cores大部分的峰值性能.研究使用一种递归Cholesky分解的算法,通过将对角线块的递归细分,将原本的对称矩阵秩K更新(SYRK)和三角方程组求解(TRSM)操作转化为大量的通用矩阵乘法(GEMMs),从而更充分地发挥Tensor Cores的峰值性能.实验结果表明,提出的递归Cho…Previous