科研学术

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
计算机(网安)学院在计算机体系结构领域顶会SC发表论文
文:王瀚生、李铭昕 来源:计算机学院 时间:2025-07-08 667

近日,计算机(网安)学院“下一代互联网数据处理技术”国家工程实验室段翰聪团队在基础数学库特征值分解研究中取得重大进展,在计算机体系结构领域重要学术会议SC'25(Supercomputing)(CCF-A类)以长文形式发表了题为“Rethinking Back Transformation in 2-stage Eigenvalue Decomposition on Heterogeneous Architectures”(重新思考异构架构上的二阶段矩阵特征值分解的反向回代)的论文。论文第一作者为计算机学院2023级博士生王瀚生(导师段翰聪教授),论文指导老师为张少帅研究员〔通信作者〕、段翰聪教授、姜徐教授、吴锡教授(成都信息工程大学),其余作者包含黄大军、邹高远、石璐。电子科技大学为该论文的第一作者单位和通讯作者单位,同时这是电子科技大学作为第一单位被该会议接收的首篇文章。

对称矩阵特征值分解(EVD)作为基础数学工具之一,广泛应用于空气动力学、量子力学、量子化学、凝聚态物理以及人工智能等多个领域,是支撑国防、工业与科研发展的重要计算环节。然而,现有的特征值分解算法在需要求解特征向量的情况下效率较低,难以充分发挥现代异构计算平台的性能潜力。针对这一问题,本论文提出了两项具有创新性的优化方法,显著提升了对称矩阵特征值分解的整体性能。

首先,论文深入分析了现有凸块追逐反向回代(BC-Back)阶段效率受限的原因,并将原有以 BLAS3 (矩阵矩阵乘法)为主的计算流程重构为更适合并行执行的 BLAS2(矩阵向量乘法) 操作流程。在此基础上,充分利用 GPU 的 SIMT 架构特性,通过合并线程组、优化寄存器使用、避免内存访问冲突等关键技术手段,实现了 BC-Back 阶段的性能突破。实验结果表明,该方法相较 MAGMA 中的实现,在相同任务下取得了约2.7倍的性能提升。

10dee62caec0f225798721f1d7ea78b8_db6a0.p 

其次,针对传统算法中分治法(D&C)、BC-Back 和条带化变换反向回代(SBR-Back)阶段串行执行的瓶颈问题,论文提出了一种全新的执行方式:将 SBR-Back 与 BC-Back 阶段完全迁移至 GPU 上运行,同时让 D&C 在 CPU 上独立并行执行。这种设计打破了原有阶段间的依赖关系,有效利用了 CPU/GPU 异构架构的优势,覆盖了 D&C 阶段的耗时影响,进一步提升了整体特征值分解的计算效率。

d5286c40177a9f7bc21754c1d3376065_db6a0.p 

通过上述两项核心优化,论文在求解特征向量的过程中大幅提升了现有算法的性能表现。实验数据显示,该方法相比当前最先进的cuSOLVER库,在整体 EVD 分解性能上实现了约2.5倍的加速,展现出在高性能数值计算领域的广阔应用前景。

 

会议介绍:

SC是计算机系统结构与高性能计算领域最具影响力的国际学术会议之一,2024年有超过两万相关领域人士参会,由美国计算机学会(ACM)和电气电子工程师学会(IEEE)合办,也是中国计算机学会(CCF)认定的A类会议。

团队介绍:

“下一代互联网数据处理技术”国家工程实验室多年来一直从事分布式系统与网络技术的研究和开发工作,近年来,主要围绕嵌入式人工智能、大模型、知识推理与发现、存储、底层基础数学库等方向广泛而深入的研究。近五年在中国计算机学会(CCF)认定的A类期刊和会议及中科院认定的一区期刊上发表40余篇学术论文。团队成员承担欧盟FP7项目、英国皇家学会、中国国家自然基金、中国博新计划基金、中央高校基金等国家级、省部级科研项目,并与华为、IBM、浙大网新等工业界企业具有良好的科研合作。同时,团队与来自英国、美国、新加坡等国家的多位知名学者与机构具有良好的合作关系,为研究营造良好的国际交流氛围。实验室具有良好的硬件条件、严谨的科研氛围、融洽的师生关系。


编辑:刘瑶  / 审核:李果  / 发布:陈伟