师资队伍

孙羽菲

当前您的位置: 首页 > 师资队伍 > 教授 > 孙羽菲



    所属部门:软件工程系

    电子邮件:sunyf@nankai.edu.cn

       职称:研究员

    学历:博士

    导师:硕士生导师

    所学专业:计算机科学

    研究方向:深度学习、异构计算、人工智能


 

 


   个人简介

   南开大学教授,先进计算与关键软件海河实验室研究员。博士毕业于中科院计算所,本科毕业于山东大学。主要研究方向人工智能、深度学习、异构计算  等,主持参与了国家重点研发计划课题、科技委重点课题等多项国家级和省部级项目,完成了多项国际化标准协议和软件的研发和产业化。发表高质量论文三十余篇,申请专利和软著二十余项。



      科研项目、成果、获奖等情况

  先进技术类课题二期,科技委重点课题,2024-2026  主持

  先进技术类课题一期,科技委重点课题,2023-2024  主持

  支付系统的落地应用和推广,省部级项目,2023-2026  主持

  面向国产芯片的AI框架计算生态建设,横向课题,2023-2024  主持

  智能计算软件平台优化与应用,国家重点研发计划课题 2021-2023  参与

  软件平台研制,国家重点研发计划课题 2018-2021  参与

  2022年天津市科技进步一等奖

 

部分论文、专利等

[1] Haotian Wang, Yicheng Sui, Yudong Xie, Yicong Liu, Yufei Sun*, Changqing Shi, Yuzhi ZhangFixing Broken Graphs: LLM-Powered Automatic Code Optimization for DNN Programs. IEEE/ACM International Conference on Automated Software Engineering (ASE), 2025.

[2] Shi, C., Sun Y*, Chen, R., Wang, J., Guo, Q., Gong, C., Sui, Y., Jin, Y., & Zhang, Y. TransCL: An Automatic CUDA-to-OpenCL Programs Transformation Framework. ACM Transactions on Architecture and Code Optimization. (2025)

[3] 王昊天, 孙羽菲*, 隋轶丞, 王嘉豪, 石昌青, 方建滨, 张玉志. MTTorch: 面向MT-3000芯片和Transformer模型的PyTorch算子库实现与优化[J].软件学报, 2025,36(8):3896-3916

[4] 李东闻, 钟震宇, 孙羽菲*, 申峻宇, 马子智, 于川越, 张玉志. 玲珑:一个小规模的高质量中文预训练语言模型[J]. 计算机研究与发展, 2024, 62(3):682-693

[5]Gong C, Chen Y*, Luo Q, Lu Y, Li T, Zhang Y, Sun Y∗, and Zhang L. Deep Feature Surgery: Towards Accurate and Efficient Multi-exit Networks[C]//European Conference on Computer Vision. Cham: Springer Nature Switzerland, 2024: 435-451.

[6] Yicheng Sui, Yufei Sun*, Changqing Shi, Haotian Wang, Zhiqiang Zhang, Jiahao Wang, Yuzhi Zhang. Opencl-pytorch: an OpenCL-based extension of PyTorch. CCF Transactions on High Performance Computing, 6, 287–300 (2024)

[7] 钟震宇, 林勇良, 王昊天, 李东闻, 孙羽菲*, 张玉志. 一种面向通用计算设备的自动流水线并行训练框架[J]. 计算机科学, 2024,51(12):129-136.

[8]Changqing Shi, Yufei Sun*, Yicheng Sui, Yuqiao Chen, Haotian Wang & Yuzhi Zhang. oclCUB: An OpenCL parallel computing library for deep learning operators[J]. CCF Transactions on High Performance Computing, 6,319–329 (2024)

[9] 陈锐, 孙羽菲*, 郭强, 隋轶丞, 周振辉, 石昌青, 张玉志. OclDNN:一种可应用于TensorFlow的通用DNN库[J]. 计算机工程, 2023, 49(4): 138-148.

[10] 陈锐, 孙羽菲*, 程大果, 郭强, 陈禹乔, 石昌青, 隋轶丞, 张宇哲, 张玉志. TensorFlow中OpenCL核函数的实现与优化[J].计算机学报,2022,45(11):2456-2474.

[11]一种用于支付系统的令牌桶与漏桶结合的限流方法及系统,发明专利,2025 [专 利 号:ZL 202510875930.X]

[12]一种适用于支付系统的安全加密方法、设备及产品, 发明专利,2025 [专 利 号::ZL 202510098413.6]

[13] OpenCL PyTorch的实现方法.发明专利,2023.[专利申请号: 202310871880.9]

[14] 一种领域知识图谱半自动化构建的方法及装置.发明专利,2022.[专利申请号: 202211502425.3]

[15]大规模文本数据的去重方法及装置、电子设备和存储介质. 发明专利, 2022. [专利申请号: 202210700368.3]




社会兼职

先进计算与关键软件海河实验室研究员