
所属部门:软件工程系
电子邮件:sunyf@nankai.edu.cn
职称:研究员
学历:博士
导师:硕士生导师
所学专业:计算机科学
研究方向:深度学习、异构计算、人工智能
南开大学教授,先进计算与关键软件海河实验室研究员。博士毕业于中科院计算所,本科毕业于山东大学。主要研究方向人工智能、深度学习、异构计算 等,主持参与了国家重点研发计划课题、科技委重点课题等多项国家级和省部级项目,完成了多项国际化标准协议和软件的研发和产业化。发表高质量论文三十余篇,申请专利和软著二十余项。
科研项目、成果、获奖等情况
先进技术类课题二期,科技委重点课题,2024-2026 主持
先进技术类课题一期,科技委重点课题,2023-2024 主持
支付系统的落地应用和推广,省部级项目,2023-2026 主持
面向国产芯片的AI框架计算生态建设,横向课题,2023-2024 主持
智能计算软件平台优化与应用,国家重点研发计划课题 2021-2023 参与
软件平台研制,国家重点研发计划课题 2018-2021 参与
2022年天津市科技进步一等奖
[1] Haotian Wang, Yicheng Sui, Yudong Xie, Yicong Liu, Yufei Sun*, Changqing Shi, Yuzhi ZhangFixing Broken Graphs: LLM-Powered Automatic Code Optimization for DNN Programs. IEEE/ACM International Conference on Automated Software Engineering (ASE), 2025.
[2] Shi, C., Sun Y*, Chen, R., Wang, J., Guo, Q., Gong, C., Sui, Y., Jin, Y., & Zhang, Y. TransCL: An Automatic CUDA-to-OpenCL Programs Transformation Framework. ACM Transactions on Architecture and Code Optimization. (2025)
[3] 王昊天, 孙羽菲*, 隋轶丞, 王嘉豪, 石昌青, 方建滨, 张玉志. MTTorch: 面向MT-3000芯片和Transformer模型的PyTorch算子库实现与优化[J].软件学报, 2025,36(8):3896-3916
[4] 李东闻, 钟震宇, 孙羽菲*, 申峻宇, 马子智, 于川越, 张玉志. 玲珑:一个小规模的高质量中文预训练语言模型[J]. 计算机研究与发展, 2024, 62(3):682-693
[5]Gong C, Chen Y*, Luo Q, Lu Y, Li T, Zhang Y, Sun Y∗, and Zhang L. Deep Feature Surgery: Towards Accurate and Efficient Multi-exit Networks[C]//European Conference on Computer Vision. Cham: Springer Nature Switzerland, 2024: 435-451.
[6] Yicheng Sui, Yufei Sun*, Changqing Shi, Haotian Wang, Zhiqiang Zhang, Jiahao Wang, Yuzhi Zhang. Opencl-pytorch: an OpenCL-based extension of PyTorch. CCF Transactions on High Performance Computing, 6, 287–300 (2024)
[7] 钟震宇, 林勇良, 王昊天, 李东闻, 孙羽菲*, 张玉志. 一种面向通用计算设备的自动流水线并行训练框架[J]. 计算机科学, 2024,51(12):129-136.
[8]Changqing Shi, Yufei Sun*, Yicheng Sui, Yuqiao Chen, Haotian Wang & Yuzhi Zhang. oclCUB: An OpenCL parallel computing library for deep learning operators[J]. CCF Transactions on High Performance Computing, 6,319–329 (2024)
[9] 陈锐, 孙羽菲*, 郭强, 隋轶丞, 周振辉, 石昌青, 张玉志. OclDNN:一种可应用于TensorFlow的通用DNN库[J]. 计算机工程, 2023, 49(4): 138-148.
[10] 陈锐, 孙羽菲*, 程大果, 郭强, 陈禹乔, 石昌青, 隋轶丞, 张宇哲, 张玉志. TensorFlow中OpenCL核函数的实现与优化[J].计算机学报,2022,45(11):2456-2474.
[11]一种用于支付系统的令牌桶与漏桶结合的限流方法及系统,发明专利,2025 [专 利 号:ZL 202510875930.X]
[12]一种适用于支付系统的安全加密方法、设备及产品, 发明专利,2025 [专 利 号::ZL 202510098413.6]
[13] OpenCL PyTorch的实现方法.发明专利,2023.[专利申请号: 202310871880.9]
[14] 一种领域知识图谱半自动化构建的方法及装置.发明专利,2022.[专利申请号: 202211502425.3]
[15]大规模文本数据的去重方法及装置、电子设备和存储介质. 发明专利, 2022. [专利申请号: 202210700368.3]
社会兼职
先进计算与关键软件海河实验室研究员