师资队伍

孙羽菲

当前您的位置: 首页 > 师资队伍 > 特聘研究员 > 孙羽菲 > 正文

孙羽菲

发布日期:2025-03-25 浏览量:



    所属部门:软件工程系

    电子邮件:yufei_sun@sina.com

    学历:博士

    导师:硕士生导师

    所学专业:计算机体系结构

    研究方向:深度学习、异构计算、人工智能


 

 


   个人简介

南开大学软件学院特聘研究员,毕业于中国科学院计算技术研究所获博士学位。主要研究方向人工智能、深度学习、异构计算、大模型等,主持参与了国家重点研发计划课题、科技委重点课题等多项国家级和省部级项目,完成了多项国际化标准协议和软件的研发和产业化。在国内外期刊和学术会议发表论文近三十篇,申请专利和软著二十余项。


科研项目、成果、获奖等情况

先进技术类课题,科技委重点课题,2024-2026

支付系统的落地应用和推广,省部级项目,2023-2026

面向国产芯片的AI框架计算生态建设,登临合作课题,2023-2024

智能计算软件平台优化与应用,国家重点研发计划课题 2021-2023

XXX软件平台研制,国家重点研发计划课题 2018-2021

2022年天津市科技进步一等奖

 

部分论文


 [1] Shi, C., Sun Y*, Chen, R., Wang, J., Guo, Q., Gong, C., Sui, Y., Jin, Y., & Zhang, Y. TransCL: An Automatic CUDA-to-OpenCL Programs Transformation Framework. ACM Transactions on Architecture and Code Optimization. (2025)

[2]王昊天, 孙羽菲*,隋轶丞,王嘉豪,石昌青,方建滨,张玉志. MTTorch:面向MT-3000芯片和Transformer 模型的PyTorch算子库实现与优化[J].软件学报,2024

[3]Sui Y, Sun Y*, Shi C, et al. Opencl-pytorch: An OpenCL-based extension of PyTorch[J]. CCF Transactions on High Performance Computing, (2024) 6:287-300

[4]李东闻,钟震宇,孙羽菲*,申峻宇,马子智,于川越,张玉志.玲珑:一个小规模的高质量中文预训练语言模型[J/OL].计算机研究与发展. 2024

[5]Gong C, Chen Y*, Luo Q, Lu Y, Li T, Zhang Y, Sun Y∗, and Zhang L. Deep Feature Surgery: Towards Accurate and Efficient Multi-exit Networks[C]//European Conference on Computer Vision. Cham: Springer Nature Switzerland, 2024: 435-451.

[6]钟震宇,林勇良,王昊天,李东闻, 孙羽菲*,张玉志.一种面向通用计算设备的自动流水线并行训练框架[J].计算机科学,2024,51(12):129-136.

[7]Shi C, Sun Y*, Sui Y, et al. oclCUB: An OpenCL parallel computing library for deep learning operators[J]. CCF Transactions on High Performance Computing, 2024: 319-329

[8]陈锐, 孙羽菲*, 郭强, 隋轶丞, 周振辉, 石昌青, 张玉志. OclDNN:一种可应用于TensorFlow的通用DNN库[J]. 计算机工程, 2023, 49(4): 138-148.

[9] 陈锐, 孙羽菲*, 程大果, 郭强等. TensorFlow中OpenCL核函数的实现与优化[J]. 计算机学报,2022,45(11):2456-2474

[10] 陈禹乔,孙羽菲*,程大果,张玉志,周建宇,隋轶丞,石昌青. TensorFlow框架中OpenCL核函数的测试验证方案设计与实现[J]. 数据与计算发展前沿, 2022, 4(2): 17-28.

[11] 李东闻,钟震宇,申峻宇,王昊天,孙羽菲*,张玉志等. NKCorpus:利用海量网络数据构建大型高质量中文数据集[J].数据与计算发展前沿, 2022, 4(3):30-45

[12] OpenCL PyTorch的实现方法.发明专利,2023.[专利申请号: 202310871880.9]

[13] 一种领域知识图谱半自动化构建的方法及装置.发明专利,2022.[专利申请号: 202211502425.3]

[14]大规模文本数据的去重方法及装置、电子设备和存储介质. 发明专利, 2022. [专利申请号: 202210700368.3]

[15] OpenCLCUB库的实现方法及装置、电子设备和存储介质. 发明专利, 2022. [专利申请号: 202210698398.5]


社会兼职

先进计算与关键软件海河实验室研究员