# 个人简介

我目前是大连理工大学软件学院将于 26 年 6 月毕业的研三学生,就读于大连理工大学软件优化组,导师是李晓晨老师。研究方向:深度学习(包括图像、文本处理模型)、大语言模型预训练

求职意向:26 届秋招,大语言模型(预训练)/ 视觉大模型 / 计算机视觉

# 教育背景

# 本科

2019~2023,本科就读于中国地质大学(武汉)计算机学院,智能科学与技术专业

研究方向:深度学习(目标检测)
课程:数据结构、操作系统、算法分析与设计、人工智能导论、机器学习、深度学习、计算机视觉、图像处理、自然语言处理、智能优化算法等
绩点:3.818/5.0,专业排名:5/67,通过 CET-6,获得优秀毕业生

# 硕士

2023~2026,研究生就读于大连理工大学软件学院,软件工程专业

研究方向:深度学习(文本处理模型)、大语言模型预训练
保研,获得一等硕士生奖助学金

# 专业技能

分类描述
编程语言熟练使用 Python、C++、Java
基础技能熟悉 Linux 系统(常用 Ubuntu、Arch、CentOS),Git/Gerrit 版本控制,LaTeX/Markdown 语法

开发能力

  • C++ 开发:MFC(电梯智能群控系统)、Qt(磁盘管理)、OpenCV(AI Canteen
  • Java 开发:Spring Boot+Bootstrap+MyBatis(学生作业批改系统)、Android(AI Canteen
算法基础数据结构,机器学习,深度学习,数学建模 (Python), 计算机视觉,自然语言处理,群体智能优化算法

深度学习框架

  • 熟悉 PyTorch 框架,熟悉 NVIDIA Megatron / 阿里 Pai-Megatron-Paich 框架
  • 了解 DeepSpeed、华为 MindSpore、腾讯 ncnn 框架

深度学习模型

  • 熟悉 Transformer、BERT、GPT、Qwen 等模型尤其是 MoE 模型
  • 熟悉目标检测模型(YOLO 系列、Faster R-CNN 等)
  • 了解 ViT、Swin Transformer 等视觉模型

# 实习经历

中兴通讯算法部,大语言模型预训练;时间:2023.06 至今

参与中兴通讯大语言模型的预训练工作,工作内容和掌握技能如下:
(1)调研大语言模型的最新研究进展,了解不同模型(如 GPT、BERT、Qwen、DeepSeek 等)。了解相关提速增效的改进方法:Dynamic MoE、MoE++、细粒度专家,Muon 优化器等,具备前沿技术融入框架的代码能力,会模型测评
(2)熟悉 NVIDIA Megatron 和阿里 Pai-Megatron-Paich 框架、Transformer Engine 库,掌握多机多卡环境下的大语言模型训练和调优方法,了解并行策略、混合精度训练、梯度聚合等技术
(3)熟练使用前沿的训练提速方法(GroupedGEMM、permute 算子、FlashAttention/FusedAttention),同时熟练使用 trace 分析瓶颈点

# 项目经历

# 基于非自回归模型的 Verilog 行级代码补全

角色:负责人,独自完成;时间:2023.01~2023.04

基于非自回归模型的 Verilog 行级代码补全方法,与传统的基于自回归模型的代码补全方法不同,使用了非自回归模型,解码阶段无需依赖之前的输出 token 能并行生成所有 token,具有更小的延迟,推理速度显著提升。此外,还采用了混合语法引导的采样策略,这是一种类似 Teacher Forcing 的方法,并且采样大小能根据模型的学习效果进行动态调整,即根据第一次解码的初步结果确定采样率,混合真实值第二次解码后再更新参数,采样按关键字:标识符:操作符 = 2:1:1,能使模型更好地学习其中的语法和语义信息,以提升代码补全的准确率。该项目于 2025 年 3 月提交了专利申请。

# 基于改进 YOLOv5 的垃圾智能识别与分类

角色:负责人,独自完成;时间:2023.01~2023.04

在目标检测中,为提升模型的平均精度均值(mAP),在 YOLOv5 模型上提出了采用 SIoU 损失函数、将主干网络替换为 EfficientNet-B0、解耦头这三种改进策略,mAP@0.5 由 93% 提升到了 96.2%。进行了详细的消融实验,每增加一个改进点提升 0.7~1.5 个 mAP。还对不同规模的 YOLOv5 模型实施改进(B0 改进 YOLOv5s、B1 改进 YOLOv5m),绘制系列改进模型与原模型的 mAP - 参数量(或延迟时间)折线图,说明改进模型的性价比更高:在同规模模型对比中,改进算法效果更优;在具有相同 mAP 的两个模型里,改进算法的延迟时间更短。

  • 消融实验:每增加改进后 mAP@0.5 等指标的变化
增加改进mAP@0.5%参数量GFLOPsFPS延迟时间
YOLOv5s937.0M15.878.59.3ms
+ 检测头93.7(+0.7)8.8M21.362.910.0ms
+ 主干网络95.2(+1.5)10.9 M19.945.517.4ms
+ 损失函数96.2(+1.0)10.9 M19.946.217.0ms
  • 对比实验:改进前后模型 mAP - 参数量折线图

# AI Canteen(食堂菜品智能识别系统)

角色:负责人,独自完成;时间:2022.07~2022.08

开发的安卓平台软件 AI Canteen 食堂菜品智能识别系统,基于 YOLOv7 目标检测技术实现了传统点单方式的智能化。将训练好的 YOLOv7 模型部署在 Android 端,基于 ncnn 计算框架实现高效的推理,支持 CPU/GPU 推理以及多摄像头切换,所实现的目标检测算法具有高精度和实时性。系统拥有类似外卖 APP 的二级联动列表界面,将识别结果融入其中,方便用户查看和修改。

# 快递信息智能化提取系统

角色:负责人,负责快递面单的检测与信息提取部分;时间:2021.10~2021.12

快递信息智能化提取系统,主要功能是提取快递面单上的文字信息,对地址进行匹配纠错,并结合分割后的人像生成结构化信息。运用 YOLOv5 检测面单、CRNN_CTC 识别文本、地址库模板匹配纠错和 DeepLabV3 分割人像技术。此项目是参与华为 ICT 创新赛的初赛作品。

# 获奖经历

分类描述

数学类

2020.12,获得全国大学生数学竞赛(非数学类)三等奖
2023.12,获得中国研究生数学建模竞赛三等奖

荣誉类

2021.11,获得 “华为素质尖兵” 奖学金及教育部 - 华为智能基座 “未来之星” 称号
2023.06,获得中国地质大学(武汉)优秀毕业生
2024.11,获得一等硕士生奖助学金

其他

2022.05,“国家级大学生创新创业训练计划” 项目结题
2023.11,获得辽宁省大学生智慧海洋科技创新大赛决赛优秀奖

# 发明专利

# 基于非自回归模型的 Verilog 行级代码补全方法

申请号:CN202510240647.X;申请日:2025.03.03
详见

# 个人爱好

体育运动:慢跑、骑行、乒乓球
游戏方面:对多种类型的游戏有所了解:MMORPG(魔兽世界)、MOBA(英雄联盟)、FPS(绝地求生、和平精英)、卡牌策略(炉石传说、三国杀)、开放世界(塞尔达传说:荒野之息、原神)、本地合作(胡闹厨房 2、双人成行、双影奇境)
热爱开发有趣的项目、撰写博客,同时是 Android “发烧友”(刷机、Magisk),有坚定的开源理念,梦想成为自由代码人
求职期间此页面作为个人简历使用,部分内容不够详细,会持续更新

阅读次数