# 个人简介

我目前是大连理工大学软件学院将于 26 年 6 月毕业的研三学生，就读于大连理工大学软件优化组，导师是李晓晨老师。研究方向：深度学习（包括图像、文本处理模型）、大语言模型预训练

求职意向：26 届秋招，大语言模型（预训练）/ 视觉大模型 / 计算机视觉

# 教育背景

# 本科

2019~2023，本科就读于中国地质大学（武汉）计算机学院，智能科学与技术专业

研究方向：深度学习（目标检测）
课程：数据结构、操作系统、算法分析与设计、人工智能导论、机器学习、深度学习、计算机视觉、图像处理、自然语言处理、智能优化算法等
绩点：3.818/5.0，专业排名：5/67，通过 CET-6，获得优秀毕业生

# 硕士

2023~2026，研究生就读于大连理工大学软件学院，软件工程专业

研究方向：深度学习（文本处理模型）、大语言模型预训练
保研，获得一等硕士生奖助学金

# 专业技能

分类	描述
编程语言	熟练使用 Python、C++、Java
基础技能	熟悉 Linux 系统（常用 Ubuntu、Arch、CentOS），Git/Gerrit 版本控制，LaTeX/Markdown 语法
开发能力	C++ 开发：MFC（电梯智能群控系统）、Qt（磁盘管理）、OpenCV（AI Canteen） Java 开发：Spring Boot+Bootstrap+MyBatis（学生作业批改系统）、Android（AI Canteen）
算法基础	数据结构，机器学习，深度学习，数学建模 (Python), 计算机视觉，自然语言处理，群体智能优化算法
深度学习框架	熟悉 PyTorch 框架，熟悉 NVIDIA Megatron / 阿里 Pai-Megatron-Paich 框架了解 DeepSpeed、华为 MindSpore、腾讯 ncnn 框架
深度学习模型	熟悉 Transformer、BERT、GPT、Qwen 等模型尤其是 MoE 模型熟悉目标检测模型（YOLO 系列、Faster R-CNN 等）了解 ViT、Swin Transformer 等视觉模型

# 实习经历

中兴通讯算法部，大语言模型预训练；时间：2023.06 至今

参与中兴通讯大语言模型的预训练工作，工作内容和掌握技能如下：
（1）调研大语言模型的最新研究进展，了解不同模型（如 GPT、BERT、Qwen、DeepSeek 等）。了解相关提速增效的改进方法：Dynamic MoE、MoE++、细粒度专家，Muon 优化器等，具备前沿技术融入框架的代码能力，会模型测评
（2）熟悉 NVIDIA Megatron 和阿里 Pai-Megatron-Paich 框架、Transformer Engine 库，掌握多机多卡环境下的大语言模型训练和调优方法，了解并行策略、混合精度训练、梯度聚合等技术
（3）熟练使用前沿的训练提速方法（GroupedGEMM、permute 算子、FlashAttention/FusedAttention），同时熟练使用 trace 分析瓶颈点

# 项目经历

# 基于非自回归模型的 Verilog 行级代码补全

角色：负责人，独自完成；时间：2023.01~2023.04

基于非自回归模型的 Verilog 行级代码补全方法，与传统的基于自回归模型的代码补全方法不同，使用了非自回归模型，解码阶段无需依赖之前的输出 token 能并行生成所有 token，具有更小的延迟，推理速度显著提升。此外，还采用了混合语法引导的采样策略，这是一种类似 Teacher Forcing 的方法，并且采样大小能根据模型的学习效果进行动态调整，即根据第一次解码的初步结果确定采样率，混合真实值第二次解码后再更新参数，采样按关键字：标识符：操作符 = 2:1:1，能使模型更好地学习其中的语法和语义信息，以提升代码补全的准确率。该项目于 2025 年 3 月提交了专利申请。

# 基于改进 YOLOv5 的垃圾智能识别与分类

角色：负责人，独自完成；时间：2023.01~2023.04

在目标检测中，为提升模型的平均精度均值（mAP），在 YOLOv5 模型上提出了采用 SIoU 损失函数、将主干网络替换为 EfficientNet-B0、解耦头这三种改进策略，mAP@0.5 由 93% 提升到了 96.2%。进行了详细的消融实验，每增加一个改进点提升 0.7~1.5 个 mAP。还对不同规模的 YOLOv5 模型实施改进（B0 改进 YOLOv5s、B1 改进 YOLOv5m），绘制系列改进模型与原模型的 mAP - 参数量（或延迟时间）折线图，说明改进模型的性价比更高：在同规模模型对比中，改进算法效果更优；在具有相同 mAP 的两个模型里，改进算法的延迟时间更短。

消融实验：每增加改进后 mAP@0.5 等指标的变化

增加改进	mAP@0.5%	参数量	GFLOPs	FPS	延迟时间
YOLOv5s	93	7.0M	15.8	78.5	9.3ms
+ 检测头	93.7(+0.7)	8.8M	21.3	62.9	10.0ms
+ 主干网络	95.2(+1.5)	10.9 M	19.9	45.5	17.4ms
+ 损失函数	96.2(+1.0)	10.9 M	19.9	46.2	17.0ms

对比实验：改进前后模型 mAP - 参数量折线图

# AI Canteen（食堂菜品智能识别系统）

角色：负责人，独自完成；时间：2022.07~2022.08

开发的安卓平台软件 AI Canteen 食堂菜品智能识别系统，基于 YOLOv7 目标检测技术实现了传统点单方式的智能化。将训练好的 YOLOv7 模型部署在 Android 端，基于 ncnn 计算框架实现高效的推理，支持 CPU/GPU 推理以及多摄像头切换，所实现的目标检测算法具有高精度和实时性。系统拥有类似外卖 APP 的二级联动列表界面，将识别结果融入其中，方便用户查看和修改。

# 快递信息智能化提取系统

角色：负责人，负责快递面单的检测与信息提取部分；时间：2021.10~2021.12

快递信息智能化提取系统，主要功能是提取快递面单上的文字信息，对地址进行匹配纠错，并结合分割后的人像生成结构化信息。运用 YOLOv5 检测面单、CRNN_CTC 识别文本、地址库模板匹配纠错和 DeepLabV3 分割人像技术。此项目是参与华为 ICT 创新赛的初赛作品。

# 获奖经历

分类	描述
数学类	2020.12，获得全国大学生数学竞赛（非数学类）三等奖 2023.12，获得中国研究生数学建模竞赛三等奖
荣誉类	2021.11，获得 “华为素质尖兵” 奖学金及教育部 - 华为智能基座 “未来之星” 称号 2023.06，获得中国地质大学（武汉）优秀毕业生 2024.11，获得一等硕士生奖助学金
其他	2022.05，“国家级大学生创新创业训练计划” 项目结题 2023.11，获得辽宁省大学生智慧海洋科技创新大赛决赛优秀奖

# 发明专利

# 基于非自回归模型的 Verilog 行级代码补全方法

申请号：CN202510240647.X；申请日：2025.03.03
详见

# 个人爱好

体育运动：慢跑、骑行、乒乓球
游戏方面：对多种类型的游戏有所了解：MMORPG（魔兽世界）、MOBA（英雄联盟）、FPS（绝地求生、和平精英）、卡牌策略（炉石传说、三国杀）、开放世界（塞尔达传说：荒野之息、原神）、本地合作（胡闹厨房 2、双人成行、双影奇境）
热爱开发有趣的项目、撰写博客，同时是 Android “发烧友”（刷机、Magisk），有坚定的开源理念，梦想成为自由代码人
求职期间此页面作为个人简历使用，部分内容不够详细，会持续更新