# 个人简介
我目前是大连理工大学软件学院将于 26 年 6 月毕业的研三学生,就读于大连理工大学软件优化组,导师是李晓晨老师。研究方向:深度学习(包括图像、文本处理模型)、大语言模型预训练
求职意向:26 届秋招,大语言模型(预训练)/ 视觉大模型 / 计算机视觉
# 教育背景
# 本科
研究方向:深度学习(目标检测)
课程:数据结构、操作系统、算法分析与设计、人工智能导论、机器学习、深度学习、计算机视觉、图像处理、自然语言处理、智能优化算法等
绩点:3.818/5.0,专业排名:5/67,通过 CET-6,获得优秀毕业生
# 硕士
研究方向:深度学习(文本处理模型)、大语言模型预训练
保研,获得一等硕士生奖助学金
# 专业技能
分类 | 描述 |
---|---|
编程语言 | 熟练使用 Python、C++、Java |
基础技能 | 熟悉 Linux 系统(常用 Ubuntu、Arch、CentOS),Git/Gerrit 版本控制,LaTeX/Markdown 语法 |
开发能力 |
|
算法基础 | 数据结构,机器学习,深度学习,数学建模 (Python), 计算机视觉,自然语言处理,群体智能优化算法 |
深度学习框架 |
|
深度学习模型 |
|
# 实习经历
参与中兴通讯大语言模型的预训练工作,工作内容和掌握技能如下:
(1)调研大语言模型的最新研究进展,了解不同模型(如 GPT、BERT、Qwen、DeepSeek 等)。了解相关提速增效的改进方法:Dynamic MoE、MoE++、细粒度专家,Muon 优化器等,具备前沿技术融入框架的代码能力,会模型测评
(2)熟悉 NVIDIA Megatron 和阿里 Pai-Megatron-Paich 框架、Transformer Engine 库,掌握多机多卡环境下的大语言模型训练和调优方法,了解并行策略、混合精度训练、梯度聚合等技术
(3)熟练使用前沿的训练提速方法(GroupedGEMM、permute 算子、FlashAttention/FusedAttention),同时熟练使用 trace 分析瓶颈点
# 项目经历
# 基于非自回归模型的 Verilog 行级代码补全
基于非自回归模型的 Verilog 行级代码补全方法,与传统的基于自回归模型的代码补全方法不同,使用了非自回归模型,解码阶段无需依赖之前的输出 token 能并行生成所有 token,具有更小的延迟,推理速度显著提升。此外,还采用了混合语法引导的采样策略,这是一种类似 Teacher Forcing 的方法,并且采样大小能根据模型的学习效果进行动态调整,即根据第一次解码的初步结果确定采样率,混合真实值第二次解码后再更新参数,采样按关键字:标识符:操作符 = 2:1:1,能使模型更好地学习其中的语法和语义信息,以提升代码补全的准确率。该项目于 2025 年 3 月提交了专利申请。
# 基于改进 YOLOv5 的垃圾智能识别与分类
在目标检测中,为提升模型的平均精度均值(mAP),在 YOLOv5 模型上提出了采用 SIoU 损失函数、将主干网络替换为 EfficientNet-B0、解耦头这三种改进策略,mAP@0.5 由 93% 提升到了 96.2%。进行了详细的消融实验,每增加一个改进点提升 0.7~1.5 个 mAP。还对不同规模的 YOLOv5 模型实施改进(B0 改进 YOLOv5s、B1 改进 YOLOv5m),绘制系列改进模型与原模型的 mAP - 参数量(或延迟时间)折线图,说明改进模型的性价比更高:在同规模模型对比中,改进算法效果更优;在具有相同 mAP 的两个模型里,改进算法的延迟时间更短。
- 消融实验:每增加改进后 mAP@0.5 等指标的变化
增加改进 | mAP@0.5% | 参数量 | GFLOPs | FPS | 延迟时间 |
---|---|---|---|---|---|
YOLOv5s | 93 | 7.0M | 15.8 | 78.5 | 9.3ms |
+ 检测头 | 93.7(+0.7) | 8.8M | 21.3 | 62.9 | 10.0ms |
+ 主干网络 | 95.2(+1.5) | 10.9 M | 19.9 | 45.5 | 17.4ms |
+ 损失函数 | 96.2(+1.0) | 10.9 M | 19.9 | 46.2 | 17.0ms |
- 对比实验:改进前后模型 mAP - 参数量折线图
# AI Canteen(食堂菜品智能识别系统)
开发的安卓平台软件 AI Canteen 食堂菜品智能识别系统,基于 YOLOv7 目标检测技术实现了传统点单方式的智能化。将训练好的 YOLOv7 模型部署在 Android 端,基于 ncnn 计算框架实现高效的推理,支持 CPU/GPU 推理以及多摄像头切换,所实现的目标检测算法具有高精度和实时性。系统拥有类似外卖 APP 的二级联动列表界面,将识别结果融入其中,方便用户查看和修改。
# 快递信息智能化提取系统
快递信息智能化提取系统,主要功能是提取快递面单上的文字信息,对地址进行匹配纠错,并结合分割后的人像生成结构化信息。运用 YOLOv5 检测面单、CRNN_CTC 识别文本、地址库模板匹配纠错和 DeepLabV3 分割人像技术。此项目是参与华为 ICT 创新赛的初赛作品。
# 获奖经历
分类 | 描述 |
---|---|
数学类 | 2020.12,获得全国大学生数学竞赛(非数学类)三等奖 |
荣誉类 | 2021.11,获得 “华为素质尖兵” 奖学金及教育部 - 华为智能基座 “未来之星” 称号 |
其他 | 2022.05,“国家级大学生创新创业训练计划” 项目结题 |
# 发明专利
# 基于非自回归模型的 Verilog 行级代码补全方法
申请号:CN202510240647.X;申请日:2025.03.03
详见
# 个人爱好
体育运动:慢跑、骑行、乒乓球
游戏方面:对多种类型的游戏有所了解:MMORPG(魔兽世界)、MOBA(英雄联盟)、FPS(绝地求生、和平精英)、卡牌策略(炉石传说、三国杀)、开放世界(塞尔达传说:荒野之息、原神)、本地合作(胡闹厨房 2、双人成行、双影奇境)
热爱开发有趣的项目、撰写博客,同时是 Android “发烧友”(刷机、Magisk),有坚定的开源理念,梦想成为自由代码人
求职期间此页面作为个人简历使用,部分内容不够详细,会持续更新