专注数据质量,驱动模型进化

我是郑麒翰,一名大模型数据训练师。深耕 RAG 知识库构建与多模态图文训练,致力于通过精细化的数据清洗、标注规则制定与评测闭环,为大模型注入高质量的专业知识。

Agent 协作就绪
核心项目经验

数据驱动的 AI 实践

从底层数据清洗、RAG 知识库构建,到多模态图文数据训练与模型评测的全链路交付。

RAG 知识库构建

面向企业内部专业问答场景

多维度文档清洗
Chunk 策略优化
问答样本构建 (2000+条)
Agent 初筛 + 人工复核
规则校验
半自动化生产
轻量级 Agent

多模态图文训练

围绕图文生成场景

七类标注维度建立
图文样本处理
幻觉与变形问题归因

郑麒翰

AI训练师大模型数据训练师
深圳
18507390857

个人简介

具备 1 年 AI 训练师/大模型数据训练经验,熟悉 RAG 知识库构建、多模态图文数据训练与模型评测全链路。可独立完成需求对接、规则制定、标注管理、质检验收与项目复盘等环节的闭环交付。

累计处理文本、图文及评测样本 3000+ 条/组,熟练使用 Cursor、ChatGPT、Claude 等 AI 工具辅助提升工作流效率。

AI训练核心

RAG知识库构建与评测
数据清洗与chunk切分
多轮问答数据构建
Prompt编写与优化
SFT数据标注
RLHF偏好数据理解
COT思维链样本构建
多模态图文标注
模型评测
标注规则制定
质检标准制定

项目协作

任务拆分
进度跟进
跨角色沟通
问题清单管理
闭环推进
交付资料整理
规则文档撰写