专注数据质量，驱动模型进化

我是郑麒翰，一名大模型数据训练师。深耕 RAG 知识库构建与多模态图文训练，致力于通过精细化的数据清洗、标注规则制定与评测闭环，为大模型注入高质量的专业知识。

Agent 协作就绪←

核心项目经验

数据驱动的 AI 实践

从底层数据清洗、RAG 知识库构建，到多模态图文数据训练与模型评测的全链路交付。

面向企业内部专业问答场景

多维度文档清洗

Chunk 策略优化

问答样本构建 (2000+条)

Agent 初筛 + 人工复核

规则校验

半自动化生产

轻量级 Agent

围绕图文生成场景

七类标注维度建立

图文样本处理

幻觉与变形问题归因

AI训练师大模型数据训练师

深圳

18507390857

具备 1 年 AI 训练师/大模型数据训练经验，熟悉 RAG 知识库构建、多模态图文数据训练与模型评测全链路。可独立完成需求对接、规则制定、标注管理、质检验收与项目复盘等环节的闭环交付。

累计处理文本、图文及评测样本 3000+ 条/组，熟练使用 Cursor、ChatGPT、Claude 等 AI 工具辅助提升工作流效率。

RAG知识库构建与评测

数据清洗与chunk切分

多轮问答数据构建

Prompt编写与优化

SFT数据标注

RLHF偏好数据理解

COT思维链样本构建

多模态图文标注

模型评测

标注规则制定

质检标准制定

任务拆分

进度跟进

跨角色沟通

问题清单管理

闭环推进

交付资料整理

规则文档撰写