课程学习
-- FLOPs
Agent 工程

Agent 工程师需要掌握的微调技能

7 课时

01 / 第一章:微调决策与方法谱系

02 / 第二章:数据工程与训练工具

03 / 第三章:评估、部署与推理

Agent 工程师需要掌握的微调技能/第一章:微调决策与方法谱系
视频 / 图文36 分钟付费课时

第三节:持续预训练、指令微调与人类偏好对齐

梳理 CPT、SFT、DPO/RLHF 分别改变模型的知识、行为和偏好,避免把不同训练目标混在一起。

本课时正文暂未解锁登录或购买后查看完整正文、代码和资料。
解锁课程
精选课程首页精选论文题库价格