课程学习

-- FLOPs

Agent 工程

Agent 工程师需要掌握的微调技能

7 课时

01 / 第一章：微调决策与方法谱系

02 / 第二章：数据工程与训练工具

03 / 第三章：评估、部署与推理

Agent 工程师需要掌握的微调技能/第一章：微调决策与方法谱系

视频 / 图文36 分钟付费课时

第三节：持续预训练、指令微调与人类偏好对齐

梳理 CPT、SFT、DPO/RLHF 分别改变模型的知识、行为和偏好，避免把不同训练目标混在一起。

本课时正文暂未解锁登录或购买后查看完整正文、代码和资料。

精选课程首页精选论文题库价格