avatar
文章
76
标签
98
分类
22

关于笔者
主页
博文
  • 分类
  • 标签
  • 归档
友链
留言板
Roger-Lv's space
搜索
关于笔者
主页
博文
  • 分类
  • 标签
  • 归档
友链
留言板

RLHF

发表于2024-09-11|更新于2024-09-18|强化学习
|阅读量:

RLHF

从零实现ChatGPT——RLHF技术笔记 - 知乎 (zhihu.com)

一文读懂「RLHF」基于人类反馈的进行强化学习-CSDN博客

大模型 | 通俗理解RLHF基础知识以及完整流程-CSDN博客

文章作者: Roger-Lv
文章链接: http://example.com/2024/09/11/2024-09-11-RLHF/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Roger-Lv's space!
人工智能强化学习
cover of previous post
上一篇
KL散度详解
cover of next post
下一篇
AlexNet解析
相关推荐
cover
2024-09-11
强化学习笔记
cover
2024-09-05
Transformer解析
cover
2024-09-05
两万字讲清楚:现在的AI产品有多难做?
cover
2024-09-05
大模型学习路线
cover
2024-09-10
AlexNet解析
cover
2024-09-10
常用激活函数

评论
avatar
Roger-Lv
Send a flare and light the way.
文章
76
标签
98
分类
22
Follow Me
公告
Welcome!
目录
  1. 1. RLHF
最新文章
k8s中通过pod获取gpu使用进程到pod的映射关系
k8s中通过pod获取gpu使用进程到pod的映射关系2025-02-16
CUDA容器化&Container runtime相关技术梳理
CUDA容器化&Container runtime相关技术梳理2024-10-01
GPU容器相关概念
GPU容器相关概念2024-09-28
GPU 容器底层实现
GPU 容器底层实现2024-09-28
NVIDIA device plugin for Kubernetes原理分析
NVIDIA device plugin for Kubernetes原理分析2024-09-28
©2020 - 2025 By Roger-Lv
框架 Hexo|主题 Butterfly
搜索
数据库加载中