始徒Beginner
强化学习概述
🛠工具与编程
doggie
2025 年10 月 5 日 03:06
1
强化学习基本要素
智能体
环境
策略
奖励(短期奖励
价值(长期奖励
参考
5分钟搞清楚什么是强化学习_哔哩哔哩_bilibili
相关话题
话题
回复
浏览量
活动
强化学习PPO(Proximal Policy Optimization)算法原理
🛠工具与编程
强化学习
,
proximal-policy-optimization
0
17
2026 年4 月 29 日
三分钟讲解大模型训练全过程
🛠工具与编程
大模型
,
模型训练
0
37
2026 年4 月 27 日
知识图谱简介
🛠工具与编程
知识图谱
0
22
2026 年3 月 24 日
残差网络简介
🛠工具与编程
0
14
2025 年10 月 5 日
BERT和GPT区别
🛠工具与编程
0
14
2025 年10 月 5 日