始徒Beginner
强化学习概述
🛠工具与编程
doggie
2025年10月05日03:06
1
强化学习基本要素
智能体
环境
策略
奖励(短期奖励
价值(长期奖励
参考
5分钟搞清楚什么是强化学习_哔哩哔哩_bilibili
Related topics
話題
回覆
觀看
活動
强化学习PPO(Proximal Policy Optimization)算法原理
🛠工具与编程
强化学习
,
proximal-policy-optimization
0
17
2026年04月29日
三分钟讲解大模型训练全过程
🛠工具与编程
大模型
,
模型训练
0
37
2026年04月27日
知识图谱简介
🛠工具与编程
知识图谱
0
22
2026年03月24日
残差网络简介
🛠工具与编程
0
14
2025年10月05日
BERT和GPT区别
🛠工具与编程
0
14
2025年10月05日