公告:
目前学习会对外开放,欢迎联系我们申请加入。
曾经的组会部分ppt已分享在Google网盘,学习小组的所有ppt已经分享在Onedrive网盘。欢迎自由下载使用,内容制作如有疏漏欢迎联系我们指正。
Online (暂不对外开放)
强化学习及LLM学习小组组会2025 每周日上午10点准时召开。
学习小组会议记录
2023年
第09次组会
Topic: Preference-based RL
第08次组会
Topic: Distributional RL & Distributed RL
第07次组会
Topic: GYM and Experiment
第06次组会
Topic: Actor-Critic
第05次组会
Topic: TRPO & PPO
第04次组会
Topic: Policy Gradient
第03次组会
Topic: Deep Q-Learning
第02次组会
Topic 1: Dynamic Programming
Topic 2: Temporal Difference
第01次组会
Topic 1: Imitation Learning
Topic 2: MDP
2022年
第40次组会
日期: 2022年9月3日
第30次组会
日期: 2022年6月4日
第20次组会
日期: 2022年3月19日
第17次组会
日期: 2022年2月19日
注释: 进一步减少形式主义,组会分享尽量回避制作PPT,对着原文讲,降低负担。整个小组高度聚焦,每次只分享核心关键内容,减少背景等无关信息介绍。
第10次组会
日期: 2021年11月13日
...
第01次组会
日期: 2021年9月11日
学习小组2023资料共享
点我进入OneDrive
基础系列
Taylor Series | PPT链接 | 更新日期2021年9月18日
Restricted Boltzmann Machine | PPT链接 | 更新日期2021年9月25日
Support Vector Machine | PPT链接 更新日期2021年10月23日
GNN&TD3 | PPT链接 更新日期2021年10月23日
Entropy&MSE | PPT链接 更新日期2021年10月23日
RNN | PPT链接 更新日期2021年10月30日
Self-attention & Transformers | PPT链接 更新日期2021年10月30日
Contrastive Learning | PPT链接 更新日期2021年11月13日
进阶系列
mean field series | PPT链接 | 更新日期 2021年9月18日
Learning multi-agent communication | PPT链接 | 更新日期 2021年10月16日
Graph-Based modular reinforcement learning | PPT链接 | 更新日期2021年10月9日
PMIC and Divide&Explore | PPT链接 | 更新日期2021年10月30日
Factored Multi-Agent Centralised Policy Gradients(Multi-Agent Mujoco)|PPT链接 |更新日期2021年11月13日
Sequential Communication in Multi-Agent Reinforcement Learning|PPT链接 |更新日期2021年11月13日
ToM2C and MOBA | PPT链接 | 更新日期2021年11月20日
Relational Deep Reinforcement Learning|PPT链接 |更新日期2021年11月28日
Max-plus Algorithm|PPT链接 更新日期2021年12月4日
Transfer | PPT链接 更新日期2021年12月18日
DCG | PPT链接 更新日期2021年12月23日