我们开源了一个通用决策 AI 算法平台 DI-engine,以及相关的一系列学术算法,生态应用和底层基建。欢迎大家了解,star,使用,提建议~
github: https://github.com/opendilab/DI-engine
以下是一些 RL 智能体的 demo:( random agent 代表纯随机 bot,trained agent 代表训练得到的 RL agent )
- Lunarlander
- SMAC MMM2
- gfootball trained agent vs rule-based bot