最近有一个同学实现了一个利用 DQN + CNN 的 Java 版增强学习 Flappybird:

作者自己手写了一个Java 版的 Flappybird,然后+ DJL 纯 Java 深度学习框架。
目前训练了 300 万步,鸟可以自己玩到 380 多分。训练好的模型已经在 repo 里面了,可以直接用来继续训练或者用 agent 跑跑看。
参考项目:
最近有一个同学实现了一个利用 DQN + CNN 的 Java 版增强学习 Flappybird:

作者自己手写了一个Java 版的 Flappybird,然后+ DJL 纯 Java 深度学习框架。
目前训练了 300 万步,鸟可以自己玩到 380 多分。训练好的模型已经在 repo 里面了,可以直接用来继续训练或者用 agent 跑跑看。
参考项目:
1
nl101531 Dec 1, 2020 via iPhone
很有意思
|
2
saul0913 Dec 1, 2020
这种东西用按键精灵不是更简单
|
3
tsening Dec 1, 2020
真厉害
|
4
lanking520 OP @saul0913 按键精灵没法应对随机管道呀
|
5
SkyLine7 Dec 3, 2020
很强
|
6
choichun Dec 5, 2020 via Android
|