Target network(目标网络):在深度强化学习(尤其是 DQN 等算法)中,用来生成较稳定的目标值(如 TD 目标)的一个网络。它通常与“在线网络(online network)”参数相同但更新更慢(周期性拷贝或软更新),以减少训练时的震荡与发散。该短语在一般语境中也可指“目标(面向的)网络”,但在机器学习里最常见的是上述含义。
/ˈtɑːrɡɪt ˈnɛtˌwɜːrk/
The target network helps stabilize training.
目标网络有助于稳定训练。
In DQN, the target network is updated less frequently than the online network to reduce moving-target problems when computing the TD target.
在 DQN 中,目标网络的更新频率通常低于在线网络,以减少计算 TD 目标时“目标不断移动”带来的不稳定。
target 原意为“靶子、目标”(与射箭/射击中的“靶”相关),引申为“要达到的对象”。network 由 net(网)+ work(工作/构造)组成,现代常指“网络系统”,在机器学习里也常指“神经网络”。合起来 target network 就是“用于提供目标的网络”,强调其在训练中充当相对稳定的“参照靶”。