V2EX  ›  英汉词典

Target Network

Definition / 定义

Target network(目标网络):在深度强化学习(尤其是 DQN 等算法)中,用来生成较稳定的目标值(如 TD 目标)的一个网络。它通常与“在线网络(online network)”参数相同但更新更慢(周期性拷贝或软更新),以减少训练时的震荡与发散。该短语在一般语境中也可指“目标(面向的)网络”,但在机器学习里最常见的是上述含义。

Pronunciation / 发音

/ˈtɑːrɡɪt ˈnɛtˌwɜːrk/

Examples / 例句

The target network helps stabilize training.
目标网络有助于稳定训练。

In DQN, the target network is updated less frequently than the online network to reduce moving-target problems when computing the TD target.
在 DQN 中,目标网络的更新频率通常低于在线网络,以减少计算 TD 目标时“目标不断移动”带来的不稳定。

Etymology / 词源

target 原意为“靶子、目标”(与射箭/射击中的“靶”相关),引申为“要达到的对象”。networknet(网)+ work(工作/构造)组成,现代常指“网络系统”,在机器学习里也常指“神经网络”。合起来 target network 就是“用于提供目标的网络”,强调其在训练中充当相对稳定的“参照靶”。

Related Words / 相关词

Literary Works / 文学作品

  • Human-level control through deep reinforcement learning(Nature, 2015,DQN 经典论文;讨论用目标网络稳定学习)
  • Reinforcement Learning: An Introduction(Sutton & Barto;在深度强化学习相关章节/讨论中常涉及目标网络思想)
  • Deep Reinforcement Learning Hands-On(技术书;以实践角度讲解 target network 的作用与实现)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1328 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 17:28 · PVG 01:28 · LAX 10:28 · JFK 13:28
♥ Do have faith in what you're doing.