V2EX  ›  英汉词典

Q-Network

释义 Definition

Q-network(Q网络):在强化学习中,用神经网络来近似动作价值函数 Q(s, a) 的模型,用于估计“在状态 s 下采取动作 a 有多好(期望回报有多高)”。常见于 DQN(Deep Q-Network) 等算法中。该词也常泛指“用来输出Q值的网络”。

发音 Pronunciation (IPA)

/ˈkjuː ˌnɛt.wɝːk/

例句 Examples

I trained a Q-network to choose actions in a simple game.
我训练了一个Q网络,让它在一个简单游戏中选择动作。

The agent updates its Q-network using mini-batches sampled from replay memory to stabilize learning.
智能体通过从经验回放中抽取小批量数据来更新Q网络,以提高学习的稳定性。

词源 Etymology

Q 来自 Q(s, a)(动作价值函数)的记号,常被解释为 quality(动作/策略的“质量”或“好坏程度”);network 指神经网络。随着深度学习在强化学习中的应用,“用神经网络近似Q函数”逐渐被称为 Q-network,并在 DQN 相关研究中广泛传播。

相关词 Related Words

文学与著作中的用例 Literary Works

  • **Mnih et al. (2015), “Human-level control through deep reinforcement learning” (Nature)**:提出并系统化使用以神经网络近似Q值的做法(DQN),语境中频繁出现与 Q-network 同义/近义的表述(如用于估计Q值的网络)。
  • **Mnih et al. (2013), “Playing Atari with Deep Reinforcement Learning” (arXiv/DeepMind report)**:早期DQN工作,讨论用神经网络学习Q值(即Q-network的核心概念)。
  • Maxim Lapan, Deep Reinforcement Learning Hands-On:在工程实践章节中常用 Q-network 指代输出Q值的神经网络模块。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1062 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 18:47 · PVG 02:47 · LAX 11:47 · JFK 14:47
♥ Do have faith in what you're doing.