Home Sign Up Sign In

Q-Network

释义 Definition

Q-network（Q网络）：在强化学习中，用神经网络来近似动作价值函数 Q(s, a) 的模型，用于估计“在状态 s 下采取动作 a 有多好（期望回报有多高）”。常见于 DQN（Deep Q-Network） 等算法中。该词也常泛指“用来输出Q值的网络”。

发音 Pronunciation (IPA)

/ˈkjuː ˌnɛt.wɝːk/

例句 Examples

I trained a Q-network to choose actions in a simple game.
我训练了一个Q网络，让它在一个简单游戏中选择动作。

The agent updates its Q-network using mini-batches sampled from replay memory to stabilize learning.
智能体通过从经验回放中抽取小批量数据来更新Q网络，以提高学习的稳定性。

词源 Etymology

Q 来自 Q(s, a)（动作价值函数）的记号，常被解释为 quality（动作/策略的“质量”或“好坏程度”）；network 指神经网络。随着深度学习在强化学习中的应用，“用神经网络近似Q函数”逐渐被称为 Q-network，并在 DQN 相关研究中广泛传播。

相关词 Related Words

文学与著作中的用例 Literary Works

**Mnih et al. (2015), “Human-level control through deep reinforcement learning” (Nature)**：提出并系统化使用以神经网络近似Q值的做法（DQN），语境中频繁出现与 Q-network 同义/近义的表述（如用于估计Q值的网络）。
**Mnih et al. (2013), “Playing Atari with Deep Reinforcement Learning” (arXiv/DeepMind report)**：早期DQN工作，讨论用神经网络学习Q值（即Q-network的核心概念）。
Maxim Lapan, Deep Reinforcement Learning Hands-On：在工程实践章节中常用 Q-network 指代输出Q值的神经网络模块。

About · Help · Advertise · Blog · API · FAQ · Solana · 1072 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 53ms · UTC 18:33 · PVG 02:33 · LAX 11:33 · JFK 14:33
♥ Do have faith in what you're doing.