Lipschitz 常数(也称“利普希茨常数”)是一个用来度量函数“变化有多快”的常数 \(L\)。如果对任意两点 \(x,y\),都有
\[
|f(x)-f(y)| \le L|x-y|,
\]
则称 \(f\) 是 Lipschitz 连续的,而满足不等式的 \(L\) 就是一个 Lipschitz constant(通常取最小的那一个作为“最佳”常数)。它在分析、优化、机器学习与微分方程中常用于给出误差界与收敛性保证。
/ˈlɪpʃɪts ˈkɑːnstənt/
A smaller Lipschitz constant means the function changes more slowly.
较小的 Lipschitz 常数意味着函数变化更慢。
If the gradient has a Lipschitz constant \(L\), then gradient descent can use a step size up to \(1/L\) to guarantee convergence under standard assumptions.
如果梯度具有 Lipschitz 常数 \(L\),那么在常见假设下,梯度下降可使用不超过 \(1/L\) 的步长来保证收敛。
Lipschitz 来自德国数学家 Rudolf Lipschitz(鲁道夫·利普希茨) 的姓氏;该概念用于刻画函数满足一种“线性上界”的稳定性条件。constant 源自拉丁语 constans,意为“固定不变的”。