在数学分析 中,隐函数定理 (英语:Implicit function theorem )是一个用来回答下面的问题的工具:
以隐函数 表示一個多變量函數,此函數的變量在局部上是否存在显式的关系?
隐函数定理说明,对于一个由关系
f
(
x
,
y
)
=
0
{\displaystyle f(x,y)=0}
表示的隐函数,如果它在某一点的偏微分 满足某些条件,则在该点有邻域 使得在该邻域内 y 可以表示成关于 x 的函数:
y
=
h
(
x
)
{\displaystyle y=h(x)}
这样就把隐函数关系变成了常见的函数 关系。
举一个简单例子:假设两个变量 x , y 满足隐函数 x 2 + y 2 − 1 = 0 ,此隐函数代表了平面上的单位圆,任取单位圆中的一点,那是否存在包含该点的邻域 跟定义在邻域里的显函数 y =h (x ) 去(局部的)描述这单位圆的图形?
答案是:除了(-1,0) 跟 (1,0 ) 两点外,其他点局部上都有 y =h (x ) 的显函数表达式。理由请看下面的隐函数定理。
例子
让函数
f
(
x
,
y
)
=
x
2
+
y
2
{\displaystyle f(x,y)=x^{2}+y^{2}}
,则单位圆就可以写成满足方程式
f
(
x
,
y
)
−
1
=
0
{\displaystyle f(x,y)-1=0}
的点的集合。在圆上的点A附近,y 可以表示成 x 的函数:
y
(
x
)
=
1
−
x
2
{\displaystyle y(x)={\sqrt {1-x^{2}}}}
,但点B就不行(因为在点B附近,一个 x 会对应到两个 y 的值)。
有函数
f
(
x
,
y
)
=
x
2
+
y
2
{\displaystyle f(x,y)=x^{2}+y^{2}}
,那么方程式
f
(
x
,
y
)
−
1
=
0
{\displaystyle f(x,y)-1=0}
的所有解的集合构成平面上的单位圆 。圆上的点整体上是无法表示成单变数函数
y
=
h
(
x
)
{\displaystyle y=h(x)}
的形式的,因为每个
x
∈
(
−
1
,
1
)
,
{\displaystyle x\in (-1,1),}
都有两个
y
{\displaystyle y}
的值与之对应,即
±
1
−
x
2
{\displaystyle \pm {\sqrt {1-x^{2}}}}
。
然而在某些点附近,局部 地用
x
{\displaystyle x}
来表示
y
{\displaystyle y}
是可能的。比如给定圆上一点
(
x
,
y
)
{\displaystyle (x,y)}
,如果
y
>
0
{\displaystyle y>0}
,也就是说如果只选取圆的上半部分的话,在这一点附近
y
{\displaystyle y}
可以写成关于
x
{\displaystyle x}
的函数:
y
=
1
−
x
2
{\displaystyle y={\sqrt {1-x^{2}}}}
。如果
y
<
0
{\displaystyle y<0}
,在圆的下半部分
y
{\displaystyle y}
也可以写成关于
x
{\displaystyle x}
的函数:
y
=
−
1
−
x
2
{\displaystyle y=-{\sqrt {1-x^{2}}}}
。
但是,在点
(
±
1
,
0
)
{\displaystyle (\pm 1,0)}
的附近,
y
{\displaystyle y}
无法写成关于
x
{\displaystyle x}
的函数,因为这些点的每一个邻域中都包含了上半圆和下半圆的点,也就是说对于附近的每一个
x
{\displaystyle x}
,都有两个
y
{\displaystyle y}
的值与之对应,这种情况下
y
{\displaystyle y}
无法写成
x
{\displaystyle x}
的函数。
定理的叙述:欧几里得空间的情况
设 f : R n+m → R m 为一个连续可微 函数。这里R n+m 被看作是两个空间的直积 : R n ×R m ,于是 R n+m 中的一个元素写成 (x ,y ) = (x1 , ..., xn , y1 , ..., ym ) 的形式。 我们的目标是找到一个函数 h : R n → R m ,让这函数的图形(graph of a function), (x , h (x )) , 局部上恰好等于集合{ (x , y ) | f (x ,y ) = 0 },当然这目标不见得一定可以达成,接下来我们会看需要哪些条件来保证函数 h 的局部存在。
固定一点(a ,b ) = (a1 , ..., an , b1 , ..., bm ) 使得 f (a , b ) = 0 ,我们希望在点 (a ,b ) 的附近找到一个 y 关于 x 的函数 h ,严格来说,就是说存在 a 的邻域 U ⊆ R n 和 b 的邻域 V ⊆ R m 以及函数:h : U → V ,使得 h 的函数的图形 (x , h (x )) 刚好等于 U × V 中 f (x ,y ) = 0 的集合,也就是说:
{
(
x
,
h
(
x
)
)
∣
x
∈
U
}
=
{
(
x
,
y
)
∈
U
×
V
∣
f
(
x
,
y
)
=
0
}
{\displaystyle \{(\mathbf {x} ,h(\mathbf {x} ))\mid \mathbf {x} \in U\}=\{(\mathbf {x} ,\mathbf {y} )\in U\times V\mid f(\mathbf {x} ,\mathbf {y} )=\mathbf {0} \}}
。
要保证这样的函数 h 存在,函数 f 的雅可比矩阵 要满足某些性质。对于给定的一点 (a ,b ) ,f 的雅可比矩阵 写作:
(
D
f
)
(
a
,
b
)
=
[
∂
f
1
∂
x
1
(
a
,
b
)
⋯
∂
f
1
∂
x
n
(
a
,
b
)
⋮
⋱
⋮
∂
f
m
∂
x
1
(
a
,
b
)
⋯
∂
f
m
∂
x
n
(
a
,
b
)
|
∂
f
1
∂
y
1
(
a
,
b
)
⋯
∂
f
1
∂
y
m
(
a
,
b
)
⋮
⋱
⋮
∂
f
m
∂
y
1
(
a
,
b
)
⋯
∂
f
m
∂
y
m
(
a
,
b
)
]
=
[
X
|
Y
]
{\displaystyle (Df)(\mathbf {a} ,\mathbf {b} )=\left[{\begin{matrix}{\frac {\partial f_{1}}{\partial x_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{1}}{\partial x_{n}}}(\mathbf {a} ,\mathbf {b} )\\\vdots &\ddots &\vdots \\{\frac {\partial f_{m}}{\partial x_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{m}}{\partial x_{n}}}(\mathbf {a} ,\mathbf {b} )\end{matrix}}\right|\left.{\begin{matrix}{\frac {\partial f_{1}}{\partial y_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{1}}{\partial y_{m}}}(\mathbf {a} ,\mathbf {b} )\\\vdots &\ddots &\vdots \\{\frac {\partial f_{m}}{\partial y_{1}}}(\mathbf {a} ,\mathbf {b} )&\cdots &{\frac {\partial f_{m}}{\partial y_{m}}}(\mathbf {a} ,\mathbf {b} )\\\end{matrix}}\right]=[X|Y]}
其中的矩阵
X
{\displaystyle X}
是函数 f 关于变数 x 的偏微分,而矩阵
Y
{\displaystyle Y}
是 f 关于变数 y 的偏微分。隐函数定理说明了:如果
Y
{\displaystyle Y}
是一个可逆 矩阵的话,那么满足前面性质的邻域 U 、V 和函数 h (x ) 就会存在。正式的叙述就是:
设
f : R n+m → R m 为
连续可微 函数,让
R n+m 中的坐标记为
(x , y ) ,
(x , y ) = (x1 , ..., xn , y1 , ..., ym ) 。给定一点
(a1 , ..., an , b1 , ..., bm ) = (a ,b ) 使得
f (a ,b )=0 (
0 ∈ R m ,是个零向量)。如果
m ×m 矩阵
[(∂fi / ∂yj )(a , b ) 是可逆矩阵的话(此矩阵即上面的矩阵
Y
{\displaystyle Y}
),那么存在
a 的邻域
U ⊆ R n 、
b 的邻域
V ⊆ R m 以及唯一的连续可微函数
h :U → V ,使得
h
(
a
)
=
b
{\displaystyle h(\mathbf {a} )=\mathbf {b} }
且
f
(
x
,
h
(
x
)
)
=
0
,
{\displaystyle f(\mathbf {x} ,h(\mathbf {x} ))=\mathbf {0} ,\,\,}
对所有的
x
∈
U
{\displaystyle \mathbf {x} \in U}
。
一般情形
设
E
1
{\displaystyle E_{1}}
、
E
2
{\displaystyle E_{2}}
和
F
{\displaystyle F}
是三个巴拿赫空间,而
U
{\displaystyle U}
、
V
{\displaystyle V}
分别是
E
1
{\displaystyle E_{1}}
、
E
2
{\displaystyle E_{2}}
上的两个开集 。设函数:
f
:
U
×
V
→
F
{\displaystyle f:U\times V\rightarrow F}
是一个
k
(
k
≥
1
)
{\displaystyle k~(k\geq 1)}
阶可微函数 (见Fréchet导数 ),并且对于
E
1
×
E
2
{\displaystyle E_{1}\times E_{2}}
中的一点
(
x
0
,
y
0
)
{\displaystyle (x_{0},y_{0})}
,满足:
f
(
x
0
,
y
0
)
=
0
{\displaystyle f(x_{0},y_{0})=0}
映射
y
↦
(
D
f
(
x
0
,
y
0
)
)
(
0
,
y
)
{\displaystyle y\mapsto (Df(x_{0},y_{0}))(0,y)}
是一个从
E
2
{\displaystyle E_{2}}
到
F
{\displaystyle F}
的同构
那么有如下结论:
存在
x
0
{\displaystyle x_{0}}
的邻域
U
0
⊂
U
{\displaystyle U_{0}\subset U}
、
y
0
{\displaystyle y_{0}}
的邻域
V
0
⊂
V
{\displaystyle V_{0}\subset V}
,以及
k
{\displaystyle k}
阶Fréchet可微函数
φ
:
U
0
→
V
0
{\displaystyle \varphi :U_{0}\rightarrow V_{0}}
,使得:
对任意
(
x
,
y
)
∈
U
0
×
V
0
{\displaystyle (x,y)\in U_{0}\times V_{0}}
,只要
f
(
x
,
y
)
=
0
{\displaystyle f(x,y)=0}
,就有
y
=
φ
(
x
)
{\displaystyle y=\varphi (x)}
。
参见
参考来源
Jittorntrum, K. An Implicit Function Theorem. Journal of Optimization Theory and Applications. 1978, 25 (4). doi:10.1007/BF00933522 .
Kumagai, S. An implicit function theorem: Comment. Journal of Optimization Theory and Applications. 1980, 31 (2). doi:10.1007/BF00934117 .