8. Производная сложной функции Если дана функция z=F(u; v), где в свою очередь u=u(x; y) и v=v(x; y), то говорят, что ...
75 downloads
221 Views
255KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
8. Производная сложной функции Если дана функция z=F(u; v), где в свою очередь u=u(x; y) и v=v(x; y), то говорят, что задана слож ная функция от x и y. Теорема. Пуст ь функция F(u; v) имеет непрерывные производные по u и v в т очке (u0; v0) и кроме т ого, сущест вуют производные функций u и v по x и y в т очке (x0; y0), где выполняют ся равенст ва u0= u(x0; y0), v0= v(x0; y0). Тогда в т очке (x0; y0) сущест вуют производные
¶F ¶F и , ¶y ¶x причем
¶F = ¶x ¶F = ¶y
¶F ¶u ¶F ¶v × + × ¶u ¶x ¶v ¶x ¶F ¶u ¶F ¶v . × + × ¶u ¶y ¶v ¶y
(2.8.1)
С доказательством теоремы можно ознакомится в [1. гл. VIII § 10]. Пример 14. Найти частные производные сложной функции F = u 2 + uv + v 2 , где 2
2
u = ( x + y) ; v = ( x - y) . Решение. В соответствии с формулой (2.8.1) имеем
¶F = ( 2 u + v ) × 2 ( x + y ) + ( u + 2 v ) × 2 ( x - y) ; ¶ x
¶F = ( 2 u + v ) × 2 ( x + y ) - ( u + 2 v ) × 2 ( x - y) , ¶y 2
2
где u = ( x + y) ; v = ( x - y) .
Полная производная Пусть задана функция z=F(u; v), где x и y есть функции от t: x=x(t); y=y(t). Тогда z есть функция только от t: z=F(x(t); y(t)). Производная
dz от функции z=F(x(t); y(t)) называется полной производной. dt
Очевидно, что в условиях предыдущей теоремы из формулы (2.8.1) получаем dz ¶F dx ¶F dy = × + × . dt ¶x dt ¶ y dt
(2.8.2)
Если задана функция z=F(x; y), где y есть функция от x: y=y(x), то z есть функция только от x: z=F(x; y(x)). В соответствии с формулой (2.8.1) получаем dz ¶F ¶F dy = + × . dx ¶x ¶y dx
(2.8.3)
Пример 15. Дана функция z = x y , где x=x(t), y=y(t). Найти
dz . dt
Решение. В соответствии с формулой (2.8.2) имеем dz ¶z dx ¶z dy dx dy = × + × = yx y -1 × + x y ln x × , где x=x(t), y=y(t). dt ¶x dt ¶ y dt dt dt Замечание. Формула (2.8.2) естественным образом обобщается на случай, когда функция F есть функция от n аргументов x1, x2,¼, xn, зависящих от переменной t: dz n ¶F dx i =å × dt i =1 ¶ x i dt
Пример 16. Пусть определитель n го порядка D =
a ij ( , i j = 1, 2, K , n ) , зависящих от t: a ij
(2.8.4)
a 11
a 12
K
a 1 n
a 21
a 22
K
a 2 n
--
--
- - - -
a n 1
a n 2
K
состоит из элементов
a nn
= a ij ( t ) . Тогда определитель D есть функция от t: D=D(t). С
помощью формулы (2.8.4) получим производную
d D . dt
Решение. Известно, что определитель D может быть разложен по элементам какоголибо столбца n
(строки). (например, jго столбца): D = å a ij A ij , где алгебраические дополнения A 1 j , A 2 j , K , A nj элемента i =1
a ij не содержат. Поэтому
¶D = A ij . ¶a ij
Далее по формуле (2.8.4) получаем d D = dt
n
n
n n da ij ù é n é n da ij ù ¶D da ij × = A × = × A ij ú . êå ij ú å êå å å å dt dt û j =1 ë i =1 dt j =1 i =1 ¶ a ij j =1 ë i =1 û
é n da ij ù × A ij ú есть разложение D по элементам jго столбца, в котором Очевидно, что выражение êå ë i =1 dt û
элементы a ij заменены на производные
da ij dt
. Таким образом,
производная определителя равна сумме n определителей, получающихся из D заменой, поочередно, элементов его 1 го , 2 го ,¼, n го столбца производными. t sin t t 2 d D( t ) Пусть, например, требуется найти , где D( t ) = cos t t - 3 t 3 . dt t + 2 2 t t + 5
В соответствии с изложенным выше правилом имеем 1 sin t t 2 t cos t t 2 t sin t 2 t d D( t ) 3 3 = - sin t t - 3 t + cos t 1 t + cos t t - 3 3 t 2 . dt 1 2 t t + 5 t + 2 2 t + 5 t + 2 2 t 1
9. Инвариантность формы первого дифференциала Пусть z=f(x; y), где x=x(s, t) и y=y(s, t). Рассмотрим сложную функцию z=f(x(s, t), y(s, t)). Найдем первый дифференциал этой функции. По определению имеем dz =
¶f ( x ( s , t ), y ( s , t ) ) ¶f ( x ( s , t ), y ( s , t ) ) ds + dt . ¶s ¶t
Найдем частные производные
¶f ¶f , по формулам дифференцирования сложной ¶s ¶t
функции (2.8.1). Тогда æ ¶f ¶x ¶f ¶y ö æ ¶f ¶x ¶f ¶y ö dz = ç × + × ÷ ds + ç × + × ÷ dt . è ¶x ¶s ¶y ¶s ø è ¶x ¶t ¶y ¶ t ø
Сгруппируем слагаемые в этом выражении dz =
¶f æ ¶x ¶x ö ¶f æ ¶y ¶y ö ç ds + dt ÷ + ç ds + dt ÷ . ¶x è ¶s ¶t ø ¶y è ¶s ¶ t ø
Для функций x=x(s, t) и y=y(s, t) от независимых переменных s, t имеем в соответствии с формулой (2.6.4): dx =
¶x ¶x ¶y ¶y ds + dt ; dy = ds + dt . ¶s ¶ t ¶s ¶ t
Подставляя эти выражения в формулу (2.9.1), получаем dz =
¶f ¶f dx + dy . ¶x ¶ y
Последнее выражение совпадает формально с формулой (2.6.4).
(2.9.1)
Таким образом, выражение для полного дифференциала dz остается неизменным вне зависимости от того, являются ли переменные x, y независимыми переменными, или x, y являются функциями от s и t. Данное свойство принято называть свойством инвариант ност и формы первого дифференциала.
10. Производная от функции, заданной неявно Теорема (о неявной функции). Пуст ь функция z= F(x; y) определена в некот орой d окрест ност и т очки (x0; y0) и F(x0; y0)= 0. Пуст ь, кроме т ого, част ные производные F x ¢ ( x ; y ) и F y ¢ ( x ; y ) сущест вуют и непрерывны в эт ой окрест ност и и F y ¢( x ; y ) ¹ 0 . Тогда в дост ат очно малой окрест ност и W т очки x0 сущест вует одна и т олько одна непрерывная функция y=f(x), удовлет воряющая соот ношениям y0=f(x0); F(x; f(x))= 0 (xÎW ), причем эт а функция дифференцируема и y ¢ ( x ) = -
F x ¢( x ; y ) , (xÎW ), y=f(x). F y ¢ ( x ; y )
(2.10.1)
С доказательством теоремы можно ознакомится в [1. гл. VIII § 11]. Пример 17. Дано уравнение x 2 + y 2 - R 2 = 0 . Требуется найти y x ¢ . Решение. В соответствии с формулой (2.10.6) имеем y x ¢ = -
2 x x = - , 2 y y
где x и y связаны соотношением x 2 + y 2 - R 2 = 0 и y¹0. Замечание. В условиях приведенной выше теоремы можно обосновать следующий прием нахождения производной от неявно заданной функции. Пусть имеется уравнение F(x; y)=0.
(2.10.2)
Оно определяет некоторую функцию y=y(x). При подстановке этой функции в уравнение (2.10.2), левая часть уравнения становится сложной функцией от x тождественно равной нулю: F(x; y(x))=0. Дифференцируя эту функцию по x по правилу (2.8.2), получаем F x ¢( x ; y ) + F y ¢( x ; y ) y x ¢ = 0 ,
откуда при условии, что F y ¢( x ; y ) ¹ 0 , получаем y x ¢ = -
F x ¢( x ; y ) , F y ¢ ( x ; y )
что соответствует формуле (2.10.1). С помощью данного приема предыдущий пример можно решить следующим образом. Полагая у функцией от x: y=y(x), получаем равенство x 2 + y 2 ( x ) - R 2 = 0 . Дифференцируя обе части уравнения по x, получаем 2 x + 2 y × y ¢ = 0 , откуда при y¹0 имеем 2 yy ¢ = - 2 x , x y x ¢ = - , y где x и y связаны соотношением x 2 + y 2 - R 2 = 0 . 11. Дифференциалы вы сших порядков Полным дифференциалом второго порядка (или вторым дифференциалом) называется полный дифференциал от полного дифференциала dz, т.е. по определению: d 2 z = d ( dz ) . Теорема. Пуст ь в област и D задана функция z=f(x; y), имеющая непрерывные част ные производные первого и вт орого порядков. Тогда вт орой дифференциал определяет ся формулой d 2 z =
¶ 2 f 2 ¶ 2 f ¶ 2 f 2 dx + 2 dxdy + dy . ¶x ¶y ¶x 2 ¶ y 2
(2.11.1)
(Здесь для крат кост и записи мы вмест о f(x; y) пишем f). Доказат ельст во. Функция z=f(x; y) имеет непрерывные частные производные первого порядка. Тогда в соответствии с Теоремой 2 на стр.70 представление (2.6.1) имеет место и можно записать dz =
¶f ¶f dx + dy . ¶x ¶ y
(2.11.2)
Дифференциал dz есть функция от x и y. Поскольку функция z=f(x; y) имеет непрерывные частные производные второго порядка, dz будет иметь непрерывные производные первого порядка, и можно определить полный дифференциал от dz: d(dz).
Используя формулу (2.11.2) и свойства дифференциала (формула (2.6.5)), получаем æ ¶ 2 f æ ¶f æ ¶f ö ¶f ö ¶ 2 f ö æ ¶f ö d z = d ( dz ) = d ç dx + dy ÷ = d ç ÷ dx + d ç ÷ dy = ç 2 dx + dy ÷ dx + è ¶x ø è ¶x ¶y ø è ¶y ø ¶x ¶y ø è ¶x 2
æ ¶ 2 f ¶ 2 f ö ¶ 2 f 2 ¶ 2 f ¶ 2 f 2 +ç dx + 2 dy ÷ dy = dx + 2 dxdy + 2 dy . ¶y ¶x 2 ¶x ¶y ¶ y è ¶y ¶x ø
Здесь на последнем шаге мы воспользовались равенством вторых смешанных производных. Пример 18. Дана функция z = ln 1 ( + 2 x + 3 y) . Найти d 2 z. Решение. Находим частные производные z x ¢ = z xx ¢¢ = -
4
(1 + 2 x + 3 y )
2
2 3 ; z y ¢ = ; 1 + 2 x + 3 y 1 + 2 x + 3 y ; z xy ¢¢ = -
6
(1 + 2 x + 3 y )
2
; z ¢¢yy = -
9
(1 + 2 x + 3 y )
2
.
В области D={(x; y): 1+2x+3y>0)} функция и все ее частные производные первого и второго порядков непрерывны. Поэтому для области D можно записать (по формуле (2.10.1)) 2
d z = -
4 dx 2 + 12 dxdy + 9 dy 2 2
(1 + 2 x + 3y )
.
Полным дифференциалом kго порядка называется полный дифференциал от полного дифференциала (k1)го порядка: d k z = d ( d k - 1 z ) , (k=2,3,¼). Формула (2.11.1) может быть записана в символической (операторной) форме следующим образом: 2
æ¶ ¶ ö d 2 z = ç dx + dy ÷ f . ¶ y ø è ¶x
(2.11.2 а )
Эта запись понимается так: двучлен, стоящий в скобках, формально возводится в квадрат, а затем символ f приписывается в числителе к ¶ 2 . По аналогии с формулой (2.11.2 а ) для d k z имеем k
æ¶ ¶ ö d z = ç dx + dy ÷ f . ¶ y ø è ¶x k
(2.11.2 б )
Используя "бином Ньютона", получаем следующее выражение для d k z: k
d k z =
å C
m k
m = 0
¶ k f dx m dy k - m , ¶x m ¶ y k - m
(2.11.3)
где C k m =
k ! , m ! ( k - m ) !
(0! = 1 ) .
12. Ф ормула Тейлора Теорема. Пуст ь функция z= f(x; y) определена в некот орой окрест ност и т очки M0(x0; y0) и имеет в эт ой окрест ност и непрерывные част ные производные до (n+ 1)го порядка включит ельно. Тогда при дост ат очно малых Dx и Dy имеет мест о формула (Тейлора): Df ( x 0 ; y 0 ) = f ( x 0 + Dx 0 ; y 0 + D y 0 ) - f ( x 0 ; y 0 ) = = df ( x 0 ; y 0 ) +
, 1 2 1 d f ( x 0 ; y 0 ) +K + d n f ( x 0 ; y 0 ) + r n 2 ! n !
(2.12.1)
где r n =
1 d n+ 1 f ( x 0 + qDx ; y 0 + qD y ) , где 0< q< 1. ( n + 1 )!
Доказат ельст во. Введем функцию F ( t ) = f ( x 0 + t Dx ; y 0 + t D y ) , где 0
(2.12.2)
Df ( x 0 ; y 0 ) = f ( x 0 + Dx ; y 0 + D y ) - f ( x 0 ; y 0 ) = F ( 1 ) - F ( 0) .
(2.12.3)
Очевидно, что
Запишем формулу Маклорена для F(t) F (t ) = F ( 0 ) +
F ¢( 0 ) F ¢¢( 0 ) 2 F ( n ) ( 0 ) n F ( n +1 ) ( q ) n +1 t + t + K + t + t , где 0
Полагая t=1, получаем æ F ¢( 0 ) F ¢¢( 0 ) F ( n ) ( 0 ) ö F ( n + 1) ( q ) ÷+ . F ( 1 ) - F ( 0 ) = çç + + K + (n + 1 )! 2 ! n ! ÷ø è 1 !
(2.12.4)
Из формулы (2.12.2) имеем F ¢( t ) =
¶f ( x 0 + t Dx ; y 0 + t Dy ) f ( x 0 + t Dx ; y 0 + t Dy ) Dx + D y . ¶x ¶y
Отсюда при t=0 получаем F ¢( 0 ) =
¶f ( x 0 ; y 0 ) ¶f ( x 0 ; y 0 ) Dx + D y = df ( x 0 ; y 0 ) . ¶x ¶y
(2.12.5)
Аналогично получаем F ¢¢( t ) = f xx ¢¢ ( x 0 + t Dx ; y 0 + t Dy ) Dx 2 + 2 f xy ¢¢ f ( x 0 + t Dx ; y 0 + t Dy ) Dx Dy + + f yy ¢¢ f ( x 0 + t Dx ; y 0 + t Dy ) D y 2
,
откуда при t=0 (с учетом формулы (2.11.1)) получаем F ¢¢( 0 ) = d 2 f ( x 0 ; y 0 ) .
(2.12.6)
Продолжая этот процесс, по индукции получаем F ¢¢¢( 0 ) = d 3 f ( x 0 ; y 0 ), K , F (n ) ( 0 ) = d n f ( x 0 ; y 0 ) , F (n +1 ) ( q ) = d (n +1 ) f ( x 0 + qDx ; y 0 + qD y ) .
(2.12.7)
Подставляя выражения (2.12.5) (2.12.7) в формулу (2.12.4) с учетом формулы (2.12.3), получаем искомую формулу (2.12.1)n Замечание 1. В формуле (2.11.1) остаточный член r n записан в форме Лагранжа. Остаточный член r n может быть записан и в форме Пеано r n = o ( D r n ) ,
где Dr = ( Dx ) 2 + ( Dy ) 2 . В этом случае достаточно непрерывности производных в точке (x0; y0) до nго порядка включительно. Замечание 2. Если положить Dx=xx0; Dy=yy0, то формулу Тейлора (2.12.1)можно записать следующим образом: f ( x ; y ) = f ( x 0 ; y 0 ) + df ( x 0 ; y 0 ) + +
1 2 1 d f ( x 0 ; y 0 ) +K + d n f ( x 0 ; y 0 ) + 2 ! n !
1 d n + 1 f ( x 0 + q ( x - x 0 ); y 0 + q ( y - y 0 )) (n + 1)!
,(2.12.8)
(0
1 2 d f ( 0 ; 0 ) +K 2 !
1 1 + d n f ( 0 ; 0) + d n + 1 f (qx ; q y ) ( ) n ! n + 1 !
.
(2.12.9)
Данную формулу называют формулой Маклорена. С учетом формулы (2.12.3) в развернутой форме последнюю формулу можно записать следующим образом
f ( x , y ) = f ( 0 ; 0 ) +
¶f ( 0 ; 0 ) ¶f ( 0 ; 0 ) x + y + ¶x ¶y
+
1 æ ¶ 2 ( 0 ; 0 ) 2 ¶ 2 f ( 0 ; 0 ) ¶ 2 f ( 0 ; 0 ) 2 ö x + 2 xy + y ÷ +K + ç 2 è ¶x 2 ¶x ¶y ¶y 2 ø
+
2 1 m ¶ f ( 0 ; 0 ) m n - m C å n ¶x m ¶y n -m x y + r n , n !
(2.12.10)
где r n=o(Dr n ). В частности при n=2 имеем f ( x ; y ) = f ( 0 ; 0 ) +
¶f ( 0 ; 0 ) ¶f ( 0 ; 0 ) x + y + ¶x ¶y
1 æ ¶ 2 ( 0 ; 0 ) 2 ¶ 2 f ( 0 ; 0 ) ¶ 2 f ( 0 ; 0 ) 2 ö + ç x + 2 xy + y ÷ + r 2 2 è ¶x 2 ¶x ¶y ¶y 2 ø
,
(2.12.11)
где r 2=o(x 2 +y 2 ). Пример 19. Записать формулу Маклорена для функции z = ln( 1 + 2 x + 3 y) с учетом квадратичного члена и остаточным членом в форме Пеано. Решение. Частные производные для этой функции найдены в примере 18. Подставляя в эти выражения x=0 и y=0, получаем z x ¢ ( 0 ; 0 ) = 2 ; z y ¢ ( 0 ; 0 ) = 3; z xx ¢¢ ( 0 ; 0 ) = 6 ; z yy ¢¢ ( 0 ; 0 ) = - 9 . ¢¢ ( 0 ; 0 ) = - 4 ; z xy Кроме того, z( 0 ; 0 ) = ln 1 = 0 . Подставляя эти выражения в формулу (2.11.11), получаем ln( 1 + 2 x + 3 y ) = ( 2 x + 3 y ) +
1 [ - 4 x 2 + 12 xy - 9 x 2 ] + r 2 , 2
где r 2=o(x 2 +y 2 ).
13. Экстремумы . Наиболь шее и наимень шее значения Определение. Пуст ь функция z= f(x; y) определена в област и D и (x0; y0) внут ренняя т очка эт ой област и. Говорят , чт о функция z=f(x; y) имеет в т очке (x0; y0) максимум (минимум), если сущест вует окрест ност ь эт ой т очки т акая, чт о для всех (x; y) из эт ой окрест ност и, кроме самой т очки (x0; y0), выполняет ся неравенст во f ( x ; y ) < f ( x 0 ; y 0 ) . ( > )
(2.13.1)
При эт ом т очка (x0; y0) называет ся т очкой максимума (минимума), а соот вет ст вующее значение функции f(x0; y0) максимумом (минимумом). Определение.
Точки максимума или минимума называют ся т очками экст ремума. Теорема (необходимы е условия экстремума). Пуст ь функция z= f(x; y) имеет в т очке (x0; y0) экст ремум. Если в эт ой т очке сущест вуют част ные производные f x ¢ ( x 0 ; y 0 ) и f y ¢ ( x 0 ; y 0 ) , т о эт и производные равны нулю ì f x ¢( x 0 ; y 0 ) = 0 í î f y ¢ ( x 0 ; y 0 ) = 0 .
(2.13.2)
Доказат ельст во. По условию (x0; y0) точка экстремума. Для определенности предположим, что это точка максимума. Поэтому существует d окрестность в виде прямоугольника
{
E d = ( x ; y ): x - x 0 < d ; y - y0 < d
}
такая, что для всех (x; y) в этой окрестности, кроме точки (x0; y0), имеет место неравенство f ( x ; y ) < f ( x 0 ; y 0 ) . Зафиксируем переменную y: y=y0. Тогда функция z=f(x; y0) есть функция только от x, причем в окрестности
{x :
}
x - x 0 < d ,
имеет место неравенство f ( x ; y 0 ) < f ( x 0 ; y 0 ) . Это означает, что x0 точка максимума функции z=f(x; y0), причем в этой точке существует производная f x ¢ ( x 0 ; y 0 ) . По теореме Ферма эта производная равна нулю. Зафиксировав переменную x: x=x0, аналогичным образом докажем, что производная f y ¢ ( x 0 ; y 0 ) также равна нулю. Если (x0; y0) точка минимума, то доказательство проводится аналогичноn Определение. Точки (x; y) из област и определения функции f(x, y), в кот орых первые част ные производные равны нулю, называют ся ст ационарными. Замечание 1. Условия (2.13.2) являются необходимыми, но не достаточными, т.е. стационарные точки не обязательно являются точками экстремума. Например, функция z=xy имеет частные производные
¶z ¶z = y ; = x , ¶y ¶x которые обращаются в ноль в точке (0; 0). Однако, точка (0; 0) не является точкой экстремума, так как в любой окрестности этой точки приращение функции Dz=(0+x)(0+y)0×0=xy
принимает как положительные, так и отрицательные значения, что противоречит определению экстремума (2.13.1). Замечание 2. В предположении дифференцируемости функции f(x, y) условия (2.13.2) допускают простое геометрическое толкование: касательная плоскость к поверхности z=f(x, y) в ее точке, соответствующий экстремуму, должна быть параллельной плоскости OXY. Замечание 3. Необходимое условие существования экстремума в случае дифференцируемой функции кратко можно записать еще так: df ( x 0 ; y 0 ) = 0 . В самом деле, если f x ¢( x 0 ; y 0 ) = 0 , f y ¢( x 0 ; y 0 ) = 0 , то df ( x 0 ; y 0 ) = f x ¢( x 0 ; y 0 ) dx + f y ¢( x 0 ; y 0 ) dy = 0 . Если, наоборот, df ( x 0 ; y 0 ) = f x ¢( x 0 ; y 0 ) dx + f y ¢( x 0 ; y 0 ) dy = 0 , то, ввиду произвольности dx и dy, производные f x ¢ ( x 0 ; y 0 ) и f y ¢ ( x 0 ; y 0 ) равны нулю. Замечание 4. Если рассматриваемая функция f(x; y) имеет частные производные во всей рассматриваемой области, то точки экстремума следует искать лишь среди ст ационарных т очек. Однако встречаются случаи, когда в некоторых точках области определения какаято частная производная имеет бесконечное значение или вовсе не существует, в то время как другая производная равна нулю. Может также случиться, что обе частные производные не существуют в какихто точках области определения. Такие точки тоже следует причислить к "подозрительным" на экстремум точкам. Теорема (достаточны е условия экстремума). Пуст ь функция z= f(x; y) определена в некот орой окрест ност и т очки (x0; y0) и имеет в эт ой т очке непрерывные част ные производные вт орого порядка. Пуст ь, кроме т ого, в т очке (x0; y0) выполняет ся необходимые условия экст ремума (2.13.2). Обозначим a 11 = f xx ¢¢( x 0 ; y 0 ) ; a 21 = f yx ¢¢( x 0 ; y 0 ) ; a 22 = f yy ¢¢( x 0 ; y 0 ) , ¢¢( x 0 ; y 0 ) ; a 12 = f xy 2 d = a 11 a 22 - a 12 .
(2.13.3)
Если d> 0, т о (x0; y0) т очка экст ремума, при эт ом: если a 11< 0, т о (x0; y0) т очка максимума; если a 11> 0, т о (x0; y0) т очка минимума. Доказат ельст во. Запишем формулу Тейлора (2.12.1) при n=2 с остаточным членом r 2 в форме Пеано:
1 2 d f ( x 0 ; y 0 ) + r 2 , где r 2 = o D r 2 . 2
(
Df ( x 0 ; y 0 ) = df ( x 0 ; y 0 ) +
)
С учетом формул (2.6.2), (2.6.3) и (2.11.1) получаем: Df ( x 0 ; y 0 ) = f x ¢( x 0 ; y 0 ) Dx + f y ¢( x 0 ; y 0 ) D y + +
1 f xx ¢¢ ( x 0 ; y 0 ) Dx 2 + 2 f xy ¢¢ ( x 0 ; y 0 ) Dx Dy + f yy ¢¢ ( x 0 ; y 0 ) D y 2 + r 2 , где Dx=xx0; Dy=yy0. 2
[
]
В точке (x0; y0) выполняются необходимые условия экстремума (2.13.2). Поэтому с учетом обозначений (2.13.3) получаем:
( )
Dr 1 Df ( x 0 ; y 0 ) = a 11 Dx 2 + 2 a 12 Dx × Dy + a 22 Dy 2 + r 2 = 2 2
[
=
где u =
]
( D r ) 2
2
[a u + 2 a 2
11
]
u × v + a 22 v 2 + r 2 =
12
(2.13.4)
2
{[a u + 2a u × v + a v ] + a } 2
2
11
12
r 2 Dx Dy ; v = ; a 2 = Dr D r Dr
( )
2
22
2
¾п ¾¾¾ р и D r ® 0 ® 0 .
Заметим, что u 2 + v 2 = 1 .
Приращения Dx и Dy не равны нулю одновременно. Пусть Dy¹0. Тогда
[a u + 2 a 2
11
где t =
]
[
]
u × v + a 22 v 2 = v 2 a 11 t 2 + 2a 12 t + a 22 ,
12
u Dx = . v D y
Квадратный трехчлен
[a t
2
11
+ 2 a 12 t + a 22
]
сохраняет знак при всех t при условии, что 2 2 D = 4 a 12 - 4 a 11 a 22 = 4 ( a 12 - a 11 a 22 ) < 0 ,
т.е. 2 d = a 11 a 22 - a 12 > 0 .
При этом:
[ <0, то [a t
] ] < 0 при всех t.
если a 11>0, то a 11 t 2 + 2 a 12 t + a 22 > 0 при всех t; если a 11
2
11
+ 2 a 12 t + a 22
Учитывая формулу (2.13.5), получаем, что: a) если d>0 и a 11>0, то
[a u + 2 a 2
11
]
u × v + a 22 v 2 > 0 при всех u, v,
12
а значит и на множестве u 2 + v 2 = 1 . b) если d>0 и a 11<0, то
[a u + 2 a 2
11
]
u × v + a 22 v 2 < 0 при всех u, v,
12
а значит и на множестве u 2 + v 2 = 1 .
(2.13.5)
Квадратичная форма
[a u + 2a 2
11
u × v + a 22 v 2
12
]
есть непрерывная функция от u и v на ограниченном замкнутом множестве
{
}
R = ( u , v ): u 2 + v 2 = 1
и, в соответствии с теоремой Вейерштрасса, в случае a) d>0 и a 11>0
(2.13.6)
достигает на этом множестве своего наименьшего значения m, причем m>0. Таким образом, в этом случае
[a u + 2 a 2
11
]
u × v + a 22 v 2 ³ m > 0
12
(2.13.7)
для всех (u; v)ÎR. С другой стороны, слагаемое a2 в формуле (2.13.4) стремится к нулю при Dr®0. Поэтому при достаточно малых Dx и Dy будет иметь место неравенство a 2 < m . Таким образом, в некоторой окрестности точки (x0; y0) при выполнении условий (2.13.6) правая часть в формуле (2.13.4), а с нею и приращение Df(x0; y0), положительна. Это означает, что при выполнении условий (2.13.6) точка (x0; y0) есть точка минимума. В случае b) d>0 и a 11<0
(2.13.8)
квадратичная форма
[a u + 2 a 2
11
]
u × v + a 22 v 2 < 0 при (u; v)ÎR
12
и достигает на множестве R наибольшего значения (m), где m>0, а слагаемое a2 в формуле (2.13.4) при достаточно малых Dx и Dy будет удовлетворять неравенству a 2 < m . Таким образом, при выполнении условий (2.13.8) правая часть в формуле (2.13.4), а с нею и приращение Df(x0; y0) отрицательна, что означает, что (x0; y0) точка максимума. Если Dy=0, то Dx¹0 и вместо формулы (2.13.5) можно записать
[a u + 2 a 2
11
где s =
]
[
]
u × v + a 22 v 2 = u 2 a 11 s 2 + 2 a 12 s + a 22 ,
12
v Dy = . u D x
Далее доказательство проводится аналогичноn
Замечание 1. Можно доказать (см., например, [3.п.197]), что, если 2 d = a 11 a 22 - a 12 < 0 , то точка (x0; y0) не является точкой экстремума. 2 Если d = a 11 a 22 - a 12 = 0 , то требуется дополнительный анализ с привлечением
производных более высокого порядка. Замечание 2. Из доказательства теоремы следует, что знак приращения Df(x0; y0) определяется знаком квадратичной формы d 2 f ( x 0 ; y 0 ) = a 11 Dx 2 + 2 a 12 Dx × Dy + a 22 D y 2 , т.е. знаком дифференциала 2 го порядка d 2 f ( x 0 ; y 0 ) . Поэтому достаточное условие экстремума можно сформулировать следующим образом:
если в стационарной точке (x0; y0) выполняется условие d 2 f ( x 0 ; y 0 ) < 0 , то (x0; y0) точка максимума; если в стационарной точке (x0; y0) выполняется условие d 2 f ( x 0 ; y 0 ) > 0 , то (x0; y0) точка минимума; если d 2 f ( x 0 , y 0 ) может принимать как положительные, так и отрицательные значения, то (x0; y0) не являет ся т очкой экст ремума. В такой форме достаточное условие экстремума обобщается на случай функции нескольких переменных Z=f(x1, x2,¼, xn). Пример 20. Исследовать на экстремум функцию z = x 3 - 6 x 2 + 9 x + 3 y 2 - 12 y + 7 . ìïz x ¢ = 3 x 2 - 12 x + 9 = 0 , x 1 = 3 ; x 2 = 1 Решение. Находим стационарные точки: í . ï îz y ¢ = 6 y - 12 = 0 , y = 2 Имеются две стационарные точки M1(3; 2); M2(1; 2). Находим вторые производные z xx ¢¢ = 0 ; z yy ¢¢ = 6 . ¢¢ = 6 x - 12 ; z xy Рассмотрим точку M1(3; 2). Находим a 11 = z xx ¢¢ ( 3 ; 2 ) = 6 ; a 12 = 0 ; a 22 = 6 ;
2 ìd = a 11 a 22 - a 12 = 6 × 6 - 0 = 36 > 0 . í î a 11 = 6 > 0
Точка M1(3; 2) точка минимума. Рассмотрим точку M2(1; 2). Находим a 11 = z xx ¢¢ ( 1 ; 2 ) = 6 × 1 - 12 = - 6 ; a 12 = 0 ; a 22 = 6 . 2 d = a 11 a 22 - a 12 = -6 × 6 - 0 = -36 < 0 .
Точка M2(1; 2) не является точкой экстремума. Пример 21. Исследовать на экстремум функцию z = x 2 + y 4 . Решение. Находим стационарные точки ïìz x ¢ = 2 x = 0 x = 0 . í 3 y = 0 z = 4 y = 0 ¢ ï y î Точка M(0; 0) является стационарной. Находим вторые производные z xx ¢¢ = 0 ; z ¢ yy¢ = 12y 2 . ¢¢ = 2 ; z xy Очевидно, что 2 a 11=2; a 12=0; a 22=0; d = a 11 a 22 - a 12 = 0 .
Достаточное условие не дает ответа на вопрос о характере стационарной точки. Однако, очевидно, что приращение Dz в точке (0; 0)
Dz = z ( x , y ) - z ( 0 , 0 ) = ( x 2 + y 4 ) - 0 = x 2 + y 4 > 0 при всех Dx=x и Dz=y не равных нулю одновременно. Поэтому точка (0; 0) точка минимума. Пример 22. Исследовать на экстремум функцию z = x 2 + y3 . Решение. Легко показать, что в данном случае точка M(0; 0) стационарная точка и в ней d=0. Однако, очевидно, что эта точка не является точкой экстремума, так как на прямой x=0 приращение Dz=z(0; y)z(0; 0)=y 3 меняет знак при переходе через точку y=0.