www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии Н. С. Даирбеков
1. ДИФФЕРЕНЦИАЛЬНАЯ
ГЕОМЕТРИЯ КРИВЫХ
1.1. Плоскость и пространство. Векторы. Далее Rn обозначает арифметическое евклидово пространство размерности n. Оно состоит из точек (векторов) x = (x1 , . . . , xn ), xi ∈ R. Для произвольной пары векторов x, y ∈ Rn определено их скалярное произведение hx, yi = x1 y 1 + · · · + xn y n . Определена норма вектора |x| =
p
hx, xi =
p (x1 )2 + . . . (xn )2
www.phys.nsu.ru и расстояние между двумя точками p ρ(x, y) = |x − y| = (x1 − y 1 )2 + . . . (xn − y n )2 .
Напомню, что окрестностью точки x ∈ Rn называется любое множество, содержащее шар с центром в x и некоторым радиусом r > 0. Если A — множество в Rn и x ∈ A, то пересечение окрестности точки x с множеством A называют относительной окрестностью точки x в A. В случае n = 2 мы называем R2 плоскостью и часто обозначаем точки плоскости через (x, y). Говоря пространство, подразумеваем R3 и его точки часто обозначаем (x, y, z). В трехмерном пространстве определена еще одна операция — векторное произведение. Напомню как его можно вычислить. Обозначим через ~i, ~j, ~k стандартный базис в трехмерном пространстве. Рассмотрим формальный определитель ~i ~k ~j w = u1 u2 u3 v 1 v 2 v 3 2 1 1 u u 3 u u3 u u 2 ~ ~ ~ = i 2 −j 1 +k 1 v v3 v v3 v v2 = (u2 v 3 − u3 v 2 )~i − (u1 v 3 − u3 v 1 )~j + (u1 v 2 − u2 v 1 )~k. Вектор w называется векторным произведением векторов u и v и обозначается w = u×v. Оно равно нулю, если векторы u и v колинеарны. Если векторы u и v не колинеарны, то векторное произведение векторов u и v перпендикулярно плоскости, проходящей через u и v, его длина равна площади параллелограмма, натянутого на u и v, и он направлен так, что базис u, v, w является правым. 1
www.phys.nsu.ru
www.phys.nsu.ru 2
Н. С. Даирбеков
Для произвольный трех векторов u, v, w ∈ R3 определено их смешанное произведение 1 2 2 u 1 u2 u3 v v . (u, v, w) = (u, v × w) = v w 1 w 2 w 3 Оно равно нулю, если на векторы u, v, w линейно зависимы. В противном случае оно равно объему параллелепипеда, натянутого на векторы u, v, w, причем со знаком минус, если базис u, v, w является левым. Напомню понятие правого и левого базиса. Пусть V — произвольное векторное пространство. Два базиса ~e1 , . . . , ~en и f~1 , . . . , f~n называются одинаково ориентированными, если определитель матрицы перехода C от первого базиса ко второму положителен: det C > 0. Если det C < 0, то базисы называются противоположно ориентированными. По этому отношению все базисы в V распадаются на два класса. Произвольные два базиса в каждом классе одинаково ориентированы, а произвольные два базиса из разных классов противоположно ориентированы. Классы одинаково ориентированных базисов называются ориентациями пространства V . Таким образом, существует две ориентации пространства. Пространство называют ориентированным, если в нем выбрана некоторая ориентация. Базисы выбранной ориентации называют правыми, а базисы противоположной ориентации называют левыми. Для произвольного векторного пространства V нет выделенной ориентации. Однако в Rn существует стандартный базис
www.phys.nsu.ru ~e1 = (1, 0, . . . , 0), . . . , ~en = (0, . . . , 1).
Ориентация, определенная этим базисом, является правой ориентацией Rn . Отношение одинаковой ориентации базисов можно определить другим образом, не связанным непосредственно с матрицами перехода. Деформацией базиса ~e1 , . . . , ~en векторного пространства V в базис f~1 , . . . , f~n называют такое семейство n непрерывных функций ~ai : [a, b] → V , i = 1, . . . , n, что для каждого t ∈ [a, b] векторы ~a1 (t), . . . , ~an (t) составляют базис векторного пространства V , ~ai (a) = ~ei , i = 1, . . . , n и ~ai (b) = f~i , i = 1, . . . , n. Теорема. Два базиса одинаково ориентированы тогда и только тогда, когда они деформируемы друг в друга. В одну сторону это утверждение очевидно вытекает из непрерывной зависимости определителя матрицы от ее элементов. Доказательство обратного утверждения элементарно, но достаточно длинно. Мы его опускаем. 1.2. Элементарные кривые. Способы их задания. Множество C в Rn называется элементарной кривой, если оно является образом отрезка при некотором непрерывном взаимно однозначном отображении (скажем, α : I → Rn , I = [a, b] ⊂ R) этого интервала в Rn . Отображение α называется параметризацией данной кривой. Положение любой точки P кривой определяется числом t из интервала I, образом которого эта точка является: P = α(t). Переменная t называется параметром кривой C. Выражение x = α(t), или в развернутом виде x1 = α1 (t), . . . , xn = αn (t), называют параметрическим уравнением кривой. На
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
3
плоскости это выглядит так: x = α1 (t), y = α2 (t). В пространстве соответственно имеем x = α1 (t), y = α2 (t), z = α3 (t). У одной и той же элементарной кривой может быть много различных параметризаций. Кривую, снабженную параметризацией, назовем параметризованной кривой. Параметризация называется гладкой, если α(t) = (α1 (t), . . . , αn (t)), где каждое αi является некоторой вещественнозначной функцией на I класса C 2 (или C 3 , или C 4 , или выше в зависимости от контекста). Параметризация называется регулярной, если производная dα dt — ненулевой вектор для всех t. Иначе говоря, если 1 2 n 2 dα dα (t) + · · · + (t) 6= 0, t ∈ I. dt dt Элементарная кривая, допускающая регулярную параметризацию, называется регулярной элементарной кривой. Отмечу, что не достаточно требовать только гладкости параметризации (без регулярности), так как может получится негладкая кривая. Пример. Пусть f (t) — гладкая функция на прямой со следующими свойствами: 1) f (t) = 0, если t ≤ 0, 2) f (t) строго возрастает при t > 0. Рассмотрим вектор-функцию t ∈ R.
www.phys.nsu.ru x = f (t),
y = f (−t),
Ее образом является кривая с углом в начале координат.
Связное множество C в Rn называют гладкой кривой, если каждая точка из C обладает относительной окрестностью в C, являющейся регулярной элементарной кривой. Если не требовать связности C, то нетрудно понять, что множество C, удовлетворяющее указанному условию, является объединением попарно непересекающихся кривых. Таким образом, по определению каждый достаточно малый участок кривой параметризуется отрезком. Рассмотрим глобальное строение кривой. Возможны следующие случаи: 1) вся кривая параметризуется отрезком — кривая с двумя концами, 2) вся кривая параметризуется полуинтервалом — кривая с одним концом, 3) вся кривая параметризуется открытым интервалом — кривая без концов или открытая кривая, 4) кривая параметризуется окружностью — замкнутая кривая. Как задать кривую? Первый способ — параметрическое задание кривой — непосредственно связан с определением. Надо задать гладкую вектор-функцию α : I → Rn с ненулевым вектором скорости α0 (t) 6= 0, t ∈ I, на отрезке, полуинтервале или интервале. Второй способ — явное задание кривой — задать кривую в виде графика функции. Если f : I → R — гладкая функция, то ее график является плоской элементарной кривой, допускающей параметризацию x = t, y = f (t). Такое задание гладкой кривой называется явным. Аналогично пространственная кривая допускает явное задание, если она обладает параметризацией вида x = t, y = f (t), z = g(t) (в Rn определение аналогично). Не все кривые допускают явное задание, например, окружность (или любая дуга окружности, большая 180◦ ). Применяя теорему об обратной функции можно вывести (сделайте это!),
www.phys.nsu.ru
www.phys.nsu.ru 4
Н. С. Даирбеков
что в окрестности каждой своей точки гладкая кривая допускает явное задание в подходящей системе координат. Третий способ — неявное задание кривой — определить кривую с помощью уравнений (например, x2 +y 2 −1 = 0 на плоскости). Рассмотрим плоскую область V ⊂ R2 и функцию g : V → R. Рассмотрим множество C = {x ∈ V : g(x) = 0}.
Получившееся множество может конечно не быть кривой. Например, оно может быть пустым (x2 + y 2 + 1 = 0), или состоять из точки (x2 + y 2 = 0), и вообще может быть почти произвольным. Точнее, имеет место следующая теорема Теорема (Уитни). Пусть C — произвольное замкнутое множество в Rn . Тогда существует функция g : Rn → R такая, что C = {x ∈ Rn : g(x) = 0}. Тем не менее, можно указать условия, при которых множество C, заданное таким образом, является кривой. Теорема (неявное задание плоской кривой). Пусть g : U → R — гладкая функция, заданная на области U ⊂ R2 . Рассмотрим множество C = {x ∈ ∂g ∂g U : g(x) = 0}. Если grad g(x) = ( ∂x 1 , ∂x2 ) 6= 0 в каждой точке x ∈ C, то C является объединением попарно непересекающихся гладких кривых. Доказательство использует теорему о неявной функции. Напомню ее формулировку.
www.phys.nsu.ru Теорема. Представим пространство Rn+m размерности n + m в виде прямого произведения Rn+m = Rn × Rm пространств размерности n и m, т. е. запишем элементы x = (x1 , . . . , xn , xn+1 , . . . , xn+m ) в виде x = (y, z), где y = (y 1 , . . . , y n ) ∈ Rn , а z = (z 1 , . . . , z m ) ∈ Rm . Пусть U ⊂ Rn+m — открытое множество и заданы n гладких функций g 1 , . . . , g n : U → R. Пусть для некоторой точки (y0 , z0 ) ∈ U выполнено g 1 (y0 , z0 ) = · · · = g n (y0 , z0 ) = 0, причем 1 ∂g 1 ∂g ∂y1 (y0 , z0 ) . . . ∂yn (y0 , z0 ) .. .. .. 6= 0. det . . . ∂g n ∂g n (y , z ) . . . (y , z ) 0 0 0 0 ∂y1 ∂yn
Тогда существуют окрестность V точки y0 в Rn , окрестность W точки z0 в Rm и гладкие функции f 1 , . . . , f n : W → V такие, что выполнение уравнений g 1 (y, z) = 0, . . . , g n (y, z) = 0 для (y, z) ∈ V × W эквивалентно равенствам y 1 = f 1 (z), . . . , y n = f n (z), z ∈ W . Выведем теорему о неявном задании плоской кривой из теоремы о неявной функции. Аналогичная теорема имеет место в пространстве. Теорема (неявное задание пространственной кривой). Пусть g 1 и g 2 — гладкие функции заданные на области U ⊂ R3 . Рассмотрим множество C = {x ∈ U : g 1 (x) = 0, g 2 (x) = 0}. Если 1 1 1 ∂g
1
∂g ∂x2
∂g ∂x3
∂g 2 ∂x1
∂g 2 ∂x2
∂g 2 ∂x3
∂x rank
=2
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
5
в каждой точке x ∈ C, то C является объединением попарно непересекающихся гладких кривых.
Доказательство аналогично доказательству предыдущей теоремы и является упражнением в применении теоремы о неявной функции. В этом случае удобно рассматривать кривую как пересечение двух поверхностей Φ1 = {x : g 1 (x) = 0} и Φ2 = {x : g 2 (x) = 0}. Аналогично мы можем неявно задать кривую в n-мерном пространстве как совместное решение n − 1 уравнений с соответствующим условием на ранг. Рассмотрим произвольную кривую C и ее параметризацию α : I → Rn . Рассмотрим также произвольное непрерывное биективное (а, значит, и монотонное) отображение ϕ : J → I, τ 7→ t = ϕ(τ ), некоторого отрезка J на отрезок I. Композиция β : J → Rn , определяемая по формуле β(τ ) = α(ϕ(τ )), также будет параметризацией кривой C. Говорят, что она получается из параметризации α заменой параметра t = ϕ(τ ). Пример. Для того, чтобы параметризация β(τ ), полученная из регулярной параметризации α(t) с помощью замены параметра t = ϕ(τ ), также была регулярной, необходимо и достаточно, чтобы замена была неособой, т. е., чтобы функция ϕ была гладкая, а ее производная нигде не обращалась в нуль. Каждая параметризация определяет некоторый порядок точек на кривой. Если две параметризации связаны возрастающей заменой параметра, то они определяют один и тот же порядок, а если они связаны убывающей заменой параметра — то разный. Чтобы фиксировать порядок точек на кривой, достаточно указать начальную и конечную точки кривой. Эти точки называются концами кривой. Ориентированная кривая — это кривая с фиксированным порядком точек на ней. Ориентацию кривой удобно изображать стрелкой.
www.phys.nsu.ru 1.3. Касательная кривой. Пусть C — гладкая кривая в Rn , а α(t) — ее регулярная параметризация. Если P = α(t0 ) — точка кривой, то производная 1 dαn dα 0 α (t0 ) = (t0 ), . . . , (t0 ) dt dt вектор-функции α называется касательным вектором или вектором скорости кривой C в точке P . Касательные векторы в одной и той же точке, соответствующие различным параметризациям, колинеарны и, значит, могут отличаются только множителем. Действительно, если β(τ ) = α(ϕ(τ )) — другая параметризация той же кривой, причем t0 = ϕ(τ0 ), то вектор β 0 (τ0 ) = α0 (ϕ(t0 ))ϕ0 (τ0 ) очевидно колинеарен вектору α0 (t0 ) = α0 (ϕ(τ0 )). Прямая, проходящая через точку P в направлении касательного вектора α0 (t0 ), называется касательной прямой в точке P . Параметрическое уравнение касательной прямой имеет вид x = α(t0 ) + τ α0 (t0 ). Пример. Касательная к графику гладкой функции y = f (x) в точке (x0 , f (x0 )) имеет уравнение y = f (x0 ) + f 0 (x0 )(x − x0 ). Наше определение касательной просто, но не очень геометрично. Можно взять другое определение, основанное на следующем известном свойстве касательной: касательная есть предельное положение секущей. Пусть Q — точка
www.phys.nsu.ru
www.phys.nsu.ru 6
Н. С. Даирбеков
кривой C, близкая к точке P . Проведем секущую через точки P и Q. Тогда при стремлении точки Q к P эти секущие стремятся к касательной прямой в точке P . (Легко вывести из определения производной.) Плоскость, содержащая точку P и ортогональная касательной прямой, называется нормальной плоскостью кривой C в точке P . Уравнение нормальной плоскости можно записать следующим образом: hx − α(t0 ), α0 (t0 )i = 0.
1.4. Длина кривой. Натуральный параметр. Пусть элементарная кривая C параметризована вектор-функцией α : [a, b] → Rn . Выберем на отрезке [a, b] k − 1 точку, разбивающие его на k частей: a < t1 < · · · < tk−1 < b. Положим t0 = a, tk = b. Ломаная с вершинами в точках α(t0 ), . . . , α(tk ) называется вписанной в кривую C. Длиной кривой C называется предел, к которому стремится длина вписанных ломаных при неограниченном убывании длин звеньев ломаной. Отметим, что условие убывания длин звеньев вписанной ломанной можно заменить эквивалентным ему условием max
i=0,...,k−1
(ti+1 − ti ) → 0.
Заметим, что предел всегда существует (конечный или бесконечный) и совпадает с супремумом длин ломаных, вписанных в кривую. Кривая C называется спрямляемой, если ее длина конечна.
www.phys.nsu.ru Теорема (о длине кривой). Каждая элементарная гладкая кривая спрямляема и ее длина может быть найдена по формуле Zb S=
|α0 (t)| dt,
a
где α : [a, b] → Rn — произвольная регулярная параметризация кривой. Доказательство. Введем обозначения: ∆αi = α(ti ) − α(ti−1 ),
αi0 = α0 (ti ),
∆ti = ti − ti−1 .
Тогда длина вписанной ломаной равна |∆α1 | + . . . |∆αk | и разность между ней и интегралом от модуля производной оценивается следующим образом: Zb k k k X X X |∆αi | − |α0 (t) dt ≤ |∆αi | − |αi0 |∆ti i=1
k X |αi0 |∆ti − + i=1
i=1
i=1
a
Zb
|α0 (t) dt = I + II.
a
Заметим, что второе слагаемое стремится к нулю по определению интеграла. Осталось доказать, что первое слагаемое стремится к нулю. Имеем k k X X I= |∆αi | − |αi0 |∆ti ≤ |∆αi − αi0 ∆ti |. i=1
i=1
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
7
Для каждого слагаемого получаем |∆αi −
αi0 ∆ti |
Zti Zti 0 = α (t) dt − αi0 dt ti−1
ti−1
Zti Zti 0 0 = (α (t) − αi ) dt ≤ |α0 (t) − αi0 | dt. ti−1
ti−1
0
Так как функция α (t) непрерывна на отрезке [a, b], то она равномерна непрерывна на этом отрезке. Значит для любого ε > 0 найдется такое δ > 0, что для любых x, y ∈ [a, b] таких, что |x − y| < δ выполнено |α0 (x) − α0 (y)| < ε. Поэтому если все отрезки ti−1 , ti ] по длине меньше δ, то |α0 (t) − αi0 | < ε и, следовательно, Zti
|∆αi − αi0 ∆ti | ≤
ε dt = ε · ∆ti . ti−1
Окончательно выводим I≤
k X
(ε · ∆ti ) = ε ·
i=1
k X
∆ti = ε(tk − t0 ).
i=1
Отсюда ввиду произвола в выборе ε следует, что первое слагаемое стремится к нулю.
www.phys.nsu.ru Пример. Если плоская кривая явно задана уравнением y = f (x), то подставляя в формулу α1 (t) = t, α2 (t) = f (t), α3 (t) = 0, получим Zb p S= 1 + (f 0 )2 dx. a
С понятием длины связана одна очень удобная параметризация кривой, называемая естественной параметризацией, натуральной параметризацией или параметризацией длиной дуги, а соответствующий параметр называется натуральным параметром. Натуральная параметризация выделяется условием: длина произвольного участка кривой, отвечающего изменению параметра от a1 до b1 , равна b1 − a1 . Заметим, что если натуральная параметризация γ(s) является гладкой, то ее касательный вектор имеет единичную длину: |γ 0 (s)| ≡ 1. Действительно, из формулы для длины кривой имеем Zb1
|γ 0 (s)| ds = b1 − a1 .
a1
Значит 1 b1 − a1
Zb1
|γ 0 (s)| ds = 1,
a1
т. е. среднее значение модуля γ 0 на произвольном отрезке [a1 , b1 ] равно 1. Устремляя b1 к a1 , выводим из непрерывности, что |γ 0 (a1 )| = 1. Ввиду произвола в
www.phys.nsu.ru
www.phys.nsu.ru 8
Н. С. Даирбеков
выборе a1 получаем нужное равенство. Заметим, что обратное тоже верно, т. е. гладкая параметризация е касательным вектором единичной длины является натуральной. Это очевидно из формулы для длины кривой. Теорема (о натуральном параметре). Каждой гладкая кривая допускает гладкую натуральную параметризацию. Доказательство. Рассмотрим произвольную регулярную параметризацию α : [a, b] → Rn гладкой кривой C. Зададим на [a, b] функцию ψ(t) по формуле Zt ψ(t) =
|α0 (τ ) dτ.
a
Иными словами ψ(t) равно длине участка кривой между α(a) и α(t). Очевидно, что функция ψ(t) — гладкая, ψ 0 (t) = |α0 (t)|, монотонно возрастающая (так как имеет положительную производную) и отображает отрезок [a, b] на отрезок [0, S], где S — длина кривой C. Рассмотрим обратную функцию ϕ = ψ −1 : [0, S] → [a, b]. Определим новую параметризацию γ(s) с помощью замены параметра t = ϕ(s): γ(s) = α(ϕ(s)). Проверим, что |γ 0 (s)| ≡ 1. Действительно, 0 1 1 ϕ0 (s) = ψ −1 (s) = 0 = 0 . ψ (ϕ(s)) |α (ϕ(s))|
www.phys.nsu.ru Поэтому
0 α (ϕ(s)) ≡ 1. |γ (s)| = |α (ϕ(s))ϕ (s)| = 0 |α (ϕ(s))| 0
0
0
Пример. Уравнения x = cos s, y = sin s при s ∈ [0, π] задают естественную параметризацию верхней единичной полуокружности. 1.5. Кривизна кривой. Соприкасающаяся плоскость. Рассмотрим гладкую кривую C и ее натуральную параметризацию γ(s). Вектор γ 0 (s) обозначим через ~t и будем называть единичным касательным вектором кривой в точке γ(s). Он очевидно имеет единичную длину. Рассмотрим вторую производную γ 00 (s). Этот вектор называется вектором кривизны кривой C в точке P = γ(s) и обозначается через ~k. Его длина k = |~k| называется кривизной кривой C в точке P. Вектор ~k ортогонален вектору ~t. Действительно, справедливо следующее простое утверждение. Лемма. Для гладкой вектор-функций f : [a, b] → Rn тождество |f (t)| ≡ const выполняется тогда и только тогда, когда векторы f (t) и f 0 (t) ортогональны для всех t. Доказательство. Имеем hf (t), f (t)i0 = 2hf (t)0 , f (t)i. Дальше воспользуемся фактом, что функция на интервале постоянная тогда и только тогда, когда она имеет нулевую производную.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
9
Продолжим. Если k 6= 0, то ~k 6= 0 и прямая, проходящая через точку P в направлении ~k, называется главной нормалью кривой C в точке P . В этом случае единичный вектор ~n = ~k/k называется единичным вектором главной нормали. Таким образом, d~t = k~n. ds Эта формула называется первой формулой Френе. Замечание. Для плоских кривых кривизне часто приписывают знак, полагая ее положительной, если базис ~t, ~n правый, и отрицательной, если базис левый. Пример. 1. Кривизна прямой равна нулю во всех точках. Обратно: если кривизна кривой рана нулю во всех точках, то кривая является отрезком прямой. 2. Кривизна дуги окружности радиуса R равна 1/R.
Величина, обратная кривизне, называется радиусом кривизны кривой в данной точке. Плоскость, проходящая через касательную и главную нормаль кривой, называется соприкасающейся плоскостью кривой. Теорема (о соприкасающейся плоскости). Соприкасающаяся плоскость кривой в точке P есть предел, к которому стремится при Q → P переменная плоскость, проходящая через касательную кривой в точке P и через точку Q.
www.phys.nsu.ru Доказательство. Рассмотрим точку P = γ(s0 ) и переменную точку Q = γ(s0 + ∆s). Тогда вектор N=
2 0 γ (s0 ) × (γ(s0 + ∆s) − γ(s0 )) ∆s2
перпендикулярен к плоскости, проходящей через касательную прямую и точку Q. По формуле Тейлора 1 ∆s2 ~ k + o(∆s2 ). γ(s0 + ∆s) − γ(s0 ) = γ 0 (s0 )∆s + γ 00 (s0 )∆s2 + o(∆s2 ) = ∆s~t + 2 2 Поэтому γ 0 (s0 ) × (γ(s0 + ∆s) − γ(s0 )) =
∆s2 ~ ~ t × k + o(∆s2 ) . 2
Значит при ∆s → 0 N = ~t × ~k + o(1) → ~t × ~k. Так как вектор ~t × ~k перпендикулярен соприкасающейся плоскости, угол между переменной плоскостью и соприкасающейся плоскостью стремится к нулю, что заканчивает доказательство теоремы. Пример. Соприкасающаяся плоскость плоской кривой всегда совпадает с той плоскостью, в которой лежит кривая. Все это верно для натуральной параметризации кривой. Выясним, что происходит для произвольной регулярной параметризации.
www.phys.nsu.ru
www.phys.nsu.ru 10
Н. С. Даирбеков
Пусть α(t) — произвольная регулярная параметризация кривой C. Пусть она связана с естественной параметризацией γ(s) с помощью замены параметра s = Rt ψ(t) = 0 |α0 (τ )| dτ , причем s0 = ψ(t0 ). Так как α(t) = γ(ψ(t)), имеем α0 (t) = γ 0 (ψ(t))ψ 0 (t), α00 (t0 ) = γ 00 (s0 ) · (ψ 0 (t0 ))2 + γ 0 (s0 ) · ψ 00 (t0 ).
Первое слагаемое лежит на главной нормали кривой, а второе на касательной прямой. В частности, при любой параметризации вектор ускорения α00 (t0 ) лежит в одной и той же плоскости — соприкасающейся плоскости кривой. Отсюда выводим уравнение соприкасающейся плоскости (x − α(t0 ), α0 (t0 ), α00 (t0 )) = 0 для произвольной регулярной параметризации. Проекция вектора α00 (t0 )⊥ на соприкасающаяся плоскость равна α00 (t0 )⊥ = |α0 (t0 )|2~k. 00 ⊥ α (t0 ) Здесь мы учли равенство ψ 0 (t0 ) = |α0 (t0 )|. Ясно, что k(t0 ) = |α 0 (t )|2 . Обозначим 0
через θ угол между векторами α0 (t0 ) и α00 (t0 ). Тогда |α00 (t0 )⊥ | = |α00 (t0 )| · sin θ =
|α00 (t0 ) × α0 (t0 )| . |α0 (t0 )|
www.phys.nsu.ru Окончательно выводим
k=
|α00 × α0 | . |α0 |3
Пример. Кривизна плоской кривой, заданной явным уравнением y = f (x), вычисляется по формуле |f 00 | k= . (1 + (f 0 )2 )3/2
1.6. Кручение. Формулы Френе. Пусть C — гладкая кривая в R3 и γ(s) — ее натуральная параметризация. Будем считать, что C имеет ненулевую кривизну во всех своих точках. В частности, в любой точке P = γ(s0 ) определены единичный касательный вектор ~t = γ 0 и единичный вектор главной нормали ~n = k1 ~t0 , где k — кривизна кривой. Определим вектор бинормали 0 00 ~b = ~t × ~n = γ × γ . k ~ ~ Упорядоченная тройка векторов t, ~n, b называется базисом Френе (а также репером Френе, сопровождающий репер, трехвекторник Френе, сопровождающий трехвекторник). Для произвольной регулярной параметризации α(t) имеем 0 00 ~b = α × α . |α0 × α00 |
Рассмотрим вектор ~b0 (s0 ). Он ортогонален вектору t(s0 ). Действительно, учитывая, что векторы ~t0 и ~n колинеарны, имеем ~b0 = (~t × ~n)0 = ~t0 × ~n + ~t × ~n0 = ~t × ~n0 .
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
11
Далее, вектор ~b0 ортогонален вектору ~b, так как длина вектора ~b постоянная. Следовательно, ~b0 (s0 ) колинеарен вектору ~n(s0 ). Поэтому выполняется равенство ~b0 (s0 ) = −κ~n(s0 ).
Число κ называется кручением кривой C в точке C. Это так называемая третья формула Френе. Кручение характеризует отличие пространственной кривой от плоской. Пример. Кручение кривой равно нулю в каждой точке тогда и только тогда, когда кривая лежит в некоторой плоскости. Теорема (формулы Френе). ~t0 (s) = k(s)~n(s), ~n0 (s) = −k(s)~t(s) + κ(s)~b(s), ~b0 (s) = −κ(s)~n(s). Доказательство. Первая и третья формулы нам уже известны. Вторая из них следует: ~n = ~(~b × ~t)0 = ~b0 × ~t + ~b × ~t0 = −κ(~n × ~t) + k(~b × ~n) = κ~b − k~t.
www.phys.nsu.ru Пусть по прежнему γ(s) — естественная параметризация гладкой кривой C и кривизна C не обращается в нуль. Из формул Френе имеем γ 0 (s) = ~t,
γ 00 (s) = k~n, γ 000 (s) = (k~n)0 = k 0~n + k~n0 = k 0~n + k(−k~t + κ~b) = −k 2~t + k 0~n + kκ~b. Вычисляя смешанное произведение, получим (γ 0 , γ 00 , γ 000 ) = (~t, k~n, −k 2~t + k 0~n + kκ~b) = (~t, k~n, kκ~b) = k 2 κ. Окончательно получаем (γ 0 , γ 00 , γ 000 ) . k2 Теперь выведем формулу для кручения при произвольной параметризации Rt α(t). Пусть s = ψ(t) = 0 |α0 (τ )| dτ — замена переменной, связывающая параметризацию α с естественной параметризацией: α(t) = γ(ψ(t)). Тогда κ=
α0 (t) = γ 0 (s)ψ 0 (t), α00 (t) = γ 00 (s)(ψ 0 (t))2 + γ 0 (s)ψ 00 (t), α000 (t) = γ 000 (s)(ψ 0 (t))3 + 3γ 00 (s)ψ 0 (t)ψ 00 (t) + γ 0 (s)ψ 00 (t). Отсюда следует, что (α0 , α00 , α000 ) = (γ 0 , γ 00 , γ 000 )(ψ 0 )6 .
www.phys.nsu.ru
www.phys.nsu.ru 12
Н. С. Даирбеков
При этом ψ 0 = |α0 |. Так как k =
|α0 ×α00 | |α0 |3 ,
κ=
выводим
(α0 , α00 , α000 ) . |α0 × α00 |2
Кривизна и кручение полностью определяют кривую в R3 с точностью до ее положения в пространстве. Более точно, имеет место теорема. Теорема. Пусть C1 и C2 — две гладкие кривые, имеющие одинаковую длину. Пусть γ1 (s) и γ2 (s) — их естественные параметризации. Если кривизны и кручения в соответствующих точках равны: k1 (s) = k2 (s),
κ1 (s) = κ2 (s),
то кривые C1 и C2 совмещаются некоторым движением всего пространства. Доказательство. Совместим движением пространства реперы Френе обеих кривых в начальной точке. Иначе говоря, будем считать, что γ1 (0) = γ2 (0), ~t1 (0) = ~t2 (0), ~n1 (0) = ~n2 (0), ~b1 (0) = ~b2 (0). Докажем, что γ1 (s) ≡ γ2 (s). Взглянем на формулы Френе ~t0 (s) = k(s)~n(s), ~n0 (s) = −k(s)~t(s) + κ(s)~b(s),
www.phys.nsu.ru ~b0 (s) = −κ(s)~n(s)
и рассмотрим их как систему обыкновенных дифференциальных уравнений относительно ~t, ~n, ~b. Полагая k ≡ k1 ≡ k2 , κ ≡ κ1 ≡ κ2 , мы видим, что ~t1 , ~n1 , ~b1 и ~t2 , ~n2 , ~b2 являются решениями этой системы с одинаковыми начальными данными. По теореме единственности для решений дифференциальных уравнений получаем ~t1 ≡ ~t2 , ~n1 ≡ ~n2 , ~b1 ≡ ~b2 . Но тогда Zs Zs γ1 (s) = γ1 (0) + ~t1 (s) = γ2 (0) + ~t2 (s) = γ2 (s). 0
0
Аналогично используя теорему существования решений дифференциальных уравнений, можно доказать, что для любых гладких функций h(s) и η(s) на отрезке [0, S], первая из которых положительна, существует гладкая кривая для которой k = h(s), κ = η(s). Соотношения k = h(s), κ = η(s) называются натуральными уравнениями кривой.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
2. ДИФФЕРЕНЦИАЛЬНАЯ
13
ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
2.1. Элементарные поверхности. Множество V ⊂ Rn называется областью, если оно открыто и связно. Будем называть множество Φ в евклидовом пространстве R3 элементарной поверхностью, если Φ является образом плоской области V при непрерывном взаимно однозначном отображении f : V → R3 : Φ = f (V ),
V ⊂ R2 ,
причем обратное отображение из Φ на V также непрерывно. Отображение f называется параметризацией элементарной поверхности Φ. Поверхность, снабженная параметризацией, называется параметризованной поверхностью. Координаты в плоскости R2 , в которой лежит область V , будем обозначать через u, v. Значениями u и v полностью определяется положение любой точки P на поверхности P = f (u, v). Числа u и v называются локальными координатами точки P . Говорят, что поверхность задана уравнением ~r = f (u, v). Пусть f : V → R3 — параметризация элементарной поверхности Φ, причем 1 f , f 2 , f 3 — координатные функции отображения f . Говорим, что f — регулярная параметризация, если функции f 1 , f 2 , f 3 — гладкие, причем ранг матрицы Якоби ∂f 1 ∂u
∂f 2 ∂u
∂f 1 ∂v
∂f 2 ∂v
www.phys.nsu.ru ∂f 3 ∂u
равен 2 для всех (u, v) ∈ V , т. е. 1 ∂f ∂f 1 ∂u ∂v , ∂f 2 ∂f 2 ∂u
∂v
∂f 3 ∂v
по крайней мере один из трех определителей 1 2 ∂f ∂f ∂f 1 ∂f 2 ∂u ∂v ∂v ∂u , ∂f 3 ∂f 3 ∂f 3 ∂f 3 ∂u
∂v
∂u
∂v
∂f не обращался в нуль. Это эквивалентно тому, что векторы ~ru = ∂u и ~rv = ∂f ∂v линейно независимы. Элементарная поверхность, обладающая регулярной параметризацией, называется гладкой элементарной поверхностью.
2.2. Гладкие поверхности. Способы их задания. Назовем множество Φ в R3 гладкой поверхностью, если каждая точка из Φ обладает относительной окрестностью, которая является гладкой элементарной поверхностью. Произвольная регулярная параметризация такой окрестности называется локальной картой поверхности; иногда сама эта окрестность называется картой. Таким образом, каждая гладкая поверхность покрывается некоторым набором локальных карт, но глобальная параметризация существует не для всех поверхностей, например, сфера не является элементарной поверхностью. Набор локальных карт, покрывающий всю поверхность, называется атласом поверхности. Пусть дана гладкая функция g(x, y), заданная на области U в плоскости. Тогда ее график — это множество в R3 , состоящее из точек {(x, y, g(x, y) : (x, y) ∈ U }.
www.phys.nsu.ru
www.phys.nsu.ru 14
Н. С. Даирбеков
Лемма (о явном задании поверхности). График гладкой функции является гладкой поверхностью. Обратно, в окрестности каждой своей точки любая гладкая поверхность является графиком некоторой гладкой функции при подходящем обозначении координат. Доказательство. Очевидно, что график является образом плоской области U при отображении x 7→ x, y 7→ y, z 7→ g(x, y).
Проверим условие на ранг. В другую сторону используем теорему об обратной функции. Напомню ее формулировку. Теорема. Пусть ϕ : U → Rn — гладкое отображение открытого множества U ⊂ Rn в Rn . Предположим, что x0 ∈ U , y0 = ϕ(x0 ) и определитель матрицы Якоби отображения ϕ в точке x0 не равен нулю: ∂ϕ1 ∂ϕ1 ∂x1 (x0 ) . . . ∂xn (x0 ) .. .. .. det 6= 0. . . . ∂ϕn ∂x1 (x0 )
∂ϕn ∂xn (x0 )
...
Тогда найдутся окрестность A точки x0 и окрестность B точки y0 такие, что f взаимно однозначно отображает A на B. Причем обратное отображение B на A также гладкое.
www.phys.nsu.ru
Если поверхность является графиком функции g(x, y), то случае мы говорим, что она задана уравнением z = g(x, y). Такое задание поверхности называется явным. Одна и та же элементарная поверхность допускает много параметризаций. Рассмотрим произвольное взаимно однозначное отображение ϕ : W → V некоторой плоской области W на область V : ϕ : W → V,
(ξ, η) 7→ (u, v),
где u = ϕ1 (ξ, η), v = ϕ2 (ξ, η), причем ϕ и ϕ−1 непрерывны. Если f : V → R3 — параметризация элементарной поверхности Φ, то композиция G : W → R3 , G(ξ, η) = f (ϕ1 (ξ, η), ϕ2 (ξ, η)), также будет параметризацией для Φ. Говорят, что она получается из параметризации f при помощи замены локальных координат u = ϕ1 (ξ, η), v = ϕ2 (ξ, η). Нетрудно доказать, что любые две параметризации элементарной поверхности получаются одна из другой при помощи некоторой замены локальных координат. Пример. Для того, чтобы параметризация G(ξ, η), полученная заменой (u, v) = ϕ(ξ, η) из регулярной параметризации f (u, v), была регулярной, необходимо и достаточно, чтобы замена была неособой, т. е. функции ϕ1 и ϕ2 были гладкими и якобиан замены не обращался в нуль: 1 1 ∂ϕ ∂u
2
∂ϕ ∂u
∂ϕ ∂v
2
∂ϕ ∂v
6= 0.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
15
Пусть U — открытое множество в R3 и g : U → R — гладкая функция. Множество S = g −1 (c) = {x ∈ U : g(x) = c}, c ∈ R, называют множеством уровня функции g (высоты c).
Лемма (о неявном задании поверхности). Пусть S — множеством уровня гладкой функции g высоты c. Допустим, что grad g(x) = (
∂g ∂g ∂g (x), 2 (x), 3 (x)) 6= 0 ∂x1 ∂x ∂x
для всех x ∈ S. Тогда S — гладкая поверхность. Обратно, в окрестности каждой своей точки любая гладкая поверхность допускает такое задание. Доказательство. В одну сторону используем теорему о неявной функции. В другую воспользуемся леммой о явном задании поверхности. Имеем некоторое уравнения z = f (x, y). Положим g(x, y, z) = z − f (x, y). Если поверхность является множеством уровня функции g(x, y, z) высоты c, то случае мы говорим, что она задана уравнением g(x, y, z) = c. Такое задание поверхности называется неявным. 2.3. Поверхности вращения и линейчатые поверхности. Пусть x = x(v), z = z(v) — произвольная гладкая кривая на плоскости xz, не пересекающая оси z. Поверхность
www.phys.nsu.ru x = x(v) cos u, y = x(v) sin u, z = z(v). называется поверхностью вращения, а кривая x = x(v), z = z(v) называется ее профилем. Наглядно поверхность получается вращением профиля вокруг оси z. В этом случае ~ru = (−x(v) sin u, x(v) cos u, 0), ~rv = (x0 (v) cos u, x0 (v) sin u, z 0 (v)) и линейная независимость этих векторов гарантируется регулярностью профиля (т. е. условием x0 (v)2 + z 0 (v)2 6= 0) и тем, что профили не пересекает оси z (т. е. x(v) 6= 0). Для доказательства надо отдельно рассмотреть точки, где z 0 (v) 6= 0, и точки, где z 0 (v) = 0. Заметим, что указанная параметризация является регулярной, если v0 < v < 2π + v0 для любого фиксированного v0 . Поверхность ~r = f (u, v) называется линейчатой, если f (u, v) = ~a(u) + v~b(u), где ~a(u) и ~b(u) — произвольные гладкие вектор-функции такие, что векторы ~a0 (u) + v~b0 (u) и ~b(u) линейно независимы. Это условие гарантирует регулярность параметризации. Наглядно линейчатая поверхность зачерчивается движущейся в пространстве прямой с направляющим вектором ~b(u), проходящей через точку ~a(u).
www.phys.nsu.ru
www.phys.nsu.ru 16
Н. С. Даирбеков
2.4. Касательное пространство и касательная плоскость. Нормаль к поверхности. Пусть Φ — гладкая поверхность и P — точка на Φ. Вектор в точке P называется касательным к поверхности Φ, если он является вектором скорости некоторой параметризованной кривой в R3 , целиком принадлежащей Φ. Нулевой вектор также считается касательным.
Теорема. Множество касательных векторов к гладкой поверхности в точке P является двумерным подпространством R3 . Доказательство. Рассмотрим произвольную регулярную параметризацию f : V → R3 поверхности Φ в окрестности точки P , причем P = f (u0 , v0 ). Любая гладкая кривая α на Φ в окрестности точки P является поднятием некоторой плоской кривой α ˜ в V в том смысле, что α(t) = f (˜ α(t)). И наоборот любая плоская гладкая кривая α ˜ в V порождает гладкую кривую на Φ: α(t) = f (˜ α(t)). Параметрические уравнения u = α1 (t),
v = α2 (t)
называются локальными уравнениями кривой α. Если α(t0 ) = P , то α0 (t0 ) = df (u0 , v0 )˜ α0 (t0 ). Иначе говоря, множество касательных векторов к поверхности Φ в точке P является образом при линейном отображений df (u0 , v0 ) множества касательных векторов в точке (u0 , v0 ) всевозможных плоских кривых, проходящих через точку (u0 , v0 ). Последнее множество векторов очевидно совпадает с R2 . Так как матрица линейного отображения df (u0 , v0 ) : R2 → R3 имеет ранг 2 ввиду условия регулярности параметризации, образ этого отображения есть двумерное подпространство в R3 .
www.phys.nsu.ru Множество всех касательных векторов к гладкой поверхности в некоторой точке P является поэтому двумерным подпространством в R3 , называемым касательным пространством поверхности в точке P и обозначаемым TP Φ. Пусть f : V → R3 — регулярная параметризация поверхности Φ. Пусть P = f (u0 , v0 ) — точка на M . Кривые на поверхности Φ, задаваемые локальными уравнениями u = t, v = v0 = const, u = u0 = const, v = t, называются координатными линиями поверхности Φ. Тогда параметрические уравнения координатных линий равны ~r = f (t, v0 ),
~r = f (u0 , t).
Векторы их скоростей в точке P очевидно равны ∂f ∂f (u0 , v0 ), (u0 , v0 ) ∂u ∂v по определению частных производных отображения. По условию регулярности эти векторы линейно независимы и тем самым касательное пространство TP Φ совпадает с подпространством R3 , натянутым на эти два вектора: ∂f ∂f TP Φ = {ξ = λ (u0 , v0 ) + µ (u0 , v0 ) | λ, µ ∈ R2 }. ∂u ∂v Числа λ и µ называются локальными координатами касательного вектора ξ.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
17
Плоскость P +TP Φ, проходящая через точку P называется касательной плоскостью поверхности. Она состоит из касательных прямых в точке P к всевозможным кривым на Φ, проходящим через P . Уравнение касательной плоскости можно записать следующим образом: ∂f ∂f ~r − f (u0 , v0 ), (u0 , v0 ), (u0 , v0 ) = 0. ∂u ∂v
Прямая, проходящая через P и ортогональная касательной плоскости, называется нормальной прямой. Для этой прямой мы можем взять единичный направляющий вектор ∂f × ∂f ∂v . ~n = ∂u ∂f | ∂u × ∂f ∂v | Предположим, что поверхность Φ задана неявным уравнением g(x, y, z) = c и точка P = (x0 , y0 , z0 ) лежит на этой поверхности, т. е. g(x0 , y0 , z0 ) = c. Лемма. Касательное пространство к Φ в точке P совпадает с множеством векторов, ортогональных grad g(x0 , y0 , z0 ): TP Φ = {ξ ∈ R3 : hξ, grad g(x0 , y0 , z0 )i = 0}. Доказательство. Каждый касательный вектор ξ к Φ в точке P представляет собой вектор скорости α0 (t0 ) некоторой параметризованной кривой α : I → R3 , для которой α(t0 ) = P и α(I) ⊂ Φ. Из включения α(I) ⊂ Φ следует, что g(α(t)) = 0, так что по правилу дифференцирования сложной функции имеем
www.phys.nsu.ru d(g ◦ α) (t0 ) = grad g(α(t0 )) · α0 (t0 ) = hg(x0 , y0 , z0 ), ξi. dt Таким образом, левая часть доказываемой формулы содержится в правой. Так как обе части являются двумерными подпространствами, отсюда вытекает, что они совпадают. 0=
Единичный направляющий вектор нормальной прямой можно взять в виде ~n =
grad g(x0 , y0 , z0 ) . | grad g(x0 , y0 , z0 )|
2.5. Ориентируемые и неориентируемые поверхности. Пусть Φ — гладкая элементарная поверхность и f : V → R3 — ее регулярная параметризация. ∂f Для произвольной точки P = f (u0 , v0 ) векторы ∂u (u0 , v0 ), ∂f ∂v (u0 , v0 ) составляют базис касательного пространства P = f (u0 , v0 ). Напомню, что фиксация базиса определяет ориентацию векторного пространства. При этом базисы, для которых матрица перехода от данного базиса имеет положительный определитель, одинаково ориентированы с данным базисом, а базисы с отрицательным определителем матрицы перехода противоположно ориентированы. Значит данная регулярная параметризация поверхности определяет некоторую ориентацию касательного пространства TP Φ в каждой точке P . Кроме того, она определяет непрерывное поле единичных нормалей: ~n =
∂f ∂u ∂f | ∂u
× ×
∂f ∂v , ∂f ∂v |
называемое полем единичных внутренних нормалей.
www.phys.nsu.ru
www.phys.nsu.ru 18
Н. С. Даирбеков
Пусть Ψ : W → R3 — другая регулярная параметризация, получающаяся из параметризации f при помощи замены локальных координат u = ϕ1 (ξ, η), v = ϕ2 (ξ, η). Точка P теперь естественно приобретает другие локальные координаты (ξ0 , η0 ): P = Ψ(ξ0 , η0 ) и касательное пространство TP Φ в точке P име∂Ψ ет также базис ∂Ψ ∂ξ (ξ0 , η0 ), ∂η (ξ0 , η0 ) и приобретает ориентацию, определенную этим базисом. Лемма. Параметризации f и Ψ определяют одну и ту же ориентацию касательного пространства TP Φ в каждой точке P поверхности Φ тогда и только тогда, когда якобиан замены локальных переменных положителен: 1 1 ∂ϕ ∂η
∂ϕ ∂ξ
det
2
∂ϕ ∂ξ
2
∂ϕ ∂η
> 0.
В этом случае параметризации f и Ψ порождают одно и то же поле единичных внутренних нормалей. Оставлю доказательство этой леммы как упражнение. Определение. Пусть Φ — произвольная гладкая поверхность. Назовем две локальные карты согласованными, если якобиан замены локальных переменных на их общей части положителен, иначе говоря, если они определяют одну и ту же ориентацию касательного пространства в каждой точке пересечения этих карт. Назовем поверхность Φ ориентируемой, если она допускает покрытие согласованными локальными картами. Такое набор согласованных локальных карт, покрывающих поверхность, называется ориентирующим атласом. Поверхность называют ориентированной, если фиксирован максимальный ориентирующий атлас. Карты этого атласа называются согласованными с ориентацией. Произвольный ориентирующий атлас может быть дополнен до максимального. Поэтому для фиксации ориентации достаточно указать произвольный ориентирующий атлас.
www.phys.nsu.ru Наличие ориентирующего атласа позволяет определить ориентацию касательного пространства в каждой точке поверхности с помощью описанной выше процедуры через локальные карты, а также задать непрерывное поле внутренних нормалей на поверхности. С другой стороны имеет место следующая лемма. Лемма. Если поверхность допускает непрерывное поле (ненулевых) нормалей, то она ориентируемая. Доказательство. Допустим, что на гладкой поверхности Φ задано непрерывN ное поле нормалей N . Полагая ~n = |N | , получим непрерывное поле единичных нормалей. Рассмотрим произвольный атлас поверхности Φ. Пусть f : V → R3 , ~r = f (u, v), — произвольная локальная карта этого атласа, где V — область в R2 . По f строим непрерывное поле единичных нормалей ~n0 =
∂f ∂u ∂f | ∂u
× ×
∂f ∂v . ∂f ∂v |
На f (V ) имеем два непрерывных поля единичных нормалей ~n и ~n0 . Из связности f (V ) вытекает, что поля либо совпадают, либо в каждой точке направлены
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
19
противоположно друг другу. Во втором случае поменяем координаты u и v местами. Заметим, что для полученной параметризации вектор ~n0 изменит направление на противоположное и совпадет с ~n. Поступим так с каждой локальной картой. Теперь нетрудно проверить, что любые две карты получившегося атласа согласованы. Заметим, что если поверхность связная, то для произвольных двух ориентирующих атласов ориентации касательного пространства либо одинаковые сразу во всех точках, либо разные во всех точках, причем в первом случае атласы определяют одинаково направленные поля нормалей, а во втором — противоположно направленные. Таким образом, имеется две разные ориентации связной поверхности. Чтобы ориентировать связную ориентируемую поверхность достаточно фиксировать ориентацию касательного пространства или направление нормали к поверхности в одной точке. Если ориентируемая поверхность имеет n компонент связности, то она допускает 2n различных ориентаций.
2.6. Первая квадратичная форма поверхности. Длина кривой на поверхности. Пусть Φ — гладкая поверхность и f : V → R3 , ~r = f (u, v), — произвольная локальная карта поверхности, где V — область в R2 . Рассмотрим гладкую кривую C на поверхности Φ, заданную локальными уравнениями u = ϕ1 (t), v = ϕ2 (t), t ∈ [a, b]. В пространстве кривая C задана векторным уравнением ~r = ϕ(t), где ϕ(t) = f (ϕ1 (t), ϕ2 (t). Найдем длину C по известной формуле Zb
www.phys.nsu.ru S=
|ϕ0 (t)| dt.
a
0
Вычислим длину вектора ϕ (t). По правилу дифференцирования сложной функции (цепному правилу) ∂f 1 ∂f 1 (ϕ (t), ϕ2 (t)) · (ϕ1 )0 (t) + (ϕ (t), ϕ2 (t)) · (ϕ2 )0 (t) ∂u ∂v или более коротко ϕ0 = fu ϕ˙ 1 + fv ϕ˙ 2 . Значит |ϕ0 |2 = |fu |2 (ϕ˙ 1 )2 + 2hfu , fv iϕ˙ 1 ϕ˙ 2 + |fv |2 (ϕ˙ 2 )2 . Введем следующие обозначения ϕ0 (t) =
E = |fu |2 ,
F = hfu , fv i,
G = |fv |2 .
Таким образом, |ϕ0 | =
p E(ϕ˙ 1 )2 + 2F ϕ˙ 1 ϕ˙ 2 + G(ϕ˙ 2 )2 .
Квадратичная форма I(ξ) = E(ξ 1 )2 + 2F ξ 1 ξ 2 + G(ξ 2 )2 ,
ξ = (ξ 1 , ξ 2 ),
называется первой квадратичной формой поверхности Φ, причем коэффициенты не числа, а функции, зависящие от локальных координат u и v. Таким образом, для длины кривой имеем формулу Zb p S= I(ϕ˙ 1 , ϕ˙ 2 ) dt. a
www.phys.nsu.ru
www.phys.nsu.ru 20
Н. С. Даирбеков
Пример. Для поверхности, заданной явным уравнением z = g(x, y), коэффициенты первой квадратичной формы имеют вид E(x, y) = 1 + gx2 (x, y), F (x, y) = gx (x, y)gy (x, y), G(x, y) = 1 + gy2 (x, y).
2.7. Угол между кривыми на поверхности. Покажем как найти угол между кривыми на поверхности, равный по определению углу между касательными прямыми этих кривых, с помощью первой квадратичной формы поверхности. Пусть C1 и C2 — две кривые на поверхности Φ, заданные своими локальными уравнениями u = ϕ1 (t),
v = ϕ2 (t),
u = ψ 1 (t),
v = ψ 2 (t),
в локальной карте f : V → R3 . Пусть кривые C1 и C2 проходят через одну и ту же точку P = f (u0 , v0 ). Если u0 = ϕ1 (t0 ) = ψ 1 (τ0 ), v0 = ϕ2 (t0 ) = ψ 2 (τ0 ), а θ — угол между касательными векторами этих кривых в точке P , то hϕ0 (t0 ), ψ 0 (τ0 )i , |ϕ0 (t0 )||ψ 0 (τ0 )| где как и раньше для касательных векторов имеем cos θ =
www.phys.nsu.ru ϕ0 = fu ϕ˙ 1 + fv ϕ˙ 2 , ψ 0 = fu ψ˙ 1 + fv ψ˙ 2 ,
Находим скалярное произведение hϕ0 , ψ 0 i = hfu ϕ˙ 1 + fv ϕ˙ 2 , fu ψ˙ 1 + fv ψ˙ 2 i = E ϕ˙ 1 ψ˙ 1 + F (ϕ˙ 1 ψ˙ 2 + ϕ˙ 2 ψ˙ 1 ) + Gϕ˙ 2 ψ˙ 2 . Длины векторов ϕ0 и ψ 0 находятся по формулам p p |ϕ0 | = E(ϕ˙ 1 )2 + 2F ϕ˙ 1 ϕ˙ 2 + G(ϕ˙ 2 )2 = I(ϕ˙ 1 , ϕ˙ 2 ), q q |ψ 0 | = E(ψ˙ 1 )2 + 2F ψ˙ 1 ψ˙ 2 + G(ψ˙ 2 )2 = I(ψ˙ 1 , ψ˙ 2 ), 2.8. Площадь поверхности. Пусть Φ — регулярная элементарная поверхность и f : U → Φ ее регулярная параметризация. Площадью Φ называется число ZZ p S= EG − F 2 dudv. U
Чтобы обосновать разумность такого определения, рассмотрим поверхность Φ, заданную параметризацией f : U → R3 , где U — прямоугольник в плоскости переменных (u, v). Разобьем U на маленькие прямоугольники прямыми, параллельными координатным осям, то есть рассмотрим прямоугольную сетку на U . Под действием f мы получим некоторые искривленную сетку на поверхности Φ, состоящую из четырехугольников. В каждом из них зафиксируем по точке и рассмотрим ортогональную проекцию
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
21
этого четырехугольника на касательную плоскость в фиксированной точке. Интуитивно ясно, что площадь этой проекции мало отличается от площади самого четырехугольника, а сумма площадей проекций приближает площадь всей поверхности Φ. Если наш четырехугольник достаточно мал, то площадь его проекции примерно равна площади параллелограмма с вершинами f (u, v), f (u+du, v), f (u, v + dv), f (u + du, v + dv), где du, dv — длина стороны соответствующего прямоугольника в плоскости (u, v). Тогда f (u + du, v) ≈ f (u, v) + fu (u, v),
f (u, v + dv) ≈ f (u, v) + fv (u, v),
f (u + du, v + dv) ≈ f (u, v) + fu (u, v) + fv (u, v). Площадь параллелограмма со сторонами fu (u, v) и fv (u, v) может быть вычислена через определитель Грама. Если a1 и a2 — два вектора в пространстве, то площадь параллелограмма с сторонами a1 и a2 равна S 2 = (|a1 ||a2 | sin θ)2 = |a1 |2 |a2 |2 (1 − cos2 θ) ha1 , a2 i2 = |a1 |2 |a2 |2 − |a1 |2 |a2 |2 = ha1 , a1 iha2 , a2 i − ha1 , a2 i2 |a1 |2 |a2 |2 ha1 , a1 i ha1 , a2 i = det . ha1 , a2 i ha2 , a2 i
www.phys.nsu.ru Последний определитель и есть определитель Грама системы векторов a1 , a2 . Таким образом, √ площадь проекции достаточно малого прямоугольника примерно равна S = EG − F 2 . Суммируя по всем четырехугольникам, заключаем, что искомая сумма площадей проекций стремится к указанному выше интегралу, т. е. площади поверхности Φ.
2.9. Кривизна кривой на поверхности. Вторая квадратичная форма поверхности. Пусть Φ — гладкая поверхность и пусть f (u, v) — ее локальная параметризация. Рассмотрим кривую C на поверхности Φ, заданную своими локальными уравнениями u = ϕ1 (t), v = ϕ2 (t). Этим локальным уравнениям соответствует параметризация ϕ(t)f (ϕ1 (t), ϕ2 (t). Пусть P = ϕ(t0 ) — точка на кривой C. Вы~ числим кривизну C в точке P . Обозначим через θ угол между нормалью N поверхности Φ в точке P и главной нормалью ~n кривой C в точке P . Рассмотрим естественную параметризацию ψ(s) кривой C. Пусть она соответствует локальным уравнениям u = ψ 1 (s), v = ψ 2 (s) и пусть P = ψ(x0 ). Кривизна k кривой C в точке P равна k = |ψ 00 (s0 )| =
~i hψ 00 (s0 ), N . cos θ
Далее ψ 0 (s) = fu (ψ 1 , ψ 2 )ψ˙ 1 + fv (ψ 1 , ψ 2 )ψ˙ 2 . Следовательно, ψ 00 (s) = fuu (ψ 1 , ψ 2 ) + 2fuv (ψ 1 , ψ 2 )ψ˙ 1 ψ˙ 2 + fvv (ψ 1 , ψ 2 )(ψ˙ 2 )2 +fu (ψ 1 , ψ 2 )ψ¨1 + fv (ψ 1 , ψ 2 )ψ¨2
www.phys.nsu.ru
www.phys.nsu.ru 22
Н. С. Даирбеков
~ последние два слагаемых исчезнут. Для коэфПри скалярном умножении на N фициентов в первой строке приняты специальные обозначения ~ (u, v)i, L(u, v) = hfuu (u, v), N ~ (u, v)i, M (u, v) = hfuv (u, v), N ~ (u, v)i, N (u, v) = hfvv (u, v), N или короче ~, L = fuu · N
~, M = fuv · N
~ (u, v). N (u, v) = fvv (u, v) · N
Пользуясь этими обозначениями, получаем k cos θ = ψ 00 · ~n = L(ψ 1 , ψ 2 )(ψ˙ 1 )2 + 2M (ψ 1 , ψ 2 )ψ˙ 1 ψ˙ 2 + N (ψ 1 , ψ 2 )(ψ˙ 2 )2 , причем значения функций ψ 1 , ψ 2 и их производных вычисляются в точке s0 . Запишем это коротко так: k cos θ = L(ψ˙ 1 )2 + 2M ψ˙ 1 ψ˙ 2 + N (ψ˙ 2 )2 . Для исходной (не обязательно натуральной) параметризации ϕ имеем ψ 0 (s) =
ϕ0 (t) . |ϕ0 (t)|
Значит
ϕ˙ 1 ϕ˙ 2 ψ˙ 1 = 0 , ψ˙ 1 = 0 . |ϕ | |ϕ | Подставляя в предыдущую формулу получим
www.phys.nsu.ru k cos θ =
L(ϕ˙ 1 )2 + 2M ϕ˙ 1 ϕ˙ 2 + N (ϕ˙ 2 )2 . E(ϕ˙ 1 )2 + 2F ϕ˙ 1 ϕ˙ 2 + G(ϕ˙ 2 )2
Определение. Квадратичная форма II(ξ) = L(ξ 1 )2 + 2M ξ 1 ξ 2 + N (ξ 2 )2 ,
ξ = (ξ 1 , ξ 2 ),
называется второй квадратичной формой поверхности. Функции L, M и N называются коэффициентами второй квадратичной формы поверхности. Полученную выше формулу для кривизны кривой на поверхности схематично можно записать так: II k= . I cos θ 2.10. Нормальная кривизна поверхности. Пусть ξ — касательный вектор поверхности Φ в точке P . Проведем касательную прямую l через точку P с направляющим вектором ξ и проведем плоскость через l и нормаль к поверхности в точке P . В достаточно малой окрестности точки P получится некоторая кривая C0 . Кривая C0 называется нормальным сечением поверхности Φ в направлении ~ поверхпрямой l (или вектора ξ). Заметим, что угол между вектором нормали N ности и главной нормалью нормального сечения равен 0 или π. Из предыдущей формулы имеем: кривизна нормального сечения в точке P равна II(ξ) , I(ξ) причем знак плюс берется, если нормали к поверхности и нормальному сечению совпадает, и берется знак минус, если они противоположны. k=±
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
23
Определение. Число
II(ξ) I(ξ) называют нормальной кривизной поверхности Φ в направлении вектора ξ (прямой l). kn =
Для произвольной кривой имеем следующую теорему. Теорема (теорема Менье). Кривизна произвольной кривой C на поверхности может быть вычислена по формуле kn k= . cos θ Это теорема представляет собой очевидное следствие формулы для кривизны кривой на поверхности и определения нормальной кривизны поверхности. 2.11. Соприкасающийся параболоид поверхности. Типы точек на поверхности. Пусть P — произвольная точка поверхности Φ. Рассмотрим ортогональную систему координат с началом в точке P и осью z, направленной вдоль нормали к поверхности Φ в точке P . Тогда некоторая достаточно малая окрестность точки P на поверхности Φ задается явным уравнением z = g(x, y), причем g(0, 0) = 0. Это уравнение определяет следующую параметризацию поверхности Φ: u ~r = f (u, v) = v z(u, v) или иначе x = u, y = v, z = g(u, v). Мы знаем, что векторы fu (0, 0) = (1, 0, gx (0, 0)) и fv (0, 0) = (0, 1, gy (0, 0)) порождают касательное пространство TP Φ. Но в выбранной системе координат TP Φ совпадает с плоскостью z = 0. Поэтому
www.phys.nsu.ru gx (0, 0) = gy (0, 0) = 0. Из формулы Тейлора следует, что 1 g(x, y) = (gxx (0, 0)x2 + 2gxy xy + gyy y 2 ) + o(x2 + y 2 ). 2 То есть, с точностью до бесконечно малых второго порядка наша поверхность Φ в окрестности точки P приближается поверхностью Φ второго порядка, заданной уравнением 1 z = g¯(x, y) = (gxx (0, 0)x2 + 2gxy xy + gyy y 2 ). 2 Поверхность Φ называется соприкасающимся параболоидом поверхности Φ в точке P . Фактически она может представлять собой эллиптический или параболический параболоид, параболический цилиндр или плоскость. Соприкасающийся параболоид обладает рядом замечательных свойств. Во первых, по определению он приближает исходную поверхность с точностью до бесконечно малых второго порядка. Во вторых, Φ является графиком второй квадратичной формы II поверхности Φ в точке P , если II рассматривать как
www.phys.nsu.ru
www.phys.nsu.ru 24
Н. С. Даирбеков
функцию на касательном пространстве TP Φ. Действительно, коэффициенты второй квадратичной формы II(ξ) = L(ξ 1 )2 + 2M ξ 1 ξ 2 + N (ξ 2 )2 вычисляются по параметризации следующим образом: L = fuu (0, 0) · ~n(0, 0) = gxx (0, 0), M = fuv (0, 0) · ~n(0, 0) = gxy (0, 0), N = fvv (0, 0) · ~n(0, 0) = gyy (0, 0).
Значит II = 12 g¯. В третьих, в точке P у поверхностей Φ и Φ нормальные кривизны в любом направлении одни и те же. Действительно, по определению II kn = . I Вычисляя первую квадратичную форму I(ξ) = E(ξ 1 )2 + 2F ξ 1 ξ 2 + G(ξ 2 )2 поверхности Φ в точке P относительно параметризации ~r = f (u, v), получим E = |fu (0, 0)|2 = |(1, 0, 0)| = 1,
G = |fv (0, 0)|2 = 1,
F = hfu , fv i = 0.
И точно так же для Φ. Таким образом, в точке P обе поверхности имеют одинаковые первые и вторые квадратичные формы и, следовательно, нормальные кривизны у них одинаковые. Точки поверхности классифицируются в соответствии с типом соприкасающегося параболоида.
www.phys.nsu.ru Определение. P называется точкой эллиптического типа, если Φ — эллиптический параболоид; гиперболического типа, если Φ — гиперболический параболоид; параболического типа, если Φ — цилиндр или плоскость.
2.12. Главные кривизны и формула Эйлера. Пусть Φ — соприкасающийся параболоид поверхности Φ в точке P . Из аналитической геометрии известно, что поворотом осей уравнение параболоида можно привести к виду 1 z = (k1 x2 + k2 y 2 ). 2 Всегда можем считать, что k1 ≤ k2 . Нормальную кривизну поверхности Φ в точке P в направлении вектора ξ можно вычислить по формуле kn =
II(ξ) k1 (ξ 1 )2 + k2 (ξ 2 )2 (ξ 1 )2 (ξ 2 )2 = = k1 1 2 + k2 1 2 . 1 2 2 2 2 2 I(ξ) (ξ ) + (ξ ) (ξ ) + (ξ ) (ξ ) + (ξ 2 )2
Обозначим через θ угол между осью x и вектором ξ. Тогда можем записать kn (θ) = k1 cos2 θ + k2 sin2 θ. Отсюда следует, что k1 ≤ kn ≤ k2 . Заметим, что если k1 < k2 , то равенство слева или справа возможно только, когда cos θ = 0 или 1, т. е., если направление вектора ξ параллельно одному из координатных. Если же k1 = k2 , то нормальная кривизна не зависит от направления kn ≡ k1 . Таким образом, мы доказали следующую теорему Эйлера.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
25
Теорема. В каждой точке гладкой поверхности существуют две перпендикулярные касательные прямые l1 и l2 в направлении которых нормальная кривизна принимает наибольшее и наименьшее значения k1 и k2 . Если l — произвольная кривая, образующая угол θ с прямой l1 , то нормальная кривизна в направлении l вычисляется по формуле Эйлера kn = k1 cos2 θ + k2 sin2 θ.
Определение. Наибольшую и наименьшую нормальные кривизны (k1 и k2 ) поверхности в точке P называют главными кривизнами в точке P , а направления, в которых достигаются главные кривизны, называют главными направлениями. Если главные кривизны различны (k1 6= k2 ), то главные направления определены однозначно и перпендикулярны друг другу. Если главные кривизны равны, то все направления являются главными. 2.13. Гауссова кривизна и средняя кривизна. Произведение главных кривизн K = k1 k2 называется гауссовой кривизной поверхности в точке P . Гауссова кривизна полностью определяет тип соприкасающегося параболоида и, следовательно, тип точки P . Если K > 0, то Φ — эллиптический параболоид и P — точка эллиптического типа. Если K < 0, то Φ — гиперболический параболоид и P — точка гиперболического типа. Если K = 0, то Φ — параболический цилиндр или плоскость и P — точка параболического типа. Полусумма главных кривизн
www.phys.nsu.ru H=
k1 + k2 2
называется средней кривизной поверхности в точке P . Гауссова и средняя кривизны в свою очередь полностью определяют главные кривизны поверхности: по теореме Виета k1 и k2 являются корнями уравнения x2 − 2Hx + K = 0. 2.14. Вычисление главных направлений и кривизн. Пусть Φ — гладкая поверхность, заданная уравнением ~r = f (u, v) в окрестности точки P = f (u0 , v0 ). В касательном пространстве TP Φ векторы e1 = fu (u0 , v0 ) и e2 = fv (u0 , v0 ) задают базис и каждый касательный вектор ξ ∈ TP Φ задается относительно него координатами ξ = (ξ 1 , ξ 2 ). Рассмотрим первую и вторую квадратичные формы I(ξ) = E(ξ 1 )2 + 2F ξ 2 ξ 2 + G(ξ 2 )2 , II(ξ) = L(ξ 1 )2 + 2M ξ 1 ξ 2 + N (ξ 2 )2 . Нормальная кривизна поверхности в направлении вектора ξ равна kn (ξ) =
II(ξ) . I(ξ)
www.phys.nsu.ru
www.phys.nsu.ru 26
Н. С. Даирбеков
Нахождение главных направлений и кривизн сводится к нахождению точек максимума и минимума функции kn (ξ 1 , ξ 2 ). В точках экстремума частные производные равны нулю: ∂kn ∂kn = 0, = 0. ∂ξ 1 ∂ξ 2 Значит ∂kn (2Lξ 1 + 2M ξ 2 )I(ξ) − II(ξ)(2Eξ 1 + 2F ξ 2 ) = = 0, 1 ∂ξ I(ξ)2 ∂kn (2M ξ 2 + 2N ξ 2 )I(ξ) − II(ξ)(2F ξ 1 + 2Gξ 2 ) = = 0, ∂ξ 2 I(ξ)2 Иначе говоря, (Lξ 1 + M ξ 2 ) − kn (ξ)(Eξ 1 + F ξ 2 ) = 0, (M ξ 1 + N ξ 2 ) − kn (ξ)(F ξ 1 + Gξ 2 ) = 0. Введем матрицы I=
E F
F , G
II =
L M
M N
.
Тогда вектор ξ главного направления кривизны удовлетворяет уравнению IIξ − λIξ = 0, где λ = kn (ξ) является главной кривизной. Отсюда также следует, что λ является корнем уравнения det(II − λI) = 0.
www.phys.nsu.ru Сформулируем полученный результат в виде теоремы.
Теорема. Пусть симметричные (2×2)-матрицы I и II являются матрицами первой и второй квадратичных форм поверхности в точке P . Тогда главные кривизны являются корнями уравнения P (λ) = det(II − λI) = 0, а главные направления удовлетворяют уравнениям IIξ − ki Iξ = 0. Отсюда, в частности, получаем формулу для гауссовой кривизны det II LN − M 2 = . det I EG − F 2 Действительно, k1 и k2 являются корнями квадратного уравнения K = k1 k2 =
0 = det(II − λI) = det I det(I −1 II − λE), где E — единичная матрица, т. е. они — собственные числа матрицы I −1 II. Но тогда их произведение равно определителю этой матрицы. Таким образом, det II . det I Аналогично можно вывести формулу для средней кривизны: K = k1 k2 = det(I −1 II) = det(I −1 ) det II =
2H = k1 + k2 =
EN − 2M F + LG . EG − F 2
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
27
2
−M Полученная нами формула K = LN EG−F 2 выражает кривизну через коэффициенты первой и второй квадратичных форм поверхности. Гаусс нашел формулу для кривизны только через коэффициенты первой квадратичной формы, более точно, через коэффициенты первой квадратичной формы поверхности и их частные производные первого и второго порядков. Эта формула Гаусса влечет замечательное утверждение — «theorema egregium» (славная, блистательная, замечательная) теорема Гаусса.
Теорема. Если одна гладкая поверхность получается из другой изгибанием (т. е. преобразованием, сохраняющим длины кривых), то гауссовы кривизны этих поверхностей в соответствующих точках совпадают. Другими словами, кривизна поверхности не меняется при изгибании. Дело в том, что если две поверхности получаются одна из другой изгибанием, то можно так выбрать их карты, что первые квадратичные формы будут одинаковы в соответствующих точках. Тогда из формулы Гаусса будет следовать, что кривизны совпадают. 2.15. Геодезические линии на поверхности. Геодезическая на поверхности Φ ⊂ R3 есть параметризованная кривая γ : I → Φ, вектор ускорения которой всюду ортогонален к Φ. Другими словами, γ¨ (t) ⊥ Tγ(t) Φ для всех t ∈ I. Представим себе, что наша кривая γ — это траектория движения материальной точки единичной массы m = 1. Тогда v = γ(t) ˙ — это скорость движения, a = γ¨ (t) — ускорение, а F = ma = γ¨ (t) — сила, действующая на точку. Тогда сила F перпендикулярна нашей поверхности и не имеет составляющей, которая была бы касательна к поверхности, т. е. сила служит только для того, чтобы точка оставалась на поверхности. Иными словами, геодезическая — это кривая на Φ, которая всюду на поверхности идет «наипрямейшим» образом. В частности, геодезическая является локально кратчайшей. Более точно, имеет место следующее свойство, которое мы оставим без доказательства: Экстремальное свойство геодезической: Дуга геодезической линии C между произвольными ее точками A и B будет кратчайшей среди всех кривых, лежащих на поверхности, с концами в этих точках, если точки A и B достаточно близки. Отметим, что свойство быть геодезической зависит от параметризации кривой, т. е. это свойство параметризованной кривой. В частности, имеет место следующее утверждение.
www.phys.nsu.ru
Лемма. Геодезические имеют постоянную скорость. Доказательство. Действительно, имеем γ(t) ˙ ∈ Tγ(t)Φ ,
γ¨ (t) ⊥ Tγ(t)Φ ,
t ∈ I.
Тогда d d 2 |γ(t)| ˙ = hγ(t), ˙ γ(t)i ˙ = 2hγ(t), ˙ γ¨ (t)i = 0. dt dt Заметим, что пропорциональная замена параметра t 7→ τ = kt на геодезической снова дает геодезическую, т. к. вектор ускорения относительно нового
www.phys.nsu.ru
www.phys.nsu.ru 28
Н. С. Даирбеков
параметра τ колинеарен вектору ускорения относительно параметра t, а значит по-прежнему ортогонален поверхности. Из леммы следует, что параметр на геодезической всегда пропорционален натуральному. Укажем также следующие простые свойства геодезической: 1) вектор главной нормали кривой совпадает в каждой точке с вектором нормали к поверхности (с точностью до знака), 2) соприкасающаяся плоскость кривой в каждой точке проходит через нормаль к поверхности, 3) в каждой своей точке кривая имеет наименьшую кривизну среди всех кривых, проходящих через эту точку в том же самом направлении (следует из теоремы Менье). Интуитивно ясно, что взяв точку на поверхности и указав в ней направление, мы можем двигаться в этом направлении на поверхности «наипрямейшим» образом, оставляя след в виде геодезической. Сформулируем соответствующую теорему.
Теорема. Через каждую точку в каждом направлении проходит единственная геодезическая. Поскольку любая дуга геодезической сама есть геодезическая, то единственность требует пояснений. Под единственностью мы имеем в виду тот факт, что любые две геодезические, проходящие через одну и ту же точку в одном направлении, являются дугами одной и той же большей геодезической. Приведу набросок доказательства теоремы. ~ — гладкое поле нормалей к поверхности Φ в окрестности точки P ∈ Пусть N Φ. Например, можно задать поверхность неявным уравнением g(x1 , x2 , x3 ) = 0. 1 2 3 ~ (x1 , x2 , x3 ) = grad g(x 1,x 2,x 3) . Заметим, что эта формула Тогда можно положить N | grad g(x ,x ,x )| ~) в определяет некоторое гладкое векторное поле (обозначаемое по-прежнему N некоторой окрестности нашей поверхности. По определению параметризованная кривая γ : I → Φ является геодезической тогда и только тогда, когда ее ускорение в каждой точке γ(t) перпендикулярно ~ (γ(t)). Иными словами, для всех t ∈ I поверхности, т. е. колинерно вектору N
www.phys.nsu.ru ~ (γ(t)), γ¨ (t) = µ(t)N ~ (γ(t)), получим Умножая обе части равенства на N ~ (γ(t)) ~ (γ(t)) dN dN ~ (γ(t))i = hγ(t), µ(t) = h¨ γ (t), N ˙ N (γ(t))i0 − hγ(t), ˙ i = −hγ(t), ˙ i, dt dt ~ (γ(t))i = 0. Подставляя найденное значение µ, выводим уравнетак как hγ(t), ˙ N ние ~ (γ(t)) dN ~ (γ(t)) = 0. iN (∗) γ¨ (t) + hγ(t), ˙ dt Запишем γ(t) = (x1 (t), x2 (t), x3 (t)). Тогда 3
~ (γ(t)) X ∂N dxj (t) dN = . dt ∂xj dt j=1
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
29
Таким образом, параметризованная кривая γ является геодезической тогда и только тогда, когда она удовлетворяет уравнениям (i = 1, 2, 3) j j k X d2 xi i 1 2 3 ∂N 1 2 3 dx dx N (x , x , x ) + (x , x , x ) = 0, (∗∗) dt2 ∂xk dt dt j,k=1
~ . Мы получили систему обыкновенных дифгде N j — компоненты вектора N ференциальных уравнений второго порядка относительно функций x1 (t), x2 (t), x3 (t). По теореме существования и единственности решений дифференциальных уравнений, для любых начальных данных x(t0 ) = x0 , x(t ˙ 0 ) = v существует решение этой системы уравнений, причем это решение единственно в том же самом смысле, что и в формулировке теоремы. Для завершения доказательства теоремы, остается показать, что решение γ(t) = (x1 (t), x2 (t), x3 (t)) является кривой на исходной поверхности Φ. Для этого снова воспользуемся неявным уравнением поверхности g(x) = 0. Заметим, что (∗∗) влечет выполнение (∗). Тогда ~ (γ(t)) dN d ~ (γ(t))i = h¨ ~ (γ(t))i + hγ(t), hγ(t), ˙ N γ (t), N ˙ i = 0. dt dt ~ (γ(t))i постоянно. Так как hγ(0), ~ (γ(0))i = 0, выводим, То есть значение hγ(t), ˙ N ˙ N что для всех t ~ (γ(t))i = 0. hγ(t), ˙ N Отсюда следует
www.phys.nsu.ru d ~ (γ(t), γ(t))i g(γ(t)) = hgrad g(γ(t)), γ(t)i ˙ = h| grad g(γ(t))|N ˙ = 0. dt Значит величина g(γ(t)) постоянна, а так как при t = t0 она обращается в нуль, то она равна нулю для всех t. Таким образом, g(γ(t)) = 0 для всех t и тем самым кривая γ лежит на поверхности g(x) = 0. Теорема доказана.
Замечание. Заметим, что для геодезической уравнения (∗) и (∗∗) верны для ~ , совпадающего на поверхности с полем едилюбого гладкого векторного поля N ничным нормалей поверхности. Этим фактом можно воспользоваться для упрощения расчетов при нахождении геодезических линий. В качестве примера проведем эскиз вычисления геодезических для сферы и цилиндра. Рассмотрим единичную сферу g(x, y, z) = x2 + y 2 + z 2 − 1 = 0. Вычисляем нормаль на сфере: N (x, y, z) =
grad g(x, y, z) (2x, 2y, 2z) = = (x, y, z), | grad g(x, y, z)| |(2x, 2y, 2z)|
так как на сфере |(x, y, z)| = 1. Здесь удобно продолжить это поле в окрестность сферы тривиальным образом до поля ~ (x, y, z) = (x, y, z). N Записывая уравнения (∗∗), находим y¨ + y(x˙ 2 + y˙ 2 + z˙ 2 ) = 0, y¨ + y(x˙ 2 + y˙ 2 + z˙ 2 ) = 0, z¨ + z(x˙ 2 + y˙ 2 + z˙ 2 ) = 0.
www.phys.nsu.ru
www.phys.nsu.ru 30
Н. С. Даирбеков
Мы знаем, что искомая геодезическая линия имеет постоянную скорость: x˙ 2 + y˙ 2 + z˙ 2 = const = v0 .
Тогда уравнения становятся совсем простыми x ¨ + v0 x = 0,
y¨ + v0 y = 0,
z¨ + v0 z = 0.
Или γ 00 = −v0 γ. Решить их уже достаточно легко, но можно уже заметить, что кручение нашей кривой равно нулю в каждой точке. Действительно, вспомним формулу для кручения кривой: (γ 0 , γ 00 , γ 000 ) . κ= |γ 0 × γ 00 |2 Так как γ 000 = −v0 γ 0 , находим (γ 0 , γ 00 , γ 0 ) κ = −v0 0 = 0. |γ × γ 00 |2 Нулевым кручением обладают только плоские кривые. Значит искомая кривая γ лежит в некоторой плоскости. Теперь вспомним, что для геодезической соприкасающаяся плоскость в каждой точке проходит через нормаль к поверхности в этой точке, и что для плоских кривых плоскость, где лежит кривая, и есть соприкасающаяся плоскость кривой. Заключаем, что наша геодезическая должна быть кривой в плоскости, проходящей через нормаль к сфере, т. е. это большая окружность. Для цилиндра. Зададим цилиндр уравнением x2 + y 2 = 1. Вычисляя нормаль, ~ = (x, y, 0). По этой формуле продолжим ее в окрестность цилиндра. найдем N После этого запишем уравнение (∗∗). Получим
www.phys.nsu.ru x ¨ + x(x˙ 2 + y˙ 2 ) = 0, y¨ + y(x˙ 2 + y˙ 2 ) = 0, z¨ = 0. Как и в предыдущем случае нетрудно заметить, что x˙ 2 + y˙ 2 ≡ const = v0 . Приходим к следующим уравнениям x ¨ = −v0 x,
y¨ = −v0 y,
z¨ = 0.
Дальнейшие рассуждения очевидны.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
3. ГЕОМЕТРИЯ
31
ЕВКЛИДОВЫХ ПРОСТРАНСТВ
3.1. Аксиомы евклидова пространств. Неравенство Коши — Буняковского и неравенство треугольника. Евклидовым пространством называется конечномерное вещественное векторное пространство L, снабженное симметричной положительно определенной билинейной формой, т. е. отображением (·, ·) : L×L → R со следующими свойствами: 1) билинейность (=линейность по каждому аргументу): (λx1 + µx2 , y) = λ(x1 , y) + µ(x2 , y), (x, λy1 + µy2 ) = λ(x, y1 ) + µ(x, y2 ), где λ, µ ∈ R, 2) симметричность: (x, y) = (y, x), 3) положительная определенность: (x, x) ≥ 0, и (x, x) = 0 тогда и только тогда, когда x = 0.
Самый известный пример — арифметическое евклидово пространство Rn . Комплексное евклидово пространство (унитарное пространство, эрмитово пространство) — это конечномерное комплексное векторное пространство L, снабженное эрмитовой положительно определенной полуторалинейной формой, т. е. отображением (·, ·) : L × L → C со следующими свойствами: 1) полуторалинейность (=линейность по первому аргументу, полулинейность (антилинейность) по второму аргументу):
www.phys.nsu.ru (λx1 + µx2 , y) = λ(x1 , y) + µ(x2 , y), (x, λy1 + µy2 ) = λ(x, y1 ) + µ(x, y2 ), где λ, µ ∈ C, а λ — комплексное сопряжение числа λ. 2) эрмитовость (эрмитова симметричность): (x, y) = (y, x), 3) положительная определенность: (x, x) ≥ 0, и (x, x) = 0 тогда и только тогда, когда x = 0. Основным примером является арифметическое комплексное евклидово пространство Cn , состоящее из упорядоченных наборов (z 1 , . . . , z n ) комплексных чисел. Если z = (z 1 , . . . , z n ) ∈ Cn и w = (w1 , . . . , wn ) ∈ Cn , то по определению Pn (z, w) = k=1 z k wk . p Определение. Евклидовой длиной вектора x ∈ L называется число |x| = (x, x). Фундаментальным свойством евклидовых пространств является выполнение неравенства Коши — Буняковского. Лемма. Для любых x, y ∈ L имеем |(x, y)| ≤ |x||y|. Равенство достигается только тогда, когда векторы x и y линейно зависимы.
www.phys.nsu.ru
www.phys.nsu.ru 32
Н. С. Даирбеков
Доказательство. Проведем доказательство в комплексном случае (оставив вещественный случай как упражнение). Если x = 0, то имеет место равенство и векторы линейно зависимы. Будем считать, что x 6= 0. Для любого вещественного t имеем |tx + y|2 = t2 |x|2 + 2t Re(x, y) + |y|2 ≥ 0. Отсюда выводим (Re(x, y))2 ≤ |x|2 |y|2 . (∗) iϕ −iϕ Запишем (x, y) = |(x, y)|e , ϕ ∈ R, и применим (∗) к элементам e x и y. Так как Re(e−iϕ x, y) = |(x, y)|, получаем |(x, y)|2 ≤ |e−iϕ x|2 |y|2 = |x|2 |y|2 .
Равенство возможно только тогда, когда |t0 e−iϕ x + y| = 0 для некоторого t0 ∈ R, что завершает доказательство. Следствие (неравенство треугольника). Для любых x, y, z ∈ L |x + y| ≤ |x| + |y|, |x − z| ≤ |x − y| + |y − z|. Доказательство. Снова рассмотрим комплексный случай (вещественный случай — упражнение). Имеем |x + y|2 = |x|2 + 2 Re(x, y) + |y|2 ≤ |x|2 + 2|x||y| + |y|2 ≤ (|x| + |y|)2 . Заменив x на x − y и y на y − z, получим второе неравенство.
www.phys.nsu.ru Следствие. Длина вектора |x| задает норму на L, а число |x − y| для x, y ∈ L задает метрику на L.
Доказательство. Остается только проверить свойство |λx| = |λ||x| для λ ∈ C в комплексном случае и λ ∈ R в вещественном. Ограничимся комплексным пространством: |λx| = (λx, λx)1/2 = (λλ(x, x))1/2 = |λ||x|.
3.2. Ортогональные векторы. Теорема Пифагора. Угол между векторами. Векторы x, y ∈ L называются ортогональными, если (x, y) = 0. Теорема (Пифагора). Если векторы x1 , . . . , xk попарно ортогональны, то k k X 2 X = x |xj |2 . j j=1
j=1
Доказательство. Упражнение (сначала доказать для двух векторов, затем рассуждать по индукции). Если L — (вещественное) евклидово пространство и x, y ∈ L, то по неравенству Коши — Буняковского (x, y) −1 ≤ ≤ 1. |x||y| Поэтому существует единственный угол ϕ, 0 ≤ ϕ ≤ π, для которого (x, y) cos ϕ = . |x||y|
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
33
Он называется углом между векторами x и y. Для комплексного векторного пространства определение угла иное. Мы имеем |(x, y)| 0≤ ≤ 1. |x||y| Поэтому существует единственный угол ϕ, 0 ≤ ϕ ≤ π/2, для которого |(x, y)| . |x||y| Таким образом, два вектора ортогональны тогда и только тогда, когда угол между ними равен π/2. cos ϕ =
3.3. Процесс ортогонализации. Ортонормированные базисы, их существование и свойства. Процесс ортогонализации часто встречается в геометрии и состоит в том, что из данных линейно независимых векторов x1 , . . . , xm строятся m попарно ортогональных векторов y1 , . . . , ym . Мы рассмотрим процесс ортогонализации Грама — Шмидта. Он заключается в следующем. Пусть даны m линейно независимых векторов x1 , . . . , xm . Положим y1 = x1 . Далее ищем вектор y2 , ортогональный y1 в виде y2 = x2 + αy1 . Из условия (y2 , y1 ) = 0 выводим (x2 + αy1 , y1 ) = 0. Значит (x2 , y1 ) . (y1 , y1 ) Дальнейшее построение индукционное. Предположим, что попарно ортогональные и отличные от нуля векторы y1 , y2 , . . . , yk−1 уже построены. Ищем вектор yk в виде yk = xk + λ1 y1 + · · · + λk−1 yk−1 . Находим коэффициенты λ1 , . . . , λk−1 из условий ортогональности (yk , y1 ) = 0, . . . , (yk , yk−1 ) = 0: α=−
www.phys.nsu.ru (xk + λ1 y1 + · · · + λk−1 yk−1 , y1 ) = 0, ... (xk + λ1 y1 + · · · + λk−1 yk−1 , yk−1 ) = 0. Так как векторы y1 , y2 , . . . , yk−1 попарно ортогональны, то эти равенства записываются в виде (xk , y1 ) + λ1 (y1 , y1 ) = 0, ... (xk , yk−1 ) + λk−1 (yk−1 , yk−1 ) = 0. Отсюда (xk , y1 ) (xk , yk−1 ) , . . . , λk−1 = − . (y1 , y1 ) (yk−1 , yk−1 ) Проверим, что так получившийся вектор yk ненулевой. Заметим, что yk есть линейная комбинация вектора xk и векторов y1 , . . . , yk−1 . Но вектор yk−1 можно заменить линейной комбинацией вектора xk−1 и y1 , . . . , yk−2 и т. д. Окончательно получаем, что вектор yk записывается в виде λ1 = −
yk = a1 x1 + a2 x2 + · · · + ak−1 xk−1 + xk для некоторых чисел a1 , . . . , ak−1 . Теперь ясно, что yk 6= 0. Действительно, в противном случае мы получим противоречие с линейной независимостью системы
www.phys.nsu.ru
www.phys.nsu.ru 34
Н. С. Даирбеков
векторов x1 , . . . , xk . Итак доказано, что xk 6= 0. Таким образом, индукционный шаг обоснован. В результате мы получаем m ненулевых попарно ортогональных векторов y1 , . . . , y m . Теперь докажем следующую теорему.
Теорема. В каждом n-мерном евклидовом пространстве существует базис, состоящий из n попарно ортогональных векторов (ортогональный базис). Любой набор ненулевых попарно ортогональных векторов можно дополнить до ортогонального базиса. Доказательство. Очевидно, что первое предложение является следствием второго. Надо стартовать с одного ненулевого вектора и по второму предложению дополнить его до ортогонального базиса. Однако мы докажем оба предложения независимо. Для этого вспомним, что аналогичные утверждения (без ортогональности) имеются в векторном пространстве. Тогда в каждом n-мерном евклидовом пространстве существует базис из n линейно независимых векторов x1 , . . . , xn . Применяя процесс ортогонализации, получаем n ненулевых попарно ортогональных векторов y1 , . . . , yn . Легко проверить, что любой набор ненулевых попарно ортогональных векторов линейно независим. Следовательно, y1 , . . . , yn и есть искомый базис. Чтобы доказать второе предложение, заметим сначала, что любой набор ненулевых попарно ортогональных векторов линейно независим (упражнение). Теперь применим известное утверждение о том, что любой набор линейно независимых векторов в векторном пространстве можно дополнить до базиса пространства. Применим процесс ортогонализации Грама — Шмидта к получившемуся базису. Замечая, что первоначальный набор ортогональных векторов при этом не меняется, закончим доказательство теоремы.
www.phys.nsu.ru Определение. Базис, состоящий из попарно ортогональных векторов называется ортогональным базисом. Базис, состоящий из попарно ортогональных векторов единичной длины называется ортонормированным базисом. Следствие. В каждом евклидовом пространстве существует ортонормированный базис. Доказательство. Действительно, по теореме в каждом евклидовом пространстве существует ортогональный базис y1 , . . . , yn . Нормируя векторы: y1 yn e1 = , . . . , en = , |y1 | |yn | получим ортонормированный базис e1 , . . . , en .
3.4. Матрица Грама. Пусть e1 , . . . , en — произвольный упорядоченный набор векторов евклидова пространства L. Определение. Матрица G = (gij ), gij = (ei , ej ), (e1 , e1 ) (e1 , e2 ) . . . (e2 , e1 ) (e2 , e2 ) . . . G= . .. .. .. . . (en , e1 ) (en , e2 ) . . .
i, j = 1, . . . , n, (e1 , en ) (e2 , en ) .. , . (en , en )
называется матрицей Грама системы векторов e1 , . . . , en .
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
35
Если e1 , . . . , en — базис L, то матрица Грама G базиса e1 , . . . , en называется также матрицей скалярного произведения в базисе e1 , . . . , en .
Из определений непосредственно выводим, что для (вещественного) евклидова пространства матрица Грама произвольного базиса P симметрична, т. е. Gt = n i j G или gji = gij , и положительно определена, т. е. i,j=1 gij x x > 0, если 1 n ~x = (x , . . . , x ) 6= 0. Для комплексного евклидова (унитарного) пространства, матрица Грама произвольного базиса эрмитова (эрмитово симметрична), т. е. Pn Gt = G или g ji = gij , и положительно определена т. е. i,j=1 gij z i z j > 0, если ~z = (z 1 , . . . , z n ) 6= 0. Доказательства этих свойств являются упражнениями. Задание {ei } и G полностью определяет скалярное произведение, ибо в вещественном случае X n n X X X i j (x, y) = x ei , y ej = xi y j (ei , ej ) = gij xi y j , i=1 i
j=1
i,j=1
i,j=1
j
где x , y — координаты векторов x и y в базисе e1 , . . . , en . В случае комплексного евклидова пространства имеем X n n X X (x, y) = xi ei , y j ej = xi y j (ei , ej ). i=1
j=1
i,j=1
Определение. Удобно ввести следующее соглашение — правило суммирование Эйнштейна. Если в выражении какой-либо индекс встречается дважды как верхний и нижний индексы, то по нему подразумевается суммирование от 1 до n (пределы суммирования определяются границами изменения индекса).
www.phys.nsu.ru С учетом этого соглашения имеем (x, y) = gij xi y j
(вещественный случай),
(x, y) = gij xi y j
(комплексный случай).
Выясним как меняется G при замене базиса. Пусть C — матрица перехода от базиса e1 , . . . , en к базису e01 , . . . , e0n : (e01 , e02 , . . . , e0n ) = (e1 , e2 , . . . , en )C, т. е. e0i = cji ej (помним соглашение о суммировании!). Следовательно, β 0 α β α β gij = (e0i , e0j ) = (cα i eα , cj eβ ) = ci cj (eα , eβ ) == ci cj gαβ ,
так что в евклидовом пространстве матрица Грама штрихованного базиса равна C t GC. В унитарном пространстве аналогично выводим, что матрица Грама штрихованного базиса равна C t GC. Лемма. Определитель матрицы Грама любой системы векторов l1 , . . . , ln в евклидовом пространстве равен квадрату n-мерного объема параллелепипеда P = {t1 l1 + · · · + tn ln : 0 ≤ ti ≤ 1}, натянутого на векторы l1 , . . . , ln . Приведем набросок доказательства этой леммы. Во первых, если набор векторов l1 , . . . , ln линейно зависим, то P лежит в некотором подпространстве, размерность которого строго меньше чем n, и потому его n-мерный объем равен нулю. С другой стороны, матрица Грама линейно зависимого набора векторов
www.phys.nsu.ru
www.phys.nsu.ru 36
Н. С. Даирбеков
вырожденная. Действительно, если l1 , . . . , ln — линейно зависимый набор векторов, то один из векторов является линейной комбинацией остальных, скажем, lk — линейная комбинация векторов l1 , . . . , lk−1 : ek = α1 l1 + . . . αk−1 lk−1 . Поставляя эту формулу вместо первого сомножителя lk в последней строке матрицы Грама, видим, что тогда последняя k-я строка матрицы Грама является линейной комбинацией остальных строк. Следовательно, в этом случае определитель матрицы Грама также равен нулю. Поэтому остается разобрать случай, когда l1 , . . . , ln — линейно независимая система векторов. Пусть e1 , . . . , en — ортонормированный базис в L, а f — линейное отображение L → L, переводящее ei в li , i = 1, 2, . . . , n. Если A — матрица этого отображения в базисе {ei }: (l1 , . . . , ln ) = (e1 , e2 , . . . , en )A,
то матрица Грама {li } равна At A, так как матрица Грама ортонормированного базиса очевидно единичная. Следовательно, det G = det(At A) = (det A)2 . С другой стороны, f является линейным отображением единичного куба на наш параллелепипед, а искажение объемов при линейном отображении равно модулю определителю этого отображения. Так как единичный куб имеет объем 1, параллелепипед P имеет объем, равный | det A|, и лемма доказана.
www.phys.nsu.ru 3.5. Изометрический изоморфизм евклидовых пространств одной размерности. Если L — (вещественное) евклидово пространство, а e1 , . . . , en — его базис, то как мы знаем (x, y) = ~xt G~y , где G — матрица скалярного произведения в базисе {ei } (матрица Грама {ei }), а ~x, ~y — это вектор-столбцы из координат векторов x и y относительно базиса e1 , . . . , en . Для комплексного евклидова пространства аналогичная формула имеет вид (x, y) = ~xt G~y . Наиболее простая формула получается в случае ортонормированного базиса, так как в этом случае матрица Грама единичная и мы имеем (x, y) = ~xt ~y
в вещественном пространстве,
(x, y) = ~xt ~y
в комплексном пространстве.
Так как x = xj ej , умножая обе части равенства на ek , получим xk = (x, ek ),
k = 1, . . . , n.
Итак, коэффициенты вектора в ортонормированном базисе суть скалярные произведения вектора на базисные векторы.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
37
Определение. Два евклидовых пространства L и L0 называются изоморфными, если существует линейное отображение f : L → L0 пространства L на L0 , сохраняющее скалярное произведение, т. е. (f x, f y) = (x, y) для любых x, y ∈ L. Здесь в левой стороне подразумевается скалярное произведение в L0 , а в правой — скалярное произведение в L. Отображение f называют изометрическим изоморфизмом L на L0 . Аналогичное понятие применяется к комплексным евклидовым пространствам. В этом случае f должно быть комплексно линейным. Теорема. Все евклидовы пространства данной размерности изоморфны между собой. Все комплексные евклидовы пространства данной размерности изоморфны между собой.
Доказательство. Достаточно доказать, что каждое евклидово пространство размерности n изоморфно Rn , а каждое комплексное евклидово пространство размерности n изоморфно Cn . Ограничимся комплексным случаем. Пусть L — n-мерное комплексное евклидово пространство. Зафиксируем произвольный ортонормированный базис e1 , . . . , en . Каждому вектору x ∈ L поставим в соответствие вектор f (x) = ~x ∈ Cn , составленный из координат вектора x в базисе {ei }. Проверка того, что f — изоморфизм комплексных евклидовых пространств L и Cn , является легким упражнением. 3.6. Подпространство и ортогональное дополнение к нему, ортогональное разложение. Пусть L0 ⊂ L — подпространство евклидова пространства L, т. е. для любых x, y ∈ L0 имеем x + y ∈ L0 и для любого скаляра λ также имеем λx ∈ L0 .
www.phys.nsu.ru Определение. Вектор x ортогонален подпространству L0 , если он ортогонален каждому вектору из L0 : (∀y ∈ L0 ) Ортогональное дополнение
L⊥ 0
(x, y) = 0.
состоит из всех векторов x, ортогональных L0 .
Теорема. 1. Для того чтобы вектор x был ортогонален n-мерному подпространству L0 необходимо и достаточно, чтобы он был ортогонален m линейно независимых векторов из L0 (базису в L0 ). 2. L⊥ 0 является подпространством L. 3. L = L0 ⊕ L⊥ 0. ⊥ 4. (L⊥ ) = L. 0 Доказательство. 1. Если e1 , . . . , em — базис в L0 , то каждый вектор y ∈ L0 является линейной комбинацией векторов e1 , . . . , em : y = y 1 e1 + · · · + y m em , где y j – скаляры. Если (x, ej ) = 0 для всех j, то (x, y) = y 1 (x, e1 ) + · · · + y m (x, em ) = 0. 2. Если x, y ∈ L⊥ 0 , то (∀z ∈ L0 )
(x, z) = (y, z) = 0.
Тогда (x + y, z) = (x, z) + (y, z) = 0,
z ∈ L0 ,
www.phys.nsu.ru
www.phys.nsu.ru 38
Н. С. Даирбеков
и для любого скаляра λ
(λx, z) = λ(x, z) = 0,
z ∈ L0 ,
⊥ т. е. x + y ∈ L⊥ 0 и λx ∈ L0 . 3. Зафиксируем ортогональный базис e1 , . . . , em в L0 и дополним его до ортогонального базиса e1 , . . . , em , em+1 , . . . , en в L. Так как каждый вектор ej , j ≥ m + 1, ортогонален всем векторам e1 , . . . , em , то по лемме ej ∈ L⊥ 0, j = m + 1, . . . , n. В частности, dim L⊥ ≥ n − m. 0 ⊥ ⊥ Заметим, что LP 0 ∩ L0 = {0}. В самом деле, если x ∈ L0 ∩ L0 , то из x ∈ L0 m j ⊥ следует, что x = j=1 x ej , а из x ∈ L0 следует, что x ортогонален всем ej . Тогда для k = 1, . . . , m
0 = (x, ek ) =
m X
xj (ek , ej ) = xk |ek |2 .
j=1
Следовательно, xk = 0, k = 1, . . . , m, и x = 0. Из L0 ∩ L⊥ 0 = {0} вытекает, что ⊥ dim(L0 ⊕ L⊥ 0 ) = dim L + dim L0 ≥ m + (n − m) = n. ⊥ ⊥ Так как L0 ⊕ L⊥ 0 ⊂ L, а dim L = n, выводим dim L0 = n − m и L0 ⊕ L0 = L. Так как n − m векторов em+1 , . . . , en линейно независимы, лежат в L⊥ и dim L⊥ 0 0 = n − m, то em+1 , . . . , en составляют базис L⊥ . 0 4. Аналогичные рассуждения показывают, что e1 , . . . , em составляют базис ⊥ ⊥ ⊥ (L⊥ 0 ) , т. е. (L0 ) = L0 .
www.phys.nsu.ru Таким образом, каждый вектор x ∈ L единственным образом разлагается в сумму x = x1 + x2 , x1 ∈ L1 , x2 ∈ L⊥ 0.
Вектор x1 называется ортогональной проекцией вектора x на подпространство L0 . По теореме Пифагора (∀y ∈ L0 ) |x − y|2 = |x1 + x2 − y|2 = |x1 − y|2 + |x2 |2 ≥ |x2 |2 , причем для y = x1 имеет место равенство. Иными словами, x1 — ближайший вектор в L0 до x. Если e1 , . . . , em — ортогональный базис в L0 , то x1 =
m X
λj ej ,
j=1
где λj =
(x,ej ) (ej ,ej ) ,
j = 1, . . . , m.
3.7. Определение сопряженного пространства. Базис сопряженного пространства. Пусть L — векторное пространство над F, где F = R или C — поле скаляров. Определение. Линейной формой (линейным функционалом) называется линейное отображение l : L → F, т. е. функция f : L → F со свойствами: l(x + y) = l(x) + l(y), l(λx) = λl(x),
x ∈ L,
x, y ∈ L, λ ∈ F.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
39
Сумма двух линейных функционалов l1 и l2 определяется следующим образом: (l1 + l2 )(x) = l1 (x) + l2 (x), произведение скаляра λ ∈ F на функционал l так: (λl)(x) = λl(x). Легко проверить, что l1 + l2 и λl — также линейные функционалы. Множество линейных функционалов с так определенным сложением и произведением на скаляры называется сопряженным пространством к L и обозначается через L∗ . Как и произвольное линейное отображение, линейный функционал полностью определяется своими значениями на базисе. Пусть e1 , . . . , en — базис L. Для k = 1, . . . , n положим ( 0, k 6= j k k f (ej ) = δj = 1, k = j, (δjk называются символами Кронекера) и продолжим f k на L по линейности. Pn Тогда значение функционала f k на произвольном векторе x = j=1 xj ej равно k-ой координате вектора x в базисе e1 , . . . , en : f k (x) = xk . Лемма. Функционалы f 1 , . . . , f n составляют базис сопряженного пространства L∗ .
www.phys.nsu.ru Доказательство. Упражнение.
Определение. Базис f 1 , . . . , f n называется биортогональным (взаимным, двойственным) к базису e1 , . . . , en . 3.8. Координаты ковектора. Преобразование координат ковектора при замене базиса исходного пространства. Если L — векторное пространство, то его элементы называются векторами, а элементы сопряженного пространства L∗ называются ковекторами. Если e1 , . . . , en — базис в L, а f 1 , . . . , f n — биортогональный базис в L∗ , то любой ковектор l ∈ L∗ имеет разложение l = lk f k
(помним соглашение о суммировании).
Числа l1 , . . . , ln называются координатами ковектора в базисе e1 , . . . , en . Для любого x ∈ L l(x) = li xi , где x1 , . . . , xn — координаты вектора x в базисе e1 , . . . , en , а l1 , . . . , ln — координаты ковектора l в базисе e1 , . . . , en . Рассмотрим как меняются координаты ковектора при замене базиса. Пусть e01 , . . . , e0n — другой базис в L и пусть C = (cij ) — матрица перехода от базиса {ei } к базису {e0i }, т. е. (e01 , . . . , e0n ) = (e1 , . . . , en )C, i
e0j = cij ei . i
Пусть f 0 — биортогональный базис к {e0i }. Обозначим через xi и x0 — координаты вектора x, а через li и li0 — координаты ковектора l в базисе {ei } и в базисе {ei }.
www.phys.nsu.ru
www.phys.nsu.ru 40
Н. С. Даирбеков
Напомню как меняются координаты вектора. Имеем j
j
j
x = x0 e0j = x0 cij ei = cij x0 ei .
Тогда
j
xi = cij x0 . Далее, j
j
l(x) = li xi = li cij x0 = cij li x0 . С другой стороны j
l(x) = lj0 x0 . Следовательно, lj0 = cij li . Таким образом, координаты ковектора при замене базиса преобразуются матрицей C перехода от старого базиса к новому. 3.9. Пространство, сопряженное с евклидовым пространством. Контравариантные и ковариантные компоненты вектора; связь между ними. Теперь предположим, что L — евклидово пространство. Лемма. Если L — евклидово пространство, то каждый линейный функционал на нем можно записать в виде l(x) = (x, y)
www.phys.nsu.ru для подходящего вектора y. Обратно, каждый вектор y определяет линейный функционал f (x) = (x, y).
Доказательство. Пусть e1 , . . . , en — ортонормированный базис в L. Тогда для произвольного вектора x ∈ L мы можем записать l(x) = li xi ,
где {li } — координаты ковектора l в базисе e1 , . . . , en , а {xi } — координаты вектора x в базисе e1 , . . . , en . Возьмем в качестве y вектор с координатами l1 , . . . , ln : n X y= li ei . i=1
Тогда f (x) = (x, y). Обратное утверждение леммы очевидно.
Таким образом, имеется взаимно однозначное соответствие L → L∗ : y ∈ L 7→ l = (·, y) ∈ L∗ . Заметим, что для вещественного евклидова пространства это отображение линейно: если x 7→ ξ, y 7→ η и λ ∈ R, то x + y 7→ ξ + η и λx 7→ λξ. Для комплексного евклидова пространства оно антилинейно: если x 7→ ξ, y 7→ η и λ ∈ C, то x + y 7→ ξ + η и λx 7→ λξ. Для простоты далее будем рассматривать только вещественное евклидово пространство. Таким образом, имеется естественное отождествление евклидова пространства L и его сопряженного L∗ . Каждый элемент евклидова пространства может таким образом рассматриваться как вектор и как ковектор. Тогда относительно произвольного базиса e1 , . . . , en он имеет как векторные координаты xi , так и ковекторные координаты xi , называемые векторными и ковекторными компонентами вектора x.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
41
Выясним как связаны векторные и ковекторные компоненты вектора x ∈ L. Для этого рассмотрим биортогональный базис f 1 , . . . , f n В силу отождествления элементы биортогонального базиса также могут рассматриваться как векторы. Выразим их через базис e1 , . . . , en . Сначала выразим e1 , . . . , en через f 1 , . . . , f n . Допустим ei = aik f k . Умножим обе части на eα : (ei , eα ) = aik (f k , eα ). Далее по определению k
k
(f , eα ) = f (eα ) =
δαk
( 1, = 0,
k=α k 6= α.
Кроме того, вспомним про матрицу Грама G = (gij ) базиса {ei }. Тогда получим giα = aik δαk = aiα . Таким образом, Пусть G−1
ei = gik f k . = (g ij ) — матрица обратная к матрице G: g iα gαk = δki .
Тогда окончательно получаем
www.phys.nsu.ru f i = g ik ek . Для произвольного вектора x получаем
x = xi f i = xi g ik ek = xk ek .
Следовательно (учитывая, что G — симметричная матрица), xk = g ki xi , xi = gik xk . 3.10. Связь между линейными операторами и билинейными формами. Пусть L — евклидово пространство. Каждое линейное отображение A : L → L определяет некоторую билинейную форму a(x, y) = (Ax, y), где с правой стороны стоит скалярное произведение векторов Ay и x. Говорим, что форма a порождена отображением A. Обратно, имеет место следующая лемма. Лемма. Если a : L × L → R — билинейная форма, то она порождена некоторым единственным линейным отображением A : L → L. Доказательство. Зафиксируем ортонормированный базис e1 , . . . , en . Пусть A = (aij ) — матрица формы a в базисе {ei }. Иными словами, a(x, y) = aij xi y j , где {xi } — координаты произвольного вектора x в базисе e1 , . . . , en . Определим линейное отображение A : L → L по формуле x0 = Ax,
j
x0 = aij xi ,
j = 1, . . . , n.
www.phys.nsu.ru
www.phys.nsu.ru 42
Н. С. Даирбеков
Тогда A — искомое отображение:
(Ax, y) = aij xi y j = a(x, y).
Проверим единственность. Если A и A0 — два отображения со свойствами a(x, y) = (Ax, y),
a(x, y) = (A0 x, y),
то для всех x, y 0 = (Ax − A0 x, y). В частности, для y = Ax − A0 x |Ax − A0 x|2 = (Ax − A0 x, Ax − A0 x) = 0. Тогда Ax = A0 x. Лемма доказана.
Таким образом, в евклидовом пространстве имеется естественное взаимно однозначное отображение между линейными отображениями и билинейными формами. Совершенно аналогично, в комплексном евклидовом пространстве имеется естественное взаимно однозначное отображение между линейными отображениями и полуторалинейными формами, то есть отображениями a : L × L → C, линейными по первому аргументу и полулинейными (антилинейными) по второму. Оно дается той же самой формулой: a(x, y) = (Ax, y). Доказательство такое же как и в вещественном случае.
www.phys.nsu.ru
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
4. ЛИНЕЙНЫЕ
43
ОПЕРАТОРЫ В ЕВКЛИДОВЫХ ПРОСТРАНСТВАХ
4.1. Сопряженный оператор, его матрица. Пусть L — евклидово пространство и f : L → L — линейное отображение (оператор). Линейное отображение f ∗ : L → L, удовлетворяющее равенству (f (x), y) = (x, f ∗ (y)),
называется сопряженным к f (сопряженный оператор). Теорема. В евклидовом пространстве для каждого оператора существует сопряженный оператор и притом только один. В ортонормированном базисе матрица A∗ сопряженного оператора f ∗ связана с матрицей A исходного оператора f формулой A∗ = At , a∗ ij = aji , т. е. посредством транспонирования и комплексного сопряжения. Для вещественного пространства матрица сопряженного оператора в ортонормированном базисе является транспонированной. Матрица At называется эрмитово сопряженной матрице A. Доказательство. Сначала докажем формулу. Это также докажет единственность сопряженного отображения, так как по матрице отображение восстанавливается однозначно. В ортонормированном базисе (x, y) = ~xt ~y ,
www.phys.nsu.ru где ~x, ~y — координаты векторов x, y ∈ L. Далее
(f (x), y) = (A~x)t ~y = ~xt At ~y ,
а (x, f ∗ (y)) = xt A∗ ~y = ~xt A∗ ~y , где A и A∗ — матрицы одноименных операторов в фиксированном базисе. Если (f (x), y) = (x, f ∗ (y)), то отсюда выводим At = A∗ , что эквивалентно доказываемой формуле. Докажем теперь существование. Это очень просто, Возьмем произвольный ортонормированный базис. Найдем матрицу A данного отображения в этом базисе, рассмотрим матрицу At и построим отображение f ∗ с этой матрицей. Оно — искомое. Замечание. В произвольном базисе матрица A∗ сопряженного оператора f ∗ связана с матрицей A исходного оператора f формулой A∗ = G−1 At G. Действительно, как и выше выводим: (f (x), y) = (A~x)t G~y = ~xt At G~y , (x, f ∗ (y)) = ~xt GA∗ ~y = ~xt GA∗ ~y , откуда At G = GA∗ , что эквивалентно указанной выше формуле.
www.phys.nsu.ru
www.phys.nsu.ru 44
Н. С. Даирбеков
4.2. Нормальный оператор, канонический вид его матрицы. Пусть L — евклидово пространство. Оператор (линейное отображение) f : L → L называется нормальным, если f f ∗ = f ∗ f . Иначе говоря, если операторы f и f ∗ перестановочны (коммутируют).
Теорема (о каноническом виде матрицы нормального оператора). Оператор f в комплексном евклидовом пространстве является нормальным тогда и только тогда, когда его матрица является диагональной в некотором ортонормированном базисе. Иначе говоря, матрица нормального оператора в ортонормированном базисе приводится к диагональной форме. Доказательство. Достаточность. Если в некотором ортонормированном базисе матрица оператора f диагональная, т. е. имеет вид λ1 0 . . . 0 0 λ2 . . . 0 .. .. .. , .. . . . . 0
0
...
λn
то матрица оператора f ∗ имеет вид λ1 0 0 λ2 .. .. . .
... ... .. .
0 0 .. .
...
λn
www.phys.nsu.ru 0
0
.
Матрицы операторов f и f ∗ — диагональные и, значит, перестановочны, но тогда и сами операторы перестановочны. Докажем необходимость. Выберем собственное значение λ оператора f и определим соответствующее собственное подпространство Lλ = {x ∈ L : f (x) = λx}. Проверим, что Lλ — f ∗ -инвариантно: f ∗ (Lλ ) ⊂ Lλ . Действительно, если x ∈ f (Lλ ), y = f ∗ (x), то ∗
f (y) = f (f ∗ (x)) = f ∗ (f (x)) = f ∗ (λx) = λf ∗ (x) = λy. поскольку f f ∗ = f ∗ f , т. е. y = f ∗ (x) ∈ Lλ . Отсюда вытекает, что пространство L⊥ λ f -инвариантно: если (x, x0 ) = 0 для всех x0 ∈ Lλ , то (f (x), x0 ) = (x, f ∗ (x0 )) = 0. ∗ ∗ Такое же рассуждение показывает, что L⊥ λ f -инвариантно. Ограничения f и f ⊥ на Lλ , очевидно, коммутируют. Применяя индукцию по размерности L, мы можем считать, что на L⊥ λ оператор f диагонализируется в ортогональном базисе. Так как то же верно для Lλ , это завершает доказательство.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
45
4.3. Унитарный оператор как оператор изометрический и как нормальный оператор с единичным спектром, канонический вид его матрицы. Оператор f в (комплексном) евклидовом пространстве L называется изометрическим, если ∀x, y ∈ L (f (x), f (y)) = (x, y).
Если L — вещественное евклидово пространство, то такой оператор f называют ортогональным. Если L — комплексное евклидово пространство, то такой оператор f называют унитарным. Лемма. Следующие условия равносильны: 1. Оператор f — изометрический. 2. (∀x ∈ L) |f (x)| = |x|. 3. Если A — матрица f в ортонормированном базисе, то At A = AAt = E At A = AAt = E
в вещественном случае,
(∗)
в комплексном случае,
(∗∗)
где E — единичная матрица. 4. f f ∗ = f ∗ f = id, где id — тождественное отображение. 5. f переводит ортонормированный базис в ортонормированный базис. Вещественная матрица, удовлетворяющая (∗), называется ортогональной. Комплексная матрица, удовлетворяющая (∗∗), называется унитарной. Из 4 также следует, что изометрический оператор — нормальный.
www.phys.nsu.ru Доказательство. 1 =⇒ 2:
|f (x)|2 = (f (x), f (x)) = (x, x) = |x|2 .
2 =⇒ 1: Для евклидова пространства 1 (x, y) = (|x + y|2 − |x|2 − |y|2 ), 4 что проверяется прямой проверкой. Отсюда следует, что сохранение длин ведет к сохранению скалярных произведений. Для комплексного евклидова пространства аналогично имеем 1 Re(x, y) = (|x + y|2 − |x|2 − |y|2 ), 4 (x, y) = Re(x, y) − i Re(ix, y). Значит сохранение длин снова ведет к сохранению скалярных произведений. 1 =⇒ 3. В ортонормированном базисе комплексного евклидового пространства имеем (x, y) = ~xt ~y . Так как f (x) = A~x, (f (x), f (y)) = (A~x)t A~y = ~xt (At A)~y . Тогда из (f (x), f (y)) = (x, y) выводим At A = E. Отсюда A−1 = At и, следовательно, AAt = AA−1 = E. В вещественном случае доказательство аналогично. 3 =⇒ 1: Обратить предыдущие рассуждения.
www.phys.nsu.ru
www.phys.nsu.ru 46
Н. С. Даирбеков
4 ⇐⇒ 3: Следует из связи между операторами и их матрицами. Также легко непосредственно доказать 1 ⇐⇒ 4 (упражнение). 1 =⇒ 4: Если e1 , . . . , en — ортонормированный базис и e0i = f (ei ), i = 1, . . . , n, то ( 1, i = j, 0 0 (ei , ej ) = (ei , ej ) = 0, i 6= j. 4 =⇒ 1: Если e1 , . . . , en — ортонормированный базис и e0i = f (ei ) — так же ортонормированный базис, то (f (x), f (y)) = (xi f (ei ), y j f (ej )) = xi y j (e0i , e0j ) =
n X
xi y i = (x, y).
j=1
Лемма. Собственные числа изометрического оператора по модулю равны единице. Собственные векторы, отвечающие разным собственным числам, ортогональны. Доказательство. Ограничимся случаем комплексного евклидова пространства. Если f (x) = λx, x 6= 0, то (x, x) = (f (x), f (x)) = λλ(x, x),
www.phys.nsu.ru т. е |λ|2 = λλ = 1. Если f (x) = λx, f (y) = µy, λ 6= µ, x 6= 0, y 6= 0, то
(x, y) = (f (x), f (y)) = λµ(x, y).
Так как |λ| = |µ| = 1, а λ 6= µ, то λµ 6= 1. Поэтому (x, y) = 0.
Теорема (о каноническом виде матрицы унитарного оператора). Для оператора f в унитарном пространстве следующие условия эквивалентны: 1. f — изометрия. 2. f — нормальный оператор и его спектр лежит на единичной окружности в C. 3. В подходящем ортонормированном базисе матрица f имеет вид λ1 0 . . . 0 0 λ2 . . . 0 (∗) .. .. .. , .. . . . . 0
0
...
λn
где |λ1 | = |λ2 | = · · · = |λn | = 1. Доказательство. 1 =⇒ 2: Следует из предыдущих лемм. 2 =⇒ 3: В подходящем ортонормированном базисе матрица каждого нормального оператора имеет диагональный вид (∗). Так как спектр лежит на единичной окружности, все λi по модулю равны единице. 3 =⇒ 1: Очевидно следует из формулы для скалярного произведения в ортонормированном базисе.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
47
4.4. Канонический вид матрицы ортогонального оператора. Теорема Эйлера. Канонический вид матрицы ортогонального оператора более сложный. Если dim L = 1, то f (x) = λx, где λ = ±1. Разберем случай dim L = 2. Пусть e1 , e2 — ортонормированный базис в L. Пусть a b A= c d — матрица ортогонального оператора f в этом базисе. Так как собственные числа по модулю равны единице, det A = ad − bc = ±1. Сначала разберем случай собственного ортогонального оператора: det A = 1, т. е. ad − bc = 1. Найдем обратную матрицу 1 d −b A−1 = . det A −d a
Учитывая, что det A = 1, получим −1
A
=
d −d
−b . a
С другой стороны, условие ортогональности At A = E означает, что a c A−1 = At = , b d
www.phys.nsu.ru Следовательно,
d −d
−b a
=
a c . b d
Отсюда
A=
a −c , c a
где a2 + c2 = 1. Полагая a = cos ϕ, c = sin ϕ, заключаем, что каждый собственный ортогональный оператор имеет в произвольном ортонормированном базисе матрицу вида cos ϕ − sin ϕ . sin ϕ cos ϕ Это — матрица поворота в плоскости на угол ϕ. Пусть теперь f — несобственный ортогональный оператор, т. е. det A = ad − bc = −1. В этом случае характеристическое уравнение имеет вид λ2 − a + d − 1 и, следовательно, имеет вещественные корни λ1 и λ2 . Так как по модулю они равны единице, имеем λ1 = ±1, λ2 = ±1. Так как их произведение равно −1, одно число равно 1, а второе −1. По лемме отвечающие им собственные векторы e1 и e2 ортогональны. Также можно считать, что e1 и e2 — единичные векторы. Итак, в ортонормированном базисе e1 , e2 матрица оператора f имеет вид 1 0 . 0 −1 Это — матрица зеркального отражения плоскости относительно одной из осей. Теорема (о каноническом виде матрицы ортогонального оператора). Для оператора f в евклидовом пространстве следующие условия эквивалентны: 1. f — изометрия.
www.phys.nsu.ru
www.phys.nsu.ru 48
Н. С. Даирбеков
2. В подходящем ортонормированном базисе матрица оператора f имеет вид A(ϕ1 ) .. . A(ϕm ) 1 .. , . 1 −1 .. .
O
O
−1 где A(ϕ) =
cos ϕ sin ϕ
− sin ϕ . cos ϕ
Доказательство. 2 =⇒ 1: упражнение. 1 =⇒ 2: Случаи dim L = 1 и dim L = 2 разобраны выше. Лемма. У каждого линейного оператора f в вещественном векторном пространстве L существует одномерное или двумерное инвариантное подпространство.
www.phys.nsu.ru Доказательство. Фиксируя произвольный ортонормированный базис, можем считать, что f — оператор в Rn с ортогональной матрицей A. Далее, если у оператора f есть вещественное собственное число λ0 ∈ R, и x0 — собственный вектор, отвечающий этому числу, то x0 порождает одномерное инвариантное собственное подпространство. В этом случае лемма доказана. Если вещественных собственных чисел нет, то существует комплексное собственное число λ0 = α + iβ. Ему отвечает собственный вектор ~v = (x1 + iy 1 , . . . , xn + iy n ),
xj , y j ∈ R,
j = 1, . . . , n.
Подставляя в равенство A~v = λ0~v ,
ajk v k = λ0 v j ,
координаты вектора ~v : ajk (xk + iy k ) = (α + iβ)(xj + iy j ), и отделяя вещественную часть от мнимой, имеем ajk xk = αxj − βy j , ajk y k = αy j + βxj . В векторной записи: A~x = α~x − β~y ,
A~y = α~y + β~x.
Эти равенства означают, что двумерное подпространство, порожденное векторами x и y инвариантно относительно f . Лемма доказана.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
49
Продолжим доказательство теоремы. Если dim L ≥ 3 и f имеет вещественное собственное число λ (заметим, что обязательно λ = ±1), то как и в доказательстве теоремы о каноническом виде нормального оператора положим L = Lλ ⊕ L⊥ λ и будем рассуждать как в указанном доказательстве. Наконец, если f не имеет вещественных собственных чисел, то следует выбрать двумерное f -инвариантное подпространство L0 ⊂ L, которое существует по доказанной выше лемме. На нем, как мы видели выше, матрица ограничения f в любом ортонормированном базисе будет иметь вид A(ϕ). Поэтому остается проверить, что L⊥ 0 также f -инвариантно. Действительно, если (x0 , x) = 0 для всех x0 ∈ L0 , то (x0 , f (x)) = (f (f −1 (x)), f (x)) = (f −1 (x0 ), x) = 0,
ибо f −1 (x0 ) ⊂ L0 для всех x0 ∈ L0 . Это завершает доказательство.
Следствие (теорема Эйлера). В трехмерном евклидовом пространстве любое ортогональное отображение f , не меняющее ориентацию, является вращением относительно некоторой оси. Доказательство. Так как характеристический многочлен f имеет степень 3, у него обязательно есть вещественный корень. Если он единственный, то он должен быть равен 1, ибо det f = 1. Если есть еще вещественный корень, то все корни должны быть вещественны и возможны комбинации (1, 1, 1) или (1, −1, −1). В любом случае собственное значение 1 имеется. Соответствующее собственное подпространство является осью вращения, а сужение f на ортогональную к нему плоскость является собственным ортогональным преобразованием плоскости, т. е., как мы видели выше, вращением в этой плоскости на некоторый угол ϕ.
www.phys.nsu.ru 4.5. Самосопряженный оператор, вещественность его спектра, канонический диагональный вид матрицы. Оператор f : L → L называется самосопряженным (или эрмитовым), если f ∗ = f . Другими словами, если для всех x, y ∈ L (f (x), y) = (x, f (y)). Теорема. 1. Оператор f самосопряжен тогда и только тогда, когда в произвольном ортонормированном базисе его матрица A эрмитова (эрмитово t симметрична), A = A, в случае комплексного евклидова пространства, и t симметрична, A = A, в случае вещественного евклидова пространства. 2. Спектр самосопряженного оператора вещественен, а собственные векторы, отвечающие разным собственным числам ортогональны. 3. В подходящем ортонормированном базисе матрица самосопряженного оператора имеет диагональный вид с вещественными числами по диагонали. Доказательство. 1. Это очевидно из связи между матрицей сопряженного оператора и матрицей исходного оператора в ортонормированном базисе. 2. Если f (x) = λx, то λ(x, x) = (f (x), x) = (x, f (x)) = λ(x, x). Если f (x) = λx, f (y) = µy, λ 6= µ, то λ, µ ∈ R и λ(x, y) = (f (x), y) = (x, f (y)) = µ(x, y), что влечет (x, y) = 0.
www.phys.nsu.ru
www.phys.nsu.ru 50
Н. С. Даирбеков
3. Для унитарного пространства утверждение прямо следует из того, что эрмитов оператор нормален, и факта, что в унитарном пространстве матрица нормального оператора имеет диагональный вид в подходящем ортонормированном базисе. Диагональные элементы это конечно собственные значения оператора, а по предыдущему мы знаем, что они вещественные. В евклидовом пространстве вопрос проще всего ввести произвольный ортонормированный базис и рассмотреть матрицу данного самосопряженного оператора в этом базисе. Она — симметричная. Поэтому существует ортонормированный базис в Rn в котором эта матрица имеет требуемый вид. Последний порождает искомый базис в L.
4.6. Проекторы. Ортогональное разложение пространства и разложение тождественного оператора в сумму попарно ортогональных самосопряженных проекторов. Если векторное пространство L — прямая сумма своих подпространств M и N : L = M ⊕ N, так что каждый вектор z ∈ L единственным образом записывается в виде z = x + y, x ∈ M , y ∈ N , то проектором на M параллельно N называется оператор P , определенный равенством Ez = x. В случае N = M ⊥ , то есть L = M ⊕ M ⊥ оператор P называется ортогональным проектором (ортопроектором) на M . Обозначается через PM . Лемма. Пусть PM и PN — два ортопроектора. Следующие условия эквивалентны: 1. Подпространства M и N ортогональны друг другу:
www.phys.nsu.ru (x, y) = 0
для всех x ∈ M и y ∈ N .
2. PM PN = 0 (переходя к сопряженным операторам видим, что это равносильно PN PM = 0). Доказательство. 1 =⇒ 2. Если M и N ортогональны друг другу, то N ⊂ M ⊥ и PM (y) = 0 для всех y ∈ N . Для произвольного x ∈ L, имеем y = PN x ∈ N . Значит PM (PN x) = 0. 2 =⇒ 1. Для x ∈ M имеем PM x = x. Аналогично для y ∈ N имеем PM y = y. ∗ Если PM PN = 0, то, учитывая PM = PM , имеем ∗ (x, y) = (PM x, PN y) = (x, PM PN y) = (x, PM PN y) = 0.
Определение. Два ортопроектора P1 и P2 называются ортогональными, если P1 P2 = 0. Ввиду леммы ортогональные ортопроекторы — это проекторы на ортогональные подпространства, и данное определение вполне естественно. Теорема. Пусть L1 , L2 , . . . , Lk — подпространства евклидова пространства L и P1 = PL1 , . . . , Pk = PLk — ортопроекторы на эти подпространства. Тогда следующие условия эквивалентны: 1. L = L1 ⊕ L2 ⊕ · · · ⊕ Lk и L1 , L2 , . . . , Lk — попарно ортогональные подпространства. 2. id = P1 + P2 + · · · + Pk и P1 , P2 , . . . , Pk — попарно ортогональные ортопроекторы.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
51
Доказательство. 1 =⇒ 2. Попарная ортогональность проекторов вытекает из леммы. Проверим требуемое равенство. Для x ∈ L x = x1 + x2 + · · · + xk , где xj ∈ Lj . Далее, Pj xj = xj . Следовательно, id(x) = x = P1 x + · · · + Pk x. 2 =⇒ 1. Обратить рассуждения.
4.7. Спектральное разложение самосопряженного оператора. Положительный самосопряженный оператор и корень из него. Полярное разложение оператора. Пусть L — (комплексное) евклидово пространство. Теорема. Если f — самосопряженный оператор в L, то существуют вещественные числа λ1 , . . . , λk и попарно ортогональные ортопроекторы P1 , . . . , Pk такие, что f = λ1 P1 + · · · + λk Pk . (∗) Доказательство. В подходящем ортонормированном базисе e1 , . . . , en матрица эрмитова оператора A имеет имеет диагональный вид с вещественными числами λ1 , . . . , λn по диагонали. Иными словами, f (ej ) = λj ej , j = 1, . . . , n. Положим Lj = Lin(ej ) и Pj = PLj . Тогда выполняется (∗).
www.phys.nsu.ru Определение. Разложение оператора (∗) называют спектральным разложением самосопряженного оператора. Определение. Оператор f называется положительным (неотрицательно полуопределенным), если (f (x), x) ≥ 0 для всех x ∈ L; пишем f ≥ 0. Если (f (x), x) > 0 для всех x 6= 0, то f называется строго положительным (положительно определенным) оператором; пишем f > 0. Определение. Пусть f — положительный самосопряженный оператор. Тогда в его спектральном разложении X f= λj Pj j
все λj ≥ 0. Положим √
X√ p f= λj Pj . j
√ √ Очевидно, что f ≥ 0 и ( f )2 = f . Оператор f называется положительным квадратным корнем из f . Теорема (полярное разложение). Для произвольного оператора f в L существуют положительный оператор P и изометрия U такие, что f = U P . Доказательство. Приведем доказательство только в том случае, когда f — обратимый оператор. Так как оператор f√∗ f положительный, можно найти его положительный квадратный корень P = f ∗ f . Положим V = P f −1 . Достаточно показать, что V — изометрия, так как тогда можно будет взять U = V −1 . Но так как V ∗ = (f −1 )∗ P ∗ = (f ∗ )−1 P,
www.phys.nsu.ru
www.phys.nsu.ru 52
Н. С. Даирбеков
мы видим, что
V ∗ V = (f ∗ )−1 P P f −1 = (f ∗ )−1 f ∗ f f −1 = id,
так что V — изометрия, и в этом случае все доказано.
Определение. Представление f = U P называется полярным разложением оператора f . Замечание. Применяя только что доказанную теорему к f ∗ вместо f и переходя к сопряженным, получаем также, что каждый оператор f может быть записан в виде f = P U с изометрическим U и положительным P . 4.8. Существование общего диагонализирующего базиса у семейства коммутирующих самосопряженных операторов. Определение. Два оператора f и g называются перестановочными (коммутируют), если f g = gf . Лемма. Для коммутирующих самосопряженных операторов f и g в (комплексном) евклидовом пространстве всегда существует общий собственный вектор. Доказательство. Обозначим через L1 множество всех собственных векторов f , отвечающих какому-нибудь собственному значению λ. Тогда L1 инвариантно относительно g. Действительно, нам надо показать, что если x ∈ L1 , то есть f (x) = λx, то и g(x) ∈ L1 , то есть f (g(x)) = λg(x). Проверка тривиальна:
www.phys.nsu.ru (f (g(x)) = (g(f (x)) = f (λx) = λg(x).
Итак сужение f˜ оператора g на L1 являются оператором в L1 и он очевидно самосопряженный. Тогда g˜ имеет собственный вектор x ∈ L1 . Очевидно, что x — искомый вектор. Теорема. Если f и g — самосопряженные операторы в (комплексном) евклидовом пространстве, то следующие условия равносильны: 1. Существует ортонормированный базис в котором матрицы операторов одновременно имеют диагональный вид. 2. Операторы f и g перестановочны.
Доказательство. 1 =⇒ 2. Очевидно, что диагональные матрицы перестановочны. Тогда и сами операторы перестановочны. 2 =⇒ 1. Докажем индукцией по размерности пространства L. База индукции очевидна. Сделает индукционный шаг. Предполагая, что утверждение верно для операторов в пространствах размерности, меньшей n, докажем его для операторов в пространствах размерности n. Пусть операторы f и g в пространстве L размерности n перестановочны. Согласно лемме существует одномерное подпространство L0 , инвариантное относительно каждого оператора (оно натянуто на общий собственный вектор): f (L0 ) ⊂ L0 ,
g(L0 ) ⊂ L0 .
L⊥ 0
Тогда подпространство также инвариантно относительно f и g. Действительно, если x ∈ L⊥ 0 , то есть (x, x0 ) = 0 для всех x0 ∈ L0 , то (f (x), x0 ) = (x, f (x0 )) = 0,
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
53
то есть f (x) ∈ L⊥ 0 . Аналогично для g. Тогда сужения операторов f и g на L⊥ 0 — самосопряженные перестановочные операторы в L⊥ . Так как размерность L⊥ 0 0 меньше n, по индукционному предположению существует ортонормированный базис в L⊥ 0 , в котором матрицы операторов одновременно имеют диагональные вид. Дополняя этот базис единичным вектором из L0 , получим искомый базис в L.
Утверждение теоремы верно для любого семейства попарно перестановочных операторов, доказательство аналогичное и опирается на аналог леммы в случае произвольного семейства попарно перестановочных операторов. 4.9. Приведение квадратичных и эрмитовых форм к главным осям. Приведение пары форм к диагональному виду. Определение. Квадратичная форма Q на вещественном векторном пространстве L — это отображение из L в R, определенное по формуле Q(x) = a(x, x),
x ∈ L,
где a — симметричная билинейная форма на L. Как мы знаем, в евклидовом пространстве существует взаимно-однозначное соответствие между линейными операторами f и билинейными формами a:
www.phys.nsu.ru a(x, y) = (f (x), y).
При этом симметричным билинейным формам будут соответствовать самосопряженные операторы. Таким образом, в евклидовом пространстве каждая квадратичная форма порождена некоторым самосопряженным оператором: Q(x) = (f (x), x). Аналогичная картина наблюдается в комплексном пространстве.
Определение. Эрмитовой формой в комплексном векторном пространстве L называется полуторалинейное отображение a(·, ·) : L × L → C (т. е. отображение линейное по первому аргументу и полулинейное по второму) которое эрмитово симметрично: a(x, y) = a(y, x). Эрмитовой квадратичной формой называется отображение Q(x) = a(x, x), где a — эрмитова форма. Заметим, что значения — вещественные числа. Эрмитова форма a(x, y) называется полярной к квадратичной форме Q. Как и в вещественном евклидовом пространстве, в комплексном евклидовом пространстве имеется взаимно-однозначное соответствие между эрмитовыми операторами и эрмитовыми формами, оно выражается той же самой формулой, а также между эрмитовыми операторами и эрмитовыми квадратичными формами. Последнее задается прежним правилом Q(x) = (f (x), x).
www.phys.nsu.ru
www.phys.nsu.ru 54
Н. С. Даирбеков
Теорема (о приведении формы к главным осям). В подходящем ортонормированном базисе каждая эрмитова форма в унитарном пространстве имеет вид a(x, y) = λ1 x1 y 1 + · · · + λn xn y n ,
(∗)
а эрмитова квадратичная форма — вид Q(x) = λ1 |x1 |2 + · · · + λn |xn |2 ,
(∗∗)
где λ1 , . . . , λn ∈ R, а xi — координаты вектора x. Доказательство. Каждая эрмитова форма a(x, y) получается с помощью некоторой эрмитовой оператора f по правилу a(x, y) = (f (x), y). По теореме о каноническом виде матрицы самосопряженного оператора, в подходящем ортонормированном базисе матрица эрмитова оператора f имеет диагональный вид λ1 .. , . λn где по диагонали стоят вещественные числа, а вне диагонали нули. Отсюда вытекает (∗). Формула (∗∗) — прямое следствие.
www.phys.nsu.ru Аналогичная теорема имеет место в евклидовом пространстве и доказательство переносится дословно. Нахождение в (комплексном) евклидовом пространстве ортонормированного базиса, в котором данная (эрмитова) квадратичная форма приводится к указанному виду, называется приведением этой формы к главным осям.
Теорема. Пусть Q1 (x) и Q2 (x) — две (эрмитовы) квадратичные формы в (комплексном) векторном пространстве L, причем форма Q1 положительно определена, т. е. Q( x) > 0 для x 6= 0. Тогда существует базис, в котором обе эти формы одновременно приводятся к диагональному виду. Доказательство. Введем в L скалярное произведение, положив (x, y) = a(x, y), где a(x, y) — эрмитова форма, соответствующая Q1 . Пространство L станет таким образом (комплексным) евклидовым. По доказанной выше теореме о приведении формы к главным осям в L существует ортонормированный базис в котором Q2 (x) приводится к диагональному виду: Q2 (x) = λ1 |x1 |2 + · · · + λn |xn |2 . В ортонормированном базисе скалярное произведение имеет вид (x, y) = x1 y 1 + · · · + xn y n , то есть Q1 (x) = (x, x) = |x1 |2 + · · · + |xn |2 . Теорема доказана.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
55
4.10. Связь между эрмитовыми и унитарными операторами, преобразование Кэли. Обозначим через E — тождественный оператор в унитарном пространстве L.
Теорема. 1. Если f — эрмитов оператор в унитарном пространстве, то оператор g = (f + iE)(f − iE)−1 (∗) — унитарный, причем его спектр не содержит единицы и f = i(g + E)(g − E)−1 .
(∗∗)
2. Наоборот, если g — унитарный оператор, спектр которого не содержит единицы, то оператор f , определенный формулой (∗∗), является самосопряженным и g выражается через f формулой (∗). Каждый из операторов f и g называется преобразованием Кэли другого. Доказательство. 1. В некотором ортонормированном базисе матрица A оператора f — диагональная: λ1 .. A= . λn причем диагональные элементы — вещественные числа: λj ∈ R. Тогда матрица B оператора g, определенного по формуле (∗), выглядит так: λ1 +i
www.phys.nsu.ru λ1 −i
B=
..
.
λn +i . λn −i
Легко проверить, что диагональные элементы матрицы B по модулю равны единице. Следовательно, g — унитарный оператор. Проверка всех других утверждений теоремы аналогична и является упражнением. 4.11. Экстремальные свойства собственных значений самосопряженных операторов (теорема Куранта — Фишера). Пусть L — евклидово или унитарное пространство и f — самосопряженный оператор. Расположим собственные значения f в порядке убывания с учетом кратностей: λ1 ≥ λ2 ≥ · · · ≥ λn и выберем соответствующий ортонормированный базис {e1 , e2 , . . . , en }, состоящий из собственных векторов. С оператором f связана квадратичная форма Q(x) = (f (x), x). В базисе {ej } она приобретает вид Q(x) =
n X
λi |xi |2 ,
i=1 i
где x — координаты вектора x. Простейшие экстремальные свойства собственных чисел λi выражается следующим фактом: Лемма. 1. Обозначим через S единичную сферу в L: S = {x ∈ L : |x| = 1}. Тогда λ1 = max Q(x), λn = min Q(x). x∈S
x∈S
www.phys.nsu.ru
www.phys.nsu.ru 56
Н. С. Даирбеков
+ 2. Обозначим L− k = Lin(e1 , . . . , ek ), Lk = Lin(ek , . . . , en ). Тогда
λk = max Q(x) = x∈S∩L+ k
min Q(x).
x∈S∩L− k
Доказательство. 1. Поскольку |xi |2 ≥ 0 и λ1 ≥ · · · ≥ λn , очевидно ! ! n n n X X X i 2 i 2 i 2 λn |x | ≤ λi |x | ≤ |x | . i=1
i=1
i=1
Для x ∈ S левая часть равна λn , а правая λ1 . Эти значения достигаются на векторах (0, . . . , 0, 1) и (1, 0, . . . , 0). 2. Действительно, в указанных выше координатах ограничение Q на L+ k имеет Pn Pk i 2 вид i=k λi |xi |2 , а на L− : λ |x | . Дальше рассуждаем как в п. 1. i=1 i k Следующее важное усиление этого результата, в котором вместо L− k рассматриваются любые линейные подпространства в L той же размерности, называют теоремой Куранта — Фишера. Она доставляет так называемую "минимаксную"характеризацию собственных значений. Теорема (теорема Куранта — Фишера). Для любого подпространства L0 ⊂ L размерности n − k + 1 справедливы неравенства λk ≤ max 0 Q(x),
λn−k+1 ≥ min 0 Q(x).
x∈S∩L
x∈S∩L
− Эти оценки точны для некоторых L (например, L+ k и Ln−k+1 соответственно), так что 0
www.phys.nsu.ru λk = min max 0 Q(x), 0 L
x∈S∩L
λn−k+1 = max min 0 Q(x). 0 L
x∈S∩L
Доказательство. Поскольку dim L0 + dim L− k = (n − k + 1) + k = n + 1, − 0 а dim(L0 + L− k ) ≤ dim L = n, пересечение L ∩ Lk не равно нулю. Возьмем − 0 x0 ∈ S ∩ (L ∩ Lk ). Согласно лемме λk = min − Q(x), так что λk ≤ Q(x0 ) и x∈S∩Lk
тем более λk ≤ max 0 Q(x). Второе неравенство можно доказать аналогично, x∈S∩L
а можно применив первое неравенство к оператору −f и заметив, что знаки и порядок собственных значений при этом обращаются. 4.12. Исследование асимптотики спектра возмущенного самосопряженного оператора. Пусть f и g — два самосопряженных оператора в евклидовом пространстве. Рассмотрим оператор f (ε) = f + εg. При ε → 0 собственные значения и собственные векторы оператора fε стремятся к соответствующим собственным значениям и векторам оператора f . Для простоты мы ограничимся только случаем некратных собственных значений. Предположим, что все собственные значения λ1 , . . . , λn оператора f различны. Обозначим через e1 , . . . , en соответствующие нормированные собственные векторы. Для оператора f (ε) обозначим соответствующие величины через λ1 (ε), . . . , λn (ε) и e1 (ε), . . . , en (ε). Можно показать, что λj (ε) и ej (ε) являются дифференцируемыми функциями от ε). Можем написать (1)
λj (ε) = λj + ελj + . . . ,
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
57
(1)
ej (ε) = ej + εej + . . . ,
где многоточие означает члены более высокого порядка малости по ε. (1) Наша цель вычислить поправки первого порядка λj . Равенство f (ε)ej (ε) = λj (ε)ej (ε) можно тогда переписать так: (1)
(1)
(1)
(f + εg)(ej + εej + . . . ) = (λj + ελj + . . . )(ej + εej + . . . ), или (1)
(1)
(1)
f (ej ) + ε(f (ej ) + g(ej )) + · · · = λj ej + ε(λj ej + λj ej ) + . . . . Следовательно, (1)
(1)
(1)
f (ej ) + g(ej ) = λj ej + λj ej . Умножим обе части скалярно на ej . (1)
(1)
(1)
(f (ej ), ej ) + (g(ej ), ej ) = λj (ej , ej ) + λj . (1)
(1)
(1)
Из самосопряженности f выводим (f (ej ), ej ) = (ej , f (ej )) = λj (ej , ej ). Итак, (1)
λj
= (g(Bej ), ej ).
Продолжая в том же духе можно вывести формулы для поправок более высокого порядка.
www.phys.nsu.ru 4.13. Кососимметрический (косоэрмитов) оператор, его чисто мнимый спектр и канонический вид матрицы. Оператор f в евклидовом (унитарном) пространстве называется кососимметрическим (косоэрмитовым), если f ∗ = −f , т. е. (f (x), y) = −(x, f (y)),
x, y ∈ L.
Лемма. Спектр кососимметрического (косоэрмитова) оператора чисто мнимый. Доказательство. Если f (x) = λx, x 6= 0, а f ∗ = −f , то λ(x, x) = (f (x), x) = −(x, f (x)) = −λ(x, x). Следовательно, λ + λ = 0.
Теорема. Следующие условия эквивалентны. 1. f ∗ = −f . 2. Матрица A оператора f в произвольном ортонормированном базисе кососимметрична (At = −A) в случае евклидова пространства, и косоэрмитова (At = −A) в случае унитарного пространства. 3. В подходящем ортонормированном базисе матрица A оператора f имеет вид: в унитарном пространстве iα1 .. , α1 , . . . , αn ∈ R, . iαn
www.phys.nsu.ru
www.phys.nsu.ru 58
Н. С. Даирбеков
в евклидовом пространстве 0 −α1 α1 0 .. . 0 −αk αk 0
0 ..
.
, 0
α1 , . . . , αk ∈ R.
Доказательство. Доказательства требует только импликация 1 =⇒ 3. Для унитарного пространства все просто. Косоэрмитовый оператор является очевидно нормальным. Тогда в некотором ортонормированном базисе его матрица диагональная. Так как собственные значения чисто мнимые, диагональные элементы имеют указанный вид. Для евклидова пространства чуть сложнее. Проведем индукцией по размерности пространства. Случай dim L = 1 очевиден (f = 0). В случае dim L = 2. Возьмем произвольный ортонормированный базис. В нем матрица оператора кососимметрична. Единственная возможность: 0 −α . α 0
www.phys.nsu.ru Индукционный шаг полностью имитирует соответствующее рассуждение из доказательства теоремы о каноническом виде матрицы ортогонального оператора. Теорема доказана.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
5. ТЕНЗОРНАЯ
59
АЛГЕБРА И ТЕНЗОРНЫЙ АНАЛИЗ
5.1. Определение тензора. Примеры тензоров. Объекты, с которыми мы сталкивается в алгебре или геометрии, очень часто определяются в каждом базисе своей системой чисел. Например, вектор или ковектор определяется в каждом базисе набором из n чисел — своих координат. Линейный оператор или билинейная форма определяется набором n2 чисел — матрицей оператора или билинейной формы. При переходе от одной системы координат к другой (т. е. замене базиса) система чисел, задающая данный объект, преобразуется определенным образом, причем закон преобразования различен для различных объектов. Вектор и ковектор задаются наборами из n чисел, однако при переходе к другому базису эти наборы преобразуются по разному. То же самое можно сказать про матрицы линейных операторов и билинейных форм. Напомню как меняются координаты векторов и ковекторов. В векторном пространстве L перейдем от базиса {ej } к базису {e0j }. Пусть C = (cji ) — матрица перехода: e0i = cji ej
(не забывайте про соглашение о суммировании!)
и пусть B = (bji ) — обратная матрица: j j cα i bα = δ i ,
j j bα i cα = δi . 1
n
— его
1
n
— его
Если x1 , . . . , xn — координаты вектора x в базисе {ej }, а x0 , . . . , x0 координаты в базисе {e0j }, то
www.phys.nsu.ru i
x0 = biβ xβ .
Если l1 , . . . , ln — координаты ковектора l в базисе {ej }, а l0 , . . . , l0 координаты в базисе {e0j }, то lj0 = cα j lα .
Определение. Говорим, что нам задан тензор типа (p, q), если каждой системе координат {ej } в L отнесена система np+q чисел i ...i
Tj11...jqp ,
1 ≤ i1 ≤ n, . . . , 1 ≤ ip ≤ n,
1 ≤ j1 ≤ n, . . . , 1 ≤ jq ≤ n,
причем при переходе от одной системы координат {ej } к другой {e0 i } эти числа преобразуются по формуле i ...i
α
i
q i1 p β1 ...βp 1 T 0 j11 ...jpq = cα j1 . . . cjq bβ1 . . . bβp Tα1 ...αq .
i ...i
Число r = p+q называется рангом или валентностью тензора. Числа Tj11...jqp называются компонентами тензора в данном базисе. Пространство тензоров типа i ...i (p, q) обозначается Tqp (L). Сам тензор может обозначаться через {Tj11...jqp } или i ...i
(Tj11...jqp ), или просто через T . Нижние индексы называются ковариантными, а верхние — контравариантными. Тензор типа (0, 0) называется скаляром, типа (1, 0) — контравариантным вектором, типа (0, 1) — ковариантным вектором, типа (p, 0) — контравариантным тензором ранга p, типа (0, q) — ковариантным тензором ранга q, и, если p 6= 0 и q 6= 0, то — смешанным тензором, p раз контравариантным и q раз ковариантным.
www.phys.nsu.ru
www.phys.nsu.ru 60
Н. С. Даирбеков
Примеры тензоров. 1. Скаляры. Если каждой системе координат отнесено одно и то же фиксированное число a, то его формально можно считать также тензором, а именно — тензором нулевого ранга. Тензор нулевого ранга называется скаляром. 2. Векторы. Вектору из L в каждом базисе соответствует совокупность n его координат, которые представляют контравариантный тензор ранга 1. 2. Ковекторы. Ковектору в каждом базисе соответствует совокупность его координаты. которые представляют ковариантный тензор ранга 1. 3. Билинейные формы. Пусть a(x, y) — билинейная форма в пространстве L. Отнесем каждому базису матрицу данной билинейной формы в этом базисе. Мы получим ковариантный тензор ранга 2 (упражнение). 4. Метрический тензор. Если L — евклидово пространство, то в нем имеется выделенная билинейная форма — скалярное произведение. Матрица (gij ) этой формы в каждом базису {ei } задает ковариантный тензор ранга 2, называемый фундаментальным или метрическим тензором евклидова пространства. Компонентами фундаментального тензора в произвольном базисе являются элементы матрицы Грама скалярного произведения в этом базисе. Сопоставим каждому базису в L матрицу (g ij ), обратную к матрице Грама, т. е. такой набор чисел g ij , что g iα gαk = δki .
Это определяет контравариантный тензор (g ij ) ранга 2 (упражнение). Этот тензор называется контравариантным метрическим тензором. 5. Линейные операторы. Пусть f — линейный оператор в L. Каждому базису {ei } отнесем матрицу (aji ) оператора f в этом базисе:
www.phys.nsu.ru f (ei ) = aji ej . Покажем, что (aji ) есть смешанный тензор ранга 2, один раз ковариантный и один раз контравариантный. Действительно, пусть переход к новому базису задается формулой e0i = cα i eα и, следовательно, обратный переход — формулой 0 ei = bα i eα ,
k k где bα i cα = δi .
Тогда α α β α β k 0 f (e0i ) = f (cα i eα ) = ci f (eα ) = ci aα eβ = ci aα bβ ek . k
Таким образом, матрица (a0 i ) оператора f в базисе {e0i } имеет вид k
j β a0 i = cα i bβ aα ,
что и доказывает, что матрица линейного оператора есть тензор второго ранга, один раз ковариантный и один раз контравариантный. В частности, единичному оператору в каждом базисе соответствует единичная матрица, т. е. система чисел ( 1 i = k, k δi = 0 i 6= k
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
61
представляет собой простейший тензор ранга 2, один раз ковариантный и один раз контравариантный. Тензор δik интересен тем, что его компоненты в любой системе координат одни и те же.
Теорема. 1. Пусть имеется два тензора одного типа. Если компоненты этих тензоров равны в какой-либо системе координат, то они равны в произвольной системе координат. Иными словами, два тензора равны, если их компоненты равны в хотя бы одном базисе. 2. При заданных p и q мы можем построить тензор типа (p, q), компоненты которого в каком-нибудь одном базисе равны np+q наперед заданным числам. Доказательство. 1. Это утверждение очевидно. Так как оба тензора имеют один тип, то они преобразуются по одним и тем же формулам при изменении базиса и так как их компоненты равны в одной системе координат по предположению равны, они равны и в любой другой системе координат. i ...i 2. Допустим, что дан какой-нибудь базис {ei } и набор np+q чисел Tj11...jqp . i ...i
Каждому базису {e0i } отнесем набор чисел T 0 j11 ...jpq , связанный с первоначальным набором формулами, указанными в определении тензора. Непосредственно проверяется, что получится тензор. 5.2. Операции над тензорами: перестановки индексов, линейные операции, произведение, свертка, спуск и подъем индексов. Здесь мы рассмотрим различные операции над тензорами. i ...i Перестановки индексов. Если Tj11...jqp — тензор типа (p, q), и если σ — произвольная перестановка множества {1, . . . , p}, а τ — перестановка множества {1, . . . , q}, то
www.phys.nsu.ru i ...i
...i
i
σ(p) Sj11 ...jpq = Tjτσ(1) (1) ...jτ (q)
определяет тензор типа (p, q) (проверьте!). Линейная комбинация тензоров. Если даны два тензора S и T одного типа и числа µ, ν ∈ R, линейная комбинация U = µS + νT определяется формулой i ...i
i ...i
i ...i
Uj11...jqp = µSj11 ...jpq + νTj11...jqp . Легко проверить, что действительно получится тензор типа (p, q). Произведение тензоров. Если даны тензор S типа (p, q) и тензор T типа (r, s), то их произведение U = S ⊗ T определяется формулой i ...i i
...i
i ...i
i
...i
p+1 p+r p+r Uj11...jqpjp+1 = Sj11 ...jpq Tjq+1 ...jq+s . q+1 ...jq+s
непосредственная проверка показывает, что получится тензор типа (p + r, q + s). Свертка тензора. Пусть r ∈ {1, . . . , p}, s ∈ {1, . . . , q}. Для (p, q)-тензора T определим (p − 1, q − 1)-тензор S следующим образом (заметьте суммирование по α): i ...i
i
...i
i ...i
αi
...i
r+1 p r−1 r+1 p Sj11 ...jr−1 = Tj11...js−1 αjs+1 ...jq . s−1 js+1 ...jq
Тензор S называется сверткой тензора T по паре индексов r и s. Итерируя эту конструкцию, получим определение свертки по нескольким парам индексов. Спуск и подъем индексов. Предположим теперь, что L — евклидово пространство. Если x — произвольный вектор в L, то в каждом базисе определены
www.phys.nsu.ru
www.phys.nsu.ru 62
Н. С. Даирбеков
его контравариантные xi и ковариантные xi компоненты в этом базисе, причем они связаны следующим образом: xi = g iα xα = xα g αi ,
xi = giα xα = xα gαi . Можно сказать, что в первой формуле нижний индекс поднят наверх, а во второй — верхний индекс спущен вниз. Эти операции обобщаются на произвольные тензоры. i ...i Если TJ11 ...jpq — тензор типа (p, q), а s ∈ {1, . . . , q}, то каждая из операций i ...i
i ...i
p+1 p αip+1 Tj11...jq−1 = Tj11...js−1 αjs ...jq−1 g
и
i ...i
i ...i
p p Tj10...jq−1 = g i0 α Tj11...js−1 αjs ...jq−1
определяет тензор типа (p + 1, q − 1). Каждая из этих операций называется подъемом индекса. Операции подъема индекса есть не что иное, как свертка произведения данного тензора и тензор g ij и потому корректна. Отличия между этими двумя операциями состоит только в порядке умножения данного тензора и контравариантного метрического тензора. Если r ∈ {1, . . . , p}, то аналогично каждая из операций i ...i
i ...i
p−1 Tj11...jq+1 = Tj11...jqr−1
и
αir ...iq−1
gαjq+1
www.phys.nsu.ru i ...i
i ...i
Tj01...jqp−1 = gj0 α Tj11...jqr−1
αir ...iq−1
определяет тензор типа (p − 1, q + 1). Эти операции называется спуском индекса. Каждая из них получается сверткой произведения данного тензора на метрический тензор и потому корректна. Эти операции могут применяться многократно в разных комбинациях. 5.3. Базисы в пространстве тензоров. Имеется взаимнооднозначное соответствие между векторами (элементами пространства L) и контравариантными векторами в L (тензорами типа (1,0)). Вектору v ∈ L соответствует тензор типа (1,0), компоненты которого в произвольном базисе {e1 , . . . , en } пространства L, равны координатам вектора v в этом базисе: v = v i ei , v ∈ L ←→ (v i ) ∈ T01 (L). Мы отождествляем векторы в L с контравариантными векторами в L с помощью этого естественного соответствия. Аналогично имеется взаимнооднозначное соответствие между ковекторами L (элементами сопряженного пространства L∗ = линейными функционалами на L) и ковариантными векторами в L (тензорами типа (0,1)). Ковектору l соответствует тензор типа (0,1), компоненты которого в произвольном базисе {e1 , . . . , en } пространства L, равны координатам ковектора в биортогональном базисе {f 1 , . . . , f n } пространства L∗ : l = li f i ,
l ∈ L∗ ←→ (li ) ∈ T10 (L). Мы отождествляем ковекторы в L с контравариантными векторами в L с помощью этого естественного соответствия.
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
63
В частности, сами базисные векторы e1 , . . . , en могут рассматриваться как тензоры типа (1, 0), а ковекторы f 1 , . . . , f n из биортогонального базиса могут рассматриваться как тензоры типа (0, 1). Для произвольных наборов индексов i1 , . . . , ip , j1 , . . . , jq , каждый из которых меняется от 1 до n, мы тогда можем рассмотреть следующие тензоры типа (p, q): 1
q
ei1 ⊗ · · · ⊗ eip f j ⊗ · · · ⊗ f j .
(∗)
Теорема. Для любого базиса {ei } набор тензоров (∗) составляет базис в пространстве тензоров Tqp (L). Кроме того, для любого тензора T ∈ Tqp (L) верна формула 1 q i ...i T = Tj11...jqp ei1 ⊗ · · · ⊗ eip f j ⊗ · · · ⊗ f j , т. е. компоненты тензора T в базисе {ei } являются его координатами в базисе (∗). 1
q
Доказательство. В базисе {ei } тензор S = ei1 ⊗ · · · ⊗ eip f j ⊗ · · · ⊗ f j имеет i ...i все компоненты нулевые за исключением единственной компоненты Sj11 ...jpq = 1. Отсюда вытекает утверждение теоремы. 5.4. Симметрические и кососимметрические тензоры. Операции симметризации и альтернирования. Симметрическое и внешнее произведение. Определение. Ковариантный (контравариантный) тензор ранга p называется симметрическим, если при любой перестановке индексов тензор не меняются.
www.phys.nsu.ru Определение. Ковариантный (контравариантный) тензор ранга p называется кососимметрическим (знакопеременным, антисимметрическим), если он меняет знак при перемене любых двух индексов местами.
Из определения кососимметрического тензора непосредственно следует, что при любой перестановке индексов компоненты тензора не меняются, если перестановка четная, и меняют знак на противоположный, если перестановка нечетная. Замечание. Аналогично мы можем определить тензоры, симметрические или кососимметрические по какой-либо части индексов, а не по всем индексам сразу, например, по первым двум индексам и т. п. По каждому ко(контра)вариантному тензору T мы можем построить новый симметрический тензор S(T ). Эта операция называется симметризацией и состоит в следующем. Пусть задан некоторый тензор, например, Ti1 i2 ...iq . Его симметризация состоит в построении тензора 1 X Tiσ(1) iσ(2) ...iσ(q) , S(T )i1 i2 ...iq = T(i1 i2 ...iq ) = q! σ где сумма берется по всем перестановкам σ множества {1, 2, . . . , q}. Операция альтернирования вводится аналогично операции симметризации и дает возможность по данному тензору T построить знакопеременный тензор A(T ). Она определяется следующим образом: 1 X A(T )i1 i2 ...iq = T[i1 i2 ...iq ] = (−1)σ Tiσ(1) iσ(2) ...iσ(q) , q! σ
www.phys.nsu.ru
www.phys.nsu.ru 64
Н. С. Даирбеков
где сумма берется по всем перестановкам σ множества {1, 2, . . . , q}, а (−1)σ — это знак перестановки (он равен 1, если перестановка четная, и 0, если перестановка нечетная) Аналогично определяются операции симметризации и альтернирования по группе индексов. Например, 1 T[ij]k... = (Tijk... − Tjik... ), 2 1 T (ij)k... = (T ijk... + T jik... ) 2 Определение. Симметрическое произведение ко(контра)вариантных симметрических тензоров T1 и T2 : T1 T2 = S(T1 ⊗ T2 ) Внешнее (косое, альтернированное) произведение ко(контра)вариантных тензоров T1 и T2 : T1 ∧ T2 = A(T1 ⊗ T2 ).
5.5. Криволинейные координаты (К. К.) в евклидовом пространстве. Пусть L — евклидово пространство размерности n, в котором зафиксирована некоторая система координат (x1 , x2 , . . . , xn ) и пусть {e1 , e2 , . . . , en } — базис, порождающий эту координатную систему, т. е. точка P ∈ G имеет координаты x1 , x2 , . . . , xn , если P = xi ei . Мы будем это записывать просто как P = (x1 , x2 , . . . , xn ). Возьмем вспомогательное арифметическое евклидово пространство Rn векторов ~u = (u1 , u2 , . . . , un ). Пусть G — некоторая открытая область в L, U – некоторая открытая область в Rn , а f : U → G – взаимнооднозначное отображение области U на G, P = f (u). Так как f взаимнооднозначно, то определено обратное отображение f −1 : G → U области G на U . В координатах можем написать: xk = xk (u1 , . . . , uk ), k = 1, . . . , n, uk = uk (x1 , . . . , xk ), k = 1, . . . , n. Мы будем говорить, что в области G задана криволинейная система координат (u1 , u2 , . . . , un ), если отображение f гладкое и его якобиан в каждой точке области U отличен от нуля. Последнее условие гарантирует нам, что обратное отображение f −1 : G → U также гладкое. Таким образом, каждой точке P в G сопоставляется набор чисел (u1 , . . . , un ), причем разным точкам области соответствуют разные наборы чисел (u1 , . . . , un ) и, наоборот, разным наборам чисел (u1 , . . . , un ) соответствуют разные точки области G. Набор чисел (u1 , . . . , un ) называют криволинейными координатами точки P и часто просто пишется P = (u1 , . . . , un ). Криволинейную систему координат задают определяя либо f , либо f −1 . Примеры. 1. Прямолинейные координаты. Это тривиальный пример в котором координатами точки P служит набор чисел x1 , . . . , xn . 2. Полярная система координат на плоскости. 1 x = u1 cos u2 , f: x2 = u1 sin u2 .
www.phys.nsu.ru
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
65
Здесь область G совпадает с плоскостью E 2 , из которой удалена положительная полуось x1 , область U — полуполоса u1 > 0, 0 < u2 < 2π. Обычно обозначают u1 = ρ, u2 = ϕ. 3. Цилиндрическая система координат в пространстве. В этом случае область U определяется неравенствами u1 > 0, 0 < u2 < 2π, −∞ < u3 < ∞, а отображения f и f −1 задаются формулами: 1 x = u1 cos u2 , x2 = u1 sin u2 , f: 3 x = u3 . 5.6. Локальный базис (Л. Б.) в криволинейных координатах. В области U координатными линиями являются прямые линии uk = ck , k 6= i, ui = t, где ck – некоторые постоянные, t – параметр. При отображении f : U → G они переходят в кривые линии γi , уравнения которых записываются так: xr = xr (c1 , . . . , ci−1 , t, . . . , cn ), r = 1, . . . , n, i = 1, . . . , n.
Эти линии называются координатными линиями области G в криволинейных координатах (u1 , u2 , . . . , un ). Через каждую точку P = (u1 , u2 , . . . , un ) проходит n координатных линий γi (t), i = 1, . . . , n. ∂ Обозначим через ∂u i касательный вектор кривой γi (t) в точке P . Координа∂ ты вектора ∂ui относительно основного фиксированного базиса {e1 , e2 , . . . , en } выражаются по формулам:
www.phys.nsu.ru ∂ ∂xj 1 = (u , . . . , un )ej . ∂ui ∂ui
j Так как якобиан отображения f равен определителю ∂x ∂ui , i, j = 1, . . . , n, и ∂ ∂ ∂ отличен от нуля, то система векторов ∂u1 , ∂u образует базис. 2 , . . . , ∂un Таким образом, введение криволинейной системы координат в области G ин ∂ ∂ ∂ дуцирует в каждой точке P базис ∂u , , . . . , , который называется ло1 ∂u2 ∂un кальным базисом в точке P . Удобно считать, то каждой точке P ∈ G соответствует свой экземпляр пространства L. Он называется касательным пространством в точке P и обозначается через TP G, причем для разных точек касательные пространства в этих точках считаются непересекающимися. Элементы TP G называются касательными векторами с началом в P . Понять удобность такого взгляда проще всего, если рассматривать в качестве G искривленную поверхность. Если G — искривленная поверхность, то прикрепление собственного касательного пространства TP G к каждой ∂ точке∂ P ∈ G вполне естественно. Тогда ∂u является базисом в TP G, ассоциированным с криволи1 , . . . , ∂un нейными координатами (u1 , . . . , un ). ∂ ∂ ∂ Базис ковекторов, биортогональный базису ∂u , обозначается 1 , ∂u2 , . . . , ∂un через du1 , du2 , . . . , dun . Тогда dui =
∂ui j dx , ∂xj
где dx1 , . . . , dxn — базис, двойственный базису e1 , . . . , en . Напомню, что ковектор в L— это линейный функционал на L. В данном случае значение ковектора
www.phys.nsu.ru
www.phys.nsu.ru 66
Н. С. Даирбеков
dxi на векторе v ∈ L равно i-й координате вектора v в базисе e1 , . . . , en . dxi (v) = v i ,
i = 1, . . . , n.
В примере 1 мы имеем ∂ = ei , i = 1, . . . , n. ∂xi Таким образом, базисные векторы получили еще одно обозначение. В примере 2: ∂ ∂ = cos u2 e1 + sin u2 e2 , = −u1 sin u2 e1 + u1 cos u2 e2 . ∂u1 ∂u2 В примере 3: ∂ ∂ ∂ = cos u2 e1 + sin u2 e2 , = −u1 sin u2 e1 + u1 cos u2 e2 , = e3 . 1 2 ∂u ∂u ∂u3 5.7. Преобразование Л. Б. при переходе от одной системы К. К. к другой. Допустим, что в области G заданы две системы К. К. (u1 , u2 , . . . , un ) 1 2 n и (u0 , u0 , . . . , u0 ) в двух открытых областях U и U 0 в Rn . Будем называть 1 2 n (u1 , u2 , . . . , un ) точки P старыми координатами точки P , а (u0 , u0 , . . . , u0 ) — новыми. Очевидно, новые координаты можно выразить через старые и наоборот. Если −1 P = f (~u) = f 0 (~u0 ), то отображение ϕ = f 0 ◦ f : U → U 0 дает связь между старыми и новыми координатами. В подробной записи отображение ϕ записывается в следующей форме: 1 1 u0 = u0 (x1 (u1 , . . . , un ), . . . , xn (u1 , . . . , un )), ϕ: ··· 0n n u = u0 (x1 (u1 , . . . , un ), . . . , xn (u1 , . . . , un )).
www.phys.nsu.ru Отображение ϕ имеет обратное ϕ−1 = f −1 ◦ f 0 : U 0 → U , 1
n
1
n
ur = ur (x1 (u0 , . . . u0 ), . . . , xn (u0 , . . . u0 )). Пример. Пусть на плоскости E 2 заданы две криволинейные системы координат. Одна – полярная система координат ρ, ϕ, а другая – параболическая система координат, заданная отображением 1
2
x1 = (u0 )2 − (u0 )2 , 1
2
x2 = 2u0 u0 . Тогда отображение ϕ запишется так: 01 √ u = ρ cos ϕ/2, ϕ: 02 √ u = ρ sin ϕ/2. Рассмотрим теперь закон преобразования локальных базисов при переходе от одной криволинейной системы координат к другой. Пусть P – произвольная точка области G ⊂ L. Тогда в касательном TP G в этой точке ∂ ∂ пространстве мы имеем два локальных базиса: ∂u и ∂u0i . Найдем матрицу перехода от i ∂ ∂ к ∂u0i . Из определения локального базиса мы имеем базиса ∂u i ∂xj ∂xj ∂uk ∂uk ∂xj ∂uk ∂ ∂ = e = e = e = . j j j ∂uk ∂u0 i ∂u0 i ∂u0 i ∂u0 i ∂uk ∂u0 i ∂uk
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
67
Таким образом,
∂ ∂uk ∂ = i ∂u0 ∂u0 i ∂uk ∂ и матрица перехода от базиса ∂ui к базису ∂u∂0 i совпадает с матрицей ∂ Якоби отображения ϕ−1 . Переход от базиса ∂u∂0 i к базису ∂u задается i тогда обратной матрицей, которая является матрицей Якоби отображения ϕ: k
∂ ∂u0 ∂ = . ∂ui ∂ui ∂u0 k Напоминаю, что все производные вычислены при значениях координат, соответствующих точке P . 5.8. Тензорные поля. Преобразование координат тензорного поля при замене криволинейных координат. Говорим, что в области G евклидова пространства L задано векторное (ковекторное) поле, если в каждой точке P ∈ G задан вектор (ковектор) V (P ) в касательном пространстве TP G. Аналогично определяется тензорное поле, а именно, будем говорить, что в G задано тензорное поле типа (p, q), если в каждой точке P ∈ G задан тенi ...i зор Tj11,...,jp q (P ) в касательном пространстве TP G (т. е. тензор в L, компоненты которого зависят от точки P ). 1 2 n Пусть в G введена криволинейная система координат ∂ (u , u , . . . , u ). В этом случае в каждой точке P ∈ G существует базис ∂ui и взаимный к нему базис {du1 , . . . , dun }. Поэтому если в области G задано векторное поле V (P ), то этого векторного поля принято определять относительно базиса ∂координаты : i ∂u ∂ V (u) = V i (u1 , . . . , un ) = V i (u1 , . . . , un ) i . ∂u Для ковекторного поля имеем W (u) = Wi (u1 , . . . , un ) = Wi (u1 , . . . , un )dui .
www.phys.nsu.ru В общем случае, компоненты тензорных полей T (P ) записываются в локаль∂ ном базисе ∂u : i ∂ ∂ i ...i i ...i T (u) = Tj11...jqp (~u) = Tj11...jqp (u1 , . . . , un ) i1 ⊗ · · · ⊗ ⊗ duj1 ⊗ · · · ⊗ dujq . ∂u ∂uip Пусть в области G евклидова пространства L даны две криволинейные си1 2 n стемы координат (u1 , u2 , . . . , un ) и (u0 , u0 , . . . , u0 ) и тензорное поле T с комi1 ...ip 1 n 0 i1 ...ip 01 0n понентами Tj1 ...jq (u , . . . , u ) и T j1 ...jq (u , . . . , u ) в этих криволинейных координатах. Выведем формулы связывающие компоненты тензора в данных криволиней ∂ ∂ ных координатах. Так как преобразование, связывающие базисы ∂u 1 , . . . , ∂un и ∂u∂0 1 , . . . , ∂u∂0 n нам известно, то, вспоминая определение тензора, мы получаем i
i ...i
1
n
T 0 j11 ...jpq (u0 , . . . , u0 ) =
i
∂u0 1 ∂u0 p ∂uα1 ∂uβq β1 ...βp 1 . . . . . . Tα ...α (u , . . . , un ). ∂uβ1 ∂uβp ∂u0 j1 ∂u0 jq 1 q
www.phys.nsu.ru
www.phys.nsu.ru 68
Н. С. Даирбеков
5.9. Метрический тензор. В каждой точке P области G в пространстве зададим дважды ковариантный тензор, который совпадает с метрическим тензором в TP G. Мы получим тензорное поле типа (0,2), называемое полем метрическим тензором или просто метрическим тензором. Если в области G задана некоторая криволинейная система координат (u1 , u2 , . . . , un ), то она задание ин ∂ ∂ дуцирует в TP G базис ∂u1 , . . . , ∂un для каждой точки P . Из определения выводим: ∂ ∂ , . gij (u1 , . . . , un ) = ∂ui ∂uj Стартуя с контравариантного метрического тензора, аналогично определяется дважды контравариантное тензорное поле g ij (u1 , . . . , un ) . Легко понять, что его компоненты g ij (u1 , . . . , un ) являются элементами матрицы, обратной к матрице (gij ). Полученное тензорное поле называется полем контравариантного метрического тензора или просто контравариантным метрическим тензором.
5.10. Дифференцирование векторных и тензорных полей. Ковариантная производная. Символы Кристоффеля. Если в области G задана функция ϕ и касательный вектор A = Ai ei ∈ TP G, то производная функции ϕ вдоль вектора A в точке P обозначается через ∇A ϕ. Как известно из курса математического анализа она вычисляется следующим образом: ϕ(P + tA) − ϕ(P ) ∂ϕ j ∇A ϕ = lim = A . t→0 t ∂xj Аналогично, если задано векторное поле V = V i ei , то можно вычислить производную векторного поля X в направлении вектора A в точке P . Мы получим новый касательный вектор в точке P , который обозначается через ∇A V (P ). По определению он равен V (P + tA) − V (P ) ∂V i j ∂V i j ∇A V (P ) = lim = A ei = A . t→0 t ∂xj ∂xj
www.phys.nsu.ru i ...i
Более общо, если дано тензорное поле T = (Tj11...jqp ), то можно определить новый тензор в точке P — производную тензора T в направлении вектора A : ! i ...i ∂Tj11...jqp j T (P + tA) − T (P ) ∇A T (P ) = lim = A . t→0 t ∂xj Допустим теперь, что в G задано еще одно векторное поле Z = Z i ei . Тогда мы можем вычислить производную тензора T в направлении вектора Z(P ) для каждой точки P ∈ G. Мы получим новое тензорное поле, которое называется производной тензорного поля T вдоль поля Z и обозначается через ∇Z T . Согласно вышеуказанной формуле имеем следующую формулу для вычисления производной тензорного поля в прямолинейных координатах: ! i ...i i ...i ∂Tj11...jqp j ∂Tj11...jqp j ∇Z T = Z = Z ei1 ⊗ · · · ⊗ eip ⊗ f j1 ⊗ · · · ⊗ f jq . (∗) ∂xj ∂xj Лемма (свойства производной тензорного поля). Для любых гладких векторных полей Z, Z1 , Z2 , гладких тензорных полей T, T1 , T2 и любой гладкой функции ψ справедливы следующие свойства операции ∇: ∇Z1 +Z2 T = ∇Z1 T + ∇Z2 T,
(1)
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
69
∇Z (T1 + T2 ) = ∇Z T1 + ∇Z T2 ,
(2)
∇ψZ T = ψ∇Z T,
(3)
∇Z (T1 ⊗ T2 ) = (∇Z T1 ) ⊗ T2 + T1 ⊗ (∇Z T2 ), ∇Z (свертка T ) = свертка ∇Z T . Кроме того, для любых гладких векторных полей V1 , V2 : ∇Z (V1 , V2 ) = (∇Z V1 , V2 ) + (V1 , ∇Z V2 ).
(4) (5) (6)
Доказательство. Упражнение, опирающееся только лишь на определения, формулу (∗) и правило дифференцирования суммы и произведения функций. Наша задача — найти формулу для вычисления производной тензорного поля T вдоль векторного поля Z, когда в области G введена криволинейная система координат (u1 , u2 , . . . , un ). Имеем ∂ ∂xj i Z ej . Z = Zi i = ∂u ∂ui Следовательно, в случае скалярного поля T = ϕ ∂ϕ i ∂ϕ ∂xj i Z = Z . ∂xj ∂ui ∂ui Итак, для скалярного поля ответ очень простой: ∂ϕ i ∇Z ϕ = Z . ∂ui Теперь рассмотрим случай векторного поля T = V . Пусть ∂ V = V i i. ∂u Используя лемму, находим ∂ ∂ ∇Z V = ∇ i ∂ V j j = Z i ∇ ∂ i V j j Z ∂u ∂u ∂u i ∂u ∂ ∂ = Zi ∇ ∂i V j + V j∇ ∂i . ∂u ∂u ∂uj ∂uj ∇Z ϕ =
www.phys.nsu.ru (D0)
j ∂ Заметим, что (D0) влечет ∇ ∂ i V j = ∂V , и разложим векторное поле ∇ ∂ i j ∂u ∂ui ∂ ∂u ∂u ∂ по локальному базису ∂u : 1 , . . . , ∂un ∂ ∂ ∇ ∂i = Γkij k . (K) ∂u ∂uj ∂u Получим ∂ ∂V k k j + Γ V Zi k . (D1) ∇Z V = ij ∂ui ∂u Формула (D1) дает ответ на поставленную задачу в случае векторного поля, однако определение (K) величин Γkij не очень удобно для вычислений. Выразим величины Γrki через компоненты метрического тензора gij (u1 , . . . , un ). Так как частная производная не зависит от порядка вычисления производных, левая часть (K) симметрична относительно i и j. Следовательно, правая часть также симметрична относительно i и j: Γkij = Γkji .
www.phys.nsu.ru
www.phys.nsu.ru 70
Н. С. Даирбеков
∂ ∂ Напомню, что для метрического тензора мы имеем gij = ∂u i , ∂uj . Продифференцируем это равенство по uk используя лемму: ∂ ∂ ∂ ∂ ∂ ∂ ∂gij = ∇ ∂k , = ∇ ∂k , + , ∇ ∂k ∂u ∂u ∂u ∂uk ∂ui ∂uj ∂ui ∂uj ∂ui ∂uj ∂ ∂ ∂ ∂ = Γrki r , j + , Γrkj r = Γrki grj + Γrkj gir = Γki,j + Γkj,i , i ∂u ∂u ∂u ∂u
где введено обозначение Γki,j = Γrki grj . Из симметрии Γrik = Γrki следует, что Γrik grj = Γrki grj , что означает симметричность Γki,j по первым двум индексам: Γki,j = Γik,j . В полученном равенстве ∂gij = Γki,j + Γkj,i ∂uk произведем циклическую перестановку индексов i, j, k:
(a)
∂gki = Γjk,i + Γji,k (b) ∂uj ∂gjk = Γij,k + Γik,j . (c) ∂ui Сложив (a) и (b) и вычтя из суммы (c), с учетом симметричности Γik,j по первым двум индексам, получим
www.phys.nsu.ru ∂gij ∂gki ∂gik + − = Γki,j + Γkj,i + Γjk,i + Γji,k − Γij,k − Γik,j = 2Γkj,i ∂uk ∂uj ∂uj или ∂gki ∂gjk 1 ∂gij + − . (K1) Γkj,i = 2 ∂uk ∂uj ∂ui Величины Γkj,i называются символами Кристоффеля первого рода, а величины 1 ∂gkα ∂gjα ∂gkj Γikj = Γkj,α g αi = g iα + − (K2) 2 ∂uj ∂uk ∂uα — символами Кристоффеля второго рода. Замечание. Символы Кристоффеля Γkj,i и Γikj не являются тензорами. Закон их преобразования при замене координат более сложный. Обозначим V,ik =
∂V k + Γkij V j . ∂ui
(D2)
Из формулы (D1) получаем ∂ ∇Z V = V,ik Z i k . (D3) ∂u Отсюда нетрудно заключить, что V,ik являются компонентами тензорного поля типа (1,1), т. е. при замене координат они преобразуются по тензорному закону. Этот тензор называется ковариантной производной векторного поля V . Итак, наша задача полностью решена в случае дифференцирования векторного поля. Рассмотрим случай ковекторного поля W = Wi dui .
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
71
∂ Для произвольного векторного поля V = V i ∂u i рассмотрим скалярное поле i ϕ = Wi V , полученное сверткой тензорного произведения W и V . Из леммы имеем j ∇Z (Wk V k ) = ∇Z W k V k + Wj ∇Z V .
Из предыдущего выводим ∂(Wk V k ) i Z , ∂ui j ∂V j j k ∇Z V = + Γ V Z i. ik ∂ui ∇Z (Wk V k ) =
Взяв V =
∂ , ∂uk
отсюда выводим ∇Z W
k
=
∂Wk j i − Γ W ik j Z . ∂ui
Итак, ∂Wk j − Γik Wj Z i duk . ∇Z W = ∂ui Аналогично предыдущему, положим
Wk,i =
∂Wk − Γjik Wj . ∂ui
˜ (D1)
˜ (D2)
www.phys.nsu.ru Имеем
˜ (D3)
∇Z W = Wk,i Z i duk .
Отсюда нетрудно заключить, что (Wk,i ) являются компонентами дважды ковариантного тензора второго ранга. Этот тензор называется ковариантной производной ковекторного поля W . Теперь перейдем к нахождению производной тензорного поля. Для краткости ограничимся случаем тензора второго ранга, один раз контравариантного и один раз ковариантного: T = (Tji ). Имеем T = Tji
∂ ⊗ duj . ∂ui
Тогда T i ∂ ⊗ duj j ∂ui ∂ ∂ i j k j i j i ∂ =Z ⊗ du + Tj ∇ ∂k ⊗ du + Tj i ⊗ ∇ ∂k du ∇ ∂ k Tj ∂u ∂u ∂u ∂ui ∂ui ∂u ! i ∂Tj ∂ ∂ ∂ = Zk ⊗ duj + Tji Γrki r ⊗ duj − Tji Γjkp i ⊗ dup ∂uk ∂ui ∂u ∂u ! ∂Tji ∂ i r r i = + Γkr Tj − Γkj Tr Z k i ⊗ duj . ∂uk ∂u
∇Z T = ∇
Z k ∂k ∂u
Окончательно, ∇Z T =
∂Tji + Γikr Tjr − Γrkj Tri ∂uk
! Zk
∂ ⊗ duj . ∂ui
˜˜ (D1)
www.phys.nsu.ru
www.phys.nsu.ru 72
Н. С. Даирбеков
Полагая
i Tj,k =
∂Tji + Γikr Tjr − Γrkj Tri , ∂uk
˜˜ (D2)
выводим i ∇Z T = Tj,k Zk
∂ ⊗ duj . ∂ur
˜˜ (D3)
i Тензорное поле Tj,k называется ковариантной производной тензорного по˜˜ ля (T i ). Анализируя формулу (D2), мы видим, что ковариантная производная j
i Tj,k получается по такому правилу: по ковариантному индексу она получается ˜ как производная ковариантного вектора (см. формулу (D2), а по контравариантному индексу — как производная контравариантного вектора (см. формулу (D2)). i ...i Повторяя предыдущие рассуждения, для тензорного поля Tj11...jqp типа (p, q), мы получим следующую формулу для ковариантной производной этого тензора i ...i
i ...i Tj11...jqp,k
=
∂Tj11...jqp ∂uk
+
q X
i ...α ...ip
r Γjkα T 1 r r j1 ...jq
r=1
−
p X
i ...i
1 p r Γα kir Tj1 ...αr ...jq ,
r=1
где индекс αr стоит на r месте и по нему происходит суммирование. В качестве примера подсчитаем ковариантную производную метрического тензора:
www.phys.nsu.ru gij,k =
∂gij ∂gij − Γrik grj − Γrjk gri = − Γik,j − Γjk,i = 0, ∂uk ∂uk
∂g
так как ∂uijk = Γik,j + Γjk,i (см. формулу (a)). Отметим, что это заключение можно было сделать по другому следующим образом: подсчитать тензорное поле (gij,k ) в прямолинейных координатах, а затем пересчитать его в координатах (u1 , . . . , un ), пользуясь тензорным законом. В прямолинейных координатах символы Кристоффеля равны нулю, а частная производная метрического тензора также равна нулю, так как тензор не меняется от точки к точке. Следовательно, в прямолинейных координатах все слагаемые в последней сумме равны нулю. Точно такое рассуждение верно для любого тензорного поля, принимающего одно и то же значение в каждой точке области G (про такое поле говорят, что оно является параллельным). Значит ковариантная производная параллельного поля равна нулю. Очевидно, что в свою очередь равенство нулю ковариантной производной означает, что поле является параллельным (для доказательства рассмотрите поле в прямолинейных координатах). Примеры. 1. Вычислим символы Кристоффеля первого и второго рода в прямолинейных координатах. Так как в этой системе gij = (ei , ej ) постоянны, то из формулы, выражающей символы Кристоффеля через компоненты метрического тензора, получим Γijk = Γjk,i ≡ 0 при i, j, k = 1, . . . , n. 2. Вычислим символы Кристоффеля в полярной системе координат. В этом случае g11 = 1, g 11 = 1,
g12 = g21 = 0, g 12 = g 21 = 0,
g22 = (u1 )2 = ρ2 , g 22 = 1/ρ2 = 1/(u1 )2 .
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
73
Из упомянутой выше формулы для символов Кристоффеля следует, что Γ11,1 = 0,
Γ12,1 = Γ21,1 = 0,
Γ22,1 = −u0 ,
Γ11,2 = 0,
Γ12,2 = Γ21,2 = u1 ,
Γ22,2 = 0.
Вычисляя символы Кристоффеля второго рода через символы Кристоффеля первого рода и метрический тензор, получаем Γ111 = 0, Γ112 = Γ121 = 0, Γ122 = −u0 = −ρ, 1 1 2 2 2 Γ11 = 0, Γ12 = Γ21 = u1 = ρ , Γ222 = 0. 5.11. Основные дифференциальные операторы: градиент, дивергенция и лапласиан в К. К. Здесь мы рассмотрим как выглядят известные вам из курса анализа дифференциальные операторы в криволинейных координатах. 1. Дифференциал функции. Пусть f – дифференцируемая функция, определенная в некоторой области G ⊂ E n , f : G → R. Для произвольной точке P ∈ G рассмотрим линейный функционал df (P ), отображающий вектор V ∈ TP G в значение дифференциала функции f на этом векторе: V 7→ df (P )(V ). Таким образом, для произвольной точке P ∈ G определен ковектор df (P ), а в области G определено ковекторное поле df . Если (u1 , . . . , un ) – произвольная криволинейная система координат в G, то из формулы инвариантности первого дифференциала вытекает, что ∂f ∂f 1 n i df (u1 , . . . , un ) = (u , . . . , u )du = . ∂ui ∂ui ∂f ∂f Таким образом, набор функций ∂u представляет компоненты ковек1 , . . . , ∂un торного поля. 2. Градиент функции. Как мы знаем в евклидовом пространстве имеется взаимнооднозначное соответствие между векторами и ковекторами. Теперь для дифференцируемой функции f в произвольной точке P ∈ G рассмотрим вектор, двойственный рассмотренному выше ковектору df (P ). Он называется градиентом функции f в точке P и обозначается grad f (P ). Иначе говоря, компоненты ковектора df (P ) являются ковариантными компонентами вектора grad f (P ). Напомню, что каждому вектору V соответствует ковектор X 7→ (X, V ). Следовательно, имеем формулу
www.phys.nsu.ru (X, grad f (P )) = df (P )(X) для всех X ∈ TP G. Как мы знаем контравариантные компоненты получаются из ковариантных подъемом индекса. Тогда для произвольных криволинейных координат (u1 , . . . , un ) в G имеем ∂f (grad f (u1 , . . . , un ))i = g iα (u1 , . . . , un ) α (u1 , . . . , un ). ∂u Так как для прямоугольных декартовых координат g ij = δ ij , имеем в декартовых координатах ∂f 1 n grad f (x1 , . . . , xn ) = (x , . . . , x ) . ∂xi Таким образом, grad f — это тот самый вектор, который рассматривается в курсе математического анализа.
www.phys.nsu.ru
www.phys.nsu.ru 74
Н. С. Даирбеков
3. Дивергенция векторного поля. ∂ Пусть в области G задано векторное поле V = V i (u1 , . . . , un ) ∂u i . Дивергенцией векторного поля λ называется скалярное поле (функция), определенное формулой ∂V i div V = V,ii = + Γiik V k . (1) ∂ui В прямоугольных декартовых координатах получаем знакомую из курса анализа формулу ∂V i div V (x1 , . . . , xn ) = . ∂xi 4. Лапласиан. Лапласианом гладкой функции f называют функцию ∆f , определенную формулой ∆f = div(grad f ).
www.phys.nsu.ru
www.phys.nsu.ru
www.phys.nsu.ru Лекции по линейной алгебре и дифференциальной геометрии
СПИСОК
[1] [2] [3] [4] [5] [6] [7] [8] [9]
А. Л. П. И. А. А. А. И. Л.
75
ЛИТЕРАТУРЫ
Д. Александров, Н. Ю. Нецветаев. Геометрия. В. Погорелов. Лекции по дифференциальной геометрии. К. Рашевский. Курс дифференциальной геометрии. М. Гельфанд. Лекции по линейной алгебре. И. Кострикин. Введение в алгебру. И. Кострикин, Ю.И.Манин. Линейная алгебра и геометрия. И. Мальцев. Основы линейной алгебры. В. Белько и др. Сборник задач по дифференциальной геометрии. А. Беклемишева и др. Сборник задач по аналитической геометрии и линейной алгебре.
ИНСТИТУТ МАТЕМАТИКИ ИМ. С. Л. СОБОЛЕВА, E-mail address:
[email protected]
ПР. АКАД.
КОПТЮГА 4, НОВОСИБИРСК, 630090, РОССИЯ
www.phys.nsu.ru
www.phys.nsu.ru