КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Корешков Н.А. ЛИНЕЙНЫЕ ОПЕРАТОРЫ.
КАЗАНЬ 2004.
ОГЛАВЛЕНИЕ ГЛАВА 1. ЛИНЕЙНОЕ ПР...
134 downloads
160 Views
903KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Корешков Н.А. ЛИНЕЙНЫЕ ОПЕРАТОРЫ.
КАЗАНЬ 2004.
ОГЛАВЛЕНИЕ ГЛАВА 1. ЛИНЕЙНОЕ ПРОСТРАНСТВО 1. Линейное пространство. 2. Линейная зависимость и ее свойства. 3. Базис и размерность. 4. Координаты. Изоморфизм пространств. 5. Координаты вектора в новом базисе. 6. Сумма и пересечение пространств. 7. Прямые суммы. ГЛАВА 2. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 1. Линейные отображения векторных пространств. 2. Матрица линейного оператора. 3. Алгебра линейных операторов. 4. Инвариантные подпространства и собственные вектора. 5. Сопряженное (двойственное) пространство. 6. Триангулизация линейного оператора и теорема Гамильтона-Кэли. 7. Факторпространства и фактороператоры. 8. Корневое подпространство. 9. Жорданова нормальная форма. 10. Минимальный многочлен матрицы.
ГЛАВА 3. ВЕКТОРНЫЕ ПРОСТРАНСТВА СО СКАЛЯРНЫМ ПРОИЗВЕДЕНИЕМ 1. Евклидовы пространства 2. Процесс ортогонализации. 3. Изоморфизм евклидовых пространств. 4. Ортогональное дополнение. 5. Унитарное пространство.
Глава 1. Линейное пространство 1. Линейное пространство В различных разделах математики и физики часто встречается ситуация, когда с некоторой совокупностью объектов можно производить операции сложения и умножения на скаляр. Причем эти операции всегда обладают рядом одинаковых свойств. Выделяя эти общие свойства, приходим к следующему определению линейного (векторного) пространства. Определение 1.1. Множество V называется линейным (векторным) пространством над полем k, а его элементы векторами, если а) на V задана бинарная операция V ×V → V, обычно называемая сложением: (v1, v2) → v1+ v2, удовлетворяющая следующим аксиомам: Ia) v1+ v2= v2+ v1 (коммутативность) IIa) (v1+ v2)+v3=v1+ (v2+v3) (ассоциативность) IIIa) существует такой нейтральный элемент 0, называемый нулевым вектором, что v+0=v, для любого v ∈ V; IV a) для любого вектора v ∈ V существует вектор v’ ∈ V такой, что v+v’=0. Вектор v’ называют противоположным вектором и обозначают - v. Перечисленные аксиомы означают, что множество V является абелевой аддитивной группой. б) на множестве k×V задана операция (λ,v) → λv ∈ V, называемая умножением вектора на скаляр, удовлетворяющая еще четырем аксиомам: Iб) λ(v1+v2)= λv1+ λv2 IIб) (α+β)v=αv+βv λ,α,β ∈ k, v,v1,v2 ∈ V; (аксиомы дистрибутивности)
IIIб) (αβ) v =α(β v) (ассоциативность), α,β ∈ k, v ∈ V; IVб) 1·v=v (унитарность) В качестве поля k в дальнейшем часто будет фигурировать либо поле комплексных чисел C, либо поле действительных чисел R. Но основные свойства линейного пространства не зависят от природы основного поля. Поэтому многие свойства и конструкции, связанные с линейным пространством будут рассматриваться над произвольным полем.
Примеры линейных пространств. 1. Пусть V= {(α1 ,α 2 ,...,α n ),α i ∈ k , i = 1,..., n} – множество всевозможных наборов длины n с компонентами из поля k. Для наборов α = (α 1 , α 2 ,..., α n ) ∈ V и β = ( β 1 , β 2 ,..., β n ) ∈ V определим их сумму γ = (γ 1 , γ 2 ,..., γ n ) ∈V по правилу: γ i = α i + β i i = 1,..., n . Произведение на
скаляр также определим покоординатно, т.е. λα = (λα 1 , λα 2 ,..., λα n ) . Тогда аксиомы Iа, IIа, Iб-IVб вытекают из соответствующих аксиом поля k, т.к. все проверки осуществляются покоординатно. Нейтральным элементом будет набор (0,0,…,0), состоящий из n нейтральных элементов поля. Наконец, противоположным вектором будет набор –α = (–α1, –α2,…,-αn), состоящий из элементов, являющихся противоположными для компонент вектора α. Они существуют в силу соответствующей аксиомы в поле. Это пространство называется пространством строк длины n, и обозначается kn. Как мы вскоре увидим, любое n-мерное векторное пространство может быть отождествлено с пространством строк длины n.
2. Обозначим через R(a,b) множество всех функций на интервале ( a, b) ⊂ R
со значениями в R. Операции сложения и умножения на
скаляр введем поточечно, т.е. (f+g)(x)= f(x) +g(x), , (λf )( x) = λf ( x) , где f , g ∈ R(a, b) , λR, x ∈ (a,b).
Тогда проверка аксиом векторного пространства в R(a,b) сводится к проверке соответствующих свойств на множестве действительных чисел R. 2. Линейная зависимость и ее свойства Основным инструментом в изучении свойств линейного пространства является понятие линейной зависимости векторов. Определение 2.1. Набор векторов v1,v2,…,vm пространства V называется линейно зависимым, если существует ненулевой набор скаляров
(α1 ,α 2 ,...,α m ),α i ∈ k , i = 1,..., m
такой, что
α1v1 + α 2 v2 + ... + α m vm = 0
(2.1)
(Здесь 0 – нулевой вектор пространства V.) Заметим, что при m=1 система, состоящая из одного вектора v, будет линейно зависимой тогда и только тогда, когда v=0. Действительно, если v=0, то, взяв α 1 = 1 , имеем 1 ⋅ v = 0 . Обратно, если α ⋅ v = 0 и α ≠ 0 , то, умножая последнее равенство на α −1 , имеем v=0. В дальнейшем часто будем использовать эквивалентное определение линейной зависимости. Определение 2.2. Набор векторов v1,v2,…,vm, m≥2, пространства V называется, линейно зависимым, если один из этих векторов является линейной комбинацией остальных, т.е. v j = α 1v1 + ... + α j −1 v j −1 + α j +1 v j +1 + ... + α m v m
для некоторого j и некоторых констант α 1 ,..., α j −1 , α j +1 ,..., α m .
(2.2)
Проверим эквивалентность этих определений при m>1. Пусть выполнено определение 2.1. Т.к. набор (α 1 ,..., α m ) ненулевой, то существует номер j такой, что α j ≠ 0 . Разделив соотношение (2.1) на α j и переместив слагаемые с номерами, отличными от j, в правую часть этого соотношения, получим: vj = −
α j −1 α j +1 α α1 v1 − ... − v j −1 − v j +1 − ... − m v m . Т.е. выполняется αj αj αj αj
соотношение (2.2). Если имеет место соотношение (2.2), то, переместив вектор v j в правую часть этого соотношения, получим: α 1 v1 + ... + α j −1v j −1 − v j + α j +1v j +1 + ... + α m v m = 0 . Последнее равенство пока-
зывает, что определение 2.1 выполнено, т.к. набор (α 1 ,..., α j −1 ,−1, α j +1 ,..., α m ) очевидно ненулевой.
Отметим некоторые свойства линейной зависимости. Свойство 2.1. Если некоторая подсистема векторов линейно зависима, то и вся система векторов также линейно зависима. Доказательство. Пусть, например, первые s векторов всей системы линейно зависимы, т.е. α 1 v1 + α 2 v 2 + ... + α s v s = 0 ,
где не все α i равны нулю. Перепишем последнее соотношение следующим образом: α 1 v1 + α 2 v 2 + ... + α s v s + 0 ⋅ v s +1 + ... + 0 ⋅ v m = 0 .
Мы получили нетривиальную линейную зависимость системы векторов v1,…,vs ,…,vm. Заметим, что мы воспользовались условием 0·v=0, которое получается
с
помощью
0·v=(0+0)·v=0·v+ 0·v.
дистрибутивности
умножения,
а
именно
Свойство 2.2. Любая подсистема линейно независимой системы векторов сама линейно независима. Доказательство. Непосредственно следует из предыдущего (рассуждение от противного). Свойство 2.3. Система векторов, содержащая нулевой вектор, линейно зависима. Утверждение легко вытекает из свойства 2.1, если заметить, что нулевой вектор представляет линейно зависимую систему. Свойство 2.4. Если векторы v1,v2,…,vk
линейно независимы, а
v1,v2,…,vk,v линейно зависимы, то вектор v линейно выражается через v1,v2,…,vk. Доказательство.
В силу линейной зависимости векторов
v1 ,..., v k , v существует ненулевой набор (α 1 ,...,α k ,α ) ≠ (0,...,0,...,0) , что
α 1 v1 + α 2 v 2 + ... + α k v k + αv = 0 . Если α ≠ 0 , то утверждение очевидно.
Если же α = 0 , то из линейной независимости векторов v1 ,..., v k следует, что α1 = ... = α k = 0 . Это противоречит условию нетривиальности набора (α1 ,...,α k ,α ) . 3. Базис и размерность Важнейшей характеристикой линейного пространства является понятие размерности. Чтобы ввести это понятие, нам потребуется следующая лемма. Лемма (о замене) 3.1. Если векторы системы U = {u1 ,K, un } линейно независимы и линейно выражаются через векторы системы W = {w1 ,K, wm } , то n ≤ m .
Доказательство. Доказательство будем вести индукцией по m. При m=1 имеем u1 = λ1w1, u2 = λ2 w1,..., un = λn w1 . Все коэффициенты λ j отличны от нуля, т.к. в противном случае система векторов содер-
жала бы нулевой вектор, что противоречит линейной независимости U, в силу следствия 2.3. Предположим, что n > m = 1 . Тогда λ2 u1 − λ1u2 = λ2 λ1 w1 − λ1λ2 w1 = 0 , т.е. подсистема {u1 ,u 2 } – линейно зави-
сима. Опять получаем противоречие с линейной независимостью U (см. свойство 2.2.). Предположим, что лемма верна для систем W с m-1 векторами и докажем ее для систем с m векторами. Пусть в соотношениях u1 = λ11 w1 + ... + λ1m wm ............................... un = λn1 w1 + ... + λnm wm
все коэффициенты λim = 0, i = 1,..., n . Тогда по предположению индукции n ≤ m − 1 < m . Если для некоторого i λim ≠ 0 , то, меняя нумерацию, будем считать, что i=n, λnm ≠ 0 . Рассмотрим новую систему векторов
U ' = {u'1 ,...u' n −1 } ,
где
u ' i = ui −
λim u , λnm n
i = 1,..., n − 1 .
Тогда
m −1
u' i = ∑ μ ij w j , i = 1,..., n − 1 , т.к. после приведения подобных членов коj =1
эффициенты в выражении для u'i при wm будут равны нулю. Проверим
линейную
независимость
системы
векторов
U ' = {u'1 ,...u' n −1 } . Предположим, что она линейно зависима, т.е. суще-
ствует
ненулевой
набор
(α1 , α 2 ,..., α n−1 )
α1u'1 +α 2 u' 2 +... + α n −1u' n −1 = 0 . Подставим вместо u' i их ui −
такой,
что
выражения:
λim u . Получим α 1u1 + ... + α n −1u n −1 + βu n = 0 . В силу линейной незаλnm n
висимости системы U = {u1 ,...un } последнее соотношение возможно только в случае, когда α1 = ... = α n −1 = β = 0 . Это противоречит тому, что (α1 ,..., α n −1 ) ≠ (0,...,0) .
Итак, система векторов U ' = {u'1 ,...u' n −1 } линейно независима и ли^
нейно выражается через систему W = {w1 ,..., wm−1} . По предположению индукции n − 1 ≤ m − 1 , т.е. n ≤ m . Лемма доказана. Следствие 3.2. Пусть U = {u1 ,..., un } и W = {w1,..., wm } – две максимальные линейно независимые системы векторов пространства V. Тогда n=m. Доказательство: В силу максимальности системы W набор векторов {u s , w1 ,..., wm } будет линейно зависимым. Таким образом, каждый вектор u s системы U линейно выражается через вектора системы W. Мы попадаем в условия леммы о замене и потому n ≤ m . Меняя местами системы U и W, получим m ≤ n . Из двух полученных неравенств вытекает, что n=m. Доказанное следствие позволяет корректно определить понятие размерности векторного пространства. Определение 3.3. Линейное пространство называется конечномерным, если в нем существует конечная максимальная линейно независимая система векторов. В противном случае говорят, что пространство бесконечномерно. Любую такую систему векторов будем называть базисом пространства. Из следствия 3.2 вытекает, что количество векторов в любом базисе одинаково. Это позволяет сформулировать следующее определение размерности. Определение 3.4. Количество векторов в любом базисе конечномерного пространства V называется его размерностью и обозначается dim k V (Здесь k–поле скаляров, участвующее в определении векторного пространства). Примеры:
1. Пространство k n строк длины n имеет размерность n. Действительно, вектора ei = (0,...1,...,0) , i=1,…n образуют базис k n . Любой вектор
n
v = (α1 ,...α n ) = ∑ α i ei .
Если
i =1
n
∑α e i =1
i i
= 0,
то (α1 ,...α n ) = 0 , т.е.
α1 = α 2 = ... = α n = 0 . Итак, векторы e1 ,..., en образуют максимальную
линейно независимую систему. 2. Совокупность всех многочленов от переменного x n
k [ x ] = { f ( x ) = ∑ ai x i , ai ∈ k , n ∈ N } i =0
является бесконечномерным пространством, так как для любого n набор векторов 1, x,..., x n – линейно независим. 4. Координаты. Изоморфизм пространств Теорема 4.1. Пусть V
n-мерное векторное пространство и
e1 ,.., en – его базис. Тогда
1. любой вектор из V единственным образом представляется в n
виде v = ∑ α i ei , α i ∈ k . i =1
2. любую линейно независимую систему векторов v1,v2,…,vm, m
α α1 e1 − ... − n en . α α
Если для некоторого вектора v существуют два представления: v = α1e1 + ... + α n en и v = β1e1 + ... + β n en . То, вычитая из одного соотно-
шения другое, имеем: (α1 − β1 )e1 + ... + (α n − β n )en = 0 .
Т.к. вектора e1 ,.., en линейно независимы, то α1 − β1 = ... = α n − β n = 0 , т.е. α1 = β1 ,..., α n = β n . Рассмотрим второй пункт теоремы. Из совокупности векторов v1 ,.., vm , e1 ,.., en , удалим все те, которые линейно выражаются через
предыдущие. Оставшийся набор v1 ,.., vm , ei ,.., ei содержит все вектора 1
s
v1 ,.., vm , в силу их линейной независимости. Предположим, что по-
лучившийся набор линейно зависим, т.е. α1v1 + α 2 v2 + ... + α m vm + β i ei + ... + β i ei = 0 . 1
1
s
s
Разделив это соотношение на ненулевой коэффициент β i с наиj
большим номером, получим, что вектор ei является линейной комj
бинацией предыдущих. Следовательно, набор v1 ,.., vm , ei ,.., ei – ли1
s
нейно независим. Кроме того, любой вектор пространства V является линейной комбинацией базисных векторов e1 ,.., en , а значит и линейной комбинацией векторов v1 ,.., vm , e1 ,.., en . Но любой вектор последнего набора, по построению, линейно выражается через вектора v1 ,.., vm , ei ,.., ei . 1
s
Поэтому вектора v1 ,.., vm , ei ,.., ei образуют базис пространства V. Что 1
s
доказывает второй пункт рассматриваемой теоремы. Скаляры α1 ,.., α n ∈ k , возникающие при разложении вектора v ∈ V по базису: v = α1e1 + ... + α n en , называются координатами вектора v в базисе e1 ,.., en . Если u = β1e1 + ... + β n en еще один вектор из V, то v + u = (α1 + β1 )e1 + ... + (α n + β n )en , λv = ( λα1 )e1 + ... + ( λα n )en , λ ∈ k . Таким
образом, в n –мерном векторном пространстве выполняются те же правила работы с координатами, что и в 3-мерном пространстве, а именно: координаты суммы двух векторов равны сумме соответствующих координат, а координаты произведения вектора на скаляр
состоят из координат исходного вектора, умноженных на этот скаляр. Указанное обстоятельство позволяет отождествлять произвольное n –мерное векторное пространство и пространство строк длины n .
Для точной формулировки, описывающей это отождествление, введем понятие изоморфизма векторных пространств. Определение 4.2. Пусть V и U – два линейных пространства над полем k . Изоморфизмом пространства V в пространство U называется биекция ϕ (т.е. взаимно однозначное отображение) V в U , удовлетворяющее условию: ϕ (α1v1 + α 2 v 2 ) = α1ϕ ( v1 ) + α 2ϕ ( v 2 ) , v1 , v2 ∈ V , α1 , α 2 ∈ k .
Если V есть n –мерное векторное пространство, e1 ,.., en – некоторый фиксированный базис V, то определим отображение ϕ пространства V в k n формулой: ϕ (v ) = (α1 , α 2 ,..., α n ) , где α1 , α 2 ,..., α n - координаты вектора v в базисе e1 ,.., en . Из определения ϕ легко следует, что отображение является биекцией V на пространство k n . А из вышеприведенного замечания о правилах действия с координатами суммы и произведения на скаляр следует линейность отображения ϕ , которую
удобнее
проверять
в
виде
двух
условий:
ϕ (v1 + v 2 ) = ϕ (v1 ) + ϕ ( v 2 ) , ϕ (αv ) = αϕ ( v ) .
Построенный изоморфизм показывает, что структура произвольного конечномерного пространства однозначно определяется его размерностью. Чтобы подчеркнуть этот факт, приведем следующую теорему. Теорема 4.3. Два линейных пространства над полем k изоморфны тогда и только тогда, когда их размерности совпадают.
Доказательство. Пусть пространства V и W изоморфны и ϕ – соответствующая биекция из V на W с условием линейности. Если v1 ,.., vn - базис пространства V, то ϕ ( v1 ),.., ϕ ( vn ) - базис W . Действи-
тельно, любой вектор w ∈ W имеет прообраз v ∈ V , т.е. n
n
i =1
i =1
w = ϕ ( v ) = ϕ ( ∑ α i v i ) = ∑ α iϕ ( v i ) .
Если же
n
∑ α ϕ (v ) = 0 , i
i =1
i
n
то ϕ ( ∑ α i vi ) = 0 . Но в силу линейности ϕ , i =1
имеем: ϕ (0) = 0 . А т.к. ϕ – биекция , то
n
∑α v
i i
= 0 . Из линейной неза-
i =1
висимости векторов v1 ,.., vn следует, что α1 = ... = α n = 0 . Итак, мы проверили, что вектора ϕ (v1 ),.., ϕ (vn ) образуют максимальную линейно независимую систему в W , следовательно, dim k W = n = dim k V . Обратно, пусть dim k W = dim k V = n . Обозначим через v1 ,.., vn ; w1 ,.., wn базисы в V и W . Определим отображение ϕ на базисных элементах: ϕ (vi ) = wi , i = 1,..., n . Т.к. v1 ,.., vn базис V, то можно определить отобраn
n
i =1
i =1
жение на всем пространстве V по правилу: ϕ (∑α i vi ) = ∑αi wi . Построенное отображение является биекцией пространства V на пространство W , т.к. w1 ,.., wn базис. Линейность построенного отображения очевидна, т.е. ϕ – изоморфизм пространств V и W . 5. Координаты вектора в новом базисе Пусть V n -мерное векторное пространство, а e1 ,.., en и e'1 ,.., e' n – два его базиса. Запишем каждый вектор нового (штрихованного) базиса e'1 ,.., e' n в виде линейной комбинации векторов старого (не штрихо-
ванного) базиса:
e'1 = t11e1 + t 21e2 + ... + t n1en ...................... e' n = t1n e1 + t 2 n e2 + ... + t nn en
или в матричной форме: ⎡ t11 t12 K t1n ⎤ ⎢t t K t2 n ⎥ ⎥ ( e'1 , e' 2 ,..., e' n ) = ( e1 , e2 ,..., en ) ⎢ 21 22 ⎥ ⎢M M ⎥ ⎢ ⎣t n1 t n 2 K t nn ⎦
Возникающую таким образом матрицу T называют матрицей перехода от старого базиса к новому. Как видно из ее определения, элементами матрицы перехода являются координаты векторов нового базиса (записываемые в нашей редакции по столбцам) в старом базисе. Матрица T - невырожденная. Если столбцы матрицы T удовлетворяют нетривиальному соотношению с коэффициентами λ1 ,..., λn , то λ1e1′ + ... + λn en′ = 0 . Что противоречит линейной независимо-
сти базисных элементов e1′ ,..., e′n . Здесь ( e'1 ,..., e' n ) и ( e1 ,..., en ) матрицы, состоящие из одной строки и n столбцов. А произведение в правой части равенства вычисляется
по обычному правилу умножения матриц. n
n
i =1
i =1
Пусть x = ∑ xi ei = ∑ x'i e'i - представление вектора x в двух данных базисах. Используя выражение новых базисных векторов e'i через старые ei получим: ⎛ n ⎞ x = ∑ x'i e'i = ∑∑ x'i t ji e j = ∑ ⎜ ∑ x'i t ji ⎟e j . i =1 i =1 j =1 j =1 ⎝ i =1 ⎠ n
n
n
n
n
Сравнивая эту запись с представлением вектора x = ∑ xi ei и исi =1
пользуя единственность разложения вектора по базису, имеем: n
x j = ∑ x ' i t ji , j = 1,..., n . i =1
В матричной форме это соотношение можно переписать следующим образом: ⎛ x1 ⎞ ⎡ t11 t12 K t1n ⎤⎛ x '1 ⎞ ⎜ ⎟ ⎢ ⎥⎜ ⎟ ⎜ x2 ⎟ ⎢t 21 t 22 K t 2 n ⎥⎜ x ' 2 ⎟ , ⎜ M ⎟=⎢M M ⎥⎜ M ⎟ ⎜⎜ ⎟⎟ ⎢ ⎥⎜⎜ ⎟⎟ ⎝ xn ⎠ ⎣t n1 t n 2 K t nn ⎦⎝ x ' n ⎠
или X ' = T −1 X , где X , X ' – столбцы координат вектора x в старом и новых базисах, а T = [tij ]. Пример. Пусть V – 3-мерное мерное пространство, e1 , e2 , e3 – его базис. Вектор x в этом базисе имеет вид: x = e1 + 2e2 − e3 . Новый базис связан со старым формулами:
e'1 = e1 − e2 + e3 ,
e' 2 = 2e1 − e2 + 3e3 , e' 3 = 3e1 + e2 + 6e3 . Найдем координаты вектора x в но-
вом базисе. Т.к. вычисление обратной матрицы с помощью элементарных преобразований сводится к составлению произведения из элементарных матриц, то применение этого произведения к столбцу X равносильно выполнению тех же элементарных преобразований
и в том же порядке, которые производятся для приведения исходной матрицы T к единичной. Иcпользуя это замечание, произведем соответствующие вычисления. 2 3 1 ⎤ ⎡1 2 3 1 ⎤ ⎡1 2 3 1 ⎤ ⎡1 2 0 − 14⎤ ⎡1 ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ − 1 − 1 1 2 ⎥ ~ ⎢0 1 4 3 ⎥ ~ ⎢0 1 4 3 ⎥ ~ ⎢0 1 0 − 17⎥ ~ ⎢⎣ 1 3 6 − 1⎥⎦ ⎢⎣0 1 3 − 2⎥⎦ ⎢⎣0 0 − 1 − 5⎥⎦ ⎢⎣0 0 − 1 − 5 ⎥⎦
⎡1 0 0 20 ⎤ ⎢ ⎥ ⎢0 1 0 − 17⎥ ⎢⎣0 0 1 5 ⎥⎦
Следовательно, x = 20e'1 −17e' 2 +5e' 3 .
в
новом
базисе
вектор
x
имеет
вид:
6. Сумма и пересечение пространств Пусть U некоторое подмножество в векторном пространстве V. Будем говорить, что U является подпространством в V, если оно является линейным пространством (т.е. выполняются все восемь аксиом определения 1.1) относительно операций сложения и умножения на скаляр, которые определены в V. Имеет место следующий критерий того, что подмножество U является подпространством. Критерий (подпространства) 6.1. Подмножество U векторного пространства V является подпространством т. и т.т., когда для любых векторов u1 , u2 ∈ U
и любых скаляров α1 ,α 2 ∈ k
вектор
α1u1 + α 2 u2 принадлежит V .
Проверить самостоятельно. Естественным примером линейного подпространства является линейная оболочка векторов. Пусть v1 ,..., vm некоторый фиксированный набор векторов пространства V. Назовем линейной оболочкой системы векторов v1 ,..., vm множество всевозможных сумм
m
∑λ v ,λ ∈k . i i
i
i =1
m
m
m
m
i =1
i =1
i =1
i =1
Если v = ∑ λi vi , v' = ∑ λ 'i vi , то v + v ' = ∑ (λi + λ 'i )vi , λv = ∑ ( λλi )vi , λ ∈ k . Следовательно, это множество замкнуто относительно опера-
ции сложения векторов и умножения на скаляр. В силу критерия 6.1. это множество будет подпространством. В дальнейшем оно будет обозначаться символом < v1 , v2 ,..., vm > . Легко видеть, что максимальная линейно независимая система векторов из набора v1 , v2 ,..., vm остается максимальной линейно независимой системой во всем пространстве < v1 , v2 ,..., vm > . Это дает возможность эффективно строить базис в линейных оболочках.
Определим сумму V + W двух подпространств U и W пространства V как совокупность векторов вида u + w , u ∈ U , w ∈ W . Если u1 + w1 , u2 + w2 ∈ U + W , то
α1 (u1 + w1 ) + α 2 (u 2 + w2 ) = (α 1u1 + α 2 u 2 ) + (α1 w1 + α 2 w2 ) ∈ U + W ,
т.к. α1u1 + α 2 u2 ∈ U , α1w1 + α 2 w2 ∈ W . Пусть u1 ,..., u s базис U , w1 ,..., wt базис W . Тогда из определения суммы подпространств имеем, что U + W =< u1 ,..., u s , w1 ,..., wt > . Поэтому базисом пространства U + W является максимальная линейно независимая подсистема ui ,..., ui , w j ,..., w j 1
m
1
p
системы u1 ,..., u s , w1 ,..., wt , а
dim k (U + W ) = m + p .
Вычислим теперь размерность пересечения U ∩ W подпространств U, W, которое также является подпространством. Любой вектор x, принадлежащий пересечению, можно записать s
t
двумя способами: x = ∑ xi ui , x = ∑ y i wi . Если (ui1, i =1
натное представление вектора
…,
uin)tr – коорди-
i =1
ui ,
а [wi1, …, win]tr – аналогичное пред-
ставлению вектора wi в некотором базисе пространства V, то, приравнивая две записи вектора x, получим систему линейных однородных уравнений для нахождения коэффициентов
x1 ,..., xs , y1 ,..., yt :
⎛ u s1 ⎞ ⎛ wt1 ⎞ ⎛ u11 ⎞ ⎛ w11 ⎞ x1 ⎜⎜ M ⎟⎟ + ... + x s ⎜⎜ M ⎟⎟ = y1 ⎜⎜ M ⎟⎟ + .. + yt ⎜⎜ M ⎟⎟ . ⎜ u1n ⎟ ⎜ w1n ⎟ ⎜ u sn ⎟ ⎜ wtn ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
(6.1)
Множество решений этой системы обозначим M. Ранг r системы (6.1) равен максимальному числу линейно независимых столбцов, т.е. фундаментальной
r = m + p = dim k (U + W ) .
системе
= dim k U + dim k W − dim k (U + W ) .
Количество векторов в
решений
равно
(s+t)–r=
Каждому вектору m = ( x10 ,..., xs0 , y10 ,..., yt0 ) ∈ M поставим в соответствие вектор
x=
∑
s x 0u i =1 i i
. Легко проверить (проделайте это сами), что ука-
занное соответствие определяет изоморфизм пространств M и U∩W. В силу теоремы 4.3. dim k M = dim k U ∩ W и мы приходим к следующему утверждению: Теорема 6.2. Если U и W конечномерные подпространства пространства V, то
dim k U ∩ W = dim k U + dim k W − dim k (U + W ) .
Из доказательства теоремы вытекает способ построения базиса пересечения U∩W. Действительно, если
m j = ( x1( j ) ,..., xs( j ) , y1( j ) ,..., yt( j ) ) ∈ M
,
где j=1, …, (s+t)–r, фундаментальная система решений для (6.1), то в силу изоморфизма M и U∩W, набор s
x ( j ) = ∑ xi( j ) u i , j=1, …, (s+t)–r, i =1
является базисом пересечения U∩W. Пример. Базис пространства U: u1 = (1,1,2) , u2 = (0,1,−1) . Базис пространства W : w1 = (1,2,1) , w2 = (1,0,1) . Вычисляя ранг матрицы, составленной из координат векторов u1 , u2 , w1 , w2 , получим, что u1 , u2 , w2 образуют максимальную линейно
независимую систему векторов. Т.е. базис U+W образуют вектора u1 , u2 , w2 и dim k (U + W ) = 3 .
Из формулы теоремы 6.2 сразу получаем, что
dim k (U ∩ W ) = 1 .
Одна-
ко для нахождения базиса пересечения U∩W необходимо решить систему 6.1: ⎛1⎞ ⎛0⎞ ⎛1⎞ ⎛1⎞ x1 ⎜ 1 ⎟ + x2 ⎜ 1 ⎟ = y1 ⎜ 2 ⎟ + y 2 ⎜ 0 ⎟ ⎜ 2⎟ ⎜ − 1⎟ ⎜1⎟ ⎜1⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
Ее фундаментальный набор решений содержит единственный вектор, например, (1,1,1,0). Соответственно, базисом пересечения U∩V является вектор
⎛1⎞ u1 + u 2 = ⎜ 2 ⎟ . ⎜1⎟ ⎝ ⎠
7. Прямые суммы Представление любого вектора из суммы U+W двух подпространств, вообще говоря, неоднозначно, и это связано с наличием ненулевого пересечения U∩W. Если
U ∩W = 0 ,
то из условия
u1 + w1 = u2 + w2 следует u1 − u2 = w2 − w1 . И т.к. u1 − u2 ∈ U , а w2 − w1 ∈ W ,
то u1 − u2 = w2 − w1 = 0 . В этом случае имеет место единственность разложения любого вектора из U+W на сумму своих компонент. Обобщая эту ситуацию на случай n слагаемых, приходим к следующему определению: Определение 7.1. Сумма
U = U 1 + ... + U n = {u =
∑
n u, i =1 i
ui ∈ U i }
называ-
ется прямой суммой подпространств Ui, i=1,…,n, если для любого i выполняется условие: обозначается
как
) U i ∩ (U 1 + ... + U i + ... + U n ) = 0 .
или
U 1 ⊕ U 2 ⊕ ... ⊕ U n
В этом случае U ⊕ in=1 U i .
(Здесь
) U1 + ... + U i + ... + U n = U1 + ... + U i −1 + U i +1 + ... + U n .)
Отметим два важных свойства прямых сумм. Свойство 7.2. Сумма
U = U 1 + ... + U n
является прямой т. и т.т., ко-
гда любой вектор u ∈ U единственным образом представляется в виде суммы
u = u1 + u 2 + ... + u n , ui ∈U i ,
Доказательство. Пусть
i=1,…,n.
U = ⊕ in=1U i .
Если
u = u1 + ... + u n = u '1 +... + u 'n
два разложения вектора u, то для любого u i − u 'i =
∑
n j =1 (u ' j −u j ) j ≠i
i ∈{1,2,..., n} ,
. Из этого равенства следует, что вектор
имеем: u i − u 'i ,
принадлежащий
Ui ,
принадлежит и сумме:
) U1 + ... + U i + ... + U n .
u i − u 'i = 0 ,
ределению прямой суммы получаем, что
По оп-
i=1,…,n, т.е. име-
ем единственность разложения вектора u. )
Обратно, пусть x ∈U i ∩ (U1 + ... + U i + ... + U n ) . Т.е. x=ui=u1+… +ui-1+ui+1+…+un. Тогда
u1 + ... + ui −1 − ui + ui +1 + ... + u n = 0 .
Но нулевой век-
тор можно представить в виде 0=0+…+0, где каждое слагаемое принадлежит подпространству Ui, i=1,…,n. Используя единственность разложения, имеем:
u1 = u 2 = ... = u n = 0 ,
т.е. x=0. Следовательно, про-
странство U является прямой суммой своих подпространств. Свойство 7.3. Сумма гда
dimU =
∑
n
i =1
U = U 1 + ... + U n
является прямой т.и.т.т., ко-
dim U i .
Доказательство. Пусть U = ⊕ in=1U i . Применим индукцию по количеству слагаемых n. При n=1, очевидно, dim U = dim U1. Для вычисления dim U воспользуемся формулой из теоремы 6.2: dim (U1+ … +Un) = dim U1+ dim (U2+ …+Un) – dim U1 ∩ (U2+ …+Un). По условию U1 ∩ (U2+ …+Un)=0, т.е. dim U1 ∩ (U2+ …+Un)=0. Сумма U2+ …+Un – прямая в силу свойства 7.2. Поэтому по предположению индукции
dimU = dim U 1 +
Обратно, предположим, что чим через вия
U=
∑
ui1 ,..., uiki n
дающих
∑
n
k = j =1 j
∑
Uj
j =1
j =1
∑
n j =2
U=
n j =2
dim U j =
∑
n
Uj
j =1
dimU j
∑
и
n j =1
, т.е.
dim U j
dimU =
.
∑
n j =1
dimU j
. Обозна-
– базис пространства Ui, i=1,…,n. Тогда из усло-
вытекает, что
векторного n
∑
dim(U 2 + ... + U n ) =
dim U j = dimU
{u11 ,..., u1k1 ,..., u n1 ,..., u nkn }
пространства
U.
. Следовательно,
странства U. Тогда по свойству 7.2 сумма
С
– система порождругой
{u11 ,..., u nkn }
∑
n
Uj
j =1
–
стороны, базис про-
– прямая.
Одним из важных случаев возникновения прямой суммы является конструкция дополнительного подпространства. Теорема 7.4. Пусть U подпространство в конечномерном пространстве V. Тогда существует такое подпространство W в V, что
V =U ⊕W
.
Доказательство. Выберем какой-либо базис в U: e1 ,..., em . Дополним его до базиса всего пространства V: e1 ,..., em ,..., en . Обозначим через W линейную оболочку свойства 7.2,
U ∩W = 0 .
Т.е.
< em+1 ,..., en > .
V =U ⊕W
Тогда V=U+W, а, в силу
.
Рассматривая прямые суммы, мы действовали пока в фиксированном векторном пространстве V. Такие прямые суммы называют внутренними. Иногда возникает необходимость в рассмотрении внешней прямой суммы двух векторных пространств над одним и тем же полем k, заранее никуда не вложенных в качестве подпространств. Под
U ⊕W
в этом случае понимается совокупность V все-
возможных пар (u,w), u ∈ U , w ∈ W . Операция сложения векторов из V и умножения их на скаляры определены формулами (u, w) + (u' , w' ) = (u + u' , w + w' ) ; α (u, w) = (αu, αw) ; u, u' ∈ U , w, w'∈W , α ∈ k .
Векторы (u,0) образуют в V подпространство векторы (0,w) образуют подпространство
W
U,
изоморфное U, а
, изоморфное W. Соот-
ветствующими изоморфизмами являются отображения: (u,0) → u, (0,w) → w. Кроме того, V является внутренней прямой суммой своих подпространств
U
и
W
.
Глава 2. Линейные операторы 1.
Линейные отображения векторных пространств
Линейные отображения векторных пространств появляются в различных разделах математики. Их примерами могут служить вращения и отражения в трехмерном пространстве, а также операции дифференцирования и интегрирования в пространствах функций. Рассмотрим понятие линейного отображения в наиболее общем виде. Определение 1.1. Пусть V и W векторные пространства над полем k. Отображение φ из V в W называется линейным, если ϕ (α1v1 + α 2 v2 ) = α1ϕ (v1 ) + α 2ϕ (v2 ) , v1 , v2 ∈V , α1 ,α 2 ∈ k .
Наряду с термином линейное отображение часто используется его синоним: линейный оператор. Частным случаем линейного отображения является линейная функция, когда в качестве пространства W берется одномерное пространство, обычно отождествляемое с основным полем k. Совокупность всех линейных отображений из пространства V в пространство W будем обозначать Homk(V,W). Примеры. 1) V=W=R2 – действительная плоскость, φ – поворот каждого вектора из R2 на фиксированный угол α. Тогда а) ϕ (λv ) = λϕ (v )
б) ϕ (v1 + v2 ) = ϕ ( v1 ) + ϕ ( v2 )
2) V=W=k[x] – кольцо многочленов от одной переменной x, ϕ = – оператор дифференцирования. Тогда
d dx
d d d (αf + β g ) = α f +β g. dx dx dx
С каждым линейным отображением φ: V →W связаны два подпространства
–
его
ядро
Kerϕ = {v ∈V ,ϕ (v) = 0}
и
образ
Jmϕ = {w ∈W , w = ϕ (v), v ∈V } .
Отметим следующую зависимость между размерностями ядра и образа. Теорема 1.1. Если V конечномерное векторное пространство над полем k, φ
∈ Homk(V,W),
конечномерны и
то пространства Ker φ и Im φ также
dim k Kerϕ + dim k Jmϕ = dim k V
.
Доказательство. Т.к.
Kerϕ ⊆ V
– конечномерно. Выберем базис полним его до базиса
, то
e1 ,..., em
e1 ,..., em , em+1 ,..., en
dim Kerϕ ≤ dim V < ∞ ,
т.е. Ker φ
пространства Ker φ
и до-
всего пространства V. Тогда
любой вектор w, принадлежащий Im φ, можно представить в виде: w = ϕ(
n
n
i =1
i =1
∑ α i e i ) = ∑ α i ϕ (e i ) =
n
∑ α ϕ (e ) . i
i
i = m +1
Проверим, что ϕ (em+1 ),...,ϕ (en ) образует базис образа Im φ . Предположим,
∑
n
i = m +1
что
α i ei ∈ Kerϕ .
∑
n
α ϕ (e i ) = 0 . i = m +1 i
Поэтому
∑
n
i = m +1
Тогда
α i ei = ∑i =1 α i ei m
ϕ (∑i = m +1 α i ei ) = 0 , n
т.е.
. Но линейная зависи-
мость между базисными векторами возможна только в том случае, когда все коэффициенты равны нулю. В частности, α m+1 = ... = α n = 0 , т.е. ϕ (em+1 ),...,ϕ (en ) – линейно независимы. Итак, вектора ϕ (em+1 ),..., ϕ (en ) образуют базис образа Im φ и dim k Imφ = n–m= dim k V – dim k Ker φ . Что и требовалось доказать. 2.
Матрица линейного оператора
Зафиксируем два базиса v1 ,..., vn и w1 ,..., wm в пространствах V и W соответственно. Тогда для ϕ ∈ Homk (V , W ) выполнены соотношения: ϕ (v1 ) = a11 w1 + a 21 w2 + ... + a m1 wm LLLLLLLLLL
ϕ (v n ) = a1n w1 + a 2 n w2 + ... + a mn wm
Матрица
⎡ a11 K a1n ⎤ Aϕ = ⎢ LL ⎥ ⎢a m1 K a mn ⎥ ⎣ ⎦
называется матрицей линейного оператора
φ. Приведенную систему соотношений можно заменить одним матричным: (ϕ (v1 ),..., ϕ ( vn )) = ( w1 ,..., wm ) Aϕ , где произведение в правой части вычисляется по обычному правилу умножения матриц.
Пусть x = x1v1 + ... + xn vn произвольный вектор из пространства V. Тогда n
n
m
m
n
i =1
i =1
j =1
j =1
i =1
ϕ ( x ) = ∑ xiϕ ( vi ) = ∑ xi ∑ a ji w j = ∑ ( ∑ a ji xi )w j .
Т.е. координаты вектора y = ϕ ( x ) = y1 w1 + ... + y m wm вычисляются с помощью следующего матричного равенства: ⎛ x1 ⎞ ⎛ y1 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ M ⎟ = Aϕ ⎜ M ⎟ . ⎜x ⎟ ⎜y ⎟ ⎝ n⎠ ⎝ m⎠
Следовательно, для вычисления координат образа любого вектора достаточно знать матрицу соответствующего линейного оператора. И наоборот, при фиксированных базисах в пространствах V и W любая матрица A размера m × n задает оператор φ, если принять написанное выше равенство за определение. Нами доказана Теорема 2.1. Пусть V =< v1 ,..., vn > и W =< w1 ,..., wm > - линейные пространства с фиксированными базисами. Тогда существует взаимно однозначное соответствие между элементами из Homk (V , W ) и m × n - матрицами с коэффициентами из основного поля k.
Примеры. 1. Пусть φ - поворот каждого вектора на угол α в плоскости R 2 . В качестве базисных векторов возьмем взаимно перпендикулярные векторы e1 , e2 единичной длины. Тогда ϕ (e1 ) = u + v = cos α ⋅ e1 + sin α ⋅ e2 .
Аналогично ϕ (e2 ) = cos α ⋅ e2 − sin α ⋅ e1 . Поэтому матрицей этого ли⎡cos α
нейного отображения будет матрица ⎢ ⎣ sin α 2. Пусть ϕ =
d dx
− sin α ⎤ . cos α ⎥⎦
- оператор дифференцирования кольца многочленов
R[x]. Рассмотрим подпространство Rn [ x ] = { f ( x ) ∈ R[ x ], deg f ≤ n} , состоящее из многочленов, степень которых не превосходит n. Тогда d Rn [ x] ⊆ Rn [ x] и можно рассмотреть ограничение данного линейноdx
го оператора на подпространство ров пространства
Rn [x]
Rn [x] .
В качестве базисных векто-
возьмем многочлены 1, x,..., x n . Тогда
ϕ ( x i ) = ix i −1 , i = 1,..., n , ϕ (1) = 0 . Поэтому матрицей оператора диффе-
ренцирования в пространстве ⎡0 ⎢0 ⎢M ⎢0 ⎢0 ⎣
Rn [x] 1 0 M 0 0
0 2 M 0 0
будет матрица K 0⎤ K 0⎥ M⎥ . K n⎥ K 0 ⎥⎦
В дальнейшем мы будем рассматривать только линейные операторы, действующие из пространства V, в то же самое пространство V.
Если V n-мерное векторное пространство, а e1 ,..., en и e'1 ,..., e' n два его базиса, то линейный оператор ϕ ∈ Homk (V , V ) определяет две матрицы: n
n
j =1
j =1
ϕei = ∑ a ji e j или Aei = ∑ a ji e j и n
n
j =1
j =1
ϕe' i = ∑ a ' ji e' j или A' e'i = ∑ a ' ji e' j . (В матричном варианте под век-
тором ei понимаем столбец (0, …, 1, … 0)t – единица на i-том месте) Через T обозначим матрицу перехода от базиса e1 ,..., en к базису n
n
i =1
i =1
e'1 ,..., e' n . Пусть x = ∑ xi ei = ∑ x ' i e' i два представления вектора x ∈ V в
двух различных базисах. Тогда ⎛ y1 ⎞ ⎛ x1 ⎞ Y = ⎜⎜ M ⎟⎟ = A⎜⎜ M ⎟⎟ = AX ⎜ yn ⎟ ⎜ xn ⎟ ⎝ ⎠ ⎝ ⎠
,
⎛ y1 ⎞ ⎛ x1 ⎞ Y = ⎜⎜ M ⎟⎟ = A⎜⎜ M ⎟⎟ = AX ⎜ yn ⎟ ⎜ xn ⎟ ⎝ ⎠ ⎝ ⎠
.
Кроме того, в силу параграфа 2 главы 1 X = TX ' , Y = TY ' (т.к. Y и Y ' координаты
одного и того же вектора
ATX ' = AX = Y = TY ' = TA' X ' . Т.к.
X'
y = ϕ (x ) ).
Поэтому
- произвольный столбец, то
AT = TA' или A' = T −1 AT .
Матрицы A и A' , связанные последним соотношением, принято называть подобными матрицами. Нами доказана Теорема 2.9. Матрицы линейного оператора, заданные в разных базисах, подобны. Пример. Матрица линейного оператора в базисе e1 , e2 , e3 имеет вид:
5 − 2⎤ ⎡ 4 ⎢ − 2 − 2 1 ⎥ . Найти матрицу этого оператора в базисе ⎢ ⎥ ⎣⎢ − 1 − 1 1 ⎦⎥
e'1 = e1 − e2 + e3 , e' 2 = 2e1 − e2 + 3e3 , e' 3 = 3e1 + e2 + 6e3 .
Для вычисления произведения T −1 Aϕ отметим, что матрицу T −1 можно рассматривать как произведение элементарных матриц, возникающих при приведении матрицы T к единичной. Поэтому, выполняя с матрицей Aϕ те же элементарные преобразования в том же порядке, которые производятся с матрицей T получим T −1 Aϕ . 2 3 4 5 − 2 ⎤ ⎡1 2 3 4 5 − 2⎤ ⎡1 ⎥ ⎢ ⎥ ⎢ 3 − 1⎥ ~ ⎢ − 1 − 1 1 − 2 − 2 1 ⎥ ~ ⎢0 1 4 2 ⎢⎣ 1 3 6 − 1 − 1 1 ⎥⎦ ⎢⎣0 1 3 − 5 − 6 3 ⎥⎦ 5 − 2⎤ ⎡1 2 0 − 17 − 22 10⎤ ⎡1 2 3 4 ⎥ ⎥ ⎢ ⎢ 3 − 1⎥ ~ ⎢0 1 0 − 26 − 33 15⎥ ~ ⎢0 1 4 2 ⎢⎣0 0 − 1 − 7 − 9 4 ⎥⎦ ⎢⎣0 0 − 1 − 7 − 9 4 ⎥⎦ 44 − 20⎤ ⎡1 0 0 35 ⎥ ⎢ ⎢0 1 0 − 26 − 33 15 ⎥ . ⎢⎣0 0 1 7 9 − 4 ⎥⎦ 44 − 20⎤ ⎡ 35 Вычисляя произведение матрицы T −1 Aϕ = ⎢⎢− 26 − 33 15 ⎥⎥ и матри− 4 ⎥⎦ 9 ⎢⎣ 7
цы T , получим что оператор ϕ в базисе e'1 , e' 2 , e' 3 , действует следующим образом: ϕ (e'1 ) = −29e'1 +22e' 2 −6e' 3 , ϕ (e' 2 ) = −34e'1 +26e' 2 −7e' 3 , ϕ (e' 3 ) = 29e'1 −21e' 2 +6e' 3 .
3.
Алгебра линейных операторов
Введенная ранее алгебра квадратных матриц M n (k ) с коэффициентами из поля k может быть описана как алгебра линейных операторов n-мерного векторного пространства. Множество Homk(V, V) в дальнейшем будем обозначать Endk(V) или End(V). Зададим на End(V) операции сложения, умножения и умножения на элементы из k. Пусть ϕ ,ψ ∈ End (V ),α ∈ k , тогда:
(ϕ + ψ )( x) = ϕ ( x) + ψ ( x) , (ϕψ )( x) = ϕ (ψ ( x)) , (αϕ )( x ) = α (ϕ ( x )) , где x ∈ V .
Легко проверить, что относительно сложения и умножения на скаляр множество End(V) удовлетворяет всем аксиомам векторного пространства, а операция умножения отображений ассоциативна (ϕψ ) χ = ϕ (ψχ ) и связана с операциями сложения законами дистрибу-
тивности ϕ (ψ + χ ) = ϕψ + ϕχ , (ψ + ϕ ) χ = ψχ + ϕχ и (λϕ )ψ = λ (ϕψ ) = ϕ (λψ ) λ ∈ k . Перечисленные факты означают, что End(V) является ассо-
циативной алгеброй над полем k или k-алгеброй. Для того чтобы описать отождествление алгебр End(V) и Mn(k), введем понятие изоморфизма алгебр. Определение 3.1. Говорят, что k-алгебры A и B изоморфны, если существует биекция ϕ алгебры A на алгебру B такая, что для ∀a1 , a 2 ∈ A , ∀α 1 ,α 2 ∈ k
ϕ (α1a1 + α 2 a 2 ) = α1ϕ ( a1 ) + α 2ϕ ( a 2 ) , ϕ ( a1a 2 ) = ϕ ( a1 )ϕ ( a 2 ) . (1).
Теорема 3.1. Пусть V =< e1 ,..., en > - линейное пространство над полем k с фиксированным базисом. Тогда отображение ϕ → Aϕ задает изоморфизм k-алгебр End(V) и Mn(k). Доказательство. В силу теоремы 2.1. отображение ϕ → Aϕ является биекцией k-алгебр End(V) и Mn(k). Для проверки соотношений (1) заметим, что n-мерное пространство V изоморфно пространству строк (или столбцов) длины n . Поэтому, отождествляя вектора ⎛ x1 ⎞ ⎜ ⎟ x = ∑ xi ei и x = ⎜ M ⎟ , можем записать, что ϕ ( x ) = Aϕ x , где i =1 ⎜x ⎟ ⎝ n⎠ n
⎛
n
⎞
n
n
n
⎠
i =1
j =1
j =1
⎛
n
⎞
ϕ ( x) = ϕ ⎜ ∑ xi ei ⎟ = ∑ xi ∑ a ji e j =∑ ⎜ ∑ a ji xi ⎟e j , ⎝ i =1
⎝ i =1
⎠
⎛ x1 ⎞ ⎛ y1 ⎞ ⎜ ⎟ ⎜ ⎟ n Aϕ x = Aϕ ⎜ M ⎟ = ⎜ M ⎟ , y j = ∑ a ji xi i =1 ⎜x ⎟ ⎜ y ⎟ ⎝ n⎠ ⎝ n⎠
(здесь Aϕ = (a rs ) ). Тогда Aϕ +ψ ( x) = (ϕ + ψ )( x) = ϕ ( x) + ψ ( x) = Aϕ ( x) + Aψ ( x) , ∀x ∈ V ,
ϕ + ψ → Aϕ + Aψ .
Соответственно,
Aλϕ ( x ) = ( λϕ )( x ) = λ (ϕ ( x )) = λAϕ ( x ) , ∀x ∈ V , т.е. λϕ → λAϕ .
Наконец, ⎛ Aϕψ ( x) = (ϕψ )( x) = ϕ (ψ ( x)) = ϕ ⎜ ⎜ ⎝
n
⎞ b ji xi e j ⎟ = ⎟ i =1 ⎠ n
∑∑ j =1
n
n
∑∑
b ji xiϕ (e j ) =
j =1 i =1
n
n
∑∑ j =1 i =1
n
b ji xi
∑a
kj ek
k =1
n ⎛ n ⎛ n ⎞ ⎞ = ∑ ⎜ ∑ ⎜⎜ ∑ akj b ji ⎟⎟xi ⎟ek = Aϕ Aψ ( x ) , ∀x ∈ V (здесь Aψ = (brs ) ), т.е. ϕψ → Aϕ Aψ . ⎜ ⎟ k =1 ⎝ i =1 ⎝ j =1 ⎠ ⎠
4. Инвариантные подпространства и собственные векторы Определение 4.1. Подпространство U пространства V называется инвариантным относительно оператора ϕ ∈ End (V ) , если ϕU ⊆ U . Обозначим через φ |U ограничение линейного оператора φ
на подпространство U , а через Aφ | его матрицу. U
Если e1 ,..., em базис пространства U , то, дополняя его до базиса e1 ,..., em ,..., en пространства V , получим, что матрица Aϕ линейного
оператора ϕ в этом базисе имеет вид: ⎡A Aϕ = ⎢ u ⎣0
C⎤ , B ⎥⎦
где Au = Aϕ |
U
⎡a11 ...a1m ⎤ = ⎢ .......... ⎥ - матрица ограничения линейного операто⎢ ⎥ ⎢⎣a m1 ...a mm ⎥⎦
ра ϕ на подпространство U , а C, B - некоторые матрицы с коэффициентами из k размеров m × (n − m ) и (n − m ) × (n − m ) соответственно. Если у инвариантного подпространства U существует дополнительное инвариантное подпространство W , т.е V = U ⊕ W и ϕW ⊆ W , то матрица оператора ϕ ∈ End (V ) имеет вид: ⎡A Aϕ = ⎢ u ⎣0
0⎤ , Aw ⎥⎦
⎡a m+1,m+1 ...a m +1,n ⎤ ⎡a11 ...a1m ⎤ где Au = ⎢⎢.......... ⎥⎥ и Aw = ⎢⎢..................... ⎥⎥ - матрицы ограничения ли⎢⎣a n ,m +1 ...a n ,n ⎥⎦ ⎢⎣a m1 ...a mm ⎥⎦
нейного оператора ϕ на подпространства U и W . В этом случае говорят о прямой сумме операторов ϕ = ϕ u ⊕ ϕ w и прямой сумме матриц A = Au ⊕ Aw , соответствующих разложению V = U ⊕ W в прямую сумму подпространств. Матрица линейного оператора приобретает совсем простой вид (является диагональной), если найдутся n одномерных инвариантn
ных подпространств U i таких, что V = ⊕ U i , n = dim V . i =1
Такие подпространства выделяются специальным определением. Определение 4.2. Вектор v ∈ V , v ≠ 0 называется собственным вектором оператора ϕ ∈ End k (V ) , если для некоторого λ ∈ k выполняется соотношение ϕv = λv . Скаляр λ называют собственным значением оператора ϕ .
Зафиксируем некоторый базис e1 ...en пространства V . Пусть ⎡a11 ...a1n ⎤ n Aϕ = ⎢........... ⎥ матрица оператора ϕ в этом базисе, а v = ∑ xi ei - раз⎢ ⎥ i =1 ⎢⎣a n1 ...a nn ⎥⎦
ложение вектора v по этому базису. Тогда, используя отождествле⎛ x1 ⎞ ⎜ ⎟ ние вектора v = ∑ xi ei , со столбцами ⎜ M ⎟ , из его координат, условие i =1 ⎜x ⎟ ⎝ n⎠ n
ϕv = λ0 v, λ0 ∈ k можно переписать как Aϕ v = λ0 v или (Aϕ − λ0 E )v = 0 , где E - единичная матрица. В координатной форме последнее соотно-
шение приобретает вид: ⎛ ⎡a11 ...a1n ⎤ ⎡λ0 0...0⎤ ⎞⎛ x1 ⎞ ⎜⎢ ⎥ ⎟⎜ ⎟ ⎥ ⎢ ⎜ ⎢........... ⎥ − ⎢0λ0 ...0 ⎥ ⎟⎜M ⎟ = 0 ⎜ ⎢a ...a ⎥ ⎢00...λ ⎥ ⎟⎜ x ⎟ 0 ⎦ ⎠⎝ n ⎠ ⎝ ⎣ n1 nn ⎦ ⎣
Или
(a11 − λ0 )x1 + a12 x2 + ... + a1n xn = 0 a 21 x1 + (a 22 − λ0 )x 2 + ... + a 2 n x n = 0 KKKKKKKKKKKKKK a n1 x1 + a n 2 x 2 + ... + (a nn − λ0 )x n = 0
.
(1)
n
Так как v = ∑ xi ei ≠ 0 , т.е. система имеет ненулевое решение, то i =1
Aϕ − λ0 E = 0 . Уравнение
Aϕ − λ E = 0 называют характеристическим
уравнением оператора ϕ , а многочлен Aϕ − λE называется характеристическим многочленом. Полученный факт означает, что собственное значение любого линейного оператора является корнем его характеристического многочлена (или для краткости – характеристическим корнем).
Обратно, пусть λ0 - характеристический корень оператора ϕ , то есть
Aϕ − λ0 E = 0 . Тогда система (1) имеет ненулевое решение
n
v = ∑ xi ei ≠ 0 . Переходя к матричной форме, получим Aϕ v = λ0 v . i =1
Если e'1 ,..., e' n другой базис пространства V , а T - матрица перехода от первого базиса ко второму, то матрица Aϕ' линейного оператора ϕ в новом базисе, как было отмечено ранее, выражается через Aϕ
формулой:
Aϕ' = T −1 Aϕ T .
Тогда
Aϕ' − λE = T −1 Aϕ T − T −1λET = T −1 Aϕ − λE T = Aϕ − λE , то есть характери-
стические многочлены подобных матриц совпадают и приведенное выше определение характеристического многочлена линейного оператора корректно. Приведенные рассуждения доказывают следующее утверждение: Предложение 4.1. Пусть φ ∈ End k (V ) . Тогда корни характеристического многочлена оператора φ , принадлежащие полю k , и только они являются собственными значениями этого оператора. Заметим, что существование собственного вектора существенно зависит от основного поля k . Например, если k = R - поле действительных чисел, а ϕ - оператор поворота векторов из R 2 на угол α (α ≠ 0) , то в этом случае собственных векторов у ϕ нет. Напротив,
если k = C - поле комплексных чисел, то характеристический многочлен в этом случае обязательно имеет корень, принадлежащий C . Поэтому система (1) имеет хотя бы одно ненулевое решение, то есть оператор ϕ имеет собственный вектор. Рассмотрим одно достаточное условие, при выполнении которого матрица линейного оператора имеет диагональный вид.
Теорема 4.2. Если оператор ϕ ∈ End k (V ) имеет n = dim k V различных собственных значений, принадлежащих полю k , то существует базис пространства V , в котором матрица Aϕ этого оператора имеет вид: ⎡λ1 0...0 ⎤ Aϕ = ⎢0λ2 ...0 ⎥ . ⎢ ⎥ ⎣⎢00...λn ⎦⎥
Доказательство. Как видно из предыдущих рассуждений, каждому собственному значению отвечает хотя бы один ненулевой собственный вектор. Поэтому для доказательства теоремы достаточно проверить, что набор из собственных векторов, отвечающих различным собственным значениям, линейно независим. Доказательство этого факта проведем индукцией по количеству векторов t в этом наборе. При t=1 утверждение очевидно. Пусть оно справедливо при любых t ≤ s . Докажем его при t=s+1. Предположим противное, то есть для
некоторого набора собственных векторов v1 ,..., v s +1 с собственными значениями λ1 ,..., λ s +1 ∈ k , λi ≠ λ j , когда i ≠ j , существует нетривиальная линейная зависимость: α1v1 + ... + α s +1v s +1 = 0 . Применяя к этому соотношению оператор ϕ , получим α1λ1v1 + ... + α s +1λs +1v s +1 = 0 . Умножая первое соотношение на λs +1 и вычитая из него второе, получим α1 (λs +1 − λ1 )v1 + ... + α s (λs +1 − λs )v s = 0 . Из линейной независимости векто-
ров v1 ,..., v s и условий λs +1 − λi ≠ 0, i = 1,..., s следует равенство нулю α1 , α 2 ,..., α s . Тогда из соотношения α s +1 = 0 ,
s +1
∑α v i =1
i i
= 0 получается, что и
и мы приходим к противоречию с условием, что
(α1 ,..., α s+1 ) ≠ (0,...,0) .
5. Сопряженное (двойственное) пространство Обозначим через V * совокупность линейных функций на пространстве
V,
то
есть
используя
введенные
ранее
обозначения
V * = Homk (V , k ) . Введем операции сложения и умножения на кон-
станты для элементов из V * по правилу: ( f + g )(v ) = f (v ) + g (v ) ,
(λf )(v ) = λf (v ) ,
f , g ∈ V * , λ ∈ k , v ∈ V . Легко проверить, что относитель-
но введенных операций множество V * становится векторным пространством над полем k . Это пространство и называют сопряженным или двойственным к пространству V. Теорема 5.1. Пусть V конечномерное линейное пространство над полем k . Тогда dim k V * = dim k V . Доказательство. Обозначим через n размерность пространства V . Зафиксируем некоторый базис e1 ,..., en этого пространства. Т.к. любая линейная функция однозначно определяется своими значениями на базисе , то рассмотрим набор функций λi ∈ V * , i = 1,..., n , определенных условиями: ⎧1, i = j . ⎩0, i ≠ j
λi (e j ) = ⎨
Тогда любая функция λ ∈ V * выражается через функции λi , i = 1,..., n n
по формуле λ = ∑ λ (ei )λi . Действительно, для любого вектора i =1
n
v = ∑ ai ei ∈ V имеем i =1
⎛
n
⎞
n
⎠
i =1
λ (v ) = λ ⎜ ∑ ai ei ⎟ = ∑ ai λ (ei ) , ⎝ i =1
( ∑ λ (e j )λ j )(v ) = ∑ λ (e j )λ j (v ) = ∑ λ (e j )∑ ai λ j (ei ) = ∑ λ (e j )a j . n
n
n
n
n
j =1
j =1
j =1
i =1
j =1
∑ λ (e )λ n
То есть значения функций λ и
j =1
j
j
на любом векторе совпа-
дают, следовательно λ = ∑ λ (e j )λ j . n
j =1
Проверим линейную независимость функций λi , i = 1,..., n . Если n
∑a λ i =1
i
i
= 0 , то, вычисляя значение левой и правой части нашего ра-
венства на векторе e j , имеем a j = 0, j = 1,..., n . Итак, функции λi , i = 1,..., n образуют базис V * , то есть dim k V * = dim k V .
Само название пространства V * , двойственного к V и двойственных базисов e1 ,..., en , λ1 ,..., λn связано “двусторонней симметрией” между V и V * . Условимся временно вместо f (x ) писать ( f , x ) . Тем самым определено отображение V * × V → k , линейное по каждому аргументу:
(αf + βg , x ) = α ( f , x ) + β ( g , x ) ,
( f ,αx + βy ) = α ( f , x ) + β (g , y ), f , g ∈ V * , x, y ∈ V ,α , β ∈ k . Отображения V × W → k с указанными свойствами принято называть билинейными. Пользуясь двойственными базисами и представляя через них элементы x = α1e1 + ... + α n en , f = β1λ1 + ... + β n λn , легко вычислить значение f ( x) = ( f , x) = α 1 β 1 + ... + α n β n .
Рассмотрим одну конструкцию, связанную с линейными операторами в двойственном пространстве. При любом фиксированном элементе f ∈ V * и ϕ ∈ End k (V ) отображение x → ( f , ϕx ), ϕ ∈ End k (V ) снова является элементом из V * , то есть линейной функцией:
( f , ϕ (αx + βy )) = ( f , αϕ (x ) + βϕ ( y )) = α ( f , ϕ (x )) + β ( f , ϕ ( y )).
Раз это так, то мы можем определить линейную функцию ϕ * f на V полагая
(ϕ
*
f , x ) = ( f , ϕx ) .
(5.1)
def
Соответствие ϕ * : f → ϕ * f при переменной f определяет линейное отображение V * → V * : (ϕ * (αf + βg ), x) = (αf + β g , ϕ ( x)) = = α ( f , ϕ ( x)) + β ( g , ϕ ( x)) = α (ϕ * f , x) + β (ϕ * g , x) = = (αϕ * f + βϕ * g , x)
т.е. ϕ * (αf + βg ) = αϕ * ( f ) + βϕ * ( g ) . Так что ϕ * ∈ End k (V * ) . Определение 5.1. Линейный оператор ϕ * на V * , заданный соотношеним (5.1), называют оператором, сопряженным к ϕ ∈ End k (V ) . Непосредственно из определения, легко вывести следующие свойства
отображения
∗:ϕ → ϕ* :
0* = 0 ,
1* = 1 ,
(αϕ ) * = αϕ * ,
(ϕ + ψ )* = ϕ * + ψ * , (ϕψ )* = ψ *ϕ * , ϕ ,ψ ∈ End k (V ), α ∈ k .
Например,
последнее
соотношение
доказывается
так:
((ϕψ )* f , x ) = ( f , (ϕψ ) x ) = ( f , ϕ (ψx ) = (ϕ * f ,ψx ) = (ψ *ϕ * f , x ) .
Чтобы задать оператор ϕ * в матричном виде, естественно выбрать n
в V и V * двойственные базисы {ei } , {λi } . Если ϕe j = ∑ a kj ek , то k =1
n
n
k =1
k =1
(λi , ϕe j ) = ∑ a kj (λi ek ) = ∑ a kj δ ik = aij .
Положив
далее
n
ϕ ∗ λi = ∑ a ki∗ λk ,
будем
иметь
k =1
n
(ϕ ∗ λi , e j ) = ∑ a ki∗ (λk , e j ) = a ∗ji .
Т.к.
в
соответствии
с
(5.1)
k =1
(ϕ * λi , e j ) = (λi , ϕe j ) = aij , то a ∗ji = aij . Следовательно, верна
Теорема 5.2. Если в базисе {ei } пространства V линейный оператор ϕ имеет матрицу Aϕ = A = (aij ) , то в дуальном базисе {λi } про-
странства V * сопряженный оператор ϕ * имеет транспонированную матрицу At = Aϕ = A* = ( aij* ) . *
Содержательным примером использования понятия сопряженного оператора является следующее утверждение. Теорема 5.3. Всякий комплексный линейный оператор ϕ ∈ End C (V ) на конечномерном векторном пространстве V обладает инвариантной гиперплоскостью (или (n − 1) -мерным-инвариантным подпространством). Доказательство. Пусть dim C V = n . Для любой ненулевой линейной функции f на V , dim k Kerf = n − 1 . Из замечания к теореме 4.1 следует, что у комплексного линейного оператора обязательно есть хотя бы один собственный вектор. Пусть f ∈ V * собственный вектор оператора ϕ * , отвечающий собственному значению λ . Тогда, используя определяющее соотношение (5.1), для любого вектора x ∈ Kerf имеем: 0 = λ ( f , x ) = ( λf , x ) = (ϕ * f , x ) = ( f , ϕ ( x )) , т.е. ϕ ( x ) ∈ Kerf .
Это означает, что Kerf — инвариантное подпространство. Теорема доказана. 6. Триангулизация линейного оператора и теорема Гамильтона-Кэли Триангулизацией линейного оператора называют выбор такого базиса в пространстве, где действует этот оператор, что матрица оператора имеет треугольный вид. Т.е. все элементы матрицы, расположенные выше или ниже главной диагонали, нулевые. Теорема 6.1. Для любого линейного оператора ϕ ∈ EndC(V), действующего в конечномерном комплексном пространстве V существует базис, в котором матрица оператора Aφ имеет треугольный вид.
Доказательство. Доказательство проведем индукцией по размерности пространства V. Если dim C V = 1 , то утверждение тривиально. Предположим, что теорема справедлива для любого пространства V, размерность которого < n , и рассмотрим пространство V, dim C V = n . По теореме 5.3 в пространстве V существует подпространство U , dim c U = n − 1 и ϕU ⊆ U . По предположению индукции в подпространстве U существует базис v2 ,..., vn такой, что матрица ограничения линейного оператора ϕ на подпространстве U имеет вид: ⎡ a 22 ⎢a Aϕ = ⎢ 32 ⎢ M ⎢ ⎣a n 2
т.е. ϕvi = aii vi +
n
∑a
j =i +1
ji
0⎤ 0⎥ ⎥, M ⎥ ⎥ K a nn ⎦
0 K a 33 K M an3
v j , i = 2,..., n . Дополним базис подпространства n
U до базиса V : v1 , v2 ,..., vn . Т.к. ϕv1 = ∑ a j1v j , то матрица оператора Aϕ j =1
равна ⎡ a11 ⎢a ⎢ 21 ⎢ M ⎢ ⎣ a n1
0 a 22 M an 2
0⎤ 0⎥ ⎥. M ⎥ ⎥ K a nn ⎦ K K
Теорема доказана. Т.к. характеристический многочлен | A − λE | треугольной матрицы равен
n
∏ (a i =1
ii
− λ ) , то диагональные элементы aii этой матрицы сов-
падают с корнями характеристического многочлена. Обозначим через χ A ( λ ) характеристический многочлен матрицы A , а через χ ϕ (λ ) характеристический многочлен оператора ϕ .
Теорема 6.2. (Гамильтона-Кэли) Линейный оператор ϕ (и соответствующая ему матрица) аннулирует свой характеристический многочлен χ ϕ (λ ) , т.е. χ ϕ (ϕ ) = 0 (соответственно, χ A ( A) = 0 ). Доказательство. В силу теоремы 6.1 в пространстве V существует базис v1 ,..., vn , n = dim k V , что ϕvi = λi vi +
n
∑a
j =i +1
ji
v j , i = 1,..., n , где
λi , i = 1,..., n собственные значения оператора ϕ . Обозначим через Vi =< vi ,..., vn > , i = 1,..., n линейную оболочку соответствующих n − i + 1
вектора. Тогда (ϕ − λi E )Vi ⊆ Vi +1 , i = 1,..., n , где полагаем, Vn +1 = 0 , E тождественный оператор. n
Т.к. χ ϕ (λ ) = ∏ (λ − λi ) , то i =1
⎛
⎞
n
χϕ (ϕ )V = ⎜⎜ ∏ (ϕ − λi E ) ⎟⎟V = (ϕ − λn E )...(ϕ − λ1 E )V1 ⊂ ⊂ (ϕ − λn E )...(ϕ − λ2 E )V2 ⊆
⎝ i =1 ... ⊆ (ϕ − λn E )Vn = 0 .
⎠
Т.е. χ ϕ (ϕ ) = 0 . Теорема доказана. 7. Факторпространства и фактороператоры Для любого подпространства U в пространстве V дополнительное подпространство W такое, что V = U ⊕ W определяется неоднозначно. Но все они естественным образом изоморфны одному пространству, которое однозначно определяется по U и V . Множество x + U = {x + y, y ∈ U } называется смежным классом, вектор
x
-
представителем
0 ≠ z ∈ ( x + U ) ∩ ( x '+U ) ,
то
этого
смежного
z = x + y = x '+ y ' ,
класса.
y, y ' ∈ U .
Если
Поэтому
x = x '+ y '− y ∈ x'+U , т.е. x + U ⊂ x'+U . Аналогично x' = x + y − y '∈ x + U , т.е. x'+U ⊂ x + U . Следовательно, x + U = x '+U . Итак, два смежных класса
либо не пересекаются, либо совпадают. При фиксированном U по-
ложим x = x + U . Каждый вектор v из V принадлежит ровно одному смежному классу. Обозначим через V = V U множество всех классов {v + U , v ∈ V } . На этом множестве можно ввести структуру векторного
пространства
следующим
образом:
x+ y = x+ y
или
( x + U ) + ( y + U ) = ( x + y ) + U αx = αx или α ( x + U ) = αx + U , x, y ∈ V , α ∈ k .
Проверим корректность этих определений. Пусть x + U = x '+U , y + U = y '+U . Тогда ( x '+U ) + ( y '+U ) = ( x '+ y ' ) + U .
Но x' = x + u ,
y ' = y + u~ , т.е.
( x '+ y ' ) + U = x + y + u + u~ + U = x + y + U .
Аналогично: α ( x'+U ) = αx'+U = α ( x + u ) + U = αx + U . Выполнимость условий коммутативности и ассоциативности сложения в V , а также ассоциативности и дистрибутивности умножения легко следует из соответствующих условий для представителей в пространстве V . Нейтральным элементом в множестве V является класс 0 + U = U , а противоположным для x + U будет − x + U . Таким образом, все аксиомы векторного пространства в V выполнены. Это пространство и принято называть факторпространством пространства V по подпространству U . Пример. Пусть V = R 2 , U = R1 . Тогда каждый класс x + R1 есть совокупность векторов, концы которых лежат на прямой параллельной прямой U = R1 . Т.е.
Если W = R1 некоторое дополнительное подпространство в R 2 , то пересечение прямых x + U и W определяет вектор x w , который можно взять в качестве представителя класса x + U .
Тогда
соответствие x w → x w + U определяет изоморфизм между
подпространством W и факторпространством V U . Обобщением этого примера является следующая Теорема 7.1. Пусть V = U ⊕ W - прямая сумма подпространств U , W ⊂ V . Тогда отображение ϕ : w → w + U является изоморфизмом
между пространствами W и V U . Доказательство. Во-первых, отметим, что ϕ — линейное отображение. Действительно, ϕ (α 1 w1 + α 2 w2 ) = (α 1 w1 + α 2 w2 ) + U = (α 1 w1 + U ) + (α 2 w2 + U ) = = α 1 ( w1 + U ) + α 2 ( w2 + U ) = α 1ϕ ( w1 ) + α 2ϕ ( w2 ) .
Во-вторых, ϕ -сюрьекция. Ибо для любого класса v + U ∈ V U имеем: v + U = ( w + u ) + U = w + U , где w + u - разложение вектора v . Следовательно, ϕ ( w) = w + U = v + U . Наконец, если ϕ ( w) = 0 , то w + U = U , т.е. w ∈ U . Но W ∩ U = 0 и потому w = 0 . Это доказывает, что отображение ϕ инъективно. Линейность и биективность ϕ означает, что ϕ - изоморфизм. Следствие 7.1. dimV U = dimV − dimU . Доказательство. По теореме 7.4 главы 1 для подпространства U в пространстве V существует дополнительное подпространство W такое, что V = U ⊕ W . Тогда dim W = dim V − dim U . Но, по доказанной теореме, W ~= V U . Следовательно, dimV U = dim W = dimV − dim U .
Пусть ϕ ∈ End k V , U - инвариантное относительно оператора ϕ подпространство в V . Определим фактороператор ϕ ∈ End k V / U по формуле: ϕ (v + U ) = ϕv + U или ϕ (v ) = ϕ (v) . Если v ′ + U = v + U , то ϕ (v ′ + U ) = ϕv ′ + U .
Но
v′ = v + u ,
значит
ϕv ′ = ϕv + ϕu .
Поэтому,
ϕ (v ′ + U ) = ϕv + ϕu + U = ϕv + U . Это доказывает корректность опреде-
ления фактороператора. Зафиксируем в подпространстве U некоторый базис e1 ,..., em и дополним его до базиса e1 ,..., em ,..., en всего пространства. Тогда V = U ⊕ W , где U = e1 ,..., em , W = em +1 ,..., en . Так как W ≅ V / U , то
em +1 = em +1 + U ,..., en = en + U - базис факторпространства. Из определе-
ния фактороператора получаем: n
ϕ e j = ϕ e j = ∑ aij ei = i =1
n
∑a e
i = m +1
ij i
.
Следовательно, матрица Aϕ этого линейного оператора в базисе ⎡A e1 ,..., en представляется в виде: ⎢ 1 ⎣0
A3 ⎤ , где A1 - матрица ограничеA2 ⎥⎦
ния оператора ϕ на подпространство U , A2 - матрица фактороператора ϕ , действующего в факторпространстве V /U . Используя вид матрицы Aϕ , имеем: Aϕ − λE = A1 − λE1 A2 − λE 2 , где Ei - единичные матрицы размеров m × m и (n − m ) × (n − m ) . Таким образом, характеристический многочлен оператора ϕ равен произведению характеристического многочлена ограничения этого оператора на подпространство U и характеристического многочлена фактороператора. 8. Корневое подпространство
Определение 8.1. Множество векторов Vλ = {v ∈ V, (ϕ − λ )s v = 0 для некоторого s} называется корневым подпространством оператора ϕ ∈ End k (V ) , соответствующим характеристическому корню λ ∈ k .
(Здесь и ниже: ϕ − λ = ϕ − λ ⋅ E ) В том, что Vλ – подпространство нас убеждает легкая проверка. Если,
u, v ∈ Vλ ,
например,
(ϕ − λ )s u = 0 ,
причем
(ϕ − λ )r v = 0 ,
t = max(s, r ) , то (ϕ − λ ) (αu + βv ) = α (ϕ − λ ) u + β (ϕ − λ ) v = 0 . t
t
t
Откуда αu + βv ∈ Vλ при любых α , β ,∈ k . Заметим, что Vλ ≠ 0 , так как собственные векторы оператора ϕ , отвечающие собственному значению λ ∈ k , принадлежат Vλ . Если размерность пространства V равна n , то, как следует из определения Vλ , характеристический многочлен f ϕ |
Vλ
Vλ равен
ограничения ϕ |V оператора ϕ на подпространстве λ
(x − λ )r , r = dim k Vλ
≤ n . Действительно, если dim Vλ = 1 , то
Vλ = Vλ ,1 = {v, (ϕ − λ )v = 0} и характеристический многочлен f ϕ |Vλ ( x) ог-
раничения оператора ϕ на подпространство Vλ равен x − λ . Пусть для корневых пространств размерности меньшей чем r утверждение
справедливо
и
рассмотрим
корневое
подпространство
Vλ , dim Vλ = r . Так как подпространство собственных векторов Vλ ,1 ин-
вариантно относительно ϕ , то можно определить фактороператор ϕ на
факторпространстве
V = V / Vλ ,1 .
Тогда
подпространство
Vλ = Vλ / Vλ ,1 в V совпадает с корневым подпространством оператора
ϕ , отвечающим значению λ . Действительно, по определению
{
}
Vλ = {v = v + Vλ ,1 , v ∈ Vλ } = v , (ϕ − λ ) v = 0 . t
Поэтому Vλ ⊂ {v ∈ V | (ϕ − λ )t v = 0} = Vλ (ϕ ) . С другой стороны, из соотношения
(ϕ − λ )t v = 0
следует,
что
(ϕ − λ )t v ∈ Vλ ,1 ,
то
есть
(ϕ − λ )t +1 v = 0 , и значит
Vλ (ϕ ) ⊂ Vλ . Так как dim Vλ < dim Vλ = r , то, по
предположению индукции, характеристический многочлен f ϕ | ( x) Vλ
ограничения фактороператора ϕ на подпространство Vλ = Vλ (ϕ ) равен (x − λ )s , s = dim Vλ . Используя замечание из конца предыдущего параграфа,
имеем:
f ϕ |Vλ ( x) = fϕ |V ( x) λ
fφ| vλ (x)= (x − λ )q (x − λ )s , q = dim Vλ ,1 , s = dim Vλ / Vλ ,1 =r-q.
{
То
есть
}
f ϕ |V ( x ) = ( x − λ ) . В частности, Vλ = v ∈ V , (ϕ − λ ) v = 0 . . r
λ
r
Из доказанного результата следует, что Vλ={v ∈ V, (φ-λ)n (v)=0}, n=dimV. Действительно, {v ∈ V, (φ-λ)r (v)=0, r=dimVλ} ⊂ {v ∈ V, (φ-λ)n (v)=0, n=dimV} ⊆ Vλ . Теорема
8.1.
ϕ ∈ End C (V ), dim C V = n
Пусть
и
ni
s
f ϕ ( x ) = ∏ (x − λi ) , λi ≠ λ j , i ≠ j - характеристический многочлен опеi =1
ратора ϕ . Тогда V = Vλ ⊕ ... ⊕ Vλ - прямая сумма корневых подпроs
1
странств Vλ , причем dim C Vλ = ni . i
i
Доказательство. Ни один из множителей (x − λi ) не может быть
делителем
одновременно
всех
многочленов
f i ( x ) = ∏ (x − λ j ) j , i = 1,..., s , и поэтому HOD ( f1 ( x ),..., f s ( x )) = 1 . Найдутся, n
j ≠i
стало быть, многочлены h1 (x ),..., hs (x ) ∈ C [x] , для которых s
∑ f (x )h (x ) = 1 i =1
i
(8.1).
i
Подпространства Wi = f i (ϕ )hi (ϕ )V = { f i (ϕ )hi (ϕ )v, v ∈ V }, i = 1,..., s инвариантны
ϕ:
относительно
ϕWi = ϕf i (ϕ )hi (ϕ )V = f i (ϕ )hi (ϕ )ϕV ⊆ f i (ϕ )hi (ϕ )V = Wi .
(ϕ − λi E )n Wi i
Кроме
того,
= f ϕ (ϕ )hi (ϕ )V = 0 , так как по теореме Гамильтона-Кэли
f ϕ (ϕ )V = 0 . Поэтому
(8.2)
Wi ⊂ Vλi
Подставляя в соотношении (8.1) вместо переменной x оператор ϕ , получим: s
E = ∑ f i (ϕ )hi (ϕ ) . i =1
⎛
s
⎞
s
⎠
i =1
Тогда V = ⎜ ∑ f i (ϕ )hi (ϕ )⎟V = ∑ Wi . Ввиду включения ⎝ i =1
(8.2) имеем:
s
V = ∑Vλi . i =1
Обозначим через Vi = ∑Vλ . Если v ∈ Vλ ∩ Vi , то (ϕ − λi E )n v = 0 . А так i≠ j
j
i
⎛
⎞
как v = ∑ v j , v j ∈ Vλ и (ϕ − λ j E )n v j = 0 , то и ⎜⎜ ∏ (ϕ − λ j E )n ⎟⎟v = 0 . j
i≠ j
⎝
⎠
i≠ j
Из взаимной простоты многочленов (x − λi )n и c(x ) = ∏ (x − λ j )n слеi≠ j
a (x )
дует существование многочленов
и
b( x ) ,
для которых
a ( x )( x − λi ) + b( x )c( x ) = 1 . n
Используя это соотношение, имеем: v = a (ϕ )(ϕ − λi E ) v + b(ϕ )∏ (ϕ − λ j E ) v = 0 , то есть пространства Vλi и n
n
i≠ j
Vi = ∑ Vλ j не пересекаются. Значит, V = Vλ1 ⊕ ... ⊕ Vλs . j ≠i
В базисе, являющемся объединением базисов пространств Vλ , опеi
ратор ϕ имеет матрицу ⎡ A1 ⎢ Aϕ = ⎢ ⎢ ⎢ ⎣0
0⎤ ⎥ ⎥, ⎥ O ⎥ As ⎦
A2
где Ai - матрица порядка ni′ = dim Vλ с единственным собственным i
значением λi и характеристическим многочленом f A (x ) = (x − λi )n′ . i
i
s
ni′
Поэтому f ϕ (x ) = f A (x ) = ∏ (x − λi ) . С другой стороны, по условию ϕ
s
i =1
ni
f ϕ ( x ) = ∏ ( x − λi ) . Следовательно,
ni′ = ni , i = 1,..., s .
i =1
Итак, мы доказали, что пространство V есть прямая сумма корневых подпространств Vλ оператора ϕ и размерность каждого корнеi
вого подпространства Vλ равна кратности характеристического i
корня λi . 9. Жорданова нормальная форма Определение 9.1. Матрица, имеющая вид: ⎡ A1 ⎢ A=⎢ ⎢ ⎢ ⎣
A2 0
⎡λi 0 0 ⎢1 λ 0 ⎤ i ⎢ ⎥ 0 ⎢ 0 1 λi ⎥ , где Ai = ⎢ ⎥ O L L ⎢ ⎥ ⎢0 0 0 As ⎦ ⎢ ⎣0 0 0
0⎤ 0⎥ ⎥ L 0 0⎥ ⎥ L L ⎥ L λi 0 ⎥ ⎥ L 1 λi ⎦ L L
0 0
или Ai = [λi ] , называется жордановой. Если A = Aϕ - матрица некоторого линейного оператора ϕ , то базис в котором его матрица Aϕ имеет вышеприведенный вид, называется жордановым базисом. Теорема 9.1. Пусть ϕ ∈ End k (V ) , и все его характеристические корни λ1 ,..., λs принадлежат полю
k
. Тогда в пространстве V суще-
ствует жорданов базис оператора ϕ , т.е. базис, в котором его матрица Aϕ - жорданова. Доказательство. Теорема 8.1. позволяет свести ситуацию к рассмотрению оператора с единственным собственным значением, то есть к корневому пространству. Заменяя оператор ϕ на ϕ − λi E ,
получим, что достаточно рассмотреть корневое пространство, отвечающее нулевому собственному значению. Если жорданов базис e1 ,..., en уже построен, то действие оператора ϕ (в силу определения 9.1) имеет вид: ϕe1 = e2 ϕe 2 = e3
ϕeκ +1 = eκ + 2 ϕe κ + 2 = e κ + 3
K ϕeκ −1 = eκ ϕe κ = 0
K ϕeκ + s −1 = eκ + s ϕe κ + s = 0
ϕer +1 = er + 2 ϕe r + 2 = e r + 3
K K K K K
K
ϕer +t −1 = en ϕe n = 0
То есть базис разбивается на несколько групп, в каждой из которых оператор ϕ переводит вектор ei кроме последнего в следующий вектор ei +1 , а последний вектор каждой группы в нулевой. Изобразим эту ситуацию следующей диаграммой: •
•
•
•
↓ ↓ L
D:
•
↓ ↓
↓ L
M
M
M
↓ ↓
↓
• • •
•
• •
.
• • •
•
↓ •
Точки каждого столбика этой диаграммы обозначают вектора em , ϕem ,..., ϕ κ m −1em , а стрелки показывают действие оператора ϕ на со-
ответствующих векторах. (Все вектора из нижнего этажа диаграммы переводятся в нулевой вектор). Доказательство теоремы будем вести индукцией, по размерности пространства V. Если dim k V = 1 , то V = e1 , ϕe1 = αe1 . Но V - корневое пространство, отвечающее нулевому собственному значению, то есть ϕ κ e1 = 0 , для некоторого κ . Значит α = 0 и Aϕ = [0] , то есть e1 - жорданов базис. Пусть для любого корневого пространства размерности меньше n утверждение справедливо. Рассмотрим пространство V, dim k V = n и для любого v ∈ V , ϕ t v = 0 для некоторого t . Обозначим через V0 под-
пространство собственных векторов пространства V , то есть V0 = {v ∈ V , ϕv = 0}. Так как ϕV0 ⊆ V0 , то можно определить факторопе-
ратор ϕ , действующий на факторпространстве V = V / V0 . Для любого вектора v из факторпространства V выполняется соотношение ϕ t v = 0 , для некоторого t , а dim k V < dim k V . Поэтому, по предполо-
жению индукции в пространстве V существует жорданов базис, которому отвечает диаграмма D .
Пусть e1,..., em ,..., e p вектора, отвечающие верхним точкам каждого столбца диаграммы D , а e1,..., em ,..., e p - представители соответствующих
классов.
ϕ t +1e1 = 0,..., ϕ t 1
m +1
Т.к.
em = 0,..., ϕ 2 e p = 0
ϕ t e1 = 0,..., ϕ t em = 0,..., ϕ e p = 0 , 1
m
то
в силу принадлежности векторов
ϕ t e1 ,..., ϕ t em ,..., ϕe p подпространству V0 . Обозначим через U линей1
m
ную оболочку векторов ϕ t e1 ,..., ϕ t em ,..., ϕe p , а через W подпростран1
m
ство в V0 дополнительное к U , т.е. V0 = U ⊕ W . Пусть eα , eα +1 ,..., eα + s базис подпространства W . Обозначим через D диаграмму:
Если мы проверим, что вектора, отвечающие точкам этой диаграммы, образуют базис пространства V , то по построению это будет жорданов базис. Пусть v ∈ V , тогда v ∈ V = V V и, следовательно, 0 p t j −1
p t j −1
v = ∑∑ λij ϕ e j ,λij ∈ k . Тогда v − ∑∑ λij ϕ i e j ∈ V0 , т.е. i
j =1 i = 0
j =1 i = 0
p t j −1
p
j =1 i =0
j =1
p
s
tj
s
v − ∑∑ λijϕ i e j = ∑ λijϕ j e j + ∑ γ q eα + q , γ q ∈ k или v = ∑∑ λijϕ i e j + ∑ γ q eα + q . t
q =0
j =1 i = 0
q =0
Итак, каждый вектор из V является линейной комбинацией векторов, отвечающих точкам диаграммы D. Для
доказательства
линейной
независимости
векторов
{ϕ i e j , j = 1,..., p, i = 0,..., t j ; eα + q , q = 0,..., s} проверим вначале независимость
векторов
нижнего
этажа
диаграммы
D,
т.е.
t
{ϕ j e j , j = 1,..., p; eα + q , q = 0,..., s} .
Т.к. V0 = U ⊕ W , а {eα +t , t = 0,..., s} базис пространства W , то достаточно проверить линейную независимость образующих пространства t
U , т.е. {ϕ j e j , j = 1,..., p j } .
Предположим, что существует набор ( β 1 ,..., β p ) , β i ∈ k такой что p
∑β ϕ j =1
j
tj
p
e j = 0 . По построению каждое t j ≥ 1 . Поэтому ϕ ∑ β jϕ j =1
t j −1
ej = 0 ,
т.е.
p
∑ β jϕ j =1
t j −1
e j ∈ U . Значит
p
∑β ϕ j =1
t j −1
j
e j = 0 . Но вектора ϕ
t j −1
e j , j = 1,..., p
входят в базис факторпространства V (им отвечают точки нижнего этажа диаграммы D ), следовательно, все коэффициенты β j равны нулю, т.е. вектора ϕ t e j , j = 1,..., p линейно независимы. j
Пусть вектора, отвечающие точкам диаграммы D, линейно зависиp
tj
s
∑∑ λijϕ i e j + ∑ γ q eα + q = 0 . Обозначим через r номер самого верх-
мы:
j =1 i = 0
q =0
него этажа диаграммы D , перед векторами которого имеются ненулевые коэффициенты. Применив к соотношению линейной зависимости оператор ϕ r −1 , получим
p
∑λ j =1
t j − r +1, j
tj
ϕ e j = 0 , в котором по пред-
положению не все коэффициенты равны нулю. Но это противоречит линейной независимости векторов нижнего этажа. Теорема доказана. Пример. Найти жорданову нормальную форму оператора ϕ , в пространстве V =< e1 , e2 , e3 , e4 > , заданного матрицей: ⎡0 ⎢− 1 Aϕ = ⎢ ⎢− 1 ⎢ ⎣− 1
1 − 1 1⎤ 2 − 1 1⎥ ⎥ 1 1 0⎥ ⎥ 1 0 1⎦
Здесь и далее жордановой нормальной формы оператора ϕ будем называть матрицу этого оператора в жордановом базисе. −λ Aϕ − λE = − 1 −1 −1 −λ = −1 −1 0
−1 −λ 1 1 2 − λ −1 1 = −1 −1 1 1− λ 0 1 0 1− λ 0
1 0 1 −λ 2−λ 0 1 = (1 − λ ) − 1 1 1− λ 0 −1 0 0 1− λ
−1 1 1 2 − λ −1 1 = 1 1− λ 0 0 λ −1 1− λ
1 0 2−λ 0 = = (1 − λ ) 2 − λ −1 1 1− λ
1 = (λ − 1) 4 2−λ
Характеристические корни λ1 = λ2 = λ3 = λ4 = 1 . Собственные вектора находятся из системы: ⎧− x1 + x2 − x3 + x4 = 0 ⎨ ⎩− x1 + x2 = 0
Пространство собственных векторов U = {(ϕ − 1)v = 0} имеет базис: f1 = (1,1,0,0), f 2 = (0,0,1,1)
Добавляя к векторам
вектора
f1 , f 2
e1 = (1,0,0,0) ,
e2 = (0,1,0,0) ,
e3 = (0,0,1,0) , e4 = (0,0,0,1) , находим, что базис пространства, содержа-
щий f1 , f 2 , состоит из векторов f1 , f 2 , e1 , e3 , а e2 = f1 − e1 , e4 = f 2 − e3 . Обозначив e1 через f 3 , а e3 через f 4 , имеем ϕf1 = f1 , ϕf 2 = f 2 , ϕf 3 = −e2 − e3 − e4 = − f1 − f 2 + f 3 , ϕf 4 = −e1 − e2 + e3 = − f 1 + f 4 .
Базис факторпространства V = V U состоит из векторов f 3 , f 4 и мат⎡1 0 ⎤
рица фактороператора ϕ в этом базисе имеет вид: ⎢ ⎥ . Т.е. f 3 , f 4 ⎣0 1⎦ жорданов базис с диаграммой D : f 3 • • f 4 для оператора ϕ − E . Тогда диаграмма D для оператора ϕ − E имеет вид: f3 ↓ (ϕ − E ) f 3
f4 ↓ (ϕ − E ) f 4
В соответствии с диаграммой D жорданова форма оператора ϕ − E равна ⎡0 ⎢1 ⎢ ⎢0 ⎢ ⎣0
а оператора ϕ :
0 0 0 0
0 0 0 1
0⎤ 0⎥ ⎥, 0⎥ ⎥ 0⎦
⎡1 ⎢1 Bϕ = ⎢ ⎢0 ⎢ ⎣0
0 1 0 0
0 0 1 1
0⎤ 0⎥ ⎥. 0⎥ ⎥ 1⎦
Кроме того, мы получили матрицу перехода T к жорданову базису, которая осуществляет подобие матриц Aϕ и Bϕ , т.е. Bϕ = T −1 Aϕ T , ⎡1 ⎢0 T =⎢ ⎢0 ⎢ ⎣0
− 1 0 − 1⎤ − 1 0 − 1⎥ ⎥. −1 1 0 ⎥ ⎥ −1 0 0 ⎦
Вопрос единственности жордановой формы решается с помощью формулы для количества жордановых клеток данного размера. Теорема 9.2. Пусть iκ (λ j ) - количество жордановых клеток размера κ , отвечающих собственному значению λ j матрицы A . Тогда iκ (λ j ) = rκ −1 (λ j ) − 2rκ (λ j ) + rκ +1 (λ j ) ,
κ ≥ 1,
где
rt ( λ j )
ранг матрицы
( A − λ j E ) t , а r0 ( λ j ) = n , n - размер матрицы A .
Доказательство. Обозначим через J жорданову нормальную форму оператора ϕ ∈ End k (V ) , заданного в некотором базисе матрицей A . Пусть T матрица перехода от первоначального базиса к жорданову. Тогда J = T −1 AT и для любого λ из k J − λE = T −1 ( A − λE )T . Более того ( J − λE ) s = T −1 ( A − λE ) s T . Поэтому
ранги матриц ( A − λE ) s и ( J − λE ) s совпадают, т.е. формулу для iκ (λ j ) достаточно проверить для случая, когда rt (λ j ) ранг матрицы (J − λ j E)t .
⎡ B1 ⎢ Если B = ⎢ ⎢ ⎢ ⎣0
0⎤ ⎥ ⎥ блочнодиагональная матрица, то, очеO ⎥ ⎥ Bp ⎦
B2
p
видно, rB = ∑ rBi (Здесь и далее rC - ранг матрицы C ). Следоваi =1
тельно, для вычисления ранга матрицы ( J − λ j E ) t достаточно вычислить ранг отдельного блока размера m :
⎡λs − λ j ⎢ 1 J κ (λ − λ ) = ⎢ ⎢ L ⎢ ⎣ 0 m
s
j
L 0
κ
⎤ ⎥ ⎥ . L L L ⎥ ⎥ L 1 λs − λ j ⎦
0 L λs − λ j L
0 0
0 0
Если λs − λ j ≠ 0 , то rJ mκ (λ s − λ j ) = m для любого κ , так как
1)
J mκ (λ s − λ j ) ≠ 0 .
2)
Пусть
λs = λ j .
1 ≤ κ ≤ m − 1, J mκ (0) = 0, κ ≥ m ,
⎡0 ⎢L ⎢ ⎢0 κ J m (0 ) = ⎢ ⎢1 ⎢ ⎢ ⎢⎣ 0
Тогда
0 L L L 0⎤ O L L L L⎥⎥ L 0 L L 0⎥ ⎥, O O ⎥ ⎥ O O O ⎥ 1 0 L 0 ⎥⎦
где единицы стоят на к-той побочной диаго-
нали и их количество равно m-k, κ = 1,..., m − 1 . Следовательно, ⎧m − κ ,1 ≤ κ ≤ m − 1 rJ mκ (0 ) = ⎨ . ⎩0, κ ≥ m
В рекуррентной форме последнее соотношение примет вид: rJ mκ (0 ) = rJ mκ −1 (0) − 1,1 ≤ κ ≤ m . Поэтому при переходе от
(J − λ E )
κ −1
j
к
(J − λ E )
ранг уменьшается на количество клеток, отвечающих зна-
чению
λj ,
κ
j
размеры
которых
не
меньше
κ,
то
есть
rκ (λ j ) = rκ −1 (λ j ) − iκ (λ j ) − iκ +1 (λ j ) − ... . В частности, при κ = 1 ранг J − λ j E
меньше размера матрицы J на величину, равную количеству всех клеток, отвечающих собственному значению λ j . Аналогично rκ +1 (λ j ) = rκ (λ j ) − iκ +1 (λ j ) − iκ + 2 (λ j ) − ... . Вычитая из первого соотношения второе, получим: rκ (λ j ) − rκ +1 (λ j ) = rκ −1 (λ j ) − rκ (λ j ) − iκ (λ j ). .
Или iκ (λ j ) = rκ −1 (λ j ) − 2rκ (λ j ) + rκ +1 (λ j ) . Следствие 9.3. Жорданова нормальная форма с точностью до перестановки жордановых клеток определяется однозначно. Пример. Пусть A матрица из предыдущего примера. Ее характеристические корни λ1 = λ2 = λ3 = λ4 = 1 . Вычисляем степени матрицы A–E: ⎡− 1 ⎢− 1 A−E =⎢ ⎢− 1 ⎢ ⎣− 1
Поэтому
1 − 1 1⎤ 1 − 1 1⎥⎥ , 1 0 0⎥ ⎥ 1 0 0⎦
( A − E )2
⎡0 ⎢0 =⎢ ⎢0 ⎢ ⎣0
0 0 0 0
0 0 0 0
0⎤ 0⎥⎥ κ = ( A − E ) ,κ ≥ 2 . 0⎥ ⎥ 0⎦
r1 (1) = 2, r2 (1) = 0, rκ (1) = 0, κ ≥ 2.
i1 (1) = 4 − 2r1 (1) + r2 (1) = 0 ,
i2 (1) = r1 (1) − 2r2 (1) + r3 (1) = 2 .
Следовательно, Таким
образом,
жорданова форма состоит из двух жордановых клеток размера 2. ⎡1 ⎢1 J =⎢ ⎢0 ⎢ ⎣0
0 1 0 0
0 0 1 1
0⎤ 0⎥ ⎥. 0⎥ ⎥ 1⎦
10. Минимальный многочлен матрицы Определение 10.1. Многочлен f (x ) ∈ k [x ] называется минимальным многочленом матрицы A = (aij ), aij ∈ k , если 1) f(A) =0, то есть многочлен f(x) аннулируется матрицей A,
2) среди всех многочленов, удовлетворяющих условию 1, степень f(x) - минимальна, 3) старший коэффициент многочлена f(x) равен 1. Предложение 10.1. Любой многочлен, аннулируемый матрицей A , делится на минимальный многочлен этой матрицы. Доказательство. Пусть μ A (x ) — минимальный многочлен матрицы A , а f (x ) ∈ k [x ] такой, что f ( A) = 0 . Тогда существуют многочлены q(x ), r (x ) ∈ k [x ], что f (x ) = q(x )μ A (x ) + r (x ) , причем либо r (x ) = 0 , либо deg r (x ) < deg μ A (x ) . Предположим,
r (x ) ≠ 0 .
что
f ( A) = q( A)μ A ( A) + r ( A) .
Тогда
f ( A) = μ A ( A) = 0 , то есть r ( A) = 0 . Так как
Но
deg r ( x ) < deg μ A ( x ) , то полу-
чаем противоречие с минимальностью степени μA(x) . Следовательно, r (x ) = 0 и f ( x ) делится на μA(x). Следствие 10.1. Минимальный многочлен определен однозначно. Доказательство. Пусть μ1 (x ) и μ 2 (x ) два минимальных многочлена матрицы A. В силу п.2 определения 10.1 deg μ1 (x ) = deg μ 2 (x ) . Тогда из предложения 10.1 вытекает, что μ1 (x ) = cμ 2 (x ), c ≠ 0, c ∈ k . Наконец, сравнивая старшие коэффициенты в последнем равенстве, получим c=1. Лемма 10.2. Минимальные многочлены подобных матриц совпадают. Доказательство. Пусть A и B две подобные матрицы, то есть m
n
A = T BT , T ≠ 0 . Обозначим через μ A (x ) = ∑ ai x и μ B ( x ) = ∑ bi x i - ми−1
i
i =0
нимальные многочлены этих матриц. Тогда n
(
)
⎛
n
⎞
μ B ( A) = ∑ bi T −1 B iT = T −1 ⎜⎜ ∑ bi B i ⎟⎟T = T −1μ B (B )T = 0 . i =0
⎝ i =0
⎠
i =0
В
силу
предложения
10.1
μ B ( x ) = q( x )μ A ( x ) .
Аналогично,
μ A (x ) = p ( x )μ B ( x ) . То есть μ B (x ) = q(x ) p (x )μ B ( x ) . Отсюда q(x ) p( x ) ∈ k , а
из сравнения старших коэффициентов следует, что q(x ) = p (x ) = 1 . Итак, μ A (x ) = μ B (x ) . ⎡ A1 ⎢ Лемма 10.3. Если A = ⎢ ⎢ ⎢ ⎣0
ца,
то
минимальный
{
A2
0⎤ ⎥ ⎥ блочнодиагональная матри⎥ O ⎥ As ⎦
многочлен
μ A (x )
матрицы
A
равен
}
HOK μ A1 ( x ),..., μ As ( x ) , μ Ai ( x ) − минимальный многочлен матрицы Ai .
Доказательство. Если f (x ) ∈ k [x ] - произвольный многочлен, а A - блочнодиагональная матрица, указанная в лемме, то ⎡ f ( A1 ) ⎢ f ( A) = ⎢ ⎢ ⎣ 0
f ( A2 )
O
0 ⎤ ⎥ ⎥. ⎥ f ( As )⎦
Поэтому μ A ( Ai ) = 0, i = 1,..., s . По предложению 10.1 минимальный многочлен μ A (x ) матрицы A делится на каждый минимальный многочлен μ A (x ) . Следовательно, он делится на их наименьшее общее i
кратное, обозначаемое в дальнейшем m(x ) . С другой стороны, ⎡m( A1 ) ⎤ ⎢ ⎥ = 0. m( Ai ) = 0 , так как μ Ai ( x ) | m( x ) . Значит m( A) = O ⎢ ⎥ m( As )⎥⎦ ⎢⎣
Опять, используя предложение 10.1, имеем: μ A (x ) | m(x ) . Рассуждая далее как в конце леммы 10.2, получим, что μ A (x ) = m(x ) .
Лемма 10.4. Если
⎡ λ 0 0 L 0 0⎤ ⎢ 1 λ 0 L 0 0⎥ A = ⎢L L L ⎥, ⎢⎣ 0 0 0 L 1 λ ⎥⎦
то минимальный много-
член μA(x) равен (x − λ )m , где m – размер матрицы A. Доказательство. Как следует из вычислений в доказательстве теоремы 9.2 ( A − λE )m = 0 . Поэтому μ A (x ) | (x − λ )m . Но все делители многочлена (x − λ )m имеют вид (x − λ )k ,1 ≤ k ≤ m . Если μ A (x ) = (x − λ )t , t < m , то ( A − λE )t = 0 . Это противоречит виду матрицы
( A − λE )t , которая равна ⎡0 ⎢L ⎢0 ⎢1 ⎢L ⎢0 ⎣
0⎤ L⎥ 0 0⎥. 0 0⎥ L⎥ 1 0 ⎥⎦
0 L L 0 L 0 L L 0 L
0
Следовательно, μ A (x ) = (x − λ )m . Теорема 10.5. Минимальный многочлен μA(x) матрицы A равен s
∏ (x − λ ) i
mi
, где λ1 ,..., λs все различные собственные значения матри-
i =1
цы A, а mi – максимальный размер жордановой клетки, отвечающей собственному значению λi. Доказательство. В силу леммы 10.2 минимальный многочлен μA(x) матрицы A совпадает с минимальным многочленом μJ(x) ⎡ J1 ⎤ ⎥, J =⎢ O ⎢ J s ⎥⎦ ⎣
жордановой нормальной формы этой матрицы. Пусть
где J t - матрица, состоящая из блоков, отвечающих собственному значению λt . Тогда по лемме 10.3 μ J (x ) есть наименьшее общее t
кратное минимальных многочленов μ i (x ) = (x − λt )i для каждого жорданова блока размерности i, то есть μ J (x ) = (x − λt )m , где mt t
t
размер максимального из таких блоков.
Так как
(
mi
) = ∏ (x − λ ) s
HOK (x − λ1 ) ,..., (x − λs ) m1
ms
i
, когда все λi различны,
i =1
s
то μ J (x ) = ∏ (x − λi )m . i
i =1
Пример. 1 − 1 1⎤ 2 − 1 1⎥ . 1 1 0⎥ 1 0 1⎥⎦
⎡0 A = ⎢⎢− 1 −1 ⎢⎣− 1
Ее жорданова форма, как следует из примера параграфа 9, равна ⎡1 ⎢1 ⎢0 ⎢⎣0
0 1 0 0
0 0 1 1
0⎤ 0⎥ . 0⎥ 1⎥⎦
Следовательно, μ A (x ) = (x − 1)2 . Действительно, как следует из вычислений того же примера, (A – E)2=0 и легко заметить, что матрица A не может аннулировать многочлен первой степени, так как не является скалярной.
Глава
3.
Векторные
пространства
со
скалярным
произведением 1. Евклидовы пространства Как известно, в вещественном трехмерном пространстве скалярное произведение двух векторов определяется как произведение длин этих векторов на косинус угла между ними. Для вещественного пространства произвольной размерности, напротив, длину вектора и косинус угла между векторами определяют с помощью скалярного произведения. Рассмотрим эту процедуру подробно.
Определение 3.1.
Скалярным произведением на вещественном
пространстве V называют отображение (· | ·) из декартова квадрата V×V в поле действительных чисел R, обладающее следующими свойствами: 1.
(x | y) = (y | x), x,y
2.
(α1 x1 + α 2 x2 | y ) = α1 (x1 | y ) + α 2 (x2 | y ), α1 ,α 2 ∈ R, x1 , x2 , y ∈V
3.
(x | x ) > 0, если
∈V
x ≠ 0, x ∈V
Примеры: 1) Пусть V — n-мерное векторное пространство над R. Выберем некоторый базис
e1 ,..., en
из V. Пусть x= ∑i =1 xi ei , n
y=
∑
n
i =1
yi ei
- любые
два вектора из V. Определим скалярное произведение x и y следующей формулой: (x | y) = ∑i =1 xi yi . Тогда n
(y | x) = ∑i =1 yi xi = ∑i =1 xi yi =(x | y), n
n
(α ′x'+α ′′x′′ | y ) = ∑ ( α ′xi′
∑
если
x≠0.
n x2 i =1 i
> 0,
n
∑
+ α ′′xi′′ ) yi = α ′
i =1
x) =
n
так как все
i =1
xi2 ≥ 0
n
∑ x′′y
xi′ yi + α ′′
i i
= α ′( x′ | y ) + α ′′(x′′ | y ) ,
(x |
i =1
и существует i0, для которого
xi0 ≠ 0 ,
2) Пусть V=C[a,b] – пространство непрерывных функций на интервале [a,b]. Для любой пары функций f,g ∈ C[a,b] определим отображение ( f
| g)=
b
∫ f (x )g (x )dx . Легко видеть, что свойства 2, 3 скалярa
ного произведения вытекают из соответствующих свойств интеграла, а свойство 1 следует из коммутативности произведения функций. Вещественное линейное пространство, снабженное скалярным произведением, будем называть евклидовым пространством. Введем понятие длины вектора.
Определение 3.2. Длиной вектора x из евклидова пространства V будем называть положительное действительное число
(x | x ) ,
которое обозначим ||x||. λx = λ x , λ ∈ R . Для проверки неравенства
Легко видеть, что
x + y ≤ x + y , которое по аналогии с трехмерным случаем называ-
ется неравенством треугольника докажем следующую теорему. Теорема 3.1.(неравенство Коши-Буняковского) Для любых двух векторов x,y из евклидова пространства V справедливо неравенство (x | y ) ≤ x y . Доказательство. Для любого λ ∈ R : (λx − y | λx − y ) ≥ 0 . Следовательно, λ2 (x | x ) − 2λ (x | y ) + ( y | y ) ≥ 0 . Но квадратный трехчлен принимает только неотрицательные значения, если и только если его дискриминант D = (x | y )2 − (x | x )( y | y ) ≤ 0 . Последнее неравенство равносильно сформулированной теореме. Заметим, что если (x | y ) =
x y
, то D=0 и существует единственное
вещественное λ0, для которого (λ0 x − y | λ0 x − y ) = 0 , то есть вектора x и y коллинеарны. Обратное также справедливо. То есть неравенство Коши-Буняковского для неколлинеарных векторов строгое, а для коллинеарных превращается в равенство. Следствие 3.1.
x+ y ≤ x + y
Доказательство. x + y = (x + y | x + y ) = (x | x ) + 2(x | y ) + ( y | y ) ≤ 2 2 2 ≤ x +2 x ⋅ y + y =(x + y ) 2
Извлекая корень из левой и правой частей неравенства, имеем утверждение следствия. Перепишем неравенство Коши-Буняковского следующим образом: −1 ≤
(x | y ) ≤ 1 . x⋅ y
Тогда, обозначая (x | y ) через cos ϕ , будем называть ϕ углом между x⋅ y
векторами x и y, считая, что 0 ≤ ϕ ≤ π . Определение 3.3. Вектора x и y евклидова пространства V называются ортогональными, если (x | y ) = 0 , то есть угол φ между x и y равен π . 2
2. Процесс ортогонализации При изучении метрических свойств трехмерного пространства обычно выбирают базис из трех взаимно ортогональных векторов единичной длины. Покажем, что в произвольном n-мерном евклидовом пространстве также существует аналогичный базис. Теорема 2.1. Пусть U = a1 ,..., a m - ненулевое подпространство в евклидовом пространстве V. Тогда существуют ненулевые вектора b1 ,..., bs , s ≤ m такие, что (bi | b j ) = 0, 1 ≤ i, j ≤ s, i ≠ j и U = b1 ,..., bs .
Доказательство. Так как U ≠ 0 , то один из образующих ai ≠ 0 . Меняя нумерацию, можно считать, что это a1 . В качестве вектора b1 возьмем a1 . Следующий вектор b2 ищем в виде: b2 = a 2 + λ21b1 . Из
условия (b2 | b1 ) = 0 получим: (a 2 | b1 ) + λ21 (b1 | b1 ) = 0 . Так как b1 ≠ 0 , то
(b1 | b1 ) ≠ 0 , то есть
λ21 = −
(a2 | b1 ) . Если b ≠ 0 , то b ищем в виде 2 3 (b1 | b1 )
b3 = a3 + λ31b1 + λ32b2 . Если b2 = 0 , то b3 ищем в виде b3 = a3 + λ31b1 . Пусть
уже найдены ненулевые взаимно ортогональные вектора b1 , br ,..., bt за k − 1 шаг. Тогда bk ищем в виде
bk = a k + λk 1b1 + λkr br + ... + λkt bt ,1 < r < ... < t . Из условий
(b
k
| b j ) = 0, j ∈ {1, r,..., t} находим
λkj = −
(a (b
k j
). |b ) | bj j
Подставляя эти значения в выражение для bk , вычисляем очередной вектор. Если он оказался нулевым, то при дальнейших построениях его не учитываем. Через m шагов мы получим s ≤ m ненулевых, взаимно ортогональных векторов. Обозначим их b1′, b2′ ,..., bs′ . Так как ak = bk − λk1b1 − λkr br − ... − λkt bt , то U ⊆ b1′,..., bs′ . С другой стороны, если уже известно, что b1 , br ,..., bt ∈ U , то из формулы для bk следует, что и bk ∈ U . Итак, U = b1′,..., bs′ . Заметим, что вектора b1′,..., bs′ образуют базис подпространства U . Действительно, если
s
∑ α b' = 0 i
i
для не-
i =1
которых α i ∈ R, i = 1,..., s , то, умножая последнее соотношение на b′j , получим: α j (b′j | b′j ) = 0 , то есть α j = 0, j = 1,..., s . Процедура, использованная для доказательства теоремы 2.1 называется процессом ортогонализации. Пример. Пусть V=R4, скалярное произведение векторов задается как в примере 1, параграфа 1, т.е.
4
( x | y ) = ∑ xi y i ,
x.y ∈ R4.
i =1
Подпространство
U
натягивается
на
вектора:
a1=(1,0,1,0),
a2=(2,1,0,1), a3=(3,1,1,1). В качестве первого вектора ортогональной системы возьмем b1 = a1 = (1,0,1,0) . Вектор b2 ищем в виде a 2 + λ 21b1 . Условие (b2 | b1 ) = 0
дает: λ21 = −
Тогда
(a2 | b1 ) = −1 . (b1 | b1 )
b2 = (2,1,0,1) − (1,0,1,0) = (1,1,−1,1) .
Ищем
(b3 | b1 ) = 0 следует λ31 = −
(a3 | b1 ) = −2 . (b1 | b1 )
b3 = a3 + λ31b1 + λ32b2 .
Из
Аналогично, λ32 = −
Поэтому чем
(a3 | b2 ) = −1 . (b2 | b2 )
b3 = (1,1,1,1) − 2(1,0,1,0) − (1,1,−1,1) =(0,0,0,0).
Итак,
U = b1 ,b2
, при-
(b2 | b1 ) = 0 .
Определение 2.1. Система векторов a1 ,..., am называется ортонормированной, если (ai | a j ) = 0,1 ≤ i, j ≤ m, i ≠ j, (ai | ai ) = 1 . Следствие 2.1. Конечномерное евклидово пространство имеет ортонормированный базис. Доказательство: Пусть V — евклидово пространство размерности n, a1 , a 2 ,..., an - некоторый базис пространства V . Применяя процедуру ортогонализации, найдем вектора b1 , b2 ,..., bm , m ≤ n , такие, что
(b
i
| b j ) = 0,1 ≤ i, j ≤ m, i ≠ j и V = b1 , b2 ,..., bm . Но тогда m = n и b1 ,..., bm об-
разуют базис V . Обозначим через ei вектора вида гда (ei | ei ) = 1,
i = 1,K, n
тельно, вектора
и, кроме того
e1 ,..., en
(e | e ) = 0, i
j
bi b = i (bi | bi ) bi
i ≠ j , 1 ≤ i, j ≤ n .
. То-
Следова-
образуют ортонормированный базис.
3. Изоморфизм евклидовых пространств Также как для линейных пространств, структура евклидова пространства определяется его размерностью. Определение 3.1. Два евклидовых пространства V1 и V2 изоморфны (V1 ≅ V2 ) , если существует отображение ϕ : V1 → V2 , которое задает изоморфизм линейных пространств и сохраняет скалярное произведение, то есть (ϕx | ϕy ) = (x | y ), x, y ∈ V1 .
Теорема 3.1. Конечномерные евклидовы пространства V,V’ изоморфны тогда и только тогда, когда их размерности совпадают. Доказательство.
Если евклидовы пространства V,V’
изо-
морфны, то они, в частности, изоморфны, как линейные пространства. А поэтому, в силу теоремы 1.4.3, их размерности совпадают. Пусть
dim R V = dim R V ′ = n .
Тогда, как показано в предыдущем пара-
графе, в каждом из этих пространств существует ортонормированный базис. Обозначим эти базисы через
e1 ,..., en
и
e1′ ,..., en′
соответст-
венно.
ϕ :V → V '
по
правилу
(
Определим
)
отображение
ϕ ∑i =1α i ei = ∑i =1α i ei′, α i ∈ R . n
n
Так же как в теореме 1.4.3. легко убедить-
ся, что φ – изоморфизм линейных пространств. Если теперь x=
n
n
i =1
i =1
∑ α i ei , y = ∑ β i ei , то (x | y ) =
n
n
n
i =1
i =1
i =1
∑ α i β i . Но ϕ (x ) = ∑α i ei′ , ϕ ( y ) = ∑ β i ei′
n
и (ϕ ( x ) | ϕ ( y ) ) = ∑ α i β i . Следовательно, (x | y ) = (ϕ ( x) | ϕ ( y ) ), x, y ∈ V , то i =1
есть ϕ - изоморфизм евклидовых пространств. 4. Ортогональное дополнение При разложении трехмерного пространства в сумму подпространств меньшей размерности часто в качестве дополнения к плоскости выбирается перпендикулярная ей прямая (и наоборот). Рассмотрим, как эта конструкция обобщается на случай произвольного конечномерного евклидова пространства. Определение 4.1. Пусть U – подпространство евклидова пространства V. Ортогональным дополнением подпространства U называется следующая совокупность векторов: U ⊥ = {x ∈V | (x, u ) = 0, ∀u ∈U } .
Легко проверить, что U ⊥ - подпространство.
Теорема 4.1.
Для любого подпространства U евклидова про-
странства V имеет место разложение V = U ⊕ U ⊥ . Доказательство. Пусть ним его до базиса цесс
a1 ,..., am ,..., an
ортогонализации,
a1 ,..., am
- некоторый базис U. Допол-
всего пространства V. Применяя про-
построим
ортонормированный
базис
e1 ,..., em ,..., en пространства V. Причем вектора e1 ,..., em образуют орто-
нормированный базис подпространства U. Обозначим W=
em +1 ,..., en
.
Тогда V = U ⊕ W (по свойству 1.7.3). И, по определению ортогонального дополнения, W ⊆ U ⊥ . С другой стороны, если x ∈U ⊥ , то в его разложении по базису e1 ,..., en x=
первые m координат будут нулевыми. Действительно, если
n
∑ x e , то из условия (x | e ) = 0, j = 1,..., m , получим i i
j
x j = 0, j = 1,..., m .
Сле-
i =1
довательно, U ⊥ ⊆ W . Итак, V = U ⊕ U ⊥ . Теорема доказана. Представление вектора x ∈ V в виде суммы y + z, y ∈ U , z ∈ U ⊥ называют ортогональным разложением, а вектора y и z называют ортогональными проекциями на U параллельно U ⊥ и, соответственно, на U ⊥ параллельно U . Пример: V = R 4 , U = a1 , a 2 , a1 = (1,2,0,1), a 2 = (− 1,1,1,0) . Найти U ⊥ и проекцию вектора x = (3,0,1,2 ) на U параллельно U ⊥ . Из определения U ⊥ следует, что v ∈ U ⊥ ⇔ (v | ai ) = 0, i = 1,2 . Следовательно, U ⊥ — множество решений однородной системы линейных уравнений x1 + 2 x2 + x4 = 0 − x1 + x 2 + x3 = 0
.
Поэтому базис U ⊥ - это фундаментальная система решений указанной системы уравнений. Например, в качестве таковой можно
взять вектора v1 = (2,−1,3,0), v2 = (1,−1,0,3) . Для нахождения проекции вектора x на подпространство U , то есть нахождения таких y ∈ U , z ∈ U ⊥ , что x = y + z , представим y в виде y1a1 + y 2 a 2 . Тогда из
условия, что (z | ai ) = 0, i = 1,2 , получим следующую систему уравнений: y1 (a1 | a1 ) + y 2 (a 2 | a1 ) = ( x | a1 ) y1 (a1 | a 2 ) + y 2 (a 2 | a 2 ) = ( x | a 2 ) .
Решая ее, получим y1 = 1, y 2 = −1, то есть y = (2,1,−1,1) . 5. Унитарное пространство Определение 5.1. Отображение ( | ): V×V→C на комплексном линейном пространстве V называется эрмитовым произведением, если: 1)
(x | y ) = ( y | x ), x, y ∈V , то есть (x | x ) ∈ R ,
2)
(α1 x1 + α 2 x2 | y ) = α1 (x1 | y ) + α 2 (x2 | y ), x1 , x2 , y ∈V
3)
(x | x ) > 0 , если
x ≠ 0.
Комплексное линейное пространство, снабженное эрмитовым произведением, называется унитарным пространством. Свойства 1 и 3 позволяют определить длину вектора как
(x | x ) с
выполнением тех же свойств длины вектора, что и в евклидовом случае. Для унитарных пространств выполняются утверждения, аналогичные утверждениям для евклидовых пространств. Теорема 5.1. Пусть
U = a1 ,..., am
ненулевое подпространство уни-
тарного пространства V. Тогда существуют ненулевые вектора b1 ,..., bs , s ≤ m
такие, что
(b | b ) = 0, i
j
1 ≤ i, j ≤ s, i ≠ j
и
U = b1 ,..., bs
.
Так же как для евклидовых пространств, ортонормированным базисом унитарного пространства размерности n называется совокупность из n векторов
e1 ,..., en
таких, что
(e | e ) = 0, i ≠ j, 1 ≤ i, j ≤ n, (e | e ) = 1, i
j
i
i
i = 1,..., n .
Следствие 5.1. Любое конечномерное унитарное пространство имеет ортонормированный базис. Определение 5.2. Два унитарных пространства V1 и V2 изоморфны, если существует отображение ϕ : V1 → V2 , которое биективно, линейно и сохраняет эрмитово произведение, то есть
(x | y ) = (ϕx | ϕy ), x, y ∈ V1 . Теорема 5.2. Конечномерные унитарные пространства V1 и V2 изоморфны тогда и только тогда, когда dim C V1 = dim C V2 . Теорема 5.3. Для любого подпространства U конечномерного унитарного пространства V имеет место разложение: V = U ⊕ U ⊥ , где
U ⊥ = {x ∈V , (x | u ) = 0, u ∈U } .
Доказательства всех теорем этого параграфа получаются прямым повторением соответствующих рассуждений для евклидовых пространств.
Глава 4. Билинейные и квадратичные формы 1. Матрица билинейной формы Определение 1.1. Пусть V – линейное пространство над полем k. Отображение f: V×V→ k называется билинейной формой на пространстве V, если: 1) f (α1 x1 + α 2 x2 , y ) = α1 f (x1 , y ) + α 2 f (x2 , y ), x1 , x2 , y ∈V ,α1 ,α 2 ∈ k 2) f (x, β1 y1 + β 2 y2 ) = β1 f (x , y1 ) + β 2 f (x, y2 ), x, y2 , y1 ∈V , β1 , β 2 ∈ k
Зафиксируем некоторый базис
e1 ,..., en
в пространстве V. Тогда мат-
рица F = ( f ij ), 1 ≤ i, j ≤ n, f ij = f (ei , e j ) называется матрицей билинейn
n
i =1
i =1
ной формы f . Если x = ∑ xi ei , y = ∑ yi ei , то f (x, y ) = X t FY , где X t = (x1 , x2 ,..., xn ),
⎛ n f ⎜ xi ei , ⎜ i =1 ⎝
∑
Y=(y1,
⎞ y je j ⎟ = ⎟ j =1 ⎠ n
∑
n
…,
n
n
yn)t.
Действительно,
⎡ f11 L L xi f ij y j = ( x1 , x2 ,..., xn )⎢⎢ j =1 ⎢⎣ f n1 L n
∑∑ x y f (e , e ) = ∑∑ i
j
i
j
i =1 j =1
i =1
f1n ⎤⎛ y1 ⎞ ⎥⎜ M ⎟ . ⎥⎜ ⎟ f nn ⎥⎦⎜⎝ yn ⎟⎠
Предположим теперь, что e1′ ,..., en′ — другой базис пространства V, а F ′ = ( f ij′ ) — матрица формы f в этом базисе. Если T — матрица,
перехода от базиса {ei } к базису {ei′}, то F ′ = T t FT . Для получения этой формулы воспользуемся связью координат вектора в разных базисах. Если зисе, то
⎛ x1′ ⎞ ⎛ y1′ ⎞ ⎜ ⎟ X ′ = ⎜ M ⎟, Y ′ = ⎜⎜ M ⎟⎟ ⎜ x′n ⎟ ⎜ y′n ⎟ ⎝ ⎠ ⎝ ⎠
X = TX ′ , Y = TY ′ .
( X ′)t T t FTY ′
= X ′t F ′Y ′ .
- координаты векторов x,y в новом ба-
Следовательно, f(x,y) =
X t FY =
(TX ′)t F (TY ′) =
Откуда получаем выше приведенную формулу.
Определение 1.2. Рангом билинейной формы f называется ранг соответствующей ей в каком-нибудь базисе матрицы F. Следствие 1.2. Ранг билинейной формы является ее инвариантом, не зависящим от выбора базиса. Доказательство этого утверждения заключается в применении теоремы о ранге произведения двух матриц, одна из которых невырождена. 2. Квадратичные формы Если для билинейной формы f выполнено условие: f (x, y ) = f ( y , x ) , x, y ∈ V , то f называется симметрической билинейной формой. Ука-
занное условие выполняется, если оно выполняется для базисных
элементов: f (ei , e j ) = f (e j , ei ), i, j = 1,..., n . Последнее означает, что матрица F = ( f ij ) этой билинейной формы – симметрическая. Пусть теперь f симметрическая билинейная форма. Положим q f (x ) = f (x, x ), x ∈V
. Тогда
q f (− x ) = q f (x )
и f (x, y ) = 1 {q f (x + y ) − q f (x ) − q f ( y )}. 2
Действительно,
{
}
1 1 q f ( x + y ) − q f (x ) − q f ( y ) = { f (x + y, x + y ) − f (x, x ) − f ( y, y )} = 2 2 1 1 = f (x, y ) + f ( y, x ) = f (x, y ). 2 2
Обратно, пусть q : V → k отображение пространства V в поле k такое, что 1) q(− x ) = q(x ), x ∈ V и 2) f ( x, y ) =
1 {q(x + y ) − q(x ) − q( y )} является билинейной (очевидно 2
симметричной) формой. Тогда q f = q . Положим в 2) y = − x : − f ( x, x ) =
1 [q(0) − q( x ) − q( − x )] . 2
Отсюда q( x ) = f ( x , x ) +
1 q ( 0) . 2
Так как f - билинейная форма, то f (0,0) = 0 . Поэтому при x=0 име1 2
ем q(0) = q(0) , то есть q(0) = 0 . Значит q( x ) = f ( x, x ) = q f ( x ) . Таким образом, по каждой симметричной билинейной форме однозначно определяется квадратичная форма. Если e1 ,..., en - фиксированный базис в пространстве V , то
n
n
f ( x, y ) = ∑∑ f ij xi y j ,
где
i =1 j =1
f ij = f ( ei , e j ) . Тогда q f ( x ) = f ( x, x ) =
n
n
∑∑ f i =1 j =1
ij
xi x j . И матрица F = ( f ij ) би-
линейной формы f называется также и матрицей соответствующей квадратичной формы. Соответственно, ранг F называется рангом квадратичной формы и q f ( x ) = X t FX . Определение 2.1. Квадратиная форма q имеет в базисе n
n
i =1
i =1
e1 ,..., en
ка-
нонический вид, если для любого x = ∑ xi ei , q( x ) = ∑ xi2 f ii . Базис e1 ,..., en
называется каноническим.
Теорема 2.1. (Лагранж) Пусть на векторном пространстве V размерности n над полем K задана квадратичная форма q ранга r ≤ n . Тогда в V существует канонический базис e1 ,..., en , в котором q( x ) = λ1 x12 + ... + λr x r2 , λi ≠ 0, i = 1,..., r .
Доказательство. Требуется построить такой базис {ei }, чтобы соответствующая симметрическая билинейная форма f (у которой f ( x, x ) = q( x ) ) имела свойство
f ( ei , e j ) = 0, i ≠ j, i, j = 1,..., n . Проведем
доказательство индукцией по n = dim k V . При n = 1 : q( x ) = λ1 x12 и утверждение теоремы очевидно. Пусть e1 - такой вектор, что q(e1 ) = f (e1 , e1 ) ≠ 0 . Рассмотрим линейную функцию f1 : V → k , определенную правилом: f1 ( x ) = f ( x, e1 ) . Функция f1 ненулевая, так как f1 ( e1 ) ≠ 0 . Поэтому подпространство L = Kerf1 = {x ∈ V , f1 ( x ) = 0} имеет размерность n-1. По предположению
индукции L обладает базисом e2 ,..., en , в котором матрица формы f, ограниченной на L, диагональна, то есть: f ( ei , e j ) = 0, i ≠ j, i, j = 2,..., n . По построению f ( e1 , e j ) = 0, j = 2,..., n . Следовательно, набор векторов e1 ,..., en
имеет нужное нам свойство. Проверим, что система векторов
e1 ,..., en
- линейно независима. Если
α1e1 + α 2 e2 + ... + α n en = 0 , то α1 ≠ 0 , поскольку e2 ,..., en — базис L. В таn
ком случае e1 = ∑ β i ei и i =2
⎛ n ⎞ 0 ≠ f1 (e1 ) = f1 ⎜⎜ β i ei ⎟⎟ = ⎝ i=2 ⎠
∑
n
∑ β f (e , e ) = 0 i
1
i
— противо-
i=2
речие, доказывающее линейную независимость векторов
e1 ,..., en .
Итак, мы доказали, что в базисе {ei } матрица F нашей квадратичной формы диагональна. Так как ранг квадратичной формы величина инвариантная, то количество ненулевых элементов на диагонали матрицы F равно r . Следовательно, в базисе {ei } форма q имеет вид: q( x ) = λ1 x12 + ... + λr x r2 . На практике эта теорема обычно формулируется и доказывается в координатной записи. Теорема 2.2. (Лагранж) Пусть
q( x) =
n
∑f
ij xi x j
— квадратичная
i , j =1
форма от n переменных. Тогда существует невырожденное преобразование ⎛ x1 ⎞ ⎛ y1 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ x2 ⎟ ⎜ y2 ⎟ ⎜ M ⎟ = Q⎜ M ⎟, Q ≠ 0 , ⎜ ⎟ ⎜ ⎟ ⎜x ⎟ ⎜y ⎟ ⎝ n⎠ ⎝ n⎠
такое, что q( y ) = λ1 y12 + ... + λr y r2 , где все λi ≠ 0 , а r – ранг квадратичной формы q. Доказательство. Доказательство проведем индукцией по количеству переменных n . Если n = 1 , то q( x ) = f11 x12 и утверждение теоремы очевидно. Предположим, что для любой квадратичной формы от m < n переменных утверждение теоремы справедливо и пусть q( x ) =
n
n
∑f
i , j =1
ij
xi x j = ∑ f ii xi2 + 2 i =1
∑f
ij
xi x j ненулевая квадратичная
1≤i < j ≤ n
форма от n переменных. Рассмотрим два случая:
А) Существует номер i, для которого f ii ≠ 0 . Меняя нумерацию переменных, будем считать, что i = 1 . Тогда q( x ) = f11−1 ( f11 x1 + f12 x 2 + ... + f1n x n ) + g ( x ) , где g ( x ) = 2
n
∑g
x x j - квадра-
ij i
i, j =2
тичная форма от переменных x2 ,..., xn . По предположению индукции ⎛ x2 ⎞ ⎛ y2 ⎞ ⎜ ⎟ ⎜ ⎟ существует невырожденное преобразование ⎜ M ⎟ = Q1 ⎜ M ⎟, Q1 ≠ 0, та⎜x ⎟ ⎜y ⎟ ⎝ n⎠ ⎝ n⎠
кое, что g ( y ) = μ 2 y 22 + ... + μ s y s2 . Рассмотрим преобразование ⎡ f11 ⎛ y1 ⎞ ⎢ ⎜ ⎟ 0 ⎜ M ⎟=⎢ ⎜y ⎟ ⎢ M ⎝ n⎠ ⎢ 0 ⎣
f12
L
Q1−1
f1n ⎤ ⎥ ⎥ ⎥ ⎥ ⎦
⎛ x1 ⎞ ⎜ ⎟ ⎜ M ⎟. ⎜x ⎟ ⎝ n⎠
Относительно новых переменных форма q примет вид: q( y ) = f11−1 y12 + μ 2 y 22 + ... + μ s y s2 . Последний пункт теоремы вытекает из
того, что ранг квадратичной формы не меняется при невырожденном преобразовании, а ранг матрицы ⎡ f11−1 ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
μ2 O 0
μs
⎤ ⎥ 0 ⎥ ⎥ ⎥ ⎥ ⎥ 0 ⎥ O ⎥ ⎥ 0⎦
равен числу ненулевых элементов на главной диагонали. Б) Для всех i : 1 ≤ i ≤ n, f ii = 0 . Так как q ≠ 0 , то существует коэффициент f ij ≠ 0 . Меняя нумерацию, можно считать, что f ij = f12 . Совершим преобразование переменных: x1 = y1 − y 2 , x2 = y1 + y 2 , xi = yi , i = 3,..., n . Определитель матрицы этого
преобразования
1
−1
0
K
0
1
1
0
K
0
0
0
1
K
0 =2
L L L L L 0
0
0
1
K
отличен от нуля, так что мы не выходим из круга невырожденных преобразований. Тогда относительно переменных y1 ,..., y n форма q будет иметь ненулевой коэффициент при y12 и мы получаем пункт А). 3. Вещественные квадратичные формы Если основное поле k, над которым рассматривается векторное пространство V, произвольно, то дальнейшее упрощение канонического вида квадратичной формы возможно только при некоторых дополнительных условиях. Пусть K=R — поле действительных чисел. Предположим, что первые s коэффициентов в каноническом виде квадратичной формы q = λ1 y12 + ... + λs y s2 + λs +1 y s2+1 + ... + λr y r2 положительны, а остальные r-s отрицательные. Произведем следующую замену переменных: zi = λi yi , i = 1,..., s . z i = − λi yi ,
i = s + 1,..., r , z i = y i , i = r + 1,..., n . Тогда
q( y ) = q( z ) = z12 + ... + z s2 − z s2+1 − ... − z r2 .
Полученное выражение называется нормальным видом квадратичной формы, а величины s и r-s количеством положительных и отрицательных квадратов. Теорема 3.1.(Закон инерции) Количество положительных и отрицательных квадратов в нормальном виде квадратичной формы определено однозначно. Доказательство. Пусть q = x12 + ... + x s2 − x s2+1 − ... − x r2 = ( x1′ ) + ... + ( xt′ ) − ( xt′+1 ) − ... − ( x r′ ) — два нор2
2
2
2
мальных вида квадратичной формы q и предположим, что t < s . Это означает, что существуют два базиса e1 ,..., en и e1′ ,..., en′ пространства V, на котором определена форма q, такие, что значения соответствующей билинейной формы f = f q на базисных элементах следующие: f (ei , ei ) = 1, i = 1,..., s, f (ei , ei ) = −1, i = s + 1,..., r, f (ei , ei ) = 0, i > r; соответственно: f (ei′, ei′ ) = 1, i = 1,..., t, f (ei′, ei′ ) = −1, i = t + 1,..., r, f (ei′, ei′ ) = 0, i > r. Кроме того, f (ei , e j ) = f (ei′, e′j ) = 0, i ≠ j. . Рассмотрим в V подпространства L = e1 ,..., es , L′ = et′+1 ,..., en′ . Так как dim(L + L′) ≤ dim V = n , то по теореме 6.2 из главы 1 имеем: dim(L I L′) = dim L + dim L′ − dim( L + L′) ≥ s + (n − t ) − n = s − t > 0 .
Стало быть, существует ненулевой вектор a ∈ L I L′ , для которого возможны два представления: a = a1e1 + ... + a s es = at′+1et′+1 + ... + a n′ en′ . В силу первого разложения получим q( a ) = f (a , a ) =
n
∑a a
i , j =1
i
j
f ( ei , e j ) = a12 + ... + a s2 > 0 .
А из второго q(a ) = f (a, a ) =
∑ a ′a ′ f (e′, e′ ) = −(a ′ ) n
i , j =1
2
i
j
i
j
t +1
− ... − (a r′ ) ≤ 0 . 2
(Возможно, что r < n и at′+1 = ... = a r′ = 0 ). Из полученного противоречия следует, что t ≥ s . Проводя аналогичные рассуждения для случая t > s , получим t ≤ s . Следовательно, t = s , что доказывает сформулированную теорему. 4. Положительно определенные квадратичные формы Определение 4.1. Пусть
q :V → k
квадратичная форма на V со зна-
чением в k и F = [ fij ] — матрица этой квадратичной формы относительно некоторого фиксированного базиса. Тогда i-тым главным минором формы q называется определитель
f11 K
f1i
Δi = K K K . f i1 K f ii
Теорема 4.1.(Метод Якоби) Если все главные миноры квадратичной формы
q = X t FX
Δ1 ,..., Δ n
отличны от нуля, то существует
базис e1′ ,..., en′ пространства V, в котором форма q имеет вид: q=
1 (x1′ )2 + Δ1 (x ′2 )2 + ... Δ n−1 (x′n )2 . Δ1 Δ2 Δn
Доказательство. Обозначим через f билинейную форму на пространстве V, соответствующую заданной квадратичной форме q. Тогда элементы f ij матрицы F есть значения билинейной формы f на парах базисных векторов (ei , e j ) , то есть f ij = f (ei , e j ) . Построим базис e1′ ,..., en′ , такой что f (ei′, e′j ) = 0, i ≠ j . Будем искать его в виде: e1′ = c11e1 e2′ = c12 e1 + c22 e2
…………….. en′ = c1n e1 + c2 n e2 + ... + cnn en
Потребуем, чтобы для элементов ei′, i = 1,..., n выполнялись условия: ⎛
j
⎞
⎝
m =1
⎠
f (ei′ , et ) = 0, t = 1,..., i − 1 , f ( ei′, ei ) = 1 . Тогда f (ei′, e′j ) = f ⎜⎜ ei′, ∑ cmj em ⎟⎟ = 0, j < i . В
силу симметричности f получим, что f ( ei′, e′j ) = 0, j > i . Это обеспечивает диагональность матрицы F ′ (матрица формы f в базисе e1′ ,..., en′ ). Подставив выражения для новых базисных векторов ei′ че-
рез старые es в написанные выше условия, получим систему уравнений для нахождения коэффициентов cti : f11c1i + f 21c2i + ... + f i1cii = 0 f12 c1i + f 22 c2i + ... + f i 2 cii = 0
………………………………. f1,i −1c1i + f 2,i −1c2i + ... + f i ,i −1cii = 0 f1i c1i + f 2i c2i + ... + f ii cii = 1
Определитель этой системы равен Δ i , который по условию теоремы отличен от нуля. Следовательно, система имеет единственное решение, что обеспечивает канонический вид формы q . В частности, вычисляя по правилу Крамера неизвестное cii , имеем f11 f12
cii =
f1, i −1 f1, i
f i −1,1 f i −1, 2 L f i −1, i −1 f i −1, i
K K L K K Δi
0 0 0 1
=
Δ i −1 , i > 1. Δi
При i = 1 , система сводится к одному уравнению f11c11 = 1 . Откуда 1 1 = . Но f ii′ = f (ei′, ei′ ) = f11 Δ1
c11 =
i ⎞ ⎛ f ⎜⎜ ei′, ∑ c ji e j ⎟⎟ = ⎠ ⎝ j =1
i
= ∑ f (ei′, e j )c ji = cii . Итак, коэффициенты f ii′ канонического вида j =1
формы q в базисе e1′ ,..., en′ равны cii и, следовательно, имеют вид, указанный в теореме. Применим полученный результат для вывода необходимого и достаточного условия положительной определенности квадратичной формы, заданной на вещественном пространстве. Определение 4.2. Квадратичная форма q : V → R на веществен-
ном пространстве V называется положительно определенной, когда q( x ) > 0 для любого x ∈ V , x ≠ 0 . Теорема 4.2. Квадратичная форма q на n-мерном вещественном
пространстве V положительно определена тогда и только тогда, когда ее нормальный вид есть: (x1′ )2 + (x2′ )2 + ... + (xn′ )2 .
Доказательство. Пусть q( x ) > 0 для любого ненулевого x ∈ V .
Нормальный вид формы q в некотором базисе e1′ ,..., en′ есть
(x1′ )2 + ... + (x s′ )2 − (x s′+1 ) − ... − (x r′ )2 . Если
r < n , то q( en′ ) = 0 . Если r = n , но
s < n , то q( en′ ) < 0 . Оба случая противоречат положительной опреде-
ленности формы q, то есть s = r = n . Достаточность доказывается еще проще. Теорема 4.3. (Критерий Сильвестра) Квадратичная форма q на
n-мерном вещественном пространстве V положительно определена тогда и только тогда, когда все главные миноры
Δ1 ,..., Δ n
ее мат-
рицы F строго положительны. Доказательство. Пусть все
Δ i > 0, i = 1,..., n .
Тогда, используя ме-
тод Якоби, можно найти базис e1′ ,..., en′ , в котором q ( x′) = xi′′ =
Δ0 (x1′ )2 + Δ1 (x2′ )2 + ... Δ n−1 (x′n )2 , Δ 0 = 1 . Сделав замену переменных Δ2 Δ1 Δn
Δ i −1 xi′ , i = 1,..., n , Δi
получим:
q( x′′) = (x1′′) + ... + (xn′′ ) 2
2
. Отсюда, в силу тео-
ремы 4.2, получим что q - положительно определена. Необходимость докажем индукцией по dim V = n. При n = 1 форма q( x ) имеет вид f11 x12 . Если q( x ) > 0 , то f11 = Δ1 > 0 . Что доказывает теорему в этом случае. При n > 1 рассмотрим под⎧
n
⎫
⎩
i =1
⎭
пространство U = ⎨ x = ∑ xi ei | xn = 0⎬ . Матрица ограничения квадратичной формы q |U равна
⎡ f11 K ⎢ L L ⎢f K ⎣ n −1,1
f1, n −1 ⎤ L ⎥. f n −1, n −1 ⎥ ⎦
По предположению ин-
дукции все главные миноры этой матрицы строго положительны. Но они являются минорами
Δ1 , Δ 2 ,..., Δ n −1
матрицы F. Осталось прове-
рить положительность последнего главного минора Δ n , который совпадает с определителем |F| матрицы F. По теореме 4.2 нормаль-
ный вид формы q есть (x1′ )2 + (x2′ )2 + ... + (xn′ )2 . Следовательно, существует такая невырожденная матрица T = (tij ) , tij ∈ R , что E = T t FT , где - единичная матрица. Переходя к определителям, получим
E 2
T F = 1 . То есть F =
1 T
2
> 0.
Замечание: Используя полученные результаты, можно сказать,
что любое скалярное произведение на n-мерном вещественном пространстве V в координатной форме имеет вид:
( x, y ) =
n
∑f
ij xi y j
= X t FY ,
i , j =1
где F — симметрическая матрица, все главные миноры которой строго положительны.
Глава 5. Нормальные операторы 1. Перенос сопряженного оператора в исходное пространство
Основной целью этой главы будет описание линейных операторов, сохраняющих геометрию евклидова (соответственно унитарного) пространства. Так как геометрия этих пространств определяется соответствующим скалярным произведением, то указанное выше условие будет означать сохранение скалярного произведения. Вначале рассмотрим конструкцию, которая позволяет рассматривать действие сопряженного оператора (см. глава 2, параграф 5) в исходном пространстве. Пусть V — евклидово пространство. Для любой линейной функции λ из V* (см. глава 2, параграф 5) существует вектор y λ ∈ V , такой, что λ ( x) = ( x | yλ ), x ∈V . Действительно, если
e1 ,..., en
- ортонормирован-
ный базис пространства V, то в качестве yλ необходимо взять
∑
n j =1
λ (e j )e j
.
Теорема 1.1. Отображение λ → yλ , где λ ∈V * , yλ ∈V задает изо-
морфизм пространств V и V*. Доказательство. Провести самостоятельно.
Изоморфизм из предыдущей теоремы обозначим через φ. Пусть ψ ∈ End R (V ) . Тогда действие оператора ψ * из End R (V * ) определено
правилом (ψ *λ )(x ) = λ (ψx ) , где x ∈ V , λ ∈ V * . Определим оператор ψ V* , действующий в пространстве V, формулой: ψ V* ( yλ ) = ϕ (ψ * (ϕ −1 yλ )) . Указанное правило делает коммутативной сле-
дующую диаграмму: −1
ϕ λ ←⎯⎯ yλ
↓ ψ V*
ψ* ↓
ϕ ψ *λ ⎯ ⎯→ yψ *λ .
Тогда (ψx | y λ ) = (x | ψ V* y λ ) . Действительно, (ψx | y λ ) = λ (ψ (x )) . С другой стороны,
( x |ψ V* yλ ) = ( x | yψ * λ ) = (ψ *λ )( x) = λ (ψ ( x)) .
Когда функция λ пробегает пространство V * , вектор y λ принимает все значения из V . Поэтому последнюю формулу можно переписать так:
(ψx | y ) = (x | ψ V* y ) . Если речь идет только об операторах
ψ ,ψ V* ∈ End R (V ) , то оператор ψ V* будем записывать как ψ * . В резуль-
тате этих соглашений доказанная формула приобретает вид:
(ψx | y ) = (x | ψ * y ), x, y ∈ V . Эта формула справедлива и для унитарных пространств. Для ее проверки необходимо только при доказательстве теоремы 1.1 в качестве вектора y λ взять вектор
n
∑ λ (e j =1
j
)e j , где e1 ,..., en — некоторый
ортонормированный базис унитарного пространства V . Отметим связь между матрицами линейных операторов ϕ и ϕ * . Пусть
⎡ a11 K a1n ⎤ ⎥ - матрица оператора ϕ в ортонормированном баL Aϕ = ⎢ ⎢ ⎥ ⎢⎣a n1 K a nn ⎥⎦
зисе e1 ,..., en . Тогда (ϕei | ek ) =
(e | ϕ e ) = (e | ∑ i
*
k
i
n
a* e s =1 sk s
)= a
*
ik
(∑
)
n
a e | ek = aki . j =1 ji j
Если ϕ *ek = ∑ s =1 ask* es , то n
. В силу формулы (ϕei | ek ) = (ei | ϕ *ek ) , полу-
чим aik* = aki или Aϕ = Aϕt . *
2. Канонический вид нормального оператора в унитарном пространстве Определение 2.1. Пусть
V
— унитарное пространство,
ϕ ∈ End C (V ) . Оператор ϕ называется нормальным, если ϕ ϕ * = ϕ * ϕ .
Теорема 2.1. Оператор ϕ — нормален тогда и только тогда, ко-
гда в пространстве V существует ортонормированный базис, в котором матрица оператора ϕ имеет диагональный вид. Предварительно докажем несколько лемм. Лемма 2.1. Если v— собственный вектор нормального оператора ϕ : ϕv = av , a ∈ C , то v— собственный вектор оператора ϕ ∗ , причем ϕ ∗v = a v .
Доказательство. Обозначим через U подпространство собст-
венных векторов оператора ϕ , отвечающих собственному значению a : U = {v ∈ V , ϕv = av}. Тогда ϕ (ϕ ∗ v − a v) = ϕ ∗ϕv − a ϕv = a (ϕ ∗ v − a v) , если v ∈ U , т.е. ϕ ∗ v − a v ∈ U . С другой стороны,
(u | ϕ ∗ v − a v) = (ϕu | v) − a (u | v) = 0 , если u ∈ U . Таким образом
ϕ ∗ v − a v ∈ U ⊥ , для любого вектора v ∈ V . Следовательно, если v ∈ U ,
то ϕ ∗ v − a v ∈ U ∩ U ⊥ = 0 . Значит ϕ ∗ v = a v , когда ϕv = av .
Лемма 2.2. Если V — унитарное или евклидово пространство U-
инвариантное подпространство для оператора ϕ ∈ End (V ) , то U ⊥ инвариантно относительно ϕ * . Доказательство. Пусть x ∈ U , y ∈ U ⊥ . Тогда (ϕx | y ) = 0, так как ϕx ∈ U . С другой
стороны, (ϕx | y ) = (x | ϕ * y ) . Значит, ϕ * y ∈ U ⊥ . Аналогичным рассуждением доказывается Лемма 2.3. Если ϕ U ⊆ U , ϕ *U ⊆ U , то ϕ U ⊥ ⊆ U ⊥ , ϕ *U ⊥ ⊆ U ⊥ Доказательство теоремы 2.1. Пусть ϕ — нормальный
оператор, действующий в конечномерном унитарном пространстве V. Если dimC V=1, то утверждение теоремы справедливо. Пусть dimC V = n >1. Обозначим через U = {u ∈ V , ϕu = au, a ∈ C} - подпространство собственных векторов, отвечающих собственному значению a. Достаточно рассматривать случай, когда U ≠ V . Кроме того U ≠ 0 . В силу леммы 2.1 ϕ *U ⊆ U . Тогда по лемме 2.3 ϕ U ⊥ ⊆ U ⊥ , ϕ *U ⊥ ⊆ U ⊥ . А так как dim U ⊥ = dim V − dim U < dim V , то, применяя предпо-
ложение индукции, получим, что существует ортонормированный базис e1 ,..., es в U ⊥ , в котором матрица сужения оператора φ — диагональная. Так как V = U ⊕ U ⊥ , то, объединяя базисы подпространств U и U ⊥ , получим утверждение теоремы. Обратно, пусть существует ортонормированный базис e1 ,..., en пространства V , в котором матрица Aϕ оператора ϕ — диагональная. Используя формулу из параграфа 1, имеем Aϕ = Aϕt . Значит Aϕ так*
же диагональная. Следовательно, Aϕ Aϕ = Aϕ Aϕ или ϕ ϕ * = ϕ * ϕ . *
*
3. Комплексификация векторных пространств
*
Для получения канонического вида нормального оператора в вещественном случае нам потребуется процедура комплексификации векторного пространства. Пусть V - вещественное пространство. Обозначим через купность пар ( x, y ), x, y ∈ V и введем в
V~
V~
сово-
покомпонентную процедуру
сложения, то есть ( x, y ) + ( x ′, y ′) = ( x + x ′, y + y ′) . Если поле комплексных чисел интерпретировать как множество пар (a, b), a, b ∈ R с операциями
сложения
( a , b) + ( a ′, b′) = ( a + a ′, b + b′)
и
умножения
( a, b)( a′, b′) = ( aa′ − bb′, ab′ + ba′) , то можно превратить V~ в векторное
пространство над C, если умножение на константы из C задать формулой: ( a , b)( x, y ) = ( ax − by , ay + bx ) .
Проверки аксиом векторного пространства повторяют соответствующие проверки аксиом поля C . В частности, отождествляя пару (0,1) и мнимую единицу, имеем i ( x, y ) = (0,1)( x, y ) = ( − y , x ) . То
есть
( x, y ) = ( x,0) + (0, y ) = ( x,0) + i ( y ,0) . Поэтому пару ( x, y ) будем записы-
вать в виде x + iy , а операции сложения и умножения примут вид: ( x + iy ) + ( x′ + iy′) = ( x + x′) + i ( y + y′) , (a + bi )( x + iy ) = (ax − by ) + i (by + ax), a, b ∈ R, x, y ∈V
Полученное пространство
V~
.
будем называть комплексификацией
пространства V. Если V евклидово пространство, то
V~
можно превратить в унитар-
ное, задав эрмитово произведение на
V~
по формуле:
(z1 | z2 )V~ = (x1 + iy1 | x2 + iy2 )V~ = = (x1 | x2 )V + ( y1 | y2 )V + i ( y1 | x2 )V − i (x1 | y2 )V
.
Все аксиомы эрмитова произведения проверяются непосредственным вычислением. Если ϕ - линейный оператор, действующий на
~ V , то его можно продлить до линейного оператора ϕ на V по фор-
муле: ϕ ( x + iy ) = ϕx + iϕy . Предложение 3.1. ϕ * = ϕ * . ~
Доказательство. Для любых векторов z1 , z 2 из V имеем:
(z | ϕ z )= (ϕ z | z ) = (ϕx + iϕy | x *
1
2
1
2
1
1
2
+ iy 2 ) =
= (ϕx1 | x 2 ) + (ϕy1 | y 2 ) + i (ϕy1 | x 2 ) − i (ϕx1 | y 2 ) =
= (x1 | ϕ * x 2 ) + ( y1 | ϕ * y 2 ) + i ( y1 | ϕ * x 2 ) − i (x1 | ϕ * y 2 ) =
(x
1
(
)(
) (
| ϕ * x 2 + iϕ * y 2 ) + (iy1 | ϕ * x2 + iϕ * y 2 ) = x1 | ϕ * z 2 + iy1 | ϕ * z2 = z1 | ϕ * z 2
).
Так как z1 -
*
произвольный вектор из V , то ϕ z 2 = ϕ * z 2 . Но z2 - также любой век* тор из V , следовательно, ϕ = ϕ * .
4. Канонический вид нормального оператора в вещественном случае
Определение нормального оператора для евклидовых пространств дословно повторяет эрмитов случай. А именно, φ - нормален, если ϕϕ * = ϕ *ϕ .
Теорема 4.1. Пусть V - евклидово пространство. Тогда оператор
φ - нормален тогда и только тогда, когда существует ортонормированный базис в V, в котором матрица Aφ оператора φ имеет клеточно-диагональный вид, причем каждая клетка на диагонали имеет либо вид [a] , либо
⎡ a b ⎤ , a, b ∈ R . ⎢⎣− b a ⎥⎦
Так же как в предыдущем параграфе, вначале докажем ряд вспомогательных предложений. Предложение 4.1. Пусть ϕ - продолжение линейного оператора ~
ϕ на комплексификацию V пространства V . Тогда ϕ z = λz , если и
только если ϕx = ax − by ,
(*)
ϕy = bx + ay , ~
где z = x + iy ∈V , x, y ∈V , λ = a + bi ∈ C , a, b ∈ R . Доказательство. По определению ϕ z = ϕx + iϕy . С другой сто-
роны, λz = (a + bi )(x + iy ) = ax − by + i (ay + bx ) . Сравнивая два этих выражения, получаем необходимость утверждения предложения 4.1. Достаточность условий (*) также очевидна. Следствие 4.1. Если ϕ z = λz , то ϕ z = λ z, z = x − iy . Доказательство: λ z = (a − bi )(x − iy ) =
= ax − by − i (ay + bx ) = ϕx − iϕy = ϕ z .
Предложение 4.2. Пусть V евклидово пространство, а x, y ∈V
такие, что ϕx = ax − by, ϕy = bx + ay, b ≠ 0 , причем ϕ - нормален. Тогда
(x | y ) = 0, ( x | x ) = ( y | y ) . Доказательство. В силу предложения 4.1 для ϕ имеем: ϕ z = λz, λ = a + bi, z = x + iy ∈ V~ . Используя следствие 4.1, получим *
λ z = ϕ z . Тогда по следствию 2.1 (см. параграф 2): ϕ z = λ z .
Вычислим теперь скалярное произведение (ϕ z | z ) двумя способами. С
одной
(ϕ z | z ) = (z | ϕ
стороны, *
(ϕ z | z ) = (λz | z ) = λ (z | z ) .
С
другой:
)
z = ( z | λz ) = λ ( z | z ) . Так как b ≠ 0 , то λ ≠ λ и поэтому
(z | z ) = 0 . Но (z | z ) = (x + iy | x − iy ) = (x | x ) − ( y | y ) + i ( y | x ) + i (x | y ) . Приравнивая нулю действительную и мнимую часть этого выражения, получим утверждение предложения. Доказательство теоремы 4.1.
Если характеристический многочлен Aϕ − λE имеет действительный корень λ0 , то, как и при доказательстве теоремы 2.1, определяем подпространство U = {v, ϕv = λ0 v} и дословно повторяем упомянутое доказательство. Пусть все характеристические корни оператора φ — комплексные. ~
Тогда перейдем к комплексифицированному пространству V и опе-
ратору ϕ . Заметим, что из нормальности φ вытекает нормальность ϕ . Действительно: *
ϕ ϕ ( x + iy ) = ϕ ϕ * ( x + iy ) = ϕ (ϕ * x + iϕ * y ) = ϕϕ * x + iϕϕ * y , *
*
ϕ ϕ ( x + iy ) = ϕ (ϕx + iϕy ) = ϕ * (ϕx + iϕy ) = ϕ *ϕx + iϕ *ϕy .
Из равенства полученных выражений следует, что ϕϕ * = ϕ *ϕ . Если z = x + iy
собственный
вектор
оператора
ϕ,
то
есть
ϕ z = λ0 z , λ0 = a + bi ∈ C , то ϕx = ax − by, ϕy = bx + ay .
Рассмотрим подпространство U = x, y , натянутое на вектора x, y . Очевидно, что ϕU ⊆ U . Проверим, что ϕ *U ⊆ U . В силу следствия 2.1 из ϕ z = λ0 z имеем ϕ * z = λ0 z . Или ϕ ∗ z = λ0 z . Так как ϕ ∗ z = ϕ * x + iϕ * y , а λ0 z = (ax + by ) + i (ay − bx) , то ϕ * x = ax + by, ϕ * y = ay − bx
.
То есть ϕ *U ⊆ U . По лемме 2.3 ϕ *U ⊥ ⊆ U ⊥ , ϕ U ⊥ ⊆ U ⊥ . Так как dim R U = 2 , то dim R U ⊥ < dim R V и по предположению индукции в U ⊥ существует ба-
зис с необходимыми свойствами. В качестве базиса в U берем e1 =
x y . Объединяя базисы U и U ⊥ , получим утверждение , e2 = x y
теоремы о виде матрицы Aϕ . Для проверки утверждения в обратную сторону достаточно заметить, что матрица
Aϕ *
также будет блочно-диагональная и
⎡ a b ⎤ ⎡ a − b⎤ ⎡ a − b⎤ ⎡ a b ⎤ ⎡ a 2 + b 2 ⎢− b a ⎥ ⎢b a ⎥ = ⎢b a ⎥ ⎢− b a ⎥ = ⎢ 0 ⎦ ⎣ ⎦⎣ ⎦ ⎣ ⎦⎣ ⎣
Aϕ Aϕ * = Aϕ * Aϕ , или ϕ ϕ * = ϕ * ϕ .
5. Унитарные операторы
⎤ ⎥. a 2 + b2 ⎦ 0
Поэтому
Применим полученные результаты для описания операторов, сохраняющих скалярное произведение. Определение 5.1. Пусть V - унитарное пространство. Тогда опеϕ ∈ End C (V )
ратор
называется
унитарным,
если
(ϕx | ϕy ) = (x | y ), x, y ∈V . Предложение 5.1. Оператор φ унитарен тогда и только тогда,
когда выполняются следующие равносильные утверждения: 1)
Образы ϕe1 ,..., ϕen некоторого ортонормированного базиса
e1 ,..., en также ортонормированный базис.
2)
Образы ϕ e 1 ,..., ϕ e n любого ортонормированного базиса e1 ,..., en
также ортонормированный базис. 3)
ϕ −1 = ϕ * , т.е. оператор, сопряженный к ϕ , совпадает с об-
ратным к ϕ . Доказательство. Пусть ϕ - унитарен, и e1 ,..., en - некоторый
(любой) ортонормированный базис. Тогда (ϕei | ϕe j ) = (ei | e j ) = δ ij . Т.е. ϕ e1 ,..., ϕ e n - ортонормированный базис.
Обратно, пусть ϕe1 ,..., ϕen - ортонормированный базис для некоторого
(любого)
(ϕe
i
ортонормированного
базиса
e1 ,..., en .
То
есть
| ϕe j ) = (ei | e j ) = δ ij . Для любых двух векторов x = ∑ xi ei , y = ∑ y j e j n
n
i =1
j =1
(x | y ) = ∑ xi y j (ei | e j ) = ∑ xi yi ,
имеем: ⎛
n
⎞
n
n
j =1
⎠
i , j =1
i =1
n
n
i , j =1
i =1
(ϕx | ϕy ) = ⎜⎜ ∑ xiϕei | ∑ y jϕe j ⎟⎟ = ∑ xi y j (ϕei | ϕe j ) = ∑ xi yi . Сравнивая полуn
⎝ i =1
ченные формулы, имеем (x | y ) = (ϕx | ϕy ) . Мы проверили эквивалентность исходного определения и пунктов 1) и 2). Проверим эквивалентность определения унитарного оператора и пункта 3).
ϕ
Если
-
унитарен,
(x | y ) = (ϕx | ϕy ) = (x | ϕ *ϕy ) . То есть
то
(x | y − ϕ ϕy ) = 0 . Следовательно, ϕ ϕ = 1 . *
*
Обратно, если ϕ * = ϕ −1 , то из формулы (ϕx | ϕy ) = (x | ϕ *ϕy ) получаем
(ϕx | ϕy ) = (x | y ) . Предложение полностью доказано. Теорема 5.2. Для любого унитарного оператора существует ор-
тонормированный базис, в котором его матрица имеет вид: 0⎤ ⎡λ1 ⎥ ⎢ λ2 ⎥, ⎢ ⎥ ⎢ O ⎥ ⎢ λn ⎦ ⎣0
причем λi = 1, i = 1,..., n . Доказательство. Если φ - унитарен, то в силу пункта 3) пред-
ложения 5.1 он нормален. Поэтому, по теореме 2.1, существует ортонормированный базис, в котором матрица Aϕ - диагональна. Из условия ϕ * = ϕ −1 следует, что Aϕt = Aϕ , то есть для каждого диаго−1
нального элемента λi выполняется равенство λi = λi−1 . Что равносильно условию λi = 1 . Заметим, что матрица унитарного оператора в любом ортонормированном базисе имеет достаточно специальный вид. Пусть e1 ,..., en - некоторый ортонормированный базис и действие унитарного оператора φ в этом базисе задается формулами: n
ϕei = ∑ a ji e j , i = 1,..., n . Тогда, используя пункт 2 предложения 5.1, j =1
⎛
n
n
⎞
n
⎝
j =1
s =1
⎠
j =1
имеем: δ ik = (ϕei | ϕek ) = ⎜⎜ ∑ a ji e j | ∑ a sk es ⎟⎟ = ∑ a ji a jk = (α i | α k ) , где ⎛ a1i ⎞ ⎛ a1k ⎞ ⎜ ⎟ ⎜ ⎟ α i = ⎜ M ⎟, α k = ⎜ M ⎟ . ⎜a ⎟ ⎜a ⎟ ⎝ ni ⎠ ⎝ nk ⎠
Так как из полученного условия вытекает унитарность оператора φ, то можно сформулировать следующий вывод: Матрица линейного оператора в ортонормированном базисе является матрицей унитарного оператора тогда и только тогда, когда скалярное произведение столбцов матрицы с разными номерами равно нулю, а скалярный квадрат каждого столбца равен единице. Такую матрицу принято называть унитарной матрицей. 6. Ортогональные операторы
Определение ортогонального оператора аналогично определению унитарного. Определение 6.1. Пусть V - евклидово пространство. Тогда опе-
ратор
ϕ ∈ End R (V )
называется
ортогональным,
если
(x | y ) = (ϕx | ϕy ), x, y ∈ V . Предложение 6.1. Оператор φ ортогонален тогда и только то-
гда, когда выполняются следующие условия: 1)
Образы ϕe1 ,..., ϕen некоторого (любого) ортонормированного
базиса e1 ,..., en также ортонормированный базис. 2)
ϕ * = ϕ −1 , оператор сопряженный к оператору ϕ совпадает с
обратным к нему. Доказательство аналогично доказательству предложения 5.1. Теорема 6.2. Оператор φ ортогонален тогда и только тогда, ко-
гда существует ортонормированный базис, в котором матрица оператора Aϕ имеет блочно-диагональный вид, причем блоки на ⎡cos α
диагонали равны либо [± 1] , либо ⎢ ⎣ sin α
− sin α ⎤ . cos α ⎥⎦
Доказательство. Если φ ортогонален, то φ нормален. Следо-
вательно, по теореме 4.1 существует ортонормированный базис, в
котором матрица Aϕ имеет блочно-диагональный вид, причем блоки ⎡ a − b⎤ , a, b ∈ R . a ⎥⎦
на диагонали равны либо [λ ], λ ∈ R , либо ⎢ ⎣b
Кроме того, из ортогональности оператора ϕ имеем Aϕ = Aϕ . Но *
−1
Aϕ * = Aϕt = Aϕt , то есть Aϕt = Aϕ −1 = Aϕ−1 . Следовательно, для каждого диа-
гонального блока получим: ⎡ a − b⎤ Либо λ = λ , либо ⎢ ⎥ ⎣b a ⎦
−1
−1
⎡ a b⎤ =⎢ ⎥ . Из этих соотношений легко ⎣− b a ⎦
⎡a − b⎤ ⎡cos α = a ⎥⎦ ⎢⎣ sin α
получить либо λ = ±1 , либо ⎢ ⎣b
− sin α ⎤ . cos α ⎥⎦
Обратно, пусть матрица оператора Aϕ — блочно-диагональная и ⎡cos α
блоки равны либо [± 1] , либо ⎢ ⎣ sin α
− sin α ⎤ . Тогда матрица Aϕ−1 также ⎥ cos α ⎦
блочно-диагональная и соответствующие блоки равны либо [± 1] , ⎡ cos α
sin α ⎤
либо ⎢ . То есть матрица Aϕ−1 совпадает с Aϕt — матри⎥ ⎣ − sin α cos α ⎦ цей, транспонированной к Aϕ . Но Aϕt = Aϕ (если базис ортонормиро*
ванный), следовательно ϕ * = ϕ −1 . Что доказывает ортогональность оператора φ. Полученному
результату
можно
придать
определенный
геометрический смысл. Представим матрицу P произвольного ортогонального оператора ϕ в виде произведения
∏ P , (соответственно ϕ = ∏ ϕ i
i
i
i
), где каждое
Pi
либо
⎡1 ⎢ O ⎢ ⎡cos α ⎢ ⎢ sin α ⎢ ⎣ ⎢ 0 ⎢ ⎢ ⎣
матрица
⎡1 ⎤ ⎢ O ⎥ 0 ⎢ ⎥ ⎢ ⎥, −1 ⎢ ⎥ 0 O ⎥ ⎢ ⎢⎣ 1⎥⎦
либо
матрица
⎤ ⎥ 0 ⎥ − sin α ⎤ ⎥ ⎥ ⎥ cos α ⎦ ⎥ O ⎥ 1⎥⎦
Пусть для определенности в первом случае: ϕ k e1 = − e1 , ϕ k ei = ei , i = 2,..., n. Если n = 3 , то получаем отражение отно-
сительно плоскости, натянутой на вектора e2 , e3 .
Имея в виду эту аналогию, соответствующий оператор φk назовем отражением относительно гиперплоскости. Во втором случае: ϕ s e1 = cos αe1 + sin αe2 , ϕ s e2 = cos αe2 − sin αe1 , ϕ s ei = ei , i = 3,..., n . Если n=3,
то получаем поворот плоскости, натянутой на вектора e1, e2 и ортогональной подпространству < e3 >. Опять по аналогии назовем соответствующий оператор поворотом двумерной плоскости, ортогональной к (n – 2)-мерному подпространству. В качестве вывода можно сформулировать такое утверждение: каждый ортогональный оператор в евклидовом пространстве является
произведением конечного числа отражений и конечного числа поворотов. 7. Самосопряженные (симметрические) операторы Определение 7.1. Пусть V – эрмитово (евклидово) пространство.
Оператор ϕ ∈ End (V ) называется самосопряженным (симметрическим), если ϕ = ϕ * . Заметим, что условие самосопряженности (симметричности) равносильно соотношению: (ϕx | y ) = (x | ϕy ), x, y ∈ V . Для матрицы самосопряженного
оператора
Aϕ * = Aϕt = Aϕ .
Т.е.
в
ортонормированном
aij = a ji ,
i, j = 1,..., n, n = dim V ,
базисе в
имеем:
частности
aii ∈ R, i = 1,..., n .
Для матрицы симметрического оператора эти условия выглядят так: a ji = aij , i, j = 1,..., n, n = dim V . Получаем обычное определение симметрической матрицы. Теорема 7.1. Пусть V - унитарное (евклидово) пространство.
Оператор ϕ ∈ End (V ) является самосопряженным (симметрическим) тогда и только тогда, когда существует ортонормированный базис, в котором матрица 0⎤ ⎡λ1 ⎢ ⎥, Aϕ = O ⎢ ⎥ λn ⎦⎥ ⎣⎢ 0
причем все λi - вещественны. Доказательство. Из самосопряженности (симметричности)
оператора ϕ вытекает его нормальность. Поэтому можно воспользоваться теоремами 2.1 и 4.1. В первом случае сразу получаем необходимый диагональный вид матрицы
0⎤ ⎡λ1 ⎥, Aϕ = ⎢ O ⎢0 λn ⎥⎦ ⎣
λi ∈ C , n = dim V . Но так как Aϕ = Aϕt = Aϕ , то λi = λi . Т.е. λi ∈ R, i = 1,..., n . *
В случае евклидова пространства канонический вид матрицы Aϕ блочно-диагональный, причем на диагонали либо блоки [λi ], либо блоки
⎡ a b ⎤, a, b ∈ R . ⎢⎣− b a ⎥⎦
⎡ a b ⎤ = ⎡a − b⎤ . ⎢⎣− b a ⎥⎦ ⎢⎣b a ⎦⎥
Опять, используя условие
Aϕ * = Aϕt = Aϕ ,
получим
Откуда b = 0 и, следовательно, Aϕ имеет необходи-
мый диагональный вид с вещественными параметрами. Проверка достаточности очевидна. 8. Приведение квадратичной формы к главным осям
В главе 4 были рассмотрены два способа (метод Лагранжа и метод Якоби), которые позволяли получить канонический вид квадратичной формы, используя невырожденные преобразования. Можно сузить класс преобразований и рассматривать только ортогональные преобразования (рассматриваем только случай евклидовых пространств). Тогда, как будет показано ниже, квадратичная форма также приводится к каноническому виду, причем сохраняется геометрия пространства, то есть расстояние между точками и углы между векторами. Пусть
q( x) =
n
∑a x i =1
2 ii i
+2
∑a x x ij i
j
= X t AX
— некоторая квадратичная
1≤ i < j ≤ n
форма над полем действительных чисел. Здесь A = [aij ] — симметрическая матрица,
X = ( x1 ,K, xn )t =
∑
n xe i =1 i i
, где e1 ,..., en — ортонормиро-
ванный базис, в котором значения соответствующей билинейной формы
fq
определяются
элементами
матрицы
A,
то
есть
f q ( ei , e j ) = aij . По теореме 7.1 существует ортонормированный базис e1′ ,..., en′ , в котором матрица A' симметричного оператора, определяе-
мого матрицей A, диагональна, причем A' = T −1 AT , где T матрица перехода к новому базису e1′ ,..., en′ . Так как оба базиса ортонормированны, то матрица T – ортогональна, то есть 0⎤ ⎡λ1 ⎢ ⎥ = A′ = T t AT . O ⎢0 λn ⎥⎦ ⎣
T −1 = T t .
Таким образом
Но последнее соотношение задает изменение
матрицы квадратичной формы под действием преобразования T. То есть, если (x1, …, xn)t=T(x1’ , …, xn’)t, где (x1′ ,..., xn′ ) координаты вектора x в новом базисе, то q( x ) = λ1 ( x1′ ) 2 + ... + λn ( xn′ ) 2 . Причем λ1 ,..., λn — характеристические корни матрицы A, так как A’ и A — подобны. Из диагональности матрицы A′ следует, что e1′ ,..., en′ — есть собственные вектора соответствующего симметрического оператора, а их координаты в исходном базисе e1 ,..., en - это элементы матрицы n
T: ei′ = ∑ t ji e j , i = 1,..., n . Таким образом, можно сформулировать слеj =1
дующий алгоритм приведения квадратичной формы к каноническому виду (к главным осям).
∑
n
1.
Записать матрицу A квадратичной формы
2.
Найти корни характеристического многочлена этой матрицы.
3.
Для каждого характеристического корня λi найти фундамен-
тальную
( A − λi E )X
систему
решений
однородной
q=
a xx j , i =1 ij i j
системы
.
уравнений
= 0.
4.
Ортонормировать эту систему: e1′ ,..., en′ .
5.
Канонический вид
q=
∑
n y2 i =1 i i
λ
, а преобразование X=TY, приво-
дящее q к такому каноническому виду, имеет в качестве матрицы T
матрицу, столбцы которой есть координаты векторов
e1′ ,..., e′n
в ста-
ром базисе. В этом алгоритме требует пояснения пункт 3, в котором предполагается, что количество векторов фундаментальной системы для
( A − λi E )X = 0 совпадает с кратностью характеристического корня
λi .
Пусть k j - кратность характеристического корня λ j , а rj - ранг матрицы A − λ j E . Тогда число векторов фундаментальной системы решений для однородной системы уравнений n − rj ,
(A − λ E )X = 0 j
равно
где n – размер матрицы A или n=dim V. (V – соответствующее
евклидово пространство). Так как
то ранг (A′ − λ j E ) равен n − k j , то есть совпадает с количеством ненулевых элементов на диагонали. Но ранг
(A′ − λ E ) j
равен рангу
(A − λ E ) = r . j
j
То есть n − k j = rj .
Следовательно, k j = n − rj = dim{v ∈ V , (A − λ j E )v = 0}. Второе замечание касается пункта 4. Достаточно ортогонализировать не всю систему собственных векторов, а только подсистемы векторов, относящихся к одному собственному значению. Действительно, собственные вектора симметрического оператора, отвечающие различным собственным значениям, уже ортогональны. Если x, y такие вектора для симметрического оператора φ, причем ϕx = λx,ϕy = μy, λ ≠ μ ,
то
из
соотношения
(ϕx | y ) = (x | ϕy ) имеем
λ ( x | y ) = μ ( x | y ) , то есть ( x | y ) = 0 , так как λ ≠ μ .
Пример:
q( x) = x12 + x22 + x32 + 4 x1 x2 + 4 x1 x3 + 4 x2 x3 ⎡1 2 2 ⎤ A = ⎢ 2 1 2⎥ . ⎢⎣2 2 1 ⎥⎦
1.Матрица формы q :
2.Характеристический многочлен A − λE = −λ + 3λ2 + 3λ + 5 . Корни характеристического многочлена: λ1 = λ2 = −1, λ3 = 5 . 3.Нахождение фундаментальной системы решений: А) λ = −1 . Система приводится к виду: x1 + x2 + x3 = 0 . Ее фундаментальная система решений: f1 = ( −1,1,0), f 2 = ( −1,0,1) . Б) λ = 5 . Система приводится к виду:
− 2 x1 + x2 + x3 = 0 x1 − 2 x2 + x3 = 0
Ее фундаментальная система решений:
f 3 = (1,1,1) .
4.Так как ( f1 | f 3 ) = ( f 2 | f 3 ) = 0 , то ортогонализуем пару векторов Получим:
b1 = (− 1,1,0), b2 = (−1,−1,2) .
окончательный
f1 , f 2 .
Нормируя вектора b1, b2, f3, получим
ортонормированный
базис
⎛ 1 1 ⎞ e1′ = ⎜ − , ,0 ⎟ , 2 2 ⎠ ⎝
1 2 ⎞ ⎛ 1 ⎛ 1 1 1 ⎞ ,− , , , e′2 = ⎜ − ⎟ , e3′ = ⎜ ⎟. 6 6 6 ⎝ ⎠ ⎝ 3 3 3⎠
5.Квадратичная форма в новом базисе имеет вид: q( x′) = −(x1′ ) − (x2′ ) + 5( x3′ ) 2
⎡ 1 ⎢− 2 ⎢ 1 T =⎢ ⎢ 2 ⎢ ⎢ 0 ⎣
−
диться, что
2
1 6 1 6 2 6
1 ⎤ 3⎥ ⎥ 1 ⎥ . 3⎥ 1 ⎥ ⎥ 3⎦
2
,
матрица
к
новому
базису
Непосредственным вычислением можно убе-
⎡ − 1 0 0⎤ T AT = ⎢⎢ 0 − 1 0⎥⎥ . ⎢⎣ 0 0 5⎥⎦ t
перехода
Литература
1.
Кострикин А.И. Введение в алгебру. Часть 2. Линейная алгеб-
ра. – М.: ФИЗМАТЛИТ, 2000. – 386 с. 2.
Гельфанд И.М. Лекции по линейной алгебре. – М. Наука,
1971. – 271с. 3.
Курош А.Г. Курс высшей алгебры. – М. :Наука”, 1965. – 431с.
4.
Ермолаев Ю.Б. Линейные преобразования. – Казань, 1987. –
47с. 5.
Ермолаев Ю.Б. Линейные операторы в унитарных и евклидо-
вых пространствах. – Казань, 1994. – 45с.