Мiнiстерство освiти i науки України Львiвський нацiональний унiверситет iменi Iвана Франка
О.М. Романiв НАВЧАЛЬНО-МЕТОД...
73 downloads
258 Views
1MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Мiнiстерство освiти i науки України Львiвський нацiональний унiверситет iменi Iвана Франка
О.М. Романiв НАВЧАЛЬНО-МЕТОДИЧНИЙ ПОСIБНИК З ЛIНIЙНОЇ АЛГЕБРИ Частина перша
для студентiв механiко-математичного факультету та факультету прикладної математики i iнформатики
Львiв Видавничий центр ЛНУ iменi Iвана Франка 2007
2
Змiст
3
Змiст Передмова . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Тема 1. Матрицi . . . . . . . . . . . . . . . . . . . . . . .
7
1.1. Означення та основнi позначення . . . . . . . . . . . .
7
1.2. Операцiї над матрицями . . . . . . . . . . . . . . . . .
10
1.3. Одинична матриця . . . . . . . . . . . . . . . . . . . . .
17
1.4. Транспонованi матрицi . . . . . . . . . . . . . . . . . .
18
1.5. Задачi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
Тема 2. Системи лiнiйних рiвнянь . . . . . . . . . . .
21
2.1. Означення та основнi позначення . . . . . . . . . . . .
21
2.2. Еквiвалентнi системи лiнiйних рiвнянь . . . . . . . . .
23
2.3. Елементарнi перетворення матриць . . . . . . . . . . .
24
2.4. Схiдчастi матрицi та системи рiвнянь . . . . . . . . . .
26
2.5. Метод Гауcса . . . . . . . . . . . . . . . . . . . . . . . .
28
2.6. Однорiднi системи лiнiйних рiвнянь . . . . . . . . . . .
34
2.7. Система рiвнянь у матричнiй формi . . . . . . . . . . .
36
2.8. Задачi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
4
Змiст
Тема 3. Арифметичний векторний простiр
. . . . .
39
3.1. Поняття вектора . . . . . . . . . . . . . . . . . . . . . .
39
3.2. Oперацiї над векторами. Векторний простiр . . . . . .
40
3.3. Лiнiйна залежнiсть
. . . . . . . . . . . . . . . . . . . .
42
3.4. Леми про лiнiйну залежнiсть . . . . . . . . . . . . . . .
44
3.5. Пiдпростори. Лiнiйнi оболонки . . . . . . . . . . . . . .
47
3.6. Бази. Розмiрнiсть . . . . . . . . . . . . . . . . . . . . .
48
3.7. Задачi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
Тема 4. Ранг системи векторiв. Ранг матрицi . . . .
53
4.1. Ранг системи векторiв . . . . . . . . . . . . . . . . . . .
53
4.2. Ранг матрицi . . . . . . . . . . . . . . . . . . . . . . . .
54
4.3. Критерiй сумiсностi систем рiвнянь . . . . . . . . . . .
59
4.4. Фундаментальна система розв’язкiв . . . . . . . . . . .
61
4.5. Задачi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66
Тема 5. Теорiя визначникiв . . . . . . . . . . . . . . . .
67
5.1. Визначники другого i третього порядкiв . . . . . . . .
67
5.2. Перестановки. Транспозицiї . . . . . . . . . . . . . . .
71
5.3. Визначники n-го порядку . . . . . . . . . . . . . . . . .
75
5.4. Найпростiшi властивостi визначникiв . . . . . . . . . .
76
5.5. Визначник матрицi трикутного вигляду . . . . . . . .
81
5.6. Мiнори та алгебричнi доповнення . . . . . . . . . . . .
83
5.7. Розклад визначника за рядком . . . . . . . . . . . . . .
86
5.8. Задачi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
Змiст
5
Тема 6. Застосування визначникiв . . . . . . . . . . .
89
6.1. Теорема про ранг матрицi . . . . . . . . . . . . . . . .
89
6.2. Оберненi матрицi . . . . . . . . . . . . . . . . . . . . . .
90
6.3. Формули Крамера . . . . . . . . . . . . . . . . . . . . .
92
6.4. Обчислення обернених матриць . . . . . . . . . . . . .
94
6.5. Матричнi рiвняння . . . . . . . . . . . . . . . . . . . . .
97
6.6. Визначник добутку матриць . . . . . . . . . . . . . . .
99
6.7. Задачi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 Тема 7. Алгебричнi структури. Поля . . . . . . . . . 103 7.1. Вiдображення
. . . . . . . . . . . . . . . . . . . . . . . 103
7.2. Алгебричнi операцiї . . . . . . . . . . . . . . . . . . . . 104 7.3. Напiвгрупи. Моноїди. Групи . . . . . . . . . . . . . . . 107 7.4. Кiльця . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 7.5. Поля . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 7.6. Задачi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 Тема 8. Комплекснi числа . . . . . . . . . . . . . . . . . 115 8.1. Поле комплексних чисел . . . . . . . . . . . . . . . . . 116 8.2. Алгебрична форма комплексних чисел . . . . . . . . . 119 8.3. Спряженi комплекснi числа . . . . . . . . . . . . . . . . 121 8.4. Геометрична iнтерпретацiя . . . . . . . . . . . . . . . . 122 8.5. Модуль та аргумент . . . . . . . . . . . . . . . . . . . . 123 8.6. Тригонометрична форма комплексного числа . . . . . 127 8.7. Формула Муавра . . . . . . . . . . . . . . . . . . . . . . 129
6
Змiст
8.8. Коренi з комплексних чисел . . . . . . . . . . . . . . . 130 8.9. Коренi з 1. Група Cn
. . . . . . . . . . . . . . . . . . . 132
8.10. Первiснi коренi з 1 . . . . . . . . . . . . . . . . . . . . 133 8.11. Задачi . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 Тема 9. Начала теорiї многочленiв . . . . . . . . . . . 137 9.1. Кiльця многочленiв . . . . . . . . . . . . . . . . . . . . 137 9.1.1. Побудова та основнi властивостi кiлець многочленiв (137). 9.1.2. Многочлени як функцiї (функцiональний погляд на многочлени) (140). 9.1.3. Дiлення з остачею (142). 9.2. Коренi многочленiв . . . . . . . . . . . . . . . . . . . . 143 9.2.1. Теорема Безу та схема Горнера (143). 9.2.2. Загальнi властивостi коренiв многочлена (145). 9.2.3. Формули Вiєта (147). 9.2.4. Диференцiювання многочленiв (148). 9.2.5. Кратнiсть кореня (149). 9.2.6. Основна теорема алгебри комплексних чисел (152). Список лiтератури . . . . . . . . . . . . . . . . . . . . . . 157
ПЕРЕДМОВА
5
Передмова Поштовхом для написання даного посiбника послужив курс лiнiйної алгебри, прочитаний мною у Львiвському нацiональному унiверситетi iменi Iвана Франка протягом декiлькох рокiв. Тому посiбник написано вiдповiдно до програми з лiнiйної алгебри для студентiв механiко-математичного факультету та факультету прикладної математики i iнформатики Львiвського нацiонального унiверситету iменi Iвана Франка. У ньому висвiтлено теми, якi вивчають у першому навчальному семестрi. Зокрема у даному посiбнику розглянуто елементи теорiї матриць (означення та основнi типи матриць, операцiї над матрицями, їх властивостi), системи лiнiйних рiвнянь (еквiвалентнi системи лiнiйних рiвнянь, схiдчастi системи рiвнянь та схiдчастi матрицi, метод Гаусса розв’язання системи лiнiйних рiвнянь, однорiднi системи лiнiйних рiвнянь), арифметичнi векторнi простори (вектори та лiнiйнi операцiї над ними, лiнiйна залежнiсть та незалежнiсть векторiв, пiдпростори, бази, розмiрнiсть пiдпросторiв), поняття рангу (ранги системи векторiв та ранги матриць, критерiй сумiсностi систем лiнiйних рiвнянь, фундаментальна система розв’язкiв), основи теорiї визначникiв та їх застосування (визначники та їх властивостi, перестановки, мiнори, алгебраїчнi доповнення, оберненi матрицi, формули Крамера, матричнi рiвняння), елементи теорiї полiв та комплекснi числа (поняття поля, пiдполя i розширення полiв, поле комплексних чисел, формулю-
6
ПЕРЕДМОВА
вання "основної теореми алгебри" та наслiдки з неї), теорiя многочленiв (кiльце многочленiв вiд однiєї змiнної, алгоритм Евклiда, коренi многочленiв, теорема Безу та наслiдки з неї, формули Вiєта, iнтерполяцiйна теорема Лагранжа, рацiональнi дроби). Кожен роздiл завершується перелiком задач, якi рекомендованi для аудиторного та самостiйного розв’язання, а також наведенi номери задач, якi виносяться на контрольнi та модульнi заняття. Я щиро вдячний всiх колишнiм i нинiшнiм спiвробiтникам кафедри алгебри i логiки механiко-математичного факультету, у спiлкуваннi з якими склалися мої уявлення про викладання алгебри.
О. М. Романiв
Тема 1.
Матрицi 1.1. Означення та основнi позначення Нехай m i n — довiльнi натуральнi числа. Означення 1.1.1. Матрицею A над множиною дiйсних чисел R (або (m × n)–матрицею над R) називають прямокутну таблицю
a11 a12 . . . a1n a21 a22 . . . a2n A= . . . . . . . . . . . . . . . . . . . . , am1 am2 . . . amn
(1.1)
елементами aij якої є дiйснi числа. 1 Матрицi позначатимемо великими латинськими лiтерами A, B, C, . . . , а їх елементи — маленькими латинськими лiтерами a, b, c, . . . . При двохiндексному позначеннi елементiв aij перший iндекс i означає номер рядка, а другий iндекс j — номер стовпчика, на перетинi яких розмiщений цей елемент. Поряд з позначеннями матрицi (1.1) часто використовуватимемо скорочене позначення A = [aij ] (i = 1, m; j = 1, n). 1
Загалом можна не обмежуватися множиною дiйсних чисел R, а розглядати довiльне числове поле K.
7
8
Тема 1. Матрицi
Множину всiх (m × n)–матриць над множиною дiйсних чисел R позначатимемо Mm×n (R). Двi матрицi A = [aij ] та B = [bij ] називають рiвними (пишуть A = B), якщо вони мають однаковi розмiри й однаковi вiдповiднi елементи (тобто aij = bij для довiльних iндексiв i та j). Приклад. Розглянемо матрицi µ ¶ 2 −1 3 A= , 5 1 0 µ C=
11 5
−1 1
µ
¶ 2 −1 3 B= , 5 1 0 ¶ 2 −1 3 3 1 0 . , D = 5 0 1 2 5
Легко бачити, що A = B, але A 6= C (оскiльки a11 6= c11 ) i A 6= D (оскiльки матрицi A та D мають рiзнi розмiри).
Якщо m = 1, то матриця (1.1) складається з одного рядка (a11 , a12 , . . . , a1n ); її називають матрицею-рядком або просто рядком. Аналогiчно при n = 1 маємо матрицю-стовпчик або просто стовпчик a11 a21 .. . . am1 Якщо n = m, тобто
a11 a12 . . . a1n a21 a22 . . . a2n A= . . . . . . . . . . . . . . . . . . . , an1 an2 . . . ann
то така (n × n)–матриця A називається квадратною, а число n — її порядком. Множина всiх квадратних матриць порядку n над множиною дiйсних чисел R позначається через Mn (R).
1.1. Означення та основнi позначення
9
Квадратна матриця має двi дiагоналi: одна з них йде з лiвого верхнього кута у правий нижнiй i називається головною дiагоналлю, або просто дiагоналлю, а iнша (яка йде з правого верхнього кута у лiвий нижнiй) — бiчною дiагоналлю. Квадратну матрицю, в якiй всi елементи, що розташованi поза головною дiагоналлю, дорiвнюють нулю, будемо називати дiагональною d1 0 . . . 0 0 d2 . . . 0 . . . . . . . . . . . . . . . . ; 0 0 . . . dn якщо у дiагональнiй матрицi всi дiагональнi елементи рiвнi мiж собою (тобто d1 = d2 = · · · = dn = d), то така матриця d 0 ... 0 0 d . . . 0 . . . . . . . . . . . . . 0 0 ... d називається скалярною. Дiагональна матриця, на головнiй дiагоналлi якої розташованi одиницi, називається одиничною 1 0 ... 0 0 1 . . . 0 . . . . . . . . . . . . . 0 0 ... 1 Матриця, всi елементи якої дорiвнюють нулю, називається нульовою i позначається через O 0 0 ... 0 0 0 . . . 0 O= . . . . . . . . . . . . . 0 0 ... 0
10
Тема 1. Матрицi
Приклад. Розглянемо квадратнi матрицi 3-го порядку 2 0 0 7 0 0 0 , B = 0 7 0 , A = 0 5 0 0 −3 0 0 7 1 0 0 0 0 0 E = 0 1 0 , O = 0 0 0 . 0 0 1 0 0 0 Легко бачити, що матриця A — дiагональна, матриця B — скалярна, матриця E — одинична, матриця O — нульова.
1.2. Операцiї над матрицями Означимо основнi операцiї над матрицями: додавання матриць, множення матрицi на число, множення матриць. Означення 1.2.1. Сумою матриць [aij ] та [bij ] однакового розмiру називається матриця [cij ] того самого розмiру, кожен елемент cij якої є сумою вiдповiдних елементiв aij та bij цих матриць cij = aij + bij . Приклад. ¶ µ µ 7 1 2 3 + 10 −4 5 6
−8 11 =
µ
9 −12
¶ =
1+7 −4 + 10
2−8 5 + 11
3+9 6 − 12
¶
µ =
8 6
−6 16
¶ 12 . −6
Легко бачити, що додавати можна тiльки матрицi однакових розмiрiв. Схематично це можна зобразити так
m
n
+
m
n
=
m
n
1.2. Операцiї над матрицями
11
Означення 1.2.2. Добутком матрицi [aij ] ∈ Mm×n (R) на скаляр λ ∈ R називається матриця [cij ] ∈ Mm×n (R), елементи якої отримують з вiдповiдних елементiв матрицi [aij ] домноженням на скаляр λ cij = λaij . Приклад.
−7 3· 1 3
9 3 · (−7) −2 = 3 · 1 0 3·3
3·9 −21 3 · (−2) = 3 3·0 9
27 −6 . 0
Твердження 1.2.1. Нехай A, B, C — матрицi однакових розмiрiв, λ, µ ∈ R. Правильнi такi рiвностi: 1) A + B = B + A; 2) (A + B) + C = A + (B + C); 3) A + O = A; 4) A + (−A) = O; 5) λ(µA) = (λµ)A; 6) (λ + µ)A = λA + µA; 7) λ(A + B) = λA + λB; 8) 1 · A = A. Доведення. Обмежимося доведенням, наприклад, рiвностi 7. Нехай A = [aij ], B = [bij ] ∈ Mm×n (R). Тодi λ(A + B) = λ([aij ] + [bij ]) = λ[aij + bij ] = [λ(aij + bij )] = = [λaij + λbij ] = [λaij ] + [λbij ] = λ[aij ] + λ[bij ] = λA + λB. Решта рiвностей доводиться аналогiчно. Перед тим як означити поняття добутку матриць загалом, розглянемо µ тривiальний випадок. Нехай (a1 , a2 , . . . , an ) — матри¶ b1 ця-рядок, а b...2 — матриця-стовпець. Добутком таких матриць bn
12
Тема 1. Матрицi
називають число a1 b1 + a2 b2 + · · · + an bn =
n X
ak bk ,
k=1
тобто b1 n b2 X ak bk . (a1 , a2 , . . . , an ) . = a1 b1 + a2 b2 + · · · + an bn = .. k=1 bn (Число ку 1).
n P k=1
ak bk можна вважати квадратною матрицею поряд-
Приклад. ¡ 2,
3,
4,
1 ¢ 2 5 1 = 2 · 1 + 3 · 2 + 4 · 1 + 5 · 3 = 27. 3
Означення 1.2.3. Добутком матрицi A = [aik ] розмiру m×p на матрицю B = [bkj ] розмiру p × n називається матриця C = [cij ] розмiру m × n, в якiй елемент cij , що стоїть на перетинi i-го рядка i j-го стовпчика, дорiвнює "добутку" i-го рядка першої матрицi A на j-ий стовпчик другої матрицi B 2 cij = ai1 b1j + ai2 b2j + · · · + aip bpj =
p X
aik bkj .
k=1 2
Пiд добутком двох рядкiв чисел a1 , a2 , . . . , an та b1 , b2 , . . . , bn розумiємо n P ai b i .
суму добуткiв вiдповiдних чисел цих рядкiв
i=1
1.2. Операцiї над матрицями
13
Приклад. ¶ −7 9 5 2 1 4 −2 4 = · 1 1 3 0 3 0 −1 µ 2 · (−7) + 1 · 1 + 4 · 3 2 · 9 + 1 · (−2) + 4 · 0 = 1 · (−7) + 3 · 1 + 0 · 3 1 · 9 + 3 · (−2) + 0 · 0 µ
¶ 2 · 5 + 1 · 4 + 4 · (−1) = 1 · 5 + 3 · 4 + 0 · (−1) ¶ µ −1 16 10 = . −4 3 17
Особливо просто виглядає добуток на дiагональнi матрицi a11 a12 . . . a1n c1 0 . . . 0 0 c2 . . . 0 a21 a22 . . . a2n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . = am1 am2 . . . amn 0 0 . . . cm c1 a11 c1 a12 . . . c1 a1n c2 a21 c2 a22 . . . c2 a2n = . . . . . . . . . . . . . . . . . . . . . . . . . . . . cm am1 cm am2 . . . cm amn (кожен рядок другої матрицi множиться на вiдповiдний дiагональний елемент першої матрицi) i, аналогiчно,
a11 a12 . . . a1n d1 0 . . . 0 a21 a22 . . . a2n 0 d2 . . . 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . = am1 am2 . . . amn 0 0 . . . dn a11 d1 a12 d2 . . . a1n dn a21 d1 a22 d2 . . . a2n dn = . . . . . . . . . . . . . . . . . . . . . . . . . . . am1 d1 am2 d2 . . . amn dn
14
Тема 1. Матрицi
(кожен стовпчик першої матрицi множиться на вiдповiдний дiагональний елемент другої матрицi). Приклади. µ ¶ 2 0 0 µ ¶ µ ¶ 1 −2 4 1 · 2 −2 · 3 4 · 1 2 −6 4 0 3 0 = 1. = . 2 5 7 2·2 5·3 7·1 4 15 7 0 0 1 µ ¶µ ¶ µ ¶ µ ¶ −2 0 1 −2 4 −2 · 1 −2 · (−2) −2 · 4 −2 4 −8 2. = = . 0 3 2 5 7 3·2 3·5 3·7 6 15 21
Зауваження 1.2.1. Не кожнi двi матрицi можна перемножити. Операцiя множення двох матриць A та B визначена лише тодi, коли кiлькiсть стовпцiв першої матрицi A дорiвнює кiлькостi рядкiв другої матрицi B (зокрема, множення квадратних матриць того самого порядку можливе завжди). Матриця-добуток AB має стiльки рядкiв, скiльки їх має матриця A, стiльки стовпцiв, скiльки їх має матриця B. Схематично це можна зобразити так: n m
Приклади. ¶µ µ x1 a b 1. x2 c d
p
y1 y2
×
z1 z2
¶
µ =
p
ax1 + bx2 cx1 + dx2
=
ay1 + by2 cy1 + dy2
m
n
¶ az1 + bz2 . cz1 + dz2
У зворотному порядку добуток цих матриць невизначений. 2 3 4 1·2 1·3 1·4 1·5 1 2 ¡ ¢ 2 · 2 2 · 3 2 · 4 2 · 5 4 6 8 2. 1 2, 3, 4, 5 = 1 · 2 1 · 3 1 · 4 1 · 5 = 2 3 4 3·2 3·3 3·4 3·5 6 9 12 3
5 10 . 5 15
1.2. Операцiї над матрицями
15
Зауваження 1.2.2. Добуток матриць загалом не володiє переставною властивiстю, тобто AB 6= BA (для довiльних матриць A та B вiдповiдних розмiрiв). Наприклад,
µ A= µ AB =
¶ µ ¶ 1 2 −1 , B= , 3 5 4 ¶ µ ¶ 3 0 −1 , BA = , 10 13 17
1 2
7 19
AB 6= BA.
Означення 1.2.4. Якщо ж для матриць A та B (вiдповiдних розмiрiв) справджується рiвнiсть AB = BA, то кажуть, що матрицi A та B комутують. Приклад.
Матрицi µ A=
1 −2
2 0
¶
µ та
комутують мiж собою, оскiльки ¶ µ −7 −6 , AB = 6 −4
B=
µ BA =
¶
−3 −2
2 −4
−7 6
¶ −6 , −4
тобто AB = BA.
Твердження 1.2.2. Властивостi операцiї множення матриць (AB)C = A(BC),
(1.2)
A(B + C) = AB + AC,
(1.3)
(B + C)D = BD + CD,
(1.4)
(λA)B = A(λB) = λ(AB),
λ∈R
(1.5)
(тут передбачено, що розмiри матриць A, B, C та D узгодженi так, що згаданi добутки та суми мають змiст).
16
Тема 1. Матрицi
Доведення. Спочатку доведемо, що добуток матриць асоцiативний (рiвнiсть (1.2)). Нехай A ∈ Mm×p (R), B ∈ Mp×q (R), C ∈ Mq×n (R). Тодi AB ∈ Mm×q (R), BC ∈ Mp×n (R), тобто всi добутки, що входять в (1.2), визначенi. Маємо
(AB)C = ([aij ] · [bij ])[cij ] =
p hX
i aik bkj · [cij ] =
k=1
=
q ³³X p hX l=1
=
q ³X p ´ ´i hX ´i aik bkl clj = aik bkl clj =
k=1
p ³X q hX
´i aik bkl clj
k=1 l=1
=
p hX
l=1 k=1 q ³X
k=1
l=1
aik
´i bkl clj
= A(BC).
Тепер доведемо властивiсть (1.3). Нехай A = [aij ] ∈ Mm×p (R), B = [bij ] ∈ Mp×n (R), C = [cij ] ∈ Mp×n (R). Тодi
A(B + C) =
p hX
i aik (bkj + ckj ) =
k=1 p p p i i hX hX X aik bkj + aik ckj = (aik bkj + aik ckj ) = = k=1
k=1
=
p hX k=1
i aik bkj +
k=1 p hX
i aik ckj = AB + AC.
k=1
Властивостi (1.4) та (1.5) доводяться аналогiчно.
1.3. Одинична матриця
17
1.3. Одинична матриця Нагадаємо означення одиничної матрицi. Означення 1.3.1. Одиничною матрицею En називається квадратна матриця порядку n, в якiй на головнiй дiагоналi стоять одиницi, на всiх iнших мiсцях нулi 1 0 ... 0 0 1 . . . 0 En = . . . . . . . . . . . . . 0 0 ... 1 Здебiльшого iндекс n в позначеннi одиничної матрицi опускають i пишуть просто E. Одиничну матрицю також зручно записувати так: En = [δij ], © 1, якщо i = j, де δij = 0, якщо i 6= j — символ Кронекера. Твердження 1.3.1. Нехай A ∈ Mm×n (R). Тодi AEn = A,
Em A = A.
(1.6)
Доведення. Доведемо першу з рiвностей (1.6) AEn =
n hX
i aik δkj .
k=1
Оскiльки δkj = 1 при k = j i δkj = 0 у всiх iнших випадках, то n P сума aik δkj зводиться до одного доданка aij , тому k=1
AEn = [aij ] = A. Друга з рiвностей (1.6) доводиться аналогiчно.
18
Тема 1. Матрицi
1.4. Транспонованi матрицi Означення 1.4.1. Для кожної матрицi a11 a12 . . . a1n a21 a22 . . . a2n A= . . . . . . . . . . . . . . . . . . . . am1 am2 . . . amn визначимо транспоновану матрицю a11 a21 . . . am1 a12 a22 . . . am2 A> = . . . . . . . . . . . . . . . . . . . , a1n a2n . . . amn рядками якої є стовпчики матрицi A, стовпчиками — рядки матрицi A. Якщо (i, j)-й елемент транспонованої матрицi позначити через a> ij , то a> ij = aji . Наприклад,
µ
1 1
9 7
9 0
5 1
¶>
1 9 = 9 5
1 7 . 0 1
Твердження 1.4.1. Для довiльних A, B ∈ Mm×n (R), λ ∈ R правильнi такi властивостi: ¡ > ¢> A = A, (A + B)> = A> + B > , (λA)> = λA> . Їхня правильнiсть очевидно випливає з означення 1.4.1.
1.4. Транспонованi матрицi
19
Твердження 1.4.2. Для довiльних матриць A, B вiдповiдних розмiрiв (саме таких, що добуток AB має змiст) правильна рiвнiсть (AB)> = B > A> . Доведення. Припустимо, що A ∈ Mm×p (R) i B ∈ Mp×n (R). Тодi AB ∈ Mm×n (R) i (AB)> ∈ Mn×m (R). З iншого боку, оскiльки B > ∈ Mn×p (R) та A> ∈ Mp×m (R), то, як наслiдок, добуток B > A> визначений i B > A> ∈ Mn×m (R). Отож, матрицi (AB)> i B > A> мають однаковi розмiри. Залишається перевiрити, що їхнi вiдповiднi елементи дорiвнюють один одному. Нехай (AB)> = [cij ]. За означенням транспонування cij дорiвнює добутку j-го рядка матрицi A на i-ий стовпець матрицi B cij = aj1 b1i + aj2 b2i + · · · + ajp bpi . Якщо B > A> = [dij ], то елемент dij дорiвнює добутку i-го стовпця матрицi B на j-ий рядок матрицi A dij = b1i aj1 + b2i aj2 + · · · + bpi ajp = aj1 b1i + aj2 b2i + · · · + ajp bpi . Отже, cij = dij , що i треба було довести. Означення 1.4.2. Якщо квадратна матриця S дорiвнює своїй транспонованiй матрицi S > , тобто S = S > , то така матриця називається симетричною. Якщо квадратна матриця K вiдрiзняється знаком вiд своєї транспонованої матрицi K > , тобто K = −K > , то така матриця називається кососиметричною.
20
Тема 1. Матрицi
Приклад. Симетрична матриця
1 9 4
9 7 0
4 0 . 5
Кососиметрична матриця
0 −2 5
2 0 −3
−5 3 . 0
1.5. Задачi Для аудиторного розв’язання [13]: №№ 788, 790, 799, 801, 804, 806, 808, 811 (а), 815 (а), 817, 827. Для самостiйного розв’язання [13]: №№ 789, 791, 792, 800, 803, 805, 809, 811 (г), 815 (б), 828. Задачi контрольної роботи i колоквiуму [13]: №№ 788 − 811, 814, 815, 827 − 829, 882, 883, 888, 889, 890. [14]: №№ 17.1 − 17.5, 17.7, 17.12 − 17.17, 18.1, 19.3, 19.4, 19.5, 19.7.
Тема 2.
Системи лiнiйних рiвнянь 2.1. Означення та основнi позначення Нехай m, n — фiксованi натуральнi числа. Означення 2.1.1. Лiнiйним рiвнянням з n невiдомими x1 , x2 , . . . , xn називається рiвняння вигляду a1 x1 + a2 x2 + · · · + an xn = b. Елементи a1 , a2 , . . . , an називаються коефiцiєнтами рiвняння, а елемент b — вiльним членом. Означення 2.1.2. Системою m лiнiйних рiвнянь з n невiдомими x1 , . . . , xn називається система вигляду a11 x1 + a12 x2 + · · · + a1n xn = b1 , a x + a x + ··· + a x = b , 21 1 22 2 2n n 2 (2.1) ................................. a x + a x + · · · + a x = b . m1 1 m2 2 mn n m Вiдповiдно, елементи aij називають коефiцiєнтами системи рiвнянь, елементи bi — вiльними членами. Вважатимемо, що коефiцiєнти aij та вiльнi члени bi — дiйснi числа (хоча цей випадок об’єктивно зовсiм не є простiшим вiд загального, коли aij та bi належать довiльному полю K). 21
22
Тема 2. Системи лiнiйних рiвнянь
Означення 2.1.3. Розв’язком системи рiвнянь (2.1) називається така впорядкована послiдовнiсть елементiв u1 , u2 , . . . , un , що пiсля замiни в системi (2.1) невiдомих xi елементами ui одержуємо систему правильних рiвностей ai1 u1 + ai2 u2 + · · · + ain un = bi
(i = 1, 2, . . . , m).
Розв’язати систему лiнiйних рiвнянь означає знайти всi її розв’язки. Означення 2.1.4. Система лiнiйних рiвнянь називається сумiсною, якщо вона має хоча б один розв’язок, i несумiсною у протилежному випадку. Означення 2.1.5. Сумiсну систему лiнiйних рiвнянь називають визначеною, якщо вона має єдиний розв’язок, i невизначеною, якщо вона має безлiч розв’язкiв. Приклад. Система лiнiйних рiвнянь ( x1 − x2 = 5, x1 − x2 = 1 несумiсна, а система
(
2x1 + x2 = 4, x1 − x2 = −1
сумiсна i визначена, оскiльки має єдиний розв’язок x1 = 1, x2 = 2. Прикладом невизначеної системи лiнiйних рiвнянь може бути система x1 + x2 + x3 = 4.
Означення 2.1.6. Матриця A, складена з коефiцiєнтiв бiля невiдомих системи (2.1), називається (основною) матрицею системи a11 a12 . . . a1n a21 a22 . . . a2n A= ... ... ... ... . am1 am2 . . . amn
2.2. Еквiвалентнi системи лiнiйних рiвнянь
23
Якщо до основної матрицi A системи (2.1) приєднати стовпчик вiльних членiв, то отримаємо так звану розширену матрицю системи a11 a12 . . . a1n b1 a21 a22 . . . a2n b2 Ab = ... ... ... ... ... . am1 am2 . . . amn bm Очевидно, що для задання системи лiнiйних рiвнянь достатньо задати її розширену матрицю.
2.2. Елементарнi перетворення системи лiнiйних рiвнянь. Еквiвалентнi системи лiнiйних рiвнянь Означення 2.2.1. Двi системи лiнiйних рiвнянь називаються еквiвалентними, якщо вони мають однаковi множини розв’язкiв, тобто якщо кожен розв’язок першої з систем є розв’язком другої та навпаки. Зокрема, прийнято вважати, що кожнi двi несумiснi системи еквiвалентнi. Означення 2.2.2. Елементарними перетвореннями системи лiнiйних рiвнянь називають перетворення таких трьох типiв: 1) додавання до одного рiвняння iншого, помноженого на скаляр; 2) перестановка мiсцями двох рiвнянь; 3) множення будь-якого рiвняння на ненульовий скаляр. Довiльний розв’язок початкової (вихiдної) системи лiнiйних рiвнянь є розв’язком нової системи, отриманої з вихiдної елементарними перетвореннями. З iншого боку, початкову систему
24
Тема 2. Системи лiнiйних рiвнянь
рiвнянь можна отримати з нової системи елементарними перетвореннями того самого типу. Наприклад, якщо додамо до першого рiвняння друге, помножене на λ, то можна повернутися назад, додавши до першого рiвняння нової системи її друге рiвняння (воно таке саме, як у вихiднiй системi), помножене на (−λ). Отож, правильна така теорема. Теорема 2.2.1. Довiльнi елементарнi перетворення системи лiнiйних рiвнянь приводять до еквiвалентної системи. Оскiльки виконання елементарних перетворень над системою лiнiйних рiвнянь зводиться до аналогiчних перетворень її розширеної матрицi, то розглянемо вiдповiдне означення елементарних перетворень для матриць.
2.3. Елeментарнi перетворення. Елементарнi матрицi. Еквiвалентнi матрицi Означення 2.3.1. Елементарними перетвореннями рядкiв (або стовпцiв) матрицi називають перетворення таких трьох типiв: 1) додавання до рядка (стовпця) матрицi iншого рядка (стовпця), помноженого на скаляр; 2) перестановка мiсцями двох рядкiв (стовпцiв) матрицi; 3) множення рядка (стовпця) матрицi на ненульовий скаляр. Означення 2.3.2. Елементарними матрицями називають квадратнi матрицi таких трьох типiв: 1) матрицi, вiдмiннi вiд одиничної наявнiстю на перетинi i-го рядка та j-го стовпчика (i 6= j) деякого ненульового елемента c — такi матрицi позначають E + c · Eij ; 2) матрицi, якi отримують з одиничної перестановкою мiсцями i-го та j-го рядкiв (i 6= j), — позначають Pij ;
2.3. Елементарнi перетворення матриць
25
3) матрицi, вiдмiннi вiд одиничної тим, що замiсть одиницi в i-му рядку мiститься ненульовий елемент c — такi матрицi позначають Qi (c). Приклади. Розглянемо множину M3 (R) квадратних матриць третього порядку. Маємо 1 0 c 1 0 0 E + c · E13 = 0 1 0 , E + d · E32 = 0 1 0 , 0 0 1 0 d 1
0 P12 = 1 0 u Q1 (u) = 0 0
1 0 0 0 1 0
0 0 , 1 0 0 , 1
0 0 1 P13 = 0 1 0 , 1 0 0 1 0 0 Q2 (v) = 0 v 0 . 0 0 1
Безпосередньою перевiркою легко переконатися, що елементарнi перетворення рядкiв (стовпцiв) будь-якої матрицi рiвносильнi домноженню її злiва (справа) на вiдповiднi елементарнi матрицi. Наприклад, множення матрицi A злiва на матрицю E + c · Eij (i 6= j) приводить до того, що до i-го рядка матрицi A додається її j-ий рядок, помножений на елемент c (iншi рядки не змiнюються)
1 0 0
0 1 0
2 1 0 · 4 1 7
3 6 = 9 1+7·2 4 = 7 2 5 8
2+8·2 5 8
3+9·2 15 =4 6 9 7
18 5 8
21 6 . 9
Означення 2.3.3. Матрицi A та B називають еквiвалентними (позначають A ∼ B), якщо матрицю B отримують з матрицi A за допомогою скiнченої послiдовностi елементарних перетворень рядкiв (стовпцiв) або, навпаки, матрицю A одержуємо з матрицi B елементарними перетвореннями рядкiв (стовпцiв).
26
Тема 2. Системи лiнiйних рiвнянь
Приклад. Матрицi µ A=
1 3
2 4
¶
µ та
B=
еквiвалентнi, оскiльки матрицю B отримують рядкiв. Аналогiчно, з попереднього прикладу 1 2 3 15 18 4 5 6 ∼ 4 5 7 8 9 7 8
3 1
4 2
¶
з матрицi A перестановкою
21 6 , 9
оскiльки другу матрицю отримують з першої додаванням до першого рядка третього рядка, помноженого на число 2.
2.4. Схiдчастi матрицi та системи лiнiйних рiвнянь Означення 2.4.1. Прямокутна m × n-матриця A = [aij ] називається схiдчастою, якщо вона задовольняє такi умови: 1) нульовi рядки (якщо такi iснують) розташованi нижче всiх ненульових рядкiв; 2) якщо a1j1 , a2j2 , . . . , arjr — першi ненульовi елементи першого, другого, . . . , r-го рядкiв, то j1 < j2 < · · · < jr (тобто номери стовпчикiв, в яких розмiщенi першi ненульовi елементи рядкiв матрицi, утворюють зростаючу послiдовнiсть). Iнакше кажучи, схiдчаста матриця — це матриця вигляду |a1j1 . . . . . . . . . . . . . . . . . . . . . . . . . . . |a2j2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (2.2) , |arjr . . . . . . O
2.4. Схiдчастi матрицi та системи рiвнянь
27
в якiй кутовi елементи a1j1 , a2j2 , . . . , arjr вiдмiннi вiд нуля, а всi елементи, що розташованi злiва та нижче вiд них, дорiвнюють нулю (при цьому j1 < j2 < · · · < jr ). Наприклад, схiдчастими матрицями ця; матриця-рядок; матрицi вигляду 1 4 3 9 5 1 4 0 0 6 3 2 , 0 5 0 0 0 1 3 0 0 0 0 0 0 0 0 0 Матриця
1 0 0 0
1 0 8 0
є: нульова матриця; одинична матри 5 2 , 3 8
3 6 6 0
9 3 1 0
2 6 9 0
4 9 2 5
4 0 0 0
4 6 0 0
3 6 2 0
2 2 . 5 4
не є схiдчастою.
Означення 2.4.2. Система лiнiйних рiвнянь називається схiдчастою, якщо її розширена матриця схiдчаста. Ще одним цiкавим прикладом схiдчастих матриць i систем лiнiйних рiвнянь є трикутнi матрицi та трикутнi системи рiвнянь. Означення 2.4.3. Квадратна матриця a11 a12 . . . a1n 0 a22 . . . a2n A= . . . . . . . . . . . . . . . . . . . 0 0 . . . ann називається верхньою трикутною, якщо aij = 0 при i > j; якщо, крiм того, ще й aii 6= 0, то матриця A називається строго трикутною. Аналогiчне означення можна сформулювати для нижнiх трикутних матриць. Система лiнiйних рiвнянь називається (строго) трикутною, якщо її основна матриця (строго) трикутна.
28
Тема 2. Системи лiнiйних рiвнянь
Приклад. Система лiнiйних рiвнянь 2x1 − x2 + 4x3 = 5, x2 − 3x3 = 0, x3 = 6 є строго трикутною, оскiльки строго трикутною є її основна матриця 2 −1 4 0 1 −3 . 0 0 1
2.5. Метод Гаусcа розв’язку системи лiнiйних рiвнянь. Аналiз можливих випадкiв Покажемо, що довiльну систему лiнiйних рiвнянь можна звести за допомогою елементарних перетворень до еквiвалентної їй схiдчастої системи. Оскiльки всi розв’язки схiдчастої системи лiнiйних рiвнянь легко вiднайти, то отримуємо простий унiверсальний метод розв’язку систем лiнiйних рiвнянь — метод Гаусcа або так званий метод послiдовного виключення змiнних. Викладення цього методу зручно провести не для систем лiнiйних рiвнянь, а для їх розширених матриць. Опишемо алгоритм зведення за допомогою елементарних перетворень довiльної матрицi до схiдчастого вигляду. Iнакше кажучи, доведемо таку теорему. Теорема 2.5.1. Довiльна матриця еквiвалентна схiдчастiй матрицi. Доведення. Якщо матриця нульова, то вона вже схiдчаста i доводити нiчого. Тому нехай матриця A є ненульовою i нехай, з точнiстю до перестановки рядкiв, a1j1 — перший ненульовий елемент першого ненульового стовпчика матрицi, тобто матриця A
2.5. Метод Гауcса
29
має вигляд
0 . . . 0 a1j1 a1j2 . . . . . . 0 . . . 0 a2j1 a2j2 . . . . . . A= 0 . . . 0 a3j1 a3j2 . . . . . . , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 . . . 0 amj1 amj2 . . . . . . де a1j1 6= 0. Виконаємо над цiєю матрицею такi елементарнi перетворення: a 1 до другого рядка додамо перший, помножений на − a2j ; до тре1j 1
a
3j1 тього рядка також додамо перший, але помножений уже на − a1j 1 i т.д. У результатi отримаємо матрицю 0 . . . 0 a1j1 a1j2 . . . . . . 0 . . . 0 0 a02j2 . . . . . . 0 0 . 0 . . . 0 0 a . . . . . . A = 3j 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 . . . 0 0 a0mj2 . . . . . .
Далi з точнiстю до перестановок рядкiв матрицi A0 припустимо, що елемент a02j2 6= 0. Тодi над матрицею A0 виконаємо аналогiчнi наведеним елементарнi перетворення, використовуючи уже a0
не перший, а другий рядок: помножимо другий рядок на − a03j2 2j2
i додамо до третього; далi помножимо другий рядок на
a0 − a04j2 2j
i
2
додамо до четвертого i т.д. Цей процес скiнченний, оскiльки матриця A має скiнченну кiлькiсть рядкiв (скiнченний розмiр). Отож, у пiдсумку отримаємо схiдчасту матрицю вигляду (2.2). З теореми 2.5.1 очевидно випливає така теорема. Теорема 2.5.2. Довiльна система лiнiйних рiвнянь еквiвалентна схiдчастiй системi.
30
Тема 2. Системи лiнiйних рiвнянь
Приклад. Зведемо систему лiнiйних рiвнянь x1 + 2x2 − x3 = 2, 2x1 + x2 + x3 = 7, 4x1 − x2 − 2x3 = −4 до схiдчастого вигляду. Для цього приведемо до схiдчастого вигляду її розширену 1 2 −1 2 1 2 −1 2 1 2 2 1 1 7 ∼ 0 −3 3 3 ∼ 0 −3 −12 4 −1 −2 −4 0 −9 2 0 0
матрицю −1 3 −7
2 3 −21
(спочатку до другого рядка додали перший, помножений на −2; потiм до третього рядка додали перший, помножений на −4; насамкiнець, до третього рядка додали другий, помножений на −3). Цiй схiдчастiй матрицi вiдповiдає схiдчаста система лiнiйних рiвнянь x1 + 2x2 − x3 = 2, −3x2 + 3x3 = 3, −7x3 = −21. Звiдси x3 = 3, x2 =
3−3x3 −3
= 2, x1 = 2 + x3 − 2x2 = 1.
З теореми 2.5.2 легко бачити таке: для того щоб навчитися розв’язувати систему лiнiйних рiвнянь, достатньо навчитися знаходити розв’язки лише еквiвалентної їй схiдчастої системи. Нехай система лiнiйних рiвнянь (2.1) уже приведена до схiдчастого вигляду a11 x1 + a13 x3 + · · · + a1s xs + · · · + a1n xn = a22 x2 + · · · + a2s xs + · · · + a2n xn = ........................ ass xs + · · · + asn xn = 0= де a11 6= 0, . . . , ass 6= 0. Можливi три принципово рiзнi випадки.
b1 , b2 , ... bs , bs+1 ,
(2.3)
2.5. Метод Гауcса
31
Перший випадок. bs+1 6= 0. У цьому випадку система мiстить рiвняння вигляду 0 · x1 + 0 · x2 + · · · + 0 · xn = bs+1 i, отже, несумiсна. Другий випадок. bs+1 = 0 i s = n. У цьому випадку отримуємо строго трикутну систему. З останнього рiвняння ann xn = bn однозначно визначається xn , потiм iз передостаннього рiвняння an−1,n−1 xn−1 + an−1,n xn = bn−1 , iз врахуванням значення уже знайденого xn , знаходиться xn−1 i т.д. В пiдсумку отримаємо, що система має єдиний розв’язок (є визначеною). Третiй випадок. bs+1 = 0 i s < n. Нехай у цьому випадку з точнiстю до перенумерацiї невiдомих маємо, що 1, 2, . . . , s — номери перших ненульових коефiцiєнтiв ненульових рiвнянь системи. Невiдомi x1 , x2 , . . . , xs назвемо головними або основними, а всi iншi xs+1 , xs+2 , . . . , xn — вiльними. Пiсля вiдкидання нульових рiвнянь i перенесення членiв iз вiльними невiдомими у праву частину отримуємо строго трикутну систему стосовно головних невiдомих. Розв’язуючи її так само, як у попередньому випадку, виразимо головнi невiдомi через вiльнi x1 = c11 xs+1 + c12 xs+2 + · · · + c1,n−s xn + d1 , x = c x 2 21 s+1 + c22 xs+2 + · · · + c2,n−s xn + d2 , (2.4) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x = c x s s1 s+1 + cs2 xs+2 + · · · + cs,n−s xn + ds . Цi вираження називають загальним розв’язком системи. Всi частковi розв’язки системи отримують iз загального пiдстанов-
32
Тема 2. Системи лiнiйних рiвнянь
кою замiсть вiльних членiв конкретних значень. Оскiльки цi значення можна вибирати довiльно, то система має нескiнченно багато розв’язкiв (є невизначеною). Приклад. Розв’яжемо систему лiнiйних рiвнянь x1 + 2x2 − x3 + x4 = 3, 2x1 + x2 + x3 − 2x4 = 5, 4x1 − x2 − 2x3 + x4 = −3. Застосуємо метод Гаусса. Випишемо розширену матрицю заданої системи лiнiйних рiвнянь 1 2 −1 1 3 2 1 1 −2 5 . −3 4 −1 −2 1 До другого рядка цiєї матрицi додамо перший рядок, помножений на −2, а до третього додамо знову перший, але помножений на −4 1 2 −1 1 3 0 −3 3 −4 −1 . 0 −9 2 −3 −15 Тепер до третього рядка додамо другий, помножений на −3 3 1 2 −1 1 0 −3 3 −4 −1 . 0 0 −7 9 −12 Цiй схiдчастiй матрицi вiдповiдає система лiнiйних рiвнянь x1 + 2x2 − x3 + x4 = 3, −3x2 + 3x3 − 4x4 = −1, −7x3 + 9x4 = −12. Оскiльки ця система мiстить три рiвняння i чотири невiдомi, то для знаходження її розв’язку одну невiдому (4 − 3 = 1), наприклад, x4 вiзьмемо за вiльну, а решту виразимо через неї: з третього рiвняння x3 = − 17 (−12 − 9x4 ) = 12 + 97 x4 ; 7 з другого рiвняння 1 + 97 x4 )) = 43 − 21 x4 ; x2 = − 13 (−1 + 4x4 − 3x3 ) = − 13 (−1 + 4x4 − 3( 12 7 21 з першого рiвняння 8 x1 = 3−x4 +x3 −2x2 = 3−x4 − 17 (−12−9x4 )−2(− 13 (− 43 + 17 x4 )) = 13 + 21 x4 . 7 21
2.5. Метод Гауcса
33
Отже, загальний розв’язок рiвняння має вигляд 8 x1 = 13 + 21 x4 , 21 1 − x , x2 = 43 21 21 4 12 9 x = + x , 3 7 7 4 x4 ∈ R. Для отримання часткового розв’язку пiдставимо замiсть вiльної невiдомої довiльне значення, наприклад, нехай x4 = 1. Тодi x3 = 3, x2 = 2, x1 = 1. Отож, частковий розв’язок має вигляд x1 = 1, x2 = 2, x3 = 3, x4 = 1.
Зауваження 2.5.1. Верхню строго трикутну матрицю за допомогою елементарних перетворень рядкiв можна звести до дiагональної матрицi. Для цього спочатку потрiбно до кожного рядка (крiм останнього) додати помножений на вiдповiдний скаляр останнiй рядок так, щоб всi, крiм дiагонального, елементи останнього стовпчика дорiвнювали нулю. Аналогiчно, додаючи помножений на певний коефiцiєнт передостаннiй рядок, треба зробити, щоб дорiвнювали нулю всi, крiм дiагонального, елементи передостаннього стовпчика i т.д. В результатi отримаємо дiагональну матрицю. Застосувавши цi мiркування до систем лiнiйних рiвнянь, легко бачити, що при їх розв’язаннi можна не зупинятися на зведеннi до схiдчастого вигляду, а продовжити перетворення i привести матрицю коефiцiєнтiв бiля головних невiдомих до дiагональної матрицi. Тодi загальний розв’язок легко зчитується з отриманої розширеної матрицi системи. Наведена процедура часто застосовується при розв’язаннi систем лiнiйних рiвнянь i називається зворотним ходом методу Гаусса.
34
Тема 2. Системи лiнiйних рiвнянь
Приклад. Застосуємо зворотний хiд методу Гаусса до розв’язання такої системи лiнiйних рiвнянь: x1 + 2x2 − x3 = 2, 2x1 + x2 + x3 = 7, 4x1 − x2 − 2x3 = −4. Легко переконатись (ми це вже виконували) в правильностi еквiвалентних матриць: 2 2 1 2 −1 1 2 −1 2 1 1 7 ∼ 0 −3 3 3 ∼ 4 −1 −2 −4 0 −9 2 −12 1 2 ∼ 0 −3 0 0
такого ланцюга
−1 3 −7
2 3 . −21
До останньої матрицi застосуємо зворотний хiд методу Гаусса 1 2 −1 2 1 2 0 5 0 −3 3 3 ∼ 0 −1 0 −2 ∼ 0 0 −7 −21 0 0 −7 −21 1 0 0 0 ∼ 0 −1 0 0 −7
1 −2 . −21
(для переходу вiд першої матрицi до другої ми другий рядок подiлили на 3 i додали до нього третiй, подiлений на 7, а потiм до першого рядка додали третiй, подiлений на −7; для переходу вiд другої матрицi до третьої до першого рядка додали другий рядок, помножений на 2). Останнiй матрицi вiдповiдає система лiнiйних рiвнянь = 1, x1 −x2 = −2, −7x3 = −21. З цiєї системи легко зчитується її розв’язок x1 = 1, x2 = 2, x3 = 3.
2.6. Однорiднi системи лiнiйних рiвнянь Означення 2.6.1. Однорiдною системою лiнiйних рiвнянь називають систему лiнiйних рiвнянь, в якiй всi вiльнi члени дорiв-
2.6. Однорiднi системи лiнiйних рiвнянь
35
нюють нулю a11 x1 + a12 x2 + · · · + a1n xn = 0, a x + a x + · · · + a x = 0, 21 1 22 2 2n n ................................. a x + a x + · · · + a x = 0. m1 1 m2 2 mn n
(2.5)
Легко бачити, що будь-яка однорiдна система лiнiйних рiвнянь є сумiсною, оскiльки завжди має хоча б один розв’язок (наприклад, нульовий x1 = x2 = · · · = xn = 0). Лема 2.6.1 (Гауссa). Якщо в однорiднiй системi лiнiйних рiвнянь кiлькiсть рiвнянь менша, нiж кiлькiсть невiдомих, то ця система має ненульовий розв’язок. Доведення. Розглянемо однорiдну систему лiнiйних рiвнянь (2.5), яка, як бачимо, має n невiдомих та m рiвнянь. Цю систему елементарними перетвореннями можна звести до схiдчастого вигляду (2.3), де, зрозумiло, b1 = · · · = bs+1 = 0. У нашому випадку s ≤ m < n, тому наявний третiй випадок методу Гауса. Отож, система має безлiч розв’язкiв, зокрема, i ненульовий. Приклад. Розв’яжемо однорiдну систему систему лiнiйних рiвнянь x1 + x2 − 2x3 − 4x4 = 0, x1 + 2x2 − x3 + 6x4 = 0, −2x1 − x2 + 3x3 − 6x4 = 0. Для цього приведемо до схiдчастого вигляду її розширену матрицю
1 1 −2
1 2 −1
−4 0 1 1 −2 −4 0 6 0 ∼ 0 1 1 10 0 ∼ −6 0 0 1 −1 −14 0 1 1 −2 −4 0 1 1 −2 −4 1 10 0 ∼ 0 1 1 10 ∼ 0 1 0 0 −2 −24 0 0 0 1 12
−2 −1 3
0 0 . 0
36
Тема 2. Системи лiнiйних рiвнянь
Цiй схiдчастiй матрицi вiдповiдає така система лiнiйних рiвнянь x1 + x2 − 2x3 − 4x4 = 0, x2 + x3 + 10x4 = 0, x3 + 12x4 = 0. Звiдси, взявши, наприклад, змiнну x4 за вiльну, а змiннi x1 , x2 , x3 за головнi, отримаємо загальний розв’язок системи x1 = −22x4 , x2 = 2x4 , x3 = −12x4 , x4 ∈ R. Для отриманнi хоча б одного часткового ненульовго розв’язку даної системи, достатньо замiсть вiльної змiнної x4 взяти довiльне дiйсне ненульове значення. Наприклад, вызьмемо x4 = 1. Тодi частковим розв’язком даної системи буде x1 = −22, x = 2, 2 x3 = −12, x4 = 1.
2.7. Матричний вигляд системи лiнiйних рiвнянь. Метод Гаусса в матричнiй iнтерпретацiї Систему лiнiйних рiвнянь (2.1) можна записати у так званому матричному виглядi A · X = B, (2.6) де через A позначено матрицю коефiцiєнтiв системи, через X — стовпчик невiдомих, через B — стовпчик вiльних членiв x1 b1 a11 a12 . . . a1n x2 b2 a21 a22 . . . a2n A= .. , B = .. . ... ... ... ... , X = . . am1 am2 . . . amn xn bm
2.7. Система рiвнянь у матричнiй формi
37
Справдi, за правилом множення матриць добуток AX є стовпчиком з m рядками, i-ий елемент якого дорiвнює ai1 x1 + ai2 x2 + · · · + ain xn . Прирiвнюючи цей елемент до i-го елемента bi стовпчика матрицi B, отримуємо i-тe рiвняння системи (2.1). Наприклад, системa лiнiйних рiвнянь x1 + 2x2 − x3 = 2, 2x1 + x2 + x3 = 7, 4x1 − x2 − 2x3 = −4 у матричному записi має такий вигляд: 1 2 −1 x1 2 2 1 1 · x2 = 7 . 4 −1 −2 x3 −4
Оскiльки елементарне перетворення рядкiв матрицi A рiвносильне її домноженню злiва на вiдповiдну елементарну матрицю (див. § 2.3), то легко бачити, що метод Гаусса в матричнiй iнтерпретацiї полягає в послiдовному домноженнi матричного рiвняння (2.6) злiва на вiдповiднi елементарнi матрицi з метою зведення матрицi A до схiдчастого вигляду. Приклад. Розглянемо матричий запис системи лiнiйних рiвнянь з попереднього прикладу 1 2 −1 x1 2 2 1 1 · x2 = 7 . 4 −1 −2 x3 −4 Для зведення матрицi коефiцiєнтiв цiєї системи до схiдчастого вигляду домножимо її послiдовно злiва на елементарнi матрицi E+(−2)E21 , E+(−4)E31 , E + (−3)E32 ¡ ¢¡ ¢¡ ¢ 1 E +(−3)E32 E +(−4)E31 E +(−2)E21 2 4
2 1 −1
−1 1 1 = 0 −2 0
2 −3 0
−1 3 . −7
38
Тема 2. Системи лiнiйних рiвнянь
На цi самi матрицi домножимо злiва стовпчик вiльних членiв 2 ¡ ¢¡ ¢¡ ¢ 2 E + (−3)E32 E + (−4)E31 E + (−2)E21 7 = 3 . −4 −21 У пiдсумку отримаємо матричне рiвняння 1 2 −1 x1 2 0 −3 3 · x2 = 3 , 0 0 −7 x3 −21 звiдки легко обчислимо розв’язок x1 = 1, x2 = 2, x3 = 3.
2.8. Задачi Для аудиторного розв’язання [13]: №№ 567, 569, 578, 580, 689, 712, 615, 616. [14]: №№ 8.1 (а,в,ж), 8.2 (а,е). Для самостiйного розв’язання [13]: №№ 568, 570, 573, 690, 713,617. [14]: №№ 8.1 (б,г,з), 8.2 (б). Задачi контрольної роботи i колоквiуму [13]: №№ 567 − 581, 689 − 697, 712 − 715, 615 − 618. [14]: №№ 8.1 (а−з), 8.2 (а−ж).
Тема 3.
Арифметичний векторний простiр 3.1. Поняття вектора Для побудови загальної теорiї систем лiнiйних рiвнянь недостаньо того апарату, який ми розглянули ранiше. Окрiм матриць, ми будемо змушенi використовувати нове поняття, яке викликає, можливо, ще бiльший загальноматематичну цiкавiсть, а саме понятя багатовимiрного векторного простору. Означення 3.1.1. Впорядковану послiдовнiсть n дiйсних чисел ~a = (a1 , . . . , an ) називають n-вимiрним числовим вектором. Числа ai , i = 1, 2, . . . , n, називають координатами (компонентами) вектора ~a. Вектори позначатимемо малими латинськими буквами ~a, ~b, ~c,... i записуватимемо у виглядi вектор-стовпчика або у виглядi вектор-рядка a1 .. ~a = . або ~a> = (a1 , . . . , an ) an 39
40
Тема 3. Арифметичний векторний простiр
(iндекс «>» тут означає транспонування i у бiльшостi випадкiв ми домовимося його опускати, тобто символ ~a означатиме вектор-стовпчик i вектор-рядок залежно вiд контексту). По-сутi, вектор ~a можна вважати (n × 1) або (1 × n)-матрицею. √ Приклад. ~a = (1, 34 , −2) — 3-вимiрний вектор, ~b = ( 4, −3, − 12 , 91) — 4вимiрний вектор.
Вектор, всi координати якого дорiвнюють нулю, називають нуль-вектором i позначають ~0 = (0, 0, . . . , 0). Вектори ~a = (a1 , . . . , an ) та ~b = (b1 , . . . , bn ) вважатимемо рiвними у тому випадку, коли їхнi вiдповiднi координати спiвпадатимуть, тобто ai = bi при i = 1, 2, . . . , n.
3.2. Лiнiйнi операцiї над векторами. Арифметичний векторний простiр Визначимо лiнiйнi операцiї додавання векторiв та множення векторiв на скаляри. Означення 3.2.1. Якщо ~a = (a1 , . . . , an ), ~b = (b1 , . . . , bn ) — довiльнi n-вимiрнi числовi вектори i λ ∈ R, то сумою векторiв ~a та ~b називається вектор ~a + ~b = (a1 + b1 , a2 + b2 , . . . , an + bn ),
(3.1)
а добутком вектора ~a на скаляр λ — вектор λ~a = (λa1 , λa2 , . . . , λan ). Приклад. Нехай ~a = (1, 3, −2), ~b = (4, −3, −1). Тодi ~a + ~b = (1, 3, −2) + (4, −3, −1) = (5, 0, −3), 10 · ~a = 10 · (1, 3, −2) = (10, 30, −20).
(3.2)
3.2. Oперацiї над векторами. Векторний простiр
41
Означення 3.2.2. Множину всiх n-вимiрних числових векторiв, на якiй визначено лiнiйнi операцiї (3.1) та (3.2), називають n-вимiрним арифметичним векторним простором i позначають Rn © ª Rn = ~a = (a1 , . . . , an ) | ai ∈ R . Зокрема, простiр R1 ототожнюють з R. Зауваження 3.2.1. Пiдкреслимо, що в означення n-вимiрного векторного простору не входить жодного множення векторiв. Твердження 3.2.1. Для довiльних векторiв ~a, ~b, ~c ∈ Rn та довiльних скалярiв λ, µ ∈ R правильнi такi властивостi: 1) ~a + ~b = ~b + ~a; 2) ~a + (~b + ~c) = (~a + ~b) + ~c; 3) ~a + ~0 = ~a; 4) ~a + (−1)~a = ~0; 5) λ(µ~a) = (λµ)~a; 6) λ(~a + ~b) = λ~a + λ~b; 7) (λ + µ)~a = λ~a + µ~a; 8) 1 · ~a = ~a. Доведення. Оскiльки всi властивостi доводяться аналогiчно, то виконаємо доведення тiльки однiєї з них, наприклад, властивостi 1. Нехай ~a, ~b ∈ Rn , тобто нехай ~a = (a1 , a2 , . . . , an ),
~b = (b1 , b2 , . . . , bn ).
Тодi маємо ~a + ~b = (a1 , a2 , . . . , an ) + (b1 , b2 , . . . , bn ) = = (a1 + b1 , a2 + b2 , . . . , an + bn ) = (b1 + a1 , b2 + a2 , . . . , bn + an ) = = (b1 , b2 , . . . , bn ) + (a1 , a2 , . . . , an ) = ~b + ~a, що й потрiбно було показати.
42
Тема 3. Арифметичний векторний простiр
3.3. Лiнiйна залежнiсть Означення 3.3.1. Лiнiйною комбiнацiєю векторiв ~a1 , ~a2 , . . . , ~ak з числовими коефiцiєнтами λ1 , λ2 , . . . , λk ∈ R називають вектор λ1~a1 + λ2~a2 + · · · + λk~ak . Означення 3.3.2. Кажуть, що вектор ~b лiнiйно виражається через вектори ~a1 , ~a2 , . . . , ~ak , якщо вiн дорiвнює деякiй їхнiй лiнiйнiй комбiнацiї ~b = α1~a1 + α2~a2 + · · · + αk~ak ,
αi ∈ R.
Приклади. 1. Вектори 2~a1 − 3~a2 + ~a3
та
~a1 + ~a2 − 8~a3
є лiнiйними комбiнацiями векторiв ~a1 , ~a2 , ~a3 . 2. Вектор ~b = (−5, 3, 4) лiнiйно виражається через вектори ~a1 = (1, 0, 3), ~a2 = (−2, 1, 1), ~a3 = (2, −1, 1) оскiльки ~b = ~a1 + 2~a2 − ~a3 .
Означення 3.3.3. Систему векторiв ~a1 , ~a2 , . . . , ~ak ∈ Rn називають лiнiйно залежною, якщо iснують скаляри λ1 , λ1 , . . . , λk ∈ R, якi одночасно не дорiвнюють нулю i такi, що λ1~a1 + λ2~a2 + · · · + λk~ak = ~0.
(3.3)
У такому випадку вважатимемо, що лiнiйна залежнiсть (3.3) нетривiальна. Якщо ж рiвнiсть (3.3) можлива лише тодi, коли λ1 = λ2 = · · · = λk = 0, то система векторiв ~a1 , ~a2 , . . . , ~ak називається лiнiйно незалежною.
3.3. Лiнiйна залежнiсть
43
Приклади. 1. Система, що складається з одного ненульового вектора ~a є лiнiйно незалежною, оскiльки рiвнiсть λ~a = ~0 можлива лише тодi, коли λ = 0. 2. Система векторiв ~a1 = (1, 1), ~a2 = (0, 1), ~a3 = (3, 4) ∈ R2 є лiнiйно залежною, оскiльки 3~a1 + ~a2 − ~a3 = ~0. 3. Система векторiв ~a1 = (1, 1), ~a2 = (0, 1) ∈ R2 лiнiйно незалежна, оскiльки рiвнiсть λ1~a1 + λ2~a2 = ~0 можлива лише за умови, що λ1 = λ2 = 0.
Розглянемо ще один важливий приклад. Приклад. Одиничними векторами простору Rn називають вектори ~e1 = (1, 0, . . . , 0),
~e2 = (0, 1, 0, . . . , 0), . . . , ~en = (0, . . . , 0, 1).
Система одиничних векторiв ~e1 , . . . , ~en лiнiйно незалежна. Справдi, нехай λ1~e1 + · · · + λn~en = ~0. Тодi λ1 (1, 0, . . . , 0)+λ2 (0, 1, 0, . . . , 0)+· · ·+λn (0, . . . , 0, 1) = (λ1 , . . . , λn ) = (0, . . . , 0), звiдки λ1 = · · · = λn = 0.
Наведемо найпростiшi властивостi лiнiйної залежностi. Твердження 3.3.1. Якщо хоча б одна пiдсистема системи векторiв лiнiйно залежна, то i вся система векторiв лiнiйно залежна. Доведення. Нехай пiдсистема ~a1 , . . . , ~as системи векторiв ~a1 , . . . , ~ak (s < k) лiнiйно залежна. Тодi iснує набiр скалярiв λ1 , . . . , λs ∈ R, якi одночасно не дорiвнюють нулю i правильна рiвнiсть λ1~a1 + · · · + λs~as = ~0. Прийнявши λs+1 = λs+2 = · · · = λk = 0, отримаємо нетривiальну лiнiйну залежнiсть λ1~a1 + · · · + λs~as + 0 · ~as+1 + · · · + 0 · ~ak = ~0, звiдки за означенням випливає лiнiйна залежнiсть системи векторiв ~a1 , . . . , ~ak .
44
Тема 3. Арифметичний векторний простiр
Твердження 3.3.2. Кожна пiдсистема лiнiйно незалежної системи векторiв лiнiйно незалежна. Доведення. Мiркування вiд супротивного: якщо б пiдсистема лiнiйно незалежної системи виявилась лiнiйно залежною, то за попереднiм твердженням i вся система була б лiнiйно залежною — суперечнiсть.
3.4. Леми про лiнiйну залежнiсть Лема 3.4.1. Вектори ~a1 , . . . , ~ak (k ≥ 2) лiнiйно залежнi тодi i тiльки тодi, коли хоча б один з них є лiнiйною комбiнацiєю iнших. Доведення. Нехай система векторiв ~a1 , . . . , ~ak — лiнiйно залежна, тобто iснує ненульовий набiр скалярiв λ1 , λ2 , . . . , λk , при якому λ1~a1 + λ2~a2 + · · · + λk~ak = ~0. Припустимо для визначеностi, що λ1 6= 0. Тодi ~a1 = −
λk λ2 ~a2 − · · · − ~ak , λ1 λ1
тобто a1 лiнiйно виражається через ~a2 , . . . , ~ak . Навпаки, нехай один вектор (наприклад, ~a1 ) є лiнiйною комбiнацiєю решти векторiв системи ~a1 = µ2~a2 + · · · + µk~ak . Тодi 1 · ~a1 − µ2~a2 − · · · − µk~ak = ~0, що i доводить лiнiйну залежнiсть векторiв ~a1 , ~a2 , . . . , ~ak .
3.4. Леми про лiнiйну залежнiсть
45
Зауваження 3.4.1. Загалом неправильно, що кожен вектор лiнiйно залежної системи лiнiйно виражається через iншi. Нехай, наприклад, ~a — довiльний ненульовий вектор. Система векторiв ~a, ~0 лiнiйно залежна 0 · ~a + 1 · ~0 = ~0, але зрозумiло, що вектор ~a не виражається через нульовий вектор ~0. Лема 3.4.2. Якщо вектори ~a1 , . . . , ~ak лiнiйно незалежнi, а вектори ~a1 , . . . , ~ak , ~b лiнiйно залежнi, то вектор ~b є лiнiйною комбiнацiєю векторiв ~a1 , . . . , ~ak . Доведення. Розглянемо нетривiальне спiввiдношення λ1~a1 + λ2~a2 + · · · + λk~ak + µ~b = ~0. Якщо µ = 0, то λ1 = · · · = λk = 0 (оскiльки за умовою леми вектори ~a1 , . . . , ~ak лiнiйно незалежнi). Звiдси випливає, що вектори ~a1 , . . . , ~ak , ~b лiнiйно незалежнi, а це суперечить умовi леми. Тому µ 6= 0, а отже, ~b = − λ1 ~a1 − λ2 ~a2 − · · · − λk ~ak , µ µ µ тобто вектор ~b є лiнiйною комбiнацiєю векторiв ~a1 , . . . , ~ak , що й потрiбно було довести. Лема 3.4.3. Якщо вектори ~a1 , . . . , ~ak лiнiйно незалежнi i вектор ~b не можна через них виразити, то система ~a1 , . . . , ~ak , ~b — лiнiйно незалежна. Доведення цiєї леми безпосередньо випливає з попередньої леми 3.4.2. Лема 3.4.4. Якщо кожен з векторiв ~b1 , . . . , ~bs лiнiйно виражається через ~a1 , . . . , ~ak i s > k, то вектори ~b1 , . . . , ~bs лiнiйно залежнi.
46
Тема 3. Арифметичний векторний простiр
Доведення. За умовою леми ~b1 = λ11~a1 + λ12~a2 + · · · + λ1k~ak , ~b2 = λ21~a1 + λ22~a2 + · · · + λ2k~ak , ................................. ~bs = λs1~a1 + λs2~a2 + · · · + λsk~ak .
(3.4)
Для доведення треба знайти такi числа µ1 , µ2 , . . . , µs ∈ R, якi одночасно не дорiвнюють нулю i для яких µ1~b1 + µ2~b2 + · · · + µs~bs = ~0.
(3.5)
Пiдставимо (3.4) в (3.5) i перегрупуємо (λ11 µ1 + λ21 µ2 + · · · + λs1 µs )~a1 + + (λ12 µ1 + λ22 µ2 + · · · + λs2 µs )~a2 + + · · · + (λ1k µ1 + λ2k µ2 + · · · + λsk µs )~ak = ~0. Прирiвнявши в останнiй рiвностi всi коефiцiєнти бiля векторiв до нуля, отримаємо систему k однорiдних лiнiйних рiвнянь з s невiдомими µ1 , µ2 , . . . , µs λ11 µ1 + λ21 µ2 + · · · + λs1 µs = 0, λ µ + λ µ + · · · + λ µ = 0, 12 1 22 2 s2 s ................................. λ µ + λ µ + · · · + λ µ = 0. 1k 1 2k 2 sk s Оскiльки s > k, то за лемою Гаусса 2.6.1 ця система має ненульовий розв’язок, тобто серед розв’язкiв µ1 , µ2 , . . . , µs iснує такий, де не всi µi одночасно дорiвнюють нулю. Отже, вектори ~b1 , . . . , ~bs лiнiйно залежнi. Лема 3.4.5 (основна лема про лiнiйну залежнiсть). Будьякi k > n векторiв простору Rn лiнiйно залежнi.
3.5. Пiдпростори. Лiнiйнi оболонки
47
Доведення. Розглянемо одиничнi вектори ~e1 = (1, 0, . . . , 0), ~e2 = (0, 1, 0, . . . , 0), . . . , ~en = (0, . . . , 0, 1) ∈ Rn . Легко бачити, що довiльний вектор ~a = (a1 , . . . , an ) ∈ Rn можна записати як лiнiйну комбiнацiю одиничних векторiв ~a = a1~e1 + · · · + an~en . Тодi за лемою 3.4.4 отримуємо, що довiльнi k (k > n) векторiв простору Rn — лiнiйно залежнi.
3.5. Пiдпростори. Лiнiйнi оболонки Означення 3.5.1. Непорожня пiдмножина U ⊂ Rn називається пiдпростором простору Rn , якщо: 1) для довiльних ~a, ~b ∈ U сума ~a + ~b ∈ U ; 2) для довiльних ~a ∈ U , λ ∈ R добуток λ~a ∈ U . Простiр Rn мiстить два тривiальнi пiдпростори: весь простiр Rn i нульовий пiдпростiр {~0} (тобто пiдпростiр, який мiстить лише нуль-вектор). Наведемо ще один важливий приклад пiдпросторiв. Означення 3.5.2. Нехай ~a1 , ~a2 , . . . , ~am — довiльнi вектори простору Rn . Множину всiх лiнiйних комбiнацiй λ1~a1 + λ2~a2 + · · · + λm~am (λi ∈ R) називають лiнiйною оболонкою векторiв ~a1 , ~a2 , . . . , ~am i позначають h~a1 , . . . , ~am i, тобто © ª h~a1 , . . . , ~am i = λ1~a1 + · · · + λm~am = ~x ∈ Rn | ~ai ∈ Rn , λi ∈ R
48
Тема 3. Арифметичний векторний простiр
Легко переконатися, що лiнiйна оболонка h~a1 , . . . , ~am i є пiдпростором простору Rn . Справдi, нехай ~x, ~y ∈ h~a1 , . . . , ~am i, тобто ~x = λ1~a1 + · · · + λm~am , ~y = µ1~a1 + · · · + µm~am для деяких λi , µi ∈ R i нехай λ ∈ R. Тодi ~x + ~y = (λ1 + µ1 )~a1 + · · · + (λm + µm )~am ∈ h~a1 , . . . , ~am i, λ~x = (λλ1 )~a1 + · · · + (λλm )~am ∈ h~a1 , . . . , ~am i, що i потрiбно було показати.
3.6. Бази. Розмiрнiсть Нехай U — пiдпростiр простору Rn . Означення 3.6.1. Система векторiв ~a1 , . . . , ~ak ∈ U називається базою пiдпростору U , якщо вона лiнiйно незалежна i кожен вектор пiдпростору U можна виразити через лiнiйну комбiнацiю векторiв ~a1 , . . . , ~ak . Приклад. Розглянемо систему одиничних векторiв ~e1 = (1, 0, . . . , 0), ~e2 = (0, 1, 0, . . . , 0), . . . , ~en = (0, . . . , 0, 1) простору Rn . Як ми вже знаємо, одиничнi вектори лiнiйно незалежнi. Крiм того, через них можна лiнiйно виразити довiльний вектор ~a = (a1 , . . . , an ) ∈ Rn ~a = a1~e1 + · · · + an~en . Отже, ~e1 , ~e2 , . . . , ~en — база простору Rn (її називають стандартною базою).
Означення 3.6.2. Якщо кожен вектор пiдпростору U можна лiнiйно виразити через комбiнацiю векторiв ~a1 , . . . , ~ak ∈ Rn , то цi вектори ~a1 , . . . , ~ak називають твiрними пiдпростору U .
3.6. Бази. Розмiрнiсть
49
Наприклад, система одиничних векторiв ~e1 = (1, 0, . . . , 0), ~e2 = (0, 1, 0, . . . , 0), . . . , ~en = (0, . . . , 0, 1) є системою твiрних простору Rn (див. попереднiй приклад). Вилучення будьякого вектора з цiєї системи призводить до того, що вони перестають бути твiрними простору Rn (зокрема, вилучений вектор не виразиться лiнiйно через решту векторiв, що залишилися у системi).
Оскiльки, очевидно, базовi вектори пiдпростору є твiрними цього пiдпростору, то можна сформулювати ще одне, еквiвалентне означення бази. Означення 3.6.3. Базою пiдпростору називається будь-яка лiнiйно незалежна система твiрних цього пiдпростору. Теорема 3.6.1. Кожен вектор пiдпростору однозначно записують у виглядi лiнiйної комбiнацiї векторiв бази цього пiдпростору. Доведення. Нехай ~a1 , . . . , ~ak — база пiдпростору U . Розглянемо довiльний вектор ~x ∈ U i припустимо, що його можна записати у виглядi двох лiнiйних комбiнацiй векторiв бази ~x = λ1~a1 + · · · + λk~ak i ~x = λ01~a1 + · · · + λ0k~ak . Вiднявши почленно другу рiвнiсть вiд першої, отримаємо (λ1 − λ01 )~a1 + · · · + (λk − λ0k )~ak = ~0. Оскiльки вектори ~a1 , . . . , ~ak лiнiйно незалежнi, то λ1 − λ01 = · · · = λk − λ0k = 0, звiдки λ1 = λ01 , . . . , λk = λ0k . Теорема 3.6.2. Кожен пiдпростiр U ⊂ Rn володiє скiнченною базою. Доведення. Якщо U — нульовий пiдпростiр простору Rn , то доводити нiчого. Тому нехай U — ненульовий пiдпростiр простору Rn .
50
Тема 3. Арифметичний векторний простiр
Розглянемо довiльний ненульовий вектор ~a1 ∈ U . Cистема, що складається з одного ненульового вектора ~a1 , є лiнiйно незалежною i, якщо через цей вектор можна лiнiйно виразити всi iншi вектори пiдпростору U , то все доведено. В iншому випадку знайдеться вектор ~a2 ∈ U , який лiнiйно не виражається через ~a1 . Тодi за лемою 3.4.3 система ~a1 , ~a2 лiнiйно незалежна. Якщо, крiм того, довiльний iнший вектор пiдпростору U є лiнiйною комбiнацiєю векторiв ~a1 , ~a2 , то система векторiв ~a1 , ~a2 утворює базу пiдпростору U i доведення завершується. В iншому випадку, знову ж таки, знайдеться деякий вектор ~a3 ∈ U , який не виражатиметься лiнiйно через вектори ~a1 , ~a2 i система ~a1 , ~a2 , ~a3 буде лiнiйно незалежною i т.д. Мiркуючи аналогiчно, ми могли б продовжувати необмежено процес розширення лiнiйно незалежної системи, але за лемою 3.4.1 довiльна лiнiйно незалежна система у просторi Rn мiстить не бiльше, нiж n векторiв. Тому при деякому натуральному k ≤ n одержимо таку лiнiйно незалежну систему ~a1 , . . . , ~ak векторiв пiдпростору U , що для довiльного ~ak+1 6= ~0 з U система ~a1 , . . . , ~ak , ~ak+1 буде лiнiйно залежною. Тому вектор ~ak+1 (а на пiдставi довiльностi його вибору й будь-який iнший вектор з U ) буде виражатися через вектори ~a1 , . . . , ~ak . Отже, вектори ~a1 , . . . , ~ak утворюють базу пiдпростору U . З доведення теореми легко бачити, що побудову бази можна розпочати з будь-якого ненульового вектора пiдпростору U . Тому правильне таке твердження. Наслiдок 3.6.3. Кожен ненульовий пiдпростiр U простору Rn має нескiнченну кiлькiсть баз. Приклади. 1. Системи векторiв ~e1 = (1, 0), ~e2 = (0, 1) та ~a1 = (1, 1), ~a2 = (2, 1) є двома рiзними базами простору R2 . 2. Поряд зi стандартною базою ~e1 , . . . , ~en у просторi Rn завжди iснує така база ~e10 = ~e1 ,
~e20 = ~e1 + ~e2 ,
~e30 = ~e1 + ~e2 + ~e3 , . . . , ~en0 = ~e1 + ~e2 + · · · + ~en .
3.7. Задачi
51
Теорема 3.6.4. Всi бази пiдпростору U простору Rn складаються з однакової кiлькостi k ≤ n векторiв. Доведення. Якщо б у пiдпросторi U iснували двi бази з рiзною кiлькiстю векторiв, то за лемою 3.4.4 вектори бiльшої з цих баз були б лiнiйно залежними, що суперечить означенню бази. Означення 3.6.4. Кiлькiсть векторiв у базi пiдпростору U називають розмiрнiстю пiдпростору U i позначають dim U . Приклад. Оскiльки довiльна база простору Rn мiстить n векторiв (наприклад, стандартна база ~e1 , . . . , ~en ), то dim Rn = n. Аналогiчно dim = R2 = 2, dim R3 = 3.
З поняттям розмiрностi тiсно пов’язанi поняття рангу системи векторiв i рангу матрицi.
3.7. Задачi Для аудиторного розв’язання [13]: №№ 636, 637, 639, 641, 642, 648, 652, 665, 672, 673. [14]: №№ 6.7 (а). Для самостiйного розв’язання [13]: №№ 638, 640, 642, 647, 649, 650, 653, 655, 666, 674. [14]: №№ 6.7 (б). Задачi контрольної роботи i колоквiуму [13]: №№ 636 − 642, 646 − 650, 652 − 659, 665 − 669, 671, 677, 679. [14]: №№ 6.1 − 6.3, 6.5 − 6.7, 6.9 − 6.12.
52
Тема 3. Арифметичний векторний простiр
Тема 4.
Ранг системи векторiв. Ранг матрицi 4.1. Ранг системи векторiв Розглянемо довiльну систему векторiв ~a1 , ~a2 , . . . , ~ak ∈ Rn . Означення 4.1.1. Рангом системи векторiв ~a1 , ~a2 , . . . , ~ak називається розмiрнiсть простору, породженого цими векторами, тобто розмiрнiсть лiнiйної оболонки h~a1 , ~a2 , . . . , ~ak i. Означення 4.1.2. Двi довiльнi системи векторiв ~a1 , ~a2 , . . . , ~ak та ~b1 , ~b2 , . . . , ~bm називаються еквiвалентними, якщо кожен з векторiв ~ai лiнiйно виражається через вектори ~b1 , ~b2 , . . . , ~bm i, навпаки, кожен з векторiв ~bj лiнiйно виражається через вектори ~a1 , ~a2 , . . . , ~ak . Це, очевидно, рiвносильне збiганню пiдпросторiв, породжених цими системами векторiв, тобто збiганню їхнiх лiнiйних оболонок h~a1 , ~a2 , . . . , ~ak i = h~b1 , ~b2 , . . . , ~bm i. Звiдси випливає, що ранги еквiвалентних систем векторiв рiвнi. 53
54
Тема 4. Ранг системи векторiв. Ранг матрицi
4.2. Ранг матрицi Нехай A — довiльна (m × n)-матриця a11 a12 . . . a1n a21 a22 . . . a2n A= . . . . . . . . . . . . . . . . . . . . ∈ Mm×n (R). am1 am2 . . . amn Рядки матрицi A можна розглядати як n-вимiрнi вектори вигляду ~ai = (ai1 , . . . , ain ), де i = 1, 2, . . . , m. Тому над рядками матрицi справджується поняття лiнiйної залежностi та незалежностi. Означення 4.2.1. Максимальна кiлькiсть лiнiйно незалежних рядкiв матрицi A називається рангом матрицi A за рядками. Аналогiчно можна розглянути стовпчики матрицi A як mвимiрнi вектори вигляду 0
~aj = (a1j , a2j , . . . , amj ), j = 1, 2, . . . , n, i ввести до розгляду поняття рангу матрицi за стовпчиками. Якщо матриця A∗ отримана з матрицi A будь-яким елементарним перетворенням, то з означення елементарних перетворень випливає, що рядки матрицi A∗ лiнiйно виражаються через рядки матрицi A. Оскiльки, в свою чергу, матрицю A можна отримати з A∗ оберненим елементарним перетворенням того самого типу, то й навпаки, рядки матрицi A лiнiйно виражаються через рядки матрицi A∗ . Отож, системи рядкiв матриць A i A∗ еквiвалентнi i, отже, ранги цих матриць за рядками рiвнi. Цим фактом можна скористатися для обчислення рангу матрицi за рядками.
4.2. Ранг матрицi
55
Твердження 4.2.1. Ранг матрицi A за рядками дорiвнює кiлькостi ненульових рядкiв схiдчастої матрицi, до якої матриця A приводиться елементарними перетвореннями рядкiв. Доведення. Оскiльки ранг матрицi за рядками не змiнюється при елементарних перетвореннях, то нам достатньо розглянути ранг за рядками довiльної схiдчастої матрицi i довести, що вiн дорiвнює кiлькостi ненульових рядкiв цiєї схiдчастої матрицi. Для цього достатньо показати, що ненульовi рядки схiдчастої матрицi лiнiйно незалежнi. Розглянемо довiльну схiдчасту матрицю a11 . . . a1k . . . a1l . . . a1s . . . a1n 0 . . . a2k . . . a2l . . . a2s . . . a2n 0 ... 0 . . . a3l . . . a3s . . . a3n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . , (4.1) A= 0 . . . 0 . . . 0 . . . a . . . a rs rn 0 ... 0 ... 0 ... 0 ... 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0
...
0
...
0
...
0
...
0
де a11 a2k a3l . . . ars 6= 0. В цiй матрицi розглянемо ненульовi рядки (як вектори) ~a1 = (a11 , . . . , a1k , . . . , a1l , . . . , a1s , . . . , a1n ), ~a2 = (0, . . . , a2k , . . . , a2l , . . . , a2s , . . . , a2n ), ...................................., ~ar = (0, . . . , 0, . . . , 0, . . . , ars , . . . , arn ) i прирiвняємо до нуля їхню лiнiйну комбiнацiю λ1~a1 + λ2~a2 + · · · + λr~ar = ~0. Пiдставивши в цiй рiвностi замiсть векторiв ~a1 , ~a2 , . . . , ~ar їхнi координати i розглянувши першу координату цiєї лiнiйної комбiнацiї, отримаємо, що λ1 a11 = 0, звiдки λ1 = 0. Розглядаючи далi
56
Тема 4. Ранг системи векторiв. Ранг матрицi
k-ту координату (з врахуванням того, що λ1 = 0), знаходимо, що λ2 a2k = 0, звiдки λ2 = 0. Продовжуючи так далi, отримаємо, що λ1 = λ2 = · · · = λr = 0, що й треба було довести. Зокрема легко бачити, що яку б послiдовнiсть елементарних перетворень, якi приводять задану матрицю до схiдчастого вигляду, ми б не обрали, кiлькiсть ненульових рядкiв отриманої схiдчастої матрицi буде тiєю самою. Приклад. Знайдемо ранг матрицi 1 1 A= −2 2 Для цього зведемо її за допомогою схiдчастого вигляду 1 1 1 −2 1 2 −1 ∼ 0 −2 −1 5 0 0 2 3 −3
1 2 −1 3
−2 −1 . 5 −3
елементарних перетворень рядкiв до 1 1 1 1
1 −2 1 ∼ 0 1 0 0 1
1 1 0 0
−2 1 . 0 0
Отож, оскiльки у схiдчастiй матрицi, до якої звелась матриця A, є два ненульовi рядки, то ранг матрицi A за рядками дорiвнює 2.
Всi наведенi мiркування (в тiм числi й твердження 4.2.1) легко переформулювати та довести для випадку рангу матрицi за стoвпчиками. Проте потреба у цьому вiдпадає, оскiльки правильною є така теорема. Теорема 4.2.2. Ранг матрицi за рядками дорiвнює її рангу за стовпчиками. (Ранг матрицi A за рядками (або за стовпчиками) називається рангом матрицi A i позначається rang A.)
4.2. Ранг матрицi
57
Доведення. Згiдно з означеннями рангiв за рядками та стовпчиками нам достаньо показати, що ранг системи рядкiв довiльної матрицi дорiвнює рангу системи її стовпчикiв. Для цього скористаємось уже розглянутою в попередньому твердженнi схiдчастою матрицею A вигляду (4.1). Ми вже знаємо, що ранг за рядками (позначимо його rangp (A)) цiєї матрицi дорiвнює r. Розглянемо вектор-стовпчики цiєї матрицi 0
0
~a1 = (a11 , 0, . . . , 0)> , ~ak = (a1k , a2k , 0, . . . , 0)> , . . . , 0
~as = (a1s , a2s , . . . , ars , 0, . . . , 0)> . Припустивши наявнiсть спiввiдношення 0
0
0
0
λ1~a1 + λk~ak + λl~al + · · · + λs~as = ~0, тобто a11 a1k a1l a1s 0 0 a2k a2l a2s 0 0 0 a3l a3s 0 .. .. .. .. .. . . . . . λ1 + λk + λl + · · · + λs ars = 0 , 0 0 0 0 0 0 0 0 .. .. .. .. .. . . . . . 0 0 0 0 0 послiдовно oтримаємо λs ars = 0, . . . , λl a3l = 0, λk a2k = 0, λ1 a11 = 0. Оскiльки за умовою a11 a2k a3l . . . ars 6= 0, то одержимо λ1 = λk = λl = · · · = λs = 0.
58
Тема 4. Ранг системи векторiв. Ранг матрицi 0
0
0
0
Отже, ранг системи вектор-стовпчикiв ~a1 , ~ak , ~al , . . . , ~as дорiвнює r i rangc A ≥ r, (4.2) де через rangc A позначено ранг за стовпчиками матрицi A. Пiдпростiр (позначимо його Vc ), породжений всiма вектор-стовпчиками матрицi A, збiгається з пiдпростором всiх вектор-стовпчикiв (їх лiнiйною оболонкою) матрицi, яку отримують з A, видаливши останнi m − r нульових рядкiв. Тому rangc (A) = dim Vc ≤ dim Rr = r.
(4.3)
Зiставивши нерiвностi (4.2) i (4.3), отримаємо, що rangc (A) = r. Згадавши, що rangp (A) також дорiвнює r, маємо rangp (A) = r = rangc (A).
Приклад. Знайдемо ранг за стовпчиками матрицi A iз попереднього прикладу 1 1 −2 1 2 −1 . A= −2 −1 5 2 3 −3 Для цього за допомогою елементарних перетворень стовпчикiв зведемо її до схiдчастого вигляду 1 0 0 1 0 0 1 1 −2 1 1 0 1 1 2 −1 . ∼ 1 ∼ 1 −2 −1 5 −2 1 1 −2 1 0 2 1 0 2 1 1 2 3 −3 Бачимо, що у схiдчастiй матрицi, до якої звелась матриця A, є два ненульовi стовчики, а тому ранг матрицi A за стовпчиками дорiвнює 2. Отож, ранги даної матрицi A за рядками i за стовпчиками спiвпадають i дорiвнюють 2. Отже, в пiдсумку отримуємо, що rang A = 2.
4.3. Критерiй сумiсностi систем рiвнянь
59
4.3. Критерiй сумiсностi систем лiнiйних рiвнянь. Теорема Кронекера-Капеллi Повернемось до розгляду системи лiнiйних рiвнянь a11 x1 + a12 x2 + · · · + a1n xn = b1 , a x + a x + · · · + a x = b , 21 1 22 2 2n n 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a x + a x + · · · + a x = b . m1 1 m2 2 mn n m
(4.4)
Питання про сумiснiсть системи лiнiйних рiвнянь (4.4) цiлком розв’язується такою теоремою. Теорема 4.3.1 (Кронекера-Капеллi). Система лiнiйних рiвнянь (4.4) сумiсна тодi i тiльки тодi, коли ранг її основної матрицi дорiвнює рангу розширеної матрицi. Доведення. Перепишемо систему (4.4) у виглядi a11 a12 a1n b1 a21 a22 a2n b2 x1 . + x2 . + · · · + xn . = . . .. .. .. .. am1
am2
amn
(4.5)
bm
Легко бачити, що сумiснiсть системи (4.4), записаної у виглядi (4.5), можна трактувати як задачу про вираження векторстовпчика вiльних членiв у виглядi лiнiйної комбiнацiї векторстовпчикiв матрицi коефiцiєнтiв A. Якщо таке вираження можливе (тобто система (4.4) сумiсна), то системи вектор-стовпчикiв матриць A та Ab (де Ab — розширена матриця системи (4.4)) — еквiвалентнi. Тому максимальна кiлькiсть лiнiйно незалежних стовпчикiв матриць A та Ab однакова, а отже, rang A = rang Ab .
60
Тема 4. Ранг системи векторiв. Ранг матрицi
Навпаки, нехай rang A = rang Ab . Якщо розглянути довiльну максимальну лiнiйно незалежну систему вектор-стовпчикiв матрицi A, то додавши до неї вектор-стовпчик вiльних членiв системи (4.4), отримаємо уже лiнiйно залежну систему. За лемою 3.4.2 це означає, що вектор-стовпчик вiльних членiв — лiнiйна комбiнацiя лiнiйно незалежних (а отже, i всiх) векторiв-стовпчикiв матрицi A. Отже, система (4.4) сумiсна. Наслiдок 4.3.2. Сумiсна система лiнiйних рiвнянь є визначеною тодi i тiльки тодi, коли ранг матрицi її коефiцiєнтiв дорiвнює кiлькостi невiдомих. Наслiдок 4.3.3. Однорiдна система лiнiйних рiвнянь завжди сумiсна. Приклад. Дослiдимо на сумiснiсть систему лiнiйних рiвнянь x1 + x2 − 2x3 + 2x4 = 1, x1 + 2x2 − x3 + 3x4 = 2, −2x1 − x2 + 5x3 − 3x4 = 3. Для цього знайдемо ранги її основної A i розширеної Ab матриць 1 1 −2 2 1 1 1 −2 2 1 1 2 −1 3 1 1 1 ∼ 2 ∼ 0 1 −2 −1 5 −3 3 0 1 1 1 5 1 1 −2 2 1 1 1 1 . ∼ 0 1 0 0 0 0 5 Бачимо, що основна матриця A (без стовпчика вiльних членiв) за допомогою елементарних перетворень звелась до вигляду 1 1 −2 2 0 1 1 1 , 0 0 0 0 а тому її ранг дорiвнює 2. У свою чергу, розширена матриця Ab — звелась до вигляду 1 1 −2 2 1 0 1 1 1 1 , 0 0 0 0 5
4.4. Фундаментальна система розв’язкiв
61
а, отже, її ранг дорiвнює 3. Оскiльки rang A 6= rang Ab , то за теоремою Кронекера-Капеллi дана система лiнiйних рiвнянь несумiсна.
4.4. Фундаментальна система розв’язкiв Розглянемо однорiдну систему лiнiйних рiвнянь a11 x1 + a12 x2 + · · · + a1n xn = 0, a x + a x + · · · + a x = 0, 21 1 22 2 2n n ................................. a x + a x + · · · + a x = 0. m1 1 m2 2 mn n
(4.6)
Лема 4.4.1. Множина розв’язкiв однорiдної системи лiнiйних рiвнянь (4.6) утворює пiдпростiр простору Rn . Доведення. Будемо трактувати розв’язки ³ c1 ´ однорiдної системи (4.6) як вектор-стовпчики вигляду ~c = c... ∈ Rn . Якщо познаn чити два рiзнi розв’язки цiєї системи через вектори-стовпчики ~c 0 та ~c , правильними є такi матричнi рiвностi (див. § 2.7): A~c = ~0
i
0
A~c = ~0,
де A — основна матриця системи, ~0 — нульовий вектор-стовпчик. Додавши цi рiвностi, одержимо 0
0
A~c + A~c = A(~c + ~c ) = ~0, 0
тобто ~c + ~c є розв’язком системи (4.6). Якщо λ ∈ R, то маємо A(λ~c) = λ(A~c) = λ · ~0 = ~0, а це означає, що i λ~c є розв’язком системи (4.6). За означенням пiдпростору отримуємо твердження леми.
62
Тема 4. Ранг системи векторiв. Ранг матрицi
Означення 4.4.1. Фундаментальною системою розв’язкiв однорiдної системи лiнiйних рiвнянь називають базу пiдпростору її розв’язкiв. Теорема 4.4.2. Нехай ранг матрицi системи лiнiйних однорiдних рiвнянь (4.6) дорiвнює r. Тодi кожна фундаментальна система розв’язкiв цiєї системи складається з n − r векторiв. Доведення. За допомогою елементарних перетворень приведемо систему (4.6) до схiдчастого вигляду. За твердженням 4.2.1 кiлькiсть ненульових рiвнянь у цьому схiдчастому виглядi дорiвнюватиме r = rang A, де A — основна матриця системи лiнiйних рiвнянь (4.6). Тому загальний розв’язок буде мiстити r головних невiдомих (див. спiввiдношення (2.4)) i з точнiстю до перенумерацiї невiдомих матиме вигляд x1 = c11 xr+1 + c12 xr+2 + · · · + c1,n−r xn , x = c x 2 21 r+1 + c22 xr+2 + · · · + c2,n−r xn , (4.7) ....................................... x = c x r r1 r+1 + cr2 xr+2 + · · · + cr,n−r xn . Надаючи почергово однiй iз вiльних невiдомих xr+1 , xr+2 , . . . , xn значення 1, а iншим — значення 0, отримаємо такi розв’язки системи (4.6): u1 = (c11 , c21 , ..., cr1 , 1, 0, . . . , 0), u2 = (c12 , c22 , ..., cr2 , 0, 1, . . . , 0), ........................................................ un−r = (c1,n−r , c2,n−r , . . . , cr,n−r , 0, 0, . . . , 1).
(4.8)
Доведемо, що розв’язки (4.8) будуть утворювати базу пiдпростору розв’язкiв системи, звiдки випливатиме твердження теореми.
4.4. Фундаментальна система розв’язкiв
63
Справдi, для довiльних λ1 , λ2 , . . . , λn−r ∈ R лiнiйнi комбiнацiї u = λ1 u1 + λ2 u2 + · · · + λn−r un−r є розв’язками системи (4.6), в якiй вiльнi невiдомi мають значення λ1 , λ2 , . . . , λn−r . Оскiльки значення головних невiдомих однозначно визначаються значеннями вiльних невiдомих (за формулами (4.7)), то будь-який розв’язок системи (4.6) є лiнiйною комбiнацiєю розв’язкiв u1 , u2 , . . . , un−r . З iншого боку, якщо u = 0, то λ1 = λ2 = · · · = λn−r = 0; як наслiдок, u1 , u2 , . . . , un−r лiнiйно незалежнi. Приклад. Знайдемо фундаментальну систему розв’язкiв i загальний розв’язок однорiдної системи лiнiйних рiвнянь 2x1 − x2 + 3x3 − 2x4 + 4x5 = 0, (4.9) 4x1 − 2x2 + 5x3 + x4 + 7x5 = 0, 2x1 − x2 + x3 + 8x4 + 2x5 = 0. Складемо матрицю системи 2 2 −1 3 −2 4 4 −2 5 1 7 ∼ 0 0 2 −1 1 8 2
i зведемо її до схiдчастого вигляду −1 3 −2 4 0 −1 5 −1 ∼ 0 −2 10 −2 2 −1 3 −2 4 0 −1 5 −1 . ∼ 0 0 0 0 0 0
Бачимо, що ранг матрицi дорiвнює 2. Тому n−r = 5−2 = 3, фундаментальна система розв’язкiв складається з трьох розв’язкiв u1 , u2 , u3 . Знайдемо головнi невiдомi (наприклад, x2 , x3 ) системи. З другого рядка схiдчастої матрицi отримаємо x3 = 5x4 − x5 ;
(4.10)
з першого рядка цiєї самої матрицi (зважаючи на спiввiдношення (4.10)) знайдемо x2 = 2x1 + 3x3 − 2x4 + 4x5 = 2x1 + 3(5x4 − x5 ) − 2x4 + 4x5 = = 2x1 + 13x4 + x5 .
(4.11)
64
Тема 4. Ранг системи векторiв. Ранг матрицi
Шукаємо перший базовий розв’язок u1 . Для цього у спiввiдношення (4.10) та (4.11) приймемо x1 = 1, x4 = 0, x5 = 0, звiдки отримаємо x2 = 2, x3 = 0. Тому u1 = (1, 2, 0, 0, 0). Прийнявши у рiвностях (4.10) та (4.11) x1 = 0, x4 = 1, x5 = 0, аналогiчно знаходимо x2 = 13, x3 = 5, тобто другим базовим розв’язком є вектор u2 = (0, 13, 5, 1, 0). Зрештою, прийнявши x1 = 0, x4 = 0, x5 = 1, знаходимо x2 = 1, x3 = −1. Тому третiм базовим розв’язком є вектор u3 = (0, 1, −1, 0, 1). Отож, фундаментальну систему розв’язкiв однорiдної системи лiнiйних рiвнянь (4.9) отримано. Для наочностi її можна записати у виглядi таблицi x1
x2
x3
x4
x5
u1
1
2
0
0
0
u2
0
13
5
1
0
u3 0 1 −1 0 1 Тепер запишемо загальний розв’язок системи (4.9) u = α1 u1 + α2 u2 + α3 u3 = α1 (1, 2, 0, 0, 0) + α2 (0, 13, 5, 1, 0) + α3 (0, 1, −1, 0, 1), де αi — довiльнi, одночасно не рiвнi нулю дiйснi числа (i = 1, 2, 3).
Насамкiнець, розглянемо зв’язок мiж розв’язками неоднорiдних i однорiдних систем лiнiйних рiвнянь. Нехай задано систему лiнiйних неоднорiдних рiвнянь a11 x1 + a12 x2 + · · · + a1n xn = b1 , a x + a x + ··· + a x = b , 21 1 22 2 2n n 2 (4.12) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a x + a x + · · · + a x = b . m1 1 m2 2 mn n m Систему лiнiйних однорiдних рiвнянь a11 x1 + a12 x2 + · · · + a1n xn = 0, a x + a x + · · · + a x = 0, 21 1 22 2 2n n ....................................... a x + a x + · · · + a x = 0, m1 1 m2 2 mn n
(4.13)
4.4. Фундаментальна система розв’язкiв
65
яка отримується iз системи (4.12) замiною вiльних членiв нулями, називають зведеною системою для системи (4.12). Мiж розв’язками систем (4.12) i (4.13) iснує тiсний взаємозв’язок, як показують такi двi теореми. Теорема 4.4.3. Сума довiльного розв’язку системи (4.12) з довiльним розв’язком зведеної системи (4.13) знову буде розв’язком системи (4.12). Доведення. Нехай u1 , u2 , . . . , un — розв’язок системи (4.12), v1 , v2 , . . . , vn — розв’язок системи (4.13). Вiзьмемо довiльне iз рiвнянь системи (4.12), наприклад k-e, i вставимо в нього замiсть невiдомих числа u1 + v1 , u2 + v2 , . . . , un + vn . Ми отримаємо n X
akj (uj + vj ) =
j=1
n X
akj uj +
j=1
n X
akj vj = bk + 0 = bk ,
j=1
що й потрiбно було показати. Теорема 4.4.4. Рiзниця довiльних двох розв’язкiв системи лiнiйних неоднорiдних рiвнянь (4.12) є розв’язком зведеної системи рiвнянь (4.13). Доведення. Нехай u1 , u2 , . . . , un i u01 , u02 , . . . , u0n — розв’язки системи (4.12). Вiзьмемо довiльне iз рiвнянь системи (4.12), наприклад k-e, i пiдставимо в нього замiсть невiдомих числа u1 − u01 , u2 − u02 , . . . , un − u0n . Ми отримаємо n X j=1
akj (uj − u0j ) =
n X
akj uj −
j=1
що й потрiбно було показати.
n X j=1
akj u0j = bk − bk = 0,
66
Тема 4. Ранг системи векторiв. Ранг матрицi
Iз цих теорем випливає, що знайшовши один розв’язок системи лiнiйних неоднорiдних рiвнянь (4.12) i додаючи його до кожного iз розв’язкiв зведеної системи (4.13), ми отримаємо всi розв’язки системи (4.12).
4.5. Задачi Для аудиторного розв’язання [13]: №№ 619, 621, 624, 643, 669, 675, 679, 698, 724, 727, 741. Для самостiйного розв’язання [13]: №№ 620, 622, 625, 644, 668, 676, 680, 699, 725, 730. Задачi контрольної роботи i колоквiуму [13]: №№ 619 − 622, 624 − 626, 665 − 669, 673 − 676, 679 − 681, 698 − 704, 712 − 723, 724 − 732, 741, 742, 746. [14]: №№ 7.2 − 7.8, 8.2, 8.4.
Тема 5.
Теорiя визначникiв 5.1. Визначники другого i третього порядкiв Розглянемо систему двох лiнiйних рiвнянь з двома невiдомими ( a1 x + b1 y = c1 , (5.1) a2 x + b2 y = c2 , позначимо через A матрицю коефiцiєнтiв цiєї системи µ ¶ a1 b1 A= . a2 b2
(5.2)
Щоб знайти невiдоме x, домножимо перше рiвняння системи (5.1) на b2 , друге на −b1 i додамо їх (a1 b2 − a2 b1 )x = c1 b2 − c2 b1 . Аналогiчно, домножуючи перше рiвняння на −a2 , друге на a1 , знайдемо (a1 b2 − a2 b1 )y = a1 c2 − a2 c1 . Якщо a1 b2 − a2 b1 6= 0, то x=
c1 b2 − c2 b1 , a1 b2 − a2 b1
y= 67
a1 c2 − a2 c1 . a1 b2 − a2 b1
(5.3)
68
Тема 5. Теорiя визначникiв
Безпосередньою перевiркою легко переконатися, що значення x та y, якi отримали за формулами (5.3), насправдi задовольняють систему (5.1). Отож, ми довели таке: якщо a1 b2 − a2 b1 6= 0, то система (5.1) має єдиний розв’язок, який визначається формулами (5.3). Знаменник a1 b2 − a2 b1 формули (5.3) визначається числами матрицi (5.2) за таким правилом: треба взяти добуток чисел, якi розташованi на головнiй дiагоналi, i вiдняти вiд нього добуток чисел iншої дiагоналi. Отриманий вираз a1 b2 − a2 b1 називається визначником або детермiнантом другого порядку матрицi A i позначається det A або |A|. Отже, згiдно з означенням для довiльної квадратної матрицi другого порядку маємо ¯ ¯ ¯a1 b1 ¯ ¯ ¯ (5.4) ¯a2 b2 ¯ = a1 b2 − a2 b1 . Наприклад, якщо A =
¯ ¯ ¡2 3¢ ¯2 3¯ 5 8 , то |A| = 5 8 = 2 · 8 − 5 · 3 = 1.
Правило, за яким обчислюється визначник матрицi другого порядку, схематично можна зобразити так: f f
f f
=
v f @ f @v
f
−
v ¡ ¡ f v
За допомогою поняття визначника формули (5.3) можна переписати у виглядi ¯ ¯ ¯ ¯ ¯a1 c1 ¯ ¯c1 b1 ¯ ¯ ¯ ¯ ¯ ¯a2 c2 ¯ ¯c2 b2 ¯ |A1 | |A | ¯= ¯= 2 , , y=¯ (5.5) x= ¯ ¯a1 b1 ¯ ¯ ¯ |A| |A| ¯ ¯a1 b1 ¯ ¯ ¯a2 b2 ¯ ¯a2 b2 ¯ де матрицi A1 та A2 отримують з матрицi A замiною першого та, вiдповiдно, другого стовпчикiв на стовпчик вiльних членiв.
5.1. Визначники другого i третього порядкiв
69
(Нагадаємо ще раз, що цi формули можна використовувати лише в тому випадку, коли |A| 6= 0). Розв’яжемо аналогiчно систему трьох лiнiйних рiвнянь з трьома невiдомими a1 x + b1 y + c1 z = d1 , a2 x + b2 y + c2 z = d2 , a3 x + b3 y + c3 z = d3 .
(5.6)
Матрицю коефiцiєнтiв цiєї системи позначимо через A a1 b1 c1 A = a2 b2 c2 . a3 b3 c3 Щоб знайти x, домножимо кожне рiвняння системи (5.6), вiдповiдно, на b2 c3 − b3 c2 , b3 c1 − b1 c3 , b1 c2 − b2 c1 i додамо отриманi лiвi та правi частини. Пiсля зведення подiбних членiв (стосовно x, y i z) отримуємо, що коефiцiєнти бiля y та z дорiвнюють нулю. Припускаючи, що коефiцiєнт бiля x вiдмiнний вiд нуля, маємо x=
d1 b2 c3 + d2 b3 c1 + d3 b1 c2 − d1 b3 c2 − d2 b1 c3 − d3 b2 c1 . a1 b2 c3 + a2 b3 c1 + a3 b1 c2 − a1 b3 c2 − a2 b1 c3 − a3 b2 c1
(5.7)
Вираз, який є у знаменнику цiєї формули, складений iз елементiв матрицi A за таким правилом: добуток чисел, розташованих на головнiй дiагоналi, i два добутки чисел, розташованих у вершинах двох рiвнобедрених трикутникiв з основами, паралельними до головної дiагоналi, беруть зi знаком плюс; три добутки, якi будують за таким самим правилом, але стосовно iншої дiагоналi, беруть зi знаком мiнус. Схематично це правило можна зобразити так
70
Тема 5. Теорiя визначникiв
f
f
f
f
f
f
f
f
f
v v v @© ¢@ ©©¢ ©¢@v © v ¢ v @ @ ¢©© @¢ ¢v @v © ¢ @v
=
−
v v v HH A ¡AH¡ ¡ ¡AHv v v HAH A¡HA¡ v A¡ ¡ v HAv
Складена сума з шести складових (три з яких взято зi знаком плюс, три — зi знаком мiнус) називається визначником третього порядку матрицi A ¯ ¯ ¯a1 b1 c1 ¯ ¯ ¯ |A| = ¯¯a2 b2 c2 ¯¯ = ¯a3 b3 c3 ¯ = a1 b2 c3 + a2 b3 c1 + a3 b1 c2 − a1 b3 c2 − a2 b1 c3 − a3 b2 c1 . (5.8) ³ Наприклад, якщо A = ¯ ¯ 1 ¯ |A| = ¯¯ 2 ¯−1
2 1 2
1 2 3 2 1 4 −1 2 5
´ , то
¯ 3¯¯ 4¯¯ = 1·1·5+2·2·3+(−1)·2·4−(−1)·1·3−2·2·5−1·2·4 = −16. 5¯
Об’єднуючи справа в (5.8) члени, якi мiстять елементи a1 , b1 , c1 , i згадуючи формулу (5.4), отримуємо ¯ ¯ ¯a1 b1 c1 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯a2 b2 c2 ¯ = a1 ¯b2 c2 ¯ − b1 ¯a2 c2 ¯ + c1 ¯a2 b2 ¯ . (5.9) ¯ ¯ ¯b3 c3 ¯ ¯a3 c3 ¯ ¯a3 b3 ¯ ¯a3 b3 c3 ¯ Формула (5.9) легко запам’ятовується. Щодо чисельника у формулi (5.7), то оскiльки його отримують iз знаменника замiною a1 , a2 , a3 , вiдповiдно, на d1 , d2 , d3 , то його можна зобразити у виглядi визначника ¯ ¯ ¯d1 b1 c1 ¯ ¯ ¯ ¯d2 b2 c2 ¯ = |A1 |. ¯ ¯ ¯d3 b3 c3 ¯
5.2. Перестановки. Транспозицiї
71
Аналогiчно, якщо кожне рiвняння системи (5.6) домножимо послiдовно на a3 c2 − a2 c3 , a1 c3 − a3 c1 , a1 c1 − a1 c2 i результати додамо, знайдемо формулу для y. Зрештою, домножуючи кожне рiвняння (5.6) почергово на a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 , знайдемо формулу для z. У пiдсумку отримаємо x=
|A1 | , |A|
y=
|A2 | , |A|
z=
|A3 | , |A|
(5.10)
де матрицi A1 , A2 , A3 отримують iз A замiною вiдповiдного стовпчика на стовпчик вiльних членiв. Зауважимо, що формули (5.10) ми вивели в припущеннi, що |A| 6= 0. Щоб отримати формули, аналогiчнi формулам (5.5), (5.10), для систем n лiнiйних рiвнянь з n невiдомими при довiльному n > 3, треба розглянути означення визначника квадратної матрицi n-го порядку.
5.2. Перестановки. Транспозицiї Для явного аналiтичного вираження визначника матрицi порядку n введемо поняття перестановки. Означення 5.2.1. Послiдовнiсть (k1 , k2 , . . . , kn ) натуральних чисел 1, 2, . . . , n, розташованих у довiльному порядку, називається перестановкою з n елементiв. Оскiльки k1 може набувати n рiзних значень, k2 при заданому значеннi k1 може приймати n − 1 значень, k3 при заданих k1 i k2 може приймати n − 2 значень i т.д., то iснує всього n(n − 1)(n − 2) · · · 2 · 1 = n! перестановок iз n елементiв. Перестановка (1, 2, . . . , n) називається тривiальною.
72
Тема 5. Теорiя визначникiв
Означення 5.2.2. Кажуть, що пара чисел утворює iнверсiю в заданiй перестановцi, якщо бiльше з них розташоване лiвiше меншого, тобто числа ki та kj утворюють iнверсiю в перестановцi (k1 , . . . , ki , . . . , kj , . . . , kn ), якщо ki > kj , а i < j. Якщо числа ki та kj не утворюють iнверсiї, то кажуть, що вони уторюють порядок. Означення 5.2.3. Перестановка називається парною (непарною), якщо кiлькiсть iнверсiй в нiй парна (вiдповiдно, непарна). Поряд з цим визначається знак перестановки, який дорiвнює 1, якщо перестановка парна, i дорiвнює −1, якщо вона непарна. Знак перестановки (k1 , . . . , kn ) позначається через sgn(k1 , . . . , kn ) i називається сигнатурою. Наприклад, при n = 3 перестановки (1,2,3) (немає iнверсiй), (2,3,1) (двi iнверсiї) i (3,1,2) (двi iнверсiї) є парними перестановками, а перестановки (1,3,2) (1 iнверсiя), (3,2,1) (3 iнверсiї) i (2,1,3) (1 iнверсiя) — непарнi. Ще один приклад. Тривiальна перестановка (1, 2, . . . , n) не має iнверсiй, тому є парною. У перестановцi (n, n − 1, . . . , 2, 1) навпаки: довiльна пара чисел утворює iнверсiю, тому кiлькiсть iнверсiй у цiй перестановцi дорiвнює Cn2 =
n(n − 1) . 2
Звiдси випливає, що sgn(n, n − 1, . . . , 2, 1) = (−1)
n(n−1) 2
.
Означення 5.2.4. Замiну мiсцями двох елементiв у перестановцi називають транспозицiєю цих елементiв. Твердження 5.2.1. Вiд довiльної перестановки можна перейти до будь-якої iншої за допомогою декiлькох послiдовно виконаних транспозицiй. Доведення. Проведемо доведення iндукцiєю за кiлькiстю n чисел, якi входять у перестановки. При n = 2 iснують тiльки двi
5.2. Перестановки. Транспозицiї
73
перестановки (1, 2) та (2, 1), i вiд будь-якої з них можна перейти до iншої за допомогою однiєї транспозицiї. Отож, при n = 2 теорема справджується. Нехай тепер n > 2 i припустимо, що твердження правильне для всiх перестановок, що складаються з n−1 числа. Розглянемо двi довiльнi перестановки n чисел (k1 , k2 , k3 , . . . , kn ),
(5.11)
(t1 , t2 , t3 , . . . , tn ).
(5.12)
Можливi два випадки: а) k1 = t1 ; б) k1 6= t1 . Розглянемо їх почергово. а) Нехай k1 = t1 . У цьому випадку (k2 , k3 , . . . , kn )
i
(t2 , t3 , . . . , tn )
будуть перестановками тих самих n − 1 чисел. За припущенням iндукцiї вiд перестановки (k2 , k3 , . . . , kn ) до перестановки (t2 , t3 , . . . , tn ) можна перейти за допомогою декiлькох послiдовно виконаних транспозицiй. Якщо цi транспозицiї (i в тому самому порядку) виконати в перестановцi (k1 , k2 , . . . , kn ), то отримаємо перестановку (k1 , t2 , . . . , tn ), тобто перестановку (5.12). Отже, у випадку k1 = t1 твердження доведено. б) Нехай тепер k1 6= t1 . Вихiдна перестановка (5.11) у цьому випадку має вигляд (k1 , k2 , k3 , . . . , t1 , . . . , kn )
(5.13)
(t1 збiгається з одним iз чисел k2 , k3 , . . . , kn ). Помiняємо в (5.13) числа k1 i t1 мiсцями (тобто виконаємо одну транспозицiю). Отримаємо перестановку (t1 , k2 , k3 , . . . , k1 , . . . , kn ).
(5.14)
Порiвнюючи (5.14) з (5.12), бачимо, що першi числа перестановок збiгаються, тобто ми отримали розглядуваний випадок а). Тому
74
Тема 5. Теорiя визначникiв
можемо перейти вiд перестановки (5.14) до перестановки (5.12) за допомогою декiлькох транспозицiй. Отже, i в цьому випадку перестановка (5.11) за допомогою транспозицiй може бути переведена у перестановку (5.12). Твердження доведено. Твердження 5.2.2. Транспозицiя змiнює парнiсть перестановки. Доведення. При транспозицiї сусiднiх елементiв змiнюється взаємне розташування тiльки цих елементiв, так що кiлькiсть iнверсiй змiнюється (збiльшується або зменшується) на 1, тому парнiсть перестановки змiнюється на протилежну. Транспозицiя елементiв ki та kj , роздiлених s iншими елементами, може бути виконана шляхом 2s + 1 послiдовних транспозицiй сусiднiх елементiв: спочатку переставляємо ki з усiма промiжними елементами (s транспозицiй) та з елементом kj (1 транспозицiя), потiм переставляємо kj зi всiма промiжними елементами (s транспозицiй). За доведеним вище кожного разу знак перестановки буде змiнюватися. Оскiльки така змiна знака вiдбудеться непарну кiлькiсть разiв (2s + 1 — непарне число), то, як наслiдок, знак перестановки змiниться на протилежний. Приклад. Розглянемо перестановку (2,3,1), яка має двi iнверсiї, а тому є парною. Виконаємо в нiй транспозицiю елеметiв 2 та 1. Отримаємо перестановку (1,3,2), яка має уже тiльки одну iнверсiю, а тому є непарною. Бачимо, що пiсля виконання однiєї транспозицiї початкова перестановка змiнила свiй знак на протилежний.
Наслiдок 5.2.3. При n > 1 кiлькiсть парних перестановок iз n елементiв збiгається з кiлькiстю непарних i дорiвнює n! 2. Доведення. Випишемо всi парнi перестановки, у кожнiй з них виконаємо транспозицiю перших двох елементiв. Тодi отримаємо всi непарнi перестановки, причому по одному разу.
5.3. Визначники n-го порядку
75
5.3. Визначники n-го порядку Означення 5.3.1. Визначником (або детермiнантом ) n-го порядку називається число, що дорiвнює алгебраїчнiй сумi n! доданкiв, кожен з яких є добутком елементiв, взятих по одному з кожного стовпця i з кожного рядка, причому такий добуток входить у суму зi знаком плюс пбо мiнус в залежностi вiд вiдповiдних перестановок. Iнакше кажучи, ¯ ¯ ¯ a11 a12 . . . a1n ¯ ¯ ¯ X ¯ a21 a22 . . . a2n ¯ ¯= ¯ (−1)r+s ak1 t1 ak2 t2 . . . akn tn , (5.15) ¯ . . . . . . . . . . . . . . . . . . .¯ ¯ (k1 ,...,kn ) ¯ ¯an1 an2 . . . ann ¯ (t1 ,...,tn ) де r дорiвнює кiлькостi iнверсiй у перестановцi (k1 , k2 , . . . , kn ), складеної з iндексiв (номерiв) рядкiв, а s — кiлькiсть iнверсiй у перестановцi (t1 , t2 , . . . , tn ), складеної з iндексiв стовпцiв. Iнколи буває зручно, щоб у так сформульованому поняттi визначника другi iндекси (номери стопвчикiв) елементiв добуткiв (або першi — номери рядкiв) було розмiщено у натуральному порядку. Тодi знаки добуткiв елементiв залежатимуть лише вiд перестановок, складених з iндексiв рядкiв, i ми отримаємо ще одне означення визначника. Означення 5.3.2. Визначником квадратної матрицi A = [aij ] порядку n називається число det A =
X
(−1)r ak1 1 ak2 2 . . . akn n ,
(k1 ,k2 ,...,kn )
де r — кiлькiсть iнверсiй у перестановцi (k1 , k2 , . . . , kn ), складеної з iндексiв (номерiв) рядкiв.
76
Тема 5. Теорiя визначникiв
Означення 5.3.2 еквiвалентне означенню 5.3.1. Справдi, якщо в якомусь доданку переставити мiсцями два множники, то це приведе до транспозицiї як серед перших iндексiв, так i серед других. Тодi за лемою 5.2.2 обидвi перестановки (k1 , . . . , kn ) та (t1 , . . . , tn ) змiнять свою парнiсть, але, очевидно, парнiсть суми r + s їх iнверсiй залишиться незмiнною. Тодi серiєю транспозицiй легко досягнути того, що другi iндекси елементiв добуткiв будуть розмiщенi в натуральному порядку (як в означеннi 5.3.2). Якщо згадати поняття сигнатури, то означення визначника можна перефразувати ще по-iншому. Означення 5.3.3. Визначником квадратної матрицi A = [aij ] порядку n називається число X det A = sgn(k1 , . . . , kn ) sgn(t1 , . . . , tn ) ak1 t1 ak2 t2 . . . akn tn (k1 ,k2 ,...,kn ) (t1 ,t2 ,...,tn )
або
X
det A =
sgn(k1 , k2 , . . . , kn ) ak1 1 ak2 2 . . . akn n .
(k1 ,k2 ,...,kn )
Ми будемо користуватися кожним iз цих означень, в залежностi вiд необхiдностi простоти викладу.
5.4. Найпростiшi властивостi визначникiв Лема 5.4.1. Якщо матриця мiстить нульовий стовпчик (рядок), то визначник цiєї матрицi дорiвнює нулю. Доведення. Якщо у матрицi A один стовпчик (рядок) є нульовим, то за означенням визначника нуль буде одним зi спiвмножникiв у кожному доданку визначника det A. Отож, det A =
P
(−1)r ak1 1 . . . 0 . . . akn n = 0.
(k1 ,...,kn )
5.4. Найпростiшi властивостi визначникiв
77
Лема 5.4.2. При домноженнi будь-якого стовпчика (рядка) матрицi на скаляр, визначник цiєї матрицi домножується на цей самий скаляр. Доведення. Нехай λ — спiльний множник j-го стовпчика визначника. Тодi ¯ ¯ ¯ a11 . . . λa1j . . . a1n ¯ ¯ ¯ ¯ a21 . . . λa2j . . . a2n ¯ ¯ ¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . . .¯ = ¯ ¯ ¯an1 . . . λanj . . . ann ¯ X = (−1)r ak1 1 . . . λakj j . . . akn n = (k1 ,...,kn )
=λ
X
(−1)r ak1 1 . . . akj j . . . akn n =
(k1 ,...,kn )
¯ ¯ ¯ a11 . . . a1j . . . a1n ¯ ¯ ¯ ¯ a21 . . . a2j . . . a2n ¯ ¯. = λ ¯¯ ¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯an1 . . . anj . . . ann ¯
Лема 5.4.3. Якщо два стовпчики (рядки) матрицi визначника переставити мiсцями, то визначник змiнює свiй знак на протилежний. Доведення. При перестановцi мiсцями i-го та j-го (i < j) стовпчикiв матрицi, кожен доданок визначника змiнює свiй знак на протилежний за рахунок додаткової транспозицiї в перестановцi (1, . . . , j, . . . , i, . . . , n), складеної з iндексiв стовпчикiв (нагадаємо, що до замiни стовпчикiв, перестановка з їхнiх iндексiв була
78
Тема 5. Теорiя визначникiв
тривiальною (1, . . . , i, . . . , j, . . . , n)). Тому ¯ ¯ ¯ a11 . . . a1i . . . a1j . . . a1n ¯ ¯ ¯ ¯ a21 . . . a2i . . . a2j . . . a2n ¯ ¯ ¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .¯ = ¯ ¯ ¯an1 . . . ani . . . anj . . . ann ¯ X = (−1)r ak1 1 . . . aki i . . . akj j . . . akn n = (k1 ,...,kn )
=
X
(−1) (−1)r ak1 1 . . . aki j . . . akj i . . . akn n =
(k1 ,...,kn )
¯ ¯ ¯ a11 . . . a1j . . . a1i . . . a1n ¯ ¯ ¯ ¯ a21 . . . a2j . . . a2i . . . a2n ¯ ¯. ¯ = (−1) ¯ ¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯an1 . . . anj . . . ani . . . ann ¯
Наслiдок 5.4.4. Визначник матрицi, яка має два однаковi стовпчики (рядки), дорiвнює нулю. Доведення. Нехай A — матриця з двома однаковими стовпчиками. Переставивши цi стовпчики мiсцями, отримаємо ту саму матрицю, проте її визначник за лемою 5.4.3 змiнить знак на протилежний. Тому det A = − det A, а це можливо лише тодi, коли det A = 0. Наслiдок 5.4.5. Визначник матрицi, в якiй два довiльнi стовпчики (рядки) пропорцiйнi, дорiвнює нулю. Наслiдок 5.4.6. Якщо матрицю B одержано з матрицi A за допомогою перестановки стовпчикiв (рядкiв), то |B| = sgn(t1 , t2 , . . . , tn )|A|,
5.4. Найпростiшi властивостi визначникiв
79
де t1 , t2 , . . . , tn — номери стовпчикiв (рядкiв), в якi перейшли стовпчики (рядки) з початковими номерами 1, 2, . . . , n. Лема 5.4.7. Якщо кожен елемент j-го стовпчика (рядка) матрицi A є сумою m складових, то визначник матрицi A дорiвнює сумi m визначникiв, причому у матрицi першого визначника в j-му стовпчику (рядку) мiстяться першi складовi, в матрицi другого — другi i т.д., iншi стовпчики (рядки) залишаться без змiн. Доведення. Без зменшення загальностi вважатимемо, що j-й стовпчик є сумою лише двох складових. Тодi ¯ ¯ ¯ a11 . . . a(1) + a(2) . . . a1n ¯ 1j 1j ¯ ¯ ¯ ¯ (1) (2) a . . . a + a . . . a ¯ 21 2n ¯ 2j 2j ¯ ¯= ¯. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯ ¯ (1) (2) ¯a . . . ann ¯ n1 . . . anj + anj X (1) (2) = (−1)r ak1 1 . . . (akj j + akj j ) . . . akn n = (k1 ,...,kn )
=
X
(1)
(−1)r ak1 1 . . . akj j . . . akn n +
(k1 ,...,kn )
+
X
(2)
(−1)r ak1 1 . . . akj j . . . akn n =
(k1 ,...,kn )
¯ ¯ ¯ ¯ ¯ a11 . . . a(1) . . . a1n ¯ ¯ a11 . . . a(2) . . . a1n ¯ 1j 1j ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ (1) (2) ¯ a21 . . . a2j . . . a2n ¯ ¯ a21 . . . a2j . . . a2n ¯ =¯ ¯+¯ ¯. ¯ . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯ ¯ ¯ ¯ (1) (2) ¯a . . . ann ¯ ¯an1 . . . anj . . . ann ¯ n1 . . . anj Лема 5.4.8. Якщо до якого-небудь стовпчика (рядка) матрицi визначника додати iнший стовпчик (рядок) матрицi, помножений на довiльний скаляр, то визначник матрицi не змiниться.
80
Тема 5. Теорiя визначникiв
Доведення. Нехай матрицю B отримуємо з матрицi A в результатi додаваня до i-го стовпчика j-го стовпчика, помноженого на скаляр λ, тобто ¯ ¯ ¯ a11 . . . a1i + λa1j . . . a1j . . . a1n ¯ ¯ ¯ ¯ a21 . . . a2i + λa2j . . . a2j . . . a2n ¯ ¯ ¯. det B = ¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¯ ¯ ¯an1 . . . ani + λanj . . . anj . . . ann ¯ За властивостями 5.4.7 та 5.4.2 визначник матрицi B можна подати у виглядi суми двох складових ¯ ¯ ¯ a11 . . . a1i . . . a1j . . . a1n ¯ ¯ ¯ ¯ a21 . . . a2i . . . a2j . . . a2n ¯ ¯ ¯+ det B = ¯ ¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯an1 . . . ani . . . anj . . . ann ¯ ¯ ¯ ¯ a11 . . . a1j . . . a1j . . . a1n ¯ ¯ ¯ ¯ a21 . . . a2j . . . a2j . . . a2n ¯ ¯ ¯. + λ¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¯ ¯ ¯an1 . . . anj . . . anj . . . ann ¯ У цiй сумi другий визначник дорiвнює нулю, оскiльки має два однаковi стовпчики; тому det B = det A.
Наслiдок 5.4.9. Якщо до якого-небудь стовпчика (рядка) матрицi визначника додати лiнiйну комбiнацiю iнших стовпчикiв (рядкiв) матрицi, то визначник цiєї матрицi не змiниться. Наслiдок 5.4.10. Якщо який-небудь стовпчик (рядок) матрицi визначника є лiнiйною комбiнацiєю iнших стовпчикiв (рядкiв) матрицi, то визначник цiєї матрицi дорiвнює нулю.
5.5. Визначник матрицi трикутного вигляду
81
Лема 5.4.11. Визначник матрицi при транспонуваннi не змiнюється, тобто det A> = det A. Доведення. Визначник матрицi A> , як i визначник матрицi A, є алгебричною сумою n! всiляких можливих добуткiв n елементiв матрицi A, взятих по одному з кожного рядка i кожного стовпця з вiдповiдним знаком. Тому єдине, в чому треба переконатися — це те, чи вiдповiднi добутки входять в det A i det A> з однаковими знаками. Для того щоб з’ясувати, з яким знаком входить в det A> добуток ak1 1 ak2 2 . . . akn n , треба розташувати його спiвмножники за порядком номерiв рядкiв. Цього можна досягти, послiдовно мiняючи мiсцями два спiвмножники. При кожнiй такiй змiнi в перестановках, якi утворюють номери рядкiв i стовпцiв, одночасно вiдбудуться транспозицiї, так що добуток їхнiх сигнатур не змiниться. Отож, якщо отриманий в результатi добуток матиме вигляд a1t1 a2t2 . . . antn , то sgn(k1 , k2 , . . . , kn ) = sgn(t1 , t2 , . . . , tn ), а це й означає, що розглядуваний добуток входить у визначники det A i det A> з тим самим знаком, що й потрiбно було показати.
5.5. Визначник матрицi трикутного вигляду Твердження 5.5.1. Визначник верхньої (нижньої) трикутної матрицi дорiвнює добутку її дiагональних елементiв. Доведення. Припустимо, що матриця A є верхньою трикутною матрицею, тобто всi елементи матрицi A, розмiщенi нижче го-
82
Тема 5. Теорiя визначникiв
ловної дiагоналi, дорiвнюють нулю a11 ∗ .. A= . . 0 ann За означенням визначника маємо X det A = (−1)r ak1 1 ak2 2 . . . akn n .
(5.16)
(k1 ,...,kn )
У нашому випадку aki i = 0 для ki > i, тому в сумi (5.16) можна залишити лише тi доданки, для яких правильнi нерiвностi k1 ≤ 1,
k2 ≤ 2, . . . , kn ≤ n.
(5.17)
Додавши почленно цi нерiвностi, одержуємо k1 + k2 + · · · + kn ≤
n(n + 1) . 2
Але k1 , k2 , . . . , kn є деякою перестановкою чисел 1, . . . , n. Тому лiва частина останньої нерiвностi також дорiвнює n(n+1) . Звiдси 2 випливає, що кожна з нерiвностей (5.17) повинна бути рiвнiстю. Це означає, що в сумi (5.16) можна залишити лише єдиний доданок a11 a22 . . . ann . Отже, det A = a11 a22 . . . ann . Приклад.
¯ ¯1 ¯ ¯0 ¯ ¯0
−2 −5 0
¯ 11¯¯ 6 ¯¯ = 1 · (−5) · 4 = −20. 4¯
Iз доведеного випливає ще один практичний метод обчислення визначникiв: за допомогою елементарних перетворень стовпчикiв i рядкiв приводимо матрицю визначника до трикутного
5.6. Мiнори та алгебричнi доповнення
83
вигляду (враховуючи, що при перестановцi двох стовпчикiв (рядкiв) визначник змiнює знак (лема 5.4.3); при додаваннi до одного стовпчика (рядка) iншого, помноженого на скаляр, визначник не змiнюється (лема 5.4.8); при множеннi стовпчика (рядка) на скаляр визначник множиться на цей скаляр (лема 5.4.2)). Тодi визначник такої трикутної матрицi, отриманої в результатi елементарних перетворень, дорiвнює добутку елементiв, розмiщених на головнiй дiагоналi. Звiдси також випливає, що визначник дiагональної матрицi дорiвнює добутку дiагональних елементiв. Приклад. Обчислимо визначник ¯ ¯1 1 ¯ ¯1 −1 ¯ ¯1 1 ¯ ¯1 1
1 1 −1 1
¯ 1 ¯¯ 1 ¯¯ . 1 ¯¯ ¯ −1
Для цього зведемо даний визначник до трикутного вигляду: вiд другого, третього i четвертого рядкiв почергово вiднiмемо перший рядок (нагадаємо, що у цьому випадку за лемою 5.4.8 визначник не змiниться). В пiдсумку отримаємо ¯ ¯ ¯ ¯ ¯1 1 1 1 ¯¯ 1 1 1 ¯¯ ¯¯1 ¯ ¯1 −1 0 0 ¯¯ 1 1 ¯¯ ¯¯0 −2 ¯ = 1 · (−2) · (−2) · (−2) = −8. ¯ = ¯0 ¯1 0 −2 0 ¯¯ 1 −1 1 ¯ ¯ ¯ ¯ ¯ ¯ ¯1 0 0 0 −2 1 1 −1
5.6. Мiнори та алгебричнi доповнення Нехай A = [aij ] — прямокутна матриця розмiру m × n i 1 ≤ k ≤ min{m, n}. Означення 5.6.1. Мiнором k-го порядку матрицi A називається визначник квадратної матрицi, складеної з елементiв, що розмiщенi на перетинi довiльно вибраних k рядкiв i k стовпчикiв матрицi A. Зазначимо, що вибранi рядки i стовпцi необов’язково повиннi йти пiдряд.
84
Тема 5. Теорiя визначникiв
Приклад.
Нехай
2 A = 1 1
9 0 1
1 2 9
7 −1 . 1
Тодi: а) 2,1, 7, 0, −1 — деякi з мiнорiв першого порядку матрицi A. Ця матриця має всього порядку, деякi з них дорiвнюють один одному; ¯ ¯ першого ¯ ¯ ¯12¯ мiнорiв ¯ — деякi з мiнорiв другого порядку; б) ¯ 21 90 ¯, ¯ 91 71 ¯, ¯ 11 −1 ¯ 2 9 1 ¯ ¯ 2 9 7 ¯ 1¯ 2 1 7 ¯ ¯ 9 1 7 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ в) ¯ 1 0 2 ¯, ¯ 1 0 −1 ¯, ¯ 1 2 −1 ¯, ¯ 0 2 −1 ¯ — всi мiнори третього порядку. 1 1 9
1 1 1
1 9 1
1 9 1
Означення 5.6.2. Якщо A = [aij ] — квадратна матриця порядку n, то мiнор порядку n − 1, який отримують iз матрицi A викреслюванням i-го рядка та j-го стовпчика, називається доповнювальним мiнором елемента aij i позначається через Mij . Число Aij = (−1)i+j Mij називається алгебричним доповненням елемента aij . Iнакше кажучи, Aij — це визначник матрицi, одержаної з матрицi A викреслюванням i-го рядка та j-го стовпчика та домножений на число (−1)i+j . Приклад. Деякими з алгебричних 9 1 1
доповнень матрицi 1 7 0 −1 3 4
є такi числа: ¯ ¯ ¯0 −1¯ ¯ = −3. A11 = (−1)1+1 M11 = ¯¯ 3 4 ¯ ¯ ¯ ¯1 −1¯ ¯ = −5. A12 = (−1)1+2 M12 = − ¯¯ 1 4 ¯ ¯ ¯ ¯9 1 ¯ ¯ = −26. A23 = (−1)2+3 M23 = − ¯¯ 1 3¯
5.6. Мiнори та алгебричнi доповнення
85
Лема 5.6.1. ¯ ¯ ¯a11 a12 . . . a1n ¯ ¯ ¯ ¯ ¯ ¯ a22 . . . a2n ¯ ¯ 0 a22 . . . a2n ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯. . . . . . . . . . . . . . . . . . .¯ = a11 A11 = a11 M11 = a11 ¯. . . . . . . . . . . . . .¯ . ¯ ¯ ¯an2 . . . ann ¯ ¯ 0 an2 . . . ann ¯ Доведення. Оскiльки всi елементи першого стовпчика, крiм a11 , дорiвнюють нулю, то в кожному доданку визначника представником першого стовпчика є елемент a11 . Тодi визначник дорiвнює X sgn(1, k2 , . . . , kn ) a11 ak2 2 . . . akn n = (1,k2 ,...,kn )
= a11
X
sgn(k2 , . . . , kn ) ak2 2 . . . akn n = a11 M11 .
(k2 ,...,kn )
(Тут використано той факт, що в перестановках (1, k2 , . . . , kn ) та (k2 , . . . , kn ) кiлькiсть iнверсiй однакова). Узагальнимо лему 5.6.1 на випадок, коли у визначнику нулями є всi елементи j-го стовпчика, крiм єдиного елемента aij . Лема 5.6.2.
¯ ¯ ¯ a11 . . . 0 . . . a1n ¯ ¯ ¯ ¯. . . . . . . . . . . . . . . . . . . . . . .¯ ¯ ¯ ¯ ai1 . . . aij . . . ain ¯ = aij Aij . ¯ ¯ ¯. . . . . . . . . . . . . . . . . . . . . . .¯ ¯ ¯ ¯an1 . . . 0 . . . ann ¯
Доведення. Помiняємо мiсцями i-й рядок з усiма попереднiми рядками та j-й стовпчик з усiма попереднiми стовпчиками. Будемо i − 1 раз мiняти мiсцями рядки та j − 1 раз стовпчики, так що за лемою 5.4.3 визначник домножиться на число (−1)i−1+j−1 = (−1)i+j .
86
Тема 5. Теорiя визначникiв
З iншого боку, в результатi всiх перестановок рядкiв i стовпчикiв отримаємо визначник ¯ ¯ ¯aij ai1 ai2 . . . ain ¯ ¯ ¯ ¯ 0 a11 a12 . . . a1n ¯ ¯ ¯ ¯. . . . . . . . . . . . . . . . . . . . . . . .¯ , ¯ ¯ ¯ 0 an1 an2 . . . ann ¯ до якого можна застосувати лему 5.6.1: цей визначник дорiвнює aij Mij . Звiдси, враховуючи множник (−1)i+j , отримуємо твердження леми.
5.7. Розклад визначника за елементами рядка або стовпчика Нехай A — квадратна матриця порядку n, тобто
a11 a12 . . . a1n a21 a22 . . . a2n A= . . . . . . . . . . . . . . . . . . . . an1 an2 . . . ann Теорема 5.7.1 (Лапласa). det A = ai1 Ai1 + ai2 Ai2 + · · · + ain Ain = det A = a1j A1j + a2j A2j + · · · + anj Anj =
n X
aij Aij ,
j=1 n X
aij Aij .
(5.18) (5.19)
i=1
Перша з цих формул називається формулою розкладу визначника за i-им рядком, друга — формулою розкладу визначника за j-им стовпчиком.
5.7. Розклад визначника за рядком
87
Доведення. Обмежимося доведенням формули рокладу визначника за j-им стовпчиком. Для цього використаємо влaстивостi визначника 5.4.7 та 5.6.2. ¯ ¯ ¯ a11 . . . a1j . . . a1n ¯ ¯ ¯ ¯ a21 . . . a2j . . . a2n ¯ ¯= det A = ¯¯ ¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯an1 . . . anj . . . ann ¯ ¯ ¯ ¯ a11 . . . a1j + 0 + · · · + 0 . . . a1n ¯ ¯ ¯ ¯ a21 . . . 0 + a2j + · · · + 0 . . . a2n ¯ ¯= ¯ =¯ ¯ ¯. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯an1 . . . 0 + 0 + · · · + anj . . . ann ¯ ¯ ¯ ¯ ¯ ¯ a11 . . . ¯ a11 . . . a1j . . . a1n ¯ 0 . . . a1n ¯¯ ¯ ¯ ¯ ¯a ¯a ... 0 . . . a2n ¯¯ . . . 0 . . . a2n ¯¯ = ¯¯ 21 + · · · + ¯¯ 21 ¯ ¯= ¯ . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯. . . . . . . . . . . . . . . . . . . . . . . .¯ ¯an1 . . . 0 . . . ann ¯ ¯an1 . . . anj . . . ann ¯ = a1j A1j + a2j A2j + · · · + anj Anj =
n X
aij Aij .
i=1
Приклад. Обчислимо визначник матрицi 1 2 3 A = 4 5 6 , 7 8 9 розклавши його за другим рядком. Маємо ¯ 3¯¯ 6¯¯ = 9¯ ¯ ¯2 = 4 · (−1)2+1 ¯¯ 8
¯ ¯1 ¯ det A = ¯¯4 ¯7
2 5 8
¯ ¯ ¯ 3¯¯ 2+2 ¯1 + 5 · (−1) ¯ ¯7 9
¯ ¯ ¯ 3¯¯ 2+3 ¯1 + 6 · (−1) ¯ ¯7 9
¯ 2¯¯ = 8¯
= −4 · (−6) + 5 · (−12) − 6 · (−6) = 0.
88
Тема 5. Теорiя визначникiв
5.8. Задачi Для аудиторного розв’язання [13]: №№ 9, 22, 43, 64, 71, 90, 100, 111, 125, 127, 188, 190, 197, 200, 225, 236, 238, 257, 279, 425. [14]: №№ 11.5, 13.1 (ж). Для самостiйного розв’язання [13]: №№ 1, 15, 23, 44, 72, 91, 102, 112, 126, 128, 129, 189, 191, 198, 202, 226, 237, 240, 259, 283, 426. [14]: №№ 13.1 (л). Задачi контрольної роботи i колоквiуму [13]: №№ 7 − 17, 22 − 27, 43 − 65, 71 − 73, 90 − 99, 100 − 105, 111 − 122, 123 − 140, 188 − 205, 212 − 215, 221, 225 − 230, 236 − 240, 240, 257 − 278, 279 − 285, 421, 425 − 442, 445 − 450. [14]: №№ 9.1(а−д), 9.2(а−ж), 10.1 − 10.4, 11.1 − 11.7, 11.10(а−в), 12.1 − 12.3, 13.1, 13.2, 14.1(а−д).
Тема 6.
Застосування визначникiв 6.1. Теорема про ранг матрицi Знаходження рангу матрицi може бути зведено до обчислення визначника. Теорема 6.1.1 (про ранг матрицi). Ранг матрицi дорiвнює максимальному порядку її мiнорiв, вiдмiнних вiд нуля. Доведення. Нехай ранг матрицi A дорiвнює r i нехай s > r, де s ∈ N. Тодi будь-якi s рядкiв матрицi A лiнiйно залежнi. Лiнiйно залежними будуть рядки довiльної квадратної пiдматрицi порядку s, якi є частинами вiдповiдних рядкiв матрицi A. Як наслiдок, довiльний мiнор порядку s дорiвнює нулю. Розглянемо пiдматрицю матрицi A, утворену будь-якими r лiнiйно незалежними рядками матрицi A. Ранг цiєї пiдматрицi, очевидно, також дорiвнює r i, отже, серед її стовпцiв знайдеться r лiнiйно незалежних. Мiнор порядку r, утворений цими стовпчиками, не дорiвнює нулю. Зауваження 6.1.1. Теорему про ранг матрицi можна сформулювати i довести по-iншому (грунтовнiше): якщо в матрицi A iснує хоча б один вiдмiнний вiд нуля мiнор порядку r, а всi мiнори порядку r + 1, отриманi дописуванням до нього одного рядка й одного стовпчика, дорiвнюють нулю, то rang A = r. 89
90
Тема 6. Застосування визначникiв Як наслiдок одержимо таку теорему.
Теорема 6.1.2. Визначник n-го порядку дорiвнює нулю тодi i тiльки тодi, коли його рядки (стовпчики) лiнiйно залежнi. Доведення. Необхiднiсть. Нехай A — квадратна матриця порядку n i det A = 0, тодi rang A < n (за теоремою 6.1.1). Отже, рядки (стовпчики) матрицi A лiнiйно залежнi. Достатнiсть — це одна з властивостей визначника.
6.2. Оберненi матрицi Означення 6.2.1. Матриця A−1 називається оберненою до матрицi A, якщо AA−1 = A−1 A = E, де E — одинична матриця. Матрицю A (тобто матрицю, для якої iснує обернена матриця) називають зворотною матрицею. Зауваження 6.2.1. З асоцiативностi добутку матриць випливає таке: якщо обернена матриця iснує, то вона єдина. Справдi, припустимо, що iснують двi матрицi B i C, оберненi до матрицi A. Тодi B = BE = B(AC) = (BA)C = EC = C, тобто B = C. Означення 6.2.2. Матрицю A називають невиродженою, якщо det A 6= 0. В iншому випадку її називають виродженою. Твердження 6.2.1. Кожну невироджену матрицю елементарними перетвореннями рядкiв можна звести до одиничної матрицi.
6.2. Оберненi матрицi
91
Доведення. Нехай det A 6= 0. За теоремою 2.5.1 матрицю A елементарними перетвореннями рядкiв можна звести до схiдчастого вигляду, бiльше того, до строго трикутного вигляду (зважаючи на теорему 6.1.2). Застосувавши до трикутної матрицi зворотний хiд методу Гаусса (зауваження 2.5.1), отримуємо одиничну матрицю. З цього твердження, зважаючи на § 2.3, легко бачити, що процесу перетворення невиродженої матрицi A в одиничну вiдповiдає матрична рiвнiсть Ik Ik−1 . . . I2 I1 A = E, де кожна з матриць I1 , I2 , . . . , Ik є елементарною матрицею одного iз трьох, ранiше розглянуних, типiв. З цiєї рiвностi випливає, що Ik Ik−1 . . . I2 I1 = A−1 = (Ik Ik−1 . . . I2 I1 )E. Остання матрична рiвнiсть означає, що матрицю A−1 можна отримати, виконавши над одиничною матрицею тi самi перетворення, якi виконуються над матрицею A при зведеннi її до одиничної. Приклад. Знайдемо за ¡допомогою елементарних перетворень матрицю, ¢ обернену до матрицi A = 13 24 . µ (A|E) =
1 3
¶ ¶ µ 1 2| 1 0 2|1 0 ∼ ∼ 0 −2| − 3 1 4|0 1 ¶ µ µ 1 0| 1 0 | −2 1 ∼ ∼ 0 1| 0 −2 | − 3 1
Отже,
µ A−1 =
−2 3 2
1 − 12
¶ .
−2 3 2
1 − 12
¶ = (E|A−1 ).
92
Тема 6. Застосування визначникiв
6.3. Формули Крамера Одним з практичних методiв розв’язування систем лiнiйних рiвнянь є метод Гаусса. Вiн дуже зручний на практицi, проте його важко застосовувати в теоретичних питаннях. Тому розглянемо ще деякi методи дослiдження та розв’язування систем лiнiйних рiвнянь. Розглянемо систему n лiнiйних рiвнянь з n невiдомими a11 x1 + a12 x2 + · · · + a1n xn = b1 , a x + a x + · · · + a x = b , 21 1 22 2 2n n 2 (6.1) ................................. a x + a x + · · · + a x = b . n1 1 n2 2 nn n n Позначимо a11 a12 . . . a1n a21 a22 . . . a2n A= . . . . . . . . . . . . . . . . . . . , an1 an2 . . . ann
a11 . . . b1 . . . a1n a21 . . . b2 . . . a2n Ai = . . . . . . . . . . . . . . . . . . . . . . . an1 . . . bn . . . ann
(Ai — матриця, одержанa з матрицi A замiною її i-го стовпчика на стовпчик вiльних членiв). У цих позначеннях справджується така теорема. Теорема 6.3.1. Якщо det A 6= 0, то система лiнiйних рiвнянь вигляду (6.1) має єдиний розв’язок, який обчилюють за формулами det Ai xi = , (i = 1, 2, . . . , n). det A Цi формули називаються формулами Крамера. Доведення. При будь-якому елементарному перетвореннi системи (6.1) одночасно вiдбувається вiдповiдне елементарне перетворення рядкiв у матрицi A та в матрицi Ai (i = 1, 2, . . . , n). Як
6.3. Формули Крамера
93
наслiдок, вiдношення, що є в правих частинах формул Крамера, не змiнюються. Оскiльки за допомогою елементарних перетворень рядкiв матрицю A можна привести до одиничної матрицi, то теорему достатньо довести у випадку, коли матриця A — одинична. Отже, якщо A = E, то систему (6.1) перепишемо у виглядi x1
= b1 = b2
x2 ...
.
xn = b n
Очевидно, що вона має єдиний розв’язок xi = bi (i = 1, 2, . . . , n). З iншого боку, det A = det E = 1, ¯ ¯ ¯1 0 . . . b1 . . . 0 0¯¯ ¯ ¯0 1 . . . b2 . . . 0 0¯¯ ¯ ¯ . . . . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯ ¯ bi . . . 0 0¯¯ = bi , det Ai = ¯¯0 0 . . . ¯ . . . . . . . . . . . . . . . . . . . . . . . . . . .¯ ¯ ¯ ¯0 0 . . . bn−1 . . . 1 0¯ ¯ ¯ ¯0 0 . . . bn . . . 0 1¯ отож, формули Крамера в цьому випадку насправдi правильнi.
Якщо det A = 0, то схiдчастий вигляд матрицi A не буде строго трикутним i, отже, система (6.1) або несумiсна, або невизначена1 i для її розв’язку треба застосувати якийсь iнший спосiб. 1 Зокрема, якщо det A = 0, але det Ai 6= 0 для довiльного i, то система (6.1) несумiсна. Якщо ж det A = det A1 = · · · = det An = 0, то система (6.1) може бути i несумiсною, i невизначеною.
94
Тема 6. Застосування визначникiв
Приклад. Розв’яжемо методом Крамера систему лiнiйних рiвнянь x1 − x2 + x3 = −2, 2x1 − x2 − x3 = 1, x1 + 2x2 + x3 = 4. Спочатку знайдемо визначник основної матрицi системи ¯ ¯ ¯1 −1 1 ¯¯ ¯ det A = ¯¯2 −1 −1¯¯ = 9. ¯1 2 1 ¯ Оскiльки det A 6= 0, то до цiєї системи лiнiйних рiвнянь можна застосувати формули Крамера. Для цього спочатку знайдемо ¯ ¯ ¯ ¯ ¯1 −2 ¯−2 −1 1 ¯¯ 1 ¯¯ ¯ ¯ 1 −1¯¯ = 18, −1 −1¯¯ = 9, det Ax2 = ¯¯2 det Ax1 = ¯¯ 1 ¯1 ¯ 4 4 1 ¯ 2 1 ¯ ¯ ¯ ¯1 −1 −2¯ ¯ ¯ 1 ¯¯ = −9. det Ax3 = ¯¯2 −1 ¯1 2 4 ¯ Тодi розв’язками цiєї системи будуть det Ax1 det Ax2 det Ax3 x1 = = 1, x2 = = 2, x3 = = −1. det A det A det A
Зауважимо також, що формули Крамера — це далеко не найкращий спосiб для практичного розв’язання систем лiнiйних рiвнянь, за винятком, можливо, випадку n = 2. Вони мають здебiльшого теоретичне застосування. Зокрема, вони дають змогу отримати явно формули для елементiв оберненої матрицi.
6.4. Обчислення обернених матриць Теорема 6.4.1. Нехай A = [aij ] — невироджена квадратна матриця порядку n. Тодi A11 A21 . . . An1 1 A12 A22 . . . An2 , A−1 = det A . . . . . . . . . . . . . . . . . . . . A1n A2n . . . Ann
6.4. Обчислення обернених матриць
95
де Aij — алгебричне доповнення до елемента aij . Доведення. Легко бачити, що матриця A−1 є розв’язком матричного рiвняння AX = E. (6.2) Якщо позначити черeз
x11 . . . X = ... ... xn1 . . .
x1n ..., xnn
то рiвняння (6.2) розкладається на n рiвнянь стосовно стовпчикiв x11 x12 x1n X1 = ... , X2 = ... , . . . , Xn = ... xn1 xn2 xnn матрицi X AXj = Ej ,
(6.3)
де Ej — j-й стопчик матрицi E. У координатному вираженi рiвняння (6.3) є системою n лiнiйних рiвнянь стосовно елементiв x1j , x2j , . . . , xnj стовпчика Xj . Матрицею коефiцiєнтiв цiєї системи слугує матриця A, стовпчиком вiльних членiв — стовпчик Ej . За формулами Крамера ¯ ¯ ¯ a11 . . . 0 . . . a1n ¯ ¯ ¯ ¯ . . . . . . . . . . . . . . . . . . . . . .¯ ¯ Aji 1 ¯¯ aj1 . . . 1 . . . ajn ¯¯ = , xij = ¯ det A ¯ ¯ det A . . . . . . . . . . . . . . . . . . . . . . ¯ ¯ ¯an1 . . . 0 . . . ann ¯ що i треба було довести.
96
Тема 6. Застосування визначникiв
Зауваження 6.4.1. Для невиродженої матрицi другого порядку ¡ ¢ A = ac db отримаємо −1
A
1 = ad − bc
µ
¶ d −b . −c a
Є сенс у запам’ятовуваннi цiєї простої формули. Приклад. Знайдемо обернену матрицю до матрицi 2 −1 0 3 −6 . A= 5 −1 −2 3 Оскiльки визначник det A = 3 вiдмiнний вiд нуля, то обернена матриця A−1 iснує. Обчислимо алгебричнi доповнення всiх елементiв матрицi A ¯ ¯ ¯ ¯ ¯3 ¯ 5 −6¯¯ −6¯¯ ¯ A11 = ¯¯ = −3, A = − = −9, 12 ¯−1 −2 3 ¯ 3 ¯ ¯ ¯ ¯ ¯ ¯−1 0¯ ¯ 2 0¯¯ ¯ = 3, A21 = − ¯¯ A22 = ¯¯ = 6, ¯ −2 3 −1 3¯ ¯ ¯ ¯ ¯ ¯−1 ¯2 0 ¯¯ 0 ¯¯ ¯ A31 = ¯¯ = 6, A = − 32 ¯5 −6¯ = 12, 3 −6¯ ¯ ¯ ¯ ¯ ¯ 2 ¯5 −1¯¯ 3 ¯¯ ¯ ¯ = 5, = −7, A23 = − ¯ A13 = ¯ −1 −2¯ −1 −2¯ ¯ ¯ ¯2 −1¯ ¯ = 11. A33 = ¯¯ 5 3 ¯ Звiдси отримуємо, що A
−1
−3 1 −9 = 3 −7
3 6 5
6 −1 12 = −3 11 − 73
1 2
2 4 .
5 3
11 3
Зауваження 6.4.2. Зрозумiло, що всi елементарнi матрицi (див. § 2.3) є зворотними, причому цi зворотнi матрицi також елементарнi i вiдповiдають зворотним елементарним перетворенням ¡ ¢−1 (E + c · Eij )−1 = E − c · Eij , Pij−1 = Pij , Qi (c) = Qi (c−1 ).
6.5. Матричнi рiвняння
97
6.5. Розв’язання системи лiнiйних рiвнянь за допомогою обернених матриць Ще одним iз методiв розв’язання систем лiнiйних рiвнянь є метод, що грунтується на використаннi обернених матриць. Розглянемо систему n лiнiйних рiвнянь з n невiдомими a11 x1 + a12 x2 + · · · + a1n xn = b1 , a x + a x + · · · + a x = b , 21 1 22 2 2n n 2 ................................. a x + a x + · · · + a x = b . n1 1 n2 2 nn n n
(6.4)
Як було показано у §2.7, цю систему можна переписати у матричному виглядi A · X = B, (6.5) де через A позначено матрицю коефiцiєнтiв системи рiвнянь, через X — стовпчик невiдомих, через B — стовпчик вiльних членiв
a11 a12 a21 a22 A= . . . . . . an1 an2
... ... ... ...
a1n a2n , ... ann
x1 x2 X = . , ..
b1 b2 B = . . ..
xn
bn
Якщо матриця A невироджена, то для неї iснує обернена матриця A−1 . Тодi домноживши рiвнiсть (6.5) злiва на матрицю A−1 , отримаємо A−1 AX = A−1 B. Звiдси, оскiльки A−1 A = E, отримаємо розв’язок X = A−1 B.
98
Тема 6. Застосування визначникiв
Отож, щоб розв’язати систему лiнiйних рiвнянь (6.4) потрiбно знайти обернену матрицю (якщо вона iснує!) до матрицi коефiцiєнтiв цiєї системи i домножити її (злiва!) на стовпчик вiльних членiв. Приклад. Розв’яжемо за допомогою оберненої матрицi систему лiнiйних рiвнянь = 0, 2x1 − x2 5x1 + 3x2 − 6x3 = −7, −x1 − 2x2 + 3x3 = 4. Перепишемо дану систему у матричному виглядi AX = B, де
2 A= 5 −1
−1 3 −2
0 −6 , 3
x1 X = x2 , x3
0 B = −7 . 4
Оскiльки визначник det A = 3 вiдмiнний вiд нуля, то обернена матриця A−1 iснує i дорiвнює −1 1 2 −3 3 6 1 A−1 = −9 6 12 = −3 2 4 . 3 − 73 53 11 −7 5 11 3 Тодi
x1 −1 −1 x2 = X = A B = −3 x3 − 73
1 2 5 3
0 1 2 4 −7 = 2 , 11 4 3 3
тобто розв’язок x1 = 1, x2 = 2, x3 = 3.
Зауваження 6.5.1. Даний метод розв’язання систем лiнiйних рiвнянь (як i метод за допомогою формул Крамера) має суттєвi обмеження в застосуваннi. Наприклад, його не можна використати, коли матриця коефiцiєнтiв A вироджена або коли вона не є квадратною (кiлькiсть рiвнянь не дорiвнює кiлькостi невiдомих).
6.6. Визначник добутку матриць
99
Зауваження 6.5.2. Рiвняння вигляду (6.5) називають матричними рiвняннями. Будь-якi матричнi рiвняння розв’язують аналогiчно, як було показано вище. Наприклад, матричне рiвняння вигляду A·X ·B =C розв’язують домноженням злiва на матрицю A−1 , а справа — на матрицю B −1 . В результатi отримаємо, що X = A−1 · C · B −1 . Проте даний спосiб розв’язання матричних рiвнянь має тi ж обмеження у застосуваннi, якi були наведенi попередньому зауваженнi. У такому випадку для знаходження розв’язкiв у явному виглядi потрiбно перейти до елементного рiвня, тобто позначити елементи матрицi X через невiдомi x1 , x2 , . . . , перемножити матрицi, утворити систему лiнiйних рiвнянь (прирiвнявши вiдповiднi коефiцiєнти) i розв’язати її методом Гаусса.
6.6. Визначник добутку матриць Твердження 6.6.1. Будь-яку невироджену матрицю можна подати як добуток елементарних матриць. Доведення. За твердженням 6.2.1 для довiльної невиродженої матрицi A знайдуться такi елементарнi матрицi I1 , I2 , . . . , Ik , що Ik Ik−1 . . . I2 I1 A = E. Оскiльки всi елементарнi матрицi є зворотними, то, домноживши злiва останню рiвнiсть на вiдповiднi оберненi матрицi (якi також є елементарними), отримаємо −1 −1 A = I1−1 I2−1 . . . Ik−1 Ik .
100
Тема 6. Застосування визначникiв
Твердження 6.6.2. Якщо I — елементарна матриця, то для довiльної матрицi A вiдповiдного розмiру виконується det(I · A) = det I · det A. Доведення. Якщо I = E +c·Eij — елементарна матриця першого типу, то det I = 1 i за лемою 5.4.8 маємо det(I · A) = det A. Якщо I = Pij — елементарна матриця другого типу, то det I = −1 i за лемою 5.4.3 маємо det(I · A) = − det A. Якщо ж I = Qi (c) — елементарна матриця третього типу, то det I = c i за лемою 5.4.2 маємо det(I · A) = c · det A. Теорема 6.6.3. Якщо A та B — довiльнi квадратнi матрицi однакового порядку, то det(A · B) = det A · det B. Доведення. Нехай det A 6= 0. Тодi за твердженням 6.6.1 маємо, що A = I1 I2 . . . Ik , а за твердженням 6.6.2 det(AB) = det(I1 I2 . . . Ik B) = = det I1 · det(I2 . . . Ik B) = det I1 · det I2 · det(I3 . . . Ik B) = = det I1 · det I2 · . . . · det Ik · det B. (6.6) З iншого боку, застосовуючи декiлька разiв твердження 6.6.2, маємо det A = det(I1 I2 . . . Ik ) = det I1 · det I2 · . . . · det Ik .
6.7. Задачi
101
Пiдставивши останню рiвнiсть в (6.6), отримаємо твердження теореми для цього випадку. Нехай тепер det A = 0. Домноженням на елементарнi матрицi першого i другого типу I1 , I2 , . . . , Is матрицю A можна звести до схiдчастого вигляду A0 , при цьому det A може змiнити тiльки знак. Тодi det(AB) = ± det(Is . . . I2 I1 AB) = = ± det((Is . . . I2 I1 A)B) = ± det(A0 B). Оскiльки det A = 0, то матриця A0 має нульовий рядок. Звiдси випливає, що матриця A0 B має нульовий рядок, тому det(A0 B) = 0 i, також, det(AB) = 0. Отже, det(AB) = det A · det B. Наслiдок 6.6.4. Виродженi матрицi необоротнi. Доведення. Якщо det A = 0, то не iснує жодної матрицi B такої, що AB = E. Справдi, det(AB) = det A · det B = 0 6= 1 = det E. З теореми 6.4.1 та наслiдку 6.6.4 випливає теорема. Теорема 6.6.5. Матриця має обернену тодi i тiльки тодi, коли вона невироджена.
6.7. Задачi Для аудиторного розв’язання [13]: №№ 608, 612, 554, 836, 840, 846, 861, 863, 867, 935. [14]: №№ 18.8 (ж), 18.9 (а).
102
Тема 6. Застосування визначникiв
Для самостiйного розв’язання [13]: №№ 610, 613, 555, 837, 841, 847, 862, 864, 868, 934. [14]: №№ 18.8 (к), 18.9 (б). Задачi контрольної роботи i колоквiуму [13]: №№ 608 − 613, 554 − 563, 836 − 853, 857, 861 − 871, 872, 875, 876, 884, 934 − 937. [14]: №№ 7.1, 8.6, 18.3, 18.5, 18.8, 18.9, 18.11, 18.20.
Тема 7.
Алгебричнi структури. Поля 7.1. Вiдображення Нехай X та Y — довiльнi множини. Означення 7.1.1. Вiдображенням f множини X у множину Y (позначають f : X → Y ) називається правило, за яким кожному елементу x множини X ставиться у вiдповiднiсть єдиний елемент y множини Y . При цьому елемент y називають образом елемента x i позначають y = f (x), а елемент x — прообразом елемента y. Означення 7.1.2. Вiдображення f : X → Y називається 1) iн’єктивним, якщо для довiльних елементiв x1 , x2 ∈ X з рiвностi f (x1 ) = f (x2 ) випливає рiвнiсть x1 = x2 ; 2) сюр’єктивним, якщо для кожного елемента y ∈ Y iснує такий елемент x ∈ X, що y = f (x), тобто для кожного елемента y ∈ Y iснує прообраз; 3) бiєктивним, якщо воно iн’єктивне i сюр’єктивне. Приклади. 1. Правило f (x) = x1 не є вiдображенням на множинi всiх дiйсних чисел R, оскiльки для нуля не iснує образа. Проте це ж правило є вiдображенням з множини R\{0} у множину R\{0} (бiльше того, воно бiєктивне). 2. Вiдображення f : N → N, для якого f (n) = n3 + 1, є iн’єктивним, але не є сюр’єктивним.
103
104
Тема 7. Алгебричнi структури. Поля
3. Позначимо множину всiх невiд’ємних дiйсних чисел через R+ = {x ∈ R | x ≥ 0}. Вiдображення f : R → R+ , задане правилом f (x) = x2 , є сюр’єктивним, але не є iн’єктивним.
Означення 7.1.3. Вiдображення iX : X → X називається одиничним вiдображенням множини X в себе, якщо iX (x) = x для кожного елемента x ∈ X. Означення 7.1.4. Вiдображення f −1 : Y → X називається оберненим вiдображенням до вiдображення f : X → Y , якщо f −1 f = iX
i
f f −1 = iY .
Приклади. 1. Вiдображення f та f −1 : R → R, якi заданi вiдповiдно прави√ лами f (x) = x3 та f −1 (x) = 3 x, є взаємно оберненими. 2. Вiдображення f : R → R, f (x) = x2 , не має оберненого, оскiльки правило √ f −1 (x) = x не має змiсту для вiд’ємних дiйсних чисел.
7.2. Алгебричнi операцiї Нехай X — довiльна множина. Означення 7.2.1. Алгебричною операцiєю ◦ називають правило, за яким довiльним двом елементам a, b множини X ставиться у вiдповiднiсть єдиний елемент c цiєї ж множини (записуватимемо a ◦ b = c). Iнакше кажучи, алгебричною (бiнарною) операцiєю ◦ на множинi X називається довiльне вiдображення декартового добутку множини X у себе X × X → X.
7.2. Алгебричнi операцiї
105
Приклади. 1. Додавання та множення є алгебричною операцiєю на множинах натуральних чисел N, цiлих чисел Z, рацiональних чисел Q, дiйсних чисел R. 2. Множення є алгебричною операцiєю на множинi невiд’ємних дiйсних чисел, але не є алгебричною операцiєю на множинi вiд’ємних дiйсних чисел (оскiльки добуток двох вiд’ємних чисел не є вiд’ємним числом).
Якщо на множинi X задано алгебричну операцiю ◦, то записуватимемо (X, ◦). Так, наприклад, запис (Z, +) означатиме, що розглядається множина Z, на якiй визначено алгебричну операцiю додавання. Якщо на множинi X визначено декiлька алгебричних операцiй ◦1 , . . . , ◦n , то у цьому випадку будемо писати (X, ◦1 , . . . , ◦n ). Означення 7.2.2. Алгебрична операцiя ◦ на множинi X називається асоцiативною, якщо для всiх елементiв a, b, c ∈ X виконується рiвнiсть (a ◦ b) ◦ c = a ◦ (b ◦ c). Означення 7.2.3. Алгебрична операцiя ◦ на множинi X називається комутативною, якщо a◦b=b◦a для довiльних елементiв a, b ∈ X. Приклади. 1. Додавання i множення на множинах N, Z, Q, R є асоцiативними i комутативними алгебраїчними операцiями. 2. Вiднiмання є неасоцiативною i некомутативною алгебричною операцiєю на кожнiй з множин Z, Q i R (наприклад, (1 − 2) − 3 6= 1 − (2 − 3)). 3. Добуток матриць є асоцiативною, але некомутативною алгебричною операцiєю.
Означення 7.2.4. Елемент e ∈ X називається нейтральним елементом стосовно алгебричної операцiї ◦ на множинi X, якщо e◦a=a◦e=a для всiх елементiв a ∈ X.
106
Тема 7. Алгебричнi структури. Поля
Приклади. 1. Для алгебричної операцiї додавання на множинах N, Z, Q i R нейтральним елементом є число 0, а число 1 є нейтральним елементом вiдносно звичайного множення на цих множинах. 2. Нульова матриця є нейтральним елементом стосовно операцiї додавання матриць, а одинична матриця — нейтральним елементом стосовно операцiї множення матриць.
Зауваження 7.2.1. Якщо нейтральний елемент для алгебричної операцiї ◦ iснує, то вiн єдиний. Справдi, якщо e1 та e2 — два нейтральнi елементи, то за означенням нейтрального елемента маємо e1 = e1 ◦ e2 = e2 . Означення 7.2.5. Елемент a−1 ∈ X називається оберненим до елемента a ∈ X стосовно алгебричної операцiї ◦, якщо a−1 ◦ a = a ◦ a−1 = e, де e — нейтральний елемент. Елемент a, для якого iснує обернений, називається зворотним або оборотним. Приклади. 1. На множинi (Z, +) довiльний елемент a ∈ Z має обернений −a ∈ Z (у даному випадку це протилежний елемент). 2. На множинi (R, ·) всi ненульовi елементи a мають оберненi a1 , а для нуля оберненого елемента не iснує. 3. На множинi матриць (Mn (R), ·) оберненi iснують лише для невироджених матриць.
Зауваження 7.2.2. Якщо для елемента a ∈ X iснує обернений, то вiн єдиний. Справдi, припустимо, що для елемента a iснують −1 два оберненi елементи a−1 1 i a2 . Тодi, використовуючи асоцiативнiсть, маємо −1 −1 −1 −1 −1 −1 −1 a−1 1 = a1 ◦ e = a1 ◦ (a ◦ a2 ) = (a1 ◦ a) ◦ a2 = e ◦ a2 = a2 .
7.3. Напiвгрупи. Моноїди. Групи
107
7.3. Напiвгрупи. Моноїди. Групи Означення 7.3.1. Множина, на якiй визначено асоцiативну бiнарну операцiю, називається напiвгрупою. Означення 7.3.2. Напiвгрупа, у якiй iснує нейтральний елемент, називається моноїдом. Приклади. 1. Множини (Z, +), (R, · ), (R+ , +) (Q, · ) — моноїди. 2. Множина 2Z парних цiлих чисел є моноїдом стосовно алгебричної операцiї додавання i є лише напiвгрупою стосовно алгебричної операцiї множення.
Означення 7.3.3. Моноїд, в якому для кожного елемента iснує обернений, називається групою. Розглянемо означення групи бiльш детальнiше. Нехай G — довiльна множина, на якiй визначено алгебричну операцiю ◦. Означення 7.3.4. Множина G, на якiй визначено алгебричну операцiю ◦, називається групою, якщо виконуються такi властивостi: 1) (a ◦ b) ◦ c = a ◦ (b ◦ c) для всiх a, b, c ∈ G (асоцiативнiсть); 2) iснує такий елемент e ∈ G, що для довiльного a ∈ G виконується a ◦ e = e ◦ a = a (iснування нейтрального елемента); 3) для довiльного елемента a ∈ G iснує такий елемент a−1 ∈ G, що a ◦ a−1 = a−1 ◦ a = e (iснування оберненого елемента). Приклади. 1. Множина цiлих чисел Z є групою стосовно операцiї додавання i не є групою стосовно операцiї множення (оскiльки не для всiх цiлих чисел iснують оберненi стосовно множення). 2. Множина всiх додатнiх дiйсних чисел стосовно операцiї ∗, визначеної правилом a ∗ b = ab , не є групою, оскiльки ця операцiя не асоцiативна.
Нехай (G, ◦) — група з алгебричною операцiєю ◦. Означення 7.3.5. Група (G, ◦) називається абелевою (комутативною), якщо операцiя ◦ комутативна, тобто a ◦ b = b ◦ a для всiх a, b ∈ G.
108
Тема 7. Алгебричнi структури. Поля
Зауваження 7.3.1. Якщо в групi G визначена операцiя додавання, то групу (G, +) називають адитивною. У цьому випадку нейтральний елемент називають нулем (позначають 0), а обернений елемент до елемента a ∈ G — протилежним (позначають −a). Якщо в групi G визначена операцiя множення, то група (G, · ) називається мультиплiкативною, а нейтральний елемент, у цьому випадку, називають одиницею (позначають 1). Приклади. 1. Числовi множини (Z, +), (2Z, +), (Q, +), (R, +) є адитивнми абелевими групами. 2. Множини ({−1, 1}, · ), (R∗ , · ), (Q∗ , · ), де R∗ = R \ {0}, Q∗ = Q \ {0}, є мультиплiкативними абелевими групами. 3. Множина всiх невироджених матриць порядку n з елементами з множини дiйсних чисел утворює абелеву групу вiдносно операцiї додавання матриць i утворює некомутативну групу вiдносно операцiї множення матриць.
Твердження 7.3.1 (наслiдки з аксiом груп). В групi (G, ◦) справедливi такi твердження: 1) нейтральний елемент єдиний; 2) для кожного елемента iснує єдиний обернений; 3) з кожної з рiвностей a ◦ b = a ◦ c i b ◦ a = c ◦ a випливає рiвнiсть b = c (закон скорочення); 4) кожне з рiвнянь a ◦ x = b i x ◦ a = b має єдиний розв’язок. Доведення. Першi двi властивостi уже були доведенi (зауваження 7.2.1 та 7.2.2). 3) Домноживши спочатку лiву, а потiм праву частину рiвностi a ◦ b = a ◦ c злiва на a−1 , одержуємо a−1 ◦ (a ◦ b) = (a−1 ◦ a) ◦ b = e ◦ b = b a−1 ◦ (a ◦ c) = (a−1 ◦ a) ◦ c = e ◦ c = c. Звiдси випливає, що b = c. Аналогiчно за допомогою домноження справа на a−1 доводиться правий закон скорочення.
7.4. Кiльця
109
4) Розв’язком рiвняння a ◦ x = b є елемент x = a−1 ◦ b, причому за законом скорочення цей розв’язок єдиний. Розглянемо довiльну непорожню пiдмножину H групи (G, ◦). Означення 7.3.6. Непорожня пiдмножина H ⊂ G називається пiдгрупою групи G стосовно введеної в групi G операцiї circ, якщо 1) для довiльних елементiв a, b ∈ H виконується a ◦ b ∈ H; 2) для кожного a ∈ H обернений елемент a−1 ∈ H. Довiльна група G мiстить двi тривiальнi пiдгрупи: пiдгрупу {e}, що складається лише з нейтрального елемента групи G (цю пiдгрупу часто ще називають одиничною), i всю групу G. Всi iншi пiдгрупи (якщо вони iснують) називають нетривiальними. Приклад. У наведених нижче включеннях кожна група є пiдгрупою кожної наступної групи: ({0}, +) ⊂ (2Z, +) ⊂ (Z, +) ⊂ (Q, +) ⊂ (R, +), (Q+ , · ) ⊂ (R+ , · ), ({1}, · ) ⊂ ({1, −1}, · ) ⊂ (Q∗ , · ) ⊂ (R∗ , · ).
7.4. Кiльця На вiдмiну вiд груп, кiльця — це алгебричнi структури iз двома операцiями. Без зменшення загальностi, будемо вважати, що цими операцiями є операцiї додавання та множення. Означення 7.4.1. Кiльцем (R, +, ·) називається множина R, на якiй визначено операцiї додавання та множення, що задовольняють таким властивостям: 1) (R, +) — абелева група (яку називають адитивною групою кiльця R); 2) (a + b)c = ac + bc i a(b + c) = ab + ac для будь-яких a, b, c ∈ R (операцiя множення дистрибутивна стосовно додавання);
110
Тема 7. Алгебричнi структури. Поля
3) a(bc) = (ab)c для всiх a, b, c ∈ R (операцiя множення асоцiативна). Означення 7.4.2. Якщо в кiльцi R стосовно множення iснує нейтральний елемент (одиниця), тобто такий елемент 1 ∈ R, що 1·a=a·1=a для кожного a ∈ R, то кiльце R називають кiльцем з одиницею. Твердження 7.4.1. Якщо в кiльцi R iснує одиниця 1, то вона єдина. Доведення аналогiчне, як у випадку мультиплiкативної абелевої групи (твердження 7.3.1). Означення 7.4.3. Кiльце (R, +, ·) називається комутативним, якщо операцiя множення комутативна, тобто ab = ba для довiльних a, b ∈ R. Зауваження 7.4.1. Нехай (R, +, ·) — кiльце з одиницею 1. Якщо 1 = 0, то для будь-якого a ∈ R маємо a = a · 1 = a · 0 = 0, тобто кiльце R складається тiльки з нуля. Таким чином, якщо кiльце мiстить бiльше одного елемента, то 1 6= 0. Приклади. 1) Числовi множини Z, Q, R є комутативними кiльцями з одиницею стосовно звичайних операцiй додавання та множення. 2) Множина парних цiлих чисел (2Z, +, ·) є комутативним кiльцем без одиницi. 3) Множина дiйсних функцiй вiд дiйсної змiнної, визначених на промiжку (a, b), є комутативним кiльцем з одиницею стосовно звичайних операцiй додавання та множення функцiй.
7.4. Кiльця
111
4) Нехай A — непорожня множина, M = 2A — множина всiх пiдмножин множини A. Визначимо на множинi 2A операцiї X ⊕ Y = (X ∪ Y )\(X ∩ Y )
i
X ¯ Y = X ∩ Y.
Очевидно, що стосовно цих операцiй ⊕ i ¯ множина 2A є кiльцем.
Твердження 7.4.2 (наслiдки аксiом кiльця). Нехай R — кiльце, 0 ∈ R — нейтральний (нульовий) елемент стосовно додавання, a, b, c — довiльнi елементи кiльця R. Тодi 1) a · 0 = 0 · a = 0; 2) a(−b) = (−a)b = −ab; 3) (−a)(−b) = ab; 4) a(b − c) = ab − ac i (a − b)c = ac − bc. Доведення. 1) Нехай a · 0 = b. Тодi b + b = a · 0 + a · 0 = a(0 + 0) = a · 0 = b, звiдки b = b − b = 0. Аналогiчно доводиться, що 0 · a = 0. 2) Оскiльки ab + a(−b) = a(b + (−b)) = a · 0 = 0 за доведеним, то a(−b) = −ab. Так само доводиться, що i (−a)b = −ab. 3) З одного боку, (−a)(−b) + (−ab) = (−a)(−b) + (−a)b = = (−a)(−b + b) = −a · 0 = 0, а з iншого ab + (−ab) = 0. Звiдси за законом скорочення отримуємо, що (−a)(−b) = ab. 4) Маємо a(b − c) + ac = a(b − c + c) = ab i, аналогiчно, (a − b)c + bc = ac.
112
Тема 7. Алгебричнi структури. Поля Нехай K — довiльна непорожня пiмножина кiльця (R, +, ·).
Означення 7.4.4. Непорожня пiдмножина K ⊂ R називається пiдкiльцем кiльця (R, +, ·), якщо 1) (K, +) є пiдгрупою адитивної групи кiльця (R, +); 2) для довiльних a, b ∈ K добуток a · b ∈ K. Приклади. 1) У ланцюжку 6Z ⊂ 2Z ⊂ Z ⊂ Q ⊂ R кожне попереднє кiльце є пiдкiльцем кожного наступного стосовно звичайних операцiй додавання i множення. 2) Кiльце неперервних дiйсних функцiй, визначених на промiжку (a, b), є пiдкiльцем кiльця всiх дiйсних функцiй, визначених на цьому промiжку.
7.5. Поля Означення 7.5.1. Кiльце R з одиницею 1, в якому довiльний ненульовий елемент a ∈ R стосовно множення володiє оберненим елементом a−1 ∈ R, називається тiлом. Означення 7.5.2. Комутативне тiло називається полем. Iнакше кажучи, полем називається комутативне кiльце з одиницею, в якому для кожного ненульового елемента iснує обернений елемент стосовно множення. Для кращого розумiння наведемо ще бiльш розширене означення поля. Означення 7.5.3. Полем називається множина P , якщо на нiй визначено алгебричнi операцiї додавання та множення i для довiльних елементiв a, b, c ∈ P виконуються такi властивостi: 1) (a + b) + c = a + (b + c); 2) iснує нейтральний (нульовий) елемент 0 ∈ P стосовно додавання; 3) для довiльного елемента a ∈ P iснує обернений (протилежний) елемент −a ∈ P стосовно додавання;
7.5. Поля
113
4) a + b = b + a; 5) (a + b)c = ac + bc i a(b + c) = ab + ac; 6) a(bc) = (ab)c; 7) iснує нейтральний (одиничний) елемент 1 ∈ P стосовно множення; 8) для довiльного ненульового елемента a ∈ P iснує обернений елемент a−1 ∈ P стосовно множення; 9) ab = ba. Приклади. 1) Множина рацiональних чисел Q i множина дiйсних чисел R є полями стосовно звичайних операцiй додавання i множення. 2) Кiльце (Z, +, ·) не є полем, оскiльки у ньому оберненi елементи iснують тiльки для ±1. 3) Нехай P — поле i a та b — рiзнi елементи цього поля. Визначимо у полi P новi операцiї додавання ⊕ та множення ¯ так: x ⊕ y = x + y − a,
x¯y =a+
(x − a)(y − a) . (b − a)
(У геометричних термiнах: ми змiнюємо початок координат та масштаб.) Легко бачити, що елементи множини P утворюють також поле i стосовно цих нових операцiї (позначимо його P 0 ). Зауважимо також, що a та b будуть вiдповiдно нулем та одиницею поля P 0 .
Зауваження 7.5.1. Кiльце, яке складається iз одного нуля, не є полем. Нехай L — довiльна непорожня пыдмножина поля (P, +, ·). Означення 7.5.4. Непорожня пiдмножина L ⊂ P називається пiдполем поля P тодi i лише тодi, коли 1) (L, +, ·) є пiдкiльцем кiльця (P, +, ·); 2) для довiльного ненульового елемента a ∈ L обернений елемент a−1 ∈ L. Приклад. Поле Q є пiдполем поля R.
114
Тема 7. Алгебричнi структури. Поля
7.6. Задачi Для аудиторного розв’язання [13]: №№ . [14]: №№ . Для самостiйного розв’язання [13]: №№ . [14]: №№ . Задачi контрольної роботи i колоквiуму [13]: №№ . [14]: №№ .
Тема 8.
Комплекснi числа Протягом вивчення курсу алгебри декiлька разiв вiдбувається розширення запасу чисел. Ще в арифметицi вiдбувається знайомство з додатнiми цiлими i дробовими числами. Алгебра ж, посутi, розпочинається iз введення вiд’ємних чисел, тобто з оформленя першої iз найважливiших числових систем — системи цiлих чисел, яка складається iз всiх додатнiх i всiх вiд’ємних чисел i нуля, та бiльш широкої системи рацiональних чисел, яка складається iз всiх цiлих чисел i всiх дробових чисел, як додатнiх, так i вiд’ємних. Подальше розширення запасу чисел вiдбувається тодi, коли до розгляду вводяться iррацiональнi числа. Система, яка складається iз усiх рацiональних i усiх iррацiональних чисел, називається системою дiйсних чисел.1 Насамкiнець, систему дiйсних чисел ми спробуємо розширити до системи комплексних чисел. Комплекснi числа вводяться у зв’язку iз такою задачею. Вiдомо, що дiйсних чисел недостаньо для того, щоб розв’язати довiльне квадратне рiвняння з дiйсними коефiцiєнтами. Найпростiшим iз квадратних рiвнянь, яке не має кореня серед дiйсних 1
Строга побудова системи дiйсних чисел мiститься, зазвичай, в унiверситетському курсi математичного аналiзу; для нас буде достатньо того обсягу знань про дiйснi числа, яким володiє читач, що розпочинає вивчення лiнiйної алгебри
115
116
Тема 8. Комплекснi числа
чисел, є x2 + 1 = 0.
(8.1)
Отож, наша задача полягатиме у розширеннi системи дiйсних чисел до такої системи чисел, у якiй рiвняння (8.1) уже б володiло коренем. В якостi матерiалу, iз якого буде будуватися ця нова система чисел, ми вiзьмемо всi точки площини.2 Таким чином, ми спробуємо побудувати систему чисел, яка зображається всiма точками площини.
8.1. Поле комплексних чисел Отож, роглянемо площину, на якiй виберемо прямокутну систему координат. Точки z площини з абсцисою a i ординатою b записуватимемо у виглядi z = (a, b). Тепер введемо на цiй множинi всiх точок площини двi алгебричнi операцiї. Якщо задано точки z1 = (a, b) i z2 = (c, d), то сумою цих точок називатимемо точку з абсцисою a + c i ординатою b + d, тобто (a, b) + (c, d) = (a + c, b + d); (8.2) добутком точок z1 = (a, b) i z2 = (c, d) називатимемо точку з абсцисою ac − bd i ординатою ad + bc, тобто (a, b) · (c, d) = (ac − bd, ad + bc).
(8.3)
2 Нагадаємо, що зображення дiйсних чисел точками прямої лiнiї (що грунтується на тому, що ми отримуємо взаємно однозначну вiдповiднiсть мiж множиною всiх точок прямої i множиною всiх дiйсних чисел, якщо при заданому початку координат i одиницi масштабу довiльнiй точцi поставимо у вiдповiднiсть її абсцису) систематично використовується у всiх роздiлах математики i є настiльки звичним, що часто не робиться рiзницi мiж дiйсним числом i точкою, що її зображає
8.1. Поле комплексних чисел
117
Таким чином, ми побудували множину чисел, що зображаються точками площини, причому операцiї над цими числами визначаються формулами (8.2) та (8.3). Ця множина чисел називається множиною комплексних чисел i позначається C. Виявляється, що множина C стосовно так введених операцiй додавання та множення утворює поле, тобто справедливе таке твердження. Твердження 8.1.1. Множина комплексних чисел C є полем стосовно операцiй додавання та множення, заданих правилами (8.2) та (8.3). Доведення. Оскiльки, як бачимо, компекснi числа додаються як матрицi, покомпонентно, то з властивостей додавання матриць випливає, що множина C є абелевою групою стосовно додавання. Перевiримо, що множення зв’язане з додаванням законом дистрибутивностi. Нехай z1 = (a, b), z2 = (c, d), z3 = (e, f ) — три комплекснi числа. ¡ ¢ (z1 + z2 )z3 = (a, b) + (c, d) (e, f ) = (a + c, b + d)(e, f ) = ¡ ¢ = (a + c)e − (b + d)f, (a + c)f + (b + d)e = = (ae + ce − bf − df, af + cf + be + de) = = (ae − bf, af + be) + (ce − df, cf + de) = = (a, b)(e, f ) + (c, d)(e, f ) = z1 z3 + z2 z3 . Тепер покажемо, що множення комплексних чисел асоцiативне. ¡ ¢ (z1 z2 )z3 = (a, b)(c, d) (e, f ) = (ac − bd, ad + bc)(e, f ) = = (ace − bde − adf − bcf, acf − bdf + ade + bce), ¡ ¢ z1 (z2 z3 ) = (a, b) (c, d)(e, f ) = (a, b)(ce − df, cf + de) = = (ace − bde − adf − bcf, acf − bdf + ade + bce).
118
Тема 8. Комплекснi числа
З рiвностi правих частин випливає рiвнiсть її лiвих частин, а тому (z1 z2 )z3 = z1 (z2 z3 ). З означення множення комплексних чисел легко бачити, що множення комутативне z1 z2 = z2 z1 , i що для множення iснує нейтральний елемент — комплексне число (1, 0) (a, b)(1, 0) = (1, 0)(a, b) = (a · 1 − b · 0, a · 0 + b · 1) = (a, b). Залишилося перевiрити, що кожний ненульовий елемент z ∈ C має обернений стосовно множення. Нехай z = (a, b) — ненульовий елемент множини C. Оскiльки z 6= 0, то a та b не дорiвнюють нулю¡ одночасно, ¢тобто a2 + b2 6= 0. Розглянемо комплексне число a −b z 0 = a2 +b 2 , a2 +b2 . Отримуємо ³ zz 0 = (a, b)
a −b ´ , = a2 + b2 a2 + b2 ³ a2 b2 −ab ab ´ = + , + = (1, 0), a2 + b2 a2 + b2 a2 + b2 a2 + b2
звiдки бачимо, що елемент z 0 є оберненим до елемента z (z 0 = z −1 ). Отже, множина C є полем. Покажемо, що система комплексних чисел є розширенням системи дiйсних чисел. З цiєю метою розглянемо точки, що лежать на осi абсцис, тобто точки вигляду (a, 0). Легко бачити, що якщо точцi (a, 0) поставити у вiдповiднiсть дiйсне число a, то
8.2. Алгебрична форма комплексних чисел
119
ми отримаємо взаємно однозначну вiдповiднiсть мiж розглядуваною множиною i множиною всiх дiйсних чисел. Застосування до цих точок формул (8.2) i (8.3) дає рiвностi (a, 0) + (b, 0) = (a + b, 0), (a, 0) · (b, 0) = (ab, 0), тобто точки вигляду (a, 0) додаються i перемножаються одне з одним так само, як вiдповiднi дiйснi числа. Отож, множина точок осi абсцис, що розглядається як частина системи комплексних чисел, за своїми алгебраїчними властивостями нiчим не вiдрiзняється вiд системи дiйсних чисел, яка звичайним чином зображається точками прямої лiнiї. Це дозволяє нам не розрiзняти в майбутньому точку (a, 0) i дiйсне число a, тобто завжди вважати, що (a, 0) = a. Зокрема, нуль (0, 0) i одиниця (1, 0) множини комплексних чисел виявляються звичайними дiйсними числами 0 i 1. Тепер покажемо, що серед комплексних чисел iснує корiнь рiвняння (8.1), тобто таке число, квадрат якого дорiвнює дiйсному числу −1. Очевидно, що це буде точка (0, 1), тобто точка, що лежить на осi ординат на вiдстанi 1 вверх вiд початку координат. Дiйсно, застосувавши до точки (0, 1) формулу (8.3), отримаємо (0, 1)(0, 1) = (−1, 0) = −1. Домовимося позначати цю точку буквою i: i2 = −1.
8.2. Алгебрична форма комплексних чисел Покажемо, що так побудованi нами комплекснi числа можуть бути записанi у їх звичайнiй, так званiй, алгебричнiй формi. Для цього спочатку знайдемо добуток дiйсного числа b на точку i: bi = (b, 0) · (0, 1) = (0, b);
120
Тема 8. Комплекснi числа
це, очевидно, буде точка, що лежить на осi ординат i має ординатою дiйсне число b, причому всi точки осi ординат зображаються у виглядi таких добуткiв. Якщо тепер (a, b) — довiльна точка, то з рiвностi (a, b) = (a, 0) + (0, b) = (a, 0) + (b, 0)(0, 1) отримаємо (a, b) = a + bi, тобто ми приходимо до звичайного запису комплексних чисел. Означення 8.2.1. Запис комплексного числа z = (a, b) у виглядi z = a + bi називають звичайною (або алгебраїчною) формою комплексного числа. У вiдповiдностi з iсторично складеними традицiями комплексне число i називатимемо уявною одиницею. Тому у записi комплексного числа z у виглядi z = a + bi число b називають уявною частиною3 комплексного числа z i позначають Im z, а число a — його дiйсною частиною i позначають Re z. Пiдкреслимо, що уявна частина (аналогiчно, як i дiйсна частина) комплексного числа є число дiйсне. Два комплекснi числа рiвнi мiж собою, якщо у них рiвнi дiйснi i уявнi частинии, тобто a + bi = c + di тодi i лише тодi, коли a = c i b = d. Додавання, вiднiмання, множення i дiлення комплексних чисел, записаних у виглядi z = a + bi, виконують за правилами (a + bi) + (c + di) = (a + c) + (b + d)i, 3 Застосування у назвi слова "уявнi" не повинна викликати сумнiви у їх iснуваннi. Ми легко можемо вказати тi точки площини — точки осi ординат, — якими цi числа зображаються.
8.3. Спряженi комплекснi числа
121
(a + bi) − (c + di) = (a − c) + (b − d)i, (a + bi) · (c + di) = (ac − bd) + (ad + bc)i, ac + bd bc − ad a + bi = 2 + 2 i. c + di c + d2 c + d2 Ми можемо сказати, що при додаваннi комплексних чисел додаються окремо їх дiйснi частини i окремо їх уявнi частини; аналогiчне правило має мiсце i для вiднiмання. Приклади. 1. (2 + 5i) + (1 − 7i) = (2 + 1) + (5 − 7)i = 3 − 2i. 2. (3 − 9i) − (7 + i) ¡= (3 − 7) + (−9¢ − 1)i ¡ = −4 − 10i.¢ 3. (1 + 2i)(3 − i) = 1 · 3 − 2 · (−1) + 1 · (−1) + 2 · 3 i = 5 + 5i. 3. 23+i = (23+i)(3−i) = 70−20i = 7 − 2i. 3+i (3+i)(3−i) 10 4.
3 2 2 (3+5i)3 +125i3 = 3 +3·3 ·5i+3·3·25i = 27+135i−225−125i 1−2i 1−2i 1−2i (−198+10i)(1+2i) −198+10i−296i−20 −218−286i = (1−2i)(1+2i) = = 5 5
= =
−198+10i = 1−2i − 52 (109 + 143i).
8.3. Спряженi комплекснi числа Означення 8.3.1. Комплексне число z = a − bi називається спряженим до комплексного числа z = a + bi. Твердження 8.3.1. Для довiльних комплексних чисел z1 , z2 ∈ C справедливi рiвностi z1 + z2 = z1 + z2 , z1 · z2 = z1 · z2 . Доведення. Перевiримо другу рiвнiсть (перша перевiряється аналогiчно). Нехай z1 = a + bi, z2 = c + di. Тодi z1 · z2 = (a + bi)(c + di) = ac − bd + (ad + bc)i = = ac − bd − (ad + bc)i = (a − bi)(c − di) = z1 · z2 .
122
Тема 8. Комплекснi числа
Зауваження 8.3.1. Якщо z = a + bi, то zz — невiд’ємне дiйсне число, оскiльки zz = (a + bi)(a − bi) = a2 + b2 .
8.4. Геометрична iнтерпретацiя Зображення комплексних чисел точками площини приводить до природнього бажання мати геометричну iнтерпретацiю операцiй, визначених для комплексних чисел. Нагадаємо, що комплексному числу z = a + bi ми поставили у вiдповiднiсть точку декартової площини з координатами a i b, тобто вектор iз початком у початку координат i з кiнцем у точцi з абсцисою a та ординатою b (див. мал. 8.1).
Рис. 8.1. Нехай маємо два комплексних числа z1 = a + bi i z2 = + i. На комплекснiй площинi цим числам вiдповiдають два вектори (див. мал. 8.2а). Побудуємо на цих векторах, як на сторонах, паралелограм. Четвертою вершиною цього паралелограма буде, очевидно, точка (a + c, b + d). Таким чином, додавання комплексних чисел геометрично виконується за правилом перелелограма, тобто за правилом додавання векторiв, що виходять iз початку координат. Далi, число, яке є протилежним до числа z = a + bi, буде точкою комплексної площини, яка є симетричною до точки
8.5. Модуль та аргумент
123
Рис. 8.2. z стосовно початку координат (мал. 8.2 б). Звiдси легко можна отримати геометричну iнтерпретацiю вiднiмання. Геометричний змiст множення i дiлення комплексних чисел стане зрозумiлим лише пiсля того, коли ми введемо до розгляду новий, вiдмiнний вiд звичайного, запис комплексних чисел.
8.5. Модуль та аргумент Запис комплексного числа у виглядi z = a + bi використовує декартовi координати точки, що вiдповiдають цьому числу. Проте розмiщення точки на площинi повнiстю визначається також визначенням її полярних координат: вiдстанню ρ вiд початку координат до точки i кута ϕ мiж додатнiм напрямком осi абсцис та напрямком iз початку координат на цю точку (мал. 8.3). Число ρ є невiд’ємним дiйсним числом, причому воно дорiвнює нулю лише для точки 0. Для комплексного числа z, що лежить на дiйснiй осi (тобто яке є дiйсним числом), число ρ буде абсолютною величиною z (ρ = |z|), а тому i для довiльного комплексного числа z його iнодi називають абсолютною величиною числа z; проте частiше число ρ називають модулем числа z. Кут ϕ мiж додатнiм напрямком осi абсцис i напрямком iз початку координат на ненульову точку z називається аргументом
124
Тема 8. Комплекснi числа
Рис. 8.3. числа z. Наведемо бiльш детальнiшi означення i властивостi модуля та аргумента комплексного числа. Означення 8.5.1. Модулем комплексного числа z = a + bi називається дiйсне число p |z| = a2 + b2 , або, що те саме (зважаючи на зауваження 8.3.1), √ |z| = zz. Твердження 8.5.1. Для довiльних комплексних чисел z, z1 , z2 справедливi такi рiвностi: 1) |z| ≥ 0, |z| = 0 ⇔ z = 0, 2) |z1 z2 | = |z1 ||z2 |, 3) |z ¯ 1 + z2 | ≤¯ |z1 | + |z2 |, 4) ¯|z1 | − |z2 |¯ ≤ |z1 + z2 |. Доведення. 1) Очевидно. 2) Дана властивiсть випливає з рiвностей p √ |z1 z2 | = (z1 z2 )z1 z2 = z1 z2 z1 z2 = p √ √ = (z1 z1 )(z2 z2 ) = z1 z1 · z2 z2 = |z1 | · |z2 |.
8.5. Модуль та аргумент
125
Перш, нiж доводитимемо наступнi властивостi, зауважимо, що для всiх дiйсних чисел a i b p a ≤ a2 + b2 . (8.4) Дiйсно, якщо a < 0, то нерiвнiсть (8.4) очевидна, а якщо a ≥ 0, то вона рiвносильна очевиднiй нерiвностi a2 ≤ a2 + b2 . 3) Доведемо спочатку, що |1 + z| ≤ 1 + |z|.
(8.5)
p Справдi, |1 + z| = (1 + z)(1 + z). Звiдси, використовуючи нерiвнiсть Re z ≤ |z| (тобто нерiвнiсть (8.4) для z = a + bi), маємо |1 + z|2 = (1 + z)(1 + z) = 1 + (z + z) + |z|2 =
¡ ¢2 = 1 + 2Re z + |z|2 ≤ 1 + 2|z| + |z|2 = 1 + |z| .
Отож,
¡ ¢2 |1 + z|2 ≤ 1 + |z| .
Добуваючи квадратний корiнь з обох частин, одержимо нерiвнiсть (8.5), яка є частковим випадком властивостi 3. Тепер покажемо, що властивiсть 3 випливає з нерiвностi (8.5). Можемо вважати, що z1 6= 0. Тодi ¯ ³ z2 ¯¯ |z1 | ´ ¯ |z1 + z2 | = |z1 |¯1 + ¯ ≤ |z1 | 1 + = |z1 | + |z2 | z1 |z2 | i властивiсть 3 доведена. 4) Оскiльки |z1 | = |z1 + z2 − z2 | ≤ |z1 + z2 | + | − z2 | = |z1 + z2 | + |z2 |, то |z1 | − |z2 | ≤ |z1 + z2 |.
(8.6)
126
Тема 8. Комплекснi числа
Аналогiчно, мiняючи мiсцями z1 i z2 , легко показати, що |z2 | − |z1 | ≤ |z1 + z2 |.
(8.7)
З (8.6) i (8.7) випливає, властивiсть 4 твердження. Зауваження 8.5.1. Властивiсть |z1 + z2 | ≤ |z1 | + |z2 | має таку геометричну iнтерпретацiю: довжина сторони трикутника не перевищує суми довжин двох його iнших сторiн. Означення 8.5.2. Аргументом4 ненульового комплексного числа z = a + bi називається дiйсне число ϕ, для якого a cos ϕ = √ a2 + b2
i
b sin ϕ = √ . a2 + b2
Аргумент ϕ комплексного числа z позначатимемо arg z. Аргумент ϕ = arg z можна обчислити для будь-якого ненульового комплексного числа z = a + bi; це очевидно, оскiльки b a ≤ 1, −1 ≤ √ ≤ 1, −1 ≤ √ 2 2 2 a +b a + b2 ¡ ¢2 ¡ ¢2 a b √ + √ = 1. a2 + b2 a2 + b2 Очевидно також, що кут ϕ може приймати довiльнi дiйснi значення, як додатнi, так i вiд’ємнi, причому додатнi кути повиннi вiдраховуватись проти годинникової стрiлки. Проте, якщо 4 Аргумент комплексного числа є природнiм узагальненням знаку дiйсного числа. Дiйсно, аргумент додатнього дiйсного числа дорiвнює 0, аргумент вiд’ємного дiйсного числа дорiвнює π; на дiйснiй осi iз початку координат виходять лише два напрямки i їх можна розрiзняти лише двома символами + i −, тодi як на комплекснiй площинi напрямкiв, що виходять iз точки 0, нескiнченно багато i розрiзняються вони вже кутом, що утворюється ними з додатнiм напрямком дiйсної осi.
8.6. Тригонометрична форма комплексного числа
127
кути вiдрiзняються один вiд одного на 2π або число, кратне 2π, то точки площини, що їм вiдпвiдають, спiвпадають. Таким чином, число arg z визначається числом z неоднозначно. Цiєї неоднозначностi можна уникнути, якщо домовитися вибирати arg z у якому-небудь промiжку довжини 2π, наприклад, у промiжку [0, 2π).
8.6. Тригонометрична форма комплексного числа Ознайомившись з геометричною iнтерпретацiєю i поняттями модуля та аргумента комплексних чисел, можна розглянути ще одну форму комплексних чисел — тригонометричну. Означення 8.6.1. Тригонометричною формою ненульового комплексного числа z = a + bi називають вираз z = |z|(cos ϕ + i sin ϕ), де |z| =
√ a2 + b2 , ϕ = arccos √a2a+b2 = arcsin √a2b+b2 .
Можливiсть запису будь-якого ненульового комплексного числа у тригонометричнiй формi випливає iз того, що довiльне ненульове число z = a + bi можна переписати у виглядi z=
³ ´ p bi a a2 + b2 √ +√ , a2 + b2 a2 + b2
звiдки, скориставшись означеннями модуля та аргумента комплексних чисел, i отримуємо необхiдний тригонометричний запис z = |z|(cos ϕ + i sin ϕ).
128
Тема 8. Комплекснi числа
Приклад. Оскiльки
¡ то 2 cos
π 3
+ i sin
1+ ¢ π 3
√ ´ ³1 √ ¡ 3 π π¢ 3i = 2 + i = 2 cos + i sin , 2 2 3 3 √ — тригонометрична форма числа 1 + 3i.
Очевидно, що два комплекснi числа, якi записанi у тригонометричнiй формi, рiвнi, якщо рiвнi їх модулi, а аргументи вiдрiзняються на цiле число, кратне 2π. Твердження 8.6.1. 1) При множеннi ненульових комплексних чисел їх модулi перемножаються, а аргументи додаються. 2) При дiленнi ненульових комплексних чисел їх модулi дiляться, а аргументи вiднiмаються. Доведення. Нехай z1 = |z1 |(cos ϕ1 + i sin ϕ1 ), z2 = |z2 |(cos ϕ2 + i sin ϕ2 ) — довiльнi комплекснi числа у тригонометричнiй формi. Тодi z1 · z2 = |z1 |(cos ϕ1 + i sin ϕ1 ) · |z2 |(cos ϕ2 + i sin ϕ2 ) = ¡ = |z1 ||z2 | (cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 )+ ¢ + i(sin ϕ1 cos ϕ2 + cos ϕ1 sin ϕ2 ) = ¡ ¢ = |z1 ||z2 | cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 ) , z1 |z1 |(cos ϕ1 + i sin ϕ1 ) = = z2 |z2 |(cos ϕ2 + i sin ϕ2 ) |z1 | (cos ϕ1 + i sin ϕ1 )(cos ϕ2 − i sin ϕ2 ) = = |z2 | cos2 ϕ2 + sin2 ϕ2 |z1 | ¡ = (cos ϕ1 cos ϕ2 + sin ϕ1 sin ϕ2 )+ |z2 | ¢ + i(sin ϕ1 cos ϕ2 − cos ϕ1 sin ϕ2 ) = ¢ |z1 | ¡ cos(ϕ1 − ϕ2 ) + i sin(ϕ1 − ϕ2 ) , = |z2 | що й потрiбно було довести.
8.7. Формула Муавра
129
8.7. Формула Муавра Твердження 8.7.1. Якщо z = |z|(cos ϕ+i sin ϕ) — довiльне комплексне число, то ¡ ¢ z n = |z|n cos(nϕ) + i sin(nϕ) , (8.8) де n ∈ Z. Формулу (8.8) називають формулою Муавра. Доведення. Виконаємо доведення методом математичної iндукцiї. Якщо n = 0 i n = 1, то формула (8.8) очевидна (для n = 0 вона зводиться до тотожностi 1 = 1). При n = −1 ми отримуємо рiвнiсть ¡ ¢−1 |z|(cos ϕ + i sin ϕ) = |z|−1 (cos ϕ − i sin ϕ) = ¡ ¢ = |z|−1 cos(−ϕ) + i sin(−ϕ) , що теж легко перевiряється за властивiстю оберненого елемента до комплексного числа z. Припустимо, що формула (8.8) вiрна для довiльного натурального n = k i покажемо, що тодi вона вiрна i для n = k + 1. Використовуючи твердження 8.6.1, маємо ¡ ¢k+1 |z|(cos ϕ + i sin ϕ) = ¡ ¢k = |z|(cos ϕ + i sin ϕ) · |z|(cos ϕ + i sin ϕ) = ¡ ¢ = |z|k cos(kϕ) + i sin(kϕ) · |z|(cos ϕ + i sin ϕ) = ¡ ¡ ¢ ¡ ¢¢ = |z|k+1 cos (k + 1)ϕ + i sin (k + 1)ϕ . Отже, рiвнiсть (8.8) справедлива для всiх натуральних n. Якщо n = −k, де k > 0, то ¡ ¢−k ¡¡ ¢−1 ¢k |z|(cos ϕ + i sin ϕ) = |z|(cos ϕ + i sin ϕ) = ¡ −1 ¢k ¡ ¢ = |z| (cos(−ϕ) + i sin(−ϕ)) = |z|−k cos(−kϕ) + i sin(−kϕ) .
130
Тема 8. Комплекснi числа Отож, формулу Муавра доведено.
8.8. Коренi з комплексних чисел Нехай n — довiльне натуральне число. Означення 8.8.1. Коренем n-го степеня з комплексного числа z називається будь-яке комплексне число u, для якого un = z. Iнакше кажучи, коренем n-го степеня з комплексного числа z називають всi розв’язки рiвняння xn = z.
(8.9)
√ Множину n z всiх коренiв n-го степеня з числа z цiлком описує таке твердження. Твердження 8.8.1. Множина всiх коренiв n-го степеня з числа z = |z|(cos ϕ + i sin ϕ) складається iз усiх комплексних чисел вигляду p ³ ϕ + 2πk ϕ + 2πk ´ + i sin zk = n |z| cos , (8.10) n n де k = 0, 1, . . . , n − 1. Доведення. Нехай комплексне число u = |u|(cos ψ + i sin ψ) — розв’язок рiвняння (8.9), тобто un = z.
(8.11)
Використовуючи формулу Муавра, з рiвностi (8.11) одержуємо |u|n (cos nψ + i sin nψ) = |z|(cos ϕ + i sin ϕ). (8.12)
8.8. Коренi з комплексних чисел
131
З умови рiвностi двох комплексних чисел, записаних у тригонометричнiй формi, отримаємо, що p |u|n = |z| або |u| = n |z|, ϕ + 2πk , де k ∈ Z. nψ − ϕ = 2πk або ψ = n Отож, що для будь-якого цiлого числа k комплексне число p ¡ ϕ + 2πk ϕ + 2πk ¢ n |z| cos + i sin n n є розв’язком рiвняння (8.9). Залишилося перевiрити, що при k = 0, 1, . . . , n−1 цi розв’язки будуть рiзними. Справдi, якби при 0 ≤ k1 < k2 ≤ n − 1 розв’язки були б однаковими, то ϕ + 2πk2 ϕ + 2πk1 − = 2πl, n n тобто k2 − k1 = nl,
l > 1,
що неможливо. Далi, оскiльки k ∈ Z, то k можна роздiлити з остачею на n k = qn + r,
де
0 ≤ r ≤ n − 1.
Тодi cos
ϕ + 2πk ϕ + 2πk + i sin = n n ϕ + 2π(nq + r) ϕ + 2π(nq + r) = cos + i sin = n n ¡ ϕ + 2πr ¢ ¡ ϕ + 2πr ¢ = cos + 2πq + i sin + 2πq = n n ϕ + 2πr ϕ + 2πr = cos + i sin . n n
132
Тема 8. Комплекснi числа
Отже, всi елементи множини лою (8.10).
√ n z обчислюються за форму-
√ Приклад. Обчислимо 3 −8. n√ ¡ o √ π + 2πk π + 2πk ¢ 3 3 −8 = 8 cos + i sin | k = 0, 1, 2 , 3 3 √ π π тобто при k = 0: z0 = 2(cos 3 + i sin 3 ) = 1 + 3i, при k = 1: z1 = 2(cos π + i sin π) = −2, √ при k = 2: z2 = 2(cos 5π + i sin 5π ) = 1 − 3i. 3 3
8.9. Коренi з 1. Група Cn Розглянемо комплексне число z = 1 i застосуємо до нього формулу (8.10). Оскiльки z = 1 = cos 0 + i sin 0, то всi коренi n-го степеня з 1 мають вигляд 2πk 2πk + i sin , де k = 0, 1, . . . , n − 1. n n Множину всiх коренiв n-го степеня з 1 позначатимемо Cn , тобто o n 2πk 2πk + i sin | k = 0, 1, . . . , n − 1 . (8.13) Cn = cos n n Твердження 8.9.1. Множина Cn стосовно операцiї множення утворює групу. яка складається з n елементiв. cos
Доведення. Оскiльки множина всiх комплексних чисел стосовно операцiй додавання та множення утворює поле, а, отже, множина всiх ненульових комплексних чисел стосовно операцiї множення утворює групу, то для доведення скористаємось критерiєм пiдгрупи. А саме, покажемо, що добуток двох елементiв з Cn i обернений до елемента з множини Cn належать до Cn . Для цього розглянемо два довiльнi коренi n-го степеня з 1 zk1 = cos
2πk1 2πk1 + i sin n n
та
zk2 = cos
2πk2 2πk2 + i sin , n n
8.10. Первiснi коренi з 1
133
де k1 , k2 = 1, 2, . . . , n − 1. Маємо ³ 2πk1 2πk1 ´³ 2πk2 2πk2 ´ + i sin cos + i sin = zk1 · zk2 = cos n n n n ³ 2π(k1 + k2 ) 2π(k1 + k2 ) ´ = cos + i sin ∈ Cn , n n ³ 2πk1 2πk1 ´−1 zk−1 = cos + i sin = 1 n n ³ 2π(n − k1 ) ´ 2π(n − k1 ) ∈ Cn . + i sin = cos n n Тому, за критерiєм пiдгрупи, множина Cn є пiдгрупою групи всiх ненульових комплексних чисел стосовно множення, а отже, множина Cn є групою стосовно множення.
8.10. Первiснi коренi з 1 Означення 8.10.1. Корiнь n-го степеня з 1 називається первiсним, якщо вiн не є коренем m-го степеня з 1, де 1 ≤ m < n. Приклад. i та −i — первiснi коренi 4-го степеня з 1, cos первiсний корiнь n-го степеня з 1.
2π n
+ i sin
2π n
—
Множину всiх первiсних коренiв n-го степеня з 1 описує таке твердження. 2π k Твердження 8.10.1. Нехай ε = cos 2π n +i sin n . Число ε є первiсним коренем n-го степеня з 1 тодi i тiльки тодi, коли k i n взаємно простi, тобто найбiльший спiльний дiльник чисел n i k дорiвнює 1.
134
Тема 8. Комплекснi числа
Доведення. Нехай εk — первiсний корiнь i нехай найбiльший спiльний дiльник чисел n i k дорiвнює d 6= 1. Тодi k = k1 d i n = n1 d для деяких k1 , n1 ∈ Z, а тому (εk )n1 = (εk1 d )n1 = εk1 dn1 = εk1 n = (εn )k1 = 1. Ми одержали суперечнiсть з тим, що εk — первiсний корiнь, оскiльки (εk )n1 = 1, а n1 < n. Нехай тепер найбiльший спiльний дiльник чисел n i k дорiвнює 1. Покажемо, що εk — первiсний корiнь n-го степеня з 1. Якщо для деякого m < n (εk )m = cos то
2πkm 2πkm + i sin = 1, n n
2πkm = 2πl, l ∈ Z n
або
km = nl.
Звiдси, i з того, що k i n взаємно простi, випливає, що m дiлиться на n, що неможливо, оскiльки m < n. Зауваження 8.10.1. Кiлькiсть первiсних коренiв n-го степеня з 1 дорiвнює кiлькостi натуральних чисел k таких, що 1 ≤ k < n i найбiльший спiльний дiльник чисел n i k дорiвнює 1. Ця кiлькiсть позначається через ϕ(n). Функцiя ϕ(n) називається функцiєю Ойлера i вiдiграє важливу роль в теорiї чисел.
8.11. Задачi Для аудиторного розв’язання [13]: №№ . [14]: №№ .