МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТ...
16 downloads
450 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ
Л.И. БРЫЛЕВСКАЯ И.А. ЛАПИН Л.С. РАТАФЬЕВА
АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ И ЛИНЕЙНАЯ АЛГЕБРА Учебное пособие
Санкт-Петербург 2008
Коллектив авторов: Л.И. Брылевская, И.А. Лапин, Л.С. Ратафьева Аналитическая геометрия и линейная алгебра Под общей редакцией Л.С. Ратафьевой Учебное пособие. СПб: СПбГУ ИТМО, 2008 год, 156 с. Предлагаемое учебное пособие представляет собой базовый конспект лекций по высшей математике для студентов 1-го курса (1 модуль) дневного и вечернего отделения общеинженерных специальностей. В нем рассматриваются следующие темы: «Элементы теории определителей», «Векторная алгебра», «Элементы аналитической геометрии», «Матрицы и системы линейных уравнений», «Линейные пространства и операторы». Содержание пособия соответствует образовательным стандартам и программе по высшей математике для направления 550000 — Технические науки. Содержит достаточно большое количество разнообразных примеров. При написании пособия использовались материалы учебных пособий, изданных в разное время в СЗПИ, а также книг и учебников, приведенных в списке литературы (без специальных ссылок).
Рекомендовано к печати Ученым Советом естественнонаучного факультета СПбГУ ИТМО (протокол №8 от 22 апреля 2008 года)
В 2007 году СПбГУ ИТМО стал победителем конкурса инновационных образовательных программ вузов России на 2007–2008 годы. Реализация инновационной образовательной программы «Инновационная система подготовки специалистов нового поколения в области информационных и оптических технологий» позволит выйти на качественно новый уровень подготовки выпускников и удовлетворить возрастающий спрос на специалистов в информационной, оптической и других высокотехнологичных отраслях экономики. © Санкт-Петербургский государственный университет информационных технологий, механики и оптики, 2008 г. © Л.И. Брылевская, И.А. Лапин, Л.С. Ратафьева, 2008г.
2
Оглавление
1 Элементы теории определителей....................................................... 5 1 Определители второго порядка...................................................... 5 2 Определители третьего порядка .................................................... 8 3 Основные свойства определителей 3-го порядка......................... 10 4 Определители высших порядков.................................................... 14 5 Исследование и решение систем линейных алгебраических уравнений ......................................................................................... 17 2 Векторная алгебра ................................................................................. 19 1 Векторы и основные линейные операции над ними ..................... 19 2 Линейная зависимость и независимость векторов. Базисы на плоскости и в пространстве. Прямоугольная декартова система координат .................................................................................... 22 3 Проекция вектора на ось. Координаты вектора. Компоненты вектора ........................................................................ 25 4 Теоремы о проекциях вектора ........................................................ 27 5 Скалярное произведение и его свойства....................................... 31 6 Векторное произведение и его свойства ....................................... 34 7 Смешанное произведение трех векторов и его свойства ............................................................................................ 37 8 Двойное векторное произведение.................................................. 40 3 Элементы аналитической геометрии ................................................. 43 1 Плоскость в трехмерном пространстве ......................................... 43 2 Прямая линия в пространстве ........................................................ 49 3 Кривые второго порядка.................................................................. 59 4 Общее уравнение кривой второго порядка ................................... 64 5 Уравнение линии на плоскости и в пространстве......................... 70 6 Поверхности второго порядка......................................................... 75 7 Поверхности вращения ................................................................... 71 4 Матрицы и системы линейных алгебраических уравнений .................................................................................................... 83 1 Матрицы. Основные понятия .......................................................... 83 2 Элементарные преобразования матриц. Ранг матрицы. Теорема о базисном миноре........................................................... 92 3
3 Исследование систем линейных алгебраических уравнений ......................................................................................... 4 Однородные системы линейных алгебраических уравнений ......................................................................................... 5 Неоднородные системы линейных алгебраических уравнений ......................................................................................... 6 Альтернатива Фредгольма для линейных систем........................ 7 Неравенство первой степени с двумя и тремя переменными ................................................................................... 5 Линейные пространства и операторы............................................... 1 Линейное пространство. Базис. Размерность. Подпространство ............................................................................. 2 Евклидово пространство En .......................................................... 3 Линейные операторы и действия над ними. Матрица линейного оператора ...................................................................... 4 Замена базиса ................................................................................. 5 Изменение матрицы линейного оператора при переходе к новому базису .................................................................................. 6 Сопряженный и самосопряженный оператор ............................... 7 Собственные векторы и собственные значения линейного оператора ......................................................................................... 8 Квадратичные формы и их приведение к каноническому виду................................................................................................... 9 Геометрические приложения теории квадратичных форм в пространствах Ρ2 и Ρ3 ...................................................................
4
96 106 110 116 119 122 122 127 133 137 139 140 141 146 147
Глава 1 Элементы теории определителей Теория определителей возникла в XVIII веке в связи с задачей решения систем линейных алгебраических уравнений. Однако впоследствии определители нашли применение в самых различных разделах математики, в частности, в векторной алгебре, аналитической геометрии и математическом анализе.
§1 Определители второго порядка. Рассмотрим систему двух линейных алгебраических уравнений с двумя неизвестными x 1 и x 2
a 11x 1 + a 12x 2 = b1 ⎫ ⎬, a 21x 1 + a 22x 2 = b 2 ⎭
(1)
a 12 ⎞ ⎛a A = ⎜ 11 ⎟, a a 22 ⎠ ⎝ 21
(2)
где a ij (i = 1,2; j = 1,2) – числовые коэффициенты системы (1). Таблица, составленная из коэффициентов этой системы
называется матрицей коэффициентов системы (1). Матрице (2) ставится в соответствие число, называемое определителем матрицы A , которое обозначается det A и вычисляется по правилу det A = a 11a 22 − a 12a 21 , т.е. определитель второго порядка равен разности произведения элементов, стоящих на главной диагонали и на побочной диагонали матрицы A . Определитель матрицы A обозначают так
det A =
a 11 a 12 a 21 a 22
= a 11a 22 − a 12a 21 .
(3)
Найдем решение системы (1). Нетрудно убедиться, что оно выражается через коэффициенты системы так (предполагаем, что det A ≠ 0 ):
b1a 22 − a 12b 2 ; a 11a 22 − a 12a 21
a 11b 2 − b1a 21 (4) . a 11a 22 − a 12a 21 Мы видим, что в знаменателе выражений для x 1 и x 2 стоит определитель det A , в числителе также стоят определители, которые мы обозначим через Δx и Δx соответственно, т.е. 1 2 b a 12 a 11 b1 Δx = 1 , Δx = . 1 2 b a a b x1 =
2
x2 =
22
21
5
2
Нетрудно заметить, что определитель Δx получается из определителя 1
Δ , если в нем заменить столбец коэффициентов при x 1 (первый столбец) столбцом из свободных членов, а определитель Δx – если второй столбец 2
определителя Δ заменить столбцом из свободных членов. Тогда решение (4) системы можно записать так:
x1 =
Δx 1 , Δ
x2 =
Δx 2 Δ
( Δ ≠ 0 ).
(5)
Эти формулы называются формулами Крамера. Итак, для того, чтобы найти решение линейной алгебраической системы второго порядка, достаточно подсчитать три определителя Δ , Δx , Δx и составить их отношение. 1
2
Пример. Найти по формулам Крамера решение линейной алгебраической системы
2x − y = 1⎫ ⎬. x +y = 2 ⎭ Решение. Вычислим определители Δ , Δx , Δx : 1
Δ= Δx = 1
2
2 −1 = 2 ⋅ 1 − ( −1) ⋅ 1 = 2 + 1 = 3 , 1 1
1 −1 2 1 = 2 ⋅ 2 − 1⋅1 = 4 − 1 = 3 . = 1 ⋅ 1 − ( −1) ⋅ 2 = 1 + 2 = 3 , Δx = 2 2 1 1 2
По формулам Крамера
Итак, x 1 = 1, x 2 = 1 .
Δx 3 x 1 = 1 = = 1, Δ 3
6
Δx x 2 = 2 = 1. Δ
Основные свойства определителей второго порядка 1) Определитель не изменится, если его строки поменять местами с соответствующими столбцами, т.е.
a 11 a 12 a 21 a 22
=
a 11 a 21 a 12 a 22
.
2) При перестановке двух строк (столбцов) определитель меняет знак на противоположный, т.е.
a 11 a 12 a a 22 . = − 21 a 21 a 22 a 11 a 12 3) Общий множитель всех элементов строки (столбца) можно выносить за знак определителя, т.е. , например,
a 11 k ⋅ a 12 a a 12 . = k ⋅ 11 a 21 k ⋅ a 22 a 21 a 22 4) Определитель с одинаковыми строчками (столбцами) равен нулю, т.е.
a 11 a 12 a 11 a 12
= 0.
5) Определитель с нулевой строкой (столбцом) равен нулю, т.е. например,
a 11 a 12 = 0. 0 0 6) Если к элементам какой-либо строки (столбца) прибавить соответствующие элементы другой строки (столбца), умноженные на одно и то же число, то определитель не изменится, т.е. например
a 11 + k ⋅ a 12 a 12 a 11 a 12 . = a 21 + k ⋅ a 22 a 22 a 21 a 22 Все эти свойства доказываются непосредственным вычислением левой и правой части выражений, входящих в рассматриваемые равенства. Докажем, например, свойство 6. Для этого вычислим определитель, стоящий в левой части равенства:
a 11 + k ⋅ a 12 a 12 = (a 11 + k ⋅ a 12 )a 22 − (a 21 + k ⋅ a 22 )a 12 = a 21 + k ⋅ a 22 a 22 = a 11a 22 − k ⋅ a 12a 22 − a 21a 12 − k ⋅ a 22a 12 = a 11a 22 − a 21a 12 =
7
a 11 a 12 . a 21 a 22
§2 Определители третьего порядка. Рассмотрим квадратную матрицу (таблицу) третьего порядка
⎛ a 11 a 12 a 13 ⎞ ⎜ ⎟ A = ⎜ a 21 a 22 a 23 ⎟ . ⎜a ⎟ ⎝ 31 a 32 a 33 ⎠
(1)
Если в этой матрице вычеркнуть любую строку и любой столбец, то оставшиеся элементы образуют квадратную матрицу второго порядка. Из квадратной матрицы третьего порядка можно получить девять квадратных матриц второго порядка. Введем несколько новых понятий. Определение 1. Минором элемента a ij матрицы третьего порядка называют определитель матрицы второго порядка, которая получается из данной матрицы вычеркиванием i -ой строки и j -го столбца, т.е. строки и столбца, на пересечении которых стоит данный элемент ( i , j ∈ {1, 2, 3} ). Минор элемента a ij обозначается символом M ij . Например, минором элемента a 12 матрицы (1) является определитель
M 12 =
a 21 a 23 a 31 a 33
(2)
.
Определение 2. Алгебраическим дополнением элемента a ij матрицы третьего порядка называют число, равное произведению минора этого элемента на ( −1)i + j . Иначе: алгебраическое дополнение элемента a ij – это минор элемента
a ij , если сумма индексов i + j четная, и минор, взятый с противоположным знаком, если сумма индексов i + j нечетная. Алгебраическое дополнение элемента a ij обозначается A ij , т.е. по определению A ij = ( −1)i + j M ij . Пример 1. Вычислить алгебраические дополнения A 12 и A 31 матрицы
⎛ 1 3 −1 ⎞ ⎜ ⎟ A = ⎜ 0 2 1 ⎟. ⎜ −3 − 1 0 ⎟ ⎝ ⎠ Имеем
A 12 = ( −1)3
0 1 = −3 ; −3 0
A 31 = ( −1)4
3 −1 = 5. 2 1
Замечание. Можно говорить также о минорах и алгебраических дополнениях элементов матрицы второго порядка, если под определителем матрицы, состоящей из одного элемента (матрицы первого порядка), понимать число, равное этому элементу.
8
Определение 3. Определителем (детерминантом) квадратной матрицы третьего порядка (определителем третьего порядка) называем число, равное сумме попарных произведений элементов первой строки на их алгебраические дополнения. Т.е. по определению имеем
a 11 a 12
a 13
det A = a 21 a 22 a 23 = a 11A 11 + a 12A 12 + a 13A 13 .
(3)
a 31 a 32 a 33 Пример 2. Вычислить определитель матрицы
⎛ 1 3 −1⎞ ⎜ ⎟ A = ⎜ 0 2 1 ⎟. ⎜ −3 −1 0 ⎟ ⎝ ⎠ Имеем
1 3 −1 2 1 0 1 0 2 det A = 0 2 1 = 1 ⋅ − 3⋅ + ( −1) ⋅ = −1 0 −3 0 −3 − 1 −3 −1 0 = 1 ⋅ (0 + 1) − 3 ⋅ (0 + 3) − 1 ⋅ (0 + 6) = 1 − 9 − 6 = −14. Замечание. Если в формулу (3) подставить выражения алгебраических дополнений через элементы матрицы, то получим
a 11 a 12 a 13 det(A ) = a 21 a 22 a 23 = a 11a 22a 33 + a 21a 32a 13 + a 31a 12a 13 − a 31 a 32 a 33
−a 13a 22a 31 − a 23a 32a 11 − a 33a 21a 12 .
(4)
В этой формуле шесть слагаемых, причем каждое из них является произведением трех элементов матрицы: по одному из каждой строки и из каждого столбца; три слагаемых входит со знаком «+», а три со знаком «–». Иногда в курсах высшей алгебры формула (4) принимается в качестве определения определителя третьего порядка.
§3 Основные свойства определителей 3-го порядка. Нетрудно убедиться, что все свойства определителей 2-го порядка справедливы и для определителей 3-го порядка. Но как более сложный объект, определители 3-го порядка имеют и дополнительные свойства. Сформулируем и докажем все свойства полностью. 1. Определитель не изменяется, если его строки поменять местами с соответствующими столбцами, т.е.
9
a 11 a 12 a 13 a 11 a 21 a 31 Δ = a 21 a 22 a 23 = a 12 a 22 a 32 , a 31 a 32 a 33 a 13 a 23 a 33
(1)
где Δ = det A . Доказывается разложением каждого определителя по элементам первой строки. В результате получаем одно и то же выражение. 2. Определитель равен сумме попарных произведений элементов любой строки (столбца) на их алгебраические дополнения. Докажем, например, равенство Δ = a 31A 31 + a 32A 32 + a 33A 33 . (2) По определению Δ = a 11A 11 + a 12A 12 + a 13A 13 . Тогда Δ = a 11
a 22 a 23
+ a 12
a 21 a 23
+ a 13
a 21 a 22
= a 32 a 33 a 31 a 33 a 31 a 32 = a 11 (a 22a 33 − a 23a 32 ) − a 12 (a 21a 33 − a 23a 31 ) + a 13 (a 21a 32 − a 22a 31 ) =
= a 11a 22a 33 − a 11a 23a 32 − a 12a 21a 33 + a 12a 23a 31 + a 13a 21a 32 − a 13a 22a 31 = = a 31 (a 12a 23 − a 13a 22 ) − a 32 (a 11a 23 − a 13a 21 ) + a 33 (a 11a 22 − a 12a 21 ) = = a 31
a 12
a 13
a 22 a 23
− a 32
a 11 a 13 a 21 a 23
+ a 33
a 11 a 12 a 21 a 22
=
= a 31A 31 + a 32A 32 + a 33A 33 , т.е. Δ = a 31A 31 + a 32A 32 + a 33A 33 . Истинность данного утверждения для другой строки или любого столбца доказывается аналогично. 3. При перестановке двух строк определитель меняет знак на противоположный. Доказательство. Пусть в матрице третьего порядка перестановлены первая и третья строки. Покажем, что
a 11 a 12
a 13
a 31 a 32 a 33
a 21 a 22 a 23 = − a 21 a 22 a 23 . a 31 a 32 a 33
a 11 a 12
(3)
a 13
Разлагая определитель, стоящий в левой части равенства (3), по элементам первой строки, получим a 11A 11 + a 12A 12 + a 13A 13 . Разлагая же определитель, стоящий в правой части этого равенства, по элементам третьей строки, получим
10
a 31 a 32 a 33 a 21 a 22 a 23 = a 11 (a 23a 32 − a 22a 33 ) − a 12 (a 31a 23 − a 21a 33 ) + a 13 (a 31a 22 − a 21a 32 ) = a 11 a 12
a 13
= a 11 (−A 11 ) + a 12 (−A 12 ) + a 13 (−A 13 ) = −(a 11A 11 + a 12A 12 + a 13A 13 ), т.е. то же выражение, но с противоположным знаком. 4. Определитель с двумя одинаковыми строками (столбцами), равен нулю. Доказательство. Пусть Δ – определитель матрицы с двумя одинаковыми строками. Если эти строки переставить местами, то определитель должен поменять знак. Но так как строки одинаковы, то определитель не изменится. Т.е. имеем Δ = − Δ , откуда 2 ⋅ Δ = 0 или Δ = 0 . 5. Если все элементы какой-либо строки определителя умножить на число, то весь определитель умножится на это число. Доказательство. Покажем, например, что
a 11
a 12
a 13
a 11 a 12
a 13
k ⋅ a 21 k ⋅ a 22 k ⋅ a 23 = k ⋅ a 21 a 22 a 23 . a 31
a 32
a 33
a 31 a 32 a 33
Разложим по элементам второй строки. Тогда левая часть равенства может быть записана так: (k ⋅ a 21 )A 21 + (k ⋅ a 22 )A 22 + (k ⋅ a 23 )A 23 = k ⋅ (a 21A 21 + ka 22A 22 + a 23A 23 ) = k ⋅ Δ , где Δ – определитель матрицы A . Это свойство иногда формулируют так: общий множитель всех элементов строки можно выносить за знак определителя. 6. Определитель, у которого соответствующие элементы двух строк пропорциональны, равен нулю. Доказательство. Пусть, например, элементы третьей строки пропорциональны элементам первой, т.е. a 31 = k ⋅ a 11 , a 32 = k ⋅ a 12 , a 33 = k ⋅ a 13 . Тогда, используя свойство 5, а затем 4, будем иметь
a 11
a 12
a 13
a 11 a 12
a 21
a 22
a 23 = k ⋅ a 21 a 22 a 23 = 0 .
k ⋅ a 11 k ⋅ a 12 k ⋅ a 13
a 11 a 12
a 13 a 13
7. Определитель, у которого все элементы какой-либо строки представляют собой сумму двух слагаемых, равен сумме двух определителей, получаемых из данного заменой элементов рассматриваемой строки соответственно на первые и вторые слагаемые. Доказательство. Пусть, например,
a 13 = a 13′ + a 13″ . 11
a 11 = a 11′ + a 11″ , a 12 = a 12′ + a 12″ ,
Тогда
a 11′ + a 11″ a 12′ + a 12″ a 13′ + a 13″ = a 21 a 22 a 23 a 31 a 32 a 33 = (a 11′ + a 11″ )A 11 + (a 12′ + a 12″ )A 12 + (a 13′ + a 13″ )A 13 = = (a 11′A 11 + a 12′A 12 + a 13′A 13 ) + (a 11″A 11 + a 12″A 12 + a 13″A 13 ) = a ′ a ′ a ′ a ″ a ″ a ″ 11
12
= a 21 a 31
a 22 a 32
13
11
a 23 + a 21 a 33 a 31
12
a 22 a 32
13
a 23 . a 33
8. Определитель не меняется, если к элементам какой-либо строки прибавить соответствующие элементы любой другой строки, умноженные на общий множитель k ∈ R Доказательство. Прибавим, например, к элементам первой строки соответствующие элементы третьей строки, умноженные на одно и то же число k . Тогда, по свойству 7, а затем по свойству 6, будем иметь
a 11 + k ⋅ a 31 a 12 + k ⋅ a 32 a 13 + k ⋅ a 33 a 11 a 12 a 13 k ⋅ a 31 k ⋅ a 32 k ⋅ a 33 = a 21 a 22 a 23 + a 21 a 21 a 22 a 23 a 22 a 23 = a 31
a 32
a 33
a 31 a 32 a 33
a 31
a 32
a 33
a 11 a 12 a 13 = a 21 a 22 a 23 . a 31 a 32 a 33 9. Теорема замещения. Сумма произведений алгебраических дополнений какой-либо строки на числа q 1 , q 2 и q 3 равна определителю матрицы, получающейся из данной, заменой рассматриваемых элементов соответственно на числа q 1 , q 2 и q 3 . Доказательство. В силу определения 3 имеем:
a 11 a 12 a 13 detA = a 21 a 22 a 23 = a 11A 11 + a 12A 12 + a 13A 13 . a 31 a 32 a 33 Полагая a 11 = q 1 , a 12 = q 2 и a 13 = q 3 , получим: q1 q 2
q3
q 1A 11 + q 2A 12 + q 3A 13 = a 21 a 22 a 23 . a 31 a 32 a 33 10. Сумма произведений элементов какой-либо строки на алгебраические дополнения другой строки равна нулю. 12
Доказательство. Рассмотрим, например, сумму произведений элементов третьей строки: a 11A 31 + a 12A 32 + a 13A 33 . По теореме замещения (свойство 9) это выражение равно определителю, в третьей строке которой стоят числа a 11 , a 12 и a 13 :
⎛ a 11 a 12 a 13 ⎞ ⎜a ⎟ ⎜ 21 a 22 a 23 ⎟ . ⎜a ⎟ ⎝ 11 a 12 a 13 ⎠ Этот определитель равен нулю по свойству 4, так как первая и третья строки совпадают. Перечисленные свойства, особенно свойство 8, позволяют значительно упростить вычисление определителя, в частности свести вычисление определителя третьего порядка к вычислению одного определителя второго порядка вместо трех. Пример. Вычислить определитель
−1 Δ = −5 2 3 . 6 −6 3 3
2
Прежде всего заметим, что элементы второго столбца имеют общий множитель 2, а элементы третьей строки – общий множитель 3. Поэтому, вынося эти множители за знак определителя, получим
−1 3 1 −1 Δ = 2 ⋅ −5 1 3 = 2 ⋅ 3 ⋅ −5 1 3 . 6 −3 3 2 −1 1 3
1
Прибавляя теперь третью строку к первой, будем иметь
5
0
0
Δ = 6 ⋅ −5 1 3 . 2 −1 1 Разлагая этот определитель по элементам первой строки, в которой только один элемент отличен от нуля, получим
Δ = 6⋅5⋅
1
3
−1 1
= 30 ⋅ (1 + 3) = 30 ⋅ 4 = 120 .
§4 Определители высших порядков. Определители высших порядков, т.е. четвертого, пятого и т.д., определяются с помощью определителей меньшего порядка точно так, как был определен определитель третьего порядка. Так, определитель четвертого порядка равен по определению
13
Δ4 =
a 11 a 12 a 13 a 14 a 21 a 22 a 23 a 24
= a 11A 11 + a 12A 12 + a 13A 13 + a 14A 14 , a 31 a 32 a 33 a 34 a 41 a 42 a 43 a 44 и a 14 – элементы первой строки, а A 11 , A 12 , A 13 и A 14 – со-
где a 11 , a 12 , a 13 ответствующие им алгебраические дополнения. Миноры и алгебраические дополнения определяются точно так же, как и для определителей третьего порядка. Таким образом, вычисление определителя четвертого порядка сводится к вычислению четырех определителей третьего порядка. Определитель порядка n по определению
a 11 a 12 a a 22 Δn = 21 . . a n1 a n 2
... a 1n ... a 2n ...
.
= a 11A 11 + a 12A 12 + ... + a 1n A 1n .
... a nn Как видно, определитель n -го порядка определяется через n определителей n − 1 порядка, каждый из них определяется через n − 1 определитель порядка n − 2 и т.д. Доводя разложение до определителей 2-го порядка и вычисляя их, получаем, что определитель n -го порядка представляет собой алгебраическую сумму n ! слагаемых. Все свойства, сформулированные и доказанные для определителей третьего порядка, справедливы и для определителей n -го порядка. И доказываются они аналогично. Для вычисления определителей порядка n используем свойство 8. С помощью этого свойства добиваемся того, чтобы в одной из строк или в одном из столбцов все элементы, кроме одного, были равными нулю. Так что вычисление определителя n -го порядка можно свести к вычислению одного определителя порядка n − 1 . Пример. Вычислить определитель пятого порядка
−2 7 0 6 −2 1 −1 3 2 3 Δ= 3 4 0 5 3 . 2 5 −4 − 2 2 0 3 −1 1 −4 Замечаем, что в третьем столбце два элемента равны нулю. Можно в этом столбце получить еще два нулевых элемента, если ко второй и четвертой строкам прибавить пятую строку, умноженную соответственно на 3 и на «–4». Тогда получим
14
−2 7 0 6 −2 1 8 0 5 −9 Δ= 3 4 0 5 3 . 2 − 7 0 − 6 18 0 3 −1 1 − 4 Таким образом
−2
7
6
−2
1 3
8 4
5 5
−9 . 3
Δ = ( −1) ⋅ ( −1)5+3
−7 −6
2
18
Для вычисления полученного определителя 4-го порядка прибавим к первой, третьей и четвертой строкам вторую строку, умноженную соответственно на 2, –3, –2. Получим
Δ=
0
23
16
−20
1
8
5
−9
0 −20 −10
30
0 −23 −16
36
.
Разлагая теперь определитель по элементам первого столбца (вынося предварительно за знак определителя множитель «–10» у элементов третьей строки), получим, что
23
16
−20
Δ = 10 ⋅ 2
1
−3 .
−23 −16
36
Прибавляя к первой строке третью строку, будем иметь
0
0
16
Δ = 10 ⋅ 2
1
−3 = 10 ⋅ 16 ⋅ (−1)1+3
−23 −16 36
2
1
−23 −16
= 160 ⋅ (−32 + 23) = −1440 .
Замечание. Существует и другое определение определителя матрицы порядка n : это сумма всевозможных произведений элементов, взятых по одному из каждой строчки, по одному из каждого столбца и снабженных знаком по определенному правилу. Более подробно с теорией определителей можно ознакомиться, например, по книге А.Г. Куроша «Курс высшей алгебры».
§5 Исследование и решение систем линейных алгебраических уравнений.
15
Рассмотрим систему линейных алгебраических уравнений третьего порядка
a 11x 1 + a 12x 2 + a 13x 1 = b1 ⎫ ⎪ (1) a 21x 1 + a 22x 2 + a 23x 3 = b 2 ⎬ . a 31x 1 + a 32x 2 + a 33x 3 = b3 ⎭⎪ Исключая по очереди неизвестные x 1 , x 2 и x 3 , переходим к формулам Δ ⋅ x 1 = Δx , Δ ⋅ x 2 = Δx , Δ ⋅ x 3 = Δx , 1 2 3 a 11 a 12 a 13 где Δ = a 21 a 22
(2)
a 23 – определитель системы (1).
a 31 a 32 a 33 b1 a 12 a 13 a 11 b1 a 13 a 11 a 12 b1 Δx = b 2 a 22 a 23 , Δx = a 21 b 2 a 23 , Δx = a 21 a 22 b 2 . 1 2 3 b3 a 32 a 33 a 31 b3 a 33 a 31 a 32 b3 Система (2) эквивалентна системе (1), т.е. каждое решение системы (1) является решением системы (2) и наоборот. Запись в виде (2) позволяет легко исследовать систему (1). Рассмотрим два случая: определитель Δ равен нулю и определитель Δ отличен от нуля. Пусть Δ ≠ 0 . В этом случае система (2) имеет единственное решение
x1 =
Δx Δx Δx 3 1 2 , x2 = , x3 = . Δ Δ Δ
Эти формулы называют формулами Крамера. В знаменателе стоит определитель, составленный из коэффициентов при неизвестных, а в числителях – определители Δi , получающиеся из Δ заменой i -го столбца столбцом свободных членов (i = 1,2,3) . Пусть Δ = 0 . Здесь возможны два случая. a) Хотя бы один из определителей Δx , Δx , Δx в системе (2) отли1
2
3
чен от нуля. Пусть для определенности Δx ≠ 0 . Тогда уравнение 1
Δ ⋅ x 1 = Δx не может быть удовлетворено никаким значением неизвестно1
го. Следовательно, система (2), а значит и исходная система (1) несовместная. б) Все определители Δx , Δx , Δx равны нулю. В этом случае (при1
2
3
мем это пока без доказательства) система (1) имеет бесчисленное множество решений. Приведенные выше формулы Крамера и рассуждения справедливы для линейных систем любого порядка. Более подробное исследование систем будет проведено в главе IV.
16
Пример 1. Исследовать и решить систему
x 1 + 2x 2 − x 3 = 1
⎫ ⎪ x 2 + 3x 3 = −7 ⎬. −x 1 + 3x 2 − x 3 = −2 ⎪⎭ Решение. Вычисляем определитель системы. Находим Δ = −17 . Следовательно, система совместна и имеет единственное решение. Вычисляя, находим Δx = −17 , Δx = 17 , Δx = 34 , 1
откуда
x1 =
2
3
Δx Δx Δx −17 17 34 1 = = 1, x 2 = 2 = = −1 , x 3 = 3 = = −2 . Δ −17 Δ −17 Δ −17
Пример 2. Исследовать систему
2x 1 + x 2 − 3x 3 = 1⎫ ⎪ x 1 − x 2 − 2x 3 = 4 ⎬ . ⎪ 3x 2 + x 3 = −7 ⎭ Находим определитель Δ системы. Он равен нулю. Обращаемся к определителям Δx , Δx и Δx . Находим: Δx = 50 .Определители Δx и Δx 1
2
1
3
2
3
можно не вычислять, так как из того, что Δx ≠ 50 , следует, что система не1
совместная.
17
Глава 2 Векторная алгебра Векторная алгебра имеет широкое применение в различных разделах физики, математики, механики и т.п. В курсе средней школы вектор определяется как некоторое преобразование пространства. Однако для прикладных целей удобнее использовать другое, традиционное определение вектора и действий над векторами, на которых мы и остановимся дальше. Это не означает, однако, что сведения, полученные в средней школе, не верны. Просто мы будем изучать векторную алгебру, исходя из несколько иных, более удобных для практических целей позиций.
§1 Векторы и основные линейные операции над ними. 1 Векторные величины В отличие от скалярной величины, которую можно задать одним числом и отложить на некоторой шкале (отсюда и название – «скалярная») – площадь, объем, температура – векторную величину, или просто вектор, можно задать с помощью числа и некоторого направления (скорость, сила). uuuur Итак, мы можем сказать, что вектор A B – это величина, которая характеризуется числом, совпадающим с длиной отрезка A B , и направлением, совпадающим с направлением луча [A , B ) (рис. 2.1.1).
uuuur
ur
При этом длину вектора обозначают A B , a или еще a . Длину вектора также называют модулем этого вектора. Векторы a и b называют равными, если совпадают их длины и направления. Векторы a и b называют противоположными, если их длины равны, а направления противоположны. Заметим, что при этом начало вектора можно поместить в любой точке пространства. Такие векторы называют свободными. Если начало и конец вектора совпадают, то такой вектор называется нулевым (0) . Направление нулевого вектора не определено.
18
B
λ1a λ1 < 0
A
a
λ2a λ2 > 0
b
-a Рис. 2.1.1 2 Умножение вектора на скаляр
a
Рис. 2.1.2
Определение 1. Произведением вектора a на число λ называется такой вектор c , что c = λ ⋅ a , а направление его совпадает с направлением вектора a , если λ >0, и ему противоположно, если λ <0; если a = 0 или λ = 0 , то λ a = 0 . Ясно, что векторы a и λ a (если λ ≠ 0 ) можно поместить на одной прямой (рис. 2.1.2). Вектор ( −1) ⋅ a = −a , очевидно, является противоположным вектору a . Определение 2. Два ненулевых вектора a и b , лежащих на одной прямой или на параллельных прямых, называются коллинеарными. 3 Единичный вектор Определение 3. Вектор a 0 , длина которого равна единице, называется единичным вектором, или ортом. Если задан некоторый вектор a ( a ≠ 0 ), то всегда можно подобрать множитель λ , такой, чтобы после умножения на него длина вектора λ a была бы равна единице. Очевидно, что в качестве такого числа нужно взять
1 a . Тогда a 0 = , и при этом a 0 называется единичным вектором, соотa a ветствующим вектору a , или ортом вектора a . Очевидно, что направление единичного вектора всегда совпадает с направлением вектора a . Ясно также, что a = a ⋅ a 0 .
λ=
Точно так же единичный вектор l 0 , направление которого совпадает с направлением оси l , называется ортом оси l , или ее единичным вектором.
19
4 Сложение векторов Определение 4. Суммой векторов a и b , расположенных так, что начало вектора b совпадает с концом вектора a , называется вектор c , начало которого совпадает с началом вектора a , а конец – с концом вектора b . (правило треугольника – рис. 2.1.3, а). При этом пишут: c = a + b . Аналогично определяется сумма n векторов a1 + a 2 + ... + an = c . А именно: суммой называют вектор c, проведенный из начала первого в конец последнего вектора, при условии, что начало вектора a2 совпадает с концом вектора a1 , начало вектора a3 совпадает с концом вектора a2 и т.д. (правило многоугольника – рис. 2.1.3, б).
a+b b
a
a4
c
a)
a1
a3
a2 б)
b
a+b a
в)
Рис. 2.1.3 Замечание. Если на векторах a и b построить параллелограмм, поместив их начало в общую точку, то сумма a + b будет лежать на диагонали параллелограмма, выходящей из общего начала векторов a и b (правило параллелограмма – рис. 2.1.3, в). Свойства сложения векторов: 1) a + 0 = a (поглощение нулевого вектора); 2) a + b = b + a (перестановочное, или коммутативное); 3) (a + b) + c = a + (b + c) (сочетательное, или ассоциативное); 4) для всякого ненулевого вектора a существует противоположный вектор − a , такой, что a + ( − a) = 0 . 5 Вычитание векторов Определение 5. Вектор c называется разностью векторов a и b , т.е. c = a − b , если c + b = a . Из последнего равенства следует, что c = a + ( −b) т.е. вычитание векторов сведено к сложению (рис. 2.1.4). Нетрудно заметить, что в параллелограмме, построенном на векторах a и b , разность этих векторов a − b лежит на диагонали параллелограмма, проведенной из конца вектора b в конец вектора a.
20
b a
−b
a−b
b
a−b −b
a
а)
б) Рис. 2.1.4
§2 Линейная зависимость и независимость векторов. Базисы на плоскости и в пространстве. Прямоугольная декартова система координат. 1 Линейная зависимость и независимость векторов Пусть имеется n векторов a1 , a 2 , …, an и n постоянных коэффициентов c 1 , c 2 ,…,c n . Выражение c 1a1 + c 2a 2 + ... + c n an называется линейной комбинацией векторов a1 , a 2 , …, an . Определение 1. Векторы a1 , a 2 , …, an называются линейно зависимыми, если существуют числа c 1 , c 2 ,…, c n , из которых хотя бы одно отлично от нуля, такие, что соответствующая линейная комбинация векторов равна нулю:
c 1a1 + c 2a 2 + ... + c n an = 0 . Определение 1*. Векторы a1 , a 2 , …, an называются линейно зависимыми, если хотя бы один вектор из этой системы можно выразить в виде линейной комбинации остальных. Можно доказать, что определения 1 и 1* эквивалентны, т.е. из 1 следует 1* и наоборот.
21
Определение 2. Векторы a1 , a 2 , …, an называются линейно независимыми, если линейная комбинация c 1a1 + c 2a 2 + ... + c n an = 0 лишь при условии c 1 = c 2 = ... = c n . Определение 2*. Векторы a1 , a 2 , …, an называются линейно независимыми, если ни один из этих векторов нельзя представить в виде линейной комбинации остальных. Можно доказать, что определения 2 и 2* эквивалентны. Заметим, что если один из векторов a1 , a 2 , …, an является нулевым, то совокупность векторов линейно зависима. Пример 1. Доказать, что коллинеарные векторы линейно зависимы. Действительно, поместим векторы a и b на одной прямой (рис. 2.2.1), тогда можно найти такое λ , при котором a = λb => 1 ⋅ a + ( −λ ) ⋅ b = 0 , а это и означает, что a и b линейно зависимы. Пример 2. Доказать, что любые три вектора a, b и c, лежащие в плоскости, линейно зависимы. Действительно, поместим начало всех трех векторов в общую точку (рис.2.2.2). Очевидно, тогда можно подобрать единственную пару чисел λ1 и λ2 , так что будет c = λ1a + λ2 b , а это и означает, что векторы a, b и c линейно зависимы.
b
c b
a
a
Рис. 2.2.2 Рис. 2.2.1 Определение 3. Ненулевые векторы a1 , a 2 , …, an называются компланарными, если они лежат в одной плоскости или параллельных плоскостях. Из сказанного выше следует, что три компланарных вектора линейно зависимы. Пример 3. Любые четыре вектора в пространстве линейно зависимы. Действительно, можно подобрать, причем единственным образом, такие числа λ1 , λ2 , λ3 , что будет d = λ1a + λ2b + λ3c (рис. 2.2.3).
d c b
λ3c
a
λ1a
22
2 Базисы на плоскости и в пространстве Определение 1. Совокупность любых двух линейно независимых векторов, принадлежащих данной плоскости, называется базисом на этой плоскости. Если e1 , e 2 – базис на плоскости, то для любого вектора a , лежащего в этой плоскости, можно найти единственным образом такие числа x 1 и x 2 , что будет a = x 1e1 + x 2e 2 . Числа x 1 и x 2 называются координатами вектора a в данном базисе. Определение 2. Совокупность любых трех линейно независимых векторов e1 , e 2 , e3 в пространстве называется базисом в пространстве. Если a – произвольный вектор, то всегда можно найти единственным образом числа x 1 , x 2 , x 3 такие, что будет иметь место представление: a = x 1e1 + x 2e 2 + x 3e3 . Коэффициенты x 1 , x 2 , x 3 в разложении данного вектора по базису называются координатами вектора a в базисе e1 , e 2 , e3 . 3 Прямоугольная декартова система координат Из всех возможных базисов ( e1 , e 2 , e3 ) в пространстве выберем такой, чтобы все векторы, входящие в этот базис, были попарно ортогональны ∧
(т.е. (ei ,e j ) =
λi =
π
2
, ( i , j = 1, 2, 3 )) , далее умножим каждый базисный вектор на
e 1 , т.е. разделим каждый вектор e i на его длину. Обозначим e i0 = i . ei ei 0
0
0
Получим базис e1 , e 2 , e3 . Такой базис называется ортонормированным. Определение 1. Три некопланарных вектора a , b и c , взятых в указанном порядке и приложенных к одной точке называют тройкой векторов. Определение 2. Тройка векторов a , b , c называется правой, если r при наблюдении с конца вектора c кратчайший поворот от вектора a к вектору b происходит против движения часовой стрелки. 0 0 0 Ограничимся выбором правой тройки базисных векторов e1 , e 2 , e3 . Поместим далее начало векторов, входящих в выбранной базис, в общую точку 0 и из этой точки проведем оси O x , O y , O z , направления которых 0
0
0
совпадают с направлениями векторов e1 , e 2 , e3 . Получим так называемую пространственную прямоугольную правую декартову систему координат O xy z Причем принято орты обозначать 23
0
0
0
так: e1 = i , e 2 = j , e3 = k (рис. 2.2.4). Ось O x называется осью абсцисс, ось O y – осью ординат, ось O z – осью аппликат. Если базис состоит из двух векторов i и j, получим прямоугольную правую декартову систему координат на плоскости – систему O xy .
z
k x
i
y
Рис. 2.2.4 §3 Проекция вектора на ось. Координаты вектора. Компоненты вектора. 1 Проекция вектора на ось. Пусть вектор AB лежит на некоторой оси l . Направление орта l 0 соответствует направлению оси (рис. 2.3.1).
24
B A
l0
l0
B
A
A′
l
B′
l
Рис. 2.3.1 Рис. 2.3.2 Определение 1. Проекцией вектора, лежащего на оси, на эту ось называется число, по абсолютной величине равное длине вектора и взятое со знаком плюс, если направление вектора совпадает с направлением оси, и со знаком минус, если они противоположны. Пусть вектор AB не лежит на оси l . Из точек A и B опустим перпендикуляры на ось l . Получим соответственно две точки A ′ и B ′ (рис. 2.3.2). Вектор A′B ′ называется компонентой вектора AB по оси l . Определение 2. Проекцией вектора, не лежащего на оси l , на эту ось называется проекция его компоненты по оси l на эту же ось. Проекция вектора на ось обычно обозначается так: прl AB . Очевидно, если вектор AB лежит на оси l , то можно написать: AB = ( прl AB ) ⋅ l 0 2 Компоненты вектора по координатным осям и координаты точки Поместим начало вектора a в начало декартовой системы координат O xy z (его конец – точка A ). Спроектируем точку A на координатные оси. Получим соответственно три точки A 1 , A 2 , A 3 (рис. 2.3.3).
uuuur uuuur uuuur Как было отмечено, векторы O A 1 , O A 2 , O A 3 , лежащие на координатных
осях O x , O y и O z , являются компонентами вектора a по координатным осям. Обозначим через a x , a y и a z – проекции вектора a на координатные
uuuur uuuur uuuur O A1 = a x i , O A 2 = a y j, O A3 =az k , uuur uuuur uuuuur uuuur uuuur uuuur uuuur O A = O A 1 + A 1A 2′ + A 2′A = O A 1 + O A 2 + O A 3 , то a = a x i + a y j + a z k . оси.
Ясно,
что
т.к.
Такое представление вектора a называется разложением его на компоненты, или ur составляющие по координатным осям. Нетрудно заметить, что вектор a лежит на диагонали параллелепипеда, следовательно, можно найти его длину, т.е. a = a x2 + a y2 + a z2 . Проекции вектора a на координатные оси, т.е. числа a x , a y и a z , являют-
ur
ся координатами вектора a
и записываются так: a = a(a x ,a y ,a z ) или
a = {a x ,a y ,a z } .
25
z
z
A3 A
k 0 i A1 x
j
A2 rx i
rz k k 0 i rx i
y
A 2′
M
r
ry j
j
y
x
uuuuur Рис. 2.3.3 Рис. 2.3.4 Рассмотрим теперь некоторую точку M в пространстве. Вектор r = O M называется радиус-вектором точки M (рис 2.3.4). Проекции r x , r y , r z радиус-вектора точки M на координатные оси называются координатами точки M в данной системе координат, и при этом их обозначают просто x , y и z , т.е. точка M имеет координаты x , y и z , записывают так: M (x , y , z ) . §4 Теоремы о проекциях вектора. Определение 1. Углом между вектором a и осью l называется наименьший угол между направлением вектора a и положительным направ^
лением оси l , обозначается (a , l ) . Теорема 1. Проекция вектора на ось равна произведению длины вектора на косинус угла между вектором и осью. Доказательство. Пусть угол θ острый, тогда прl AB = AB ⋅ cos θ . Если же θ тупой (рис. 2.4.1), то ясно, что прl A′B ′ = AB ⋅ cos θ .
B
z
γ
A B1
θ B′
β
0 A′
α l
y
Замечание (о направляющих косинусах вектора). x Рис. 2.4.2 Косинусы угловРис. α , β2.4.1 и γ , которые вектор a образует с координатными осями O x , O y и O z соответственно, называются направляющими косинусами вектора a (рис. 2.4.2). Если a x , a y , a z проекции вектора a на координатные оси, то ясно, что имеют место формулы 26
ax ⎫ a ⎪⎪ a x = a ⋅ cosα ⎫ ⎪ ⎪ a y = a ⋅ cos β ⎬ => cos β = a y ⎪ => cos 2 α + cos 2 β + cos 2 γ = 1 . ⎬ a ⎪ ⎪ a z = a ⋅ cos γ ⎭ a ⎪ cos γ = z ⎪ a ⎪⎭ cos α =
B
a A
b
z C
A
ra l
0
0
A′
B′ C ′
l
a rb
B y
x
Рис. 2.4.4 Рис. 2.4.3 Теорема 2. Проекция суммы векторов на ось равна сумме проекций этих векторов на эту же ось, т.е. прl (a + b) = прl a + прl b . Доказательство. A′B ′ = ( прl AB ) ⋅ l 0 ; B ′C ′ = ( прl BC ) ⋅ l 0 ; A′C ′ = ( прl AC ) ⋅ l 0 С другой стороны (рис. 2.4.3), A′C ′ = ( прl a) ⋅ l 0 + ( прl b) ⋅ l 0 = ( прl a + прl b) ⋅ l 0 . Сравнивая правые части равенств (1) и (2), получаем прl (a+ b) = прl a + прl b . Пример 1. Найти координаты вектора AB и его длину, если известны координаты его начала A (x A , y A , z A ) и конца B (x B , y B , z B ) – (рис. 2.4.4). Решение. Проведем радиус-векторы точек A и B: r1 и r2 . Ясно, что rA = x A i + y A j + z A k ; rB = x B i + y B j + z B k
uuuur A B = rB − rA = (x B − x A )i + (y B − y A ) j+ (z B − z A )k .
Итак, чтобы найти координаты вектора, нужно из координат его конца вычесть соответственно координаты начала. Мы получили ранее, что если a = (a x ,a y ,a z ) , то a = a x2 + a y2 + a z2 . Сле-
uuuur довательно, A B = (x B − x A )2 + (y B − y A )2 + (z B − z A )2 . Заметим, что по этой формуле удобно вычислять расстояние между двумя точками, если известны их координаты. Теорема 3. При умножении вектора a на число λ его проекция на ось также умножается на это число, т.е. прl (λ a) = λ ⋅ прl a . (Без доказательства). 27
Теорема 4. Для того чтобы два вектора были равны, необходимо и достаточно, чтобы их проекции на любую ось были равны. (Доказать самостоятельно). Пример 2. Даны точки A(1, –1,2) и B(3,2,3) (рис 2.4.5) Найти: 1. Координаты вектора AB ; 2. Длину вектора AB ; 3. Разложение вектора AB на составляющие; 4.Направляющие косинусы вектора AB ;5. Единичный вектор (орт), соответствующий вектору AB . Решение 1. Принимая во внимание предыдущий пример, получим: x B − x A = 2 , y B − y A = 3 , z B − z A = 1. Итак AB( 2,3,1) .
uuuur
2. Напомним, что a = a x2 + a y2 + a z2 , значит A B = 22 + 32 + 12 = 14 . 3. Так как a = a x i + a y j + a z k , то AB = 2 i + 3 j+ k . 4. Напомним, что a x = a cosα , a y = a cos β , a z = a cos γ , где α , β , γ – углы, которые вектор AB составляет с координатными осями O x , O y , O z . Как известно, cos α , cos β , cos γ называются направляющими косинусами вектора a . В нашем случае
cosα =
2 3 1 , cos β = , cos γ = . 14 14 14
5. Единичный вектор a 0 , соответствующий вектору a , равен a 0 = ким образом a 0 (
a . Таa
2 3 1 2 3 1 , , ) или a 0 = i+ j+ k . Нетрудно от14 14 14 14 14 14
метить, что координаты единичного вектора совпадают с его направляющими косинусами.
C
B (3, 2, 3)
a0 A (1, −1, 2)
A
B
uuuur Рис. 2.4.5 Рис. 2.4.6 Пример 3. Дан вектор A B = i + j+ 2 k и координаты точек B (1, 2, −1) ,
uuuur C ( 2, 2, 5) . Найти координаты вектора A C . (рис. 2.4.6) uuuur uuuur Решение. Найдем координаты вектора B C : B C = {1, 0, 6} . uuuur uuuur uuuur A C = A B + B C = (i + j+ 2 k) + (i + 6 k) = 2 i + j+ 8 k uuuur Итак A C = {2,1, 8} .
Пример 4. Выяснить, при каких значениях параметров λ и μ вектора a = λ i + 2 j + 3k и b = i + j + μk коллинеарны. 28
Решение. Напомним, что два вектора a и b коллинеарны, если они лежат на параллельных прямых или на одной прямой, а тогда, как было отмечено выше, они линейно зависимы. Следовательно, существует некая константа c такая, что имеет место соотношение a = c ⋅ b . Откуда следует, что λ i + 2 j + 3k = c (i + j + μ k) . Значит (λ − c )i + ( 2 − c )j + (3 − c μ )k = 0 . Так как векторы i , j , k линейно независимы, ибо они представляют собою базис, то должны обращаться в ноль коэффициенты этой линейной комбинации, т.е.
λ −c = 0 ⎫
⎪ 2 −c = 0 ⎬. 3 − c μ = 0 ⎪⎭ Из второго уравнения имеем c = 2 ; подставляя его в первое и третье 3 уравнения, получим значения интересующих нас констант: λ = 2 , μ = . 2 §5 Скалярное произведение и его свойства. 1 Определение скалярного произведения Определение. Скалярным произведением a⋅ b двух ненулевых векторов a и b называется число, равное произведению длин этих векторов на косинус угла между ними, т.е. ∧
a ⋅ b = a ⋅ b ⋅ cos(a,b) . Если хотя бы один из векторов равен нулю, то скалярное произведение этих векторов равно нулю (по определению). ∧
2
Если a = b , то a ⋅ a = a , так как cos(a,a) = 1 . Отсюда следует, что a = a ⋅ a . Заметим, что скалярное произведение a ⋅ a называется скалярным квад2
ратом и обозначается a2 . Следовательно, a 2 = a ⇒ a = a 2 . Заметим, что иногда скалярное произведение обозначают (a,b) . Свойства скалярного произведения 1) скалярное произведение можно определить через проекцию a⋅ b = a ⋅ прa b = b ⋅ прb a . ∧
∧
Действительно, прab = b ⋅ cos(a,b) , но a ⋅ b = a ⋅ b ⋅ cos(a,b) = a ⋅ прa b , отсюда можно получить также прab = 2) коммутативность:
a⋅b . a
a⋅b = b⋅a. 29
∧
∧
Это свойство очевидно, так как cos(a,b) = cos(b,a) . 3) ассоциативность относительно числового множителя λ :
(λa) ⋅ b = a ⋅ (λb) = λ (a ⋅ b).
4) дистрибутивность относительного сложения векторов: a ⋅ (b + c) = a ⋅ b + a ⋅ c . Доказательство.
ur r r ur a ⋅ (b + c ) = a ⋅ прa (b + c) = a ⋅ ( прa b + прa c) = a ⋅ прa b + a ⋅ прa c = a⋅ b+ a⋅ c
Следствие. (a + b) ⋅ (c + d) = a ⋅ c + b ⋅ c + a ⋅ d + b ⋅ d . 2 Необходимое и достаточное условие ортогональности двух векторов Напомним, что два ненулевых вектора a и b называются ортогональными, если они образуют прямой угол, т.е. ∧
(a,b) =
π
2
.
Теорема. Для того чтобы два ненулевых вектора были ортогональны, необходимо и достаточно, чтобы их скалярное произведение обращалось в нуль. Доказательство. Необходимость. Пусть векторы a и b ортогональны, тогда ∧
cos(a,b) = 0 => a ⋅ b = 0 . Достаточность. Пусть a ⋅ b = 0 . Так как векторы ненулевые, то отсюда ∧
следует, что cos(a,b) = 0 , а это и означает, что векторы a и b ортогональны. 3 Скалярное произведение векторов, заданных своими координатами
a = (a x ,a y ,a z ) , b = (bx ,by ,bz ) . i ⋅ j = j⋅ i = 0; i ⋅k = k ⋅ i = 0; j⋅k = k ⋅ j = 0 . Пусть
Очевидно,
что
i 2 = j2 = k 2 = 1;
В силу свойства 4 получим
a ⋅ b = (a x i + a y j + a z k) ⋅ (bx i + by j + bz k) = a xbx + a y by + a z bz .
В частности,
a = a 2 = a x2 + a 2y + a z2 . 4 Угол между двумя векторами Если a и b – ненулевые векторы, то, принимая во внимание определе∧
ние вектора и п.4, получим такое выражение для угла (a,b) между векторами a и b:
30
^ a x bx + a y b y + a z b z (a,b) . = arccos (a,b) = arccos a⋅b a x2 + a y2 + a z2 ⋅ bx2 + by2 + bz2 Отсюда нетрудно получить условие ортогональности (перпендикулярности) двух векторов в координатной форме: a xbx + a y by + a z bz = 0 . 5 Механический смысл скалярного произведения Если F – сила, действующая на перемещении S, то работа A этой силы ∧
F ⋅ S cos(F,S) , т.е.
на указанном перемещении, как известно, равна
A = F ⋅ S (рис. 3.5.1).
F
θ
Рис. 3.5.1
S
Даны три точки A ( 2, 3, 5), B (1, 2, 2), C (3, 5, 4) . Найти uuuur uuuur прBuuuur A B и направляющие косинусы вектора A B. C uuuur uuuur Решение. а) A B = { −1, −1, −3} , B C = {2, 3, 2} uuuur uuuur uuuur uuuur uuuur^uuuur A B ⋅ B C ( −1) ⋅ 2 + ( −1) ⋅ 3 + ( −3) ⋅ 2 11 . прBuuuur A B A B = ⋅ = = = − cos uuuu r A B B C ( , ) C 17 BC 22 + 32 + 22 Пример 1.
б) cos α =
−3 −1 −1 ; cos β = ; cos γ = . 11 11 17 ∧
Пример 2. Дан вектор a = m + n , m = n = 2 , m,n =
π 3
. Найти длину век-
тора a . Решение. Найдем скалярный квадрат вектора a : a 2 = (m + n) ⋅ (m + n) . Раскроем скобки, пользуясь свойствами скалярного произведения:
(m + n) ⋅ (m + n) = m 2 + n ⋅ m + m ⋅ n + n ⋅ n = m 2 + 2m ⋅ n + n 2 =
31
∧
2
2
= m + 2 m ⋅ n cos(m,n) + n = 4 + 2 ⋅ 2 ⋅ 2 ⋅ cos
π 3
+ 4 = 8 + 8⋅
1 = 12 . 2
a = a 2 = 12 . Пример 3. При каком значении α векторы a = i + 2 j + k и b = 2i + α j + 2k ортогональны. Решение. Принимая во внимание условие ортогональности двух векторов a x bx + a y by + a z bz = 0 , получим 1 ⋅ 2 + 2 ⋅ α + 1 ⋅ 2 = 0 . Следовательно α = −2 .
§6 Векторное произведение и его свойства. 1 Определение векторного произведения Определение. Векторным произведением a × b ненулевых векторов a и b называется такой вектор c , который удовлетворяет трем условиям: ∧
1. c = a ⋅ b ⋅ sin(a,b) , т.е. длина вектора c = a × b численно равна площади параллелограмма, построенного на этих векторах. r 2. Вектор c перпендикулярен плоскости, в которой лежат векторы a и b. 3. Тройка a , b , c – правая (рис. 2.6.1). Если хотя бы один из векторов a и b нулевой, то по определению a × b = 0 . Заметим, что иногда векторное произведение двух векторов a и b обозначается символом [a;b] .
c b
a Рис. 2.6.1
32
Свойства векторного произведения 1) коммутативность: a × b = −b × a . Это очевидно, так как при перестановке векторов изменится ориентация тройки. 2) ассоциативность относительно числового множителя λ : λ (a × b) = (λa) × b = a × (λb) . (без доказательства) 3) дистрибутивность относительно сложения векторов: a × (b + c) = a × b + a × c . Следствие. (a + b) × (c + d) = a × c + b × c + a × d + b × d . То есть скобки можно раскрывать, как при обыкновенном умножении, не переставляя при этом местами сомножители. 2 Необходимое и достаточное условие коллинеарности двух ненулевых векторов Теорема. Для того чтобы два ненулевых вектора a и b были коллинеарны, необходимо и достаточно, чтобы их векторное произведение было бы равно нулю. Доказательство. Необходимость. Пусть векторы a и b коллинеарны, тогда они лежат на ∧
одной прямой, следовательно, sin(a,b) = 0 => a × b = 0 . Значит, a × b = 0 Достаточность. Пусть векторное произведение a × b = 0 . Так как a ≠ 0 , ∧
∧
∧
b ≠ 0 , то значит sin(a,b) = 0 , т.е. (a,b) = 0 или (a,b) = π , а это означает, что векторы a и b коллинеарны. Замечание. Заметим, что если два вектора a(a x ,a y ,a z ) и b(bx ,by ,bz ) коллинеарны, то существует такое число λ , при котором a = λb , т.е. a x i + a y j + a z k = λ (bx i + by j + bz k) =>
a x = λbx ⎫ a a a ⎪ => a y = λby ⎬ => x = y = z . bx b y b z ⎪ a z = λbz ⎭ Итак, мы доказали, что если два вектора коллинеарны, то их координаты пропорциональны. 3 Векторное произведение векторов, заданных своими координатами Заметим, что i × i = j × j = k× k = 0 . Далее очевидно, что i × j = k , j × k = i , k × i = j , j × i = −k , k × j = − i , i × j = − j . Применяя свойство 3, перемножим векторно векторы a = a x i + a y j + a z k и b = bx i + by j + bz k 33
a × b = (a x i + a y j + a z k) × (bx i + by j + bz k) = a x bx i × i + a y bx j × i + a z bx k × i + +a xby i × j + a y by j × j + a z by k × j +a x bz i × k + a y bz j × k + a z bz k × k = i = (a y bz − a z by )i − (a x bz − a z bx ) j+ (a x by − a y bx )k = a x
j ay
k az .
bx
by
bz
4 Механический смысл векторного произведения Если сила F поворачивает тело вокруг оси l , то момент M силы F , как известно, равен M = r × F (рис. 2.6.2).
l
c = AB × AC С
F
0
c
r
0
A −c0
B
Рис. 2.6.2 Рис. 2.6.3 Пример 1. 1. Найти площадь треугольника с вершинами в точках A ( −1,1, 2) , B ( 2, 3, 2) и C (1, 2, −1) ; 2. Найти единичный вектор, перпендикулярный к плоскости, в которой лежат точки A , B и C . Решение. uuuur
uuuur
1. A B (3, 2, 0) , A C ( 2,1, −3) ,
i j uuuur uuuur A B ×A C = 3 2
k 2 0 3 0 3 2 0 = (−1)1+1 i + (−1)1+2 j + (−1)1+3 k = 1 −3 2 −3 2 1 2 1 −3 = −6 i + 9 j− k uuuur uuuur A B × A C = ( −6)2 + 92 + ( −1)2 = 118 .
Площадь треугольника равна половине площади параллелограмма, по-
uuuur uuuur 118 A . строенного на векторах B и A C , следовательно S ΔA B C = 2 uuuur uuuur 2. В силу определения векторного произведения вектора c = A B × A C , два вектора 34
±c 0 = ±
−6i + 9 j − k 118
удовлетворяют поставленной задаче (рис. 2.6.3).
§7 Смешанное произведение трех векторов. 1 Определение смешанного произведения Определение. Смешанным произведением ненулевых векторов a , b , c называется скалярное произведение вектора a и векторного произведения вектора b на вектор c , т.е. выражение a ⋅ (b × c) . 2 Необходимое и достаточное условие компланарности трех векторов Теорема. Для того чтобы ненулевые векторы a , b и c были компланарны, необходимо и достаточно, чтобы их смешанное произведение равнялось нулю. Доказательство. Необходимость. Пусть векторы a , b и c компланарны. Тогда их можно поместить в одной плоскости, и вектор b × c окажется перпендикулярным вектору a , следовательно, их скалярное произведение равно нулю, т.е. a ⋅ (b × c) = 0 . Достаточность. Пусть a ⋅ (b × c) = 0 . Так как векторы ненулевые, то может быть: 1) b × c = 0 , тогда b = λc , следовательно, векторы a , b и c можно поместить в одной плоскости, т.е. они компланарны; 2) b × c ≠ 0 , но a ⋅ (b × c) = 0 => a ⊥ (b × c) . Это значит, что вектор a лежит в одной плоскости с векторами b и c. 3 Геометрический смысл смешанного произведения Предположим, что векторы a , b и c некомпланарны. Построим параллелепипед на этих векторах, принимая за основание параллелограмм, построенный на векторах b и c (рис. 2.7.1). 1) Пусть a , b , c – правая тройка. Тогда угол между векторами a и (b× c) острый, т.е. векторы a и (b× c) лежат в одном полупространстве относительно плоскости, которая проходит через векторы b и c.
b×c
h
a c
b 35
Рис. 2.7.1
^ Очевидно, что a ⋅ cos(a , (b× c)) = прb×c a = h дает нам высоту параллелепипеда, следовательно, a ⋅ (b × c) есть не что иное, как объем параллелепипеда, построенного на векторах a , b , с. 2) Если a , b , c – левая тройка, то векторы a и (b× c) будут лежать в ^ разных полупространствах, а тогда a ⋅ cos(a , (b× c)) = −h , следовательно, a ⋅ (b × c) будет равно объему параллелепипеда, взятому со знаком минус. Итак, объем параллелепипеда v = ±a ⋅ (b × c) или v = a ⋅ (b × c) . Вывод. Абсолютная величина смешанного произведения трех ненулевых векторов дает нам объем параллелепипеда, построенного на этих векторах. Свойства смешанного произведения 1) a ⋅ (b × c) = b ⋅ (c × a) = c ⋅ (a × b) . То есть смешанное произведение не меняется при циклической перестановке перемножаемых векторов. Действительно, каждое произведение имеет один и тот же модуль в силу геометрического смысла смешанного произведения. Знаки их также совпадают, так как ориентация тройки не меняется при циклической перестановке векторов. 2) a ⋅ (b × c) = −a ⋅ (c × b) . Действительно, при перестановке двух соседних векторов модуль смешанного произведения не меняется, а знак меняется на противоположный, так как тройка меняет свою ориентацию. 3) a ⋅ (b × c) = c ⋅ (a × b) = (a × b) ⋅ c . Действительно, в силу первого свойства: a ⋅ (b × c) = c ⋅ (a × b) . С другой
c ⋅ (a × b) = (a × b) ⋅ c , откуда и следует окончательно: a⋅ (b× c) = (a× b) ⋅ c . Поэтому иногда смешанное произведение обозначают (a, b, c) .
стороны,
4) Если a = (a x ,a y ,a z ) , b = (bx ,by ,bz ) , c = (c x ,c y ,c z ) , то
36
ax ay az (a,b,c) = bx by bz . cx cy cz
(
)
⎛ by bz bx bz bx by ⎞ ;− ; ⎟⎟ = c c c c c y z x y x z ⎝ ⎠
Действительно, a ⋅ (b × c) = a x ,a y ,a z ⋅ ⎜⎜ c
=ax ⋅
ax ay az bx by bx bz −ay +az = bx by bz . cz cx cy cx cz cx cy cz
by bz cy
37
§8 Двойное векторное произведение. Определение. Двойным векторным произведением трех ненулевых векторов a , b и c называется вектор a × (b × c) ; если хотя бы один из def
векторов a , b или c равен нулю, то a × (b × c) = 0 . Итак, мы видим, что двойное векторное произведение представляет собою векторную величину. Заметим, что объекты типа a × (b × c) часто встречаются в физике и механике. Выведем простую форму для вычисления двойного векторного произведения. Итак, допустим, что нам известны координаты векторов, т.е. a = a x i + a y j + a z k , b = bx i + by j + b z k , c = c x i + c y j + c z k . Вычислим a × (b × c) . Обозначим v = b × c , u = a × (b × c) = a × v . Найдем вектор v . Известно, что вектор v = b × c выражается через координаты векторов b и c так:
i v = bx cx
j by cy
k bz = (by c z − bz c y )i + (bz c x − bx c z )j + (bx c y − by c x )k , cz
то есть
v x = by c z − bz c y , v y = bz c x − bx c z , v z = bx c y − by c x . В свою очередь, аналогично
u = a × v = (a y v z − a z v y )i + (a z v x − a x v z )j + (a x v y − a y v x )k .
Подставим в правую часть этого равенства полученные выражения для v x , v y и v z и, кроме того, выполним искусственное преобразование, добавив и отняв к правой части выражения a x bx c x i , a y by c y j , a z bz c z k . Получим:
u = a × (b × c) = [a ybxcy − a ybyc x − a zbzcx + a zbxc z ]i + [a zbyc z − a zbzcy − a xbxcy +a xbyc x ]j + [a xbzcx − a xbxc z − a ybyc z + a ybzcy ]k + a xbxcx i − a xbxcx i + a ybycy j − −a ybycy j + a zbzc z k − a zbzc z k = bx (a ycy + a zc z )i + a xbxcx i + by (a zc z + a xcx )j + +a ybycy j + bz (a xcx + a ycy )k + a zbzc z k − [c x (a yby + a zbz )i + a xbxcx i + cy (a zbz + +a xbx )j + a ybycy j + c z (a xbx + a yby )k + a zbzc z k] = (bx i + by j + bz k)(a xc x + a ycy + +a zc z ) − (cx i + cy j + c z k) ⋅ (a xbx + a yby + a zbz ) = b(a ⋅ c) − c(a ⋅ b) 38
Итак, получили: a × (b × c) = b(a ⋅ c) − c(a ⋅ b) . Отметим, что справа в скобках стоят числа, равные скалярным произведениям a ⋅ c и a ⋅ b ; они являются коэффициентами линейной комбинации векторов b и c , через которые выражается двойное векторное произведение a × (b × c) . Нетрудно заметить, что двойное векторное произведение представляет собою вектор, который лежит в той же плоскости, что и векторы b и c , т.е. векторы a × (b × c) , b и c компланарны. Остановимся теперь на вычислении выражения (a × b) × c , которое, вообще говоря, также является двойным векторным произведением. Действительно:
(a × b) × c = −c × (a × b) = −[a(c ⋅ b) − b(c ⋅ a)] = b(a ⋅ c) − a(b ⋅ c), т.е. (a × b) × c представляет собою вектор, лежащий в одной плоскости с векторами a и b . Очевидно также, что a × (b × c) ≠ (a × b) × c . Другие свойства двойного векторного произведения нетрудно проанализировать, принимая во внимание свойства скалярного и векторного произведения. Пример 1. Показать, что точки A (1, 2,1) , B (3, 3, 3) , C ( 4,1, 2) и D (5, 4, 5) лежат в одной плоскости. uuuur uuuur uuuur Решение. Найдемuuuu координаты векторов A Buuuu , rA C и A D . r uuuur A B ( 2,1, 2) , A C (3, −1,1) , A D ( 4, 2, 4) . Если точки A , B , C и D лежат в одной плоскости, то и векторы лежат в одной плоскости (рис. 2.8.1), а тогда смешанное произведение этих векторов равно нулю.
B C
A
D Рис. 2.8.1 Действительно,
2 1 2 ( AB , AC , AD ) = 3 −1 1 = 0, 4 2 4 т.к. первая и вторая строки определителя пропорциональны. Пример 2. Доказать, что векторы a = i + j + 2k , b = 3i + 4 j + k c = i + 2 j − 3k линейно зависимы и найти эту линейную зависимость. Решение.
39
и
1 1 2 ( a , b , c )= 3 4 1 =0, 1 2 −3 следовательно, векторы a , b и c компланарны, а значит, они линейно зависимы, т.е. существуют константы λ , μ и ν такие, что λ a + μ b + ν c , т.е. λ (i + j+ 2 k) + μ (3 i + 4 j+ k) + ν (i + 2 j− 3 k) = 0 , откуда следует: (λ + 3μ + ν )i + (λ + 4μ + 2ν ) j+ ( 2λ + μ − 3ν )k = 0 , т.к. i , j , k – базисные векторы, то имеем такую систему для нахождения λ , μ и ν :
λ + 3μ +ν = 0 ⎫ λ + 3μ +ν = 0⎫ λ = 2ν ⎫ ⎪ ⎪ λ + 3μ +ν = 0⎫ λ + 4μ + 2ν = 0⎬ ⇒ μ +ν = 0 ⎬⇒ ⎬ ⎬ ⇒ λ − 3ν + ν = 0 ⇒ μ = −ν ⎭ μ = −ν ⎭ ⎪ ⎪ 2λ + μ − 3ν = 0 ⎭ −5μ − 5ν = 0 ⎭ Здесь ν выступает в качестве параметра, и данная система имеет бесчисленное множество решений. Подставим λ = 2ν , μ = −ν в указанную выше линейную комбинацию: 2ν a − ν b + ν c = 0 . Сократим на ν ≠ 0 . Получим искомую линейную зависимость 2a − b + c = 0 .
40
Глава 3 Элементы теории аналитической геометрии Прежде чем приступить к изучению конкретных геометрических объектов и их свойств, заметим, что аналитическая геометрия главным образом рассматривает уравнения этих объектов в координатном пространстве R 3 (или R 2 ), т.е. в некоторой трехмерной декартовой системе координат O xy z (или O xy ). Причем, под уравнениями геометрических объектов (прямой линии, плоскости, конуса, гиперболы, окружности и т.п.) мы будем понимать всякое уравнение, устанавливающее связь между координатами (x , y , z ) всех точек, принадлежащих данному геометрическому объекту. Итак, аналитическая геометрия изучает геометрические объекты и их свойства аналитически, т.е. путем анализа их уравнений.
§1 Плоскость в трехмерном пространстве. Положение плоскости в пространстве можно задать различными способами. Действительно, через три данные точки M 1 , M 2 и M 3 проходит единственная плоскость, через данную точку M 0 (x 0, y 0, z 0 ) перпендикулярно данному вектору n(A , B ,C ) можно провести единственную плоскость и т.п. 1 Векторное уравнение плоскости. Общее уравнение плоскости Рассмотрим некоторую плоскость P и точку M (x , y , z ) на этой плоскости, так называемую текущую точку плоскости. Пусть кроме этого определен вектор n(A , B ,C ) – нормаль к плоскости и некоторая точка
M 0 (x 0, y 0, z 0 ) – фиксированная точка на этой плоскости. Обозначим через r0 и r – радиус векторы точек M 0 и M 1 (рис. 3.1.1).
41
z
n
0 x
M 0 (x 0 , y 0 , z 0 ) M (x , y , z ) r0 P r
y
Рис. 3.1.1
uuuuuur
Очевидно, что вектор M 0M = r − r0 лежит в плоскости. Ясно также, что
uuuuuur
векторы M 0M и n перпендикулярны, следовательно, их скалярное произведение равно нулю, т.е. (r − r0 ) ⋅ n = 0 , (1) Уравнение (1) называется уравнением плоскости в векторной форме. Выражая скалярное произведение через координаты перемножаемых векторов, получим A (x − x 0 ) + B (y − y 0 ) + C (z − z 0 ) = 0 . (2) Уравнение (2) называется уравнением плоскости, проходящей через данную точку. Обозначая через D выражение −A x 0 − B y 0 − C z 0 , запишем уравнение (2) в виде:
A x + B y +C z + D = 0
(3)
Уравнение (3) называется общим уравнением плоскости. Заметим, что общее уравнение плоскости линейно относительно переменных x , y , z . Можно доказать и обратное, что всякому линейному уравнению вида (3) в пространстве соответствует плоскость. Подчеркнем, что коэффициенты A , B ,C при переменных x , y , и z дают нам ни что иное, как координаты вектора, перпендикулярного данной плоскости P , т.е. нормали к плоскости P. 2 Угол между плоскостями. Взаимное расположение двух плоскостей в пространстве Угол между двумя плоскостями измеряется наименьшим углом между нормалями к ним. Следовательно, если даны две плоскости P1 : A 1x + B 1y + C 1z + D 1 = 0 и P 2 : A 2x + B 2y + C 2z + D 2 = 0 , то угол ϕ между ними можно вычислить из соотношения:
n1 ⋅ n 2 = n1 ⋅ n 2 ⋅ cos ϕ . Отсюда следует: cos ϕ =
A 1A 2 + B 1B 2 + C 1C 2 A 12 + B 12 + C 12 ⋅ A 2 2 + B 2 2 + C 2 2
42
.
Интересны частные случаи взаимного расположения двух плоскостей в пространстве. 3 Условие параллельности двух плоскостей Если две плоскости параллельны, то нормали к ним коллинеарны. Следовательно, условие параллельности двух плоскостей имеет вид:
A1 B 1 C 1 = = . A2 B2 C 2
(4)
4 Условие перпендикулярности двух плоскостей Если две плоскости перпендикулярны, то перпендикулярны и нормали к ним, т.е. n1 ⋅ n 2 = 0 , откуда следует
A 1A 2 + B 1B 2 + C 1C 2 = 0 .
(5)
Заметим, что условия (4) и (5) не только необходимы, но и достаточны для параллельности и перпендикулярности двух плоскостей соответственно. Пример 1. Найти уравнение плоскости, проходящей через точку M 0 (1,1, 2) и параллельной данной плоскости P : x + 2y − z + 3 = 0 (рис. 3.1.2). Решение. Искомая плоскость параллельна данной, следовательно, нормаль к плоскости P n(1, 2, −1) является нормалью также и к искомой плоскости (рис. 3.1.2), а тогда, принимая во внимание уравнение (2) – уравнение плоскости, проходящей через данную точку, получим уравнение искомой плоскости:
1 ⋅ (x − 1) + 2 ⋅ (y − 1) − 1 ⋅ (z − 2) = 0.
Или, раскрывая скобки и приводя подобные члены, окончательно получаем общее уравнение искомой плоскости: x + 2y − z − 1 = 0 .
43
n3
.M 0 (1,1, 2)
P3
.M 0
n(1, 2, −1) P
n1 P1 Рис. 3.1.2
n2 P2
Рис. 3.1.3
Пример 2. Найти уравнение плоскости, проходящей через данную точку M 0 (1,1, 2) и перпендикулярную к двум данным плоскостям: P1 : x + 2y − z + 3 = 0 и P 2 : 2x − y − 2z − 1 = 0 (рис. 3.1.3). Решение. Обозначим искомую плоскость P 3 . Нам известна точка M 0 (1,1, 2) , ей принадлежащая, значит, мы можем написать уравнение плоскости, проходящей через точку M 0 (уравнение (2)): A (x − 1) + B (y − 1) + C (z − 2) = 0 . В качестве нормали n3 мы можем взять вектор n3 = n1 × n 2 , т.к. в силу определения векторного произведения вектор n3 перпендикулярен как к вектору n1 (1, 2, −1) , так и к вектору n 2 ( 2, −1, −2) . Вычисляем i j k n 3 = n1 × n 2 = 1 2 −1 . 2 −1 −2 Разложим данный определитель по элементам первой строки, тогда будет:
2 −1 1 −1 1 2 + j⋅ ( −1)1+ 2 ⋅ + k⋅ ( −1)1+3 ⋅ = −5 i − 5 k . 2 −2 2 −1 −1 −2 т.е. n3 ( −5, 0, −5) . Изменим на нормали n3 направление (так проще), т.е. возьмем n3 (5, 0, 5) . Возьмем в качестве n3 коллинеарный вектор n 4 (1, 0,1) .
n3 = i⋅ ( −1)1+1 ⋅
Тогда уравнение искомой плоскости 1 ⋅ (x − 1) + 0 ⋅ (y − 1) + 1 ⋅ (z − 2) = 0 . x +z −3= 0. Окончательно: Пример 3. Найти уравнение плоскости, проходящей через точки M 1 (1,1, −1) , M 2 ( 2,1, 2) и M 3 (3,1, −1) (рис 3.1.4). Решение. В качестве нормали к искомой плоскости можно взять вектор uuuuuuur uuuuuuu r n = M 1M 2 × M 1M 3 .
uuuuuuur uuuuuuur Очевидно, что M 1M 3 = {2, 0, 0} , M 1M 2 = {1, 0, 3} . 44
Найдем
i j k a = 1 0 3 = 6 j. 2 0 0 Искомая плоскость 0(x − 1) + 6(y − 1) + 0(z + 1) = 0 . Окончательно получим уравнение искомой плоскости y = 1 .
n
M2
P3
M3 P
M1
P2
M
P1
Рис. 3.1.4
Рис. 3.1.5
Пример 4.
Найти точку пересечения трех плоскостей: P1 : x + y + z − 3 = 0 , P 2 : 2x − y − z = 0 и P 3 : x + 2y − z − 2 = 0 (рис. 3.1.5). Решение. Координаты точки пересечения плоскостей удовлетворяют каждому из уравнений плоскости, следовательно решение задачи сводится к нахождению решения системы трех алгебраических уравнений:
x +y +z = 3 ⎫ ⎪ 2x − y − z = 0 ⎬ . x + 2y − z = 2 ⎪⎭ Найдем решение этой системы по формулам Крамера:
Δy Δ Δ ,z = z . x= x ,y = Δ Δ Δ 1 1 1 1 1 1 1 1 = 9; Имеем Δ = 2 −1 −1 = 3 0 0 = 3 ⋅ ( −1)2+1 ⋅ 2 −1 1 2 −1 1 2 −1 3
1
1
3
0
0
−1 −1 Δx = 0 −1 −1 = 0 −1 −1 = 3 ⋅ ( −1)1+1 ⋅ = 9; 2 −1 2 2 −1 2 2 −1 1 3
1
3
3
0
3 3 Δy = 2 0 −1 = 2 0 −1 = ( −1) ⋅ ( −1)2+3 ⋅ = 9; −1 2 1 2 −1 −1 2 0
45
1 1 3 3 Δz = 2 −1 0 = 2 1 2 2 5 Окончательно получим x = 1 , y
0 3 3 3 −1 0 = ( −1) ⋅ ( −1)2+ 2 ⋅ = 9. 5 2 0 2 = 1 , z = 1. Итак, точка пересечения плоскостей M (1,1,1) .
Пример 5. Найти уравнение плоскости, проходящей через точку M 0 (1, −1, −1) и линию пересечения плоскостей (рис. 3.1.6) P1 : x + y + z − 3 = 0 и P 2 : 2x + y − z − 2 = 0 . (6) Решение. Возьмем на линии пересечения плоскостей две какие-нибудь (любые) различные точки M 1 (x 1 , y 1 , z 1 ) и M 2 (x 2 , y 2 , z 2 ) так, чтобы координаты этих точек удовлетворяли системе двух уравнений (6). Эта система содержит два уравнения с тремя неизвестными, значит она имеет бесчисленное множество решений (это есть множество точек, лежащих на линии пересечения плоскостей l ). Зафиксируем в этой системе переменную z , положив, например, z 1 = 0 , тогда получим
x1 + y 1 = 3 ⎫ ⎬ => x 1 = −1 , y 1 = 4 . 2x 1 + y 1 = 2 ⎭ Итак, мы нашли точку M 1 ( −1, 4, 0) . Положим теперь z 2 = 1 , тогда имеем:
x2 +y 2 = 2 ⎫ ⎬ => x 2 = 1 , y 2 = 1 . 2x 2 + y 2 = 3⎭ Получим вторую точку M 2 (1,1,1) . Введем в рассмотрение векторы uuuuuuur uuuuuuur M 0M 1 = −2i + 5 j + k , M 0M 2 = 2 j + 2k . Теперь можно найти нормаль к искоuuuuuuur uuuuuuur мой плоскости P : n = M 0M 1 × M 0M 2 ,
i j k n = −2 5 1 = 8i + 4 j − 4k . 0 2 2 Сокращая на 4, возьмем более простое выражение для нормали n = 2i + j − 2k . Теперь остается написать уравнение искомой плоскости P : P : 2(x − 1) + 1(y + 1) − 2(z + 1) = 0 . Окончательно общее уравнение искомой плоскости: 2x + y − 2z − 3 = 0 .
46
l
z
S(m , n , p )
M 0 (x 0 , y 0 , z 0 )
r
M1
M0
M2 P1
M (x , y , z )
n
P
P2
r0
0
y
x
Рис. 3.1.6
Рис. 3.2.1
§2 Прямая линия в пространстве. 1 Векторное уравнение прямой Положение прямой линии в пространстве можно задать различными способами. В частности, через данную точку M 0 (x 0 , y 0 , z 0 ) параллельно данному ненулевому вектору S(m , n , p ) можно провести единственную прямую (рис. 3.2.1). Вектор S называется направляющим вектором прямой. Обозначим через r0 радиус-вектор точки M 0 , а через r – радиус-вектор произвольной точки M , лежащей на прямой. uuuuuur Очевидно, что векторы M 0 M и S коллинеарны, но M 0M = r − r0 , следовательно r − r0 = λS . Отсюда (1) r = r0 + λS . Уравнение (1) называется векторным уравнением прямой линии в пространстве. 2 Параметрические и канонические уравнения прямой Запишем уравнение (1) в виде: x i + y j + z k = x 0i + y 0 j + z 0k + λm i + λn j +
+λpk = (x 0 + λm )i + (y 0 + λn )j + (z 0 + λp )k Примем теперь во внимание, что если два вектора равны, то совпадают их координаты в данном базисе i , j , k :
x = x 0 + λm ⎫ ⎪ y = y 0 + λn ⎬ . z = z 0 + λ p ⎪⎭
(2)
Уравнения (2) называются параметрическими уравнениями прямой. Здесь в качестве параметра выступает λ . Придавая λ различные числовые значения из ( −∞, +∞ ) , будем получать на прямой различные точки.
47
Исключая из уравнения (2) параметр λ , получим так называемые канонические уравнения прямой:
x −x0 y −y0 z −z0 . = = m n p 3 Уравнение прямой, проходящей через две данные точки Пусть даны две различные точки M 1 (x 1 , y 1 , z 1 ) и M 2 (x 2 , y 2 , z 2 ) . Очевидно, что через эти две точки можно провести единственную прямую (рис. 3.2.2). В качестве направляющего вектора этой прямой возьмем вектор
uuuuuuur S = M 1M 2 , а в качестве фиксированной точки можно взять любую из точек M 1 или M 2 . Пусть это будет точка M 1 . Тогда канонические уравнения прямой, про-
ходящей через две данные точки, имеют вид
x − x1 y − y 1 z − z 1 = = . x 2 − x1 y 2 − y 1 z 2 − z 1 M (x , y , z )
l
n
S
M 2 (x 2 , y 2 , z 2 )
ϕ P
M 1 (x 1 , y 1 , z 1 ) Рис. 3.2.2
Рис. 3.2.3
4 Угол между двумя прямыми. Взаимное расположение двух прямых в пространстве Определение. Углом между двумя прямыми называется наименьший угол между их направляющими векторами. Очевидно, что если
x − x1 y − y 1 z − z 1 x −x2 y −y 2 z −z2 = = = = и l2 : , m1 n1 p1 m2 n2 p2 то угол ϕ между прямыми l1 и l 2 можно вычислить из соотношения S ⋅S m 1m 2 + n 1n 2 + p 1p 2 . cos ϕ = 1 2 = S1 ⋅ S 2 m 12 + n 12 + p 12 ⋅ m 2 2 + n 2 2 + p 2 2 l1 :
Если прямые l1 и l 2 параллельны, то их направляющие векторы S1 и S 2 коллинеарны, следовательно, условие параллельности двух прямых имеет вид:
m 1 n 1 p1 = = . m 2 n 2 p2 48
(3)
Если прямые l1 и l 2 перпендикулярны, то S1 ⋅ S 2 = 0 , следовательно, условие перпендикулярности двух прямых имеет вид:
m 1m 2 + n 1n 2 + p 1p 2 = 0 .
(4)
Заметим, что в силу рассмотренных ранее теорий условия (3) и (4) являются необходимыми и достаточными условиями соответственно параллельности и перпендикулярности двух прямых в пространстве. 5 Взаимное расположение прямой и плоскости в пространстве Определение. Углом между прямой и плоскостью называется угол между прямой и ее проекцией на эту плоскость (рис. 3.2.3). Пусть плоскость P задана общим уравнением A x + B y + C z + D = 0 , следовательно, нормаль к ней n = (A , B ,C ) . Прямая задана каноническими уравнениями
x −x0 y −y 0 z −z 0 , по= = m n p
этому направляющий вектор прямой S = (m , n , p ) .В силу определения, если
ϕ – угол между прямой и плоскостью, то sin ϕ =
n ⋅S A m + B n +C p = . n⋅S A 2 + B 2 +C 2 ⋅ m 2 + n 2 + p 2
6 Условие параллельности прямой и плоскости Если прямая параллельна плоскости, то ее направляющий вектор S перпендикулярен нормали n , следовательно, S ⋅ n = 0 , значит, условие параллельности прямой и плоскости имеет вид A m + B n +C p = 0 . (5) 7 Условие перпендикулярности прямой и плоскости Если прямая перпендикулярна плоскости, то ее направляющий вектор коллинеарен нормали к плоскости, следовательно, условие перпендикулярности прямой и плоскости имеет вид:
A B C = = . m n p
(6)
Заметим, что условия (5) и (6) не только необходимы, но и достаточны соответственно для параллельности прямой и плоскости, а также для перпендикулярности прямой и плоскости. Пример 1. Найти канонические уравнения прямой, проходящей через точку M 0 (1, −1, 2) и параллельной данной прямой
l:
x +1 y −1 z (рис. 3.2.4). = = 2 −1 −1 49
Решение. Направляющий вектор данной прямой l есть S = 2i − j − k . Искомая прямая l1 параллельна данной прямой l , значит ее направляющий вектор S1 = S . Фиксированная точка M 0 (1, −1, 2) лежит на искомой прямой. Ее канонические уравнения:
x −1 y +1 z − 2 . = = 2 −1 −1
50
l
S
M0
l1
M0
S1
l
S
S2
l2
S1
l1
Рис. 3.2.5
Рис.3.2.4
Пример 2. Найти канонические уравнения прямой, проходящей через точку M 0 (1, 0, −1) и перпендикулярной к двум данным прямым (рис. 3.2.5)
l1 :
x y −1 z +1 = = 1 2 −1
и l2 :
x −1 y +1 z = = . 1 1 −1
Решение. Вычислим векторное произведение:
i j k S1× S 2 = 1 2 −1 = 3 i + 3 k . −1 1 1 В качестве направляющего вектора прямой l возьмем коллинеарный вектор S(1,0,1) . Канонические уравнения прямой l :
x −1 y z +1 = = . 1 0 1 Пример 3. Найти канонические уравнения прямой, проходящей через точку M 0 (1,1, 2) и перпендикулярной к данной плоскости P : x − 2y − z + 5 = 0 (рис. 3.2.6). Решение. В качестве направляющего вектора искомой прямой можно взять нормаль к данной плоскости n(1, −2, −1) . Искомая прямая l имеет канонические уравнения:
l
x −1 y −1 z − 2 . = = 1 −2 −1
M0
l
S P
S(1, −2, −1)
M1
n
P Пример 4. Найти координаты точки пересечения прямой
l:
x −1 y −1 z − 2 и плоскости P : x + 2y + 3z − 3 = 0 (рис. 3.2.7). = = −2 Рис.−3.2.6 1 1 Рис. 3.2.7
51
Решение. От канонических уравнений данной прямой перейдем к ее параметрическим уравнениям, положив следует
x −1 y −1 z −2 = t . Откуда =t , =t , −1 1 −2
x = t +1 ⎫ ⎪ y = −2t + 1⎬ . z = −t + 2 ⎪⎭ Выясним, при каком значении параметра t данная прямая l и плоскость P пересекаются. Для этого нужно найденные значения x , y и z подставить в уравнение плоскости P : (t + 1) + 2( −2t + 1) + 3( −t + 2) − 3 = 0 . Отсюда следует, что t = 1 , т.е. при значении параметра t = 1 прямая и плоскость пересекаются. Вернем t = 1 в параметрическое уравнение прямой, получим координаты искомой точки
x1 = 1 + 1 = 2
⎫ ⎪ y 1 = −2 ⋅ 1 + 1 = −1⎬ . z 1 = −1 + 2 = 1 ⎭⎪
Итак M 1 ( 2, −1,1) . Пример 5. Найти канонические уравнения линии пересечения плоскостей P1 : x + y = 0 и P 2 : 2x + y − z − 3 = 0 (рис. 3.2.8). Решение. Для того чтобы написать канонические уравнения прямой, мы должны знать точку M 0 на этой прямой и ее направляющий вектор S . 1. Точку M 0 мы найдем, решив систему уравнений
x + y = 0⎫ ⎬. 2x + y − z = 3⎭ Эта система имеет бесчисленное множество решений (множество точек на прямой l ). Нам достаточно найти одну какую-нибудь точку из этого множества. Для этого положим в системе z = z 0 = 0 , тогда для нахождения x 0 и y 0 имеем систему
Итак, M 0 (3, −3, 0) .
x0 +y 0 = 0 ⎫ ⎬ => x 0 = 3 , y 0 = −3 . 2x 0 + y 0 = 3⎭
2. В качестве направляющего вектора S искомой прямой можно взять вектор S = n1 × n 2 . Здесь n1 (1,1, 0) и n 2 ( 2,1, −1) . Вычислим вектор S :
i
j
S= 1 1
k 0 = −i + j − k .
2 1 −1 Итак, уравнения линии пересечения плоскостей P1 и P2 52
x −3 y +3 z = = . 1 −1 −1
n2
l
M0
P2 S
n
n1 l2 P1
l1
P
Рис. 3.2.8
M0
S2
S1
Рис. 3.2.9
Пример 6. Доказать, что данные прямые
l1 :
x −1 y z −1 = = 2 1 −1
l2 :
и
x −1 y z −1 = = 2 −1 1
лежат в одной плоскости и найти уравнение этой плоскости (рис. 3.2.9). Решение. Нетрудно видеть, что прямые проходят через точку M 0 (1, 0,1) , а через две прямые, проходящие через одну точку, можно провести единственную плоскость. В качестве нормали n к искомой плоскости P можно взять n = S1 × S 2 .
i S1 × S 2 = 2
j
k
1 −1 = 3i − 3 j + 3k .
−1 1
2
В качестве нормали n возьмем коллинеарный вектор, т.е. положим n = i − j + k . Тогда искомая плоскость имеет уравнение:
1(x − 1) − 1 ⋅ y + 1(z − 1) = 0 . Итак, окончательно P : x − y + z − 2 = 0 . 8 Прямая линия на плоскости Рассмотрим случай, когда прямая l лежит в плоскости xO y (рис. 3.2.10). Если ее направляющий вектор S = (m , n ) , а M 0 (x 0 , y 0 ) – фиксированная точка на этой прямой, то очевидно, что
x −x0 y −y0 = m n
53
(7)
S(m , n )
y n(A , B )
M 0 (x 0 , y 0 ) r
r0
M (x , y )
0 Рис. 3.2.10
x
есть каноническое уравнение прямой. Из (7) => n (x − x 0 ) = m (y − y 0 ) => nx − m y − nx 0 − m y 0 = 0 . Обозначим n = A 1 , − m = B , −nx 0 − m y 0 = C , тогда уравнение (8) можно (8) записать в виде
A x + B y +C = 0 .
(9)
Уравнение прямой l , лежащей в плоскости, записанное в виде (9), называется общим уравнением прямой на плоскости. Заметим, что это уравнение линейно относительно переменных x и y . Можно доказать и обратное, т.е. что всякому уравнению вида (3) на плоскости соответствует некоторая прямая. Разрешим теперь уравнение (9) относительно y :
y =−
A C A C x− и обозначим − = k , − = b , тогда получим B B B B y = kx + b .
(10)
Нетрудно выяснить значение параметров k и b . Пусть k > 0 и b > 0 . Тогда при x = 0 из (10) получаем y = b , т.е. b есть ордината точки пересечения с осью O y (рис. 11). С другой стороны, из ΔA B C ясно, что
tgϕ =
BC = k , т.е. k – есть тангенс угла, образуемого прямой с осьюO x , AC
который называется угловым коэффициентом этой прямой. Поэтому уравнение прямой в виде (10) называется уравнением прямой с угловым коэффициентом. В частности, если две прямые заданы своими уравнениями с угловым коэффициентом l1 : y = k1x + b1 , l 2 : y = k 2x + b 2 , то нетрудно найти угол между этими прямыми (рис. 3.2.11).
54
y
A
y
B
ϕ x
kx C b
ϕ2
x
0
0 Рис. 3.2.11
l1
θ
l2
ϕ1 Рис. 3.2.12
x
k1 − k 2 . В частности, если прямые па1 + k1k 2 раллельны, то k1 = k 2 , а если они перпендикулярны, то k1 ⋅ k 2 = −1. Ясно, что θ = ϕ1 − ϕ 2 , т.е. tgθ = ±
Пример. Через точку M 0 (1, 3) провести прямую под углом 45° к данной прямой x − 2y = 0 . Решение. Обозначим угловой коэффициент искомой прямой через k 2 ,
1 (рис. 3.2.13). Из 2 условия задачи тангенс угла между этими прямыми tgθ = 1 , с другой сторо1 − k2 k1 − k 2 2 , т.е. 1 = ± . ны, tgθ = ± 1 1 + k1k 2 1 + ⋅k2 2 1 Откуда следует: а) k 2 = 3 ; б) k 2 = − . 3 тогда данная прямая имеет угловой коэффициент k1 =
Теперь нетрудно написать уравнения этих прямых: а) 3x − y = 0 ; б) x + 3y − 10 = 0
y
3x − y = 0 x − 2y = 0 M 0 (1, 3) x + 3y − 10 = 0
x
0
Рис. 3.2.13 9 Прямая линия и гиперплоскость в n-мерном пространстве 55
Обобщим понятие трехмерного пространства на случай n измерений. 0 0 0 Пусть e1 , e 2 , …, en – ортонормированный базис n -мерного пространства, т.е. совокупность попарно ортогональных, а следовательно, линейно независимых единичных векторов. Проведя оси Ox1, Ox2, …, Oxn, через эти орты, получим n -мерную ортогональную систему координат. Тогда очевидно, что положение любой точки этого пространства будет определяться параметрами ( x 1 , x 2 , …, x n ) – координатами вектора. Проводя формально рассуждения, аналогичные изложенным выше, мы можем определить гиперплоскость в n -мерном пространстве, как множество точек, удовлетворяющее уравнению A 1x 1 + A 2x 2 + ... + A n x n + B = 0 , причем вектор (A 1 , A 2 ,..., A n ) интерпретируется как «нормаль» к этой гиперплоскости. Аналогично множество точек n -мерного пространства, удовлетворяющее уравнениям
x − x 10 x − x 20 x − xn 0 , = = ... = n m1 m2 mn
называется «прямой в n -мерном пространстве», а сами уравнения называются каноническими уравнениями этой «прямой», причем вектор S = (m 1 , m 2 ,..., m n ) n -мерного пространства называется направляющим вектором этой прямой, а точка M 0 (x 10 , x 20 ,..., x n 0 ) – фиксированной точкой на этой прямой.
§3 Кривые второго порядка. 1 Эллипс и его свойства Определение. Эллипсом называется множество всех точек плоскости, сумма расстояний от которых до двух данных точек, называемых фокусами, есть величина постоянная, равная 2a (a > 0) . Принимая во внимание определение эллипса, выведем его уравнение. Если определенным образом выбрать систему координат, то можно получить простейшую форму уравнения эллипса, которая называется каноническим уравнением (рис. 3.3.1). Итак, проведем ось Ox через фокусы, от фокуса F1 к фокусу F2 .
56
Рис. 3.3.1 Начало координат возьмем в середине отрезка F1F2 . Если расстояние между фокусами обозначить через 2c (c > 0) , то очевидно, что фокусы имеют координаты F1 ( −c , 0) , F2 (c , 0) . Ось O y направим так, чтобы система xO y была бы правой. Пусть точка M (x , y ) принадлежит эллипсу, векторы r1 и r2 называются ее фокальными радиус-векторами. В силу определения эллипса r1 + r2 = 2a ( a > 0 , a > c ). Отсюда следует:
(x + c )2 + y 2 + (x − c )2 + y 2 = 2a =>
=> (x + c )2 + y 2 = 2a − (x − c )2 + y 2 => => (x + c )2 + y 2 = 4a 2 − 4a (x − c )2 + y 2 + (x − c )2 + y 2 => => x 2 + 2xc + c 2 = 4a 2 − 4a (x − c )2 + y 2 + x 2 − 2xc + c 2 => => 4xc − 4a 2 = −4a (x − c )2 + y 2 => xc − a 2 = −a (x − c )2 + y 2 => => a 4 − 2a 2cx + x 2c 2 = a 2x 2 − 2a 2cx + a 2c 2 + a 2y 2 => => (a 2 − c 2 )x 2 + a 2y 2 = (a 2 − c 2 )a 2 . Обозначим a 2 − c 2 = b 2 , тогда из предыдущего следует: x2 y2 + = 1. a 2 b2
Это уравнение называется каноническим уравнением эллипса. Эллипс пересекает координатные оси в точках A 1 ( −a , 0) , A 2 (a , 0) , B 2 (0,b ) и B 2 (0, −b ) , которые называются вершинами эллипса. Отрезки A1 A2 и B 1B 2 , равные 2a и 2b соответственно, называются большой и малой осями эллипса, a и b – большой и малой полуосями. Эллипс симметричен относительно координатных осей и относительно начала координат. Форму эллипса можно охарактеризовать с помощью эксцентриситета ε =
(0 < ε < 1) .
c a
Чем больше эксцентриситет, тем более вытянутую форму вдоль оси O x имеет кривая. 57
2 Гипербола и ее свойства
Рис. 3.3.2 Определение. Гиперболой называется множество всех точек плоскости, модуль разности расстояний от которых до двух данных точек, называемых фокусами, есть величина постоянная, равная 2a (a > 0) . Проведем ось O x через фокусы, выбрав начало координат в середине отрезка, соединяющего фокусы, длина которого равна 2c (рис. 3.3.2). Фокусы имеют координаты F1 ( −c , 0) , F2 (c , 0) . Ось O y направим так, чтобы система xO y была бы правой. Проведя фокальные радиус- векторы r1 и r2 в некоторую точку M (x , y ) , в силу определения можем написать:
r1 − r2 = 2a . После преобразований, аналогичных выполняемым в п.1, обозначив c − a 2 = b 2 , получим каноническое уравнение гиперболы 2
x2 y2 − = 1. a 2 b2
Гипербола симметрична относительно координатных осей и начала координат, состоит из двух веток, которые пересекаются с осью O x в точках A 1 ( −a , 0) и A 2 (a , 0) , которые называются вершинами гиперболы. Отрезок
A 1A 2 , длина которого равна 2a , называется его вещественной осью, в то же время параметр a называется вещественной полуосью гиперболы. Точки B 1 (0,b ) и B 2 (0, −b ) называются мнимыми вершинами гиперболы, отрезок B 1B 2 , длина которого равна 2b , называется мнимой осью гиперболы, а параметр b – его мнимой полуосью. c Форму гиперболы характеризует эксцентриситет ε = . Ясно, что a ε > 1 , причем если эксцентриситет близок к единице, то ветви гиперболы сильно прижаты к оси O x . 58
Гипербола имеет асимптоты, к которым ее ветви приближаются при удалении от начала координат. Асимптоты гиперболы имеют уравнения
b y = ± x . Нетрудно показать, что a lim y as − y hip = 0 . x →±∞
3 Парабола и ее свойства Определение. Параболой называется множество точек на плоскости, равноудаленных от данной прямой, называемой директрисой параболы и от данной точки, называемой фокусом. Каноническое уравнение параболы мы получим, выбрав систему координат xO y таким образом: проведем ось O x перпендикулярно директрисе через фокус, направив ее от директрисы к фокусу. Расстояние от директрисы до фокуса F обозначим через p и назовем его параметром параболы. Начало координат возьмем в середине отрезка, соединяющего фокус с директрисой, и направим ось O y так, чтобы система координатных осей xO y была бы правая (рис. 3.3.3). Опустим из точки M (x , y ) на параболе перпендикуляр на директрису. Пусть N – его основание. Ясно, что
NM = FM , откуда следует y 2 = 2px . Это уравнение называется каноническим уравнением параболы. Парабола симметрична относительно оси O x и проходит через начало координат.
Рис. 3.3.3
Рис. 3.3.4
Пример 1. Найти уравнение траектории точки, которая перемещаясь по плоскости xO y , остается в два раза дальше от точки A ( −3, 0) , чем от начала координат (рис. 3.3.4). Решение. Текущую точку на искомой траектории обозначим M (x , y ) . В
uuuuur
uuuur
uuuuur
uuuur
силу условия задачи A M = 2 ⋅ O M . A M = (x + 3)i + y j , O M = x i + y j ; 59
uuuuur uuuur A M = (x + 3)2 + y 2 , O M = x 2 + y 2 , значит
(x + 3)2 + y 2 = 2 x 2 + y 2 .
Возведя в квадрат, получим (x + 3)2 + y 2 = = 4x 2 + 4y 2 , откуда следует
x 2 + 6x + 9 + y 2 = 4x 2 + 4y 2 . Имеем 3x 2 + 3y 2 − 6x = 9 . Упрощаем: x 2 + y 2 − 2x = 3 . Выделяем полный квадрат: x 2 − 2x + 1 + y 2 = 3 + 1 . Окончательно имеем: (x − 1)2 + y 2 = 22 . Получили окружность (рис. 3.3.5).
Рис. 3.3.5
Рис. 3.3.6
Пример 2. Найти сторону квадрата, вписанного в данный эллипс
x2 y2 + = 1 (рис. 3.3.6). 42 32 Решение. В силу симметрии эллипса вершины квадрата, вписанного в эллипс, имеют координаты: M 1 (m , m ) , M 2 ( −m , m ) , M 3 ( −m , m ) , M 4 (m , −m ) , (m > 0) . Искомая длина стороны квадрата d = 2m . Координаты точки M 1 удовлетворяют уравнению эллипса, потому имеем
m2 m2 + 2 = 1 => 32 m 2 + 42 m 2 = 32 ⋅ 42 => m = 2, 4 . 2 4 3 Итак, длина стороны квадрата d = 4, 8 . Пример 3. Найти уравнение траектории точки, которая, перемещаясь по плоскости xO y , остается в два раза дальше от точки A ( 4, 0) , чем от прямой x = 1 (рис. 3.3.7). uuuuur uuuuur Решение. Рассмотрим векторы A M = (x − 4)i + y j и B M = (x − 1)i . Должно быть AM = 2 ⋅ BM , т.е.
(x − 4)2 + y 2 = 2 ⋅ x − 1 . Возводя в квадрат,
получим (x − 4)2 + y 2 = 4(x − 1)2 . После упрощения имеем гиперболу
x2
y2 − 2 = 1 (рис. 3.3.7). 2 4 ⎛ 4 ⎞ ⎜ ⎟ ⎝ 3⎠ 60
Рис. 3.3.8 Рис. 3.3.7 Пример 4. Найти уравнение траектории точки, которая, перемещаясь по плоскости xO y , равноудалена от точки A ( 2,1) и от оси ординат (рис.3.3.8).
uuuuur
uuuuur
Решение. Рассмотрим векторы A M = (x − 2)i + (y − 1) j и B M = x i .
uuuuur
uuuuur
По условию задачи A M = B M , значит
(x − 2)2 + (y − 1)2 = x => (x − 2)2 + (y − 1)2 = x 2 => y 2 − 2y + 1 = 4x − 4 =>
y 2 − 2y + 1 = 4x − 4 => (y − 1)2 = 4(x − 1) . Обозначим x − 1 = X , y − 1 =Y , тогда относительно системы координат X O 1Y имеем параболу Y 2 = 4X (рис. 3.3.8). §4 Общее уравнение кривой второго порядка. Рассмотренные выше кривые 2-го порядка имеют канонические уравнения только относительно системы координат, специальным образом связанной с этой кривой. Относительно произвольно расположенной системы координат каждой из этих кривых соответствует некоторое уравнение второго порядка вида a 11x 2 + 2a 12xy + a 22y 2 + 2b1x + 2b 2y + c = 0 , которое называется общим уравнением кривой второго порядка. При каждом конкретном наборе коэффициентов это уравнение является либо уравнением эллипса (окружности), либо гиперболы, либо параболы. Заметим, что этому уравнению может и не соответствовать никакая кривая 2-го порядка (вырожденный случай), но если этому уравнению соответствует какая-нибудь кривая, то это непременно какая-нибудь из перечисленных кривых второго порядка: эллипс, гипербола или парабола. 1 Формулы преобразования координат при параллельном переносе координатных осей
61
Пусть оси O 1X и O 1Y координатной системы O 1X Y параллельны осям O x и O y исходной системы координат O xy . Допустим, что точка M в исходной системе координат имеет координаты x и y , т.е. M (x , y ) ; относительно же системы O1 XY та же точка имеет координаты X и Y , т.е. M (X ,Y ) . Установим связь между старыми координатами (x , y ) точки M и
uuuur
ее новыми координатами (X ,Y ) . Из чертежа видно, что r = O O 1 + R . Если O 1 (a ,b ) – относительно системы O xy , то ясно, что y =Y + b ; x = X + a . Эти формулы являются формулами преобразования координат при параллельном переносе координатных осей.
Рис. 3.4.1
Рис. 3.4.2
Пример 1. Выполнив параллельный перенос координатных осей, привести уравнение кривой y = x 2 − 2x + 2 к каноническому виду. Сделать рисунок кривой в исходной системе координат. Решение. Выполним параллельный перенос координатных осей, положив x = X + a , y =Y + b , где (a ,b ) – координаты нового начала системы координат O1 XY . Параметры a и b определим, потребовав, чтобы после параллельного переноса уравнение кривой стало бы простейшим (каноническим). Имеем: Y + b = (X + a )2 − 2(X + a ) + 2 =>
Y = X 2 + 2aX + a 2 − 2X − 2a + 2 − b => Y = X 2 + ( 2a − 2)X + a 2 − 2a − b + 2 . Приравняем в этом уравнении к нулю коэффициент при X и свободный член, получим координаты точки O 1 : 2a − 2 = 0 ⎫ ⎬ => a = 1 , b = 1 . 2 a − 2a − b + 2 = 0 ⎭ Окончательно имеем каноническое уравнение кривой X 2 =Y . Очевидно, что это парабола (рис. 3.4.2). 2 Формулы преобразования координат при повороте координатных осей.
62
Повернем исходную систему координат O xy на угол α , и пусть она займет положение O x 1y 1 (рис. 3.4.3). Обозначим через r радиус-вектор точки M . Очевидны соотношения: x = r ⋅ cos(ϕ + α ) = r ⋅ cos ϕ ⋅ cosα − r ⋅ sin ϕ ⋅ sinα = x 1 cosα − y 1 sinα ,
y = r ⋅ sin(ϕ + α ) = r ⋅ sin ϕ ⋅ cosα + r ⋅ sinα ⋅ cos ϕ = x 1 sinα + y 1 cosα . Окончательно:
x = x 1 cosα − y 1 sinα ⎫ ⎬. y = x 1 sinα + y 1 cosα ⎭
Эти формулы являются формулами преобразования координат при повороте координатных осей на угол α .
63
Пример 2. Выполнив поворот координатных осей, привести уравнение кривой xy = 2 к каноническому виду. Сделать рисунок кривой в исходной системе координат (рис. 3.4.4). Решение. Выполним поворот координатных осей, положив
x = x 1 cosα − y 1 sinα ⎫ ⎬. y = x 1 sinα + y 1 cosα ⎭ Уравнение данной кривой примет вид:
(x 1 cosα − y 1 sinα )(x 1 sinα + y 1 cosα ) = 2 .
Раскрывая скобки, получим:
x 1 sin α cosα + (cos 2 α − sin 2 α ) x1 y1 − y 2 (cos α sin α ) = 2 . 2
Повернем координатные оси на такой угол α , чтобы в уравнении исчезло слагаемое, содержащее произведение x1 y1 . Для этого нужно решить уравнение cos 2 α − sin 2 α = 0 . Наименьшее значение угла α , удовлетворяющего этому уравнению, есть α =
π 4
. Принимая во внимание, что sin α = cosα = 2
2 , получим канони2
2
x y ческое уравнение данной кривой 12 − 12 = 1 относительно системы коорди2 2 нат O x 1y 1 . Получим равнобочную гиперболу (рис. 3.4.4). 3 Приведение общего уравнения кривой второго порядка к каноническому виду Если кривая второго порядка задана своим общим уравнением a 11x 2 + 2a 12xy + a 22y 2 + 2b1x + 2b 2y + c = 0 , то это уравнение можно привести к каноническому виду, выполнив поворот и параллельный перенос координатных осей, причем поворот координатных осей осуществляют, выбирая такой угол поворота α , чтобы в уравнении относительно новых координат исчез бы член с произведением x 1y 1 . Итак, после поворота координатных осей уравнение кривой приобретает вид:
a 11′x 12 + a 22′y 12 + 2d 1x 1 + 2d 2y 1 + f = 0 .
Теперь можно делать следующий шаг: параллельный перенос осей. При этом координаты нового начала выбирают таким образом, чтобы упростились линейные члены и свободный член уравнения. Можно показать, что тип кривой можно определить сразу, вычислив определитель
a 11 a 12 Δ=a a 22 . 21
При этом, если Δ > 0 , то кривая называется кривой эллиптического типа и может оказаться эллипсом; если Δ < 0 , то кривая называется кривой гиперболического типа и может оказаться гиперболой; если Δ = 0 , то 64
кривая называется кривой параболического типа и может оказаться параболой. Возможны и другие, так называемые вырожденные случаи. Пример 3. Выполнив параллельный перенос и поворот координатных осей, привести к каноническому виду уравнение кривой 3x 2 − 2xy + 3y 2 + 4x + 4y − 4 = 0 . и сделать рисунок в исходной системе координат (рис. 3.4.5). Решение. Выясним прежде всего тип кривой. Вычислим дискриминант
a 11 a 12 3 −1 Δ = = 32 − ( −1)2 = 8 , Δ > 0 , т.е. наша кривая – кривая . Δ=a a 21 22 −1 3
эллиптического типа. 1. Выполним параллельный перенос координатных осей по формулам x = X + a , y =Y + b . Получим:
3(X + a )2 − 2(X + a )(Y + b ) + 3(Y + b )2 + 4(X + a ) + 4(Y + b ) − 4 = 0 . После преобразования коэффициентов имеем:
3X 2 − 2X Y + 2Y
2
+ ( 6a − 2b + 4)X + ( −2a + 6b + 4)Y +
+3a 2 − 2ab + 3b 2 + 4a + 4b − 4 = 0. Выберем координаты нового начала таким образом, чтобы аннулировались линейные слагаемые. Для этого нужно положить равным нулю коэффициенты при X и Y . Итак, имеем систему:
6a − 2b = −4 ⎫ ⎬ => a = −1 , b = −1 . −2a + 6b = −4 ⎭
65
Рис. 3.4.5 Итак имеем начало новой системы координат X O 1Y в точке O 1 ( −1, −1) . В этой системе координат наша кривая имеет уравнение 3X 2 + 3Y 2 − 2X Y = 4 . 2. Выполним теперь поворот координатных осей по формулам
X = x 1 cosα − y 1 sinα ⎫ ⎬, Y = x 1 sin α + y 1 cosα ⎭
тогда получим:
3(x 1 cos α − y 1 sin α )2 + 3(x 1 sin α + y 1 cos α )2 − −2(x 1 cos α − y 1 sin α )(x 1 sin α + y 1 cos α ) = 4, откуда следует:
(3 cos 2 α + 3 sin 2 α − 2 sin α cos α )x 12 − 2(cos 2 α − sin 2 α )x 1y 1 + +(3 cos 2 α + 3 sin 2 α + 2 sin α cos α )y 12 = 4. Выберем угол поворота α таким образом, чтобы в уравнении исчезло слагаемое с произведением x 1y 1 , т.е. положим sin 2 α − cos 2 α = 0 . Наименьший угол α , удовлетворяющий этому уравнению α = 2
2
π
4
. Тогда уравнение кривой
имеет вид: 2x 1 + 4y 1 = 4 . Запишем его в канонической форме: 2
2
x1 y1 + = 1. 2 ( 2 )2 1 Очевидно, что это эллипс (рис. 3.4.5).
66
§5 Уравнение линии на плоскости и в пространстве. 1 Кривые, заданные пересечением поверхностей Всякую линию L в пространстве можно рассматривать как пересечение двух поверхностей:
L:
F1 (x , y , z ) = 0 ⎫ ⎬. F2 (x , y , z ) = 0 ⎭
Итак, линию в пространстве можно рассматривать как множество точек, координаты которых удовлетворяют данной системе уравнений. Например, две плоскости P1 : A 1x + B 1y + C 1z + D 1 = 0 и P 2 : A 2x + B 2y + C 2z + D 2 = 0 пересекаются по прямой линии L , т.е. прямую линию L можно задать такой системой уравнений:
A 1x + B 1y + C 1z + D 1 = 0 ⎫ ⎬. A 2x + B 2y + C 2z + D 2 = 0 ⎭
L:
2 Параметрические уравнения кривых Кривую линию L на плоскости или в пространстве можно задать как траекторию движущейся точки, координаты которой задаются в виде
x = x (t )⎫ ⎪ y = y (t ) ⎬ . z = z (t ) ⎪⎭
(1)
Здесь параметр t часто имеет смысл времени, а система уравнений (1) называется системой параметрических уравнений данной кривой. Пример 1. Нарисовать кривую, заданную параметрическими уравнениями
x = a cos t ⎫ ⎬. y = b sin t ⎭ Очевидно, что достаточно взять промежуток изменения параметра t [0, 2π ] , т.к. cost и sint 2π – периодические функции. Составим таблицу изменения значений x (t ) и y (t ) в зависимости от значений параметра t .
t
0
x (t ) a y (t ) 0
π
π
π
π
6
4
3
2
2 2 2 b 2
a
1 2
b
3 2
3 2 1 b 2 a
a
0
b
3π 4
2 2 2 b 2 −a
67
π −a 0
5π 4
3π 2
2 2 2 −b 2
0
−a
−b
7π 4 2 a 2 2 −b 2
2π a 0
Остается теперь в системе координатных осей Oxy нанести точки с ко-
3 1 2 2 ,b ),(a ,b ),..., и нарисовать кривую, прохо2 2 2 2 дящую через эти точки (рис. 3.5.1), причем очевидно, что когда параметр t возрастает от 0 до 2π , точка обходит контур данной замкнутой кривой про-
ординатами ( 0, 0),(a
тив часовой стрелки. Запишем данные параметрические уравнения так:
x y = cos t , = sin t . a b
Возведем теперь в квадрат каждое из уравнений и сложим их, тогда получим:
x2 y2 + = 1, a 2 b2
т.е., исключив параметр t , мы получим канонические уравнения эллипса.
Рис. 3.5.1
Рис. 3.5.2
Пример 2. Нарисовать пространственную кривую
x = a cos t ⎫ ⎪ y = a sin t ⎬ . z = t ⎪⎭ Решение. Заметим, что параметрическим уравнениям
x = a cos t ⎫ ⎬ y = a sin t ⎭ на плоскости соответствует окружность радиуса a , а в пространстве мы получаем винтовую линию, причем расстояние между двумя соседними витками h = 2π , оно называется шагом винта. На рис. 3.5.2 изображена винтовая линия, причем стрелкой показано направление движения точки по мере возрастания t . 3 Уравнения кривых в полярных координатах Исходя из некоторой точки 0 (полюса), проведем ось O p , называемую полярной осью. Пусть точка M лежит на плоскости. 68
Рис. 3.5.3
Рис. 3.5.4
Из полюса проведем радиус-вектор r. Обозначим через ϕ угол, отсчитываемый от полярной оси по направлению к радиус-вектору против часовой стрелки (рис. 3.5.3). Положение точки M на плоскости однозначно определено параметрами r и ϕ , где r – длина радиус-вектора. Ясно, что r ≥ 0 , 0 ≤ ϕ < 2π . Совместим теперь начало декартовой системы координат xO y с полюсом, а полярную ось O p направим вдоль оси O x (рис. 3.5.4). Тогда нетрудно установить связь между декартовыми и полярными координатами: x = r cos ϕ , y = r sin ϕ . Часто из соображений большей наглядности или простоты выкладок бывает удобно учитывать связь между декартовыми и полярными координатами, переходить от уравнения кривой в декартовых координатах к ее уравнению в полярных координатах и наоборот. Пример 3. Изобразить кривую r = sin 3ϕ и найти ее уравнение в декартовых координатах. Решение. Прежде всего заметим, что r ≥ 0 , если
π 2 4 5 3ϕ ∈ [0,π ] ∪ [2π , 3π ] ∪ [4π , 5π ] , т.е. ϕ ∈ [0, ] ∪ [ π ,π ] ∪ [ π , π ] . 3 3 3 3 Если 3ϕ ∈ [π , 2π ] ∪ [3π , 4π ] ∪ [5π , 6π ] , то оказывается r < 0 , значит в обπ 2 4 5 ластях, где ϕ ∈ [ , π ] ∪ [π , π ] ∪ [ π , 2π ] кривая не лежит, их следует ис3 3 3 3
ключить из рассмотрения. Вычисляя значения r для указанных областей изменения ϕ , получим множество точек, называемое трехлепестковой розой (рис. 3.5.5). Найдем теперь уравнение этой кривой в декартовых координатах. На(cos ϕ + i sin ϕ )3 = cos 3ϕ + i sin 3ϕ , с другой стороны, помним, что
(cosϕ + i sin ϕ )3 = cos3 ϕ + 3i cos 2 ϕ sin ϕ − 3cos ϕ sin 2 ϕ − i sin3 ϕ => => sin 3ϕ = 3 cos 2 ϕ sin ϕ − sin3 ϕ . Так как cos ϕ =
x x y y = ; sin ϕ = = , то получим уравнение r r x2 +y 2 x2 +y 2
кривой в декартовых координатах 69
x2 y y3 x +y = 3 2 ⋅ − => (x 2 + y 2 )2 = 3x 2y − y 3 . 2 2 2 2 2 2 2 x +y x +y (x + y ) x + y 2
2
Заметим, что изобразить кривую по ее уравнению в таком виде довольно трудно.
y 2π 3
π 3
x
4π
5π
Пример 3. Нарисовать кривую r = sin ϕ и найти ее уравнение в декарто3 3 вых координатах. Рис. 3.5.5 Решение. Заметим, что sin ϕ 2π – периодическая функция. Берем промежуток изменения для ϕ ∈ [0, π ] , т.к. в этом промежутке sin ϕ ≥ 0 . Ясно, что кривая лежит в верхней полуплоскости. Составим таблицу для значений r в зависимости от ϕ :
ϕ r
0
π
π
π
π
4
3
2
0
6 1 2
3 2
1
2 2
2π 3
3π 4
3 2
2 2
5π 6 1 2
π 0
Теперь можно нарисовать данную кривую, проводя из полюса лучи под углом ϕ = 0,
π π
, ,...,π и откладывая на этих лучах значения соответственно 6 4 1 2 ,... . Получим набор точек, через которые остается провести равные 0, , 2 2 нашу кривую (рис. 3.5.6).
70
π y
9
π 4
0
1 2
π 6 p 1x
0 Рис. 3.5.6
Найдем уравнение этой кривой в декартовых координатах. Т.к. x = r cos ϕ , y = r sin ϕ , то ясно, что sin ϕ =
y , x 2 + y 2 = r 2 => r
r = x 2 + y 2 , а тогда данная кривая r = sin ϕ в декартовых координатах y имеет уравнение x 2 + y 2 = => x 2 + y 2 = y => x 2 + y 2 − y = 0 . 2 2 x +y Выделим полный квадрат: 2
2
1 1 1 1⎞ ⎛1⎞ ⎛ x + y − 2 ⋅ y + = => x 2 + ⎜ y − ⎟ = ⎜ ⎟ . 2⎠ ⎝2⎠ 2 4 4 ⎝ 1 Получим каноническое уравнение окружности радиуса r = с центром в 2 1 точке O ( 0, ) . 2 2
2
§6 Поверхности второго порядка. 1 Эллипсоид Определение. Эллипсоидом называется поверхность, каноническое уравнение которой имеет вид
x2 y2 z2 + + = 1 , (a > 0,b > 0,c > 0) . a 2 b2 c 2 Исследуем форму данной поверхности. Заметим, что координаты ( ±x ),( ±y ),( ±z ) удовлетворяют этому уравнению, значит данная поверхность симметрична относительно трех координатных плоскостей xO y , xO z , y O z . С координатными осями поверхность пересекается в точках (a , 0, 0) и ( −a , 0, 0) ; (0,b , 0) и (0, −b , 0) ; (0, 0,c ) и (0, 0, −c ) . Параметры a , b 71
и c называются полуосями эллипсоида. Более подробно форму поверхности можно исследовать методом сечений. Например, если провести сечение поверхности плоскостью z = h (h > 0,h < c ) :
x2 y2 z2 ⎫ + + = 1⎪ a 2 b2 c 2 ⎬. z = h ⎭⎪ h2 x2 y2 В плоскости z = h имеем кривую 2 + 2 = 1 − 2 => a b c 2 2 x y + = 1. 2 2 2 ⎞ 2 ⎞ ⎛ ⎛ h h ⎜a 1 − 2 ⎟ ⎜b 1 − 2 ⎟ ⎜ c ⎟⎠ ⎜⎝ c ⎟⎠ ⎝ Ясно, что это есть эллипс. В любой плоскости, параллельной координатным плоскостям, мы имеем эллипсы, отсюда и название данной поверхности. В частности, если a = b = c , то эллипсоид превращается в сферу x 2 + y 2 + z 2 = a 2 , т.е. сфера является частным случаем эллипсоида. Если равны любые две полуоси, то эллипсоид называется эллипсоидом вращения.
z
z
z = h (h < c )
c h
h
−b
−a
b y
a x
z = h (h > 0)
y
x
−c Рис. 3.6.1
Рис. 3.6.2
2 Однополостный гиперболоид Определение. Однополостным гиперболоидом называется поверхность, каноническое уравнение которой имеет вид
x2 y2 z2 + − = 1 , (a > 0,b > 0,c > 0) . a 2 b2 c 2 72
Для исследования формы этой поверхности применим метод сечений, т.е. пересечем эту поверхность различными плоскостями, параллельными координатным плоскостям.
x = 0⎫ ⎪ x2 y2 z2 ⎬ + − = 1⎪ a 2 b2 c 2 ⎭ дает нам в плоскости y O z гиперболу
y2 z2 − = 1. b2 c 2 Аналогично в плоскости xO z имеем гиперболу
x2 z2 − = 1. a2 c2 В плоскости z = 0 имеем эллипс
x2 y2 + = 1 (горловина). a 2 b2 Сечение z = ±h , (h > 0) дает нам эллипс
x2 ⎛ h ⎞ ⎜a 1 + 2 ⎟ ⎜ c ⎟⎠ ⎝ 2
2
+
y2 ⎛ h ⎞ ⎜b 1 + 2 ⎟ ⎜ c ⎟⎠ ⎝ 2
2
= 1.
Очевидно, что полуоси этого эллипса возрастают по мере удаления от начала координат. В сечениях плоскостями, параллельными координатным плоскостям xO z и y O z получим гиперболы. Результаты такого исследования позволяют нам нарисовать поверхность (рис. 3.6.2), которая вытянута вдоль оси Oz . 3 Двуполостный гиперболоид Определение. Двуполостным гиперболоидом называется поверхность, каноническое уравнение которой имеет вид (рис.3.6.3).
x2 y2 z2 − − = 1 , (a > 0,b > 0,c > 0) . a 2 b2 c 2 Исследуем форму этой поверхности методом сечения. Положим в уравнении x = 0 , получим
y2 z2 − 2 − 2 = 1. b c 73
Это соотношение не имеет смысла, т.к. сумма квадратов не может быть отрицательным числом. Это означает, что данная поверхность не пересекается с координатной плоскостью y O z . Положим в уравнении y = 0 , получим
x2 z2 − = 1, a2 c2 т.е. в координатной плоскости xO z мы имеем гиперболу. В координатной плоскости xO y получим также гиперболу x2 z2 − = 1. a2 c2 В сечении плоскостями x = ±h , (h > a ) получим эллипсы y2 ⎛ h2 ⎞ ⎜b 2 − 1 ⎟ ⎜ a ⎟ ⎝ ⎠
2
+
z2 ⎛ h2 ⎞ − 1 ⎜c ⎟ ⎜ a2 ⎟ ⎝ ⎠
2
= 1.
Рассмотрим и другие сечения, приходим к выводу, что данная поверхность вытянута вдоль оси O x и представляет собою две (отдельные) полости (рис. 3.6.3).
z
z
x = −h
x =h
z = h (h > 0)
y
−a
0
a
x
y
x Рис. 3.6.3
0 Рис. 3.6.4
4 Эллиптический параболоид Определение. Эллиптическим параболоидом называется поверхность, каноническое уравнения которой имеет вид
x2 y2 + = 2z , (p > 0,q > 0) . p q Исследуем форму этой поверхности. Прежде всего заметим, что z > 0 для любых x и y , отличных от нуля, причем z = 0 , если x = 0 и y = 0 . Это означает, что поверхность проходит через начало координат и лежит в верхнем полупространстве. 74
Любое сечение поверхности плоскостью, проходящей через ось O z , дает нам параболу, вытянутую вдоль оси O z . В частности, сечения плоскостями xO z и y O z представляют собой параболы, вида x 2 = 2pz и
y 2 = 2qz соответственно. В сечении плоскостью z = h (h > 0) имеем эллипс
(
x2 2ph
+
) ( 2
y2 2qh
)
2
= 1.
Вывод: поверхность имеет форму чаши, проходящей через начало координат и вытянутой вдоль оси O z . Если p = q , то поверхность называется параболоидом вращения. 5 Гиперболический параболоид Определение. Гиперболическим параболоидом называется поверхность, имеющая каноническое уравнение
x2 y2 − = 2z , (p > 0,q > 0) . p q Сечение плоскостью z = 0 дает нам пару пересекающихся прямых y x y x − =0 и + = 0 . Это означает, что наша поверхность переq p q p секается с координатной плоскостью xO y по прямым линиям. Положим x = 0 , получаем в координатной плоскости y O z параболу y 2 = −2qz . Заметим, что ветви этой параболы направлены вниз. Полагая x = h (h > 0) , получаем ту же параболу, приподнятую вверх на qh 2 qh 2 2 , т.е. y = −2qz + . величину p p В координатной плоскости xO z (y = 0) имеем параболу x 2 = 2pz . Проводя другие сечения, приходим к выводу, что поверхность имеет форму седла (рис. 3.6.5).
75
z
z x = h (h > 0)
S
y x − =0 q p
y
0
a
x
a
y x + =0 q p
Рис. 3.6.5
y
x
Рис. 3.6.6
6 Цилиндр второго порядка Определение. Цилиндрической поверхностью или просто цилиндром называется всякая поверхность, которую можно получить движением прямой (образующей), перемещающейся параллельно некоторому данному вектору S и все время пересекающей данную линию, которая называется направляющей. Если направляющей служит кривая второго порядка, то и цилиндр называется цилиндром второго порядка. Если образующие параллельны какойлибо координатной оси, то цилиндр называется прямым. На рис. 3.6.6 изображен прямой круговой цилиндр, вытянутый вдоль оси O z . 7 Конус Определение. Канонической поверхностью называется поверхность, которая получается при движении прямой (образующей), проходящей через данную точку (вершину) и пересекающей данную линию (направляющую). Если направляющей служит кривая второго порядка, то конус называется конусом второго порядка. Если направляющая есть замкнутая кривая, то конус представляет собой двуполостную поверхность, все образующие которой проходят через данную точку (вершину конуса). На рис. 3.6.7 изображен конус, имеющий уравнение x 2 + y 2 − z 2 = 0 . Исследовать форму этого конуса нетрудно, проведя различные сечения этой поверхности. Отметим еще одно важную особенность уравнения конуса: как правило это однородное уравнение относительно разностей (x − a ) , (y − b ) и (z − c ) , где точка M 0 (a ,b ,c ) – вершина конуса. На рис. 3.6.7 изображен конус с вершиной в начале координат, т.е. для данного конуса a = 0 , b = 0 и c = 0.
76
z=h
Рис. 3.7.1
Рис. 3.6.7
§7 Поверхности вращения. Поверхность, образованная вращением плоской кривой вокруг оси, расположенной в ее плоскости, называется поверхностью вращения. Эта ось называется осью вращения поверхности. Если пересекать поверхность вращения плоскостями, перпендикулярными к оси вращения, то в сечениях будут окружности с центрами на оси вращения. Рассмотрим правило получения уравнения поверхности, образованной вращением линии L, лежащей в координатной плоскости y O z вокруг оси O z . Допустим, что кривая L имеет уравнение P (y , z ) = 0 . Найдем уравнение поверхности, полученной от вращения этой линии вокруг оси O z (рис. 3.7.1). Введем на поверхности произвольную точку M (x , y , z ) и проведем через нее плоскость, перпендикулярную к оси вращения. Обозначим через M 1 и N точки пересечения построенной плоскости соответственно с данной линией L и осью вращения (осью O z ). Координаты z всех трех точек M , M 1 и N равны между собой. Поэтому имея в виду, что координаты точки N есть (0, 0, z ) , найдем радиус N M окружности, получившейся в сечении поверхности плоскостью, как расстояние между точками N и M , он равен x 2 + y 2 . С другой стороны, так как точка M 1 лежит одновременно на окружности сечения и на линии L , то радиус N M равен абсолютной величине ординаты точки M 1 . Следовательно, точка M 1 имеет такие же координаты: M 1 ( ± x 2 + y 2 , z ) , а тогда искомое уравнение поверхности вращения имеет вид: F ( ± x 2 + y 2 , z ) = 0 . Таким образом, мы приходим к следующему правилу: чтобы получить уравнение поверхности, образованной вращением линии L , лежащей в плоскости y O z , вокруг оси O z , нужно в уравнении этой линии заменить
y на ± x 2 + y 2 . 77
При выборе знака перед радикалом следует придерживаться следующего правила: знак должен совпадать в соответствующих точках со знаком координаты y на исходной кривой. Совершенно аналогичные правила будут для получения уравнений поверхностей вращения, получающихся вращением плоских линий вокруг других координатных осей. Пример. Найти уравнение поверхности, если прямую y = x − 1 вращать вокруг оси O x . Решение. Т.к. вращение прямой линии происходит вокруг оси O x , то в силу изложенного выше нам нужно в данном уравнении y = x − 1 заменить
y на ± y 2 + z 2 , получим ± y 2 + z 2 = x − 1 . Возведем обе части этого соотношения в квадрат, получим уравнение конуса с вершиной в точке M 0 (1, 0, 0) .
y 2 + z 2 = (x − 1)2 .
Рис. 3.7.2
78
Глава 4 Матрицы и системы алгебраических уравнений §1 Матрицы. Основные понятия. 1 Основные понятия Матрицами в математике называют математические объекты, имеющие вид таблицы
⎛ a 11 a 12 ... ⎜ a a 22 ... A = ⎜ 21 ⎜ . . . ⎜ ⎝ a m 1 a m 2 ... с размерами m × n , где m – число строк,
a 1n a 2n .
⎞ ⎟ ⎟ ⎟ ⎟ ⎠
amn а n – число столбцов, для ко-
торых определено равенство и действия сложения, умножения и умножения на число, которые мы определим далее. Заметим, что элементами матрицы могут быть как числа действительные или комплексные, так и другие математические объекты, например, функции (в этом случае матрица называется функциональной). В данной главе мы ограничимся рассмотрением матриц, все элементы которых a ij ∉ (i = 1, 2,..., m ; j = 1, 2,..., n ) . Иногда матрицы обозначают так:
a 11 a A = 21 .
a 12 a 22 .
... a 1n
am1 am 2
... a m n
... a 2n .
.
⎡ a 11 a 12 ⎢a a 22 21 , или так: A = ⎢ ⎢ . . ⎢ ⎣a m 1 a m 2
... a 1n ⎤ ... a 2n ⎥⎥ , . . ⎥ ⎥ ... a m n ⎦
или более кратко: A = a ij , или A = a ij , или A = a ij , (i = 1,2,..., m ; j = 1,2,..., n ) .
( )
[ ]
Если число строк n данной матрицы совпадает с числом ее столбцов, то матрица называется квадратной, при этом говорят, что она имеет порядок n или размеры n × n , т.е. квадратная матрица имеет вид
⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ a 21 a 22 ... a 2n ⎟ ⎜ A= . ⎜ . . . . ⎟ ⎜ ⎟ ⎝ a n 1 a n 2 ... a nn ⎠ Элементы a 11 , a 22 , …, a nn квадратной матрицы A образуют так называемую главную диагональ или говорят, что они стоят на главной диагонали; элементы a n 1 , a (n −1) 2 , …, a 1n образуют так называемую побочную 79
диагональ квадратной матрицы, они идут из левого нижнего в правый верхний угол матрицы. Квадратная матрица называется треугольной, если все ее элементы, стоящие выше или ниже главной диагонали, равны нулю. Квадратная матрица называется диагональной, если все элементы, не стоящие на главной диагонали, равны нулю, т.е.
0 ⎛ a 11 0 ⎜ ⎜ 0 a 22 0 diag (a 11 ,a 22 ,...,a nn ) = ⎜ 0 0 a 33 ⎜ . . ⎜ . ⎜ 0 0 0 ⎝
... 0 ⎞ ⎟ ... 0 ⎟ ... 0 ⎟ . ⎟ . . ⎟ ... a nn ⎟⎠ Определитель квадратной матрицы обозначается detA , т.е. a 11 a 12 ... a 1n det A =
a 21 a 22 . . a n1 a n 2
... a 2n . . . ... a nn
Диагональная матрица, все диагональные элементы которой равны единице, называется единичной и обозначается I или E .
Очевидно, что detE = 1 .
⎛1 ⎜ ⎜0 E = ⎜0 ⎜ ⎜. ⎜0 ⎝
0 0 ... 0 ⎞ ⎟ 1 0 ... 0 ⎟ 0 1 ... 0 ⎟ . ⎟ . . . .⎟ 0 0 ... 1 ⎟⎠
Матрица, все элементы которой равны нулю, называется нулевой 0[m × n ] . 2 Операции над матрицами Рассмотрим более подробно операции над матрицами, являющиеся составными частями самого определения матрицы. 1. Равенство матриц. Две матрицы A и B с одинаковыми размерами [m × n ] называются равными, если элементы этих матриц, имеющие одинаковые индексы, совпадают, т.е. a ij = b ij (i = 1, 2,..., m ; j = 1, 2,..., n ) . 2. Сложение матриц. Матрица C = A + B , называется суммой матриц A [m × n ] и B [m × n ] , если каждый элемент матрицы c ij = a ij + bij (i = 1, 2,..., m ; j = 1, 2,..., n ) . Непосредственно из определения сложения матриц A и B вытекают основные свойства операции сложения матриц: 80
1) коммутативность A + B = B + A ; 2) ассоциативность (A + B ) + C = A + (B + C ) ; 3) существует нулевая матрица O [m × n ] такая, что A + O = A для любой матрицы O [m × n ] . 3. Умножение матриц на число. Матрица C = λ ⋅ A называется произведением числа λ на матрицу A [m × n ] , если для каждого элемента матрицы C [m × n ] справедливо соотношение c ij = λa ij (i = 1,2,..., m ; j = 1,2,..., n ) . Очевидны свойства этой операции: 1) ассоциативность относительно умножения на число: (λμ )A = λ ( μA ) , где μ = const 2) дистрибутивность относительно сложения матриц:
λ (A + B ) = λA + λB
3) дистрибутивность относительно сложения чисел: (λ + μ )A = λA + μA . Заметим, что здесь B [m × n ] – матрица. 4. Умножение матриц. Матрица C [m × n ] называется произведением матрицы A [m × r ] на матрицу B [r × n ] , если для любого элемента матрицы C имеет место соотношение n
c ij = a i 1b1j + a i 2b 2 j + ... + a ir br j = ∑a ikbkj , (i = 1, 2,..., m ; j = 1, 2,..., n ) . k =1
При этом пишут: C = A ⋅ B . Прежде всего отметим, что из определения произведения матрицы A [m × r ] на матрицу B [r × n ] следует, что умножать матрицу A на матрицу B можно лишь в том случае, если число столбцов матрицы A совпадает с числом строк матрицы B . Кроме того ясно, что в данном случае, вообще говоря, A ⋅ B ≠ B ⋅ A , так как если r ≠ m , то B ⋅ A просто не определено, т.е. произведение матриц некоммутативно. Квадратные матрицы одного порядка называются коммутирующими, если A ⋅ B = B ⋅ A . Очевидно, что A ⋅ E = E ⋅ A = A , т.е. единичная матрица при умножении матриц играет роль обычной единицы. Можно доказать справедливость и других свойств умножения матриц. Принимая во внимание сказанное, перечислим основные свойства умножения матриц: 1) A ⋅ B ≠ B ⋅ A (умножение матриц некоммутативно); 2) (A ⋅ B ) ⋅C = A ⋅ (B ⋅C ) (ассоциативность); 3) (A + B ) ⋅C = A ⋅C + B ⋅C (дистрибутивность относительно сложения матриц); 4) A ⋅ E = E ⋅ A = A ; 5) A ⋅O = O ⋅ A = O , причем здесь O – нулевая матрица; 6) det(A ⋅ B ) = det A ⋅ det B , где A и B – квадратные матрицы. Пример 1. Вычислить A ⋅ B , если
81
⎛1 1 0⎞ ⎛1 1 2 ⎞ ⎜ ⎟ A =⎜ ⎟ , B = ⎜ 1 −1 1 ⎟ . ⎝ 0 1 −1⎠ ⎜0 1 1⎟ ⎝ ⎠ Решение. Заметим, что A [2 × 3] , B [3 × 3] . Т.к. число столбцов матрицы A совпадает с числом строк матрицы B , то произведение A ⋅ B определено, причем матрица C = A ⋅ B должна иметь размер [2 × 3] . Примем во внимание, что c ij = a i 1b1j + a i 2b 2 j + ... + a ir br j и, полагая r = 3 , вычисляем элементы матрицы C : c 11 = 1 ⋅ 1 + 1 ⋅ 1 + 2 ⋅ 0 = 2 ; c 12 = 1 ⋅ 1 + 1 ⋅ ( −1) + 2 ⋅ 1 = 2 ; c 13 = 1 ⋅ 0 + 1 ⋅ 1 + 2 ⋅ 1 = 3 ; c 21 = 0 ⋅1 + 1⋅1 + (−1) ⋅ 0 = 1; c 22 = 0 ⋅1 + 1 ⋅ (−1) + (−1) ⋅ 1 = −2 ; c 23 = 0 ⋅ 0 + 1⋅1 + (−1) ⋅1 = 0.
⎛ 2 2 3⎞ ⎟. 1 2 0 − ⎝ ⎠
Окончательно имеем: C = ⎜
Заметим, что произведение A ⋅ B удобно вычислять, перемещая левую руку по строке первой матрицы слева направо, а правую – по соответствующему столбцу второй матрицы B сверху вниз. Пример 2. Вычислить A ⋅ B , если
⎛1⎞ ⎜ ⎟ A = ⎜ 2 ⎟ , B = ( 2 1 1) . ⎜1⎟ ⎝ ⎠ Решение. Матрицы, что A [3 × 1] , B [1 × 3] . Число столбцов первой матрицы совпадает с числом строк второй, значит, произведение C = A ⋅ B определено, причем C [3 × 3] . Вычисляя элемент c ij (i = 1,2,3; j = 1,2,3) , получим матрицу C :
⎛ 1 ⋅ 2 1 ⋅1 1 ⋅1 ⎞ ⎛ 2 1 1 ⎞ ⎜ ⎟ ⎜ ⎟ C = ⎜ 2 ⋅ 2 2 ⋅ 1 2 ⋅ 1⎟ = ⎜ 4 2 2 ⎟ . ⎜ 1 ⋅ 2 1 ⋅1 1 ⋅1 ⎟ ⎜ 2 1 1 ⎟ ⎝ ⎠ ⎝ ⎠ Пример 3. Вычислить C = B ⋅ A , если
⎛1⎞ ⎜ ⎟ B = ( 2 1 1) , A = ⎜ 2 ⎟ . ⎜1⎟ ⎝ ⎠ Решение. B [1 × 3] , A [3 × 1] , значит произведение B ⋅ A определено, причем C [1 × 1] . Итак: 82
⎛1⎞ ⎜ ⎟ C = B ⋅ A = ( 2 1 1) ⋅ ⎜ 2 ⎟ = ( 2 ⋅ 1 + 1 ⋅ 2 + 1 ⋅ 1) = ( 5 ) . ⎜1⎟ ⎝ ⎠ Получили матрицу, имеющую только один элемент c 11 = 5 . Пример 4. Вычислить C 1 = A ⋅ B и C 2 = B ⋅ A , если
⎛ 1 0 1⎞ ⎛ 2 0 0⎞ ⎜ ⎟ ⎜ ⎟ A = ⎜ 1 1 1⎟ , B = ⎜ 1 1 0 ⎟ . ⎜ 0 1 1⎟ ⎜2 1 1⎟ ⎝ ⎠ ⎝ ⎠ Решение.
0 0 ⎞ ⎛ 2 + 0 + 2 0 + 0 + 1 0 + 0 + 1⎞ ⎛ 4 1 1⎞ ⎟ ⎜ ⎟ ⎜ ⎟ 1 0 ⎟ = ⎜ 2 + 1 + 2 0 + 1 + 1 0 + 0 + 1⎟ = ⎜ 5 2 1⎟ ; 1 1 ⎟⎠ ⎜⎝ 0 + 1 + 2 0 + 1 + 1 0 + 0 + 1⎟⎠ ⎜⎝ 3 2 1⎟⎠ 1⎞ ⎛ 2 + 0 + 0 0 + 0 + 0 2 + 0 + 0 ⎞ ⎛ 2 0 2 ⎞ ⎟ ⎜ ⎟ ⎜ ⎟ 1⎟ = ⎜ 1 + 1 + 0 0 + 1 + 0 1 + 1 + 0 ⎟ = ⎜ 2 1 2 ⎟ . 1⎟⎠ ⎜⎝ 2 + 1 + 0 0 + 1 + 1 2 + 1 + 1 ⎟⎠ ⎜⎝ 3 2 4 ⎟⎠ Заметим, что определены произведения A ⋅ B и B ⋅ A , однако A ⋅ B ≠ B ⋅ A , т.е. в данном случае матрицы A и B не коммутируют.
⎛1 ⎜ C 1 = A ⋅B = ⎜1 ⎜0 ⎝ ⎛2 0 ⎜ C 2 = B ⋅A = ⎜ 1 1 ⎜2 1 ⎝
0 1⎞ ⎛ 2 ⎟ ⎜ 1 1⎟ ⋅ ⎜ 1 1 1⎟⎠ ⎜⎝ 2 0⎞ ⎛1 0 ⎟ ⎜ 0⎟⋅⎜1 1 1 ⎟⎠ ⎜⎝ 0 1
3 Транспонированная матрица Определение 1. Матрица A T называется транспонированной по отношению к данной матрице A , если она получается из матрицы A путем замены в ней всех строк на соответствующие им столбцы. Пусть
⎛ a 11 a 12 ⎜ a a 22 A = ⎜ 21 ⎜ . . ⎜ ⎝a m 1 a m 2
a 1n ⎞ ⎛ a 11 a 21 ⎟ ⎜ ... a 2n ⎟ a a 22 T => A = ⎜ 12 ⎜ . ... . ⎟ . ⎟ ⎜ ... a m n ⎠ ⎝ a 1n a 2n ...
... a m 1 ⎞ ⎟ ... a m 2 ⎟ . ... . ⎟ ⎟ ... a m n ⎠
Свойства транспонированных матриц (без доказательства) 1) (A T )T = A ; 2) (λA + μB )T = λA T + μB T ; 3) (A ⋅ B )T = B T ⋅ A T ; 4) E T = E . Определение 2. Матрица A , для которой выполняется условие A = A , называется симметрической. T
4 Обратная матрица 83
Определение 3. Матрица A −1 называется обратной по отношению к квадратной матрице A n -го порядка, если A ⋅ A −1 = A −1 ⋅ A = E , где E – единичная матрица n -го порядка. Теорема. Для того чтобы у матрицы A существовала обратная матрица −1 A , необходимо и достаточно, чтобы матрица A была невырожденная (неособая), т.е. чтобы определитель матрицы A был бы отличен от нуля. Доказательство. Необходимость. Пусть существует обратная матрица A −1 , т.е. A ⋅ A −1 = E , но тогда det(A ⋅ A −1 ) = det E = 1 => det A ⋅ det A −1 = 1 => detA ≠ 0 . Достаточность. Пусть Δ = detA ≠ 0 . Обозначим через A ij алгебраические дополнения элементов a ij матрицы A . Рассмотрим матрицу
⎛ A 11 ⎜ Δ ⎜ ⎜ A 12 B =⎜ Δ ⎜ ⎜ . ⎜ A 1n ⎜ ⎝ Δ
A 21 Δ A 22 Δ . A 2n Δ
An1 ⎞ Δ ⎟ ⎟ An 2 ⎟ ... Δ ⎟. ⎟ . . ⎟ A nn ⎟ ... ⎟ Δ ⎠ ...
Докажем, что B = A −1 , для чего нужно доказать, что A ⋅ B = B ⋅ A = = E . Не уменьшая общности доказательства, проведем его для случая n = 3 . Найдем
⎛ a 11 a 12 a 13 ⎞ ⎛ A 11 A 21 A 31 ⎞ ⎜ ⎟ 1⎜ ⎟ C = A ⋅ B = ⎜ a 21 a 22 a 23 ⎟ ⋅ ⎜ A 12 A 22 A 32 ⎟ = ⎜a ⎟ Δ ⎜A ⎟ a a 32 33 ⎠ ⎝ 31 ⎝ 13 A 23 A 33 ⎠ ⎛ a 11A 11 + a 12A 12 + a 13A 13 a 11A 21 + a 12A 22 + a 13A 23 a 11A 31 + a 12A 32 + a 13A 33 ⎞ 1⎜ ⎟ = ⎜ a 21A 11 + a 22A 12 + a 23A 13 a 21A 21 + a 22A 22 + a 23A 23 a 21A 31 + a 22A 32 + a 23A 33 ⎟ . Δ⎜ ⎟ ⎝ a 31A 11 + a 32A 12 + a 33A 13 a 31A 21 + a 32A 22 + a 33A 23 a 31A 31 + a 32A 32 + a 33A 33 ⎠ На главной диагонали стоят разложения определителя Δ по элементам первой, второй и третьей строк соответственно, а все другие элементы представляют собой сумму попарных произведений элементов какой-то строки определителя на алгебраические дополнения другой строки. Следовательно
⎛Δ 0 0⎞ 1⎜ ⎟ C = A ⋅B = ⎜ 0 Δ 0 ⎟ = E . Δ⎜ ⎟ ⎝ 0 0 Δ⎠ Аналогично можно доказать, что и B ⋅ A = E . 84
Свойства обратной матрицы 1) (A −1 )−1 = A ; 2) (A ⋅ B )−1 = A −1 ⋅ B −1 ; 3) (A −1 )T = (A T )−1 . Пример 5. Найти обратную матрицу A −1 , если
⎛1 2 1⎞ ⎜ ⎟ A = ⎜0 1 1⎟ . ⎜1 1 2⎟ ⎝ ⎠ Решение. Прежде всего вычислим определитель матрицы A :
1 2 1 detA = 0 1 1 = 1 ⋅ 1 ⋅ 2 + 0 ⋅ 1 ⋅ 1 + 1 ⋅ 1 ⋅ 2 − 1 ⋅ 1 ⋅ 1 − 1 ⋅ 1 ⋅ 1 − 2 ⋅ 0 ⋅ 2 = 2 . 1 1 2 Найдем алгебраические дополнения матрицы A : 1 1 2 1 2 1 A 11 = ( −1)1+1 = 1 ; A 21 = ( −1)2+1 = −3 ; A 31 = ( −1)3+1 = 1; 1 2 1 2 1 1 A 12 = ( −1)1+ 2
0 1 = 1; 1 2
A 22 = ( −1)2+ 2
1 1 = 1; 1 2
A 32 = ( −1)3+ 2
1 1 = −1 ; 0 1
A 13 = ( −1)1+3
0 1 = −1 ; 1 1
A 23 = ( −1)2+3
1 2 = 1; 1 1
A 33 = ( −1)3+3
1 2 = 1. 0 1
Сформируем теперь обратную матрицу
A
−1
1 = det A
⎛ A 11 A 21 A 31 ⎞ ⎜ ⎟ A A A 12 22 32 ⎜ ⎟, ⎜A ⎟ ⎝ 13 A 23 A 33 ⎠
получим
⎛ 1 ⎜ ⎛ 1 −3 1 ⎞ ⎜ 2 1⎜ 1 ⎟ A −1 = ⎜ 1 1 −1⎟ = ⎜ ⎜ 2 2⎜ ⎟ ⎝ −1 1 1 ⎠ ⎜ 1 ⎜⎜ − ⎝ 2
3 2 1 2 1 2
−
1 ⎞ 2 ⎟ ⎟ 1⎟ − . 2⎟ ⎟ 1 ⎟ ⎟ 2 ⎠
Убедимся в том, что найденная матрица действительно является обратной. Должно быть A ⋅ A −1 = A −1 ⋅ A = E . Имеем: 85
⎛ 1 ⎜ ⎛1 2 1⎞ ⎜ 2 ⎜ ⎟ 1 A ⋅ A −1 = ⎜ 0 1 1 ⎟ ⋅ ⎜ ⎜ ⎜1 1 2⎟ ⎜ 2 ⎝ ⎠ ⎜⎜ − 1 ⎝ 2
1 ⎞ ⎛1 1 3 1 1 1⎞ +1− − +1+ −1+ ⎟ ⎟ ⎜ 2 2 2 2 2 2 2 ⎟ ⎜ ⎟ 1⎟ ⎜ 1 1 1 1 1 1 ⎟ − = − + − + = 2⎟ ⎜ 2 2 2 2 2 2 ⎟ ⎟ ⎜ ⎟ 1 ⎟ ⎜1 1 3 1 1 1 ⎟ + −1 − + +1 − +1 2 ⎟⎠ ⎜⎝ 2 2 2 2 2 2 ⎟⎠ ⎛1 0 0⎞ ⎜ ⎟ = ⎜0 1 0⎟ . ⎜0 0 1⎟ ⎝ ⎠ Нетрудно убедиться, что совершенно аналогично A −1 ⋅ A = E . Убедитесь 3 2 1 2 1 2
−
в этом самостоятельно. 5 Ортогональная матрица Определение 4. Квадратная матрица A называется ортогональной, если ее обратная матрица A −1 совпадает с матрицей, транспонированной по отношению к матрице A , т.е. если A −1 = A T . Свойства ортогональных матриц 1) Определитель ортогональной матрицы равен 1 либо −1 . Действительно, из A −1 = A T => det(A T ⋅ A ) = 1 => (det A )2 = 1 => det A = ±1 . 2) Сумма квадратов элементов каждой строки или столбца равна единице. 3) Сумма попарных произведений элементов двух различных строк или столбцов равна нулю. Доказательство. Докажем для случая n = 3 .
⎛ a 11 a 21 a 31 ⎞ ⎛ a 11 a 12 a 13 ⎞ ⎜ ⎟ ⎜ ⎟ A T ⋅ A = E => ⎜ a 12 a 22 a 32 ⎟ ⋅ ⎜ a 21 a 22 a 23 ⎟ = ⎜a ⎟ ⎜ ⎟ ⎝ 13 a 23 a 33 ⎠ ⎝ a 31 a 32 a 33 ⎠ 2 2 ⎛ + a 31 a 112 + a 21 a 11a 12 + a 21a 22 + a 31a 32 a 11a 13 + a 21a 23 + a 31a 33 ⎞ ⎜ ⎟ 2 2 = ⎜ a 12a 11 + a 22a 21 + a 32a 31 + a 32 a 122 + a 22 a 12a 13 + a 22a 23 + a 32a 33 ⎟ . 2 2 ⎜a a + a a + a a ⎟ a 13a 12 + a 23a 22 + a 33a 32 a 132 + a 23 + a 33 23 21 33 31 ⎝ 13 11 ⎠ T Аналогично, рассматривая A ⋅ A = E , получим точно такие же соотношения для элементов строк.
§2 Элементарные преобразования матриц. Ранг матрицы. Теорема о базисном миноре. 1 Элементарные преобразования матриц Элементарными преобразованиями матриц называются преобразования трех типов: 86
1) перемена мест двух строк или двух столбцов в данной матрице; 2) умножение строки (или столбца) на произвольное число, отличное от нуля; 3) прибавление к одной строке (столбцу) другой строки (столбца), умноженной на некоторое число. Матрицы, полученные одна из другой путем элементарных преобразований, называются эквивалентными. Эквивалентность двух матриц обозначается с помощью символа следования, т.е. A => B (иногда A ~ B ). Пример 1. 1. Найти треугольную матрицу, эквивалентную данной матрице
⎛1 0 2⎞ ⎜ ⎟ A = ⎜ 0 −1 1 ⎟ . ⎜3 0 2⎟ ⎝ ⎠ 2. Найти диагональную матрицу, эквивалентную матрице A . Решение. 1. Прибавим к третьей строке первую строку, умноженную на (–3), тогда
⎛1 0 2⎞ ⎛1 0 2 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ 0 −1 1 ⎟ => ⎜ 0 −1 1 ⎟ . ⎜ 3 0 2⎟ ⎜ ⎟ ⎝ ⎠ ⎝ 0 0 −4 ⎠ ⎛1 0 2 ⎞ ⎜ ⎟ 2. Преобразуем далее матрицу B = ⎜ 0 −1 1 ⎟ , выполнив следующие ⎜ ⎟ ⎝ 0 0 −4 ⎠ элементарные преобразования: 1) к третьему столбцу прибавим первый, умноженный на (–2), оставив неизменными первый и второй столбцы:
⎛1 0 2 ⎞ ⎛1 0 0 ⎞ ⎜ ⎟ ⎜ ⎟ − − 0 1 1 0 1 1 => ⎜ ⎟ ⎜ ⎟; ⎜ ⎟ ⎜ ⎟ ⎝ 0 0 −4 ⎠ ⎝ 0 0 −4 ⎠ 2) к третьему столбцу прибавим второй столбец:
⎛1 0 0 ⎞ ⎛1 0 0 ⎞ ⎜ ⎟ ⎜ ⎟ − − 0 1 1 0 1 0 => ⎜ ⎟ ⎜ ⎟. ⎜ ⎟ ⎜ ⎟ ⎝ 0 0 −4 ⎠ ⎝ 0 0 −4 ⎠ 2 Ранг матрицы Рассмотрим произвольную [m × n ] матрицу
87
⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ a a a ... n 21 22 2 ⎟. A =⎜ ⎜ ... ... ... ... ⎟ ⎜ ⎟ a a a ... ⎝ m1 m2 mn ⎠ Определение 1. Минором k -го порядка матрицы A называется определитель порядка k , элементы которого лежат на пересечении любых k строк и любых k столбцов матрицы A ( k не превосходит наименьшего из m или n ). Определение 2. Наибольший порядок не равного нулю минора матрицы A называется рангом матрицы A (обозначается r (A ) или r an g (A ) ). Следовательно, если r – ранг матрицы A , то у матрицы A имеется хотя бы один отличный от нуля минор r -го порядка, а все миноры (r + 1) -го порядка равны нулю. Определение 3. Если r – ранг матрицы A , то любой не равный нулю минор r -го порядка, называется базисным минором. Для нахождения ранга матрицы, вообще говоря, можно проверить равенство нулю всех миноров (любого порядка) данной матрицы, однако такой способ требует большого объема вычислений. Более экономичным является способ, основанный на использовании того факта, что ранги эквивалентных матриц совпадают. Дело в том, что ранг матрицы A совпадает с числом линейно независимых строк (столбцов), а это число не меняется при элементарных преобразованиях. По этому способу матрица приводится к диагональному виду, из которого не равный нулю минор наивысшего порядка находится без затруднений. Пример 2. Найти ранг матрицы
⎛1 0 1 2 1⎞ ⎜ ⎟ A = ⎜ 1 1 −1 1 0 ⎟ . ⎜2 1 2 1 1⎟ ⎝ ⎠ Решение.
⎛1 ⎜ A => A 1 = ⎜ 0 ⎜0 ⎝ ⎛1 ⎜ A3 = ⎜0 ⎜0 ⎝
0 1 2 1⎞ ⎛1 ⎟ ⎜ 1 −2 −1 −1⎟ => A 2 = ⎜ 0 ⎜0 1 0 −3 −1⎟⎠ ⎝ 0 0 0 0⎞ ⎛1 ⎟ ⎜ 1 −2 −1 −1⎟ => A 4 = ⎜ 0 ⎜0 0 2 −2 0 ⎟⎠ ⎝
0 1 2 1⎞ ⎟ 1 −2 −1 −1⎟ => 0 2 −2 0 ⎟⎠ 0 0 0 0⎞ ⎟ 1 0 0 0⎟. 0 2 0 0 ⎟⎠
A 1 получаем из A , вычитая из второй строки первую, а из третьей строки первую, умноженную на –2; из третьей строки вычитаем вторую – полу-
88
чаем A 2 ; подобным образом получаем нули и над главной диагональю. Ясно, что r = 3 . 3 Линейная независимость строк и теорема о базисном миноре Определение 4. Строка A = (a 1 ,a 2 ,...,a n ) называется линейной комбинацией
строк
A 1 = (b11 ,b12 ,...,b1n ) ,
A 2 = (b 21 ,b 22 ,...,b 2n ) ,
…,
A k = (bk 1 ,bk 2 ,...,bkn ) , если для некоторых чисел γ 1 , γ 2 , …, γ k справедливо равенство A = γ 1A 1 + γ 2A 2 + ...γ k A k или a j = γ 1b1j + γ 2b 2 j + ...γ kbkj
( j = 1, 2,..., n ) . Определение 5. Строки A 1 , A 2 ,..., A l называются линейно независимыми, если равенство γ 1A 1 + γ 2A 2 + ... + γ l A l = 0 возможно лишь в том случае, когда все числа γ 1 , γ 2 ,..., γ l равны нулю. В противном случае строки называются линейно зависимыми. Теорема 1. Для того чтобы строки A 1 , A 2 ,..., A l были линейно зависимы, необходимо и достаточно, чтобы хотя бы одна из этих строк являлась бы линейной комбинацией остальных строк. Доказательство. Необходимость. Пусть строки линейно зависимы, т.е. γ 1A 1 + γ 2A 2 + ... + γ l A l = 0 , где хотя бы одно из чисел γ i не равно нулю. Пусть для определенности γ 1 ≠ 0 , тогда, разделив предыдущее равенство на γ 1 , получим: A 1 = −
γ γ2 γ A 2 − 3 A 3 − ... − l A l , а это означает, что A 1 являγ1 γ1 γ1
ется линейной комбинацией A 2 , A 3 ,..., A l . Достаточность. Пусть одна из строк (например A 1 ) является линейной комбинацией остальных строк, т.е. A 1 = μ2A 2 + μ3A 3 + ... + μl A l => ( −1)A 1 + μ2A 2 + μ3A 3 + ... + μl A l = 0 , т.е. строки A 1 , A 2 ,..., A l линейно зависимы. Теорема доказана. Рассмотрим теперь произвольную матрицу:
⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ a a a ... n 21 22 2 ⎟, A =⎜ ⎜ ... ... ... ... ⎟ ⎜ ⎟ a a a ... ⎝ m1 m2 mn ⎠ и пусть r – ранг матрицы A . Тогда существует не равный нулю минор r -го порядка – базисный минор этой матрицы. Строки и столбцы, на пересечении которых стоит базисный минор, назовем соответственно базисными строчками и базисными столбцами. Теорема 2. (Теорема о базисном миноре). 89
Базисные строки (базисные столбцы) линейно независимы. Любая строка (любой столбец) матрицы A является линейной комбинацией базисных строк (базисных столбцов). Доказательство. Все рассуждения приведем для строк. Независимость базисных строк будем доказывать от противного. Пусть базисные строки линейно зависимы. Тогда по теореме 1 одна из строк является линейной комбинацией остальных. Но тогда из свойств определителя вытекает, что базисный минор равен нулю, чего не может быть, следовательно, базисные строки линейно независимы. Докажем теперь, что любая строка матрицы A является линейной комбинацией базисных строк. Не нарушая общности, можно считать, что базисный минор расположен в левом верхнем углу матрицы A . Рассмотрим определитель (r + 1) -го порядка вида:
a 11 a 12 a 21 a 22 . Δ= . ar1 ar 2 a k1 a k 2
... ... . ... ...
a 1r a 2r . a rr a kr
a 1j a 2j . , a rj a kj
полученный добавлением к базисному минору частей любой k -й строки и любого j -го столбца матрицы A . Докажем, что Δ = 0 . Если j ≤ r или k ≤ r , то Δ = 0 , так как он содержит два одинаковых столбца или две одинаковых строки. Если j > r и k > r , то Δ – есть минор (r + 1) -го порядка матрицы A , а всякий такой минор равен нулю. Итак, Δ = 0 . Разлагая Δ по элементам последнего столбца и обозначая алгебраические дополнения элементов a ij буквами c i = A ij , получим
c 1a 1j + c 2a 2 j + ... + c r a r j + c r +1a kj = 0 ( j = 1, 2,..., n ) . Но c r +1 = A kj равно базисному минору, поэтому c r +1 ≠ 0 . Отсюда, обозначая γ 1 = −
c1 c , γ 2 = − 2 , …, c r +1 c r +1
cr , из последнего равенства получим: c r +1 a kj = γ 1a 1j + γ 2a 2 j + ... + γ r a r j ( j = 1, 2,..., n ) , а это означает, что любая k -я строка матрицы A является линейной
γr = −
комбинация базисных строк. Теорема доказана.
§3 Исследование линейных алгебраических систем. Рассмотрим систему m линейных алгебраических уравнений с неизвестными x 1 , x 2 ,..., x n
90
⎧a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎪ ⎪a 21x 1 + a 22x 2 + ... + a 2n x n = b 2 . ⎨ . . . ⎪ ⎪⎩a m 1x 1 + a m 2x 2 + ... + a m n x n = bm
(1)
Система (1) называется однородной, если все ее свободные члены b1 ,b 2 ,...,bm равны нулю; если хотя бы один из свободных членов b1 ,b 2 ,...,bm отличен от нуля, то система называется неоднородной. В системе (1) число уравнений может быть меньше, равно или больше числа неизвестных. Решением системы (1) называется такая совокупность n чисел c 1 ,c 2 ,...,c n , что каждое из уравнений системы (1) обращается в тождество после замены в нем неизвестных x i соответствующими числами c i (i = 1, 2,..., n ) . Система (1) может не иметь ни одного решения, может иметь одно решение, решений может быть и бесконечно много. Система уравнений (1) называется совместной, если она имеет хотя бы одно решение и несовместной, если у нее не существует ни одного решения. Совместная система (1) называется определенной, если она имеет единственное решение, и неопределенной, если у нее существует по крайней мере два решения. Две системы называются эквивалентными, если любое решение одной из них является решением и другой системы. Заметим, что все несовместные системы являются эквивалентными. 1 Решение системы линейных алгебраических уравнений в матричном виде Возьмем систему вида (1) и введем в рассмотрение следующие матрицы:
⎛ a 11 a 12 ⎜ a a 22 A = ⎜ 21 ⎜ ... ... ⎜ ⎝a m 1 a m 2
... a 1n ⎞ ⎛ a 11 a 12 ⎟ ⎜ ... a 2n ⎟ a 21 a 22 , Ap = ⎜ ⎜ ... ... ... ⎟ ... ⎟ ⎜ ... a m n ⎠ ⎝a m 1 a m 2 ⎛ b1 ⎞ ⎜ ⎟ b B =⎜ 2 ⎟. ⎜ ... ⎟ ⎜ ⎟ ⎝ bn ⎠
... a 1n ... a 2n ... ... ... a m n
b1 ⎞ ⎛ x1 ⎞ ⎟ ⎜ ⎟ b2 ⎟ x2 , X =⎜ ⎟, ⎜ ... ⎟ ... ⎟ ⎟ ⎜ ⎟ bm ⎠ ⎝xn ⎠
Матрица A называется матрицей коэффициентов системы (1), A p называется расширенной матрицей коэффициентов системы (1), одностолбцовая матрица B называется матрицей свободных членов, одно-
91
столбцовая матрица X – матрицей неизвестных. Найдем произведение A ⋅X .
⎛ a 11 a 12 ⎜ a a 22 A ⋅ X = ⎜ 21 ⎜ ... ... ⎜ ⎝a m 1 a m 2
... a 1n ⎞ ⎛ x 1 ⎞ ⎛ a 11x 1 + a 12x 2 + ... + a 1n x n ⎟ ⎜ ⎟ ⎜ ... a 2n ⎟ ⎜ x 2 ⎟ ⎜ a 21x 1 + a 22x 2 + ... + a 2n x n ⋅ = ... ... ⎟ ⎜ ... ⎟ ⎜ . . . ⎟ ⎜ ⎟ ⎜⎜ ... a m n ⎠ ⎝ x n ⎠ ⎝ a m 1x 1 + a m 2x 2 + ... + a m n x n
⎞ ⎟ ⎟. ⎟ ⎟⎟ ⎠
Очевидно, что в силу системы (1) полученную матрицу можно приравнять матрице B . Следовательно, вместо системы (1) мы можем рассматривать матричное уравнение A ⋅X = B . Рассмотрим линейную систему, у которой число неизвестных совпадает (2) с числом уравнений:
⎧a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎪ ⎪a 21x 1 + a 22x 2 + ... + a 2n x n = b 2 . ⎨ . . . ⎪ ⎪⎩a n 1x 1 + a n 2x 2 + ... + a nn x n = bn Матрица коэффициентов этой системы квадратная, т.е.
⎛ a 11 a 12 ⎜ a a 22 A = ⎜ 21 ⎜ . . ⎜ ⎝a n 1 a n 2
... a 1n ⎞ ⎟ ... a 2n ⎟ . . . ⎟ ⎟ ... a nn ⎠ Допустим, что detA ≠ 0 , тогда у матрицы A существует обратная A −1 . Запишем систему в матричном виде A ⋅ X = B . Умножив левую и правую части этого уравнения слева на A −1 , получим A −1 ⋅ A ⋅ X = A −1 ⋅ B => E ⋅ X = A −1 ⋅ B . Итак, решение системы (2) в матричном виде X = A −1 ⋅ B . Заметим, что это решение – единственное. Пример 1. Найти решение системы в матричном виде:
2x + y + z = 3⎫ ⎪ x + 2y − z = 0 ⎬ . x − y + z = 2 ⎪⎭ Решение. Обозначим через A матрицу коэффициентов данной матрицы систему, B – матрицу-столбец из свободных членов, X – искомую матрицу-столбец. Ясно, что
92
⎛2 1 1 ⎞ ⎛ 3⎞ ⎛x ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ A = ⎜ 1 2 −1 ⎟ , B = ⎜ 0 ⎟ , X = ⎜ y ⎟ . ⎜ ⎟ ⎜ 2⎟ ⎜z ⎟ ⎝ 1 −1 1 ⎠ ⎝ ⎠ ⎝ ⎠ Данная система в матричном виде A ⋅ X = B , ее решение X = A −1 ⋅ B . Найдем обратную матрицу A −1 . Прежде всего 2
1
1
det A = 1
2
−1 = 2 ⋅ 2 ⋅ 1 + 1 ⋅ ( −1) ⋅ 1 + 1 ⋅ ( −1) ⋅ 1 − 1 ⋅ 2 ⋅ 1 −
1 −1
1
−( −1)( −1) ⋅ 2 − 1 ⋅ 1 ⋅ 1 = 4 − 1 − 1 − 2 − 2 − 1 = −3. Найдем алгебраические дополнения матрицы A .
A 11 = ( −1)1+1
2 −1 = 1, −1 1
A 21 = ( −1)2+1
1 1 = −2 , −1 1
A 31 = ( −1)3+1
1 1 = −3 , 2 −1
A 12 = ( −1)1+ 2
1 −1 = −2 , 1 1
A 22 = ( −1)2+ 2
2 1 = 1, 1 1
A 32 = ( −1)3+ 2
2 1 = 3, 1 −1
A 13 = ( −1)1+3
1 2 = −3 , 1 −1
A 23 = ( −1)2+3
2 1 = 3, 1 −1
A 33 = ( −1)3+3
2 1 = 3. 1 2
Получаем обратную матрицу A −1
⎛ 1 2 ⎞ 1⎟ ⎜−3 3 ⎛ 1 −2 − 3 ⎞ ⎜ ⎟ 1 1 ⎜ ⎟ ⎜ 2 −1 A = − ⎜ −2 1 3 ⎟ = − −1⎟ . ⎜ ⎟ 3⎜ 3 3 ⎟ ⎝ −3 3 3 ⎠ ⎜ 1 −1 −1⎟ ⎜⎜ ⎟⎟ ⎝ ⎠ −1 Вычислим X = A ⋅ B 2 ⎛ 1 2 ⎞ ⎛ 1 ⎞ 1⎟ ⎜−3 3 ⎜ − 3 ⋅ 3 + 3 ⋅ 0 + 1⋅ 2 ⎟ ⎛x ⎞ ⎜ ⎟ ⎛ 3⎞ ⎜ ⎟ ⎛1⎞ 1 2 1 ⎜ ⎟ ⎜ 2 ⎜ ⎟ ⎜ ⎟ X = ⎜y ⎟ = − −1 ⎟ ⋅ ⎜ 0 ⎟ = ⎜ ⋅ 3 − ⋅ 0 − 1 ⋅ 2 ⎟ = ⎜ 0 ⎟ . ⎜ ⎟ ⎜ ⎟ 3 3 ⎜z ⎟ ⎜ 3 ⎜ 2⎟ ⎜ 3 ⎟ ⎟ ⎜⎝ 1 ⎟⎠ ⎝ ⎠ ⎝ ⎠ 1 1 1 1 3 1 0 1 2 − − ⋅ − ⋅ − ⋅ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ ⎠ ⎝ ⎠ Итак, получим решение данной системы в матричном виде 93
⎛x ⎞ ⎛ 1 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜y ⎟ = ⎜ 0⎟ . ⎜z ⎟ ⎜1⎟ ⎝ ⎠ ⎝ ⎠ От такой записи решения можно перейти к более привычной форме записи: x = 1 , y = 0 , z = 1 . 2 Правило Крамера
1
Для простоты выкладок рассмотрим систему n линейных алгебраических уравнений с n неизвестными, положив n = 3
⎧a 11x 1 + a 12x 2 + a 13x 3 = b1 ⎪ ⎨a 21x 1 + a 22x 2 + a 23x 3 = b 2 . ⎪ ⎩a 31x 1 + a 32x 2 + a 33x 3 = b3 Пусть определитель этой системы отличен от нуля, т.е. detA ≠ 0 . Тогда можно записать решение этой системы в матричном виде, положив Δ = detA .
⎛ x1 ⎞ ⎛ A 11 A 21 A 31 ⎞ ⎛ b1 ⎞ ⎛ b1A 11 b 2A 21 b3A 31 ⎞ ⎜ ⎟ 1⎜ ⎟ ⎜ ⎟ 1⎜ ⎟ ⎜ x 2 ⎟ = Δ ⎜ A 12 A 22 A 32 ⎟ ⋅ ⎜ b 2 ⎟ = Δ ⎜ b1A 12 b 2A 22 b3A 32 ⎟ . ⎜x ⎟ ⎜A ⎟ ⎜ ⎟ ⎜b A ⎟ ⎝ 3⎠ ⎝ 13 A 23 A 33 ⎠ ⎝ b3 ⎠ ⎝ 1 13 b 2A 23 b3A 33 ⎠ Следовательно,
b1 a 12 a 13 b1A 11 + b 2A 21 + b3A 31 1 x1 = = b 2 a 22 a 23 ; Δ Δ b3 a 32 a 33 a 11 b1 a 13 b1A 12 + b 2A 22 + b3A 32 1 = a 21 b 2 a 23 ; x2 = Δ Δ a 31 b3 a 33 a 11 a 12 b1 b1A 13 + b 2A 23 + b3A 33 1 = a 21 a 22 b 2 . x3 = Δ Δ a 31 a 32 b3 Полученные формулы для вычисления x 1 , x 2 , x 3 называются формулами Крамера, а соответствующее правило – правилом Крамера. Итак, если определитель системы n линейных алгебраических уравнений с n неизвестными Δ
отличен от нуля, то по формулам Крамера: x i =
* Крамер Г. (1704 – 1752) – швейцарский математик.
94
Δx i Δ
(i = 1, 2,..., n ) , где определитель Δx i получается из определителя системы путем замены i -го столбца столбцом из свободных членов. Пример 2. Найти решение системы
2x + y + z = 3⎫ ⎪ x + 2y − z = 0 ⎬ x − y + z = 2 ⎭⎪ по формулам Крамера. Решение. Вычислим определители Δ , Δx , Δy и Δz .
2 1 1 Δ = 1 2 −1 = −3 , 1 −1 1
3 1 1 Δx = 0 2 −1 = −3 , 2 −1 1
2 3 1 Δy = 1 0 −1 = 0 , 1 2 1
2 1 3 Δz = 1 2 0 = −3 . 1 −1 2
Δx −3 Δy Δz −3 = 0; z = = =1. = = 1; y = Δ Δ −3 Δ −3 Итак, решение данной системы: x = 1, y = 0, z = 1 .
Имеем x =
3 Метод Гаусса 2 Отметим, что формулы Крамера (так же как и решение систем в матричном виде) имеют ограниченное применение, потому, что уже для систем выше 4-го порядка приводят к громоздким вычислениям. Кроме того, формулы Крамера применимы, если число уравнений совпадает с числом неизвестных и при этом определитель системы Δ ≠ 0 . Для исследования систем m алгебраических уравнений с n неизвестными в последнее время, особенно в связи с развитием вычислительной техники широкое применение получил метод Гаусса. Итак, рассмотрим систему m алгебраических уравнений с n неизвестными, причем a 11 ≠ 0 .
⎧a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎪ ⎪a 21x 1 + a 22x 2 + ... + a 2n x n = b 2 . ⎨ . . . ⎪ ⎩⎪a m 1x 1 + a m 2x 2 + ... + a m n x n = bm
(1)
Заметим, что условие a 11 ≠ 0 нетрудно выполнить. Действительно, для этого достаточно переставить уравнения таким образом, чтобы в первом *
Карл Фридрих Гаусс (1777 – 1855) – великий немецкий математик.
95
уравнении при первой неизвестной коэффициент был бы отличен от нуля, в противном случае система не содержала бы переменной x 1 . Оставляя теперь неизменным первое уравнение, преобразуем остальные уравнения таким образом, чтобы коэффициенты при неизвестной x 1 обратились бы в нуль (для этого достаточно ко второму уравнению прибавить первое уравнение, умноженное на − на −
−
a 21 , к третьему уравнению – первое, умноженное a 11
a 31 , и т.д., к m -му уравнению прибавить первое, умноженное на a 11
am1 ). a 11 В результате получим систему, эквивалентную системе (1), в виде:
⎧a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎪ a 22′x 2 + ... + a 2n ′x n = b 2′ ⎪ ⎪⎪ a 32′x 2 + ... + a 3n ′x n = b3′ . ⎨ ⎪ . . . ⎪ ⎪ a ′x + ... + a ′x = b ′ m2 2 nn n n ⎪⎩
(2)
Потребуем, чтобы в системе (2) был бы отличен от нуля коэффициент
a 22′ , чего можно опять-таки добиться с помощью перестановки уравнений. Если же после первого шага во всех уравнениях, кроме первого, коэффициенты обратятся в нуль, то приступают к следующему шагу, а именно: повторяя алгоритм Гаусса, аннулируем далее коэффициенты при x 2 во всех уравнениях, начиная с 3-го. Причем, после какого-то шага число уравнений может уменьшаться (это имеет место, если какие-то уравнения являются линейными комбинациями других уравнений, т.е. не являются независимыми). После последнего шага мы можем придти к таким ситуациям: 1) Число неизвестных совпадает с числом уравнений, и матрица систе* мы приведена к треугольному виду (a nn ≠ 0) :
⎧a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎪ * a 22 x 2 + ... + a 2*n x n = b 2* ⎪ . ⎨ . . . ⎪ * ⎪ a nn x n = bn* ⎩
(3)
bn* Теперь можно из последнего уравнения выразить x n = * , подставить a nn найденное x n в предыдущее уравнение, найти x n −1 и идти далее восходя96
щим ходом к первому уравнению, находя шаг за шагом x n −1 , x n −2 ,..., x 2 , x 1 . Очевидно, что в этом случае ранг матрицы
⎛ a 11 a 12 ⎜ a a 22 A = ⎜ 21 ⎜ ... ... ⎜ ⎝a m 1 a m 2
... a 1n ⎞ ⎟ ... a 2n ⎟ ... ... ⎟ ⎟ ... a m n ⎠
совпадает с рангом расширенной матрицы
т.е. r (A ) = r (A p ) = n .
⎛ a 11 a 12 ⎜ a a 22 A p = ⎜ 21 ⎜ ... ... ⎜ ⎝a m 1 a m 2
b1 ⎞ ⎟ b2 ⎟ , ... ⎟ ⎟ bm ⎠
... a 1n ... a 2n ... ... ... a m n
Действительно, матрица системы (3) получена с помощью элементарных преобразований над строчками исходной матрицы. В этом случае система имеет единственное решение. 2) Число неизвестных меньше числа уравнений, т.е. система имеет вид:
⎧a 11x 1 + a 12x 2 + ... + a 1k x k + ... + ⎪ * a 22 x 2 + ... + a 2*k x k + ... + ⎪ ⎪ . ⎪ . ⎪ ⎨ * a nk x k + ... + ⎪ ⎪ 0 ⋅ x k + ... + ⎪ . ⎪ ⎪ 0 ⋅ x k + ... + ⎩
a 1n x n = b1 a 2*n x n = b 2* . .
. . * a nn x n = bn*
,
0 ⋅ x n = bn* +1 .
. 0 ⋅ x n = br*
причем bn* +1 ,bn* + 2 ,...,br* отличны от нуля. В этом случае ранг матрицы системы меньше ранга ее расширенной матрицы, т.е. r (A ) < r (A p ) , тогда некоторые из уравнений системы противоречат остальным, т.е. система несовместна. 3) Число уравнений меньше числа неизвестных, т.е. система имеет вид:
⎧a 11x 1 + a 12x 2 + ... + a 1k x k + a 1 k +1x k +1 + ... + ⎪ * a 22 x 2 + ... + a 2*k x k + a 2* k +1x k +1 + ... + ⎪ ⎨ . ⎪ * ⎪ a kk x k + a k* k +1x k +1 + ... + ⎩
97
a 1n x n = b1 a 2*n x n = b 2* .
. * a kn x n = bn*
.
Примем x k +1 , x k + 2 ,..., x n за параметры, т.е. будем считать, что они принимают любые значения, тогда систему можно записать в виде:
⎧a 11x 1 + a 12x 2 + ... + a 1k x k ⎪ * a 22 x 2 + ... + a 2*k x k ⎪ ⎨ ⎪ * ⎪ a kk xk ⎩
= b1 − a 1 k +1x k +1 − ... − a 1n x n = b 2* − a 2* k +1x k +1 − ... − a 2*n x n .
.
.
.
* = bn* − a k* k +1x k +1 − ... − a kn xn
Система имеет бесчисленное множество решений, r (A ) = r (A p ) < n . Замечание. При исследовании систем методом Гаусса систему обычно не выписывают, а работают с расширенной матрицей системы A p , выполняя элементарные преобразования, соответствующие алгоритму Гаусса. Пример 3. Исследовать систему методом Гаусса
2x + y + z = 3⎫ ⎪ x + 2y − z = 0 ⎬ . x − y + z = 2 ⎪⎭ Решение. Запишем расширенную матрицу коэффициентов данной системы и приведем ее к треугольному виду: 1 1 3 ⎞ ⎛ 1 −1 1 2⎞ ⎛2 ⎜ ⎟ ⎜ ⎟ A p = ⎜ 1 2 −1 0 ⎟ → ⎜ 2 1 1 3⎟ → ⎜ 1 2 ⎠⎟ ⎝⎜ 1 2 − 1 0 ⎠⎟ ⎝ 1 −1 1 2 ⎞ ⎛ 1 −1 1 2⎞ ⎛ 1 −1 ⎜ ⎟ ⎜ ⎟ → ⎜0 3 −1 −1 ⎟ → ⎜ 0 3 −1 −1 ⎟ . ⎜0 3 − 2 − 2 ⎟⎠ ⎜⎝ 0 0 − 1 − 1 ⎟⎠ ⎝ Вернемся теперь обратно к системе, записанной в привычном виде:
x − y + z = 2⎫ ⎪ 3y − z = −1⎬ . −z = −1⎪⎭ Теперь следует применить восходящий ход алгоритма Гаусса и выписать решение: −z = −1 => z = 1 , подставим z = 1 во второе уравнение, тогда получим y = 0 ; и, наконец, подставим y = 0 и z = 1 в первое уравнение, получим x = 0 − 1 + 2 = 1 . В результате имеем решение данной системы: x = 1, y = 0, z = 1 . Пример 4. Исследовать систему методом Гаусса
98
⎧x 1 − x 2 ⎪ ⎪x 1 + x 2 ⎨ ⎪x1 − x 2 ⎪ 3x − x 2 ⎩ 1
+ x 3 + 2x 4 −
x5 =
0
+ 2x 3 − x 4 +
x5 =
2
− x 3 + x 4 + 2x 5 = − 1 + 3x 3 − x 4 + 4x 5 = 1
Решение.
⎛ 1 −1 1 2 −1 0 ⎞ ⎛ 1 −1 1 2 −1 0 ⎞ ⎜ ⎟ ⎜ ⎟ 1 −3 2 2 ⎟ ⎜ 1 1 2 −1 1 2 ⎟ → ⎜ 0 2 → ⎜ 1 −1 −1 1 2 −1⎟ ⎜ 0 0 −2 −1 3 −1⎟ ⎜ ⎟ ⎜ ⎟ ⎝ 3 1 3 −1 4 1⎠ ⎝ 0 4 0 −7 7 1⎠ ⎛ 1 −1 1 2 −1 0 ⎞ ⎛ 1 −1 1 2 −1 0 ⎞ ⎜ ⎟ ⎜ ⎟ 0 2 1 − 3 2 2 0 2 1 − 3 2 2 ⎟→⎜ ⎟. →⎜ ⎜ 0 0 −2 −1 3 −1⎟ ⎜ 0 0 −2 −1 3 −1⎟ ⎜ ⎟ ⎜ ⎟ ⎝ 0 0 −2 −1 3 −3 ⎠ ⎝ 0 0 0 0 0 −2 ⎠ Вывод: система несовместна. Из приведенных рассуждений с очевидностью вытекает теорема. Теорема Кронекера-Капелли 3 Для того, чтобы линейная система
⎧a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎪ ⎪a 21x 1 + a 22x 2 + ... + a 2n x n = b 2 ⎨ . . . ⎪ ⎩⎪a m 1x 1 + a m 2x 2 + ... + a m n x n = bm была совместна, необходимо и достаточно, чтобы ранг расширенной матрицы A p этой системы был равен рангу матрицы ее коэффициентов A , т.е.
r (A ) = r (A p ) (без доказательства). §4 Однородные системы линейных алгебраических уравнений. Фундаментальная система решений. Рассмотрим однородную систему линейных алгебраических уравнений
*
Л. Кронекер (1823-1891) – немецкий математик, А. Капелли (1855 – 1910) – итальянский математик
99
⎧a 11x 1 + a 12x 2 + ... + a 1n x n = 0 ⎪ ⎪a 21x 1 + a 22x 2 + ... + a 2n x n = 0 ⎨ . . . ⎪ ⎪⎩a m 1x 1 + a m 2x 2 + ... + a m n x n = 0
(1)
или в матричной форме A ⋅ X = 0 , где 0 – нулевой столбец. Свойства однородной системы 1) Однородная система совместна, поскольку всегда имеет нулевое (тривиальное) решение. 2) Пусть
⎛ α1 ⎞ ⎛ β1 ⎞ ⎜ ⎟ ⎜ ⎟ α2 ⎟ β2 ⎜ X = иY =⎜ ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ αn ⎠ ⎝ βn ⎠ – два решения однородной системы (1). Линейная комбинация этих решений λX + μY , где λ , μ ∈ R , также является решением системы. Более того, линейная комбинация любого конечного числа решений однородной системы (1) также является решением этой системы. 3) Если система (1) имеет хотя бы одно ненулевое решение, то она имеет бесконечно много решений. Определение. Совокупность решений X 1 , X 2 ,..., X k однородной системы (1) называется фундаментальной системой решений, если 1) X 1 , X 2 ,..., X k – линейно независимы, 2) любое решение системы X представимо в виде линейной комбинации X 1 , X 2 ,..., X k , т.е. ∃c 1 ,c 2 ,...,c k ∈ R не все равные нулю, такие, что X = c 1X 1 + c 2X 2 + ... + c k X k . Определение. Решение системы (1) вида X = c 1X 1 + c 2X 2 + ... + +c k X k , где X 1 , X 2 ,..., X k – фундаментальная система решений; c 1 ,c 2 ,...,c k – произвольные действительные постоянные, представляющее всевозможные решения системы (1) называют общим решением однородной системы. 4. Теорема (о фундаментальной системе решений) Если ранг r матрицы A однородной системы (1) меньше числа неизвестных n , то система имеет фундаментальную систему решений, состоящую из n − r решений.
100
Доказательство. Доказательство этой теоремы дает способ отыскания фундаментальной системы решений. Рассмотрим матрицу A системы (1)
⎛ a 11 ⎜ ⎜ a 21 ⎜ . A =⎜ ⎜ ar1 ⎜ . ⎜⎜ ⎝a m 1
... a 1r
a 1 r +1
... a 2r . . ... a r r . .
a 2 r +1 . a r r +1 .
... a m r
am
r +1
... a 1n ⎞ ⎟ ... a 2n ⎟ . . ⎟ ⎟. ... a r n ⎟ . . ⎟ ⎟ ... a m n ⎟⎠
(2)
Как и прежде, не умаляя общности, предположим, что базисный минор находится в левом верхнем углу матрицы A . Тогда, по теореме о базисном миноре строки с номерами от r + 1 до m представимы в виде линейных комбинаций базисных строк. Значит, пользуясь свойствами сложения строк матриц и умножения строк на число, мы можем получить матрицу, у которой строки с номерами, большими r , нулевые. Следовательно, их можно отбросить. Соответствующая ей однородная система эквивалентна исходной, но имеет r уравнений. Запишем ее в следующем виде:
⎧a 11x 1 + a 12x 2 + ... + a 1r x r = −a 1 r +1x r +1 − ... − a 1n x n ⎪ ⎪a 21x 1 + a 22x 2 + ... + a 2r x r = −a 2 r +1x r +1 − ... − a 2n x n . ⎨ . . . ⎪ ⎪⎩a r 1x 1 + a r 2x 2 + ... + a r r x r = −a r r +1x r +1 − ... − a r n x n
(3)
Неизвестные x 1 , x 2 ,..., x r назовем базисными, а остальные n − r неизвестных x r +1 , x r + 2 ,..., x n – свободными. Если свободным неизвестным придать какие-либо фиксированные значения, то из системы (3) базисные неизвестные можно найти единственным образом, поскольку A * – квадратная матрица системы, ее элементы образуют базисный минор ( detA * ≠ 0 ). Придадим свободным неизвестным следующие наборы значений:
⎛1⎞ ⎜ ⎟ ⎜0⎟ ⎜ 0 ⎟; ⎜ ⎟ ⎜ ... ⎟ ⎜0⎟ ⎝ ⎠
⎛0⎞ ⎜ ⎟ ⎜1⎟ ⎜ 0 ⎟; ⎜ ⎟ ⎜ ... ⎟ ⎜0⎟ ⎝ ⎠
⎛0⎞ ⎜ ⎟ ⎜0⎟ ⎜ 1 ⎟; … ; ⎜ ⎟ ⎜ ... ⎟ ⎜0⎟ ⎝ ⎠
⎛0⎞ ⎜ ⎟ ⎜0⎟ ⎜ 0 ⎟. ⎜ ⎟ ⎜ ... ⎟ ⎜1⎟ ⎝ ⎠
В каждом i -ом наборе все элементы, кроме одного, равны 0, а отличный от нуля (единица), стоит на i -ом месте. Всего таких наборов n − r . Подставим поочередно эти наборы значений переменных x r +1 ,..., x n в систему (3), решим ее относительно x 1 , x 2 ,..., x r и получим следующие решения:
101
⎛ x 11 ⎞ ⎜ 1⎟ ⎜x 2 ⎟ ; ⎜ ... ⎟ ⎜⎜ 1 ⎟⎟ ⎝xr ⎠
⎛ x 12 ⎞ ⎜ 2⎟ ⎜ x 2 ⎟ ; ...; ⎜ ... ⎟ ⎜⎜ 2 ⎟⎟ ⎝xr ⎠
⎛ x 1n −r ⎜ n −r ⎜x 2 ⎜ ... ⎜⎜ n −r ⎝xr
⎞ ⎟ ⎟. ⎟ ⎟⎟ ⎠
Теперь объединим соответствующие решения и получим такую совокупность решений системы (3), а значит и (1):
⎛ x 11 ⎞ ⎛ x 12 ⎞ ⎛ x 1n −r ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ M ⎟ ⎜ M ⎟ ⎜ M ⎟ ⎜ x r1 ⎟ ⎜ x r2 ⎟ ⎜ x rn −r ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ X 1 = ⎜ 1 ⎟ ; X 2 = ⎜ 0 ⎟ ; ...; X n −r = ⎜ 0 ⎟ . ⎜0⎟ ⎜1⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ M M M ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜0⎟ ⎜0⎟ ⎜ 1 ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ Покажем, что эта система решений будет фундаментальной. Для этого надо проверить два условия из определения. 1) Проверим линейную независимость столбцов X 1 , X 2 ,..., X n −r . Рассмотрим матрицу, составленную из столбцов X 1 , ..., X n −r
⎛ x 11 x 12 ⎜ 1 2 ⎜x 2 x 2 ⎜ ... ... ⎜ 1 2 ⎜xr xr ⎜1 0 ⎜ ⎜0 1 ⎜ ... ... ⎜ ⎜0 0 ⎝
... x 1n −r ⎞ ⎟ ... x 2n −r ⎟ ... ... ⎟ ⎟ ... x rn −r ⎟ . ... 0 ⎟ ⎟ ... 0 ⎟ ... ... ⎟ ⎟ 1 ⎟⎠ ...
Минор порядка n − r , образованный последними n − r строками, отличен от нуля. Следовательно, ранг данной матрицы равен n − r , и по теореме о базисном миноре все столбцы линейно независимы, что и означает линейную независимость решений X 1 , X 2 ,..., X n −r . 2) Возьмем произвольное решение однородной системы (1)
102
⎛ x1 ⎞ ⎜ ⎟ x X =⎜ 2 ⎟. ⎜ ... ⎟ ⎜ ⎟ ⎝xn ⎠ Рассмотрим одностолбцовую матрицу Y : Y = X − x r +1X 1 − x r + 2X 2 − ... − x n X n −r . (4) По свойствам однородных систем Y – решение системы (1). Выполнив все
действия
в
правой Y = (y 1 , y 2 ,..., y r , 0, 0,..., 0) .
части
равенства
(4),
получим
T
Кроме того, Y является решением системы (3), которая равносильна системе (1). Нулевому значению свободных неизвестных соответствует (единственное) нулевое решение системы (3). Значит, Y = 0 . Подставив это значение в равенство (4), получим X = = x r +1X 1 + x r + 2X 2 + ... + +x n X n −r , то есть произвольное решение X однородной системы (1) является линейной комбинацией решений X 1 , X 2 ,..., X n −r . И так очевидно, что X 1 , X 2 ,..., X n −r образуют фундаментальную систему решений. Следствие. Однородная система (1), у которой число неизвестных n совпадает с числом уравнений m , имеет ненулевое решение тогда и только тогда, когда определитель матрицы системы det A = 0 .
§5 Неоднородные системы линейных алгебраических уравнений. Рассмотрим произвольную систему линейных алгебраических уравнений представив ее в матричной форме A ⋅X = B . (1) Соответствующей ей однородной системой будем называть систему A ⋅ X = 0, (2) где 0 – нулевой столбец. 1 Некоторые свойства решений неоднородной системы и их связь с решением соответствующей однородной системы 1. Если Y является решением неоднородной системы, а X – решением однородной системы, то Z =Y + X – решение неоднородной системы линейных уравнений Доказательство. Из условия имеем A ⋅Y = B и A ⋅ X = 0 .
A ⋅Y + A ⋅ X = A ⋅ (Y + X ) = A ⋅ Z ⎫ Найдем ⎬ => A ⋅ Z = B . С другой стороны A ⋅Y + A ⋅ X = B + 0 = B ⎭ Тогда Z =Y + X является решением неоднородной системы. 103
2. Если Y и Z – решения неоднородной системы, то столбец X =Y − Z является решением соответствующей однородной системы. Доказывается аналогично свойству 1. 3. Любое решение Z неоднородной системы представимо в виде суммы Z =Y + X , где столбец Y – частное решение неоднородной системы, а столбец X – решение однородной системы, соответствующей системе (1). 4. Пусть X 1 , X 2 ,..., X n −r фундаментальная система решений однородной системы (2), а Y – частное решение неоднородной системы. Тогда все множество решений неоднородной системы представимо в виде Z =Y + c 1X 1 + c 2X 2 + ... + c n −r X n −r , (3) где r – ранг матрицы системы; c 1 ,c 2 ,...,c n −r – произвольные постоянные. При этом выражение (3) называют общим решением системы. Доказательство. По свойству 3 всякое решение неоднородной системы представимо в виде Z =Y + X , а любое решение однородной системы в виде X = c 1X 1 + ... + c n −r X n −r по теореме о фундаментальной системе решений. Пример 1. Решить однородную систему
⎧ x 1 + 2x 2 + x 3 = 0 ⎪ ⎨ 2x 1 + x 2 − 3x 3 = 0 . ⎪ ⎩3x 1 + 3x 2 − 2x 3 = 0 Решение. Однородная система всегда совместна и имеет единственное тривиальное решение тогда и только тогда, когда ранг матрицы A этой системы равен числу неизвестных. Вычислим ранг матрицы A , совершая линейные преобразования над строчками
⎛1 2 1 ⎞ ⎛1 2 1 ⎞ ⎛1 2 1 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ A = ⎜ 2 1 −3 ⎟ ~ ⎜ 0 −3 −5 ⎟ ~ ⎜ 0 −3 −5 ⎟ . ⎜ 3 3 −2 ⎟ ⎜ 0 −3 −5 ⎟ ⎜ 0 0 0 ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ Очевидно, что r gA = 2 , т.е. ранг матрицы меньше числа неизвестных и значит система имеет бесконечное множество решений. Исходная система эквивалентна такой:
⎧x 1 + 2x 2 + x 3 = 0 ⎧x 1 + 2x 2 = −x 3 или ⎨ . ⎨ 3 5 0 3 5 − x − x = x = − x 2 3 2 3 ⎩ ⎩ Полагая, например, x 3 = 1, получим систему ⎧x 1 + 2x 2 = −1 , ⎨ 3 5 x = − ⎩ 2 решая которую находим x 2 = −5 / 3 , x 1 = −1 − 2x 2 = 7 / 3 . Т.е. получим ненулевое частное решение x 1 = 7 / 3 , x 2 = −5 / 3 , x 3 = 1. 104
Полагая x 3 = c ( c – любое действительное число) получим общее решение
7 5 x 1 = c , x 2 = − c , x 3 = c (c ∈ 3 3
).
Пример 2. Найти фундаментальную систему решений и общее решение данной однородной системы
⎧x 1 + 2x 2 + x 3 − x 4 = 0 . ⎨ 2 3 0 + − + = x x x x 2 3 4 ⎩ 1 Решение. Вычислим ранг матрицы A этой системы, приведя ее к трапециевидной форме
⎛ 1 2 1 −1 ⎞ ⎛ 1 2 1 −1 ⎞ A =⎜ ⎟~⎜ ⎟. 2 1 3 1 0 3 5 3 − − − ⎝ ⎠ ⎝ ⎠ Очевидно, что r gA = 2 . Данная система эквивалентна такой
⎧x 1 + 2x 2 + x 3 − x 4 = 0 . ⎨ 3 5 3 0 − − + = x x x 2 3 4 ⎩ Фундаментальную систему получим, если положить сначала x 3 = 1 ,
x 4 = 0 а потом x 3 = 0 , x 4 = 1 . Для первого случая будем иметь
⎧x 1 + 2x 2 = −1 , ⎨ 3 5 x − = − ⎩ 2 решая которую, находим x 2 = −5 / 3 , x 1 = 7 / 3 . Т.е. ⎛ 7 / 3⎞ ⎜ ⎟ 5/ 3⎟ ⎜ X1 = . ⎜ 1 ⎟ ⎜ ⎟ ⎝ 0 ⎠ Для второго случая получим систему
⎧x 1 + 2x 2 = 1 , ⎨ x = 1 ⎩ 2 решая которую находим X 2 = ( −1 1 0 1) . T
Итак, фундаментальная система решений имеет вид
X 1 = ( 7 / 3 5 / 3 1 0 ) , X 2 = ( −1 1 0 1) . T
T
Общее решение X получаем, составляя линейную комбинацию фундаментальной системы: X = c1 ⋅ X 1 + c 2 ⋅ X 2 . 105
Т.е. общее решение имеет вид
⎛ 7 / 3⎞ ⎛ −1 ⎞ ⎜ ⎟ ⎜ ⎟ 5/ 3⎟ 1 ⎜ +c2 ⋅⎜ ⎟ X = c1 ⋅ ⎜ 1 ⎟ ⎜0⎟ ⎜ ⎟ ⎜ ⎟ ⎝ 0 ⎠ ⎝1⎠ или в координатной форме
7 ⎧ = x c1 − c 2 1 ⎪ 3 ⎪ ⎪x = − 5 c + c 1 2 ⎨ 2 3 ⎪ ⎪x 3 = c 1 ⎪x = c 2 ⎩ 4
106
(c 1 ,c 2 ∈
).
Пример 3. Решить неоднородную систему
⎧x 1 − 2x 2 + x 3 − 3x 4 + x 5 = 0 ⎪ ⎪2x 1 + x 2 − 2x 3 + x 4 − x 5 = 2 ⎪ ⎨x 1 − x 2 + x 3 − x 4 + x 5 = 14 . ⎪2x − 3x + 2x − 4x + 2x = 14 2 3 4 5 ⎪ 1 ⎪⎩3x 1 − x 2 − x 3 − 2x 4 =2 Решение. Обозначим через A и A r соответственно основную и расширенную матрицы системы
⎛1 ⎜ ⎜2 A = ⎜1 ⎜ ⎜2 ⎜3 ⎝
−2 1 1 −2 −1 1 −3 2 −1 −1
−3 1 ⎞ ⎛ 1 −2 1 ⎜ ⎟ 1 −1⎟ ⎜ 2 1 −2 −1 1 ⎟ , A r = ⎜ 1 −1 1 ⎜ ⎟ −4 2 ⎟ ⎜ 2 −3 2 ⎜ 3 −1 − 1 −2 0 ⎟⎠ ⎝
−3 1 0 ⎞ ⎟ 1 −1 2 ⎟ −1 1 11 ⎟ . ⎟ −4 2 14 ⎟ −2 0 2 ⎟⎠
Сначала надо определить, имеет ли эта система решения и сколько. Для этого приведем расширенную матрицу A r и трапециевидной форме, совершая элементарные преобразования над строками
0 ⎞ ⎛ 1 −2 1 − 3 1 ⎜ ⎟ ⎜ 0 1 0 2 0 14 ⎟ A r ~ ⎜ 0 0 −4 −3 −3 −68 ⎟ = A% r . ⎜ ⎟ 0 ⎟ ⎜0 0 0 0 0 ⎜0 0 0 0 0 0 ⎟⎠ ⎝ ~ При этом матрица A перейдет в A . Очевидно, что rgA = rgA r = 3 , т.е. ранги матриц A и A r совпадают и меньше числа неизвестных. Значит система совместна и имеет бесчисленное множество решений. Решение неоднородной системы в этом случае может быть получено как сумма общего решения соответствующей однородной системы и какоголибо частного решения неоднородной. Чтобы найти решения однородной системы, запишем эквивалентную ~ систему с матрицей A :
⎧x 1 − 2x 2 + x 3 − 3x 4 + x 5 = 0 ⎪ x2 + 2x 4 = 14 . ⎨ ⎪ 4x 3 + 3x 4 + 3x 5 = 68 ⎩
~
За базисный минор возьмем минор, стоящий в левом углу матрицы A , т.е. минор, составленный из коэффициентов перед неизвестными x 1 , x 2 и x 3 . Чтобы найти фундаментальную систему, надо перебрать всевозможные наборы свободных переменных x 4 и x 5 так, чтобы в каждом наборе одна переменная равна 1, а другая 0. Взяв x 4 = 1 , x 5 = 0 из системы 107
⎧x 1 − 2x 2 + x 3 = 3 ⎪ x 2 = 12 , ⎨ ⎪ 4x 3 = 65 ⎩ получим x 3 = 65 / 4 , x 2 = 12 , x 1 = 43 / 4 . Аналогично, взяв x 4 = 0 , x 5 = 1 , получим x 3 = 65 / 4 , x 2 = 14 , x 1 = 59 / 4 . То есть получим фундаментальную систему
X 1 = ( 43 / 4 12 65 / 4 1 0 ) , X 2 = ( 59 / 4 14 65 / 4 0 1) . T
T
Общее решение однородной системы имеет вид X = c1 ⋅ X 1 + c 2 ⋅ X 2 , где c 1 и c 2 – произвольные числа. Теперь найдем какое-либо решение неоднородной системы. Система, соответствующая матрице A r , имеет вид
⎧x 1 − 2x 2 + x 3 − 3x 4 + x 5 = 0 ⎪ x2 + 2x 4 = 14 ⎨ ⎪ 4x 3 + 3x 4 + 3x 5 = 68 ⎩ и эквивалентна данной. Положим свободные переменные x 4 и x 5 равными нулю. Тогда x 3 = 17 , x 2 = 14 , x 1 = 11 , т.е. получили частное решение
z = (17 14 11 0 0 ) . T
Общее решение системы имеет вид X =Y + Z ,т.е.
⎛ 43 / 4 ⎞ ⎛ 59 / 4 ⎞ ⎛ 11 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 12 14 ⎜ ⎟ ⎜ ⎟ ⎜ 14 ⎟ X = c 1 ⋅ ⎜ 65 / 4 ⎟ + c 2 ⋅ ⎜ 65 / 4 ⎟ + ⎜ 17 ⎟ . ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 1 ⎟ ⎜ 0 ⎟ ⎜0⎟ ⎜ 0 ⎟ ⎜ 1 ⎟ ⎜0⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ В координатной форме общее решение запишется так
43 59 ⎧ ⎪ x 1 = 4 c 1 + 4 c 2 + 11 ⎪ ⎪x 2 = 12c 1 + 14c 2 + 14 ⎪⎪ 65 65 ⎨x 3 = c 1 + c 2 + 17 , 4 4 ⎪ ⎪x 4 = c 1 ⎪ ⎪x 5 = c 2 ⎪⎩ 108
где c 1 и c 2 – произвольные числа.
§6 Альтернатива Фредгольма для линейных систем. Рассмотрим линейные системы m уравнений с n неизвестными
⎧a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎪ ⎪a 21x 1 + a 22x 2 + ... + a 2n x n = b 2 ⎨ . . . ⎪ ⎩⎪a m 1x 1 + a m 2x 2 + ... + a m n x n = bn
(1)
⎧a 11y 1 + a 12y 2 + ... + a m 1y m = 0 ⎪ ⎪a 12y 1 + a 22y 2 + ... + a m 2y m = 0 . ⎨ . . . ⎪ ⎩⎪a 1n y 1 + a 2n y 2 + ... + a m n y m = 0
(2)
и
В матричном виде эти системы запишутся соответственно так: A ⋅ X = B и A T ⋅Y = 0 , т.е. матрица коэффициентов в системе (2) получается транспонированием матрицы коэффициентов системы (1). Важную связь между множествами решений этих систем устанавливает так называемая альтернатива Фредгольма. (Альтернатива – это ситуация, когда имеет место одно из двух утверждений. Альтернативами также называют и сами эти утверждения, от латинского alter – другой, один из двух). Альтернативы Фредгольма. Для всяких систем A ⋅ X = B и T A ⋅Y = 0 справедливо одно из двух утверждений: 1. Система A ⋅ X = B имеет решение при любом B тогда и только тогда, когда система A T ⋅Y = 0 имеет только тривиальное (нулевое) решение Y = 0 . 2. Система A ⋅ X = B при некотором B несовместна и тогда система T A ⋅Y = 0 имеет нетривиальное (ненулевое) решение. Доказательство. 1. Пусть система (1), т.е. A ⋅ X = B , имеет решение при любом B (любом наборе b1 ,...,bm ). В этом случае r gA = m , так как иначе при некотором
B rgA оказался бы меньше ранга расширенной матрицы и система (1) была бы несовместной в силу теоремы Кронекера-Капелли. Так как r gA T = r gA , то в этих условиях rgA T = m , то есть равен числу неизвестных в системе (2) и эта система имеет только нулевое (тривиальное) решение.
109
2. Пусть теперь система A ⋅ X = B при некотором B несовместна. Следовательно r gA < m , значит и r gA T < m , т.е. ранг матрицы системы (2) меньше числа неизвестных и эта система имеет ненулевое (нетривиальное) решение. Замечание. Альтернативу Фредгольма можно сформулировать и для линейных операторов. Пример 1. Дана система
⎧ x + 2y + 3z = b1 . ⎨ ⎩2x + 4y + 6z = b 2 Является ли она совместной при любых значениях b1 и b 2 ? Решение. Имеем
⎛ 1 2 3⎞ rg ⎜ ⎟ = 1. 2 4 6 ⎝ ⎠ ⎛1⎞ ⎝0⎠
Если же к матрице приписать справа столбец ⎜ ⎟ , то у расширенной матрицы ранг окажется равным 2. Согласно теореме Кронекера-Капелли система
⎧ x + 2y + 3z = 1 ⎨ ⎩2x + 4y + 6z = 0 несовместна. Следовательно ответ на поставленный вопрос отрицательный. В силу второй альтернативы система однородных уравнений
⎧ y 1 + 2y 2 = 0 ⎪ ⎨2y 1 + 4y 2 = 0 ⎪ 3y + 6y = 0 2 ⎩ 1 должна иметь нетривиальное решение. Действительно, таким решением является, например, y 1 = 2 , y 2 = −1 . Пример 2. Является ли система совместной при любых b1 и b 2 ?
⎧ x + 2y + 3z = b1 . ⎨ + y + z = b 3 x 4 6 ⎩ 2 Решение. Ранг матрицы этой системы равен 2. Значит и ранг расширенной матрицы не может быть меньше двух (и не может быть больше, чем 2). Значит при любых b1 и b 2 ранг матрицы системы равен рангу расширенной матрицы и система совместна. Т.е. ответ на поставленный вопрос положителен. 110
Пример 3. Установить, какая из альтернатив имеет место для системы
⎧x 1 + x 2 = b1 . ⎨ ⎩x 1 − x 2 = b 2 Решение. Так как detA =
1
1
1 −1
= −2 ≠ 0 , то r gA = 2 . Значит и ранг рас-
ширенной матрицы равен 2. Т.е. система совместна при любых b1 и b 2 и имеет место первая альтернатива. Пример 4. Какая из альтернатив имеет место для системы
⎧ x 1 + x 2 + x 3 = b1 . ⎨ 2 x + 2 x + 2 x = b 2 3 2 ⎩ 1 Решение. Так как коэффициенты при неизвестных пропорциональны, то r gA = 1 . При b1 = 1 и b 2 = 0 ранг расширенной матрицы будет равен 2, т.е. система несовместна. Имеет место вторая альтернатива.
§7 Неравенства первой степени с двумя и тремя переменными. Системы неравенств. 1 Линейное неравенство первой степени с двумя переменными
y
y S
N
N
M
M (x ,y )
M0
x
M (x ,y ) I M 0 (x 0 ,y 0 )
II
Рис. 4.7.1
x
Рис. 4.7.2
Рассмотрим на плоскости xO y прямую линию l , проходящую через точку M 0 (x 0 , y 0 ) и параллельную направляющему вектору S (m , n ) (рис.
uuuuuur 4.7.1). Очевидно, что векторы M 0M и S коллинеарны, следовательно, их координаты пропорциональны, т.е.
x −x0 y −y0 . = m n
Очевидно, что это есть ни что иное, как каноническое уравнение прямой l , из которого следует: nx − m y − nx 0 + m y 0 = 0 обозначим n = A , −m = B , −nx 0 + m y 0 = c , тогда уравнение прямой l имеет вид: A x + B y +C = 0 . 111
Напомним, что уравнение прямой, записанное в таком виде, называется общим уравнением прямой l . Введем в рассмотрение вектор N(A , B ) . Очевидно, что N ⋅ S = 0 , т.е. вектор N является нормалью к прямой l . Рассмотрим теперь строгое неравенство A x + B y + C > 0 . Напомним, что решением любого неравенства с двумя переменными f (x , y ) > 0 называется упорядоченная пара чисел (x , y ) , удовлетворяющая (1) этому неравенству; решить неравенство – значит найти множество всех его решений. Установим геометрический смысл неравенства (1). Для этого рассмотрим уравнение A x + B y + C = 0 . На плоскости xO y прямая l , имеющая уравнение A x + B y + C = 0 , разбивает плоскость на две полуплоскости I и II (рис. 4.7.2). Покажем, что в каждой из этих плоскостей трехчлен A x + B y + C имеем постоянный знак, т.е. в одной из них выполняется неравенство A x + B y + C > 0 , а в другой A x + B y + C < 0 (на самой прямой l трехчлен равен нулю). Принимая во внимание, что A x 0 + B y 0 + C = 0 , можем написать:
A x + B y + C = A x + B y + C − (A x 0 + B y 0 + C ) = uuuuuur = A (x − x 0 ) + B (y − y 0 ) = M 0M A x + B y + C = A x + B y + C − (A x 0 + B y 0 + C ) = uuuuuur = A (x − x 0 ) + B (y − y 0 ) = N ⋅ M o M , где M (x , y ) – точка, лежащая в полуплоскости I или II. Очевидно, что
uuuuuur uuuuuur uuuuuur N ⋅ M 0M = M 0M ⋅ прN M 0M .
Если предположить, что вектор нормали равен N(A , B ) , то очевидно,
uuuuuur
что прN M 0M имеет противоположные знаки, если точка M (x , y ) лежит в полуплоскости I или II .
y
y l I
l I
2
−2
2
−2
x
x II
II
Рис. 4.7.4
Рис.4.7.3
Пример 1. Решить неравенство x − y + 2 > 0 . Решение. Прежде всего нарисуем прямую l , имеющую уравнение x − y + 2 = 0 . Она разбивает плоскость на две полуплоскости I и II (рис. 4.7.3). Возьмем точку O (0, 0) – начало координат (не лежит в полуплоскости 112
I ) и подставим координаты этой точки в левую часть уравнения прямой l . Получим x − y + 2 x =0 = 2 > 0 , y =0
т.е. координаты точки O (0, 0) удовлетворяют данному неравенству. Замечание: Нестрогое неравенство x − y + 2 ≥ 0 имеет решение, состоящее из множества точек, лежащих правее и ниже прямой l , к которому следует добавить точки, лежащие на прямой l (рис. 4.7.4). 2 Система линейных неравенств первой степени с двумя неизвестными. Рассмотрим систему неравенств:
⎧ A 1x + B 1y + C 1 > 0 ⎪ ⎪ A 2x + B 2y + C 2 > 0 . ⎨ . . . ⎪ ⎩⎪A n x + B n y + C n > 0
(2)
Решением такой системы неравенств называется множество упорядоченных пар чисел (x , y ) , удовлетворяющих каждому из неравенств системы (2). Очевидно, что геометрически множество решений системы (2) состоит из всех точек плоскости xO y , координаты которых удовлетворяют каждому неравенству системы. Пример 2. Построить множество решений системы:
⎧ x −y + 2 ≥ 0 ⎪ ⎪ x +y −6≤ 0 . ⎨ x y 2 7 0 + − > ⎪ ⎪⎩ y ≥2 Решение. Строим прямые x − y + 2 = 0 , x + y − 6 = 0 , x + 2y − 7 = 0 , y = 2 . Множеством решений каждого неравенства системы является одна из полуплоскостей, на которые разбивает плоскость соответствующая прямая. Множеством решений системы является их общая часть, представляющая собою четырехугольник A B C D , изображенный на рис. 4.7.5. При этом точки, лежащие на сторонах четырехугольника, в это множество включаются.
113
6 5 4 3 2 1 −2 −1
y A D
y =2
B
C
x 1
2
3 4
5 6
Рис.4.7.5
114
Глава 5 Линейные пространства и операторы §1 Линейное пространство. Базис. Размерность. Подпространство. Прежде чем дать определение линейного пространства, заметим, что существуют множества, элементы которых, независимо от их конкретной природы, будь то векторы в общепринятом смысле, матрицы, функции и т.д., можно складывать и умножать на число по одинаковым правилам, причем эти действия обладают одинаковыми свойствами. Это обстоятельство и позволяет ввести в рассмотрение абстрактное множество, называемое линейным пространством некоторых элементов, конкретная природа которых не играет роли с точки зрения определения линейного пространства. Заметим, что элементы линейного пространства называют также точка-
ur r ur
ми или векторами и обозначают соответственно a , b , x или a , b , x , выделяя их в печати, как правило, жирным шрифтом. 1 Определение линейного пространства Определение. Множество L элементов x , y , …, z называется линейным пространством, если: 1) Для любых двух элементов x ∈ L и y ∈ L определена операция сложения этих элементов, т.е. дано правило нахождения элемента линейного пространства L , называемого их суммой и обозначаемого x + y ; 2) Для любого элемента x ∈ L и любого числа α – вещественного или комплексного – определена операция умножения элемента x на число α , т.е. дано правило нахождения элемента линейного пространства L , называемого произведением элемента x на число α и обозначаемого α ⋅ x ; 3) Определено равенство элементов из L , обозначаемое знаком = ; 4) Операции сложения и умножения на число удовлетворяют условиям: a) x + y = y + x (коммутативность сложения); б) (x + y) + z = x + (y + z) (ассоциативность сложения); в) α ( β x) = (αβ )x (ассоциативность умножения на число); г) (α + β ) ⋅ x = α ⋅ x + β ⋅ x (дистрибутивность умножения по отношению к сложению чисел); д) α (x + y) = α ⋅ x + α ⋅ y (дистрибутивность умножения на число по отношению к сложению элементов из L ); е) Существует элемент, называемый нулевым и такой, что для любого элемента x ∈ L , x + 0 = x ; 115
любого элемента x ∈ L имеет место равенство x ⋅1 = 1 ⋅ x = x . з) Для любого элемента x существует элемент − x , называемый противоположным элементу x и такой, что x + ( − x) = 0 . ж) Для
Заметим, что если произведение α x определено только для вещественных чисел, то пространство L называется вещественным линейным пространством; если же α – комплексное число, то линейное пространство L называется комплексным линейным пространством. Если известна природа элементов, входящих в линейное пространство, то линейное пространство называется конкретным. Свойства линейного пространства. 1) В каждом линейном пространстве существует единственный элемент 0 . 2) В каждом линейном пространстве любому элементу соответствует единственный противоположный элемент. 3) Для всякого элемента x ∈ L справедливо равенство 0 ⋅ x = 0 . Произведение любого числа α на нулевой элемент линейного пространства равно нулевому элементу, т.е. α ⋅ 0 = 0 . 4) Для каждого элемента x ∈ L противоположный элемент равен произведению этого элемента на число −1 , т.е. x = ( −1) ⋅ x 2 Базис линейного пространства и координаты вектора. Размерность линейного пространства Пусть векторы (элементы) a1 , a 2 , …, an принадлежат линейному пространству L и пусть c 1 , c 2 , …, c n – какие-то произвольные числа. Выражение c 1a1 + c 2a 2 + ... + c n an называется линейной комбинацией векторов (элементов) a1 , a 2 , …, an , а числа c 1 , c 2 , …, c n – коэффициентами этой линейной комбинации. Определение 1. Векторы (элементы) a1 , a 2 , …, an называются линейно зависимыми, если c 1a1 + c 2a 2 + ... + c n an = 0 , (1) при условии, что не все коэффициенты этой линейной комбинации равны нулю; если же соотношение (1) выполняется лишь при условии, что c 1 = c 2 = ... = c n = 0 , то векторы называются линейно независимыми. Нетрудно показать, что если векторы a1 , a 2 , …, an линейно зависимы, то хотя бы один из них можно представить в виде линейной комбинации остальных и наоборот; кроме того, если векторы a1 , a 2 , …, an линейно независимы, то ни один из них нельзя представить в виде линейной комбинации остальных и наоборот. Определение 2. Любая совокупность n линейно независимых векторов e1 , e 2 ,…, en линейного пространства L называется базисом этого
116
пространства, если всякий вектор x ∈ L можно представить в виде линейной комбинации векторов e1 , e 2 , …, en , т.е. x = = x 1e1 + x 2e 2 + ... + x n en . Такое представление вектора x называется разложением его по данному базису. Числа x 1 , x 2 , …, x n , которые являются коэффициентами в разложении вектора по данному базису, называются координатами вектора в этом базисе и записываются так: x = (x 1 , x 2 ,..., x n ) или так [x 1 , x 2 ,..., x n ] , или в виде матрицы-столбца:
⎛ x1 ⎞ ⎜ ⎟ ⎜x2 ⎟. ⎜ ... ⎟ ⎜ ⎟ ⎝xn ⎠ Теорема. Координаты вектора x ∈ L относительно некоторого базиса e1 ,e2 ,...,en этого линейного пространства определяются единственным образом. Доказательство. Пусть имеет место такое разложение вектора x ∈ L относительно некоторого базиса этого линейного пространства: x = x 1e1 + x 2e 2 + ... + x n en ,
(2)
и пусть имеет место другое разложение этого же вектора относительно этого же базиса:
x = x 1′e1 + x 2′e 2 + ... + x n ′en .
(3)
Вычитая почленно (3) из (2), получим:
(4) (x 1 − x 1′ ) ⋅ e1 + (x 2 − x 2′ ) ⋅ e 2 + ... + (x n − x n ′ ) ⋅ en = 0 . Так как базисные векторы e1 , e 2 ,…, en линейно независимы, то это значит, что коэффициенты линейной комбинации могут быть только нулями, значит x 1 = x 1′ , x 2 = x 2′ , …, x n = x n ′ . Теорема доказана. В качестве примера рассмотрим пространство многочленов P n (x ) степени ≤ n . В качестве базиса можно взять одночлены 1, x , x 2 ,..., x n . Действительно, они линейно независимы, и любой многочлен P n (x ) можно представить в виде:
P n (x ) = a 0 + a 1x + a 2x 2 + ... + a n x n . В силу определения коэффициенты a 0 , a 1 , …, a n являются координатами многочлена P n (x ) в выбранном базисе, т.е. можно записать: ⎛a 0 ⎞ ⎜ ⎟ ⎜ a1 ⎟ P n (x ) = (a 0 ,a 1 ,a 2 ,...,a n ) или P n (x ) = ⎜ ... ⎟ . ⎜⎜ ⎟⎟ ⎝a n ⎠ 117
Можно доказать, что если линейное пространство L имеет базис, то он не единственный. Однако же различные базисы данного линейного пространства состоят из одного и того же числа n векторов, которое и определяет размерность линейного пространства. Определение 3. Говорят, что линейное пространство имеет размерность равную n , если n – число базисных векторов; пространство при этом обозначают Ln . Если Ln1 и Ln2 – два линейных пространства (оба вещественных или оба комплексных) и если x1 ∈ Ln1 и x 2 ∈ Ln2 , то между ними можно установить взаимно однозначное соответствие, точно так же, как и между произведениями α x1 и α x 2 и суммами x1 + y1 и x 2 + y 2 , где y1 ∈ Ln1 и y 2 ∈ Ln2 . Такое свойство линейных пространств называется изоморфизмом, а сами линейные пространства называются изоморфными. Введенное ранее линейное пространство с базисом i , j , k – пространство обычных векторов – обозначают R 3 и называют его геометрическим пространством, или координатным пространством. Понятие геометрического (координатного) пространства можно обобщить в смысле увеличения его размерности, т.е. можно рассматривать геометрическое (координатное) пространство Rn . В заключение заметим, что если базис состоит из конечного числа элементов, то такое линейное пространство называется конечномерным, если же существует бесконечно много линейно независимых векторов, то такое линейное пространство называется бесконечномерным. Примером бесконечномерного пространства может служить пространство всевозможных функций, непрерывных на данном промежутке, линейные операции в котором определяются обычным образом. 3 Подпространство линейного пространства Определение. Подпространством L1 линейного пространства Ln называется множество элементов из Ln , которое само является пространством, т.е. из x ∈ L1 , y ∈ L1 => α x + β y ∈ L1 . Свойства подпространства линейного пространства Ln 1) Размерность любого подпространства пространства Ln не превосходит n . Очевидно, что само линейное пространство Ln является подпространством наибольшей размерности, 2) Если Ln – подпространство линейного пространства Ln (m
Ln . 118
Линейное подпространство, имеющее своим базисом совокупность векторов e1 ,e 2 ,...,em , иногда называют линейной оболочкой, натянутой на эти векторы.
§2 Евклидово пространство En . 1 Определение евклидова пространства Определение 1. Вещественное линейное пространство называется евклидовым, если в нем определена операция, ставящая в соответствие любым двум векторам x и y из этого пространства число, называемое скалярным произведением векторов x и y и обозначаемое (x,y) , для которого выполнены условия: 1. (x, y) = (y, x) ; 2. (x + y,z) = (x,z) + (y, z) , где z – любой вектор, принадлежащий данному линейному пространству; 3. (α x,y) = α (x, y) , где α – любое число; 4. (x,x) ≥ 0 , причем (x,x) = 0 Ù x = 0 . Например, в линейном пространстве одностолбцовых матриц скалярное произведение векторов
⎛ x1 ⎞ ⎜ ⎟ x x=⎜ 2 ⎟ и ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎝xn ⎠
⎛ y1 ⎞ ⎜ ⎟ y y =⎜ 2 ⎟ ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎝y n ⎠
можно определить формулой T
⎛ x1 ⎞ ⎜ ⎟ x (x,y) = ⎜ 2 ⎟ ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎝xn ⎠
⎛ y1 ⎞ ⎛ y1 ⎞ ⎜ ⎟ ⎜ ⎟ y y 2 ⋅ ⎜ ⎟ = (x1 x 2 ... xn ) ⋅ ⎜ 2 ⎟ . ⎜ ... ⎟ ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝y n ⎠ ⎝y n ⎠
Евклидово пространство размерности n обозначают En . Заметим, что существуют как конечномерные, так и бесконечномерные евклидовы пространства. Определение 2. Длиной (модулем) вектора x в евклидовом пространстве En называют (x,x) и обозначают ее так: x = (x,x) . Очевидно, что у всякого вектора евклидова пространства существует длина, причем у нулевого вектора она равна нулю.
119
Далее, умножая ненулевой вектор x на число α =
1 , мы получим векx
x , длина которого равна единице. Эта операция называется норx мированием вектора x . тор x0 =
Например, в пространстве одностолбцовых матриц длину вектора
x = (x 1 x 2
... x n ) можно определить формулой: T
2
2
2
x = x 1 + x 2 + ... + x n . 2 Неравенство Коши-Буняковского
4
Пусть x ∈ En и y ∈ En – любые два вектора. Докажем, что для них имеет место неравенство:
(x,y) ≤ x ⋅ y (Неравенство Коши-Буняковского). Доказательство. Пусть α – любое вещественное число. Очевидно, что (α x − y,α x − y) ≥ 0 . С другой стороны, в силу свойств скалярного произведения можем написать
(α x − y,α x − y) = (α x,α x − y) − (y,α x − y) = (α x,α x) − (α x, y) − (y,α x) + (y,y) = = α 2 (x,x) − 2α (x, y) + (y, y). Итак, α 2 (x,x) − 2α (x,y) + (y,y) ≥ 0 . Дискриминант этого квадратного трехчлена не может быть положительным, т.е. (x,y)2 − (x,x) ⋅ (y,y) ≤ 0 , откуда вытекает:
(x, y)2 ≤ (x, x) ⋅ (y, y) => (x,y) ≤ x ⋅ y . Неравенство доказано. 3 Неравенство треугольника Пусть x и y – произвольные векторы евклидова пространства En , т.е.
x ∈ En и y ∈ En . Докажем, что x + y ≤ x + y . (Неравенство треугольника). 2
Доказательство. Очевидно, что (x + y,x + y) = x + y . 2
2
С другой стороны, (x + y,x + y) = (x, x) + 2(x, y) + (y, y) = x + 2(x,y) + y . Принимая во внимание неравенство Коши-Буняковского, получим 2
2
2
x + y ≤ x + 2 x ⋅ y + y = ( x + y )2 => x + y ≤ x + y . Неравенство треугольника доказано. 4 Норма евклидова пространства 4
Коши О.Л. (1789-1857) – французский математик. Буняковский В.Я (1804 – 1889) – русский математик.
120
Определение 1. Линейное пространство L называется метрическим, если любым двум элементам этого пространства x и y поставлено в соответствие неотрицательное число ρ (x,y) , называемое расстоянием между x и y , ( ρ (x,y) ≥ 0) , причем выполняются условия (аксиомы): 1) ρ (x, y) = 0 Ù x = y ; 2) ρ (x, y) = ρ (y, x) (симметрия); 3) для любых трех векторов x , y и z этого пространства ρ (x,y) ≤ ρ (x,z) + ρ (z,y) . Замечание. Элементы метрического пространства обычно называют точками. Очевидно, что евклидово пространство En – метрическое, причем в качестве расстояния между векторами x ∈ En и y ∈ En можно взять x − y . Так, например, в пространстве одностолбцовых матриц, где
⎛ x1 ⎞ ⎜ ⎟ x x = ⎜ 2 ⎟, ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎝xn ⎠ получим
⎛ y1 ⎞ ⎜ ⎟ y y = ⎜ 2 ⎟, ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎝y n ⎠
x − y = (x 1 − y 1 x 2 − y 2
... x n − y n ) , T
следовательно,
ρ (x , y ) = (x 1 − y 1 )2 + (x 2 − y 2 )2 + ... + (x n − y n )2 . Определение 2. Линейное пространство L называется нормированным, если каждому вектору x из этого пространства поставлено в соответствие неотрицательное число, называемое его нормой x . При этом выполняются аксиомы: 1) x ≥ 0 ∀x ∈; x = 0 Ù x = 0 ; 2) λ x = λ ⋅ x для ∀x ∈ L и любого числа λ ; 3) x + y ≤ x + y для ∀x ∈ L и ∀y ∈ L (неравенство треугольника). Нетрудно видеть, что нормированное пространство является метрическим пространством. В самом деле, в качестве расстояния между x и y можно взять x − y . В евклидовом пространстве En в качестве нормы любого вектора x ∈ En принимается его длина, т.е. x = x . Нетрудно убедиться, что все аксиомы нормы выполняются для выбранной таким образом нормы евклидова пространства En . Итак, евклидово пространство En является метрическим пространством и более того, евклидово пространство En является нормированным пространством. 121
5 Угол между векторами Заметим, что из неравенства Коши-Буняковского следует, что
(x,y) ≤ 1 ( x ≠ 0 , y ≠ 0 ). x⋅y Определение 1. Углом между ненулевыми векторами a и b евклидова пространства En называют число ϕ ∈ [0,π ] , для которого
cos ϕ =
(a,b) . a⋅b
Определение 2. Векторы x и y евклидова пространства E называются ортогональными, если для них выполняется равенство (x,y) = 0 . Если x и y – ненулевые, то из определения следует, что угол между ними равен
π 2
. Заметим, что нулевой вектор по определению считается
ортогональным любому вектору. Пример. В геометрическом (координатном) пространстве R 3 , которое является частным случаем евклидова пространства, орты i , j и k взаимно ортогональны. 6 Ортонормированный базис Определение 1. Базис e1 ,e 2 ,...,en евклидова пространства En называется ортогональным, если векторы этого базиса попарно ортогональны, т.е. если (ei ,e j ) = 0 (i ≠ j ; i = 1, 2,..., n ; j = 1, 2,..., n ) . Определение 2. Если все векторы ортогонального базиса e1 ,e2 ,...,en единичны, т.е. ei = 1 (i = 1, 2,..., n ) , то базис называется ортонормированным, т.е. для ортонормированного базиса
⎧0, i ≠ j (i = 1, 2,..., n ; j = 1, 2,..., n ) . (ei ,e j ) = ⎨ ⎩1, i = j Теорема (о построении ортонормированного базиса). Во всяком евклидовом пространстве En существуют ортонормированные базисы. Доказательство. Докажем теорему для случая n = 3 . Пусть E1 , E2 , E3 – некоторый произвольный базис евклидова пространства
E3 . Построим какой-нибудь ортонормированный базис e10 , e 2 0 ,e30 в этом пространстве. Положим e1 = E1 , e 2 = E2 + α e1 , где α – некоторое вещественное число, которое выберем таким образом, чтобы было (e1 ,e 2 ) = 0 , тогда получим 122
(E1 , E2 + α E1 ) = (E1 , E2 ) + α (E1 , E2 ) = 0 => α = −
(E1 , E2 ) , (E1 , E1 )
причем очевидно, что α = 0 , если E1 и E2 ортогональны, т.е. в этом случае e 2 = E2 , а E2 ≠ 0 , т.к. это базисный вектор. Далее, определим вектор e 3 равенством e3 = E3 + β1e1 + β 2e 2 , причем числа β1 и β 2 определяется из условия ортогональности вектора e 3 с векторами e1 и e 2 , т.е.
(e3 ,e1 ) = 0 ⎫ (e1 , E3 ) + β1 (e1 ,e1 ) + β 2 (e1 ,e 2 ) = 0 ⎫ ⎬. ⎬ => (e3 ,e 2 ) = 0 ⎭ (e 2 , E3 ) + β1 (e1 ,e 2 ) + β 2 (e 2 ,e 2 ) = 0 ⎭ Учитывая, что (e1 ,e 2 ) = 0 , получим
(e1 , E3 ) (e , E ) ; β2 = − 2 3 . (e1 ,e1 ) (e 2 ,e2 ) Очевидно, что β1 = β 2 = 0 , если e1 и e 2 ортогональны с вектором E3 , т.е. в этом случае следует взять e3 = E3 . Вектор E3 ≠ 0 , т.к. E1 , E2 и E3 линейно независимы, следовательно e3 ≠ 0 . Кроме того, из приведенного рассуждения следует, что e 3 нельзя представить в виде линейной комбинации векторов e1 и e 2 , следовательно векторы e1 ,e 2 ,e3 линейно независимы и попарно ортогональны, следовательно, их можно взять в качестве базиса евклидова пространства E3 . Остается
β1 = −
только пронормировать построенный базис, для чего достаточно каждый из построенных векторов разделить на его длину. Тогда получим e e e 0 0 0 e1 = 1 ; e 2 = 2 ; e3 = 3 . e1 e2 e3 0
0
0
Итак, мы построили базис e1 ,e 2 ,e3 – ортонормированный базис. Теорема доказана. Примененный способ построения ортонормированного базиса из произвольного базиса называется процессом ортогонализации. Заметим, что в процессе доказательства теоремы мы установили, что попарно ортого0 0 0 нальные векторы линейно независимы. Кроме того, если e1 ,e 2 ,..., en – ортонормированный базис в En , тогда для любого вектора x ∈ En имеет место единственное разложение 0 0 0 x = x 1e1 + x 2e 2 + ... + x n en , (1) где x 1 , x 2 ,..., x n – координаты вектора x в этом ортонормированном базисе. Так как
⎧ 0, i ≠ j 0 0 (ei ,e j ) = ⎨ ⎩1, i = j
(i = 1, 2,..., n ; j = 1, 2,..., n ) ,
123
0
то умножив скалярно равенство (1) на ei , получим
x i = (xi ,ei0 ) (i = 1, 2,..., n ) . В дальнейшем мы будем рассматривать только ортонормированные базисы, а потому для простоты их записи нолики сверху у базисных векторов 0 ei мы будем опускать.
§3 Линейные операторы и действия над ними. Матрица линейного оператора. 1 Линейный оператор, матрица линейного оператора Определение 1. Если задан закон, который каждому вектору x∈L ставит в соответствие вектор y ∈ L , то говорят, что в линейном пространстве L задан оператор A , при этом пишут: (1) y =Ax. Определение 2. Оператор A называется линейным, если для любых x1 ∈ L и x 2 ∈ L и произвольного числа α выполняются условия: 1) A (x1 + x 2 ) = A x1 + A x 2 , 2) A (α x) = α A x . Рассмотрим теперь в евклидовом пространстве En базис e1 ,e 2 ,...,en , и пусть в этом пространстве определен линейный оператор A : y = A x . Разложим векторы x и y по базису e1 ,e2 ,...,en :
x = x 1e1 + x 2e 2 + ... + x n en , y = y 1e1 + y 2e 2 + ... + y n en ,
(2) (3)
В силу линейности оператора A можно написать
A x = x 1A e1 + x 2A e2 + ... + x n A en . Заметим, что каждый вектор A ei ∈ E
(4)
(i = 1, 2,..., n ) , следовательно, его также можно разложить по базису e1 ,e2 ,...,en , т.е. n
A ei = a 1i e1 + a 2i e 2 + ... + a ni en (i = 1, 2,..., n ) . А тогда
y = A x = x 1 (a 11 e1 + a 21 e 2 + ... + a n 1 en ) +
+ x 2 (a 12 e1 + a 22 e 2 + ... + a n 2 en ) + . . . . . + +. + x n (a 1n e1 + a 2n e 2 + ... + a nn en ) = 124
(5)
= (a 11x 1 + a 12x 2 + ... + a 1n x n )e1 + +(a 21x 1 + a 22x 2 + ... + a 2n x n )e 2 + . . . . . + +. +(a n 1x 1 + a n 2x 2 + ... + a nn x n )en . В силу единственности разложения по данному базису мы можем приравнять коэффициенты при базисных векторах в правых частях формул (3) и (5); тогда получим:
y 1 = a 11x 1 + a 12x 2 + ... + a 1n x n , y 2 = a 21x 1 + a 22x 2 + ... + a 2n x n , .
.
.
.
(6)
.
y n = a n 1x 1 + a n 2x 2 + ... + a nn x n . Итак, линейному оператору A в данном базисе соответствует квадратная матрица
⎛ a 11 a 12 ⎜ a a 22 A = ⎜ 21 ⎜ . . ⎜ ⎝a n 1 a n 2
... a 1n ⎞ ⎟ ... a 21 ⎟ , ... . ⎟ ⎟ ... a nn ⎠
(7)
которая называется матрицей линейного оператора A , i -й столбец которой состоит из координат вектора A ei (i = 1, 2,..., n ) относительно данного базиса. Отметим, что матрица A оператора A зависит от выбора базиса e1 ,e 2 ,...,en пространства Ln . Введем теперь в рассмотрение одностолбцовые матрицы
X = (x 1 x 2
... x n ) и Y = (y 1 y 2 T
... y n ) , T
соответствующие векторам x ∈En и y ∈ En . Тогда соотношения (6) в матричном виде можно записать так:
Y = A ⋅X .
(8)
Итак, мы показали, что всякому линейному оператору A в евклидовом пространстве En соответствует матрица A ; можно доказать и обратное утверждение: всякую квадратную матрицу A можно рассматривать как матрицу некоторого линейного оператора A в данном базисе e1 ,e 2 ,...,en . Представляют интерес невырожденные линейные операторы, т.е. такие операторы, матрицы которых имеют обратную A −1 , т.е. также являются невырожденными. В этом случае каждому вектору y (образу), определенному соотношением (1), отвечает единственный вектор x (прообраз) и при этом имеет место матричное равенство: 125
X = A −1 ⋅Y .
126
2 Примеры линейных операторов
e2
M 2 (x 2 , y 2 ) r2
M 1 (x 1 , y 1 )
α
r1
ϕ e1
O
1. Возьмем в пространстве E 2Рис.5.3.1 ортонормированный базис e1 ,e 2 и рассмотрим в этом базисе вектор r1 = x 1e1 + y 1e 2
(или точку M 1 (x 1 , y 1 ) ) (рис.
5.4.1). Повернем вектор r1 вокруг начала координат на угол α против часовой стрелки. Он займет положение r2 = x 2e1 + y 2e 2 , а точка M 1 перейдет в точку
M 2 (x 2 , y 2 ) , т.е. r2 = A r1 , где A – оператор поворота против часовой стрелки на угол α относительно точки 0. Очевидны равенства x 2 = r ⋅ cos(ϕ + α ) = x 1 cosα − y 1 sinα , y 2 = r ⋅ sin(ϕ + α ) = x 1 sin α + y 1 cos α . Или в матричном виде ⎛ x 2 ⎞ ⎛ cos α − sin α ⎞ ⎛ x 1 ⎞ ⎜ ⎟=⎜ ⎟ ⋅⎜ ⎟. ⎝ y 2 ⎠ ⎝ sin α cos α ⎠ ⎝ y 1 ⎠ Здесь матрица
⎛ cos α A =⎜ ⎝ sin α
− sin α ⎞ ⎟ cos α ⎠
является матрицей поворота. 2. Тождественным называется преобразование, определяемое соотношением Ex = x, ∀x ∈ En . В частности Ee i = e i (i = 1, 2,..., n ) . Матрица тождественного линейного оператора в любом базисе имеет вид
⎛1 ⎜ ⎜0 E = ⎜0 ⎜ ⎜. ⎜0 ⎝
0 1 0 . 0
3 Действия над операторами 127
0 0 1 . 0
... 0 ⎞ ⎟ ... 0 ⎟ ... 0 ⎟ . ⎟ ... . ⎟ ... 1 ⎟⎠
1. Сложение линейных операторов. Пусть x ∈En , A и B – два линейных оператора в этом пространстве. Определение 1. Суммой линейных операторов A и B в En называется оператор C , определяемый равенством Cx = A x + B x , где x – любой вектор из En . Очевидно, что сумма линейных операторов является линейным оператором, причем его матрица C = A + B , где A и B – матрицы линейных операторов A и B . 2. Умножение линейного оператора на число. Пусть x ∈En , линейный оператор A определен в En , α – некоторое число. Определение 2. Произведением линейного оператора A на число α называется оператор α A , определяемый равенством (α A ) ⋅ x = α ⋅ (A x), ∀ x ∈ En . Очевидно, что α A является линейным оператором, а матрица этого линейного оператора получается из матрицы A умножением ее на число α , т.е. она равна α ⋅ A . 3. Умножение линейных операторов. Пусть x ∈En , y ∈ En , z ∈ En и кроме того в En определены линейные операторы A и B таким образом, что y = B x, z = A y . Определение 3. Произведением A ⋅ B линейных операторов A и B называется оператор C , определяемый соотношением Cx = A (Bxx) . Таким образом, перемножение линейных операторов состоит в последовательном их применении по отношению к вектору x . Рассмотрим матрицы-столбцы:
⎛ x1 ⎞ ⎛ y1 ⎞ ⎛ z1 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ x y z 2 2 X = ⎜ ⎟; Y = ⎜ ⎟ ; Z = ⎜ 2 ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ x y ⎝ n⎠ ⎝ n⎠ ⎝z n ⎠ и обозначим через A , B и C – соответственно матрицы линейных операторов A , B и C . Тогда очевидно, что Z = A ⋅ (B ⋅ X ) = (A ⋅ B ) ⋅ X = = C ⋅ X , таким образом, C = A ⋅ B , т.е. произведение матриц линейных операторов также является матрицей линейного оператора. Действительно, a) (A ⋅ B )(x + y) = A (B (x + y)) = A (B x + B y) = A (B x) + A (B y) =
= (A ⋅ B ) ⋅ x + (A ⋅ B ) ⋅ y б) ( A ⋅ B )(α x) = A ( B (α x)) = A (α B x) = α A ( B x) = α ( A ⋅ B )x Свойства умножения линейных операторов вытекают из свойств умножения матриц.
§4 Замена базиса. 128
1 Матрица преобразования координат. Возьмем в пространстве En два различных базиса e1 ,e 2 ,...,en и E1 , E2 ,..., En . Рассуждение проведем для случая n = 3 . Очевидно, что один и тот же вектор x относительно различных базисов имеет различные координаты. Действительно, ограничиваясь случаем n = 3 , можем написать:
x = x 1e1 + x 2e 2 + x 3e3 ,
(1) (2)
x = x 1′E1 + x 2′E2 + x 3′E3 .
Любой вектор второго базиса можем разложить по первому базису, т.е.
E1 = τ 11e1 + τ 21e 2 + τ 31e3 , E2 = τ 12e1 + τ 22e 2 + τ 32e3 , E3 = τ 13e1 + τ 23e 2 + τ 33e3 .
(3)
Подставим (3) в (2):
x = x1′(τ11e1 + τ 21e2 + τ 31e3 ) + x 2′(τ12e1 + τ 22e2 + τ 32e3 ) + x 3′(τ13e1 + τ 23e2 + τ 33e3 ) =
(4) = (τ11x 1′ + τ12x 2′ + τ13x 3′ )e1 + (τ 21x 1′ + τ 22x 2′ + τ 23x 3′ )e2 + (τ 31x 1′ + τ 32x 2′ + τ 33x 3′ )e3 .
В силу единственности разложения по данному базису мы должны приравнять коэффициенты при векторах e1 , e 2 , e3 в правых частях формул (1) и (4). Тогда получим:
x 1 = τ11x 1′ + τ12x 2′ + τ13x 3′ , x 2 = τ 21x 1′ + τ 22x 2′ + τ 23x 3′ ,
(5)
x 3 = τ 31x 1′ + τ 32x 2′ + τ 33x 3′ . Введем в рассмотрение матрицы
⎛x ′ ⎞ ⎛ x1 ⎞ ⎛ τ11 τ12 ⎜ 1 ⎟ ⎜ ⎟ ⎜ ⎜ x 2′ ⎟ τ τ x2 ⎟ ⎜ X = ; X ′ = ⎜ ⎟; T = ⎜ 21 22 ⎜ ... ⎟ ⎜ . . ⎜ ... ⎟ ⎜ ⎟ ⎜ ⎜ ′⎟ ⎝xn ⎠ ⎝τ n 1 τ n 2 ⎝xn ⎠
... τ1n ⎞ ⎟ ... τ 2n ⎟ . ... . ⎟ ⎟ ... τ nn ⎠
Тогда соотношения (5) можно записать в матричном виде X = T ⋅X ′ . Матрица T называется матрицей преобразование координат при переходе от старого базиса к новому, т.е. от базиса e1 ,e2 ,...,en к базису E1 , E2 ,..., En . Причем, столбцами матрицы преобразования координат являются координаты вектора нового базиса E1 , E2 ,..., En относительно старого базиса e1 ,e2 ,...,en . Если преобразования координат состоит в повороте координатных осей, то матрица T называется матрицей поворота. Пример. При повороте координатных осей xO y на угол α мы имели (рис. 5.4.1) 129
x = x 1 cos α − y 1 sin α ⎫ ⎬. y = x 1 sin α + y 1 cos α ⎭ Здесь
⎛ cos α − sin α ⎞ T=⎜ ⎟ – матрица поворота. ⎝ sin α cos α ⎠ y M (x , y ) y1 x1
α x Рис.5.4.1 2 Ортогональный оператор и замена базиса Определение 1. Оператор A , матрица которого относительно данного ортонормированного базиса e1 ,e 2 ,...,en евклидова пространства En ортогональна, называется ортогональным оператором. Предположим, что в пространстве En переход от ортонормированного 0 0 0 0 0 0 базиса e1 ,e 2 ,...,en к другому ортонормированному базису E1 , E2 ,..., En осуществляется с помощью преобразования координат X = T ⋅ X ′ . Так как 0 0 0 базис E1 , E2 ,..., En – ортонормированный, то
⎧1, i = j (Ei 0 , Ej 0 ) = ⎨ (i , j = 1, 2,..., n ) . , ≠ i j 0 ⎩ 0 0 Выражая скалярные произведения (Ei , Ej ) (i , j = 1, 2,..., n ) через координаты этих векторов, получим:
τ 112 + τ 212 + ... + τ n 12 = 1 ⎫ ⎪ τ 12 2 + τ 22 2 + ... + τ n 2 2 = 1 ⎪
τ 11τ 12 + τ 21τ 22 + ... + τ n 1τ n 2 = 0 ⎫ τ 11τ 13 + τ 21τ 23 + ... + τ n 1τ n 3 = 0 ⎪⎪
(6) ⎬, ⎬. . . . . . . . . . ⎪ ⎪ 2 2 2 ⎪ τ 1n + τ 2n + ... + τ nn = 1⎭ τ 1,n −1τ 1n + τ 2 ,n −1τ 2n + ... + τ n ,n −1τ n ,n = 0 ⎪⎭ Из равенств (6) следует, что TT ⋅ T = E или TT = T −1 , т.е. матрица T , осуществляющая переход от одного ортонормированного базиса к другому, ортогональная.
§5 Изменение матрицы линейного оператора при переходе к новому базису. Пусть в пространстве En определен линейный оператор A , т.е.
y = A ⋅x 130
(1)
или
Y = A ⋅X , (2) T где Y = (y 1 y 2 ... y n ) , X = (x 1 x 2 ... x n ) – матрицы-столбцы, составленные из координат векторов x и y относительно данного базиса e1 ,e 2 ,...,en , A – матрица линейного оператора A . Выберем в том же пространстве En другой базис E1 , E2 ,..., En . Относительно нового базиса матрица линейного оператора A будет иной. Обозначим через T матрицу преобразования координат, а через X ′ и Y ′ – одностолбцовые матрицы, составленные из координат векторов x и y отноT
сительно нового базиса, т.е.
X = T ⋅ X ′, Y = T ⋅Y ′.
(3) (4)
Подставим (3) и (4) в (2), тогда получим:
T ⋅Y ′ = A ⋅ T ⋅ X ′.
(5) −1
Умножая левую и правую части равенства (5) слева на T , получим:
Y ′ = T −1 ⋅ A ⋅ T ⋅ X ′. Если к тому же T – ортогональная матрица, т.е. осуществляет переход (6) от одного ортонормированного базиса к другому, то Y ′ = TT ⋅ A ⋅ T ⋅ X ′. . (7) Итак, если в En перейти к новому базису, то матрица линейного оператора также изменится и в самом общем случае будет равна T −1 ⋅ A ⋅ T .
§6 Сопряженный и самосопряженный оператор. Пусть в вещественном евклидовом пространстве En определен линейный оператор A . Определение 1. Оператор A ∗ в вещественном евклидовом пространстве En называется сопряженным по отношению к линейному оператору A в том же пространстве, если его матрица в любом ортонормированном базисе этого пространства является транспонированной по отношению к матрице оператора A . Свойства сопряженного оператора ∗ 1) E = E , где E – тождественный оператор, т.е. оператор, матрица которого E единичная в En ; 2) (A + B )∗ = A ∗ + B ∗ ;
3) (A ⋅ B )∗ = B ∗ ⋅ A ∗ ; 4) если A −1 существует, то (A −1 )∗ = (A ∗ )−1 . Определение 2. Линейный оператор A , определенный в вещественном евклидовом пространстве En , называется самосопряженным, или 131
симметрическим, если он совпадает со своим сопряженным оператором A ∗ , т.е. если A ∗ = A . Очевидно, что матрица самосопряженного оператора совпадает с транспонированной в любом ортонормированном базисе, т.е. является симметричной относительно главной диагонали. Свойства самосопряженного оператора 1) Если A ∗ = A , B ∗ = B , то (A + B )∗ = A ∗ + B ∗ = A + B . 2) Если A – невырожденный самосопряженный оператор, то
(A
−1 ∗
) = (A ∗ )−1 = A
−1
. Доказательство. Действительно, если существует A −1 и кроме того A ∗ = A , то в силу свойства 4 сопряженного оператора, получим (A −1 )∗ = (A ∗ )−1 = A −1 . 3) Если A – самосопряженный оператор в вещественном пространстве n E , то имеет место равенство:
(A x,z) = (x, A ∗z), ∀x,z ∈ En .
(1) Действительно, вводя в рассмотрение одностолбцовые матрицы X и Z , и учитывая, что (A ⋅ B )T = BT ⋅ AT , для скалярного произведения (A x,z) получим: (A ⋅ X )T ⋅ Z = X T ⋅ AT ⋅ Z . В свою очередь для скалярного произведения (x, A ∗z) имеем X T ⋅ AT ⋅ Z . Следовательно, равенство (1) верно.
§7 Собственные векторы и собственные значения линейного оператора. Пусть A – линейный оператор. Пусть x∈E1 , где E1 некоторое подпространство пространства En . Вектор y = A x может принадлежать подпространству E1 , а может и не принадлежать. Определение 1. Подпространство E1 называется инвариантным по отношению к оператору A , если A x ∈ E1 , ∀x ∈ E1 . Определение 2. Ненулевой вектор x называется собственным вектором линейного оператора A , если найдется такое число λ , что будет выполняться равенство A x = λx . При этом число λ называют собственным значением (собственным числом) оператора A , соответствующим вектору x . Множество всех собственных значений оператора A называется его спектром. Остановимся на отыскании собственных значений и собственных векторов линейного оператора A . Рассмотрение проведем для случая n = 3 . 132
Итак, пусть в некотором базисе оператор A имеет матрицу
⎛ a 11 a 12 a 13 ⎞ ⎜ ⎟ A = ⎜ a 21 a 22 a 23 ⎟ , ⎜a ⎟ ⎝ 31 a 32 a 33 ⎠ T и пусть одностолбцовая матрица X = (x 1 x 2 ... x n ) соответствует вектору x . Тогда в силу определения A ⋅ X = λX => A ⋅ X − λ EX = 0 => (A − λ E) ⋅ X = 0.
(1)
Итак, дело свелось к решению системы линейных однородных уравнений, записанной в матричном виде. Очевидно, что эта система имеет ненулевое решение, если det(A − λ E) = 0 . Уравнение det(A − λ E) = 0 называется характеристическим, или вековым уравнением оператора A ; многочлен det(A − λ E) называется соответственно характеристическим многочленом оператора A . В координатной форме характеристическое уравнение выглядит так:
a 11 − λ a 12 a 13 a 21 a 22 − λ a 23 = 0. a 31 a 32 a 33 − λ Решив его, найдем λ1 , λ2 , λ3 – собственные значения линейного оператора. Можно показать, что собственные значения оператора A не зависят от выбора базиса, т.е. матрицы A и T −1 ⋅ A ⋅ T имеют одинаковый набор собственных значений. Далее, для суммы диагональных элементов матрицы A , которую называют следом этой матрицы trA или следом оператор A (trA ) , справедлива формула λ1 + λ2 + λ3 = = a 11 + a 22 + a 33 . Кроме того, det A = λ1λ2λ3 . После того как найдены собственные значения линейного оператора A , остается подставить их по очереди в уравнение (1) и найти соответствующие собственные векторы x(1) ,x( 2 ) ,x( 3) . Пример 1. Найти собственные значения и собственные числа линейного оператора, матрица которого
⎛1 2⎞ A=⎜ ⎟. 2 1 ⎝ ⎠ Решение. В силу определения собственного вектора можем написать
A ⋅ X − λ ⋅ X = 0 => (A − λ ⋅ E) ⋅ X = 0 , где X = (x 1 x 2 ) – матрицастолбец, соответствующая искомому вектору x линейного оператора A ; T
В матричной форме получим:
2 ⎞ ⎛ x1 ⎞ ⎛ 0 ⎞ ⎛1 − λ ⎜ ⎟ ⋅⎜ ⎟ = ⎜ ⎟. ⎝ 2 1 − λ ⎠ ⎝x 2 ⎠ ⎝ 0 ⎠ 133
(2)
Система однородная, следовательно, она имеет бесчисленное множество решений, если определитель системы равен нулю, т.е. имеем характеристическое уравнение:
1− λ
2
2
1− λ
= 0.
Решая его, получим такие собственные значения λ1 = −1; λ2 = 3 . Найдем соответствующие собственные векторы. 1) λ1 = −1 подставим в (2), получим
⎛ 2 2 ⎞ ⎛ x 1(1) ⎞ ⎛ 0 ⎞ (1) ( 2) (1) (1) (1) ⎜ ⎟ ⋅ ⎜ (1) ⎟ = ⎜ ⎟ Ù x 1 + x 2 = 0 => x 1 = −x 2 = t , ⎝ 2 2⎠ ⎝x 2 ⎠ ⎝ 0⎠ где t (1) – некоторый параметр. Таким образом, имеем множество коллинеарных векторов, соответствующих первому собственному числу λ1 = −1 :
X
(1)
⎛ t (1) ⎞ = ⎜ (1) ⎟ . ⎝ −t ⎠
Этот вектор нетрудно пронормировать, тогда мы получим единичный собственный вектор, соответствующий первому собственному числу λ1 = −1 т.е.
X
(10 )
⎛ 1 ⎞ ⎜ 2 ⎟ ⎟, =⎜ ⎜ 1 ⎟ ⎜− ⎟ 2⎠ ⎝
2) λ2 = 3 подставим в (10), получим
⎛ −2 2 ⎞ ⎛ x 1(1) ⎞ ⎛ 0 ⎞ ( 2) ( 2) ( 2) ( 2) ( 2) ⎜ ⎟ ⋅ ⎜ ( 2 ) ⎟ = ⎜ ⎟ => x 1 − x 2 = 0 => x 1 = x 2 = t , т.е. ⎝ 2 −2 ⎠ ⎝ x 2 ⎠ ⎝ 0 ⎠ ⎛ 1 ⎞ ⎜ 2⎟ ⎛ t ( 2) ⎞ ⎟. X ( 2 ) = ⎜ ( 2 ) ⎟ ; X ( 20 ) = ⎜ 1 t ⎜ ⎟ ⎝ ⎠ ⎜ ⎟ ⎝ 2⎠ В заключение заметим, что множество всех векторов y = A x , где x ∈ En , называется областью значений линейного оператора A в En , а множество всех векторов x ∈ E1 ⊂ En , таких, что A x = 0 , называется ядром линейного оператора. 1 Свойства собственных чисел и собственных векторов самосопряженного оператора 134
Рассмотрим самосопряженный оператор A , определенный в вещественном евклидовом пространстве En . В силу определения матрица его A – симметрическая. Теорема 1. Собственные числа самосопряженного оператора A есть вещественные числа (без доказательства). Теорема 2. Собственные векторы, отвечающие двум различным собственным значениям самосопряженного оператора, ортогональны. Доказательство. Пусть λ1 и λ2 – различные собственные значения самосопряженного оператора A , а x1 и x 2 – соответствующие им собственные значения. Очевидны равенства:
A x1 = λ1x1 , A x 2 = λ2 x 2 .
(1) (2)
(A x1 ,x 2 ) = λ1 (x1 ,x 2 ) ⎫ ⎬. (x1 , A x 2 ) = λ2 (x1 ,x 2 )⎭
(3)
Следовательно,
Но (A x1 ,x 2 ) = (x1 , A x 2 ) т.е. левые части равенств (3) равны, следовательно, вычитая их почленно, получим:
(λ1 − λ2 ) ⋅ (x1 ,x 2 ) = 0 => (x1 ,x 2 ) = 0 , а это и означает, что собственные векторы x1 и x 2 ортогональны. Замечание. Так как собственные векторы самосопряженного оператора A ортогональны, их можно принять за базис линейного пространства, в котором определен этот линейный оператор. Поделив далее каждый вектор на его длину, мы получаем ортонормированный базис. Теорема 3. В базисе из единичных собственных векторов самосопряженного оператора матрица этого оператора диагональная, причем элементами диагонали являются ее собственные числа. Доказательство. Доказательство проведем для случая n = 3 . Пусть e1 ,e 2 ,e3 – единичные векторы самосопряженного оператора A относительно некоторого базиса линейного пространства E3 , отвечающие собственным значениям λ1 , λ2 , λ3 этого линейного оператора, т.е. A e1 = λ1e1 ,
A e 2 = λ2e 2 , A e3 = λ3e3 . Примем векторы e1 ,e 2 ,e3 за базис линейного пространства. Очевидно, что в этом базисе векторы λ1e1 , λ2e2 , λ3e3 имеют координаты: λ1e1 = (λ1 , 0, 0); λ2e 2 = (0, λ2 , 0); λ3e3 = (0, 0, λ3 ) . Следовательно, матрица A оператора A в базисе e1 ,e 2 ,e3 имеет вид:
135
⎛ λ1 0 ⎜ ⎜ 0 λ2 ⎜0 0 ⎝
0⎞ ⎟ 0 ⎟. λ3 ⎟⎠
Выбор такого базиса, в котором матрица линейного оператора имеет диагональный вид, называется приведением матрицы к диагональному виду.
§8 Квадратичные формы и их приведение к каноническому виду. Пусть в вещественном пространстве En выбран произвольный базис
e1 ,e 2 ,...,en , в котором некоторый вектор x ∈En имеет координаты x1 , x 2 ,…, xn , тогда этому вектору можно поставить в соответствие одностолбцовую матрицу X = (x 1
x2
... x n ) . T
Определение. Выражение вида 2
Φ(x 1 ,x 2 ,...,x n ) = a 11x 1 + 2a 12x 1x 2 + 2a 13x1x 3 + ... + 2a 1n x1x n + 2
+ a 22x 2 + 2a 23x 2x 3 + ... + 2a 2n x 2x n + +.
.
.
.
.
(1)
+
.
+ a nn x n , содержащее в качестве слагаемых только квадраты координат x 1 , x 2 ,..., x n и все их попарные произведения, называются квадратичной формой координат x 1 , x 2 ,..., x n , а числа a ij (i , j = 1, 2,..., n ) – коэффициентами квадратичной формы. Положим a ij = a ji (i , j = 1, 2,..., n ) , тогда квадратичную форму (1) можно переписать в виде
Φ(x1,x 2 ,...,xn ) = a11x12 + a12x1x 2 + a13x1x 3 + ... + a1n x1x n + + a 21x 2x1 + a 22x 22 + a 23x 2x 3 + ... + 2a 2n x 2x n + +.
.
.
.
.
+ a n 1xn x1 + a n 2xn x 2 +
. ...
(2)
+ + a nn x n .
Рассмотрим матрицу, составленную из коэффициентов этой квадратичной формы:
136
⎛ a 11 a 12 ⎜ a a 22 A = ⎜ 21 ⎜ . . ⎜ ⎝a n 1 a n 2
... a 1n ... a 2n ... . ... a nn
⎞ ⎟ ⎟. ⎟ ⎟ ⎠
(3)
Матрица A называется матрицей квадратичной формы. Очевидно, что она симметрична относительно главной диагонали и квадратичную форму (1) в матричном виде можно записать так:
Φ(x 1 , x 2 ,..., x n ) = X T ⋅ A ⋅ X . (4) Оператор A , имеющий матрицу A , самосопряженный. Допустим, что оператор A имеет n различных собственных значений λ1 , λ2 ,..., λn , которым соответствуют n взаимно ортогональных собственных векторов e1 ,e 2 ,...,en . Примем эти векторы за новый базис. Обозначим через T матрицу преобразования координат. Ясно, что матрица T ортогональная. Итак, положим X = T ⋅ X′ ,
(
где X ′ = x 1′
x 2′ ... x n ′
)
(5)
T
– вектор-столбец, составленный из координат
вектора относительно нового базиса. Подставим (5) в (4), тогда получим квадратичную форму относительно нового базиса
Φ(x 1′ , x 2′ ,..., x n ′ ) = (TX ′)T ⋅ A ⋅ (TX ′). Напомним, что (A ⋅ B )T = BT ⋅ AT . Учитывая кроме того, что TT = T −1 , так как T – ортогональная матрица, получим
Φ′(x 1′ , x 2′ ,..., x n ′ ) = X ′T ⋅ T −1 ⋅ A ⋅ T ⋅ X ′. Итак, матрица квадратичной формы относительно нового базиса равна T ⋅ A ⋅ T . Нетрудно заметить, что она диагональная, причем на главной диагонали стоят собственные значения λ1 , λ2 ,..., λn оператора A . Заметим −1
(это было показано раньше), что в качестве столбцов матрицы T следует взять координаты собственных векторов оператора A в исходном базисе. Приведение квадратичной формы к виду, при котором матрица квадратичной формы имеет диагональный вид, называется приведением квадратичной формы к каноническому виду.
§9 Геометрические приложения теории квадратичных форм в пространствах R 2 и R 3 . 137
Рассмотрим общее уравнение кривой второго порядка:
a 11x 2 + 2a 12xy + a 22y 2 + a 1x + a 2y + a 0 = 0 .
(1)
На первые три слагаемых можно смотреть как на квадратичную форму Φ(x , y ) = a 11x 2 + 2a 12xy + a 22y 2 . Матрица этой квадратичной формы
a 12 ⎞ ⎛a A = ⎜ 11 ⎟. a a 22 ⎠ ⎝ 21
Найдем характеристические числа этой матрицы λ1 и λ2 и соответствующие им единичные векторы X (10 ) и X ( 20 ) , которые примем за орты нового базиса E1 и E2 . Переход от базиса i , j к новому базису E1 , E2 осуществляется матрицей T . X = T ⋅X ′ , (2) где
⎛E E ⎞ T = ⎜ 11 12 ⎟ , ⎝ E21 E22 ⎠
(3)
причем в качестве столбцов этой матрицы берутся координаты векторов E1 и E2 в исходном базисе i , j . После такого преобразования квадратичная форма относительно базиса E1 , E2 имеет вид Φ(x ′, y ′) = λ1x ′2 + λ2y ′2 . Теперь остается преобразовать линейные члены уравнения (1). Для этого достаточно заменить в линейных слагаемых x и y по формулам
x = E11x ′ + E12y ′ , y = E21x ′ + E22y ′
(4)
которые следуют из формул (2) и (3). Заметим, что это преобразование представляет собой переход от старой системы координат xO y к новой x ′O y ′ , повернутой относительно старой системы на некоторый угол α . Напомним, что формулы преобразования координат при повороте координатных осей на угол α имеют вид:
x = x ′ cos α − y ′ sin α , ⎫ ⎬. y = x ′ sin α + y ′ cos α ⎭
(5)
Правые части этих соотношений совпадают с правыми частями соотношений (4), откуда и можно определить угол α . В результате таких преобразований уравнение (7) будет иметь вид:
λ1x ′2 + λ2y ′2 + a 1′x ′ + a 2′y ′ + a 0 = 0 .
(6)
Теперь остается выполнить второй этап упрощения кривой, т.е. сделать параллельный перенос координатных осей. При этом возможны следующие ситуации: 138
1) λ1 и λ2 отличны от нуля и имеют одинаковый знак. Выполняя параллельный перенос, мы приведем далее уравнение (6) к виду:
λ1x ′′2 + λ2y ′′2 + a 0′′ = 0 . Очевидно, что если a 0′′ имеет такой же знак, что и собственные числа λ1 и λ2 , или обращается в нуль, то либо данному уравнению не отвечает никакая кривая, либо соответствует точка (0, 0) ; если a 0′′ имеет противоположный знак, то данная кривая – эллипс; 2) λ1 и λ2 имеют противоположные знаки. Если после параллельного переноса свободный член не обращается в нуль, то получим гиперболу, в противном случае – пару пересекающихся прямых; 3) λ1 или λ2 обращается в ноль. После параллельного переноса мы можем получить параболу. Отметим, что не может оказаться, что оба собственных числа обращаются в нуль, так как в противном случае уравнение (1) было бы линейным. Приведенные рассуждения позволяют сделать вывод, что общее уравнение второго порядка вида (1) является уравнением либо эллипса (окружности), либо гиперболы, либо параболы. Заметим, что здесь содержатся и вырожденные кривые: эллипс (окружность), сжавшийся в точку, пара пересекающихся прямых, мнимый эллипс, пара параллельных прямых и т.п. Остановимся теперь кратко на идее приложения теории квадратичных форм к приведению общего уравнения поверхности второго порядка к каноническому виду. Общее уравнение поверхности второго порядка имеет вид:
a 11x 2 + a 22y 2 + a 33z 2 + 2a 12xy + 2a 13xz + 2a 33y z + 2a 1x + 2a 2y + 2a 3z + a 0 = 0. Суть метода совершенно аналогична изложенному. А именно: в начале рассматривается квадратичная форма
Φ(x , y , z ) = a 11x 2 + a 12xy + a 13xz + a 21y x + a 22y 2 + a 23y z + a 31zx + a 32zy + a 33z 2 (a ij = a ji , i , j = 1, 2, 3) , которая приводится к каноническому виду. Затем, используя матрицу преобразования координат, следует преобразовать линейные члены, и на втором этапе осуществить параллельный перенос координатных осей. Пример. Привести к каноническому виду уравнение поверхности x 2 + 4xz + 6y 2 + z 2 = 0 . Решение.
Рассмотрим
квадратичную
= x 2 + 4xz + 6y 2 + z 2 , Запишем ее так:
139
форму
Φ(x , y , z ) =
Φ(x , y , z ) = 1 ⋅ x 2 + 0 ⋅ xz + 2xz + 0 ⋅ y x + 6y 2 + 0 ⋅ y z + 2 ⋅ zx + 0 ⋅ zy + 1 ⋅ z 2 . Ясно, что матрица данной квадратичной формы
⎛1 0 2⎞ ⎜ ⎟ A = ⎜0 6 0⎟. ⎜2 0 1⎟ ⎝ ⎠ Найдем единичные собственные векторы матрицы A : γ (1) , γ ( 2 ) , γ ( 3) . Напомним, что γ называется собственным вектором матрицы A , если Aγ = λγ => (A − λ E) ⋅ γ = 0 . Для данной матрицы A имеем
0 2 ⎞ ⎛ γ1 ⎞ ⎛ 0 ⎞ ⎛1 − λ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 6 − λ 0 ⎟ ⋅ ⎜γ 2 ⎟ = ⎜ 0⎟ . ⎜ 2 0 1 − λ ⎟⎠ ⎜⎝ γ 3 ⎟⎠ ⎜⎝ 0 ⎟⎠ ⎝
(1)
Эта однородная система линейных алгебраических уравнений, записанная в матричном виде, имеет ненулевые решения, если ее определитель равен нулю, т.е. должно быть
1− λ 0 0 6−λ 2
0
2 0 = 0. 1− λ
Получим характеристическое уравнение, корни которого равны собственно λ1 = 3, λ2 = 6, λ3 = −1 . Найдем соответствующие им собственные вектора γ (1) , γ ( 2 ) и γ ( 3) . 1. λ1 = 3 подставим в систему (1): (1) ⎛ −2 0 2 ⎞ ⎛ γ 1 ⎞ ⎛ 0 ⎞ (1) (1) −2γ 1 + 2γ 3 = 0 ⎫⎪ ⎜ ⎟ ⎜ (1) ⎟ ⎜ ⎟ (1) (1) (1) ⎬ => γ 1 = γ 3 = t , γ 2 = 0 , (1) ⎜ 0 3 0 ⎟ ⋅ ⎜ γ 2 ⎟ = ⎜ 0 ⎟ => 3 ⋅ γ 2 = 0 ⎪⎭ ⎜ ⎟ ⎜ (1) ⎟ ⎜ ⎟ ⎝ 2 0 −2 ⎠ ⎜⎝ γ 3 ⎟⎠ ⎝ 0 ⎠ где t – параметр.
140
Имеем γ (1)
⎛ ⎜ ⎛t ⎞ ⎜ ⎜ ⎟ = ⎜ 0 ⎟ , нормируем этот вектор, получим γ (10 ) = ⎜ ⎜ ⎜t ⎟ ⎝ ⎠ ⎜⎜ ⎝
1 ⎞ 2 ⎟⎟ 0 ⎟. 1 ⎟ ⎟ 2 ⎟⎠
2. λ2 = 6 . Аналогично ( 2) ⎛ −5 0 2 ⎞ ⎛ γ 1 ⎞ ⎛ 0 ⎞ (2) ( 2) −5γ 1 + 2γ 3 = 0 ⎫⎪ ⎜ ⎟ ⎜ ( 2) ⎟ ⎜ ⎟ ( 2) (2) ( 2) ⎬ => γ 1 = γ 3 = 0, γ 2 = t ( 2) ( 2) ⎜ 0 0 0 ⎟ ⋅ ⎜ γ 2 ⎟ = ⎜ 0 ⎟ => 2γ 1 − 5γ 3 = 0 ⎪⎭ ⎜ ⎟ ⎜ ( 2) ⎟ ⎜ ⎟ ⎝ 2 0 −5 ⎠ ⎜⎝ γ 3 ⎟⎠ ⎝ 0 ⎠ T T γ ( 2 ) = ( 0 t 0 ) , γ ( 20 ) = ( 0 1 0 ) .
3. λ3 = −1 . Имеем ( 3) ⎛ 2 0 2⎞ ⎛ γ1 ⎞ ⎛ 0⎞ ( 3) ( 3) 2γ 1 + 2γ 3 = 0 ⎫⎪ ⎜ ⎟ ⎜ ( 3) ⎟ ⎜ ⎟ ⎬ => ( 3) ⎜ 0 7 0 ⎟ ⋅ ⎜ γ 2 ⎟ = ⎜ 0 ⎟ => 7 γ 0 ⋅ = ⎜ ⎟ ⎪⎭ ⎜ 2 0 2 ⎟ ⎜ ( 3) ⎟ ⎜ 0 ⎟ 2 ⎝ ⎠ ⎝γ 3 ⎠ ⎝ ⎠
γ
( 3) 1
= −γ 3
( 3)
= −t , γ 2
( 3)
= 0;γ
( 3)
= ( −t
0 t) ,γ T
( 30 )
⎛ 1 = ⎜− 2 ⎝
T
0
1 ⎞ ⎟ . 2⎠
Возьмем теперь координаты единичных собственных векторов в качестве матрицы преобразования координат
⎛ ⎜ ⎜ T=⎜ ⎜ ⎜⎜ ⎝
1 2 0 1 2
0 − 1 0
1 ⎞ 2 ⎟⎟ 0 ⎟. 1 ⎟ ⎟⎟ 2 ⎠
Преобразование X = T ⋅ X ′ дает:
1 1 ⎫ x′− y′ 2 2 ⎪ ⎪⎪ y = y ′⎬ . 1 1 ⎪ z= x′ + z ′⎪ 2 2 ⎪⎭
x=
141
Ясно, что при таком преобразовании совершается поворот координатных осей вокруг оси O y на угол α =
π
. Относительно новых координат
4 O x ′y ′z ′ квадратичная форма Φ(x ′, y ′, z ′) = 3x ′2 + 6y ′2 − z ′2 .
Следовательно наша поверхность относительно новой системы координат имеет уравнение 3x ′2 + 6y ′2 − z ′2 = 0 . Ясно, что это конус (рис. 5.9.1), вытянутый вдоль оси O z ′ .
z
z′
π 4
0
y
y′ π 4
x
x′
Рис. 5.9.1
142
Литература
[1]
Беклемишев Д.В. Курс аналитической геометрии и линейной алгебры. М.: Физматлит, 2007.
[2]
Беклемешева Л.А., Петрович А.Ю., Чубаров И.А. Сборник задач по аналитической геометрии и линейной алгебре. М.: Физматлит, 2006.
[3]
Ильин В.А., Позняк Э.Т. Аналитическая геометрия. М.: Физматлит, 2006.
[4]
Ильин В.А., Позняк Э.Т. Линейная алгебра. М.: Физматлит, 2006.
[5]
Геворкян П.С. Линейная алгебра и аналитическая геометрия. М.: Физматлит, 2007.
[6]
Бугров Я.С., Никольский С.М. Высшая математика. Т. 1, 2, 3. М.: Дрофа, 2007.
[7]
Сборник задач по математике для втузов / Под редакцией А.В. Ефимова и А.С. Поспелова. Ч. 1. М.: Физматлит, 2004.
[8]
Александров П.С. Лекции по аналитической геометрии. СПб.: Лань, 2008.
[9]
Соловьев И.А., Шевелев В.В., Червяков А.В., Репина А.Ю. Практическое руководство к решению задач по высшей математике. СПб.: Лань, 2008.
[10]
Боревич З.И. Определители и матрицы. СПб.: Лань, 2008.
[11]
Бугров Я.С., Никольский С.М. Высшая математика. Т. 1,2,3. М.: Дрова, 2007.
[12]
Смирнов В.И. Курс высшей математики. Т 1, 2. М.: Физматлит, 2006.
[13]
Никольский С.М. Курс математического анализа. Москва, 2001.
[14]
Берман А.Ф., Араманович И.Г. Краткий курс математического анализа. СПб.: Лань, 2006.
[15]
Фихтенгольц Г.М. Основы математического анализа. Т. 1, 2. СПб.: Лань, 2008. 143
[16]
Кудрявцев Л.Д. Краткий курс математического анализа. Ч. 1,2. М.: Физматлит, 2005.
[17]
Архипов Г.И., Садовничий В.А., Чубариков В.Н. Лекции по математическому анализу. М.: Физматлит, 2005.
[18]
Зорич В.А. Математический анализ. Т. 1, 2. М.: МЦНМО, 2007.
[19]
Мышкис А.Д. Лекции по высшей математике. СПб.: Лань, 2007.
[20]
Кузнецов Л.А. Сборник заданий по высшей математике. Типовые расчеты. СПб.: Лань, 2008.
[21]
Файншмидт В.Л. Дифференциальные и интегральные исчисления функций нескольких аргументов. СПб.: БВХ, 2007.
[22]
Файншмидт В.Л. Дифференциальные и интегральные исчисления функций одного аргумента. СПб.: БВХ, 2007.
[23]
Тер-Крикоров А.М., Шабунин М.И. Курс математического анализа. М.: МФТИ, 2000; М.: Физматлит, 2007.
[24]
Пискунов Н.С. Дифференциальные и интегральные исчисления. Т. 1,2. М.: Интеграл-пресс, 2001.
[25]
Задачи и упражнения по математическому анализу для втузов / Под редакцией Б.П. Демидовича. М.: Астрель, 2003.
144
ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
КАФЕДРА ВЫСШЕЙ МАТЕМАТИКИ Кафедра высшей математики (ВМ) была организована в 1930 году. Первым заведующим кафедрой был профессор Г.Д. Гродский. С конца 1936 года кафедрой ВМ заведовал профессор И.П. Натансон. С 1944 по 1973 г. кафедрой заведовал В.А. Тартаковский — выдающийся математик и замечательный педагог. В разное время на кафедре ВМ преподавали академик В.И. Смирнов, член-корреспондент АН СССР Д.К. Фаддеев, проф. И.С. Соминский, проф. Ф.И. Харшиладзе, проф. А.Ф. Андреев, проф. Ю.В. Аленицьн, проф. И.А. Молотков. В 1979 году кафедру возглавил доктор технических наук, профессор В.Г. Дегтярев, специалист по теории движения космических аппаратов. С 1997 года кафедрой руководит доктор физико-математических наук, профессор И.Ю.Попов, в область научных интересов которого входят теория рассеяния, теория операторов, моделирование сложных физических систем. Кафедра ВМ осуществляет обучение студентов всех специальностей университета по дисциплине «Высшая математика» и читает ряд специальных дисциплин математического цикла. Кафедра ВМ является самой многочисленной кафедрой в университете по числу преподавателей. В настоящее время на кафедре ВМ работают такие выдающиеся ученые как профессора В.В. Жук, А.П. Качалов, Г.П. Мирошниченко, А.Г. Петрашень, В.П. Смирнов, В.М. Уздин, В.Ю. Тертычный — член Нью-Йоркской академии. На кафедре ВМ сложилась научная школа по математическому моделированию сложных физических систем; активно развиваются направления, связанные с нанофизикой и нанотехнологиями, квантовыми компьютерами и квантовыми технологиями. Сложилось тесное сотрудничество с крупными научными центрами как в России, так и за рубежом.
145
Лариса Ивановна Брылевская Иван Александрович Лапин Лариса Семеновна Ратафьева
Аналитическая геометрия и линейная алгебра Учебное пособие Под общей редакцией Ларисы Семеновны Ратафьевой В авторской редакции Компьютерный набор и верстка Дизайн обложки
Д.В. Ермашев Д.В. Ермашев
Редакционно-издательский отдел СПбГУ ИТМО Зав. РИО Н.Ф. Гусарова Лицензия ИД № Подписано к печати Заказ № Тираж Отп. на ризографе
146