Министерство образования Российской Федерации Санкт-Петербургский государственный институт точной механики и оптики (тех...
9 downloads
226 Views
5MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Министерство образования Российской Федерации Санкт-Петербургский государственный институт точной механики и оптики (технический университет) Кафедра высшей математики
Учебное пособие Санкт-Петербург 2001
Министерство образования Российской Федерации Санкт-Петербургский государственный институт точной механики и оптики (технический университет) Кафедра высшей математики
Элементы теории линейных пространств
Учебное пособие
Санкт-Петербург 2001
Коллектив авторов: Л.И. Брылевская, И.А. Лапин, Л.С. Ратафьева., О.Л. Суслина Элементы теории линейных пространств / Под общей редакцией Л.С. Ратафьевой / Учебное пособие.- СПб:СПбГИТМО (ТУ), 2001. - 140 c Предлагаемое учебное пособие представляет собой второе издание учебного пособия того же названия, изданного в ЛИТМО в 1982 г., в которое внесены некоторые дополнения и изменения. Пособие представляет собою базовый конспект лекций по высшей математике для студентов 1-го курса (1 семестр) общеинженерных специальностей – направление 55000 – технические науки. Содержание пособия соответствует образовательным стандартам и программе по высшей математике министерства образования Российской Федерации, утверждённой в 2000 г.. Содержит достаточно большое количество разобранных примеров и задач. В пособии рассмотрены следующие разделы: «Теория определителей», «Векторная алгебра», «Аналитическая геометрия», «Элементы теории матриц и линейных алгебраических систем», «Элементы теории линейных пространств». Содержание разбито на главы, параграфы и пункты. Нумерация формул, теорем и примеров сделана по параграфам. При написании данного пособия использовались материалы учебных пособий, изданных в разное время в СЗПИ, а также книг и учебников, приведённых в списке литературы (без специальных ссылок)
Одобрено на заседании кафедры высшей математики ИТМО (ТУ) (протокол № 3 от 8.02.2000 г.).
© Санкт-Петербургский государственный институт точной механики и оптики
ОГЛАВЛЕНИЕ
Глава I. Элементы теории определителей................................... 5 § 1. Определители второго порядка ................................................................ 5 § 2. Определители третьего порядка .................................................................. 7 § 3. Основные свойства определителей 3-го порядка ...................................... 9 § 4. Определители высших порядков ................................................................. 13 § 5. Исследование и решение линейных систем ............................................... 15
Глава II. Векторная алгебра .......................................................... 17 § 1. Векторы и основные линейные операции над ними ................................. 17 § 2. Линейная зависимость и независимость векторов. Базисы на плоскости и в пространстве. Прямоугольная декартова система координат .............................................................................................................. 19 § 3. Проекция вектора на ось. Координаты вектора. Компоненты вектора ................................................................................................................... 22 § 4. Теоремы о проекциях вектора...................................................................... 24 § 5. Скалярное произведение и его свойства..................................................... 27 § 6. Векторное произведение и его свойства..................................................... 30 § 7. Смешанное произведение трёх векторов и его свойства .......................... 33 § 8. Двойное векторное произведение ............................................................... 35
Глава III. Элементы аналитической геометрии ........................ 38 § 1. Плоскость в трёхмерном пространстве....................................................... 38 § 2. Прямая линия в пространстве ...................................................................... 43 § 3. Кривые второго порядка............................................................................... 52 § 4. Общее уравнение кривой второго порядка ............................................... 57 § 5. Уравнение линии на плоскости и в пространстве ..................................... 61 § 6. Поверхности второго порядка ..................................................................... 66 § 7. Поверхности вращения ................................................................................. 72
3
Глава IV. Матрицы и системы линейных алгебраических уравнений ........................................................................................... 74 § 1. Матрицы. Основные понятия....................................................................... 74 § 2. Элементарные преобразования матриц. Ранг матрицы. Теорема о базисном миноре .................................................................................................. 82 § 3. Исследование систем линейных алгебраических уравнений ................... 86 § 4. Однородные системы линейных алгебраических уравнений................... 95 § 5. Неоднородные системы линейных алгебраических уравнений............... 99 § 6. Альтернатива Фредгольма для линейных систем..................................... 103 § 7 Неравенство первой степени с двумя и тремя переменными.................. 106
Глава V. Линейные пространства и операторы ............................. 109 § 1. Линейное пространство. Базис. Размерность. Подпространство............ 109 § 2. Евклидово пространство Ε n ........................................................................ 113 § 3. Линейные операторы и действия над ними. Матрица линейного оператора.............................................................................................................. 119 § 4. Замена базиса. ............................................................................................... 123 § 5 Изменение матрицы линейного оператора при переходе к новому базису ...................................................................................................... 125 § 6 Сопряженный и самосопряженный оператор ........................................... 126 § 7 Собственные векторы и собственные значения линейного оператора.............................................................................................................. 127 § 8 Квадратичные формы и их приведение к каноническому виду.............. 131 § 9 Геометрические приложения теории квадратичных форм в пространствах Ρ 2 и Ρ .......................................................................................... 133
Литература ....................................................................................... 138
4
ГЛАВА I. ЭЛЕМЕНТЫ ТЕОРИИ ОПРЕДЕЛИТЕЛЕЙ Теория определителей возникла в XVIII веке в связи с задачей решения систем линейных алгебраических уравнений. Однако, впоследствии определители нашли применение в самых различных разделах математики, в частности, в векторной алгебре, аналитической геометрии и математическом анализе.
§ 1. Определители второго порядка Рассмотрим систему двух линейных алгебраических уравнений с двумя неизвестными x 1 и x 2 a 11x 1 + a 12x 2 = b1 ⎫ (1) ⎬, a 21x 1 + a 22x 2 = b 2 ⎭ где a ij (i = 1, 2; j = 1, 2) - числовые коэффициенты системы (1). Таблица, составленная из коэффициентов этой системы a 12 ⎞ ⎛a (2) A = ⎜ 11 ⎟, ⎝ a 21 a 22 ⎠ называется матрицей коэффициентов системы (1). Матрице (2) ставится в соответствие число, называемое определителем матрицы A , которое обозначается detA и вычисляется по правилу detA = a 11a 22 − a 12a 21 , т.е. определитель второго порядка равен разности произведения элементов, стоящих на главной диагонали и на побочной диагонали матрицы A . Определитель матрицы A обозначают так a a 12 (3) det A = 11 = a 11a 22 − a 12a 21 . a 21 a 22 Найдём решение системы (1). Нетрудно убедиться, что оно выражается через коэффициенты системы так (предполагаем, что det A ≠ 0 ):
x1 =
b1a 22 − a 12b 2 ; a 11a 22 − a 12a 21
x2 =
a 11b 2 − b1a 21 . a 11a 22 − a 12a 21
(4)
Мы видим, что в знаменателе выражений для x 1 и x 2 стоит определитель det A , в числителе также стоят определители, которые мы обозначим через Δx и Δx соответственно, т.е. 1 1 Δx = 1
b1 a 12 b 2 a 21 5
, Δx = 2
a 11 b1 a 21 b 2
.
Нетрудно заметить, что определитель Δx получается из определителя 1 Δ , если в нём заменить столбец коэффициентов при x 1 (первый столбец) столбцом из свободных членов, а определитель Δx - если второй столбец 2
определителя Δ заменить столбцом из свободных членов. Тогда решение системы (4) можно записать так: Δx Δx (5) x1 = 1 , x 2 = 2 ( Δ ≠ 0 ). Δ Δ Эти формулы называются формулами Крамера. Итак, для того, чтобы найти решение линейной алгебраической системы второго порядка достаточно подсчитать три определителя Δ , Δx , Δx и составить их отношение. 1 2
Пример 1. Найти по формулам Крамера решение линейной алгебраической системы 2x − y = 1⎫ ⎬. x +y = 2 ⎭
Решение. Вычислим определители Δ , Δx1 , Δx 2 : Δ=
2 −1 1 −1 = 2 ⋅ 1 − ( −1) ⋅ 1 = 2 + 1 = 3, Δx = = 1 ⋅ 1 − ( −1) ⋅ 2 = 1 + 2 = 3, 1 1 1 2 1
2 1 = 2 ⋅ 2 − 1 ⋅ 1 = 4 − 1 = 3, 1 2 По формулам Крамера Δx 3 x 1 = 1 = = 1, Δ 3 Итак, x 1 = 1, x 2 = 1 . Δx = 2
x2 =
Δx 2 = 1. Δ
Основные свойства определителей второго порядка 1.Определитель не изменится, если его строки поменять местами с соответствующими столбцами, т.е.
a 11 a 12 a 11 a 21 = a 21 a 22 a 12 a 22 2.При перестановке двух строк (столбцов) определитель меняет знак на противоположный, т.е. a 11 a 12 a a 22 = − 21 a 21 a 22 a 11 a 12 6
3.Общий множитель всех элементов строки (столбца) можно выносить за знак определителя, т.е. , например, a 11 K a 12 a a 12 = K 11 a 21 K a 22 a 21 a 22 4.Определитель с одинаковыми строчками (столбцами) равен нулю, т.е. a 11 a 12 =0 a 11 a 12 5.Определитель с нулевой строкой (столбцом) равен нулю, т.е. например, a 11 a 12 =0 0 0 6.Если к элементам какой-либо строки (столбца) прибавить соответствующие элементы другой строки (столбца), умноженные на одно и то же число, то определитель не изменится, т.е. например a 11 + ka 12 a 12 a 11 a 12 = a 21 + ka 22 a 22 a 21 a 22 Все эти свойства доказываются непосредственным вычислением левой и правой части выражений, входящих в рассматриваемые равенства. Докажем, например, свойство 6. Для этого вычислим определитель, стоящий в левой части равенства:
a 11 + ka 12 a 12 = (a 11 + ka 12 )a 22 − (a 21 + ka 22 )a 12 = a 21 + ka 22 a 22 = a 11a 22 − ka 12a 22 − a 21a 12 − ka 22a 12 = a 11a 22 − a 21a 12 =
a 11 a 12 . a 21 a 22
§ 2. Определители третьего порядка. Рассмотрим квадратную матрицу (таблицу) третьего порядка ⎛ a 11 a 12 a 13 ⎞ (1) ⎜ ⎟ A = ⎜ a 21 a 22 a 23 ⎟ . ⎜a ⎟ ⎝ 31 a 32 a 33 ⎠ Если в этой матрице вычеркнуть любую строку и любой столбец, то оставшиеся элементы образуют квадратную матрицу второго порядка. Из квадратной матрицы третьего порядка можно получить девять квадратных матриц второго порядка. Введём несколько новых понятий.
7
Определение 1.
Минором элемента a ij матрицы третьего порядка называют определитель матрицы второго порядка, которая получается из данной матрицы вычёркиванием i -ой строки и j -го столбца, т.е. строки и столбца, на пересечении которых стоит данный элемент. Минор элемента a ij обозначается символом M ij . Например, минором элемента a 12 матрицы (1) является определитель a a 23 (2) M 12 = 21 . a 31 a 33
Определение 2. Алгебраическим дополнением элемента a ij матрицы третьего порядка называют число, равное произведению минора этого элемента на ( −1)i + j . Иначе: алгебраическое дополнение элемента a ij - это минор, если сумма индексов i + j чётная, и минор, взятый с противоположным знаком, если сумма индексов i + j нечётная. Алгебраическое дополнение элемента a ij обозначается A ij , т.е. по определению A ij = ( −1)i + j M ij .
Пример 1. Вычислить алгебраические дополнения A 12 и A 31 матрицы ⎛ 1 3 −1 ⎞ ⎜ ⎟ A = ⎜ 0 2 1 ⎟. ⎜ −3 − 1 0 ⎟ ⎝ ⎠
Имеем A 12 = ( −1)3
0
1
−3 0
= −3 ;
A 31 = ( −1)4
3 −1 2
1
= 5.
Замечание. Можно говорить также о минорах и алгебраических дополнениях элементов матрицы второго порядка, если под определителем матрицы, состоящей из одного элемента (матрицы первого порядка), понимать число, равное этому элементу. Определение 3. Определителем (детерминантом) квадратной матрицы третьего порядка (определителем третьего порядка) называем число, равное сумме попарных произведений элементов первой строки на их алгебраические дополнения. Т.е. по определению имеем ⎛ a 11 a 12 a 13 ⎞ ⎜ ⎟ det A = ⎜ a 21 a 22 a 23 ⎟ = a 11A 11 + a 12A 12 + a 13A 13 . ⎜a ⎟ ⎝ 31 a 32 a 33 ⎠ 8
(3)
Пример 2. Вычислить определитель матрицы ⎛ 1 3 −1 ⎞ ⎜ ⎟ A = ⎜ 0 2 1 ⎟. ⎜ −3 − 1 0 ⎟ ⎝ ⎠
Имеем
−1 2 1 0 1 0 2 1 = 1⋅ − 3⋅ + ( −1) ⋅ = −1 0 −3 0 −3 − 1 −3 −1 0
1 det A = 0
3 2
= 1 ⋅ (0 + 1) − 3 ⋅ (0 + 3) − 1 ⋅ (0 + 6) = 1 − 9 − 6 = −14. Замечание. Если в формулу (3) подставить выражения алгебраических дополнений через элементы матрицы, то получим a 11 a 12 a 13 det(A ) = a 21 a 22 a 23 = a 11a 22a 33 + a 21a 32a 13 + a 31a 12a 13 − (4) a 31 a 32 a 33 −a a a − a a a − a a a . 31 22 13
11 32
23
21 12 33
В этой формуле шесть слагаемых, причём каждое из них является произведением трёх элементов матрицы: по одному из каждой строки и из каждого столбца; три слагаемых входит со знаком «+», а три со знаком «-». В курсах высшей алгебры формула (4) принимается в качестве определения определителя третьего порядка.
§ 3. Основные свойства определителей 3-го порядка. Нетрудно убедиться, что все свойства определителей 2-го порядка справедливы и для определителей 3-го порядка. Но как более сложный объект, определители 3-го порядка имеют и дополнительные свойства. Сформулируем и докажем все свойства полностью. 1.Определитель не изменяется, если его строки поменять местами с соответствующими столбцами, т.е. a 11 a 12 a 13 a 11 a 21 a 31 Δ = a 21 a 22 a 23 = a 12 a 22 a 32 . (1) a 31 a 32 a 33 a 13 a 23 a 33
Доказывается разложением каждого определителя по элементам первой строки. В результате получаем одно и то же выражение. 2.Определитель равен сумме попарных произведений элентов любой строки (столбца) на их алгебраические дополнения. 9
Докажем, например, равенство
Δ = a 31A 31 + a 32A 32 + a 33A 33 .
(2)
Имеем a 12 a 13 a a 13 a a 12 − a 32 ⋅ 11 + a 33 ⋅ 11 = a 22 a 23 a 21 a 23 a 21 a 22 = a 31 ⋅ (a 12a 23 − a 22a 13 ) − a 32 ⋅ (a 11a 23 − a 21a 13 ) + a 33 ⋅ (a 11a 22 − a 21a 12 ) . Но a 11a 23 − a 22a 13 = A 31; −(a 11a 23 − a 21a 13 ) = A 32 ; a 11a 22 − a 21a 12 = A 33 ; Следовательно, Δ = a 31A 31 + a 32A 32 + a 33A 33 . Это свойство называют свойством разложения по элементам строки или столбца. 3.При перестановке двух строк определитель меняет знак на противоположный. Доказательство. Пусть в матрице третьего порядка перестановлены первая и третья строки. Покажем, что a 11 a 12 a 13 a 31 a 32 a 33 (3) a 21 a 22 a 23 = − a 21 a 22 a 23 a 31 ⋅
a 31 a 32 a 33 a 11 a 12 a 13 Разлагая определитель, стоящий в левой части равенства (3), по элементам первой строки, получим a 11A 11 + a 12A 12 + a 13A 13 . Разлагая же определитель, стоящий в правой части этого равенства, по элементам третьей строки, получим a 31 a 32 a 33 a 21 a 22 a 23 = a 11 (a 32a 23 − a 22a 33 ) − a 12 (a 31a 23 − a 21a 33 ) + a 11
a 12
a 13
+a 31 (a 31a 22 − a 21a 32 ) = a 11 ( −A 11 ) − a 12A 12 + a 13 ( −A 13 ) = = −(a 11A 11 + a 12A 12 + a 13A 13 ), т.е. то же выражение, но с противоположным знаком.
4.Определитель с двумя одинаковыми строками (столбцами), равен нулю. Доказательство. Пусть Δ - определитель матрицы с двумя одинаковыми строками. Если эти строки переставить местами, то определитель должен поменять знак. Но так как строки одинаковы, то определитель не изменится. Т.е. имеем Δ = −Δ , откуда 2 ⋅ Δ = 0 или Δ = 0. 5.Если все элементы какой-либо строки определителя умножить на число К, то весь определитель умножится на это число. Доказательство. Покажем, например, что 10
a 11
a 12
ka 21 a 31
ka 22 a 32
a 13
a 11
a 12
ka 23 = k ⋅ a 21 a 33 a 31
a 22 a 32
a 13
a 23 . a 33
Разложим по элементам второй строки. Тогда левая часть равенства может быть записана так: (ka 21)A 21 + (ka 22 )A 22 + (ka 23 )A 23 = k ⋅ (a 21A 21 + a 22A 22 + a 23A 23 ) = k ⋅ Δ , где Δ - определитель матрицы A . Это свойство иногда формулируют так: общий множитель всех элементов строки можно выносить за знак определителя. 6.Определитель, у которого соответствующие элементы двух строк пропорциональны, равен нулю. Доказательство. Пусть, например, элементы третьей строки пропорциональны элементам первой, т.е. a 31 = ka 11 , a 32 = ka 12 , a 33 = ka 13 . Тогда, используя свойство 5, а затем 4, будем иметь a 11 a 12 a 13 a 11 a 12 a 13 a 21 a 22 a 23 = k ⋅ a 21 a 22 a 23 = 0 ka 11 ka 12 ka 13 a 11 a 12 a 13 7.Определитель, у которого все элементы какой-либо строки представляют собой сумму двух слагаемых, равен сумме двух определителей, получаемых из данного заменой элементов рассматриваемой строки соответственно на первые и вторые слагаемые. Доказательство. Пусть, например, ′ ″ ′ ″ ′ ″ a 11 = a 11 + a 11 , a 12 = a 12 + a 12 , a 13 = a 13 + a 13 . Тогда ′ ″ ′ ″ ′ ″ a11 +a11 a12 +a12 a13 +a13 ′ ″ ′ ″ ′ ″ a 21 a 22 a 23 = (a11 +a11 )A11 + (a12 +a12 )A12 + (a13 + a13 )A13 = a 31 a 32 a 33 ′ ′ ′ ″ ″ ″ a11 a12 a13 a11 a12 a13 ′ ′ ′ ″ ″ ″ = (a11 A11 +a12 A12 +a13 A13 ) + (a11 A11 + a12 A12 + a13 A13 ) = a 21 a 22 a 23 + a 21 a 22 a 23 a 31 a 32 a 33
a 31
a 32
a 33
8.Определитель не меняется, если к элементам какой-либо строки прибавить соответствующие элементы любой другой строки, умноженные на общий множитель k ≠ 0. Доказательство. Прибавим, например, к элементам первой строки соответствующие элементы третьей строки, умноженные на одно и то же число k . Тогда, по свойству 7, а затем по свойству 6, будем иметь 11
a 11 + ka 11 a 12 + ka 12 a 13 + ka 13 a 11 a 12 a 13 ka 31 ka 32 ka 33 a 21 a 22 a 23 = a 21 a 22 a 23 + a 21 a 22 a 23 = a 31 a 32 a 33 a 31 a 32 a 33 a 31 a 32 a 33 a 11 a 12 a 13 = a 21 a 22 a 23 a 31 a 32 a 33 9.Теорема замещения. Сумма произведений алгебраических дополнений какой-либо строки на числа q 1 , q 2 и q 3 равна определителю матрицы, получающиеся из данной, заменой рассматриваемых элементов соответственно на числа q 1 , q 2 и q 3 . Доказательство. Рассмотрим, например, сумму произведений элементов первой строки на алгебраические дополнения элементов третьей строки: a 11A 31 + a 12A 32 + a 13A 33 и определитель q1
q2
Δ = a 21 a 31
a 22 a 32
q3
a 23 . a 33
Разложив его по элементам первой строки, получим Δ = q 1A 11 + q 2A 12 + q 3A 13 , т.е. исходное выражение. 10. Сумма произведений элементов какой-либо строки на алгебраические дополнения другой строки равна нулю. Доказательство. Рассмотрим, например, сумму произведений элементов третьей строки: a 11A 31 + a 12A 32 + a 13A 33 . По теореме замещения (свойство 9) это выражение равно определителю, в третьей строке которой стоят числа a 11 , a 12 и a 13 : ⎛ a 11 ⎜ ⎜ a 21 ⎜a ⎝ 11
a 12 a 22 a 12
a 13 ⎞ ⎟ a 23 ⎟ . a 13 ⎟⎠
Этот определитель равен нулю по свойству 4, так как первая и третья строки совпадают. Перечисленные свойства, особенно свойство 8, позволяют значительно упростить вычисление определителя, в частности свести вычисление определителя третьего порядка к вычислению одного определителя второго порядка, вместо трёх. 12
Пример. Вычислить определитель 3 Δ = −5 6
2 2
−1 3
−6
3
Прежде всего заметим, что элементы второго столбца имеют общий множитель 2, а элементы третьей строки – общий множитель 3. Поэтому, вынося эти множители за знак определителя, получим 3 Δ = 2 −5 6
2 1
−1 3 3 = 2 ⋅ 3 −5
1 1
−1 3
−3
3
−1
1
2
.
Прибавляя теперь третью строку к первой, будем иметь 5 Δ = 6 −5 2
0 1
0 3
−1
1
.
Разлагая этот определитель по элементам первой строки, в которой только один элемент отличен от нуля, получим 1 3 Δ = 6⋅5 = 30 ⋅ (1 + 3) = 30 ⋅ 4 = 120 . −1 1
§ 4. Определители высших порядков Определители высших порядков, т.е. четвёртого, пятого и т.д., определяются с помощью определителей меньшего порядка точно так, как был определён определитель третьего порядка. Так, определитель четвёртого порядка равен по определению Δ4 =
a 11
a 12
a 13
a 14
a 21
a 22
a 23
a 24
a 31
a 32
a 33
a 34
a 41
a 42
a 43
a 44
= a 11A 11 + a 12A 12 + a 13A 13 + a 14A 14 ,
где a 11 , a 12 , a 13 и a 14 - элементы первой строки, а A 11 , A 12 , A 13 и A 14 - соответствующие им алгебраические дополнения. Миноры и алгебраические дополнения определяются точно так же, как и для определителей третьего порядка. Таким образом, вычисление определителя четвёртого порядка сводится к вычислению четырёх определителей третьего порядка. Определитель порядка n по определению a 11 a 12 ... a 1n a a 22 ... a 2n Δn = 21 = a 11A 11 + a 12A 12 + ... + a 1n A 1n . . . ... . a n 1 a n 2 ... a n 4 13
Как видно, определитель n-го порядка определяется через n определителей n-1 порядка, каждый из них определяется через n − 1 определитель порядка n-2 и т.д.. Доводя разложение до определителей 2-го порядка и вычисляя их, получаем, что определитель n-го порядка представляет собой алгебраическую сумму n! слагаемых. Все свойства, сформулированные и доказанные для определителей третьего порядка, справедливы и для определителей n -го порядка. И доказываются они аналогично. Для вычисления определителей порядка n используем свойство 8. С помощью этого свойства добиваемся того, чтобы в одной из строк или в одном из столбцов, все элементы, кроме одного, были равными нулю. Так что вычисление определителя n -го порядка можно свести к вычислению одного определителя порядка n − 1 . Пример. Вычислить определитель пятого порядка −2 1 Δ= 3 2 0
7 −1 4 5
0 3 0 −4
6 −2 2 2 5 3 −2 2
3
−1
1
−4
Замечаем, что в третьем столбце два элемента равны нулю. Можно в этом столбце получить ещё два нулевых элемента, если ко второй и четвёртой строкам прибавить пятую строку, умноженную соответственно на 3 и на «-4». Тогда получим −2 1 Δ = 3 2 0
−2
7
0
6
8 4 −7
0 0 0
5 −9 5 3 −6 18
3
−1
1
.
−4
Таким образом Δ = ( − 1) ⋅ ( − 1) 5 + 3
−2
7
6
−2
1
8
5
−9
3
4 −7
5 −6
3
2
18
Для вычисления полученного определителя 4-го порядка прибавим к первой, третьей и четвёртой строкам вторую строку, умноженную соответственно на 2, -3, -2. Получим Δ=
0
23
16
− 20
1 0
8 − 20
5 − 10
−9 30
0
− 23
− 16
36
14
Разлагая теперь определитель по элементам первого столбца, получим (вынося предварительно за знак определителя множитель «-10» у элементов третьей строки), что 23
16
− 20
Δ = − 10 2
1
−3
− 16
36
− 23
Прибавляя к первой строке третью строку, будем иметь 0 Δ = − 10 2 − 23
0 1 − 16
16 2 − 3 = − 10 ⋅ 16 ⋅ ( − 1)1+ 3 − 23 36
1 = − 160 ( − 32 + 23 ) = 1450 − 16
Замечание. Существует и другое определение определителя матрицы порядка n : это сумма всевозможных произведений элементов, взятых по одному из каждой строчки, по одному из каждого столбца и снабженных знаком по определённому правилу. Более подробно с теорией определителей можно ознакомиться, например, по книге А.Г. Куроша «Курс высшей алгебры».
§5. Исследование и решение систем линейных алгебраических уравнений Рассмотрим систему линейных алгебраических уравнений третьего порядка a 11x 1 + a 12x 2 + a 13x 3 = b 1 ⎫ ⎪ a 21x 1 + a 22x 2 + a 23x 3 = b 2 ⎬ a 31x 1 + a 32x 2 + a 33x 3 = b 3 ⎭⎪
(1)
Исключая по очереди переменные x 1 , x 2 и x 3 , переходим к формулам Δ ⋅ x 1 = Δ1 , Δ ⋅ x 2 = Δ 2 , Δ ⋅ x 3 = Δ 3 , где (2) a 11 a 12 a 13 b1 Δ = a 21 a 22 a 23 ; Δ 1 = b 2 a 31 a 32 a 33 b3 a 11
b1
a 13
Δ 2 = a 21 b 2 a 23 a 31 b 3
a 12 a
22
a 13
a 23 ;
a 32
a 33
a 11 ; Δ 3 = a 21
a 12 a 22
b1 b2 .
a 31
a 32
b3
a 33
Система (2) эквивалентна системе (1), т.е. каждое решение системы (1) является решением системы (2) и наоборот. Запись в виде (2) позволяет легко исследовать систему. Рассмотрим два случая: определитель Δ равен нулю и определитель Δ отличен от нуля. 1) Пусть Δ ≠ 0 . В этом случае система (2) имеет единственное решение 15
Δ1 Δ Δ ; x2 = 2 ; x3 = 3 . Δ Δ Δ Эти формулы называют формулами Крамера. В знаменателе стоит определитель, составленный из коэффициентов при неизвестных, а в числителях – определители Δi , получающиеся из Δ заменой i-го столбца столбцом свободных членов (i=1,2,3). 2) Пусть Δ = 0 . Здесь возможны два случая. a) Хотя бы один из определителей Δ1 , Δ 2 , Δ 3 в системе (2) отличен от нуля. Пусть для определённости Δ1 ≠ 0 . Тогда уравнение Δ ⋅ x 1 = Δ1 не может быть удовлетворено никаким значением неизвестного. Следовательно система (2), а значит и исходная система (1) несовместная. б) Все определители Δ1 , Δ 2 , Δ 3 равны нулю. В этом случае (примем это пока без доказательства) система (1) либо имеет бесчисленное множество решений, либо она несовместная. Приведённые выше формулы Крамера и рассуждения справедливы для линейных систем любого порядка. Более подробное исследование систем будет рассмотрено в главе IV. x1 =
Пример 1. Исследовать и решить систему x 1 + 2x 2 − x 3 = 1
⎫ ⎪ x 2 + 3x 3 = −7 ⎬ ⎪ −x 1 + 3x 2 − x 3 = −2⎭
Решение. Вычисляем определитель системы Δ . Находим Δ = −17 . Следовательно система совместна и имеет единственное решение. Вычисляя, находим Δ1 = −17 , Δ 2 = 17 , Δ 3 = 34 , откуда Δ −17 Δ 17 34 = −1; x 3 = = −2 . x1 = 1 = = 1; x 2 = 2 = Δ −17 −17 Δ −17
Пример 2. Исследовать систему 2x 1 + x 2 − 3x 3 = 1⎫ ⎪ x 1 − x 2 − 2x 3 = 4 ⎬ ⎪ 3x 2 + x 3 = −7 ⎭ Находим определитель Δ системы. Он равен нулю. Обращаемся к определителям Δ1 , Δ 2 и Δ 3 . Находим: Δ1 = 50 . Определители Δ 2 и Δ 3 можно не вычислять, так как из того, что Δ1 ≠ 0 , следует, что система несовместная. 16
ГЛАВА II. ВЕКТОРНАЯ АЛГЕБРА Векторная алгебра имеет широкое применение в различных разделах физики, математики, механики и т.п.. В курсе средней школы вектор определяется как некоторое преобразование пространства. Однако для прикладных целей удобнее использовать другое, традиционное определение вектора и действий над векторами, на которых мы и остановимся дальше. Это не означает, однако, что сведения, полученные в средней школе, не верны. Просто мы будем изучать векторную алгебру, исходя из несколько иных, более удобных для практических целей позиций.
§ 1. Векторы и основные линейные операции над ними 1. Векторные величины В отличие от скалярной величины, которую можно задать одним числом и отложить на некоторой шкале (отсюда и название – «скалярная») – площадь, объём, температура - векторную величину, или просто вектор, можно задать с помощью числа и некоторого направления (скорость, сила). uuuur Итак, мы можем сказать, что вектор A B - это величина, которая характеризуется числом, совпадающим с длиной отрезка A B , и направлением, совпадающим с направлением луча [A , B ) ( рис. 2.1.1). uuuuur ur При этом длину вектора обозначают A B , a или ещё a . Длину вектора также называют модулем этого вектора. Векторы a и b называют равными, если совпадают их длины и направления. Векторы a и b называют противоположными, если их длины равны, а направления противоположны. Заметим, что при этом начало вектора можно поместить в любой точке пространстве. Такие векторы называют свободными. Если начало и конец вектора совпадают, то такой вектор называется нулевым ( 0 ). Направление нулевого вектора не определено.
B
λ1a λ1 < 0
A
a
b
r
−a Рис. 2.1.1
λ2 a λ2 > 0 a
Рис. 2.1.2 17
2. Умножение вектора на скаляр
Определение 1. Произведением вектора a на число λ называется такой вектор c , что c = λ ⋅ a , а направление его совпадает с направлением вектора a , если λ >0, и ему противоположно, если λ <0; если a = 0 или λ = 0 , то λ a = 0 . Ясно, что векторы a и λ a (если λ ≠ 0 ) можно поместить на одной прямой (рис. 2.1.2). Вектор ( −1) ⋅ a = −a , очевидно, является противоположным вектору a .
Определение 2. Два ненулевых вектора a и b , лежащих на одной прямой или на параллельных прямых, называются коллинеарными. 3. Единичный вектор
Определение 3. Вектор a0 , длина которого равна единице, называется
единичным вектором, или ортом. Если задан некоторый вектор a ( a ≠ 0 ), то всегда можно подобрать множитель λ , такой, чтобы после умножения на него длина вектора λ a была бы равна единице. Очевидно, что в качестве та1 a кого числа нужно взять λ = . Тогда a 0 = , и при этом a 0 называется едиa a ничным вектором, соответствующим вектору a , или ортом вектора a . Очевидно, что направление единичного вектора всегда совпадает с направлением вектора a . Ясно также, что a = a ⋅ a 0 .
Точно так же единичный вектор l 0 , направление которого совпадает с направлением оси l , называется ортом оси l , или её единичным вектором. 4. Сложение векторов
Определение 4. Суммой векторов a и b , расположенных так, что начало вектора b совпадает с концом вектора a , называется вектор c , начало которого совпадает с началом вектора a , а конец – с концом вектора b . (правило треугольника – рис. 2.1.3, а). При этом пишут: c = a + b . Аналогично определяется сумма n векторов a1 + a 2 + ... + an = c . r А именно: суммой называют вектор c , проведённый из начала первого в uur конец последнего вектора, при условии, что начало вектора a 2 совпадает с концом вектора a1 , начало вектора a3 совпадает с концом вектора a 2 и т.д. (правило многоугольника – рис. 2.1.3, б). 18
b
a
a4
c
a+b
a1
a)
b
a3
a2
a+b z
б) Рис. 2.1.3
в)
Замечание. Если на векторах a и b построить параллелограмм, по-
местив их начало в общую точку, то сумма a + b будет лежать на диагонали параллелограмма, выходящего из общего начала векторов a и b (правило параллелограмма – рис. 2.1.3, в). 1) a + 0 = a - поглощение нулевого вектора 2) a + b = b + a - перестановочное, или коммутативное 3) (a + b) + c = a + (b + c) - сочетательное, или ассоциативное. ur Для всякого ненулевого вектора a существует противоположный вектор ur ur ur r - −a , такой, что a + ( −a ) = 0 . 5. Вычитание векторов
Определение 5. Вектор c называется разностью векторов a и b , т.е.
c = a − b , если c + b = a . Отсюда следует, что c = a + ( −b) т.е. вычитание векторов сведено к сложению (рис. 2.1.4). Нетрудно заметить, что разность векторов лежит на второй диагонали параллелограмма, построенного на векторах a и b , проведённой из конца вектора - −b в конец вектора a . b
a
−b
a−b
a−b
b −b
a
а)
б) Рис. 2.1.4
§2. Линейная зависимость и независимость векторов. Базисы на плоскости и в пространстве. Прямоугольная декартова система координат 1. Линейная зависимость и независимость векторов Пусть имеется n векторов a1 , a 2 , …, an и n постоянных коэффициентов c 1 , c 2 ,…, c n . Выражение c 1a1 + c 2a 2 + ... + c n an называется линейной комбинацией векторов a1 , a 2 , …, an . 19
Определение 1. Векторы a1 , a 2 , …, an называются линейно зависимыми, если существуют числа c 1 , c 2 ,…, c n , из которых хотя бы одно отлично от нуля, такие, что линейная комбинация равна нулю: c 1a1 + c 2a 2 + ... + c n an = 0 Определение 1*. Векторы a1 , a 2 , …, an называются линейно зависимыми, если хотя бы один вектор из этой системы можно выразить в виде линейной комбинации остальных. Можно доказать, что определения 1 и 1* эквивалентны, т.е. из 1 следует 1* и наоборот. Определение 2. Векторы a1 , a 2 , …, an называются линейно независимыми, если линейная комбинация c 1a1 + c 2a 2 + ... + c n an = 0 лишь при условии c 1 = c 2 = ... = c n . Определение 2*. Векторы a1 , a 2 , …, an называются линейно независимыми, если ни один из этих векторов нельзя представить в виде линейной комбинации остальных. Можно доказать, что определения 2 и 2* эквивалентны. Пример 1. Доказать, что коллинеарные векторы линейно зависимы. Действительно, поместим векторы a и b на одной прямой (рис. 2.2.1), тогда можно найти такое λ , при котором a = λb => 1 ⋅ a + ( −λ ) ⋅ b = 0 , а это и означает, что a и bлинейно зависимы. Пример 2. Доказать, что любые три вектора a, b и c, лежащие в плоскости, линейно зависимы. Действительно, поместим начало всех трёх векторов в общую точку (рис.2.2.2). Очевидно, тогда можно r ur r подобрать единственную пару urчисел r λ и λ2 , так что будет c = λ1a + λ2b , а что и означает, что векторы a , b и r 1 c линейно зависимы. b
c b
a
a
Рис. 2.2.2
Рис. 2.2.1
Определение 3. Три ненулевых вектора называются компланарными, если они лежат в одной плоскости или в параллельных плоскостях. Итак, мы показали, что компланарные векторы линейно зависимы. 20
Пример 3. Любые четыре вектора в пространстве линейно зависимы. Действительно, можно подобрать, причём единственным образом, такие числа λ1 , λ2 , λ3 , что будет d = λ1a + λ2b + λ3c (рис. 2.2.3).
d c b
λ3c
a
λ1a
λ2b Рис. 2.2.3
2. Базисы на плоскости и в пространстве
Определение 1.
Совокупность любых двух линейно независимых векторов, принадлежащих данной плоскости, называется базисом на этой плоскости. Если e1 , e 2 - базис на плоскости, то для любого вектора a , лежащего в этой плоскости, можно найти единственным образом такие числа x 1 и x 2 , что будет a = x 1e1 + x 2e 2 . Числа x 1 и x 2 называются координатами вектора a в данном базисе.
Определение 2.
Совокупность любых трёх линейно независимых векторов e1 , e2 , e3 в пространстве называется базисом в пространстве. Если a - произвольный вектор, то всегда можно найти единственным образом числа x 1 , x 2 , x 3 такие, что будет иметь место представление: a = x 1e1 + x 2e 2 + x 3e3 . Коэффициенты x 1 , x 2 , x 3 в разложении данного вектоur ра по базису называются координатами вектора a в базисе e1 , e2 , e3 .
3. Прямоугольная декартова система координат Из всех возможных базисов ( e1 , e2 , e3 ) в пространстве выберем такой, чтобы все векторы, входящие в этот базис, были попарно ортогональны (т.е. ∧
(ei ,e j ) =
π
2
, ( i , j = 1, 2, 3 )) , далее разделим каждый вектор базиса на его дли21
0
0
0
ну. Получим базис e1 , e 2 , e3 Такой базис называется ортонормированным. Определение. Тройка векторов a , b , c называется правой, если при r наблюдении с конца вектора c кротчайший поворот от вектора a к вектору b происходит против движения часовой стрелки. 0 0 0 Ограничимся выбором правой тройки базисных векторов e1 , e 2 , e3 . Поместим далее начало векторов, входящих в выбранной базис, в общую точку 0 и из этой точки проведём оси Ox, Oy, Oz, направления которых 0 0 0 совпадают с направлениями векторов e1 , e 2 , e3 . Получим так называемую пространственную прямоугольную правую декартову систему координат Oxyz. Причём принято орты обозначать так: 0 0 0 e1 = i , e2 = j , e3 = k (рис. 2.2.4). Ось Ox называется осью абсцисс, ось Oy – осью ординат, ось Oz – осью аппликат. 0 Если e3 = 0 , получим прямоугольную правую систему декартовых координат на плоскости – систему Oxy. z k
x
j
i
y Рис. 2.2.4
§3. Проекция вектора на ось. Координаты вектора. Компоненты вектора. 1. Проекция вектора на ось. uuuur Пусть вектор A B лежит на некоторой оси l . Направление орта l 0 соответствует направлению оси (Рис. 2.3.1). B A
l0
l0
B
Рис. 2.3.1
A′
l
B′
l
Рис. 2.3.2
Определение 1. Проекцией вектора, лежащего на оси, на эту ось называется число, по абсолютной величине равное длине вектора и взятое со знаком плюс, если направление вектора совпадает с направлением оси и со знаком минус, если они противоположны. 22
uuuur Пусть вектор A B не лежит на оси l . Из точек A и B опустим перпенди′ ′ куляры uuuuu на ось r l . Получим соответственно две точки uuuur A и B . (Рис. 2.3.2). Вектор A ′B ′ называется компонентой вектора A B по оси l . Определение 2. Проекцией вектора, не лежащего на оси l , на эту ось называется проекция его компоненты по оси uuuurl на эту же ось. Проекция вектора на ось обычно обозначается так: прl A B . Очевидно, если вектор uuuur uuuur uuuur A B лежит на оси l , то можно написать: A B = (прl A B ) ⋅ l 0 Замечание. Отметим, что проекция вектора a на ось l является также координатой вектора a по этой оси l . 2. Компоненты вектора по координатным осям и координаты точки.
Поместим начало вектора a в начало декартовой системы координат Oxyz (его конец – точка A ). Спроектируем точку A на координатные оси. Получим соответственно три точки A 1 , A 2 , A 3 (рис. 2.3.3). uuuur uuuur uuuur Как было отмечено, векторы O A 1 , O A 2 , O A 3 , лежащие на координатur ных осях Ox. Oy и Oz , являются компонентами вектора a по координатным осям. Обозначим через a x , a y и a z - проекции вектора a на координатные uuuur uuuur uuuur оси. Ясно, что O A 1 = a x i , O A 2 = a y j , O A 3 = a z k , т.к. r uuuur uuuur uuuur uuuur uuuur uuuuuur′ uuuuu ′ O A = O A 1 + A 1A 2 + A 2 A =O A 1 + O A 2 + O A 3 , то a = a x i + a y j + a z k . Такое представление вектора a называется разложением его на компоненты,urили составляющие по координатным осям. Нетрудно заметить, что вектор a лежит на диагонали параллелепипеда, следовательно, можно най2
2
2
ти его длину, т.е. a = a x + a y + a z . Проекции вектора a на координатные оси, т.е. числа a x , a y и a z , являютur ся координатами вектора a и записываются так: a = a(a x ,a y ,a z ) или a = {a x ,a y ,a z } . z
z
A3 A
k 0 i
A1 x
j
A2 rx i
rz k k 0 i rx i
y
A 2′ Рис. 2.3.3
x 23
M
r j
ry j
Рис. 2.3.4
y
uuuuur Рассмотрим теперь некоторую точку M в пространстве. Вектор r = O M называется радиус-вектором точки M (рис 2.3.4). Проекции rx , r y , r z радиус-вектора точки M на координатные оси называются координатами точки M в данной системе координат, и при этом их обозначают просто x , y и z , т.е. точка M имеет координаты x , y и z записывают так: M (x , y , z ) .
§ 4 Теоремы о проекциях вектора. Определение 1. Углом между вектором a и осью l называется наименьший угол между направлением вектора a и положительным направле∧
нием оси l , обозначается (a,l ) . Теорема 1. Проекция вектора на ось равна произведению длины вектора на косинус угла между вектором и осью. uuuur uuuur Доказательство. Пусть угол θ острый, тогда прl A B = A B ⋅ cosθ . uuuuur uuuur Если же θ тупой (рис. 2.4.1), то ясно, что пр l A ′B ′ = A B ⋅ cosθ .
B
z
γ
A B1 B′
0
θ A′
l
β
y
α
x Рис. 2.4.2
Рис. 2.4.1
Замечание (о направляющих косинусах вектора).
Косинусы углов α , β и γ , которые вектор a образует с координатными осями Ox, Oy и Oz, называются направляющими косинусами вектора a (Рис.2.4.2). Если a x , a y , a z проекции вектора a на координатные оси, то ясно, что имеют место формулы ax ⎫ ⎪ a ⎪ a x = a ⋅ cosα ⎫ ⎪ ⎪ a y = a ⋅ cos β ⎬ => cos β = a y ⎬⎪ => cos 2 α + cos 2 β + cos 2 γ = 1 a ⎪ ⎪ a z = a ⋅ cos γ ⎭ a ⎪ cos γ = z ⎪ a ⎪⎭ cos α =
24
a A
B
b
z A
C
a ra
l
rb
0
0
A′
B′ C ′
l
B y
x
Рис. 2.4.4
Рис. 2.4.3
Теорема 2. Проекция суммы векторов на ось равна сумме проекций
этих векторов на эту же ось, т.е. пр l (a + b) = пр l a + пр l b . Доказательство . r uuuuu r uuuur 0 uuuuu uuuur uuuuur uuuur A ′B ′ = ( пр l A B ) ⋅ l ; B ′C ′ = ( пр l B C ) ⋅ l 0 ; A ′C ′ = ( пр l A C ) ⋅ l 0 ; С другой стороны (Рис. 2.4.3), (1) uuuuur 0 0 0 A ′C ′ = ( пр l a) ⋅ l + ( пр l b) ⋅ l = ( пр l a + пр l b) ⋅ l . Сравнивая правые части равенств (1) и (2), получаем пр l (a + b) = пр l a . (2) uuuur Пример 1. Найти координаты вектора A B и его длину, если известны координаты его начала A (x A , y A , z A ) ) и конца B (x B , y B , z B ) ) - (рис . 2.4.4).
Решение. Проведём радиус-векторы точек A и B: r1 и r2 . Ясно, что rA = x A i + y A j + z A k ; rB = x B i + y B j + z B k uuuur A B = rB − rA = (x B − x A )i + (y B − y A )j + (z B − z A )k . Итак, чтобы найти координаты вектора, нужно из координат его конца вычесть соответственно координаты начала. 2
2
2
Мы получили ранее, что если a = (a x ,a y ,a z ) , то a = a x + a y + a z . uuuur Следовательно, A B = (x B − x A )2 + (y B − y A )2 + (z B − z A )2 . Заметим, что по этой формуле удобно вычислять расстояние между двумя точками, если известны их координаты. Теорема 3. При умножении вектора a на число λ его проекция на ось также умножается на это число, т.е. пр l (λa) = λ пр l a . (Без доказательства).
Теорема 4. Для того, чтобы два вектора были равны, необходимо и достаточно, чтобы их проекции на любую ось были равны. (Доказать самостоятельно). 25
Пример 2. Даны точки A(1,-1,2) uuuur и B(3,2,3) (рис 2.4.5) uuuur
Найти: uuuu 1. rКоординаты вектора A B ; 2. Длину вектора A B ; 3. Разложение uuuur вектора A B на составляющие; 4.Направляющие косинусы uuuur вектора A B ; 5. Единичный вектор (орт), соответствующий вектору A B .
Решение 1. Принимая во вниманиеuuuu предыдущий пример, получим: r
x B − x A = 2 , y B − y A = 3 , z B − z A = 1. Итак A B ( 2, 3,1) . uuuur 2 2 2 2. Напомним, что a = a x + a y + a z , значит A B = 22 + 32 + 1 = 14 . uuuur 3. Так как a = a x i + a y j + a z k , то A B = 2i + 3j + k .
4. Напомним, что a x = a cosα , a y = a cos β , a z = a cos γ , где α , β , γ - угuuuur лы, которые вектор A B составляет с координатными осями Ox, Oy, Oz. Как известно, cos α , cos β , cos γ называются направляющими косину2 3 1 , cos β = , cos γ = . сами вектора a . В нашем случае cosα = 14 14 14 ur uur a uur u r 5. Единичный вектор a 0 , соответствующий вектору a , равен a 0 = ur . Таa uur ur 0 2 3 1 2 r 3 r 1 r 0 ким образом a ( j+ k . Нетрудно i+ , , ) или a = 14 14 14 14 14 14 отметить, что координаты единичного вектора совпадают с его направляющими косинусами. C
B (3, 2, 3) a0
A
A (1, −1, 2)
B
Рис. 2.4.5 Рис. 2.4.6 uuuur Пример 3. Дан вектор A B = i + j + 2k и координаты точек B (1, 2, −1) , uuuur C ( 2, 2, 5) . Найти координаты вектора A C . (рис. 2.4.6) uuuur uuuur Решение. Найдём координаты вектора B C : B C (1, 0, 6) . uuuur uuuur uuuur A C = A B + B C = (i + j + 2k) + (i + 6k) = 2i + j + 8k uuuur Итак A C ( 2,1, 8) . Пример 4. Выяснить, при каких значениях параметров λ и μ вектора a = λ i + 2 j + 3k и b = i + j + μk коллинеарны.
26
Решение. Напомним, что два вектора a и b коллинеарны, если они лежат на параллельных прямых или на одной прямой, а тогда, как было отмечено выше, они линейно зависимы. Следовательно, существует некая константа c такая, что имеет место соотношение a = c b . Откуда следует, что λ i + 2 j + 3k = c (i + j + μk) . Значит (λ − c )i + ( 2 − c )j + (3 − c μ )k = 0 . Так как векторы i , j , k линейно независимы, ибо они представляют собою базис, то должны обращаться в ноль коэффициенты этой линейной комбинации, т.е. λ −c = 0 ⎫ ⎪ 2 −c = 0 ⎬. 3 − c μ = 0 ⎭⎪ Из второго уравнения имеем c = 2 ; подставляя его в первое и третье 3 уравнения, получим значения интересующих нас констант: λ = 2 , μ = . 2
§ 5. Скалярное произведение и его свойства 1. Определение скалярного произведения ur r Скалярным произведением a ⋅ b двух ненулевых векторов a и b называется число, равное произведению длин этих векторов на косинус угла между ними, т.е.
Определение ur r .
∧
a ⋅ b = a ⋅ b ⋅ cos(a,b) . Если хотя бы один из векторов равен нулю, то скалярное произведение этих векторов равно нулю (по определению). ∧
2
Если a = b , то a ⋅ a = a , так как cos(a,a) = 1 . Отсюда следует, что a = a ⋅ a . Заметим, что скалярное произведение a ⋅ a называется скалярным квадратом и обозначается a 2 . Следовательно, a 2 = (a)2 => a = a 2 . Заметим, что иногда скалярное произведение обозначают (a,b) . Свойства скалярного произведения 1. a ⋅ b = a ⋅ пр a b = b ⋅ пр b a ∧
∧
Действительно, пр a b = b ⋅ cos(a,b) , но a ⋅ b = a ⋅ b ⋅ cos(a,b) = a ⋅ пр a b , отсюда следует, что пр a b =
a⋅b . a 27
2. Переместительное или коммутативное свойство: a⋅b = b⋅a . ∧
∧
Это свойство очевидно, так как cos(a,b) = cos(b,a) . 3. Сочетательное или ассоциативное свойство относительно числового множителя λ : (λa) ⋅ b = a ⋅ (λb) = λ (a ⋅ b) 4. Распределительное или дистрибутивное свойство относительного сложения векторов: a ⋅ (b + c) = a ⋅ b + a ⋅ c . Доказательство . ur r r ur a ⋅ (b + c ) = a ⋅ пр a (b + c) = a ⋅ ( пр a b + пр a c) = a ⋅ пр a b + a ⋅ пр a c = a ⋅ b + a ⋅ c
Следствие. (a + b) ⋅ (c + d) = a ⋅ c + b ⋅ c + a ⋅ d + b ⋅ d 2. Необходимое и достаточное условие ортогональности двух векторов
Напомним, что два ненулевых вектора a и b называются ортогональными, если они образуют прямой угол, т.е. ∧
(a,b) =
π
2
.
Теорема.
Для того, чтобы два ненулевых вектора были ортогональны, необходимо и достаточно, чтобы их скалярное произведение обращалось в нуль. Доказательство. Необходимость. Пусть векторы a и b ортогональ∧
ны, тогда cos(a,b) = 0 => a ⋅ b = 0 . Достаточность. Пусть a ⋅ b = 0 . Так как векторы ненулевые, то отсюда ∧
следует, что cos(a,b) = 0 , а это и означает, что векторы a и b ортогональны. 3. Скалярное произведение векторов, заданных своими координатами
Пусть a = (a x ,a y ,a z ) , b = (bx ,by ,bz ) . Очевидно, что i 2 = j2 = k 2 = 1; i ⋅ j = j⋅ i = 0; i ⋅k = k ⋅ i = 0; j⋅k = k ⋅ j = 0 . В силу свойства 4 получим a ⋅ b = (a x i + a y j + a z k) ⋅ (bx i + by j + bz k) = a xbx + a y by + a z bz . В частности, 2
2
2
a = a2 = a x + a y + a z . 28
4. Угол между двумя векторами
Если a и b - ненулевые векторы, то, принимая во внимание определение ∧
вектора и п.4, получим такое выражение для угла (a,b) между векторами a и b: ∧ a xbx + a y by + a z (a,b) (a,b) = arccos = arccos . 2 2 2 2 2 2 a⋅b a +a +a ⋅ b +b +b x
y
z
x
y
z
Отсюда нетрудно получить условие ортогональности (перпендикулярности) двух векторов в координатной форме: a xbx + a y by + a z bz = 0 Механический смысл скалярного произведения
Если F - сила, действующая на перемещении S, то работа A этой силы на ∧
указанном перемещении, как известно, равна F ⋅ S cos(F,S) , т.е. A = F ⋅ S (рис. 3.5.1).
F
θ
Рис. 3.5.1
S
Пример 1. Даны три точки A ( 2, 3, 5), B (1, 2, 2), B (3, 5, 4).
uuuur uuuur Найти прBuuuuCur A B и направляющие косинусы вектора A B . uuuur uuuur Решение. а) A B = ( 2; 3; 2) ; B C = ( −1; −2;1) uuuur uuuur uuuur uuuur uuuur ∧uuuur A B ⋅ B C 2 ⋅ ( −1) + 3( −2) + 2 ⋅ 1 6 =− прBuuuuCur A B = A B ⋅ cos(A B , B C ) = uuuur == 6 BC ( −1)2 + ( −2)2 + 12
б) cosα =
2 3 2 ; cos β = ; cos γ = 17 11 11 ∧
π
Пример 2. Дан вектор a = m + n , m = n = 2 , m,n = . 3
Найти длину вектора a . Решение. Найдём скалярный квадрат вектора a : a 2 = (m + n) ⋅ (m + n) . Раскроем скобки, пользуясь свойствами скалярного произведения: (m + n) ⋅ (m + n) = m 2 + n ⋅ m + m ⋅ n + n ⋅ n = m 2 + 2m ⋅ n + n 2 =
29
∧
2
2
= m + 2 m ⋅ n cos(m,n) + n = 4 + 2 ⋅ 2 ⋅ 2 ⋅ cos
π 3
+ 4 = 8 + 8⋅
1 = 12 . 2
a = a = 12 2
Пример 3. При каком значении α
вектора
a = i + 2j + k
и
b = 2i + α j + 2k ортогональны. Решение. Принимая во внимание условие ортогональности двух векторов a x bx + a y by + a z bz = 0 , получим 1 ⋅ 2 + 2 ⋅ α + 1 ⋅ 2 = 0 . Следовательно α = −2 .
§ 6. Векторное произведение и его свойства 1. Определение векторного произведения
Определение.
Векторным произведением a × b ненулевых векторов a и b называется такой вектор c , который удовлетворяет трём условиям: ∧
1. c = a ⋅ b ⋅ sin(a,b) , т.е. длина вектора c = a × b численно равна площади параллелограмма, построенного на этих векторах. r 2. Вектор c перпендикулярен плоскости, в которой лежат векторы a и b. 3. Тройка a , b , c - правая (рис. 2.6.1) Если хотя бы один из векторов a и b нулевой, то по определению a × b = 0 . Заметим, что иногда векторное произведение двух векторов a и b обозначается символом [a;b] .
c b
a Рис. 2.6.1
Свойства векторного произведения
1. a × b = −b × a . Это очевидно, так как при перестановке векторов изменится ориентация тройки. 30
2. Свойство сочетательности относительно скалярного множителя: λ (a × b) = (λa) × b = a × (λb) . (без доказательства) 3. Распределительное свойство относительно сложения векторов : a × (b + c) = a × b + a × c . (a + b) × (c + d) = a × c + b × c + a × d + b × d . Следствие. (a + b) × (c + d) = a × c + b × c + a × d + b × d . То есть скобки можно раскрывать, как при обыкновенном умножении, не переставляя местами множители (без доказательства).
2. Необходимое и достаточное условие коллинеарности двух ненулевых векторов
Теорема.
Для того, чтобы два ненулевых вектора a и b были коллинеарны, необходимо и достаточно, чтобы их векторное произведение было бы равно нулю. Доказательство. Необходимость. Пусть векторы a и b коллинеарны, ∧
тогда они лежат на одной прямой, следовательно, sin(a,b) = 0 => a × b = 0 . Значит, a × b = 0 Достаточность. Пусть векторное произведение a × b = 0 . Так как a ≠ 0 , ∧
∧
∧
b ≠ 0 , то значит sin(a,b) = 0 , т.е. (a,b) = 0 или (a,b) = π , а это означает, что векторы a и b коллинеарны. Замечание. Заметим, что если два вектора a(a x ,a y ,a z ) и b(bx ,by ,bz ) коллинеарны, то существует такое число λ , при котором a = λb , т.е. a x i + a y j + a z k = λ (bx i + by j + bz k) =>
a x = λbx ⎫ a a a ⎪ => a y = λby ⎬ => x = y = z . bx b y b z ⎪ a z = λbz ⎭ Итак, мы доказали, что если два вектора коллинеарны, то их координаты пропорциональны. 3. Векторное произведение векторов, заданных своими координатами Заметим, что i × i = j × j = k × k = 0 . Далее очевидно, что i × j = k , j × k = i , k × i = j , j × i = −k , k × j = − i , i × j = − j . 31
Применяя свойство 3, перемножим векторно векторы a = a x i + a y j + a z k и b = bx i + by j + bz k a × b = (a x i + a y j + a z k) × (bx i + by j + bz k) = a x bx i × i + a z bx j × i + a z bx k × i + +a xby i × j + a y by j × j + a z by k × j +a xbz i × k + a y bz j × k + a z bz k × k = i = (a y bz − a z by )k − (a x bz − a z bx )j + (a x by − a y bx )i = a x
j ay
k az .
bx
by
bz
4. Механический смысл векторного произведения Если сила F поворачивает тело вокруг оси l , то момент M силы F , как известно, равен M = r × F (рис. 2.6.2).
uuuur uuuur c = A B ×A C
l
F 0
B
c0
r
A
−c0 Рис. 2.6.2
B
Рис. 2.6.3
Пример 1. 1. Найти площадь треугольника с вершинами в точках A(-1,1,2), B(2,3,3) и C(1,2,-1); 2. Найти единичный вектор, перпендикулярный к плоскости, в которой лежат точки A,B и C.
Решение . uuuur
uuuur 1. A B (3, 2,1) , A C ( 2,1, −3) i j k uuuur uuuur 2 1 3 1 3 2 + (−1)1+2 j + (−1)1+3 k = A B × A C = 3 2 1 = (−1)1+1 i 1 −3 2 −3 2 1 2 1 −3 r r r = −7i + 11j − k uuuur uuuur | A B × A C |= ( −7 )2 + 112 + ( −1)2 = 171 . 32
Площадь треугольника равна половине площади параллелограмма, поuuuur uuuur 171 . строенного на векторах A B и B C , следовательно S ΔA B C = 2uuuur uuuur 2. В силу определения векторного произведения вектора c = A B × A C , два вектора −7i + 11j − k ±c 0 = ± 171 удовлетворяют поставленной задаче (рис. 2.6.3).
§ 7. Смешанное произведение трёх векторов Определение смешанного произведения
Определение. Смешанным произведением ненулевых векторов a , b , c называется скалярное произведение вектора a и векторного произведения вектора b на вектор c , т.е. выражение a ⋅ (b × c) . Необходимое и достаточное условие компланарности трёх векторов
Теорема. Для того чтобы ненулевые векторы a , b и c были компланарны, необходимо и достаточно, чтобы их смешанное произведение равнялось нулю. Доказательство. Необходимость. Пусть векторы a , b и c компланарны. Тогда их можно поместить в одной плоскости, и вектор b × c окажется перпендикулярным вектору a , следовательно, их скалярное произведение равно нулю, т.е. a ⋅ (b × c) = 0 . Достаточность. Пусть a ⋅ (b × c) = 0 . Так как векторы ненулевые, то может быть: 1) b × c = 0 , тогда b = λc , следовательно, векторы a , b и c можно поместить в одной плоскости, т.е. они компланарны; 2) b × c ≠ 0 , но a ⋅ (b × c) = 0 => a ⊥ (b × c) . Это значит, что вектор a лежит в одной плоскости с векторами b и c.
Геометрический смысл смешанного произведения. Предположим, что векторы a , b и c некомпланарны. Построим параллелепипед на этих векторах, принимая за основание параллелограмм, построенный на векторах b и c (рис. 2.7.1). 1) Пусть a , b , c - правая тройка. Тогда угол между векторами a и b × c острый, т.е. векторы a и (b × c ) лежат в одном полупространстве. 33
b×c h
a c
b Рис. 2.7.1 ∧
Очевидно, что a ⋅ cos(a,(b × c)) = пр b×c a = h даёт нам высоту параллелепипеда, следовательно, a ⋅ (b × c) есть не что иное, как объём параллелепипеда, построенного на векторах a ,b , с.. 2) Если a , b , c - левая тройка, то векторы a и b × c будут лежать в раз∧
ных полупространствах, а тогда a ⋅ cos(a,(b × c)) = −h , следовательно, a ⋅ (b × c) будет равно объёму параллелепипеда, взятому со знаком минус. Итак, объём параллелепипеда v = ±a ⋅ (b × c) или v = a ⋅ (b × c) . Вывод. Абсолютная величина смешанного произведения трёх ненулевых векторов даёт нам объём параллелепипеда, построенного на этих векторах. 2. Свойства смешанного произведения 1. a ⋅ (b × c) = b ⋅ (c × a) = c ⋅ (a × b) . Т.е. смешанное произведение не меняется при циклической перестановке перемножаемых векторов. Действительно, каждое произведение имеет один и тот же модуль в силу геометрического смысла смешанного произведения. Знаки их также совпадают, так как ориентация тройки не меняется при циклической перестановке векторов. 2. a ⋅ (b × c) = −a ⋅ (c × b) . Действительно, при перестановке двух соседних векторов модуль смешанного произведения не меняется, а знак меняется на противоположный, так как тройка меняет свою ориентацию. 3. a ⋅ (b × c) = c ⋅ (a × b) = (a × b) ⋅ c . Действительно, в силу первого свойства: a ⋅ (b × c) = c ⋅ (a × b) . С другой стороны, c ⋅ (a × b) = (a × b) ⋅ c , откуда и следует окончательно: a ⋅ (b × c) = (a × b) ⋅ c . Поэтому иногда смешанное произведение обозначают (a, b, c) . 4. Если a = (a x ,a y ,a z ) , b = (bx ,by ,bz ) , c = (c x ,c y ,c z ) , то 34
ax ay az (a,b,c) = bx by bz . cx cy cz Действительно, a ⋅ (b × c) = (a x ,a y ,a z ) ⋅ (
by bz cy cz
;−
bx bz bx by ; )= cx cz cx cy
ax ay az by bz bx by bx bz =ax ⋅ −ay +az = bx by bz . cy cz cx cy cx cz cx cy cz
§ 8. Двойное векторное произведение Определение. Двойным векторным произведением трёх ненулевых
векторов a ≠ 0 , b ≠ 0 и c ≠ 0 называется a × (b × c) ; если хотя бы один из def
векторов a , b или c равен нулю, то a × (b × c) = 0 . Итак, мы видим, что двойное векторное произведение представляет собою векторную величину. Заметим, что объекты типа a × (b × c) часто встречаются в физике и механике. Выведем простую форму для вычисление двойного векторного произведения. Итак, допустим, что нам известны координаты векторов, т.е. a = a x i + a y j + a z k , b = bx i + by j + b z k , c = c x i + c y j + c z k . Вычислим a × (b × c) . Обозначим v = b × c , u = a × (b × c) = a × v . Очевидно, что нас интересует вектор v . Известно, что вектор v = b × c выражается через координаты векторов b и c так:
то есть
i v = bx
j by
k bz = (by c z − bz c y )i + (bz c x − bx c z )j + (bx c y − by c x )k ,
cx
cy
cz
v x = by c z − b z c y , v y = b z c x − bx c z , v z = bx c y − by c x .
В свою очередь, аналогично 35
u = a × v = (a y v z − a z v y )i + (a z v x − a x v z )j + (a x v y − a y v x )k .
Подставим в правую часть этого равенства полученные выражения для v x , v y и v z и, кроме того, выполним искусственное преобразование, добавив и отняв к правой части выражения a x bx c x i , a y by c y j , a z bz c z k . Получим:
u = a × (b × c) = [a ybxcy − a ybyc x − a zbzcx + a zbxc z ]i + [a zbyc z − a zbzcy − a xbxcy +a xbyc x ]j + [a xbzcx −a xbxc z − a ybyc z + a ybzcy ]k + a xbxcx i − a xbxcx i + a ybycy j − −a ybycy j + a zbzc z k −a zbzc z k = bx (a ycy + a zc z )i + a xbxcx i + by (a zc z + a xcx )j + +a ybycy j + bz (a xcx + a ycy )k + a zbzc z k − [cx (a yby + a zbz )i + a xbxcx i + cy (a zbz + +a xbx )j + a ybycy j + c z (a xbx + a yby )k + a zbzc z k] = (bx i + by j + bz k)(a xcx + a ycy + +a zc z ) − (cx i + cy j + c z k) ⋅ (a xbx + a yby + a zbz ) = b(a ⋅ c) − c(a ⋅ b) Итак, получили: a × (b × c) = b(a ⋅ c) − c(a ⋅ b) . Отметим, что справа в скобках стоят числа, равные скалярным произведениям a ⋅ c и a ⋅ b ; они являются коэффициентами линейной комбинации векторов b и c , через которые выражается двойное векторное произведение a × (b × c) . Нетрудно заметить, что двойное векторное произведение представляет собою вектор, который лежит в той же плоскости, что и вектора b и c , т.е. векторы a × (b × c) , b и c компланарны. Остановимся теперь на вычислении выражения (a × b) × c , которое, вообще говоря, также является двойным векторным произведением. Действительно: (a × b) × c = −c × (a × b) = −[a(c ⋅ b) − b(c ⋅ a)] = b(a ⋅ c) − a(b ⋅ c), т.е. (a × b) × c представляет собою вектор, лежащий в одной плоскости с векторами a и b . Очевидно также, что a × (b × c) ≠ (a × b) × c . Другие свойства двойного векторного произведения нетрудно проанализировать, принимая во внимание свойства скалярного и векторного произведения.
Пример 1. Показать, что точки А (1,2,1), В (3,3,3), С (4,1,2) и D (5,4,5) лежат в одной плоскости. uuuur uuuur uuuur Решение. Найдем координаты векторов A B , A C и A D . 36
uuuur uuuur uuuur A B (2,1,2), A C (3,-1,1), A D (4,2,4). Если точки А, В, С и D лежат в одной плоскости, то и векторы лежат в одной плоскости (рис. 2.8.1), а тогда смешанное произведение этих векторов равно нулю. B
A
C Рис. 2.8.1
D
Действительно, 2 1 2 uuuur uuuur uuuur ( A B , A C , A D ) = 3 −1 1 = 0, 4 2 4 т.к. первая и вторая строки определителя пропорциональны.
Пример 2.
Доказать, что векторы a = i + j + 2k , b = 3i + 4 j + k и c = i + 2 j − 3k линейно зависимы и найти эту линейную зависимость.
Решение. 1 1 2 ( a , b , c )= 3 4 1 =0, 1 2 −3 cледовательно, векторы a , b и c компланарны, а значит, они линейно зависимы, т.е. существуют константы λ , μ и ν такие, что λ a + μ b +ν c =0, т.е. λ ( i + j + 2k )+ μ (3 i + 4 j + k ) + ν ( i +2 j -3 k )= 0 , откуда следует: ( λ + 3 μ + ν ) i + ( λ + 4 μ + 2ν ) j + (2 λ + μ -3ν ) k = 0 , т.к. i , j , k - базисные векторы, то имеем такую систему для нахождения λ , μ и ν :
λ + 3μ +ν = 0 ⎫ λ + 3μ +ν = 0⎫ λ = 2ν ⎫ ⎪ ⎪ λ + 3μ +ν = 0⎫ λ + 4μ + 2ν = 0⎬ ⇒ μ +ν = 0 ⎬⇒ ⎬ ⎬ ⇒ λ − 3ν + ν = 0 ⇒ μ = −ν ⎭ μ = −ν ⎭ ⎪ ⎪ 2λ + μ − 3ν = 0 ⎭ −5μ − 5ν = 0 ⎭ Здесь ν выступает в качестве параметра, и данная система имеет бесчисленное множество решений. Подставим λ = 2ν , μ = −ν в указанную выше линейную комбинацию: 2ν a − ν b + ν c = 0 . Сократим на ν ≠ 0 . Получим искомую линейную зависимость 2a − b + c = 0 . 37
ГЛАВА III. ЭЛЕМЕНТЫ АНАЛИТИЧЕСКОЙ ГЕОМЕТРИИ Прежде чем приступить к изучению конкретных геометрических объектов и их свойств, заметим, что аналитическая геометрия главным образом рассматривает уравнения этих объектов в координатном пространстве 3 (или 2 ), т.е. в некоторой трехмерной декартовой системе координат Oxyz (или Oxy). Причем, под уравнениями геометрических объектов (прямой линии, плоскости, конуса, гиперболы, окружности и т.п.) мы будем понимать всякое уравнение, устанавливающее связь между координатами (x , y , z ) всех точек, принадлежащих данному геометрическому объекту. Итак, аналитическая геометрия изучает геометрические объекты и их свойства аналитически, т.е. путем анализа их уравнений.
§ 1. Плоскость в трехмерном пространстве Положение плоскости в пространстве можно задать различными способами. Действительно, через три данные точки М1, М2 и М3 проходит единственная плоскость, через данную точку М0(x0, y0, z0) перпендикулярно данному вектору n (А,В,С) можно провести единственную плоскость и т.п. 1. Векторное уравнение плоскости. Общее уравнение плоскости Рассмотрим некоторую плоскость P и точку М(x, y, z) на этой плоскости, так называемую текущую точку плоскости. Пусть кроме этого определен вектор n (А,В,С) - нормаль к плоскости и некоторая точка М0(x0, y0, z0) фиксированная точка на этой плоскости. Обозначим через r0 и r - радиус векторы точек М0 и М1 (рис. 3.1.1). z n
0
M 0 (x 0 , y 0 , z 0 ) M (x , y , z ) r0 P r
x
y
Рис. 3.1.1 uuuuuuur Очевидно, что вектор M 0M = r − r0 лежит в плоскости. Ясно также, что uuuuuuur векторы M 0M и n перпендикулярны, следовательно, их скалярное произведение равно нулю, т.е. (r − r0 ) ⋅ n = 0 , (1) 38
Уравнение (1) называется уравнением плоскости в векторной форме. Выражая скалярное произведение через координаты перемножаемых векторов, получим A (x − x 0 ) + B (y − y 0 ) + C (z − z 0 ) = 0 . (2) Уравнение (2) называется уравнением плоскости, проходящей через данную точку. Обозначая через D выражение −A x 0 − B y 0 − C z 0 , запишем уравнение (2) в виде: (3) A x + B y +C z + D = 0 Уравнение (3) называется общим уравнением плоскости. Заметим, что общее уравнение плоскости линейно относительно переменных x , y , z . Можно доказать и обратное, что всякому линейному уравнению вида (3) в пространстве соответствует плоскость. Подчеркнем, что коэффициенты A , B ,C при переменных x , y , и z дают нам ни что иное, как координаты вектора, перпендикулярного данной плоскости P , т.е. нормали к плоскости P.
2. Угол между плоскостями. Взаимное расположение двух плоскостей в пространстве Угол между двумя плоскостями измеряется наименьшим углом между нормалями к ним. Следовательно, если даны две плоскости P1 : A 1x + B 1y + C 1z + D 1 = 0 и P 2 : A 2x + B 2y + C 2z + D 2 = 0 , то угол ϕ между ними можно вычислить из соотношения: n1 ⋅ n 2 = n1 ⋅ n 2 ⋅ cos ϕ Отсюда следует: cos ϕ =
A 1A 2 + B 1B 2 + C 1C 2 2 1
2 1
2 1
2
2
2
.
A + B +C ⋅ A 2 + B 2 +C 2 Интересны частные случаи взаимного расположения двух плоскостей в пространстве.
3. Условие параллельности двух плоскостей Если две плоскости параллельны, то нормали к ним коллинеарны. Следовательно, условие параллельности двух плоскостей имеет вид: A1 B 1 C 1 = = (3) A2 B2 C 2
4. Условие перпендикулярности двух плоскостей Если две плоскости перпендикулярны, то перпендикулярны и нормали к ним, т.е. n1 ⋅ n 2 = 0 , откуда следует (4) 39
A 1A 2 + B 1B 2 + C 1C 2 = 0 Заметим, что условия (3) и (4) не только необходимы, но и достаточны соответственно для параллельности и перпендикулярности двух плоскостей.
Пример 1. Найти уравнение плоскости, проходящей через точку M 0 (1,1, 2) и (рис.3.1.2).
параллельной
данной
плоскости
P:
x + 2y − z + 3 = 0
Решение. Искомая плоскость параллельна данной, следовательно нор-
маль к плоскости P n(1, 2, −1) является нормалью также и к искомой плоскости (рис. 1), а тогда, принимая во внимание уравнение (2) – уравнение плоскости, проходящей через данную точку, получим уравнение искомой плоскости: 1(x − 1) + 2(y − 1) − 1(z − 2) = 0 Или, раскрывая скобки и приводя подобные члены, окончательно получаем общее уравнение искомой плоскости: x + 2y − z − 1 = 0 .
n3
.M 0 (1,1, 2)
.M 0
P3
n(1, 2, −1) P
n1
P2
P1 Рис. 3.1.2
n2
Рис. 3.1.3
Пример 2. Найти уравнение плоскости, проходящей через данную точку M 0 (1,1, 2) и перпендикулярную к двум данным плоскостям: P1 : x + 2y − z + 3 = 0 и P 2 : 2x − y − 2z − 1 = 0 (рис. 3.1.3) Решение. Обозначим искомую плоскость P 3 . Нам известна точка M 0 (1,1, 2) , ей принадлежащая, значит мы можем написать уравнение плоскости, проходящей через точку M 0 - уравнение (2): A (x − 1) + B (y − 1) + C (z − 2) = 0 В качестве нормали n3 мы можем взять вектор n3 = n1 × n 2 , т.к. в силу определения векторного произведения вектор n3 перпендикулярен как к вектору n1 (1, 2, −1) , так и к вектору n 2 ( 2, −1, −2) . Вычисляем 40
i n3 = n1 × n 2 = 1
j 2
k −1 .
2 −1 −2 Разложим данный определитель по элементам первой строки, тогда будет: 2 −1 1 −1 1 2 n3 = i ⋅ ( −1)1+1 ⋅ + j ⋅ ( −1)1+ 2 ⋅ + k ⋅ ( −1)1+3 ⋅ = −5i − 5k −1 −2 2 −2 2 −1 , т.е. n 3 ( −5, 0, 5) . Изменим на нормали n3 направление (так проще), т.е. возьмём n3 (5, 0, 5) . Возьмём в качестве n3 коллинеарный вектор n 3 (1, 0,1) . Тогда уравнение искомой плоскости 1(x − 1) + 0(y − 1) + 1(z − 2) = 0 .
Окончательно x + z − 3 = 0 . Пример 3. Найти уравнение плоскости, проходящей через точки M 1 (1,1, −1) , M 2 ( 2,1, 2) и M 3 (3,1, −1) . (рис 3.1.4) Решение . В качестве нормали к искомой плоскости можно взять вектор uuuuuuur uuuuuuu r n = M 1M 2 × M 1M 3 . Очевидно, что M 1M 3 ( 2, 0, 0) , M 1M 2 (1, 0, 3) . Найдём i j k
n = 1 0 3 = 6j 2 0 0
. Искомая плоскость A (x − 1) + B (y − 1) + C (z + 1) = 0 . Положим здесь A = 0 , B = 6 , C = 0 . Окончательно получим уравнение искомой плоскости y = 1 . n
M 1.
M2 M3 P
P3
P2
M
P1
Рис.3.1.4
Рис.3.1.5
Пример 4.
Найти точку пересечения трёх плоскостей: P1 : x + y + z − 3 = 0 , P 2 : 2x − y − z = 0 и P 3 : x + 2y − z − 2 = 0 . (рис. 3.1.5) 41
Решение. Координаты точки пересечения плоскостей удовлетворяют каждому из уравнений плоскости, следовательно решение задачи сводится к нахождению решения системы трёх алгебраических уравнений: x +y +z = 3 ⎫ ⎪ 2x − y − z = 0 ⎬ . x + 2y − z = 2 ⎭⎪ Найдём решение этой системы по формулам Крамера: Δ Δ Δ x= x,y = y ,z= z . Δ Δ Δ 1 Имеем Δ = 2 1 3 Δx = 0 2
1 −1
1 1 −1 = 3
1 0
2
−1
1
2
3
0
1
1
−1 2
−1 = 0 −1 2
1 1 0 = 3 ⋅ ( − 1) 2 + 1 ⋅ 2 −1 0
−1 2
−1 − 1 = 3 ⋅ ( − 1 )1 + 1 ⋅ 2 −1
1
3
1
3
3
0
Δy = 2
0
−1 = 2
0
− 1 = ( − 1 ) ⋅ ( − 1) 2 + 3 ⋅
1
2
−1
2
0
1 Δz = 2 1
1 −1 2
−1
3 3 0 = 2 2 5
0 −1 0
1 =9 −1 −1 −1
3 −1
3 3 0 = ( − 1) ⋅ ( − 1) 2 + 2 ⋅ 5 2
=9
3 =9 2
3 =9 2
Окончательно получим x = 1 , y = 1 , z = 1 . Итак, точка пересечения плоскостей M (1,1,1).
Пример 5. Найти уравнение плоскости, проходящей через точку
M 0 (1, −1, −1) и линию пересечения плоскостей (рис. 3.1.6) P1 : x + y + z − 3 = 0 и P 2 : 2x + y − z − 2 = 0 (5) Решение. Возьмём на линии пересечения плоскостей две какие-нибудь (любые) различные точки M 1 (x 1 , y 1 , z 1 ) и M 2 (x 2 , y 2 , z 2 ) так, чтобы координаты этих точек удовлетворяли системе двух уравнений (5). Эта система содержит два уравнения с тремя неизвестными, значит она имеет бесчисленное множество решений (это есть множество точек, лежащих на линии пересечения плоскостей l ). Зафиксируем в этой системе переменную z , положив, например, z 1 = 0 , тогда получим x1 + y 1 = 3 ⎫ ⎬ => x 1 = −1 , y 1 = 4 . 2x 1 + y 1 = 2 ⎭ 42
Итак, мы нашли точку M 1 ( −1, 4, 0) . Положим теперь z 2 = 1 , тогда имеем: x2 +y 2 = 2 ⎫ ⎬ => x 2 = 1, y 2 = 1 . 2x 2 + y 2 = 3⎭ Получим вторую точку M 2 (1,1,1) . Введём в рассмотрение векторы uuuuuuur uuuuuuuur M 0M 1 = −2i + 5 j + k , M 0M 2 = 2 j + 2k . Теперь можно найти нормаль к исuuuuuuur uuuuuuuur комой плоскости P : n = M 0M 1 × M 0M 2 , i j k n = −2 5 1 = 8i + 4 j − 4k .
0 2 2 Сокращая на 4, возьмём более простое выражение для нормали n = 2i + j − 2k . Теперь остаётся написать уравнение искомой плоскости P : P : 4(x − 1) + 1(y + 1) − 2(z + 1) = 0 Окончательно общее уравнение искомой плоскости: 2x + y − z − 2 = 0 S(m , n , p ) M ( x , y , z ) l z M0
M2 P1
M 0 (x 0 , y 0 , z 0 )
r
M1 n
P
P2
0
r0
y
x
Рис. 3.1.6
Рис. 3.2.1
§ 2. Прямая линия в пространстве 1. Векторное уравнение прямой
Положение прямой линии в пространстве можно задать различными способами. В частности, через данную точку M 0 (x 0 , y 0 , z 0 ) параллельно данному ненулевому вектору S(m , n , p ) можно провести единственную прямую (рис. 3.2.1). Вектор S называется направляющим вектором прямой. Обозначим через r0 радиус-вектор точки M 0 , а через r - радиус-вектор произвольной точки M , лежащей на прямой. uuuuuuur uuuuuuur Очевидно, что векторы M 0M и S коллинеарны, но M 0M = r − r0 , следовательно r − r0 = λS . Отсюда (1) r = r0 + λS 43
Уравнение (1) называется векторным уравнением прямой линии в пространстве. 2. Параметрические и канонические уравнения прямой
Запишем уравнение (1) в виде: x i + y j + z k = x 0i + y 0 j + z 0k + λm i + λn j + λp k = (x 0 + λm )i + (y 0 + λn )j + (z 0 + λp )k Примем теперь во внимание, что если два вектора равны, то совпадают их координаты в данном базисе i , j , k : x = x 0 + λm ⎫ ⎪ (2) y = y 0 + λn ⎬ z = z 0 + λ p ⎪⎭ Уравнения (2) называются параметрическими уравнениями прямой. Здесь в качестве параметра выступает λ . Придавая λ различные числовые значения из ( −∞, +∞ ) , будем получать на прямой различные точки. Исключая из уравнения (2) параметр λ , получим так называемые канонические уравнения прямой: x −x0 y −y0 z −z0 . = = m n p 3. Уравнение прямой, проходящей через две данные точки
Пусть даны две различные точки M 1 (x 1 , y 1 , z 1 ) и M 2 (x 2 , y 2 , z 2 ) . Очевидно, что через эти две точки можно провести единственную прямую (рис.3.2.2). uuuuuuur В качестве направляющего вектора этой прямой возьмём вектор S = M 1M 2 , а в качестве фиксированной точки можно взять любую из точек M 1 или M 2 . Пусть это будет точка M 1 . Тогда канонические уравнения прямой, проходящей через две данные точки, имеют вид x − x1 y − y 1 z − z 1 . = = x 2 − x1 y 2 − y 1 z 2 − z 1 M (x , y , z )
n
M 2 (x 2 , y 2 , z 2 )
l
S
ϕ P
M 1 (x 1 , y 1 , z 1 ) Рис. 3.2.2
Рис. 3.2.3
44
4. Угол между двумя прямыми. Взаимное расположение двух прямых в пространстве
Определение. Углом между двумя прямыми называется наименьший угол между их направляющими векторами. Очевидно, что если x − x1 y − y 1 z − z 1 x −x2 y −y 2 z −z2 l1 : и l2 : , = = = = m1 n1 p1 m2 n2 p2 то угол ϕ между прямыми l1 и l 2 можно вычислить из соотношения S ⋅S m 1m 2 + n 1n 2 + p 1p 2 . cos ϕ = 1 2 = 2 2 2 2 2 2 S1 ⋅ S 2 m +n + p ⋅ m +n + p 1
1
1
2
2
2
1) Если прямые l1 и l 2 параллельны, то их направляющие векторы S1 и S 2 коллинеарны, следовательно, условие параллельности двух прямых имеет вид: m 1 n 1 p1 (3) = = m 2 n2 p2 2) Если прямые l1 и l 2 перпендикулярны, то S1 ⋅ S 2 = 0 , следовательно, условие перпендикулярности двух прямых имеет вид: (4) m 1m 2 + n 1n 2 + p 1p 2 = 0 Заметим, что в силу рассмотренных ранее теорий условия (3) и (4) являются необходимыми и достаточными условиями соответственно параллельности и перпендикулярности двух прямых в пространстве. 5. Взаимное расположение прямой и плоскости в пространстве
Определение. Углом между прямой и плоскостью называется угол между прямой и её проекцией на эту плоскость. (рис. 3.2.3) Пусть плоскость P задана общим уравнением A x + B y + C z + D = 0 , следовательно, нормаль к ней n = (A , B ,C ) . x −x0 y −y 0 z −z 0 = = Прямая задана каноническими уравнениями , поэтому m n p направляющий вектор прямой S = (m , n , p ) .В силу определения, если ϕ угол между прямой и плоскостью, то
sin ϕ =
n⋅S A m + B n +C p = . 2 2 2 2 2 2 n⋅S A + B +C ⋅ m + n + p 45
6. Условие параллельности прямой и плоскости
Если прямая параллельна плоскости, то её направляющий вектор S перпендикулярен нормали n , следовательно, S ⋅ n = 0 , значит, условие параллельности прямой и плоскости имеет вид A m + B n +C p = 0 (5) 7. Условие перпендикулярности прямой и плоскости
Если прямая перпендикулярна плоскости, то её направляющий вектор коллинеарен нормали к плоскости, следовательно, условие перпендикулярности прямой и плоскости имеет вид: A B C (6) = = m n p Заметим, что условия (5) и (6) не только необходимы, но и достаточны соответственно для параллельности прямой и плоскости, а также для перпендикулярности прямой и плоскости. Пример 1. Найти канонические уравнения прямой, проходящей через x +1 y −1 z точку M 0 (1, −1, 2) и параллельной данной прямой l : = = 2 −1 − 1 (рис.3.2.4). Решение. Направляющий вектор данной прямой l есть S = 2i − j − k . Искомая прямая l1 параллельна данной прямой l , значит её направляющий вектор S1 = S . Фиксированная точка M 0 (1, −1, 2) лежит на искомой. Её x −1 y +1 z − 2 = = . канонические уравнения: 2 −1 −1 l S l1 l
M0
M0 S2
S1 S
S1
l2
l1
Рис. 3.2.5
Рис.3.2.4
Пример 2. Найти канонические уравнения прямой, проходящей через
точку M 0 (1, 0, −1) и перпендикулярной к двум данным прямым x y −1 z +1 x −1 y +1 z l1 : = и l2 : = = (рис.3.2.5). = −1 1 2 −1 1 1 46
Решение. В качестве направляющего вектора искомой прямой l возьi
j
мём вектор S = S1 × S 2 = 1
k
2 −1 = 3i + 3k . Возьмём коллинеарный вектор
−1 1
1
x −1 y z +1 = = . 1 0 1 Пример 3. Найти уравнение прямой, проходящей через точку M 0 (1,1, 2) и перпендикулярной к данной плоскости P : x − 2y − z + 5 = 0 (рис. 3.2.6) Решение. В качестве направляющего вектора искомой прямой можно взять нормаль к данной плоскости n(1, −2, −1) . Искомая прямая l имеет каx −1 y −1 z − 2 = = . нонические уравнения: 1 −2 −1 l M0 l S(1, −2, −1) S B(1, 0,1) . Канонические уравнения прямой l :
P
M1
n
P
Рис. 3.2.6
Рис. 3.2.7
Пример 4. Найти координаты точки пересечения прямой
x −1 y −1 z − 2 и плоскости P : x + 2y + 3z − 3 = 0 (рис. 3.2.7). = = 1 −2 −1 Решение. От канонических уравнений данной прямой перейдём к её x −1 y −1 z −2 параметрическим, положив =t , =t , = t . Откуда следует −2 −1 1 x = t +1 ⎫ ⎪ y = −2t + 1⎬ z = −t + 2 ⎪⎭ Выясним, при каком значении параметра t данная прямая l и плоскость P пересекаются. Для этого нужно найденные значения x , y и z подставить в уравнение плоскости P : (t + 1) + 2( −2t + 1) + 3( −t + 2) − 3 = 0 . Отсюда следует, что t = 1 , т.е. при значении параметра t = 1 прямая и плоскость пересекаются. Вернём t = 1 в параметрическое уравнение прямой, получим координаты искомой точки
l:
47
x1 = 1 + 1 = 2 ⎫ ⎪ y 1 = −2 ⋅ 1 + 1 = −1⎬ . z 1 = −1 + 2 = 1 ⎪⎭
Итак M 1 ( 2, −1,1) . Пример 5. Найти канонические уравнения линии пересечения плоскостей P1 : x + y = 0 и P 2 : 2x + y − z − 3 = 0 . (рис. 3.2.8) Решение. Для того, чтобы написать канонические уравнения прямой, мы должны знать точку M 0 на этой прямой и её направляющий вектор S . 1. Точку M 0 мы найдём, решив систему уравнений x + y = 0⎫ ⎬. 2x + y − z = 3⎭ Эта система имеет бесчисленное множество решений (множество точек на прямой l ). Нам достаточно найти одну какую-нибудь точку из этого множества. Для этого положим в системе z = z 0 = 0 , тогда для нахождения x 0 и y 0 имеем систему x0 +y 0 = 0 ⎫ ⎬ => x 0 = 3 , y 0 = −3 . 2x 0 + y 0 = 3⎭ Итак, M 0 (3, −3, 0) 2. В качестве направляющего вектора S искомой прямой можно взять вектор S = n1 × n 2 . Здесь n1 (1,1, 0) и n 2 ( 2,1, −1) . Вычислим вектор S :
i
j
S= 1 1
k 0 = −i + j − k .
2 1 −1 Итак, уравнения линии пересечения плоскостей P1 и x −3 y +3 z P2 : = = −1 −1 1
n2
l
n1
n
M0
P2
S
l2
P1
P
Рис. 3.2.8
l1
M0 Рис. 3.2.9
48
S2
S1
Пример 6. Доказать, что данные прямые
x −1 y z −1 x −1 y z −1 = = = = и l2 : 2 1 1 2 −1 −1 лежат в одной плоскости и найти уравнение этой плоскости (рис.3.2.9). l1 :
Решение. Нетрудно видеть, что прямые проходят через точку M 0 (1, 0,1) , а через две прямые, проходящие через одну точку, можно провести единственную плоскость. В качестве нормали n к искомой плоскости P можно взять n = S1 × S 2 . i j k S1 × S 2 = 2 1 −1 = 3i − 3 j + 3k −1 1 2 В качестве нормали n возьмём коллинеарный вектор, т.е. положим n = i − j + k . Тогда искомая плоскость имеет также уравнение: 1(x − 1) − 1 ⋅ y + 1(z − 1) = 0 . Итак, окончательно P :x − y + z − 2 = 0 . 8. Прямая линия на плоскости Рассмотрим случай, когда прямая l лежит в плоскости xOy. (рис.3.2.10). Если её направляющий вектор S = (m , n ) , а M 0 (x 0 , y 0 ) - фиксированная точка на этой прямой, то очевидно, что x −x0 y −y0 = (7) m n
S(m , n )
y
n(A , B )
M 0 (x 0 , y 0 ) r
r0
M (x , y )
0
x Рис. 3.2.10 есть каноническое уравнение прямой. Из (7) => n (x − x 0 ) = m (y − y 0 ) => nx − m y − nx 0 − m y 0 = 0 (8) Обозначим n = A 1 , − m = B , −n x 0 − m y 0 = C , тогда уравнение (8) можно записать в виде A x + B y +C = 0 49
(9)
Уравнение прямой l , лежащей в плоскости, записанное в виде (9), называется общим уравнением прямой на плоскости. Заметим, что это уравнение линейно относительно переменных x и y . Можно доказать и обратное, т.е. что всякому уравнению вида (3) на плоскости соответствует некоторая прямая. Разрешим теперь уравнение (9) относительно y : A C A C y =− x − и обозначим − = k , − = b , тогда получим B B B B (10) y = kx + b . Уравнение прямой, записанное в виде (10), называется уравнением прямой с угловым коэффициентом. Нетрудно выяснить значение параметров k и b . Пусть k > 0 и b > 0 . Тогда при x = 0 из (10) получаем y = b , т.е. b есть ордината точки пересечения с осью Oy (рис. 11). С другой стороны, из BC ΔA B C ясно, что tgϕ = = k , т.е. k -есть тангенс угла, образуемого AC прямой с осью Ox, который называется угловым коэффициентом этой прямой. Поэтому уравнение прямой в виде (10) называется уравнением прямой с угловым коэффициентом. В частности, если две прямые заданы своими уравнениями с угловым коэффициентом l1 : y = k1x + b1 , l 2 : y = k 2x + b 2 , то нетрудно найти угол между этими прямыми (рис. 3.2.11). y
y
B
ϕ
A
x
0 Рис. 3.2.11
kx C b
ϕ2
x
0
l1
θ
l2
ϕ1 Рис. 3.2.12
x
k1 − k 2 . В частности, если прямые па1 + k1k 2 раллельны, то k1 = k 2 , а если они перпендикулярны, то k1 ⋅ k 2 = −1.
Ясно, что θ = ϕ1 − ϕ 2 , т.е. tgθ = ±
Пример. Через точку M 0 (1, 3) провести прямую под углом 45° к данной
прямой x − 2y = 0 .
50
Решение. Обозначим угловой коэффициент искомой прямой через k 2 , 1 (рис. 3.2.13). Из ус2 ловия задачи тангенс угла между этими прямыми tgθ = 1, с другой стороны, 1 − k2 k1 − k 2 2 tgθ = ± , т.е. 1 = ± . 1 1 + k1k 2 1 + ⋅k2 2 1 Откуда следует: а) k 2 = 3 ; б) k 2 = − . 3 Теперь нетрудно написать уравнения этих прямых: а) 3x − y = 0 ; б) x + 3y − 10 = 0
тогда данная прямая имеет угловой коэффициент k1 =
y
3x − y = 0
x − 2y = 0 M 0 (1, 3)
x + 3y − 10 = 0
0
Рис. 3.2.13
x
9. Прямая линия и гиперплоскость в n-мерном пространстве Обобщим понятие трёхмерного пространства на случай n измерений. 0 0 0 Пусть e1 , e 2 , …, en - ортонормированный базис n - мерного пространства, т.е. совокупность попарно ортогональных, а следовательно, линейно независимых единичных векторов. Проведя оси Ox1, Ox2, …, Oxn, через эти орты, получим n -мерную ортогональную систему координат. Тогда очевидно, что положение любой точки этого пространства будет определяться параметрами ( x 1 , x 2 , …, x n ) – координатами вектора. Проводя формально рассуждения, аналогичные изложенным выше, мы можем определить гиперплоскость в n - мерном пространстве, как множество точек, удовлетворяющее уравнению A 1x 1 + A 2x 2 + ... + A n x n + B = 0 , причём вектор (A 1 , A 2 ,..., A n ) интерпретируется как «нормаль» к этой гиперплоскости. Аналогично множество точек n - мерного пространства, удовлетворяющее уравнениям 51
x − x 10 x − x 20 x − xn 0 = = ... = n m1 m2 mn называется «прямой в n - мерном пространстве», а сами уравнения называются каноническими уравнениями этой «прямой», причём вектор S = (m 1 , m 2 ,..., m n ) n - мерного пространства называется направляющим вектором этой прямой, а точка M 0 (x 10 , x 20 ,..., x n 0 ) - фиксированной точкой на этой прямой.
§3. Кривые второго порядка 1. Эллипс и его свойства
Определение. Эллипсом называется множество точек на плоскости, сумма расстояний от которых до двух данных точек, называемых фокусами, есть величина постоянная (равная 2a , a > 0 ). Принимая во внимание определение эллипса, выведем его уравнение. Если определённым образом выбрать систему координат, то можно получить простейшую форму уравнения эллипса, которая называется каноническим уравнением (рис.3.3.1). Итак, проведём ось Ox через фокусы от фокуса F1 к фокусу F2 .
Рис. 3.3.1 Начало координат возьмём в середине отрезка F1F2 . Если расстояние между фокусами обозначить через 2c (c > 0) , то очевидно, что фокусы имеют координаты F1 ( −c , 0) , F2 (c , 0) . Ось Oy направим так, чтобы система xOy была бы правой. Пусть точка M (x , y ) принадлежит эллипсу, векторы r1 и r2 называются её фокальными радиус-векторами. В силу определения эллипса r1 + r2 = 2a ( a > 0 , a > c ). Отсюда следует: (x + c )2 + y 2 + (x − c )2 + y 2 = 2a => 52
(x + c )2 + y 2 = 2a − (x − c )2 + y 2
=> (x + c )2 + y 2 = 4a 2 − 4a (x − c )2 + y 2 + (x − c )2 + y 2 => => x 2 + 2xc + c 2 = 4a 2 − 4a (x − c )2 + y 2 + x 2 − 2xc + c 2 + y 2 => => 4xc − 4a 2 = −4a (x − c )2 + y 2 => xc − a 2 = a (x − c )2 + y 2 => => x 2c 2 − 2a 2xc + a 4 = a 2x 2 − 2a 2xc + a 2c 2 + a 2y => => (a 2 − c 2 ) ⋅ x 2 + a 2y 2 = a 2 ⋅ (a 2 − c 2 ) . Обозначим a 2 − c 2 = b 2 , тогда из предыдущего следует: x2 y2 + = 1. a 2 b2 Это уравнение называется каноническим уравнением эллипса. Эллипс пересекает координатные оси в точках A 1 ( −a , 0) , A 2 (a , 0) , B 2 (0,b ) и B 2 (0, −b ) , которые называются вершинами эллипса. Отрезки A 1A 2 и B 1B 2 , равные 2a и 2b соответственно, называются большой и малой осями эллипса, a и b - большой и малой полуосями. Эллипс симметричен относительно координатных осей и относительно начала координат. Форму эллипc са можно охарактеризовать с помощью эксцентриситета ε = (0 < ε < 1) . a Чем больше эксцентриситет, тем более вытянутую форму вдоль оси Ox имеет кривая. 2. Гипербола и её свойства
Рис. 3.3.2
Определение. Гиперболой называется множество точек на плоскости, модуль разности расстояний от которых до двух данных точек, называемых фокусами, есть величина постоянная, равная 2a (a > 0) . 53
Проведём ось Ox через фокусы, выбрав начало координат в середине отрезка, соединяющего фокусы, длина которого равна 2c (рис.3.3.2). Фокусы имеют координаты F1 ( −c , 0) , F2 (c , 0) . Ось Oy направим так, чтобы система xOy была бы правой. Проведя фокальные радиус – векторы r1 и r2 в некоторую точку M (x , y ) , в силу определения можем написать: r1 − r2 = 2a . После преобразований, аналогичных выполняемым в п. 1, обозначив c 2 − a 2 = b 2 , получим каноническое уравнение гиперболы x2 y2 − =1 a 2 b2 Гипербола симметрична относительно координатных осей и начала координат, состоит из двух веток, которые пересекаются с осью Ox в точках A 1 ( −a , 0) и A 2 (a , 0) , которые называются вершинами гиперболы. Отрезок A 1A 2 , длина которого равна 2a , называется его вещественной осью, в то же время параметр a называется вещественной полуосью гиперболы. Точки B 1 (0,b ) и B 2 (0, −b ) называются мнимыми вершинами гиперболы, отрезок B 1B 2 , длина которого равна 2b , называется мнимой осью гиперболы, а параметр b - его мнимой полуосью. Форму гиперболы характеc ризует эксцентриситет ε = . Ясно, что ε > 1 , причём если эксцентрисиa тет близок к единице, то ветви гиперболы сильно прижаты к оси Ox. Гипербола имеет асимптоты, к которым её ветви приближаются при удалении от начала координат. Асимптоты гиперболы имеют уравнения b y = ± x . Нетрудно показать, что lim y as − y hip = 0 . x →±∞ a
3. Парабола и её свойства
Определение. Параболой называется множество точек на плоскости, равноудалённых от данной прямой, называемой директрисой параболы и от данной точки, называемой фокусом. Каноническое уравнение параболы мы получим, выбрав систему координат xOy таким образом: проведём ось Ox перпендикулярно директрисе через фокус, направив её от директрисы к фокусу. Расстояние от директрисы до фокуса F обозначим через p и назовём его параметром параболы. Начало координат возьмём в середине отрезка, соединяющего фокус с директрисой, и направим ось Oy так, чтобы система координатных осей xOy была бы правая (рис. 3.3.3). Опустим из точки M (x ,y ) на параболе перпендикуляр на директрису. Пусть N - его основание. Ясно, что 54
uuuuur uuuuur N M = FM , откуда следует y 2 = 2px . Это уравнение называется канони-
ческим уравнением параболы. Парабола симметрична относительно оси Ox и проходит через начало координат.
Рис. 3.3.3
Рис. 3.3.4
Пример 1. Найти уравнение траектории точки, которая перемещаясь по плоскости xOy, остаётся в два раза дальше от точки A ( −3, 0) , чем от начала координат. (рис.3.3.4) Решение. Текущую точку на искомой траектории обозначим M (x ,y ) . uuuuur uuuuur uuuuur uuuuur В силу условия задачи A M = 2 O M . A M = (x + 3)i + y j , O M = x i + y j ; uuuuur uuuuur A M = (x + 3)2 + y 2 , O M = x 2 + y 2 , значит (x + 3)2 + y 2 = 2 x 2 + y 2 . Возведя в квадрат, получим (x + 3)2 + y 2 = 4x 2 + 4y 2 , откуда следует x 2 + 6x + 9 + y 2 = 4x 2 + 4y 2 . Имеем 3x 2 + 3y 2 − 6x = 9 . Упрощаем: x 2 + y 2 − 2x = 3 . Выделяем полный квадрат: x 2 − 2x + 1 + y 2 = 3 + 1 . Окончательно имеем: (x − 1)2 + y 2 = 22 . Получили окружность. (рис.3.3.5)
Рис. 3.3.5
Рис. 3.3.6 55
Пример 2. Найти сторону квадрата, вписанного в данный эллипс x2 y2 + = 1 . (рис. 3.3.6) 42 32 Решение. В силу симметрии эллипса вершины квадрата, вписанного в эллипс, имеют координаты: M 1 (m , m ) , M 2 ( −m , m ) , M 3 ( −m , m ) , M 4 (m , −m ) , (m > 0) . Искомая длина стороны квадрата d = 2m . Координаты точки M 1 удовлетворяют уравнению эллипса, потому имеем m2 m2 + 2 = 1 => 32 m 2 + 42 m 2 = 32 ⋅ 92 => m = 2, 4 . 2 4 3 Итак, длина стороны квадрата d = 4, 8 . Пример 3. Найти уравнение траектории точки, которая, перемещаясь по плоскости xOy, остаётся в два раза дальше от точки A ( 4, 0) , чем от прямой x = 1 . (рис. 3.3.7) uuuuur uuuuur Решение. Рассмотрим вектора A M = (x − 4)i + y j и B M = (x − 1)i . uuuuur uuuuur Должно быть A M = 2 B M , т.е. (x − 4)2 + y 2 = 2 x − 1 . Возводя в квадрат,
получим
(x − 4)2 + y 2 = 4(x − 1)2 . После упрощения имеем гиперболу
x2
y2 − 2 = 1 . (рис.3.3.7) 2 4 ⎛ 4 ⎞ ⎜ ⎟ ⎝ 3⎠
Рис. 3.3.8
Рис. 3.3.7
Пример 4. Найти уравнение траектории точки, которая, перемещаясь по плоскости xOy, равноудалена от точки A ( 2,1) и от оси ординат. (рис.3.3.8) 56
uuuuur
uuuuur
Решение. Рассмотрим векторы A M = (x − 2)i + (y − 1)j и B M = x i . uuuuur uuuuur По условию задачи A M = B M , значит (x − 2)2 + (y − 1)2 = x
=> (x − 2)2 + (y − 1)2 = x 2 => y 2 − 2y + 1 = 4x − 4
=> y 2 − 2y + 1 = 4x − 4 => (y − 1)2 = 4(x − 1) . Обозначим x − 1 = X , y − 1 =Y , тогда относительно системы координат X O 1Y имеем параболу .Y 2 = 4X (рис.3.3.8)
§4. Общее уравнение кривой второго порядка Рассмотренные выше кривые 2-го порядка имеют канонические уравнения только относительно системы координат, специальным образом связанной с этой кривой. Относительно произвольно расположенной системы координат каждой из этих кривых соответствует некоторое уравнение второго порядка вида a 11x 2 + 2a 12xy + a 12y 2 + 2b1x + 2b 2y + c = 0 , которое называется общим уравнением кривой второго порядка. При каждом конкретном наборе коэффициентов это уравнение является либо уравнением эллипса (окружности), либо гиперболы, либо параболы. Заметим, что этому уравнению может и не соответствовать никакая кривая 2-го порядка (вырожденный случай), но если этому уравнению соответствует какая-нибудь кривая, то это непременно какая-нибудь из перечисленных кривых второго порядка: эллипс, гипербола или парабола. 1. Формулы преобразования координат при параллельном переносе координатных осей Пусть оси O 1X и O 1Y координатной системы O 1X Y параллельны осям O x и O y исходной системы координат Oxy. Допустим, что точка M в исходной системе координат имеет координаты x и y , т.е. M (x , y ) ; относительно же системы O 1X Y та же точка имеет координаты X и Y , т.е. M (x , y ) и M (X ,Y ) . Установим связь между старыми координатами (x , y ) точки M и её новыми координатами (X ,Y ) . Из чертежа видно, что uuuur r = O O 1 + R . Если O 1 (a ,b ) - относительно системы Oxy, то ясно, что y =Y + b ; x = X + a . Эти формулы являются формулами преобразования координат при параллельном переносе координатных осей. 57
Рис. 3.4.1
Рис. 3.4.2
Пример 1. Выполнив параллельный перенос координатных осей, привести уравнение кривой y = x 2 − 2x + 2 к каноническому виду. Сделать рисунок кривой в исходной системе координат. Решение. Выполним параллельный перенос координатных осей, положив x = X + a , y =Y + b , где (a ,b ) - координаты нового начала системы координат O 1X Y . Параметры a и b определим, потребовав, чтобы после параллельного переноса уравнение кривой стало бы простейшим (каноническим). Имеем:Y + b = (X + a )2 − 2(X + a ) + 2 => Y = X 2 + 2aX + a 2 − 2X − 2a + 2 − b => Y = X 2 + ( 2a − 2)X + a 2 − 2a − b + 2 . Приравняем в этом уравнении к нулю коэффициент при X и свободный член, получим координаты точки O 1 : 2a − 2 = 0 ⎫ ⎬ => a = 1 , b = 1 . a 2 − 2a − b + 2 = 0 ⎭ Окончательно имеем каноническое уравнение кривой X 2 =Y . Очевидно, что это парабола. (рис. 3.4.2) 2. Формулы преобразования координат при повороте координатных осей. Повернём исходную систему координат Oxy на угол α , и пусть она займёт положение O x 1y 1 (рис. 3.4.3). Обозначим через r радиус-вектор точки M . Очевидны соотношения: x = r ⋅ cos(ϕ + α ) = r ⋅ cos ϕ ⋅ cosα − r ⋅ sin ϕ ⋅ sinα = x 1 cosα − y 1 sinα , y = r ⋅ sin(ϕ + α ) = r ⋅ sin ϕ ⋅ cosα + r ⋅ sinα ⋅ cos ϕ = x 1 sinα + y 1 cosα . Окончательно: 58
x = x 1 cosα − y 1 sinα ⎫ ⎬ y = x 1 sinα + y 1 cosα ⎭ Эти формулы являются формулами преобразования координат при повороте координатных осей на угол α .
Рис. 3.4.3
Рис. 3.4.4
Пример 2. Выполнив поворот координатных осей, привести уравнение
кривой xy = 2 к каноническому виду. Сделать рисунок кривой в исходной системе координат. (рис. 3.4.4) Решение. Выполним поворот координатных осей, положив x = x 1 cosα − y 1 sinα ⎫ ⎬. y = x 1 sinα + y 1 cosα ⎭ Уравнение данной кривой примет вид: (x 1 cosα − y 1 sinα )(x 1 sinα + y 1 cosα ) = 2 . Раскрывая скобки, получим: 2 2 x 1 sin α cosα + (cos 2 α − sin 2 α )x 1y 1 −y 1 cosα sinα = 2
Повернём координатные оси на такой угол α , чтобы в уравнении исчезло слагаемое, содержащее произведение x 1y 1 . Для этого нужно решить уравнение cos 2 α − sin 2 α = 0 . Наименьшее значение угла α , удовлетворяющего этому уравнению, есть π 2 , получим каноничеα = . Принимая во внимание, что sinα = cosα = 4 2 ское уравнение данной кривой относительно системы координат O x 1y 1 2
2
x1 y 1 − = 1 . Получим равнобочную гиперболу. (рис. 3.4.4) 22 22
3. Приведение общего уравнения кривой второго порядка к каноническому виду. Если кривая второго порядка задана своим общим уравнением 59
a 11x 2 + 2a 12xy + a 22y 2 + 2b1x + 2b 2y + c = 0 , то это уравнение можно привести к каноническому виду, выполнив поворот и параллельный перенос координатных осей, причём поворот координатных осей осуществляют, выбирая такой угол поворота α , чтобы в уравнении относительно новых координат исчез бы член с произведением x 1y 1 . Итак, после поворота координатных осей уравнение кривой приобретает вид: 2 2 a ′x + a ′y + 2d x + 2d y + f = 0 . 11
11
22
1
1 1
2 1
Теперь можно делать следующий шаг: параллельный перенос осей. При этом координаты нового начала выбирают таким образом, чтобы упростились линейные члены и свободный член уравнения. Можно показать, что тип кривой можно определить сразу, вычислив определитель a a 12 Δ = 11 . a 21 a 22 При этом, если Δ > 0 , то кривая называется кривой эллиптического типа и может оказаться эллипсом; если Δ < 0 , то кривая называется кривой гиперболического типа и может оказаться гиперболой; если Δ = 0 , то кривая называется кривой параболического типа и может оказаться параболой. Возможны и другие, так называемые вырожденные случаи. Пример 3. Выполнив параллельный перенос и поворот координатных осей, привести к каноническому виду уравнение кривой 3x 2 − 2xy + 3y 2 + 4x + 4y − 4 = 0 и сделать рисунок в исходной системе координат. (рис. 3.4.5) Решение. Выясним прежде всего тип кривой. Вычислим дискриминант a a 12 3 −1 = 32 − ( −1)2 = 8 , Δ > 0 , т.е. наша кривая – кривая Δ = 11 . Δ= a 12 a 22 −1 3 эллиптического типа. 1. Выполним параллельный перенос координатных осей по формулам x = X + a , y =Y + b . Получим: 3(X + a )2 − 2(X + a )(Y + b ) + 3(Y + b )2 + 4(X + a ) + 4(Y + b ) − 4 = 0 . После преобразования коэффициентов имеем: 3X 2 − 2X Y + 2Y 2 + (6a − 2b + 4)X + ( −2a + 6b + 4)Y +
+3a 2 − 2ab + 3b 2 + 4a + 4b − 4 = 0 Выберем координаты нового начала таким образом, чтобы аннулировались линейные слагаемые. Для этого нужно положить равным нулю коэффициенты при X и Y . Итак, имеем систему: 6a − 2b = −4 ⎫ ⎬ => a = −1 , b = −1 . −2a + 6b = −4 ⎭ 60
Рис. 3.4.5 Итак имеем начало новой системы координат X O 1Y в точке O 1 ( −1, −1) . В этой системе координат наша кривая имеет уравнение 3X 2 + 3Y 2 − 2X Y = 4 . 2. Выполним теперь поворот координатных осей по формулам X = x 1 cosα − y 1 sinα ⎫ ⎬, Y = x 1 sin α + y 1 cosα ⎭ тогда получим: 3(x 1 cosα − y 1 sinα )2 + 3(x 1 sinα + y 1 cosα )2 − −2(x 1 cosα − y 1 sinα )(x 1 sinα + y 1 cosα ) = 4, откуда следует: 2 (3 cos 2 α + 3 sin 2 α − 2 sinα cosα )x 1 + 2(sin 2 α − cos 2 α )x 1y 1 + +(3 sin 2 α + 3 cos 2 α + 2 sinα cosα )y 1 = 4 Выберем угол поворота α таким образом, чтобы в уравнении исчезло слагаемое с произведением x 1y 1 , т.е. положим sin 2 α − cos 2 α = 0 . Наименьший 2
угол α , удовлетворяющий этому уравнению α =
π
. Тогда уравнение кри4 2 2 вой имеет вид: 2x 1 + 4y 1 = 4 . Запишем его в канонической форме: 2
2
x1 y + 12 = 1 . 2 1 ( 2) Очевидно, что это эллипс. (рис.3.4.5)
§5. Уравнение линии на плоскости и в пространстве 1. Кривые, заданные пересечением поверхностей Всякую линию L в пространстве можно рассматривать как пересечение двух поверхностей: 61
F1 (x , y , z ) = 0 ⎫ ⎬, F2 (x , y , z ) = 0 ⎭ Итак, линию в пространстве можно рассматривать как множество точек, координаты которых удовлетворяют данной системе уравнений. Например две плоскости P1 : A 1x + B 1y + C 1z + D 1 = 0 и P 2 : A 2x + B 2y + C 2z + D = 0 пересекаются по прямой линии L , т.е. прямую линию L можно задать такой системой уравнений: A x + B 1y + C 1z + D 1 = 0 ⎫ L: 1 ⎬, A 2x + B 2y + C 2z + D 2 = 0 ⎭ L:
2. Параметрические уравнения кривых Кривую линию L на плоскости или в пространстве можно задать как траекторию движущейся точки, координаты которой задаются в виде x = x (t )⎫ ⎪ y = y (t ) ⎬ (1) z = z (t ) ⎭⎪ Здесь параметр t часто имеет смысл времени, а система уравнений (1) называется системой параметрических уравнений данной кривой. Пример 1. Нарисовать кривую, заданную параметрическими уравнениями x = a cos t ⎫ ⎬. y = b sin t ⎭ Очевидно, что достаточно взять промежуток изменения параметра t [0, 2π ] , т.к. cos t и sin t 2π - периодические функции. Составим таблицу изменения значений x (t ) и y (t ) в зависимости от значений параметра t .
t
0
x (t ) a y (t ) 0
π
π
π
π
6
4
3
2 2 2 b 2
a
1 2
2 0
b
3 2
3 2 1 b 2 a
a
b
3π 4
π
5π 4
2 2 2 b 2
−a
2 2 2 −b 2
−a
0
−a
3π 2 0 −b
2π
7π 4 a −b
2 2 2 2
a
0
Остаётся теперь в системе координатных осей Oxy нанести точки с коор3 1 2 2 ,b ),(a ,b ),..., и нарисовать кривую, проходядинатами (0, 0),(a 2 2 2 2 щую через эти точки (рис.3.5.1), причём очевидно, что когда параметр t 62
возрастает от 0 до 2π , точка обходит контур данной замкнутой кривой против часовой стрелки. x y Запишем данные параметрические уравнения так: = cos t , = sin t . a b Возведём теперь в квадрат каждое из уравнений и сложим их, тогда получим: x2 y2 + = 1, a 2 b2 т.е., исключив параметр t , мы получим канонические уравнения эллипса.
Рис. 3.5.1
Рис. 3.5.2
Пример 2. Нарисовать пространственную кривую x = a cos t ⎫ ⎪ y = a sin t ⎬ . z = t ⎪⎭ Решение. Заметим, что параметрическим уравнениям x = a cos t ⎫ ⎬ y = a sin t ⎭ на плоскости соответствует окружность радиуса a , а в пространстве мы получаем винтовую линию, причём расстояние между двумя соседними витками h = 2π , оно называется шагом винта. На рис.3.5.2 изображена винтовая линия, причём стрелкой показано направление движения точки по мере возрастания t . 63
3. Уравнения кривых в полярных координатах
Исходя из некоторой точки 0 (полюса), проведём ось Op, называемую полярной осью. Пусть точка M лежит на плоскости.
Рис. 3.5.3
Рис. 3.5.4
Из полюса проведём радиус-вектор r . Обозначим через ϕ угол, отсчитываемый от полярной оси по направлению к радиус-вектору против часовой стрелки (рис.3.5.3). Положение точки M на плоскости однозначно определено параметрами r и ϕ , где r - длина радиус-вектора. Ясно, что r ≥ 0 , 0 ≤ ϕ < 2π . Совместим теперь начало декартовой системы координат xOy с полюсом, а полярную ось Op направим вдоль оси Ox (рис.3.5.4). Тогда нетрудно установить связь между декартовыми и полярными координатами: x = r cos ϕ , y = r sin ϕ . Часто из соображений большей наглядности или простоты выкладок бывает удобно учитывать связь между декартовыми и полярными координатами, переходить от уравнения кривой в декартовых координатах к её уравнению в полярных координатах и наоборот.
Пример 3. Изобразить кривую r = sin 3ϕ и найти её уравнение в декартовых координатах. Решение. Прежде всего заметим, что r ≥ 0 , если π 2 4 5 3ϕ ∈ [0,π ] ∪ [2π , 3π ] ∪ [4π , 5π ] , т.е. ϕ ∈ [0, ] ∪ [ π ,π ] ∪ [ π , π ] . 3 3 3 3 Если 3ϕ ∈ [π , 2π ] ∪ [3π , 4π ] ∪ [5π , 6π ] , то оказывается r < 0 , значит в обπ 2 4 5 ластях, где ϕ ∈ [ , π ] ∪ [π , π ] ∪ [ π , 2π ] кривая не лежит, их следует 3 3 3 3 исключить из рассмотрения. Вычисляя значения r для указанных областей изменения ϕ , получим множество точек, называемое трёхлепестковой розой. (рис. 3.5.5) 64
Найдём теперь уравнение этой кривой в декартовых координатах. Напомним, что (cos ϕ + i sin ϕ )3 = cos 3ϕ + i sin 3ϕ , с другой стороны,
(cos ϕ + i sin ϕ )3 = cos3 ϕ + 3i cos 2 ϕ sin ϕ − 3 cos ϕ sin 2 ϕ − i sin3 ϕ =>
=> sin 3ϕ = 3cos 2 ϕ sin ϕ − sin3 ϕ . x x y y = ; sin ϕ = = , то получим уравнеr r x2 +y 2 x2 +y 2 ние кривой в декартовых координатах x2 y y3 2 2 ⋅ − x +y = 3 2 => x + y 2 x 2 + y 2 (x 2 + y 2 ) x 2 + y 2 Так как cos ϕ =
(x 2 + y 2 )2 = 3x 2y − y 3 . Заметим, что изобразить кривую по её уравнению в таком виде довольно трудно.
y
x
Рис. 3.5.5
Пример 3. Нарисовать кривую r = sin ϕ и найти её уравнение в декартовых координатах. Решение. Заметим, что sin 2π -периодическая функция. Берём промежуток изменения для ϕ ∈ [0, π ] , т.к. в этом промежутке sin ϕ ≥ 0 . Ясно, что кривая лежит в верхней полуплоскости. Составим таблицу для значений r в зависимости от ϕ :
ϕ r
0
π
π
π
π
4
3
2
0
6 1 2
3 2
1
2 2
65
2π 3 3 2
3π 4 2 2
5π 6 1 2
π
0
Теперь можно нарисовать данную кривую, проводя из полюса лучи под
π π
углом ϕ = 0, , ,...,π и откладывая на этих лучах значения соответственно 6 4 1 2 равные 0, , ,.... Получим набор точек, через которые остаётся провести 2 2 нашу кривую. (рис.3.5.6)
π 9
π 4
π 6
Рис. 3.5.6
Найдём уравнение этой кривой в декартовых координатах; y Т.к. x = r cos ϕ , y = r sin ϕ , то ясно, что sin ϕ = , x 2 + y 2 = r 2 => r r = x 2 + y 2 , а тогда данная кривая r = sin ϕ в декартовых координатах y имеет уравнение x 2 + y 2 = => x 2 + y 2 = y => x 2 + y 2 − y = 0 . 2 2 x +y Выделим полный квадрат: 2 2 1 1 1 1⎞ ⎛1⎞ ⎛ 2 2 2 x + y − 2 ⋅ y + = => x + ⎜ y − ⎟ = ⎜ ⎟ . 2⎠ ⎝2⎠ 2 4 4 ⎝ 1 Получим каноническое уравнение окружности радиуса r = с центром 2 1 в т. O (0, ) . 2
§6. Поверхности второго порядка 1. Эллипсоид
Определение. Эллипсоидом называется поверхность, каноническое уравнение которой имеет вид 66
x2 y2 z2 + + = 1 , (a > 0,b > 0,c > 0) a 2 b2 c 2 Исследуем форму данной поверхности. Заметим, что координаты ( ±x ),( ±y ),( ±z ) удовлетворяют этому уравнению, значит данная поверхность симметрична относительно трёх координатных плоскостей xOy, xOz, yOz. С координатными осями поверхность пересекается в точках (a , 0, 0) и ( −a , 0, 0) ; (0,b , 0) и (0, −b , 0) ; (0, 0,c ) и (0, 0, −c ) ; Параметры a ,b и c называются полуосями эллипсоида. Более подробно форму поверхности можно исследовать методом сечений. Например, если провести сечение поверхности плоскостью z = h (h > 0,h < c ) , получим кривую x2 y2 z2 ⎫ + + = 1⎪ a 2 b2 c 2 ⎬. z = h ⎭⎪
x2 y2 h2 В плоскости z = h имеем кривую 2 + 2 = 1 − 2 => a b c 2 2 x y + =1 2 2 2 2 ⎛ h ⎞ ⎛ h ⎞ ⎜a 1 − 2 ⎟ ⎜b 1 − 2 ⎟ ⎜ c ⎟⎠ ⎜⎝ c ⎟⎠ ⎝ Ясно, что это есть эллипс. В любой плоскости, параллельной координатным плоскостям, мы имеем эллипсы, отсюда и название данной поверхности. В частности, если a = b = c , то эллипсоид превращается в сферу 2 x + y 2 + z 2 = a 2 , т.е. сфера является частным случаем эллипсоида. Если равны любые две полуоси, то эллипсоид называется эллипсоидом вращения .
z
c h
−b
h
−a
b y
a x
z = h (h > 0)
z
z = h (h < c )
y
x
−c Рис. 3.6.2
Рис. 3.6.1 67
2. Однополостный гиперболоид
Определение. Однополостным гиперболоидом называется поверхность, каноническое уравнение которой имеет вид x2 y2 z2 + − = 1 , (a > 0,b > 0,c > 0) a 2 b2 c 2 Для исследования формы этой поверхности применим метод сечений, т.е. пересечём эту поверхность различными плоскостями, параллельными координатным плоскостям. 1) x = 0⎫ ⎪ x2 y2 z2 ⎬ + − = 1⎪ ⎭ a 2 b2 c 2 даёт нам в плоскости yOz гиперболу y2 z2 − =1 b2 c 2
2) Аналогично в плоскости xOz имеем гиперболу x2 z2 − =1 a2 c2 3) В плоскости z = 0 имеем эллипс x2 y2 + = 1 (горловина) a 2 b2 4) Сечение z = ±h , (h > 0) даёт нам эллипс x2
y2
+ =1 2 2 2 ⎞ 2 ⎞ ⎛ ⎛ h h ⎜a 1 + 2 ⎟ ⎜b 1 + 2 ⎟ ⎜ c ⎟⎠ ⎜⎝ c ⎟⎠ ⎝ Очевидно, что полуоси этого эллипса возрастают по мере удаления от начала координат. 5) В сечениях плоскостями, параллельными координатным плоскостям xOz и yOz получим гиперболы. Результаты такого исследования позволяют нам нарисовать поверхность (рис. 3.6.2), которая вытянута вдоль оси Oz. 3. Двуполостный гиперболоид
Определение. Двуполостным гиперболоидом называется поверхность, каноническое уравнение которой имеет вид (рис.3.6.3). 68
x2 y2 z2 − − = 1 , (a > 0,b > 0,c > 0) a 2 b2 c 2 Исследуем форму этой поверхности методом сечения. 1) Положим в уравнении x = 0 , получим y2 z2 − 2 − 2 =1 b c Это соотношение не имеет смысла, т.к. сумма квадратов не может быть отрицательным числом. Это означает, что данная поверхность не пересекается с координатной плоскостью yOz. 2) Положим в уравнении y = 0 , получим x2 z2 − = 1, a2 c2 т.е. в координатной плоскости xOz мы имеем гиперболу. 3) В координатной плоскости xOy получим также гиперболу x2 z2 − = 1. a2 c2 4) В сечении плоскостями x = ±h , (h > a ) получим эллипсы y2
z2
+ =1 2 2 ⎛ h2 ⎞ ⎛ h2 ⎞ −1⎟ ⎜b 2 − 1 ⎟ ⎜c ⎜ a ⎟ ⎜ a2 ⎟ ⎝ ⎠ ⎝ ⎠ Рассмотрим и другие сечения, приходим к выводу, что данная поверхность вытянута вдоль оси Ox и представляет собою две (отдельные) полости. (рис. 3.6.3) z z x = −h z = h (h > 0) x =h y
−a
x
a
x y
x Рис. 3.6.3
0 Рис. 3.6.4 Рис. 4
4. Эллиптический параболоид
Определение. Эллиптическим параболоидом называется поверхность, каноническое уравнения которой имеет вид 69
x2 y2 + = 2z , (p > 0,q > 0) p q Исследуем форму этой поверхности. Прежде всего заметим, что z > 0 для любых x и y , отличных от нуля, причем z = 0 , если x = 0 и y = 0 . Это означает, что поверхность проходит через начало координат и лежит в верхнем полупространстве. 1) Любое сечение поверхности плоскостью, проходящей через ось Oz , даёт нам параболу, вытянутую вдоль оси Oz: x 2 = 2pz , y 2 = 2qz , и т.д. 2) В сечении плоскостью z = h (h > 0) имеем эллипс
(
x2 2ph
+
) ( 2
y2 2qh
)
2
=1
Вывод: поверхность имеет форму чаши, проходящей через начало коорди-
нат и вытянутой вдоль оси Oz. Если p = q , то поверхность называется параболоидом вращения. 5. Гиперболический параболоид
Определение. Гиперболическим параболоидом называется поверхность, имеющая каноническое уравнение x2 y2 − = 2z , (p > 0,q > 0) p q 1) Сечение плоскостью z = 0 даёт нам пару пересекающихся прямых y x y x − =0 и + = 0 . Это означает, что наша поверхность пересеq p q p кается с координатной плоскостью xOy по прямым линиям. 2) Положим x = 0 , получаем в координатной плоскости yOz параболу y 2 = −2qz . Заметим, что ветви этой параболы направлены вниз. 3) Полагая x = h (h > 0) , получаем ту же параболу, приподнятую вверх на
qh 2 qh 2 2 , т.е. y = −2qz + величину . p p 4) В координатной плоскости xOz (y = 0) имеем параболу x 2 = 2pz . Проводя другие сечения, приходим к выводу, что поверхность имеет форму седла. (рис. 3.6.5)
70
z
z x = h (h > 0)
S
y x − =0 q p
y
0
a
x
a
y x + =0 q p
Рис. 3.6.5
y
x Рис. 3.6.6
6. Цилиндр второго порядка
Определение. Цилиндрической поверхностью или просто цилиндром называется всякая поверхность, которую можно получить движением прямой (образующей), перемещающейся параллельно некоторому данному вектору S и всё время пересекающей данную линию, которая называется направляющей. Если направляющей служит кривая второго порядка, то и цилиндр называется цилиндром второго порядка. Если образующие параллельны какойлибо координатной оси, то цилиндр называется прямым. На рис. 3.6.6 изображён прямой круговой цилиндр, вытянутый вдоль оси Oz. 7. Конус
Определение. Канонической поверхностью называется поверхность, которая получается при движении прямой (образующей), проходящей через данную точку (вершину) и пересекающей данную линию (направляющую). Если направляющей служит кривая второго порядка, то конус называется конусом второго порядка. Если направляющая есть замкнутая кривая, то конус представляет собой двуполостную поверхность, все образующие которой проходят через данную точку (вершину конуса). На рис. 3.6.7 изображён конус, имеющий 71
уравнение x 2 + y 2 − z 2 = 0 . Исследовать форму этого конуса нетрудно, проведя различные сечения этой поверхности. Отметим ещё одно важную особенность уравнения конуса: как правило это однородное уравнение относительно разностей (x − a ) , (y − b ) и (z − c ) , где точка M 0 (a ,b ,c ) - вершина конуса. На рис.3.6.7 изображён конус с вершиной в начале координат, т.е. для данного конуса a = 0 , b = 0 и c = 0 .
y y
y
y
Рис. 3.6.7
Рис. 3.7.1
§7. Поверхности вращения Поверхность, образованная вращением плоской кривой вокруг оси, расположенной в её плоскости, называется поверхностью вращения. Эта ось называется осью вращения поверхности. Очевидно, если пересекать поверхность вращения плоскостями, перпендикулярными к оси вращения, то в сечениях будут окружности с центрами на оси вращения. Рассмотрим правило получения уравнения поверхности, образованной вращением линии, лежащей в координатной плоскости вокруг оси координат. Найдём уравнение поверхности, полученной от вращения этой линии вокруг оси Oz (рис.3.7.1). Введём на поверхности произвольную точку M (x , y , z ) и проведём через неё плоскость, перпендикулярную к оси вращения. Обозначим через M 1 и N точки пересечения построенной плоскости соответственно с данной линией L и осью вращения (осью Oz). Координаты z всех трёх точек M , M 1 и N равны между собой. Поэтому имея в виду, что координаты точки N есть (0, 0, z ) , найдём радиус N M окружности, получившейся в сечении поверхности плоскостью, как расстояние
x 2 + y 2 . С другой стороны, так как
между точками N и M , он равен 72
точка M 1 лежит одновременно на окружности сечения и на линии L , то радиус N M равен абсолютной величине ординаты точки M 1 . Следовательно, полагая в данном уравнении
Y = ± x2 +y 2 ; Z =z (координаты точки M 1 ), получаем искомое уравнение поверхности вращения F ( ± x 2 + y 2 , z ) = 0 . Таким образом, мы приходим к следующему правилу: чтобы получить уравнение поверхности, образованной вращением линии L , лежащей в плоскости yOz, вокруг оси Oz, нужно в уравнении этой линии заменить y на ± x2 +y 2 . При выборе знака перед радикалом следует придерживаться следующего правила: знак должен совпадать в соответствующих точках со знаком координаты y на исходной кривой. Совершенно аналогичные правила будут для получения уравнений поверхностей вращения, получающихся вращением плоских линий вокруг других координатных осей.
Пример. Найти уравнение поверхности, если прямую y = x − 1 вращать вокруг оси Ox.
Решение. Т.к. вращение прямой линии происходит вокруг оси Ox, то в
силу изложенного выше нам нужно в данном уравнении y = x − 1 заменить
y на ± y 2 + z 2 , получим ± y 2 + z 2 = x − 1 . Возведём обе части этого соотношения в квадрат, получим уравнение конуса с вершиной в точке M 0 (1, 0, 0) .
y 2 + z 2 = (x − 1)2 .
Рис. 3.7.2 73
ГЛАВА IV. МАТРИЦЫ И СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ § 1. Матрицы. Основные понятия 1. Основные понятия Матрицами в математике называют математические объекты, имеющие вид таблицы. ⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ a a ... a 21 22 2 n ⎟ A =⎜ ⎜ . . . . ⎟ ⎜⎜ a ⎟⎟ ⎝ m 1 a m 2 ... a m n ⎠ с размерами m × n , где m - число строк, а n - число столбцов, для которых определено равенство и действия сложения, умножения и умножения на число, которые мы определим далее. Заметим, что элементами матрицы могут быть как числа действительные или комплексные, так и другие математические объекты, например, функции (в этом случае матрица называется функциональной). Иногда матрицы обозначают так: a 11 a 12 ... a 1n ⎡ a 11 a 12 ... a 1n ⎤ ⎢a a 21 a 22 ... a 2n a 22 ... a 2n ⎥⎥ 21 ⎢ , или так: A = , A= ⎢ . . . . . . . . ⎥ ⎢ ⎥ a m 1 a m 2 ... a m n ⎣a m 1 a m 2 ... a m n ⎦ или более кратко: A = a ij , или A = a ij , или A = ⎡⎣a ij ⎤⎦ , (i = 1, 2,..., m ; j = 1, 2,...,n ) . Если число строк n данной матрицы совпадает с числом её столбцов, то матрица называется квадратной, при этом говорят, что она имеет порядок n или размеры n × n , т.е. квадратная матрица имеет вид ⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ a a ... a 21 22 2 n ⎟. A =⎜ ⎜ . . . . ⎟ ⎜⎜ ⎟⎟ ⎝ a n 1 a n 2 ... a nn ⎠ Элементы a 11 , a 22 , …, a nn квадратной матрицы A образуют так называемую главную диагональ или говорят, что они стоят на главной диагонали; элементы a n 1 , a (n −1) 2 , …, a 1n образуют так называемую побочную диа74
гональ квадратной матрицы, они идут из левого нижнего в правый верхний угол матрицы. Квадратная матрица называется треугольной, если все её элементы, стоящие выше или ниже главной диагонали, равны нулю. Квадратная матрица называется диагональной, если все элементы, не стоящие на главной диагонали, равны нулю, т.е. ⎛ a 11 0 0 ... 0 ⎞ ⎜ ⎟ a 0 0 ... 0 22 ⎜ ⎟ diag (a 11,a 22 ,..,a nn ) = ⎜ 0 a 0 ... 0 ⎟ . 33 ⎜ ⎟ . . . . ⎟ ⎜ . ⎜ ⎟ 0 0 0 a nn ⎠ ⎝ 0 Определитель квадратной матрицы обозначается detA , т.е. a 11 a 12 ... a 1n a a 22 ... a 2n . det A = 21 . . . . a n 1 a n 2 ... a nn Диагональная матрица, все диагональные элементы которой равны единице, называется единичной и обозначается I или E . ⎛ 1 0 0 ... 0 ⎞ ⎜ ⎟ ⎜ 0 1 0 ... 0 ⎟ E = ⎜ 0 0 1 ... 0 ⎟ . ⎜ ⎟ . . . . . ⎜ ⎟ ⎜ ⎟ ⎝ 0 0 0 ... 1 ⎠ Очевидно, что detE = 1 . Матрица, все элементы которой равны нулю, называется нулевой O [m × n ] . 2. Операции над матрицами Рассмотрим более подробно операции над матрицами, являющиеся составными частями самого определения матрицы. 1. Равенство матриц. Две матрицы A и B с одинаковыми размерами [m × n ] называются равными, если элементы этих матриц, имеющие одинаковые индексы, совпадают, т.е. a ij = bij (i = 1, 2,..., m ; j = 1, 2,..., n ) . 2. Сложение матриц. Матрица C = A + B , называется суммой матриц A [m × n ] и B [m × n ] , если каждый элемент матрицы 75
c ij = a ij + bij (i = 1, 2,...,m ; j = 1, 2,...,n ) Непосредственно из определения сложения матриц A и B вытекают основные свойства операции сложения матриц: 1) A + B = B + A , т.е. сложение коммутативно; 2) (A + B ) + C = A + (B + C ) , т.е. сложение ассоциативно; 3) Существует нулевая матрица O [m × n ] такая, что A + O = A для любой матрицы O [m × n ] . 3. Умножение матриц на число. Матрица C = λ ⋅ A называется произведением числа λ на матрицу A [m × n ] , если для каждого элемента матрицы C [m × n ] справедливо соотношение c ij = λa ij (i = 1, 2,..., m ; j = 1, 2,..., n ) Очевидны свойства этой операции. 1) (λμ )A = λ ( μA ) , где μ = const 2) λ (A + B ) = λA + λB (дистрибутивность относительно сложения матриц) 3) (λ + μ )A = λA + λB (дистрибутивность относительно сложения констант) Заметим, что здесь B [m × n ] - матрица. 4. Умножение матриц. Матрица C [m × n ] называется произведением матрицы A [m × r ] на матрицу B [r × n ] , если для любого элемента матрицы C имеет место соотношение n
c ij = a i 1b1j + a i 2b 2 j + ... + a ir br j = ∑a ikbkj , (i = 1, 2,..., m ; j = 1, 2,..., n ) . k =1
При этом пишут: C = A ⋅ B . Прежде всего отметим, что из определения произведения матрицы A [m × r ] на матрицу B [r × n ] следует, что умножать матрицу A на матрицу B можно лишь в том случае, если число столбцов матрицы A совпадает с числом строк матрицы B . Кроме того ясно, что в данном случае, вообще говоря, A ⋅ B ≠ B ⋅ A , так как если r ≠ m , то B ⋅ A то просто не определено, т.е. произведение матриц некоммутативно. Квадратные матрицы одного порядка называются коммутирующими, если A ⋅ B = B ⋅ A . Очевидно, что A ⋅ E = E ⋅ A = A , т.е. единичная матрица при умножении матриц играет роль обычной единицы. Можно доказать справедливость и других свойств умножения матриц. Принимая во внимание сказанное, перечислим основные свойства умножения матриц: 1) A ⋅ B ≠ B ⋅ A (умножение матриц некоммутативно) 2) (A ⋅ B ) ⋅C = A ⋅ (B ⋅C ) (умножение матриц ассоциативно) 3) (A + B ) ⋅C = A ⋅C + B ⋅C (умножение матриц дистрибутивно относительно сложения матриц); 76
4) A ⋅ E = E ⋅ A = A 5) A ⋅O = O ⋅ A = O , причём здесь O - нулевая матрица; 6) det(A ⋅ B ) = det A ⋅ det B , где A и B - квадратные матрицы.
Пример 1. Вычислить A ⋅ B , если ⎛1 1 0⎞ ⎛1 1 2 ⎞ ⎜ ⎟ A =⎜ ⎟ , B = ⎜ 1 −1 1 ⎟ . ⎝ 0 1 −1 ⎠ ⎜0 1 1⎟ ⎝ ⎠ Решение. Заметим, что A [2 × 3] , B [3 × 3] . Т.к. число столбцов матрицы A совпадает с числом строк матрицы B , то произведение A ⋅ B определено, причём матрица C = A ⋅ B должна иметь размер [2 × 3] . Примем во внимание, что c ij = a i 1b1j + a i 2b 2 j + ... + a ir br j и, полагая r = 3 , вычисляем элементы матрицы C : c 11 = 1 ⋅ 1 + 1 ⋅ 1 + 2 ⋅ 0 = 2 ; c 12 = 1 ⋅ 1 + 1 ⋅ ( −1) + 2 ⋅ 1 = 2 ; c 13 = 1 ⋅ 0 + 1 ⋅ 1 + 2 ⋅ 1 = 3 ; c 21 = 0 ⋅1 + 1⋅1 + (−1) ⋅ 0 = 1; c 22 = 0 ⋅1 + 1⋅ (−1) + (−1) ⋅1 = −2 ; c 23 = 0 ⋅ 0 + 1⋅1 + (−1) ⋅1 = 0 .
⎛ 2 2 3⎞ Окончательно имеем: C = ⎜ ⎟. 1 − 2 0 ⎝ ⎠
Заметим, что произведение A ⋅ B удобно вычислять, перемещая левую руку по строке первой матрицы слева направо, а правую – по соответствующему столбцу второй матрицы B сверху вниз.
Пример 2. Вычислить A ⋅ B , если ⎛1⎞ ⎜ ⎟ A = ⎜ 2 ⎟ , B = ( 2 1 1) . ⎜1⎟ ⎝ ⎠
Решение. Матрицы, что A [3 × 1] , B [1× 3] . Число столбцов первой матрицы совпадает с числом строк второй, значит, произведение C = A ⋅ B определено, причём C [3 × 3] . Вычисляя элемент c ij (i = 1, 2, 3; j = 1, 2, 3) , получим матрицу C :
⎛ 1⋅ 2 1⋅1 1⋅1 ⎞ ⎛ 2 1 1 ⎞ ⎟ ⎜ ⎟ ⎜ C = ⎜ 2 ⋅ 2 2 ⋅ 1 2 ⋅ 1⎟ = ⎜ 4 2 2 ⎟ . ⎜ 1⋅ 2 1⋅1 1⋅1 ⎟ ⎜ 2 1 1 ⎟ ⎠ ⎝ ⎠ ⎝ 77
Пример 3. Вычислить C = B ⋅ A , если
Решение.
⎛1⎞ ⎜ ⎟ B = ( 2 1 1) , A = ⎜ 2 ⎟ . ⎜1⎟ ⎝ ⎠ B [1× 3] , A [3 × 1] , значит, произведение B ⋅ A определено,
причём C [1× 1] . Итак:
⎛1⎞ ⎜ ⎟ C = B ⋅ A = ( 2,1,1) ⋅ ⎜ 2 ⎟ = ( 2 ⋅ 1 + 1 ⋅ 2 + 1 ⋅ 1) = (5) ⎜1⎟ ⎝ ⎠ Получили матрицу, имеющую только один элемент a 11 = 5 . Пример 4. Вычислить C 1 = A ⋅ B и C 2 = B ⋅ A , если ⎛ 1 0 1⎞ ⎛ 2 0 0⎞ ⎜ ⎟ ⎜ ⎟ A = ⎜ 1 1 1⎟ , B = ⎜ 1 1 0 ⎟ . ⎜ 0 1 1⎟ ⎜2 1 1⎟ ⎝ ⎠ ⎝ ⎠ Решение. ⎛ 1 0 1⎞ ⎛ 2 0 0 ⎞ ⎛ 2 + 0 + 2 0 + 0 + 1 0 + 0 + 1⎞ ⎛ 4 1 1⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ C 1 = A ⋅ B = ⎜ 1 1 1⎟ ⋅ ⎜ 1 1 0 ⎟ = ⎜ 2 + 1 + 2 0 + 1 + 1 0 + 0 + 1⎟ = ⎜ 5 2 1⎟ ; ⎜ 0 1 1⎟ ⎜ 2 1 1 ⎟ ⎜ 0 + 1 + 2 0 + 1 + 1 0 + 0 + 1⎟ ⎜ 3 2 1⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎛ 2 0 0 ⎞ ⎛ 1 0 1⎞ ⎛ 2 + 0 + 0 0 + 0 + 0 2 + 0 + 0 ⎞ ⎛ 2 0 2 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ C 2 = B ⋅ A = ⎜ 1 1 0 ⎟ ⋅ ⎜ 1 1 1⎟ = ⎜ 1 + 1 + 0 0 + 1 + 0 1 + 1 + 0 ⎟ = ⎜ 2 1 2 ⎟ ; ⎜ 2 1 1 ⎟ ⎜ 0 1 1⎟ ⎜ 2 + 1 + 0 0 + 1 + 1 2 + 1 + 1 ⎟ ⎜ 3 2 4 ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ Заметим, что определены произведения A ⋅ B и B ⋅ A , однако A ⋅ B ≠ B ⋅ A , т.е. в данном случае матрицы A и B не коммутируют. 3. Транспонированная матрица
Определение 1. Матрица A T называется транспонированной по отношению к данной матрице A , если она получается из матрицы A путём замены в ней всех строк на соответствующие им столбцы. Пусть ⎛ a 11 a 12 ... a 1n ⎞ ⎛ a 11 a 21 ... a m 1 ⎞ ⎜ ⎟ ⎜ ⎟ a 21 a 22 ... a 2n ⎟ a 12 a 22 ... a m 2 ⎟ T ⎜ ⎜ => A = A= ⎜ . ⎜ . . ... . ⎟ . ... . ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ a 1n a 2n ... a m n ⎠ ⎝ a m 1 a m 2 ... a m n ⎠ 78
Свойства транспонированных матриц (без доказательства) 1. (A T )T = A ; 2. ( λA + μB )T = λA T + μB T ; 3. (A ⋅ B )T = B T ⋅ A T ; 4. E T = E . Определение 2. Матрица A , для которой выполняется условие A T = A , называется симметрической. 4. Обратная матрица
Определение 3. Матрица A −1 называется обратной по отношению к квадратной матрице A n - го порядка, если A ⋅ A −1 = A −1 ⋅ A = E , где E единичная матрица n - го порядка. Теорема. Для того, чтобы у матрицы A существовала обратная матрица A −1 , необходимо и достаточно, чтобы матрица A была невырожденная (неособая), т.е. чтобы определитель матрицы A был бы отличен от нуля. Доказательство. Необходимость. Пусть существует обратная матрица A −1 , т.е. A ⋅ A −1 = E , но тогда det(A ⋅ A −1 ) = det E = 1 => det A ⋅ det A −1 = 1 => det A ≠ 0 . Достаточность. Пусть Δ = det A ≠ 0 . Обозначим через A ij алгебраические дополнения элементов a ij матрицы A . Рассмотрим матрицу A 1n ⎞ ⎛ A 11 A 12 ... ⎜ Δ Δ Δ ⎟ ⎜ ⎟ ⎜ A 21 A 22 ... A 2n ⎟ B =⎜ Δ Δ Δ ⎟ ⎜ ⎟ ... ... ... ⎟ ⎜ ... ⎜ An1 An 2 A nn ⎟ ... ⎜ ⎟ ⎝ Δ Δ Δ ⎠ Докажем, что B = A −1 , для чего нужно доказать, что A ⋅ B = B ⋅ A = E . Не уменьшая общности доказательства, проведём его для случая n = 3 . Найдём ⎛ a 11 a 12 a 13 ⎞ ⎛ A 11 A 21 A 31 ⎞ ⎜ ⎟ 1⎜ ⎟ C = A ⋅ B = ⎜ a 21 a 22 a 23 ⎟ ⋅ ⎜ A 12 A 22 A 32 ⎟ = ⎜a ⎟ Δ ⎜A ⎟ a a 32 33 ⎠ ⎝ 31 ⎝ 13 A 23 A 33 ⎠ 79
⎛ a 11A 11 + a 12A 12 + a 13A 13 a 11A 21 + a 12A 22 + a 13A 23 a 11A 31 + a 12A 32 + a 13A 33 ⎞ 1⎜ ⎟ = ⎜ a 21A 11 + a 22A 12 + a 23A 13 a 21A 21 + a 22A 22 + a 23A 23 a 21A 31 + a 22A 32 + a 23A 33 ⎟ Δ⎜ ⎟ ⎝ a 31A 11 + a 32A 12 + a 33A 13 a 31A 21 + a 32A 22 + a 33A 23 a 31A 31 + a 32A 32 + a 33A 33 ⎠ На главной диагонали стоят разложения определителя Δ по элементам первой, второй и третьей строк соответственно, а все другие элементы представляют собой сумму попарных произведений элементов какой-то строки определителя на алгебраические дополнения другой строки. Следовательно ⎛Δ 0 0 ⎞ 1⎜ ⎟ C = A ⋅B = ⎜ 0 Δ 0 ⎟ = E . Δ⎜ ⎟ ⎝ 0 0 Δ⎠ Аналогично можно доказать, что и B ⋅ A = E .
Свойства обратной матрицы 1. (A −1 )−1 = A ; 2. (A ⋅ B )−1 = B −1 ⋅ A −1 ; 3. (A −1 )T = (A T )−1 . Пример 5. Найти обратную матрицу A −1 , если ⎛1 2 1⎞ ⎜ ⎟ A = ⎜0 1 1⎟. ⎜1 1 2⎟ ⎝ ⎠ Решение. Прежде всего вычислим определитель матрицы A : 1 2 1
det A = 0 1 1 = 1 ⋅ 1 ⋅ 2 + 0 ⋅ 1 ⋅ 1 + 1 ⋅ 1 ⋅ 2 − 1 ⋅ 1 ⋅ 1 − 1 ⋅ 1 ⋅ 1 − 2 ⋅ 0 ⋅ 2 = 2 1 1 2 Найдём алгебраические дополнения матрицы A :
1 1 2 1 = 1 ; A 21 = ( −1)2+1 = −3 ; 1 2 1 2
A 31 = ( −1)3+1
2 1 = 1; 1 1
A 12 = ( −1)1+ 2
0 1 1 1 = 1 ; A 22 = ( −2)2+ 2 = 1; 1 2 1 2
A 32 = ( −1)3+ 2
1 1 = −1 ; 0 1
A 13 = ( −1)1+3
0 1 1 2 = −1 ; A 23 = ( −1)2+3 = 1; 1 1 1 1
A 33 = ( −1)3+3
1 2 = 1; 0 1
A 11 = ( −1)1+1
Сформируем теперь обратную матрицу 80
1 A −1 = det A
⎛ A 11 A 21 A 31 ⎞ ⎜ ⎟ ⎜ A 12 A 22 A 32 ⎟ , ⎜A ⎟ ⎝ 13 A 23 A 33 ⎠
получим
3 1 ⎞ ⎛ 1 − ⎜ 2 2 ⎟ ⎛ 1 −3 1 ⎞ ⎜ 2 ⎟ 1⎜ 1 1⎟ ⎟ ⎜ 1 −1 − . A = ⎜ 1 1 −1⎟ = ⎜ 2 2⎜ 2 2⎟ ⎟ ⎜ − 1 1 1 ⎟ ⎝ ⎠ 1 1 1 ⎜⎜ − ⎟ 2 ⎟⎠ ⎝ 2 2 Убедимся в том, что найденная матрица действительно является обратной. Должно быть A ⋅ A −1 = A −1 ⋅ A = E . Имеем: 3 1 ⎞ ⎛1 1 3 1 1 1⎞ ⎛ 1 ⎜ 2 − 2 2 ⎟ ⎜ 2 +1− 2 − 2 +1+ 2 2 −1+ 2 ⎟ ⎛1 2 1⎞ ⎜ ⎟ ⎜ ⎟ 1 1 1 1 1 1 1 1 1 ⎜ ⎟ − ⎟=⎜ − + − + ⎟= A ⋅ A −1 = ⎜ 0 1 1 ⎟ ⋅ ⎜ ⎜ 2 ⎟ ⎜ 2 2 2 2 2 2 2 2 ⎟ ⎜1 1 2⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ 1 1 1 1 1 3 1 1 1 ⎜⎜ − ⎟⎟ ⎜⎜ + − 1 − + + 1 − + 1⎟⎟ 2 2 2 2 2 2 2 2 2 ⎠ ⎝ ⎠ ⎝ ⎛1 0 0⎞ ⎜ ⎟ = ⎜0 1 0⎟ . ⎜0 0 1⎟ ⎝ ⎠ Нетрудно убедиться, что совершенно аналогично A −1 ⋅ A = E . Убедитесь в этом самостоятельно. 5. Ортогональная матрица
Определение 4. Квадратная матрица A называется ортогональной, если её обратная матрица A −1 совпадает с матрицей, транспонированной по отношению к матрице A , т.е. если A −1 = A T .
Свойства ортогональных матриц
1. Определитель ортогональной матрицы равен 1 либо −1 . Действительно, из A −1 = A T => det(A T ⋅ A ) = 1 => (det A )2 = 1 => det A = ±1 . 2. Сумма квадратов элементов каждой строки или столбца равна единице. 3. Сумма попарных произведений элементов двух различных строк или столбцов равна нулю. 81
Доказательство. Докажем для случая n = 3 . ⎛ a 11 A ⋅ A = E => ⎜ a 12 ⎜ ⎜a ⎝ 13 T
a 21 a 22 a 23
a 31 ⎞ ⎛ a 11 ⎟ ⎜ a 32 ⎟ ⋅ ⎜ a 21 a 33 ⎟⎠ ⎜⎝ a 31
a 12 a 22 a 32
a 13 ⎞ ⎟ a 23 ⎟ = a 33 ⎟⎠
⎛ a 112 + a 212 + a 312 a 11a 12 + a 21a 22 + a 31a 32 a 11a 13 + a 21a 23 + a 31a 32 ⎞ ⎜ ⎟ 2 2 2 = ⎜ a 12a 11 + a 22a 21 + a 32a 31 a 12 + a 22 + a 32 a 12a 13 + a 22a 23 + a 32a 33 ⎟ . ⎜ ⎟ 2 2 2 ⎜ a 13a 11 + a 23a 32 + a 33a 31 a 13a 12 + a 23a 22 + a 33a 32 ⎟ a + a + a 13 23 33 ⎝ ⎠ T Аналогично, рассматривая A ⋅ A = E , получим точно такие же соотношения для элементов строк.
§ 2. Элементарные преобразования матриц. Ранг матрицы. Теорема о базисном миноре 1. Элементарные преобразования матриц
Элементарными преобразованиями матриц называются преобразования трёх типов: 1) перемена мест двух строк или двух столбцов в данной матрице; 2) умножение строки (или столбца) на произвольное число, отличное от нуля; 3) прибавление к одной строке (столбцу) другой строки (столбца), умноженной на некоторое число. Матрицы, полученные одна из другой путём элементарных преобразований, называются эквивалентными. Эквивалентность двух матриц обозначается с помощью символа следования, т.е. A => B (иногда A B ).
Пример 1. 1. Найти треугольную матрицу, эквивалентную данной матрице ⎛1 0 2⎞ ⎜ ⎟ A = ⎜ 0 −1 1 ⎟ . ⎜ 3 0 2⎟ ⎝ ⎠ 2. Найти диагональную матрицу, эквивалентную матрице A . Решение. 1. Прибавим к третьей строке первую строку, умноженную на (-3), тогда ⎛1 0 2 ⎞ ⎛1 0 2⎞ ⎜ ⎟ ⎜ ⎟ ⎜ 0 −1 1 ⎟ => ⎜ 0 −1 1 ⎟ ⎜ ⎟ ⎜ 3 0 2⎟ ⎝ ⎠ ⎝ 0 0 −4 ⎠ 82
⎛1 0 2 ⎞ ⎜ ⎟ 2. Преобразуем далее матрицу B = ⎜ 0 −1 1 ⎟ , выполнив следующие ⎜ ⎟ ⎝ 0 0 −4 ⎠ элементарные преобразования: 1) к третьему столбцу прибавим первый, умноженный на (-2), оставив неизменными первый и второй столбцы: ⎛1 0 2 ⎞ ⎛1 0 0 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ 0 −1 1 ⎟ => ⎜ 0 −1 1 ⎟ . ⎜ 0 0 −4 ⎟ ⎜ 0 0 −4 ⎟ ⎝ ⎠ ⎝ ⎠ 2) из третьего столбца вычтем второй столбец: ⎛1 0 0 ⎞ ⎛1 0 0 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ 0 −1 1 ⎟ => ⎜ 0 −1 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ 0 0 −4 ⎠ ⎝ 0 0 −4 ⎠ 2. Ранг матрицы
Рассмотрим произвольную [m × n ] матрицу ⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ a 21 a 22 ... a 2n ⎟ ⎜ A= ⎜ ... ... ... ... ⎟ ⎜⎜ ⎟⎟ ⎝ a m 1 a m 2 ... a m n ⎠ Определение 1. Минором k -го порядка матрицы A называется определитель порядка k , элементы которого лежат на пересечении любых k строк и любых k столбцов матрицы A . ( k не превосходит наименьшего из m или n ). Определение 2. Наибольший порядок не равного нулю минора матрицы A называется рангом матрицы A . Следовательно, если r - ранг матрицы A , то у матрицы A имеется хотя бы один отличный от нуля минор r -го порядка, а все миноры (r + 1) -го порядка равны нулю.
Определение 3. Если r - ранг матрицы A , то любой не равный нулю минор r -го порядка, называется базисным минором. Для нахождения ранга матрицы, вообще говоря, можно проверить равенство нулю всех миноров (любого порядка) данной матрицы, однако такой способ требует большого объёма вычислений. Более экономичным является способ, основанный на использовании того факта, что ранги эквива83
лентных матриц совпадают. Дело в том, что ранг матрицы A совпадает с числом линейно-независимых строк (столбцов), а это число не меняется при элементарных преобразованиях. По этому способу матрица приводится к диагональному виду, из которого не равный нулю минор наивысшего порядка находится без затруднений. Пример 2. Найти ранг матрицы ⎛1 0 1 2 1⎞ ⎜ ⎟ A = ⎜ 1 1 −1 1 0 ⎟ . ⎜ 2 1 2 1 1⎟ ⎝ ⎠
Решение.
⎛1 ⎜ A => A 1 = ⎜ 0 ⎜ ⎝0 ⎛1 ⎜ A3 = ⎜0 ⎜0 ⎝
0
1
2
1
−2
−3
1
0
−3
0
0
0
1
−2
−3
0
2
0
⎛1 1 ⎞ ⎜ ⎟ − 1 ⎟ => A 2 = ⎜ 0 ⎜0 − 1 ⎠⎟ ⎝
⎛1 0 ⎞ ⎟ => A = ⎜ 0 −1⎟ 4 ⎜ ⎜0 ⎟ 0 ⎠ ⎝
0
1
2
1 0
−2 2
−3 0
0
0
0
1 0
0 2
0 0
1 ⎞ ⎟ − 1 ⎟ => 0 ⎟⎠
0⎞ ⎟ 0⎟ 0 ⎟⎠
A 1 получаем из A , вычитая из второй строки первую, а из третьей строки первую, умноженную на -2; из третьей строки вычитаем вторую – получаем A 2 ; подобным образом получаем нули и над главной диагональю. Ясно, что r = 3 . 3. Линейная независимость строк и теорема о базисном миноре
Определение 4. Строка A = (a 1 ,a 2 ,...,a n ) называется линейной ком-
… , бинацией строк A 1 = (b11 ,b12 ,...,b1n ) , A 2 = (b 21 ,b 22 ,...,b 2n ) , A n = (bk 1 ,bk 2 ,...,bkn ) , если для некоторых чисел γ 1 , γ 2 , …, γ k справедливо равенство A = γ 1A 1 + γ 2A 2 + ... + γ k A k или a j = γ 1a 1j + γ 2a 2 j + ... + γ ka kj ( j = 1, 2,..., n ). Определение 5. Строки A 1 ,A 2 ,...A l называются линейно независимыми, если равенство γ 1A 1 + γ 2A 2 + ... + γ l A l = 0 возможно лишь в том случае, когда все числа γ 1 , γ 2 ,..., γ l равны нулю. В противном случае строки называются линейно зависимыми. Теорема 1. Для того, чтобы строки A 1 ,A 2 ,..., A l были линейно зависимы, необходимо и достаточно, чтобы хотя бы одна из этих строк являлась бы линейной комбинацией остальных строк. Доказательство. Необходимость. Пусть строки линейно зависимы, т.е. γ 1A 1 + γ 2A 2 + ... + γ l A l = 0 , где хотя бы одно из чисел γ i не равно нулю. 84
Пусть для определённости γ 1 ≠ 0 , тогда, разделив предыдущее равенство на
γ 1 , получим: A 1 = −
γ2 γ γ A 2 − 3 A 3 − ... − l A l , а это означает, что A 1 является γ1 γ1 γ1
линейной комбинацией A 2 , A 3 ,..., A l . Достаточность. Пусть одна из строк (например A 1 ) является линейной комбинацией остальных строк, т.е. A 1 = μ 2A 2 + μ3A 3 + ... + μl A l => ( −1) ⋅ A 1 + μ 2A 2 + μ3A 3 + ... + μl A l = 0 , т.е. строки A 1 , A 2 ,..., A l линейно зависимы. Теорема доказана. Рассмотрим теперь произвольную матрицу: ⎛ a 11 a 12 ⎜ a a 22 A = ⎜ 21 ⎜ ... ... ⎜⎜ ⎝a m 1 a m 2
a 1n ⎞ ⎟ a 2n ⎟ ... ... ⎟ ⎟ ... a m n ⎟⎠ ... ...
и пусть r - ранг матрицы A . Тогда существует не равный нулю минор r -го порядка – базисный минор этой матрицы. Строки и столбцы, на пересечении которых стоит базисный минор, назовём соответственно базисными строчками и базисными столбцами.
Теорема 2. (Теорема о базисном миноре). Базисные строки (базисные столбцы) линейно независимы. Любая строка (любой столбец) матрицы A является линейной комбинацией базисных строк (базисных столбцов). Доказательство. Все рассуждения приведём для строк. Независимость базисных строк будем доказывать от противного. Пусть базисные строки линейно зависимы. Тогда по теореме 1 одна из строк является линейной комбинацией остальных. Но тогда из свойств определителя вытекает, что базисный минор равен нулю, чего не может быть, следовательно, базисные строки линейно независимы. Докажем теперь, что любая строка матрицы A является линейной комбинацией базисных строк. Не нарушая общности, можно считать, что базисный минор расположен в левом верхнем углу матрицы A . Рассмотрим определитель (r + 1) -го порядка вида:
Δ=
a 11
a 12
... a 1r
... a 1 j
a 21
a 22
... a 2r
... a 2 j
... ... ar1 ar 2
... ... ... a r r
... ... , ... a r j
... ... a k1 a k 2
... ... ... a kr
... ... ... a kj
85
полученный добавлением к базисному минору частей любой k -й строки и любого j -го столбца матрицы A . Докажем, что Δ = 0 . Если j ≤ r и k ≤ r , то Δ = 0 , так как он содержит два одинаковых столбца или две одинаковых строки. Если j > r и k > r , то Δ - есть минор ( r + 1 )-го порядка матрицы A , а всякий такой минор равен нулю. Итак, Δ = 0 . Разлагая Δ по элементам последнего столбца и обозначая алгебраические дополнения элементов a ij буквами c i = A ij , получим c 1a 1j + c 2a 2 j + ... + c 2a r j + c r +1a kj = 0 ( j = 1, 2,..., n ) . Но c r +1 = A kj равно базисноc c му минору, поэтому c r +1 ≠ 0 . Отсюда, обозначая γ 1 = − 1 , γ 2 = − 2 , …, c r +1 c r +1 c γ r = − r , из последнего равенства получим: a kj = γ 1a 1j + γ 2a 2 j + ... + γ 2a r j c r +1 ( j = 1, 2,..., n ) , а это означает, что любая k -я строка матрицы A является линейной комбинация базисных строк. Теорема доказана.
§ 3. Исследование линейных алгебраических систем Рассмотрим систему m линейных алгебраических уравнений с неизвестными x 1 , x 2 ,..., x n ⎧ a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎪ a x + a x + ... + a x = b (1) ⎪ 21 1 22 2 2n n 2 ⎨ ... ⎪ ⎩⎪a m 1x 1 + a m 2x 2 + ... + a m n x n = bm Система (1) называется однородной, если все её свободные члены b1 ,b 2 ,...,bm равны нулю; если хотя бы один из свободных членов b1 ,b 2 ,...,bm отличен от нуля, то система называется неоднородной. В системе (1) число уравнений может быть меньше, равно или больше числа неизвестных. Решением системы (1) называется такая совокупность n чисел c 1 ,c 2 ,...,c n , что каждое из уравнений системы (1) обращается в тождество после замены в нём неизвестных x i соответствующими числами c i (i = 1, 2,..., n ) . Система (1) может не иметь ни одного решения, может иметь одно решение, число решений может быть и бесконечно много. Система уравнений (1) называется совместной, если она имеет хотя бы одно решение и несовместной, если у неё не существует ни одного решения. Совместная система (1) называется определённой, если она имеет единственное решение, и неопределённой, если у неё существует по крайней мере два решения. 86
Две системы называются эквивалентными, если любое решение одной из них является решением и другой системы. Заметим, что все несовместные системы являются эквивалентными. 1. Решение системы линейных алгебраических уравнений в матричном виде Возьмём систему вида (1) и введём в рассмотрение следующие матрицы: ⎛ a11 a12 ... a1n ⎞ ⎛ a 11 a 12 ... a 1n b1 ⎞ ⎛ x1 ⎞ ⎛ b1 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ a 21 a 22 ... a 2n ⎟ a 21 a 22 ... a 2n b2 ⎟ x2 ⎟ b ⎜ ⎜ ⎜ , Ap = ,X = ,B = ⎜ 2 ⎟ . A= ⎜ ... ... ... ... ⎟ ⎜ ... ⎜ ... ⎟ ⎜ ... ⎟ ... ... ... ... ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝a m 1 a m 2 ... a mn ⎠ ⎝a m 1 a m 2 ... a mn bm ⎠ ⎝xn ⎠ ⎝ bm ⎠ Матрица A называется матрицей коэффициентов системы (1), A p называется расширенной матрицей коэффициентов системы (1), одностолбцовая матрица B называется матрицей свободных членов, одностолбцовая матрица X - матрицей неизвестных. Найдём произведение A ⋅X . ⎛ a 11 a 12 ⎜ a a 22 A ⋅ X = ⎜ 21 ⎜ ... ... ⎜⎜ ⎝a m 1 a m 2
... a 1n ⎞ ⎛ x 1 ⎞ ⎛ a 11x 1 + a 12x 2 + ... + a 1n x n ⎟ ⎜ ⎟ ⎜ ... a 2n ⎟ ⎜ x 2 ⎟ ⎜ a 21x 1 + a 22x 2 + ... + a 2n x n ⋅ = ... ... ⎟ ⎜ ... ⎟ ⎜ ... ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ... a m n ⎠ ⎝ x n ⎠ ⎝ a m 1x 1 + a m 2x 2 + ... + a m n x n
⎞ ⎟ ⎟. ⎟ ⎟⎟ ⎠
Очевидно, что в силу системы (1) получившуюся матрицу можно приравнять матрице B . Следовательно, вместо систем (1) мы можем рассматривать матричное уравнение (2) A ⋅X = B . Рассмотрим линейную систему, у которой число неизвестных совпадает с числом уравнений, ⎧ a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎪ a x + a x + ... + a x = b ⎪ 21 1 22 2 2n n 2 ⎨ ... ⎪ ⎪⎩a n 1x 1 + a n 2x 2 + ... + a nn x n = bn Матрица коэффициентов этой системы квадратная, т.е. ⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ a 21 a 22 ... a 2n ⎟ ⎜ . A= ⎜ ... ... ... ... ⎟ ⎜⎜ ⎟⎟ ⎝ a n 1 a n 2 ... a nn ⎠ 87
Допустим, что det A ≠ 0 , тогда у матрицы A существует обратная A −1 . Запишем систему в матричном виде A ⋅ X = B . Умножив левую и правую части этого уравнения слева на A −1 , получим A −1 ⋅ A ⋅ X = A −1 ⋅ B => E ⋅ X = A −1 ⋅ B . Итак, решение системы (2) в матричном виде X = A −1 ⋅ B . Заметим, что это решение – единственное.
Пример 1. Найти решение системы в матричном виде: 2x + y + z = 3⎫ ⎪ x + 2y − z = 0⎬ x − y + z = 2 ⎪⎭
Решение. Обозначим через A матрицу коэффициентов данной матрицы систему, B - матрицу – столбец из свободных членов, X - искомую матрицу – столбец. Ясно, что ⎛x ⎞ ⎛2 1 1 ⎞ ⎛ 3⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ A = ⎜ 1 2 −1⎟ , B = ⎜ 0 ⎟ , X = ⎜ y ⎟ . ⎜z ⎟ ⎜ 1 −1 1 ⎟ ⎜ 2⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ Данная система в матричном виде A ⋅ X = B , её решение X = A −1 ⋅ B . Найдём обратную матрицу A −1 . Прежде всего 2
1
1
det A = 1
2
−1 = 2 ⋅ 2 ⋅ 1 + 1 ⋅ ( −1) ⋅ 1 + 1 ⋅ ( −1) ⋅ 1 − 1 ⋅ 2 ⋅ 1 −
1 −1
1
−1( −1)( −1) ⋅ 2 − 1 ⋅ 1 ⋅ 1 = 4 − 1 − 1 − 2 − 2 − 1 = −3 Найдём алгебраические дополнения матрицы A . A 11 = ( −1)1+1 A 12 = ( −1)1+ 2 A 13 = ( −1)1+3
2
−1
−1
1
1 −1 1
1
1
2
1 −1
= 1,
1
A 21 = ( −1)2+1
−1 1
= −2 , A 22 = ( −1)2+ 2 = −3 ,
A 23 = ( −1)2+3
1
2 1 1 1 2
= 1,
1
1 −1
Получаем обратную матрицу A −1 88
= −2 ,
= 3,
A 31 = ( −1)3+1 A 32 = ( −1)3+ 2
2
1
1
2 −1 1
1 −1
A 33 = ( −1)3+3
= −3
=3
2 1 1 2
=3
⎛ 1 2 ⎞ 1⎟ ⎜−3 3 ⎛ 1 −2 − 3 ⎞ ⎜ ⎟ 1 1 ⎜ ⎟ ⎜ 2 −1 − −1 ⎟ . A = − ⎜ −2 1 3 ⎟ = ⎜ ⎟ 3⎜ 3 3 ⎟ ⎝ −3 3 3 ⎠ ⎜ 1 −1 −1⎟ ⎜⎜ ⎟⎟ ⎝ ⎠ −1 Вычислим X = A ⋅ B 2 ⎛ 1 2 ⎞ ⎛ 1 ⎞ 1 3 0 1 2 − − ⋅ + ⋅ + ⋅ ⎜ ⎟ ⎜ 3 ⎟ 3 ⎛x ⎞ ⎜ 3 3 ⎟ ⎛ 3⎞ ⎜ ⎟ ⎛1⎞ 1 1 ⎜ ⎟ ⎜ 2 ⎜ ⎟ ⎜ 2 ⎜ ⎟ ⎟ − −1 ⋅ ⎜ 0 ⎟ = ⋅ 3 − ⋅ 0 − 1⋅ 2 ⎟ = ⎜ 0 ⎟ X = ⎜y ⎟ = ⎜ ⎟ ⎜ ⎟ 3 3 ⎜z ⎟ ⎜ 3 ⎜ 2⎟ ⎜ 3 ⎟ ⎟ ⎜⎝ 1 ⎟⎠ ⎝ ⎠ ⎝ ⎠ 1 1 1 1 3 1 0 1 2 − − ⋅ − ⋅ − ⋅ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ ⎠ ⎝ ⎠
Итак, получим решение данной системы в матричном виде ⎛x ⎞ ⎛ 1 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜y ⎟ = ⎜ 0⎟ . ⎜z ⎟ ⎜1⎟ ⎝ ⎠ ⎝ ⎠ От такой записи решения можно перейти к более привычной форме записи: x = 1,y = 0, z = 1 . 2. Правило Крамера 1 Для простоты выкладок рассмотрим систему n линейных алгебраических уравнений с n неизвестными, положив n = 3
a 11x 1 + a 12x 2 + a 13x 3 = b1 ⎫ ⎪ a 21x 1 + a 22x 2 + a 23x 3 = b2 ⎬ . a 31x 1 + a 32x 2 + a 33x 3 = b3 ⎪⎭ Пусть определитель этой системы отличен от нуля, т.е. det A ≠ 0 . Тогда можно записать решение этой системы в матричном виде, положив Δ = det A . ⎛ x1 ⎞ ⎛ A 11 A 21 A 31 ⎞ ⎛ b1 ⎞ ⎛ b1A 11 + b 2A 21 + b3A 31 ⎞ ⎜ ⎟ 1⎜ ⎟ ⎜ ⎟ 1⎜ ⎟ ⎜ x 2 ⎟ = Δ ⎜ A 12 A 22 A 32 ⎟ ⋅ ⎜ b 2 ⎟ = Δ ⎜ b1A 12 + b 2A 22 + b3A 32 ⎟ . ⎜x ⎟ ⎜A ⎟ ⎜ ⎟ ⎜b A + b A + b A ⎟ ⎝ 3⎠ ⎝ 13 A 23 A 33 ⎠ ⎝ b3 ⎠ ⎝ 1 13 2 23 3 33 ⎠ * Крамер Г. (1704 – 1752) – швейцарский математик.
89
Следовательно,
b1 a 12 a 13 b1A 11 + b 2A 21 + b3A 31 1 = b 2 a 22 a 23 x1 = Δ Δ b3 a 32 a 33 a 11 b1 a 13 b1A 12 + b 2A 22 + b3A 32 1 x2 = = a 12 b 2 a 23 Δ Δ a 13 b3 a 33 b1 a 12 a 13 b1A 13 + b 2A 23 + b3A 33 1 = b 2 a 22 a 23 x3 = Δ Δ b3 a 32 a 33 Полученные формулы для вычисления x 1 , x 2 , x 3 называются формулами Крамера, а соответствующее правило – правилом Крамера. Итак, если определитель системы n линейных алгебраических уравнений с n неизвестΔx i ными Δ отличен от нуля, то по формулам Крамера: x i = Δ (i = 1, 2,..., n ) , где определитель Δx i получается из определителя системы путём замены i -го столбца столбцом из свободных членов.
Пример 2. Найти решение системы 2x + y + z = 3⎫ ⎪ x + 2y − z = 0 ⎬ x − y + z = 2 ⎭⎪ по формулам Крамера.
Решение. Вычислим определители Δ , Δx , Δy и Δz . 2 Δ= 1
1 2
1 −1 2 3
1 2
1 −1 = − 3
2 −1
1 1
1
2
1
3
Δy = 1 0 −1 = 0 , Δz = 1
2
0 = −3
1 2 Имеем x =
1 3 −1 = −3 , Δx = 0
1 −1 2
1
Δx −3 Δz −3 Δy = = 1; y = = 0; z = = =1. Δ −3 Δ −3 Δ 90
Итак, решение данной системы: x = 1, y = 0, z = 1 . 3. Метод Гаусса2
Отметим, что формулы Крамера (так же как и решение систем в матричном виде) имеют ограниченное применение, потому, что уже для систем выше 4-го порядка приводят к громоздким вычислениям. Кроме того, формулы Крамера применимы, если число уравнений совпадает с числом неизвестных и при этом определитель системы Δ ≠ 0 . Для исследования систем m алгебраических уравнений с n неизвестными в последнее время, особенно в связи с развитием вычислительной техники широкое применение получил метод Гаусса. Итак, рассмотрим систему m алгебраических уравнений с n неизвестными, причём a 11 ≠ 0 .
a11x1 + a12x 2 + ... + a1n x n = b1 ⎫ ⎪ a 21x1 + a 22x 2 + ... + a 2n x n = b2 ⎪ ⎬. ... ⎪ a m 1x1 + a m 2x 2 + ... + a mn x n = bm ⎭⎪
(1)
Заметим, что условие a 11 ≠ 0 нетрудно выполнить. Действительно, для этого достаточно переставить уравнения таким образом, чтобы в первом уравнении при первой неизвестной коэффициент был бы отличен от нуля, в противном случае система не содержала бы переменной x 1 . Оставляя теперь неизменным первое уравнение, преобразуем остальные уравнения таким образом, чтобы коэффициенты при неизвестной x 1 обратились бы в нуль (для этого достаточно ко второму уравнению прибавить первое уравнение, a a умноженное на − 21 , к третьему уравнению – первое, умноженное на − 31 , a 11 a 11 a и т.д., к m -му уравнению прибавить первое, умноженное на − m 1 ). a 11 В результате получим систему, эквивалентную системе (1), в виде: a 11x 1 + a 12x 2 + ... + a 1n x n
= b1 ⎫ ⎪ a 22′x 2 + ... + a 2n ′x n = b 2′ ⎪ ⎪ a 32′x 2 + ... + a 3n ′x n = b 3′ ⎬ ⎪ ... ⎪ ⎪ a m 2′x 2 + ... + a m n ′x n = b m ′ ⎭
*
Карл Фридрих Гаусс (1777 – 1855) – великий немецкий математик.
91
(2)
Потребуем, чтобы в системе (2) был бы отличен от нуля коэффициент a 22′ , чего можно опять-таки добиться с помощью перестановки уравнений. Если же после первого шага во всех уравнениях, кроме первого, коэффициенты обратятся в нуль, то приступают к следующему шагу, а именно: повторяя алгоритм Гаусса, аннулируем далее коэффициенты при x 2 во всех уравнениях, начиная с 3-го. Причём, после какого-то шага число уравнений может уменьшаться (это имеет место, если какие-то уравнения являются линейными комбинациями других уравнений, т.е. не являются независимыми). После последнего шага мы можем придти к таким ситуациям: 1) Число неизвестных совпадает с числом уравнений, и матрица системы ∗ приведена к треугольному виду (a n n ≠ 0) : a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎫ ∗ ∗ ∗⎪ a 22 x 2 + ... + a 2n x n = b 2 ⎪ (3) ⎬. ... ⎪ ∗ ∗ a nn x n = bn ⎭⎪ ∗
b Теперь можно из последнего уравнения выразить x n = n ∗ , подставить a nn найденное x n в предыдущее уравнение, найти x n −1 и идти далее восходящим ходом к первому уравнению, находя шаг за шагом x n − 2 , x n −3 ,..., x 2 , x 1 . Очевидно, что в этом случае ранг матрицы ⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ a 21 a 22 ... a 2n ⎟ ⎜ A= ⎜ ... ... ... ... ⎟ ⎜⎜ ⎟⎟ ⎝ a m 1 a m 2 ... a m n ⎠ совпадает с рангом расширенной матрицы ⎛ a 11 a 12 ... a 1n b1 ⎞ ⎜ ⎟ a a ... a b 21 22 2 2 n ⎟, Ap = ⎜ ⎜ ... ... ... ... ... ⎟ ⎜⎜ ⎟⎟ ⎝ a m 1 a m 2 ... a m n bn ⎠ т.е. r (A ) = r (A p ) = n . Действительно, матрица системы (3) получена с помощью элементарных преобразований над строчками исходной матрицы. В этом случае система имеет единственное решение. 2) Число неизвестных меньше числа уравнений, т.е. система имеет вид: 92
a 11x 1 + a 12x 2 + ... + a 1k x k + ... + a 1n x n = b1 ⎫ * a 22 x 2 + ... + a 2*k x k + ... + a 2*n x n = b 2 ⎪⎪ ... ⎪ ⎪ ... ⎪ ⎬, * * a nk x k + ... + a nn x n = bn* ⎪ 0 ⋅ x k + ... + 0 ⋅ x n = bn* +1 ⎪ ⎪ ... ⎪ 0 ⋅ x k + ... + 0 ⋅ x n = bn* ⎪⎭ * * * причём bn +1 ,bn + 2 ,...,br отличны от нуля. В этом случае ранг матрицы системы меньше ранга её расширенной матрицы, т.е. r (A ) < r (A p ) , тогда некоторые из уравнений системы противоречат остальным, т.е. система несовместна. 3) Число уравнений меньше числа неизвестных, т.е. система имеет вид: a 11x 1 + a 12x 2 + ... + a 1k x k + a 1 k +1x k +1 + ... + a 1n x n = b1 ⎫ ∗ a 22 x 2 + ... + a 2∗k x k + a 2∗ k +1x k +1 + ... + a 2n x n = b 2∗ ⎪⎪ ⎬ ...⎪ ∗ ∗ a kk x k + a k∗ k +1x k +1 + ... + a kn x n = bk∗ ⎪⎭ Примем x k +1 , x k + 2 ,..., x n за параметры, т.е. будем считать, что они принимают любые значения, тогда систему можно записать в виде: a 11x 1 + a 12x 2 + ... + a 1k x k = b1 − a 1 k +1x k +1 − ... − a 1n x n ⎫ ⎪ * ∗ a 22 x 2 + ... + a 2∗k x k = b 2 − a 2∗ k +1x k +1 − ... − a 2∗n x n ⎪ ⎬ ...⎪ ∗ ∗ ∗ a kk x k = bk − a k∗ k +1x k +1 − ... − a kn x n ⎪⎭ Система имеет бесчисленное множество решений, r (A ) = r (A p ) < n .
Замечание. При исследовании систем методом Гаусса систему обычно не выписывают, а работают с расширенной матрицей системы A p , выполняя элементарные преобразования, соответствующие алгоритму Гаусса. Пример 3. Исследовать систему методом Гаусса 2x + y + z = 3⎫ ⎪ x + 2y − z = 0 ⎬ x − y + z = 2 ⎪⎭ Решение. Запишем расширенную матрицу коэффициентов данной системы и приведём её к треугольному виду: 93
1 1 3 ⎞ ⎛ 1 −1 1 ⎛2 ⎜ ⎟ ⎜ A p = ⎜ 1 2 −1 0 ⎟ → ⎜ 2 1 1 ⎜ 1 −1 1 2 ⎟⎠ ⎜⎝ 1 2 − 1 ⎝ 1 2 ⎞ ⎛ 1 −1 1 ⎛ 1 −1 ⎜ ⎟ ⎜ → ⎜0 3 −1 −1 ⎟ → ⎜ 0 3 −1 ⎜0 3 − 2 − 2 ⎟⎠ ⎜⎝ 0 0 −1 ⎝
2⎞ ⎟ 3⎟ → 0 ⎟⎠ 2⎞ ⎟ −1⎟ − 1 ⎟⎠
Вернёмся теперь обратно к системе, записанной в привычном виде: x − y + z = 2⎫ ⎪ 3y − z = −1⎬ . −z = −1⎪⎭ Теперь следует применить восходящий ход алгоритма Гаусса и выписать решение: −z = −1 => z = 1 , подставим z = 1 во второе уравнение, тогда получим y = 0 ; и, наконец, подставим y = 0 и z = 1 в первое уравнение, получим x = 0 − 1 + 2 = 1 . В результате имеем решение данной системы: x = 1,y = 0, z = 1 .
Пример 4. Исследовать систему методом Гаусса x 1 − x 2 + x 3 + 2x 4 − x 5 = 0 ⎫ x 1 + x 2 + 2x 3 − x 4 + x 5 = 2 ⎪⎪ ⎬ x 1 − x 2 − x 3 + x 4 + 2x 5 = − 1⎪ 3x 1 + x 2 + 3x 3 − x 4 + 4x 5 = 4 ⎪⎭
Решение. ⎛ 1 −1 1 2 −1 0 ⎞ ⎛ 1 −1 1 2 −1 0 ⎞ ⎜ ⎟ ⎜ ⎟ 1 −3 2 2 ⎟ ⎜ 1 1 2 −1 1 2 ⎟ → ⎜ 0 2 → ⎜ 1 −1 −1 1 2 −1⎟ ⎜ 0 0 −2 −1 3 −1⎟ ⎜ ⎟ ⎜ ⎟ ⎝ 3 1 3 −1 4 1⎠ ⎝ 0 4 0 −7 7 1⎠
⎛ 1 −1 1 2 −1 0 ⎞ ⎛ 1 −1 1 2 −1 0 ⎞ ⎜ ⎟ ⎜ ⎟ 0 2 1 −3 2 2 ⎟ ⎜ 0 2 1 −3 2 2 ⎟ ⎜ → → ⎜ 0 0 −2 −1 3 −1⎟ ⎜ 0 0 −2 −1 3 −1⎟ ⎜ ⎟ ⎜ ⎟ ⎝ 0 0 −2 − 1 3 − 3 ⎠ ⎝ 0 0 0 0 0 − 2 ⎠
Вывод: система несовместима. Из приведенных рассуждений с очевидностью вытекает теорема.
94
Теорема Кронекера-Капелли 3 Для того, чтобы линейная система
a 11x1 + a 12x 2 + ... + a 1n x n = b1 ⎫ a 21x1 + a 22x 2 + ... + a 2n x n = b2 ⎪⎪ ⎬ ... ⎪ a m 1x1 + a m 2x 2 + ... + a mn x n = bm ⎪⎭ была совместна, необходимо и достаточно, чтобы ранг расширенной матрицы A p этой системы был равен рангу матрицы её коэффициентов A , т.е. r (A ) = r (A p ) . (без доказательства)
§ 4. Однородные системы линейных алгебраических уравнений. Фундаментальная система решений. Рассмотрим однородную систему линейных алгебраических уравнений
⎧a11x1 + a12x 2 + ... + a1n xn = 0 ⎪a x + a x + ... + a x = 0 ⎪ 21 1 22 2 2n n ⎨ ⎪... ⎪⎩a m 1x1 + a m 2x 2 + ... + a mnxn = 0
(1)
или в матричной форме A ⋅ X = 0 , где 0 – нулевой столбец.
Свойства однородной системы 1. Однородная система совместна, поскольку всегда имеет нулевое (тривиальное) решение. 2. Пусть ⎛ α1 ⎞ ⎛ β1 ⎞ ⎜ ⎟ ⎜ ⎟ α β 2 X =⎜ ⎟ иY =⎜ 2 ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ αn ⎠ ⎝ βn ⎠ - два решения однородной системы (1). Линейная комбинация этих решений λX + μY , где λ , μ ∈ , также является решением системы. Более того, линейная комбинация любого конечного числа решений однородной системы (1) также является решением этой системы. 3. Если система (1) имеет хотя бы одно ненулевое решение, то она имеет бесконечно много решений. *
Л. Кронекер (1823-1891) – немецкий математик, А. Капелли (1855 – 1910) - итальянский
95
Определение. Совокупность решений X 1 , X 2 ,..., X k однородной системы (1) называется фундаментальной системой решений, если 1) X 1 , X 2 ,..., X k - линейно независимы, 2) любое решение системы X представимо в виде линейной комбинации X 1 , X 2 ,..., X k , т.е. ∃c 1 ,c 2 ,...,c k ∈ не все равные нулю, такие, что X = c 1X 1 + c 2X 2 + ... + c k X k . Определение. Решение системы (1) вида X = c 1E1 + c 2E2 + ... + c k Ek , где E1 , E2 ,..., Ek - фундаментальная система решений; c 1 ,c 2 ,...,c k - произвольные действительные постоянные, представляющее всевозможные решения системы (1) называют общим решением однородной системы. 4. Теорема (о фундаментальной системе решений) Если ранг r матрицы A однородной системы (1) меньше числа неизвестных n , то система имеет фундаментальную систему решений, состоящую из n − r решений. Доказательство. Доказательство этой теоремы даёт способ отыскания фундаментальной системы решений. Рассмотрим матрицу A системы (1) ⎛ a 11 ... a 1r a 1,r +1 ... a 1n ⎞ ⎜ ⎟ a ... a a ... a , 21 2 r 2 r + 1 2 n ⎜ ⎟ (2) ⎜ . . . . . . ⎟ A =⎜ ⎟ ⎜ a r 1 ... a r r a r ,r +1 ... a r n ⎟ ⎜ . . . . . . ⎟ ⎜⎜ ⎟⎟ ⎝ a m 1 ... a m r a m ,r +1 ... a m n ⎠ Как и прежде, не умоляя общности, предположим, что базисный минор находится в левом верхнем углу матрицы A . Тогда, по теореме о базисном миноре строки с номерами от r + 1 до m представимы в виде линейных комбинаций базисных строк. Значит, пользуясь свойствами сложения строк матриц и умножения строк на число, мы можем получить матрицу, у которой строки с номерами, большими r , нулевые. Следовательно, их можно отбросить. Соответствующая ей однородная система эквивалентна исходной, но имеет r уравнений. Запишем её в следующем виде: ⎧a 11x 1 + a 12x 2 + ... + a 1r x r = − a 1,r +1x r +1 − ... − a 1n x n ⎪a x + a x + ... + a x = −a x − ... − a x ⎪ 21 1 22 2 2r r 2 ,r +1 r +1 2n n (3) ⎨ ... ⎪ ⎪⎩a m 1x 1 + a m 2x 2 + ... + a r r x r = −a r ,r +1x r +1 − ... − a r n x n 96
Неизвестные x 1 , x 2 ,..., x r назовём базисными, а остальные n − r неизвестных x r +1 , x r + 2 ,..., x n - свободными. Если свободным неизвестным придать какие-либо фиксированные значения, то из системы (3) базисные неизвестные можно найти единственным образом, поскольку A * , матрица системы (3), квадратная и её элементы образуют базисный минор ( detA * ≠ 0 ). Придадим свободным неизвестным следующие наборы значений: ⎛1⎞ ⎛0⎞ ⎛0⎞ ⎛0⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜0⎟ ⎜1⎟ ⎜0⎟ ⎜0⎟ ⎜ 0 ⎟; ⎜ 0 ⎟; ⎜ 1 ⎟; … ; ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ... ... ... ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ... ⎟ ⎜0⎟ ⎜0⎟ ⎜0⎟ ⎜1⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ В каждом i -ом наборе все элементы, кроме одного, равны 0, а отличный от нуля (единица), стоит на i -ом месте. Всего таких наборов n − r . Подставим поочерёдно эти наборы значений переменных x r +1 ,..., x n в систему (3), решим её относительно x 1 , x 2 ,..., x r и получим следующие решения:
⎛ x 11 ⎞ ⎛ x 12 ⎞ ⎛ x 1n −r ⎞ ⎜ 1⎟ ⎜ 2⎟ ⎜ n −r ⎟ ⎜x 2 ⎟ ⎜x 2 ⎟ ⎜x 2 ⎟ ; ; … ; ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜x 1 ⎟ ⎜x 2 ⎟ ⎜ x n −r ⎟ ⎝ r ⎠ ⎝ r ⎠ ⎝ r ⎠ Теперь объединим соответствующие решения и получим такую совокупность решений системы (3), а значит и (1): ⎛ x 11 ⎞ ⎛ x 12 ⎞ ⎛ x 1n −r ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ M ⎟ ⎜ M ⎟ ⎜ M ⎟ ⎜ 1⎟ ⎜ 2⎟ ⎜ n −r ⎟ x x r r ⎜ ⎟ ⎜ ⎟ ⎜xr ⎟ X 1 = ⎜ 1 ⎟ ; X 2 = ⎜ 0 ⎟ ; … ; X n −r = ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 ⎟ ⎜ 1 ⎟ ⎜ 0 ⎟ ⎜ M ⎟ ⎜ M ⎟ ⎜ M ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝ 0 ⎠ ⎝ 0 ⎠ ⎝ 1 ⎠ Покажем, что эта система решений будет фундаментальной. Для этого надо проверить два условия из определения. Проверим линейную независимость столбцов X 1 , X 2 , ..., X n −r . Рассмотрим матрицу, составленную из столбцов X 1 , ..., X n −r 97
⎛ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
1
x1
x2 K
1
1
xr 0 1 K 0
x1
xr 1 0 K 0
n −r
2
K
x1
x2 K
2
K K
x2 K
2
K K K K K
xr
n −r
n −r
0 0 K 1
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Минор порядка n − r , образованный последними n − r строками, отличен от нуля. Следовательно, ранг данной матрицы равен n − r , и по теореме о базисном миноре все столбцы линейно независимы, что и означает линейную независимость решений X 1 , X 2 ,..., X n −r . 3) Возьмём произвольное решение однородной системы (1) ⎛ x1 ⎞ ⎜ ⎟ x X =⎜ 2⎟ ⎜ M ⎟ ⎜⎜ ⎟⎟ ⎝xn ⎠ Рассмотрим одностолбцовую матрицу Y : (4) Y = X − x X − x X − ... − x X r +1
1
r +2
2
n
n −r
По свойствам однородных систем Y - решение системы (1). Выполнив все действия в правой части равенства (4), получим T Y = (y 1 , y 2 ,..., y r , 0, 0,..., 0) . Кроме того, Y является решением системы (3), которая равносильна системе (1). Нулевому значению свободных неизвестных соответствует (единственное) нулевое решение системы (3). Значит, Y = 0 . Подставив это значение в равенство (4), получим X = x r +1X 1 + x r + 2X 2 + ... + x n X n −r , то есть произвольное решение X однородной системы (1) является линейной комбинацией решений X 1 , X 2 ,..., X n −r . И так очевидно, что X 1 , X 2 ,..., X n −r образуют фундаментальную систему решений. Следствие. Однородная система (1), у которой число неизвестных n совпадает с числом уравнений m , имеет ненулевое решение тогда и только тогда, когда определитель матрицы системы detA = 0 .
98
§5. Неоднородные системы линейных алгебраических уравнений. Рассмотрим произвольную систему линейных алгебраических уравнений представив её в матричной форме (1) A ⋅X = B . Соответствующей ей однородной системой будем называть систему A ⋅X = 0, (2) где 0 - нулевой столбец.
1. Некоторые свойства решений неоднородной системы и их связь с решением соответствующей однородной системы 1. Если Y является решением неоднородной системы, а X - решением однородной системы, то Z =Y + X - решение неоднородной системы линейных уравнений Доказательство. Из условия имеем A ⋅Y = B и A ⋅ X = 0 . Найдём A ⋅Y + A ⋅ X = A ⋅ (Y + X ) = A ⋅ Z ⎫ => A ⋅ Z = B С другой стороны A ⋅Y + A ⋅ X = B + 0 = B ⎬⎭ Тогда Z =Y + X является решением неоднородной системы. 2. Если Y и Z -решения неоднородной системы, то столбец X =Y − Z является решением соответствующей однородной системы. Доказывается аналогично свойству 1. 3. Любое решение Z неоднородной системы представимо в виде суммы Z = Y + X , где столбец Y - частное решение неоднородной системы, а столбец X - решение однородной системы, соответствующей системе (1). 4. Пусть X 1 , X 2 ,..., X n −r фундаментальная система решений однородной системы (2), а Y - частное решение неоднородной системы. Тогда всё множество решений неоднородной системы представимо в виде (3) Z =Y + c 1X 1 + c 2X 2 + ... + c n −r X n −r , где r - ранг матрицы системы; c 1 ,c 2 ,...,c n −r - произвольные постоянные. При этом выражение (3) называют общим решением системы. Доказательство. По свойству 3 всякое решение неоднородной системы представимо в виде Z =Y + X , а любое решение однородной системы в виде X = c 1X 1 + ... + c n −r X n −r по теореме о фундаментальной системе решений. Пример 1.. Решить однородную систему x 1 + 2x 2 + x 3 = 0 ⎫ ⎪ 2x 1 + x 2 − 3x 3 = 0 ⎬ 3x 1 + 3x 2 − 2x 3 = 0 ⎪⎭ 99
Решение. Однородная система всегда совместна и имеет единственное тривиальное решение тогда и только тогда, когда ранг матрицы A этой системы равен числу неизвестных. Вычислим ранг матрицы A , совершая линейные преобразования над строчками ⎛1 2 1 ⎞ ⎛1 2 1 ⎞ ⎛1 2 1 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ A = ⎜ 2 1 −3 ⎟ ⎜ 0 −3 −5 ⎟ ⎜ 0 −3 −5 ⎟ ⎜ 3 3 −2 ⎟ ⎜ 0 −3 −5 ⎟ ⎜ 0 0 0 ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
Очевидно, что r gA = 2 , т.е. ранг матрицы меньше числа неизвестных и значит система имеет бесконечное множество решений. Исходная система эквивалентна такой: x 1 + 2x 2 + x 3 = 0 ⎫ x 1 + 2x 2 = −x 3 ⎫ или ⎬ ⎬. −3x 2 − 5x 3 = 0 ⎭ 3x 2 = −5x 3 ⎭ Полагая, например, x 3 = 1, получим систему x 1 + 2x 2 = −1⎫ ⎬, 3x 2 = −5⎭ решая которую находим x 2 = −5 / 3, x 1 = −x 2 − 2x 2 = 7 / 3 . Т.е. получим ненулевое частное решение x 1 = 7 / 3, x 2 = −5 / 3, x 3 = 1 . Полагая x 3 = c ( c -любое действительное число) получим общее решение 7 5 x 1 = c ; x 2 = − c ; x 3 = c (c ∈ ) . 3 3
Пример 3. Решить неоднородную систему x 1 − 2x 2 + x 3 − 3x 4 + x 5 = 0 ⎫ 2x 1 + x 2 − 2x 3 + x 4 − x 5 = 2 ⎪⎪ ⎪ x 1 − x 2 + x 3 − x 4 + x 5 = 14 ⎬ 2x 1 − 3x 2 + 2x 3 − 4x 4 + 2x 5 = 14 ⎪ ⎪ 3x 1 − x 2 − x 3 − 2x 4 = 2 ⎪⎭
Решение. Обозначим через A и A r соответственно основную и расширенную матрицы системы
⎛1 ⎜ ⎜2 A = ⎜1 ⎜ ⎜2 ⎜3 ⎝
−2 1 1 −2 −1 1 −3 2 −1 −1
−3 1 ⎞ ⎛ 1 −2 1 ⎟ ⎜ 1 −1⎟ ⎜ 2 1 −2 r −1 1 ⎟ , A = ⎜ 1 − 1 1 ⎟ ⎜ −4 2 ⎟ ⎜ 2 −3 2 ⎜ 3 −1 − 1 −2 0 ⎟⎠ ⎝ 100
−3 1 0 ⎞ ⎟ 1 −1 2 ⎟ −1 1 11 ⎟ ⎟ −4 2 14 ⎟ −2 0 2 ⎟⎠
Сначала надо определить, имеет ли эта система решения и сколько. Для этого приведём расширенную матрицу A r и трапециевидной форме, совершая элементарные преобразования над строками
A
r
⎛1 ⎜ ⎜0 ⎜0 ⎜ ⎜0 ⎜0 ⎝
−2 1 0 0
1 0 −4 0
−3 2 −3 0
1 0 −3 0
0
0
0
0
0 ⎞ ⎟ 14 ⎟ − 6 8 ⎟ = A% r ⎟ 0 ⎟ 0 ⎟⎠
.
При этом матрица A перейдёт в A% . Очевидно, что r gA = r gA r = 3 , т.е. ранги матриц A и A r совпадают и меньше числа неизвестных. Значит система совместна и имеет бесчисленное множество решений. Решение неоднородной системы в этом случае может быть получено как сумма общего решения соответствующей однородной системы и какоголибо частного решения неоднородной. Чтобы найти решения однородной системы, запишем эквивалентную систему с матрицей A% : x 1 − 2x 2 + x 3 − 3x 4 + x 5 = 0 ⎫ ⎪ x 2 + 2x 4 = 0 ⎬ −4x 3 − 3x 4 − 3x 5 = 0 ⎪⎭ Пример 2.. Найти фундаментальную систему решений и общее решение данной однородной системы x 1 + 2x 2 + x 3 − x 4 = 0 ⎫ ⎬. 2x 1 + x 2 − 3x 3 + x 4 = 0 ⎭
Решение. Вычислим ранг матрицы A этой системы, приведя её к трапециевидной форме 1 −1⎞ ⎛ 1 2 1 −1⎞ ⎛1 2 A =⎜ ⎟ ⎜ ⎟. ⎝ 2 1 −3 1⎠ ⎝ 0 −3 −5 3 ⎠ Очевидно, что r gA = 2 . Данная система эквивалентна такой x 1 + 2x 2 + x 3 − x 4 = 0 ⎫ ⎬. − 3x 2 − 5x 3 + 3x 4 = 0 ⎭ Фундаментальную систему получим, если положить x 3 = 1, x 4 = 0, а потом x 3 = 0, x 4 = 1 . Для первого случая будем иметь x 1 + 2x 2 = −1⎫ ⎬, 3x 2 = −5⎭ решая которую, находим x 2 = −5 / 3, x 1 = 7 / 3. Т.е.. 101
сначала
⎛ 7 / 3⎞ ⎜ ⎟ 5/3⎟ . ⎜ X1= ⎜ 1 ⎟ ⎜ ⎟ ⎝ 0 ⎠
Для второго случая получим систему x 1 + 2x 2 = 1⎫ ⎬, x 2 = 1⎭
решая которую находим X 2 = ( −1 1 0 1) . Итак, фундаментальная система решений имеет вид T T X 1 = ( 7 / 3 −5 / 3 1 0 ) , X 2 = ( −1 1 0 1) . Общее решение X получаем, составляя линейную комбинацию фундаментальной системы: X = c1 ⋅ X 1 + c 2 ⋅ X 2 . Т.е. общее решение имеет вид T
⎛ 7/3 ⎞ ⎛ −1 ⎞ ⎜ ⎟ ⎜ ⎟ −5 / 3 ⎟ 1 ⎜ +c2 ⋅⎜ ⎟ X = c1 ⋅ ⎜ 1 ⎟ ⎜ 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎝ 0 ⎠ ⎝ 1 ⎠
или в координатной форме 7 ⎧ ⎪x 1 = 3 c 1 − c 2 ⎪ 5 ⎪ ⎨x 2 = − 3 c 1 + c 2 ⎪ ⎪x 3 = c 1 ⎪x = c ⎩ 4 2
(c 1 , c 2 ∈
).
За базисный минор возьмём минор, стоящий в левом углу матрицы A% , т.е. минор, составленный из коэффициентов перед неизвестными x 1 , x 2 и x 3 . Чтобы найти фундаментальную систему, надо перебрать всевозможные наборы свободных переменных x 4 и x 5 также, что в каждом наборе одна переменная равна 1, а остальные 0. Взяв x 4 = 1, x 5 = 0 из системы
x 1 − 2x 2 + x 3 = 3⎫ ⎪ x 2 = −2 ⎬ −4x 3 = 3⎪⎭ получим x 3 = −3 / 4, x 2 = −2, x 1 = −1 / 4 . 102
Аналогично, взяв x 4 = 0, x 5 = 1 , получим x 3 = −3 / 4, x 2 = 0, x 1 = −1 / 4 . То есть получим фундаментальную систему T T X 1 = ( −1 / 4 −2 −3 / 4 1 0 ) , X 2 = ( −1 / 4 0 −3 / 4 0 1) . Общее решение однородной системы имеет вид Y = c 1X 1 + c 2X 2 , где c 1 и c 2 - произвольные числа. Теперь найдём какое-либо решение неоднородной системы. Система, соответствующая матрице A r , имеет вид
x 1 − 2x 2 + x 3 − 3x 4 + x 5 =
0⎫ ⎪ = 1⎬ . x2 + 2x 4 −4x 3 − 3x 4 − 3x 5 = −68⎪⎭
и эквивалентна данной. Положим свободные переменные x 4 и x 5 равными нулю. Тогда x 3 = 17, x 2 = 14, x 1 = 11 , т.е. получили частное решение
z = (11 14 17 0 0 ) . Общее решение системы имеет вид X =Y + Z ,т.е. T
⎛ −1 / 4 ⎞ ⎛ − 1 / 4 ⎞ ⎛ 11 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 0 ⎟ ⎜ 14 ⎟ ⎜ −2 ⎟ ⎜ X = c 1 ⋅ ⎜ − 3 / 4 ⎟ + c 2 ⋅ ⎜ − 3 / 4 ⎟ + ⎜ 17 ⎟ . ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 1⎟ 0⎟ ⎜ 0⎟ ⎜ ⎜ ⎜ ⎜ 0 ⎟⎠ 1 ⎟⎠ ⎜⎝ 0 ⎟⎠ ⎝ ⎝
В координатной форме общее решение запишется так 1 1 x 1 = − c 1 − c 2 + 11 4 4 x 2 = −2c 1 + 14 , 3 3 x 3 = − c 1 − c 2 + 17 4 4 x 4 = c1 x5 =c2
где c 1 и c 2 - произвольные числа.
§ 6. Альтернатива Фредгольма для линейных систем Рассмотрим линейные системы m уравнений с n неизвестными 103
a 11x 1 + a 12x 2 + ... + a 1n x n = b1 ⎫ a 21x 1 + a 22x 2 + ... + a 2 n x n = b 2 ⎪⎪ ⎬ K K K K K⎪ a m 1x 1 + a m 2x 2 + ... + a m n x n = b m ⎪⎭
(1)
и a 21y 1 + a 22y 2 + ... + a m 1y m a 12y 1 + a 22y 2 + ... + a m 2y m K K K K a 1n y 1 + a 2 n y 2 + ... + a m n y m
= 0⎫ = 0 ⎪⎪ ⎬ K⎪ = 0 ⎭⎪
(2)
В матричном виде эти системы запишутся соответственно так: A ⋅ X = B и A T ⋅Y = 0 , т.е. матрица коэффициентов в системе (2) получается транспонированием матрицы коэффициентов системы (1). Важную связь между множествами решений этих систем устанавливает так называемая альтернатива Фредгольма. (Альтернатива – это ситуация, когда имеет место одно из двух утверждений. Альтернативами также называют и сами эти утверждения, от латинского alter - другой, один из двух). и Альтернативы Фредгольма. Для всяких систем A ⋅ X = B A ⋅Y = 0 справедливо одно из двух утверждений: 1. Система A ⋅ X = B имеет решение при любом B тогда и только тогда, когда система A T ⋅Y = 0 имеет только тривиальное (нулевое) решение Y =0. 2. Система A ⋅ X = B при некотором B несовместна и тогда система T A ⋅Y = 0 имеет нетривиальное (ненулевое) решение. T
Доказательство.
1. Пусть система (1), т.е. A ⋅ X = B , имеет решение при любом B (любом наборе b1 ,...,bm ). В этом случае r gA = m , так как иначе при некотором B r gA оказался бы меньше ранга расширенной матрицы и система (1) была бы несовместной в силу теоремы Кронекера-Капелли. Так как r gA T = r gA , то в этих условиях r gA T = m , то есть равен числу неизвестных в системе (2) и эта система имеет только нулевое (тривиальное) решение. 2. Пусть теперь система A ⋅ X = B при некотором B несовместна. Следовательно r gA < m , значит и r gA T < m , т.е. ранг матрицы системы (2) меньше числа неизвестных и эта система имеет ненулевое (нетривиальное) решение.
Замечание. Альтернативу Фредгольма можно сформулировать и для линейных операторов. 104
Пример 1. Дана система x + 2y + 3z = b1 ⎫ ⎬. 2x + 4y + 6z = b 2 ⎭ Является ли она совместной при любых значениях b1 и b 2 ?
Решение. Имеем ⎛1 2 3⎞ rg ⎜ ⎟ = 1. 2 4 6 ⎝ ⎠ ⎛1⎞ Если же к матрице приписать справа столбец ⎜ ⎟ , то у расширенной мат⎝0⎠ рицы ранг окажется равным 2. Согласно теореме Кронекера-Капелли система x + 2y + 3z = 1⎫ ⎬ 2x + 4y + 6z = 0 ⎭ несовместна. Следовательно ответ на поставленный вопрос отрицательный. В силу второй альтернативы система однородных уравнений y 1 + 2y 2 = 0 ⎫ ⎪ 2y 1 + 4y 2 = 0 ⎬ 3y 1 + 6y 2 = 0 ⎪⎭ должна иметь нетривиальное решение. Действительно. Таким решением является например y 1 = 2, y 2 = −1 . Пример 2. Является ли система совместной при любых b1 и b 2 ? x + 2y + 3z = b1 ⎫ ⎬ 3x + 4y + 6z = b 2 ⎭
Решение.
Ранг матрицы этой системы равен 2. Значит и ранг расширенной матрицы не может быть меньше двух (и не может быть больше, чем 2). Значит при любых b1 и b 2 ранг матрицы системы равен рангу расширенной матрицы и система совместна. Т.е. ответ на поставленный вопрос положителен. Пример 3. Установить, какая из альтернатив имеет место для системы x 1 + x 2 = b1 ⎫ ⎬. x 1 − x 2 = b2 ⎭
Решение.
1
1
= −2 ≠ 0 , то r gA = 2 . Значит и ранг 1 −1 расширенной матрицы равен 2. Т.е. система совместна при любых b1 и b 2 и имеет место первая альтернатива.
Так как detA =
105
Пример 4. Какая из альтернатив имеет место для системы x 1 + x 2 + x 3 = b1 ⎫ ⎬. 2x 1 + 2x 2 + 2x 3 = b 2 ⎭
Решение.
Так как коэффициенты при неизвестных пропорциональны, то r gA = 1 . При b1 = 1 и b 2 = 0 ранг расширенной матрицы будет равен 2, т.е. система несовместна. Имеет место вторая альтернатива.
§ 7. Неравенства первой степени с двумя и тремя переменными. Системы неравенств 1. Линейное неравенство первой степени с двумя переменными
y
y
S
N
N
M
M (x ,y )
M0
x
M (x ,y ) I M 0 (x 0 ,y 0 )
II Рис. 4.7.2
Рис. 4.7.1
x
Рассмотрим на плоскости xO y прямую линию l , проходящую через точку M 0 (x 0 , y 0 ) и параллельную направляющему вектору S(m , n ) uuuuuuur (рис.4.7.1). Очевидно, что векторы M 0M и S коллинеарны, следовательно, их координаты пропорциональны, т.е. x −x0 y −y0 . = m n Очевидно, что это есть ни что иное, как каноническое уравнение прямой l , из которого следует: nx − m y − nx 0 + m y 0 = 0 обозначим n = A , −m = B , −nx 0 + m y 0 = c , тогда уравнение прямой l имеет вид: A x + B y +C = 0 . Напомним, что уравнение прямой, записанное в таком виде, называется общим уравнением прямой l . Введём в рассмотрение вектор N(A , B ) . Очевидно, что N ⋅ S = 0 , т.е. вектор N является нормалью к прямой l . (1) Рассмотрим теперь строгое неравенство A x + B y + C > 0 Напомним, что решением любого неравенства с двумя переменными f (x , y ) > 0 называется упорядоченная пара чисел (x , y ) , удовлетворяющая этому неравенству; решить неравенство – значит найти множество всех его решений. Установим геометрический смысл неравенства (1). Для этого рас106
смотрим уравнение A x + B y + C = 0 . На плоскости xO y прямая l , имеющая уравнение A x + B y + C = 0 , разбивает плоскость на две полуплоскости I и II (рис.4.7.2). Покажем, что в каждой из этих плоскостей трёхчлен A x + B y + C имеем постоянный знак, т.е. в одной из них выполняется неравенство A x + B y + C > 0 , а в другой A x + B y + C < 0 (на самой прямой l трёхчлен равен нулю). Принимая во внимание, что A x 0 + B y 0 + C = 0 , можем написать: A x + B y + C = A x + B y + C − (A x 0 + B y 0 + C ) = uuuuuuur = A (x − x 0 ) + B (y − y 0 ) = N ⋅ M o M , где M (x , y ) - точка, лежащая в полуплоскости I или II. Очевидно, что uuuuuuur uuuuuuur uuuuuuur N ⋅ M 0M = M 0M ⋅ прN M 0M . Если предположить, что вектор нормали равен N(A , B ) , то очевидно, что uuuuuuur прN M 0M имеет противоположные знаки, если точка M (x , y ) лежит в полуплоскости I или II .
y
y l
I
l I
2
−2
2
−2
x
x II
II
Рис. 4.7.4
Рис.4.7.3
Пример 1. Решить неравенство x − y + 2 > 0 . Решение. Прежде всего нарисуем прямую l , имеющую уравнение
x − y + 2 = 0 . Она разбивает плоскость на две полуплоскости I и II (рис.4.7.3). Возьмём точку O (0, 0) - начало координат (не лежит в полуплоскости I ) и подставим координаты этой точки в левую часть уравнения прямой l . Получим x −y + 2
x =0 y =0
= 2 > 0,
т.е. координаты точки O (0, 0) удовлетворяют данному неравенству.
107
Замечание: Нестрогое неравенство x − y + 2 ≥ 0 имеет решение, состоящее из множества точек, лежащих правее и ниже прямой l , к которому следует добавить точки, лежащие на прямой l (рис.4.7.4).
2. Система линейных неравенств первой степени с двумя неизвестными. Рассмотрим систему неравенств: A 1x + B 1y + C 1 > 0 ⎫ A 2x + B 2y + C 2 > 0 ⎪⎪ ⎬ K ⎪ A n x + B n y + C n > 0 ⎭⎪
(2)
Решением такой системы неравенств называется множество упорядоченных пар чисел (x , y ) , удовлетворяющих каждому из неравенств системы (2). Очевидно, что геометрически множество решений системы (2) состоит из всех точек плоскости xO y , координаты которых удовлетворяют каждому неравенству системы. Пример 2. Построить множество решений системы: x −y + 2≥ 0 ⎫ x + y − 6 ≤ 0 ⎪⎪ ⎬ x + 2y − 7 ≥ 0 ⎪ y ≥2 ⎭⎪
Решение. Строим прямые x − y + 2 = 0 , x + y − 6 = 0 , x + 2y − 7 = 0 , y = 2 . Множеством решений каждого неравенства системы является одна из полуплоскостей, на которые разбивает плоскость соответствующая прямая. Множеством решений системы является их общая часть, представляющая собою четырёхугольник A B C D , изображенный на рис.4.7.5. При этом точки, лежащие на сторонах четырехугольника, в это множество включаются.
6 5 4 3 2 1 −2 −1
y A
D B C
1
2 3
y=2
x 4
5 6
Рис.4.7.5 108
ГЛАВА V. ЛИНЕЙНЫЕ ПРОСТРАНСТВА И ОПЕРАТОРЫ. §1. Линейное пространство. Базис. Размерность. Подпространство Прежде чем дать определение линейного пространства, заметим, что существуют множества, элементы которых, независимо от их конкретной природы, будь то векторы в общепринятом смысле, матрицы, функции и т.д., можно складывать и умножать на число по одинаковым правилам, причём эти действия обладают одинаковыми свойствами. Это обстоятельство и позволяет ввести в рассмотрение абстрактное множество, называемое линейным пространством некоторых элементов, конкретная природа которых не играет роли с точки зрения определения линейного пространства. Заметим, что элементы линейного пространства также точками ur r называют ur или векторами и обозначают соответственно a , b , x или a , b , x , выделяя их в печати, как правило, жирным шрифтом. 1. Определение линейного пространства
Определение. Множество Λ элементов x , y , …, z называется линейным пространством, если: 1) Для любых двух элементов x ∈ Λ и y ∈Λ определена операция сложения этих элементов, т.е. дано правило нахождения элемента линейного пространства Λ , называемого их суммой и обозначаемого x + y ; 2) Для любого элемента x ∈ Λ и любого числа α - вещественного или комплексного – определена операция умножения элемента x на число α , т.е. дано правило нахождения элемента линейного пространства Λ, называемого произведением элемента x на число α и обозначаемого α ⋅ x ; 3)Определено равенство элементов из Λ , обозначаемое знаком = ; 4)Операции сложения и умножения на число удовлетворяют условиям: a) x + y = y + x , т.е. сложение коммутативно; б) (x + y) + z = x + (y + z) , т.е. сложение ассоциативно; в) α ( β x) = (αβ )x , т.е. умножение на число ассоциативно; г) (α + β ) ⋅ x = α ⋅ x + β ⋅ x , т.е. умножение дистрибутивно по отношению к сложению чисел; д) α (x + y) = α ⋅ x + α ⋅ y , т.е. умножение на число дистрибутивно по отношению к сложению элементов из Λ;
109
е) Существует элемент, называемый нулевым и такой, что для любого элемента x ∈ Λ, x + 0 = x ; имеет место равенство ж) Для любого элемента x ∈ Λ x ⋅1 = 1 ⋅ x = x . з) Для любого элемента x существует элемент − x , называемый противоположным элементу x и такой, что x + ( − x) = 0 . Заметим, что если произведение α x определено только для вещественных чисел, то пространство Λ называется вещественным линейным пространством; если же α - комплексное число, то линейное пространство Λ называется комплексным линейным пространством. Если известна природа элементов, входящих в линейное пространство, то линейное пространство называется конкретным.
2. Свойства линейного пространства. 1. В каждом линейном пространстве существует единственный элемент 0 . 2. В каждом линейном пространстве любому элементу соответствует единственный противоположный элемент. 3. Для всякого элемента x ∈ Λ справедливо равенство 0 ⋅ x = 0 . Произведение любого числа α на нулевой элемент линейного пространства равно нулевому элементу, т.е. α ⋅ 0 = 0 . 4. Для каждого элемента x ∈ Λ противоположный элемент равен произведению этого элемента на число −1 , т.е. x = ( −1) ⋅ x
3. Базис линейного пространства и координаты вектора. Размерность линейного пространства Пусть векторы (элементы) a1 , a 2 , …, an принадлежат линейному пространству Λ и пусть c 1 , c 2 , …, c n - какие-то произвольные числа. Выражение c 1a1 + c 2a 2 + ... + c n an называется линейной комбинацией векторов (элементов) a1 , a 2 , …, an , а числа c 1 , c 2 , …, c n - коэффициентами этой линейной комбинации. Определение 1. Векторы (элементы) a1 , a 2 , …, an называются линейно зависимыми, если c 1a1 + c 2a 2 + ... + c n an = 0 , (1) при условии, что не все коэффициенты этой линейной комбинации равны нулю; если же соотношение (1) выполняется лишь при условии, что c 1 = c 2 = ... = c n = 0 , то векторы называются линейно независимыми. 110
Нетрудно показать, что если векторы a1 , a 2 , …, an линейно зависимы, то хотя бы один из них можно представить в виде линейной комбинации остальных и наоборот; кроме того, если векторы a1 , a 2 , …, an линейно независимы, то ни один из них нельзя представить в виде линейной комбинации остальных и наоборот. Определение 2. Любая совокупность n линейно независимых вектоr r r ров e 1 , e 2 ,…, e n линейного пространства Λ называется базисом этого пространства, если всякий вектор x ∈ Λ можно представить в виде линейной комбинации векторов e1 , e 2 ,…, en т.е. x = x 1e1 + x 2e 2 + ... + x n en . ur Такое представление вектора x называется разложением его по данному базису. Числа x 1 , x 2 ,…, x n , которые являются коэффициентами в разложении вектора по данному базису, называются координатами вектора в этом базисе и записываются так: x = (x 1 , x 2 ,..., x n ) или так [x 1 , x 2 ,..., x n ] , или в виде матрицы-столбца: ⎛ x1 ⎜ ⎜x2 ⎜ M ⎜⎜ ⎝xn
⎞ ⎟ ⎟. ⎟ ⎟⎟ ⎠
Теорема. Координаты вектора x ∈ Λ относительно некоторого базиса e1 , e2 ,…, en этого линейного пространства определяются единственным образом. ur Доказательство. Пусть имеет место такое разложение вектора x ∈ Λ относительно некоторого базиса этого линейного пространства: x = x 1e1 + x 2e 2 + ... + x n en (2) и пусть имеет место другое разложение этого же вектора относительно этого же базиса: (3) x = x ′e + x ′e + ... + x ′e . 1 1
2
2
n
n
Вычитая почленно (3) из (2), получим: (4) (x 1 − x 1′ ) ⋅ e1 + (x 2 − x 2′ ) ⋅ e 2 + ... + (x n − x n ′ ) ⋅ en = 0 Так как базисные векторы e1 , e 2 ,…, en линейно независимы, то это значит, что коэффициенты линейной комбинации могут быть только нулями, значит x = x ′ , x = x ′ , …, x = x ′ . Теорема доказана. 1
1
2
2
n
n
В качестве примера рассмотрим пространство многочленов P n (x ) степени ≤ n . В качестве базиса можно взять одночлены 1, x , x 2 ,..., x n . Действительно, они линейно независимы, и любой многочлен P n (x ) можно представить в виде: P n (x ) = a 0 + a 1x + a 2x 2 + ... + a n x n . 111
В силу определения коэффициенты a 0 , a 1 , …, a n являются координатами многочлена P n (x ) в выбранном базисе, т.е. можно записать: ⎛a 0 ⎞ ⎜ ⎟ ⎜ a1 ⎟ P n (x ) = (a 0 ,a 1 ,a 2 ,...,a n ) или P n (x ) = ⎜ ... ⎟ . ⎜⎜ ⎟⎟ ⎝a n ⎠ Можно доказать, что если линейное пространство Λ имеет базис, то он не единственный. Однако же различные базисы данного линейного пространства состоят из одного и того же числа n векторов, которое и определяет размерность линейного пространства.
Определение 3. Говорят, что линейное пространство имеет размерность равную n , если n - если число базисных векторов, пространство при этом обозначают Λ n. Если Λ1 n и Λ2 n - два линейных пространства (оба вещественных или оба комплексных) и если x1 ∈Λ1 n и x 2 ∈Λ2 n, то между ними можно установить взаимно однозначное соответствие, точно так же как и между произведениями α x1 и α x 2 и суммами x1 + y1 и x 2 + y 2 , где y1 ∈Λ1 n и y 2 ∈Λ2 n. Такое свойство линейных пространств называется изоморфизмом, а сами линейные пространства называются изоморфными. Введённое ранее линейное пространство с базисом i , j , k - пространство обычных векторов – обозначают 3 и называют его геометрическим пространством, или координатным пространством. Понятие геометрического (координатного) пространства можно обобщить в смысле увеличения его размерности, т.е. можно рассматривать геометрическое (координатное) пространство n . В заключение заметим, что если базис состоит из конечного числа элементов, то такое линейное пространство называется конечномерным, если же существует бесконечно много линейно независимых векторов, то такое линейное пространство называется бесконечномерным. Примером бесконечномерного пространства может служить пространство всевозможных функций, непрерывных на данном промежутке, линейные операции в котором определяются обычным образом. 4. Подпространство линейного пространства.
112
Определение. Подпространством Λ1 линейного пространства Λn на-
зывается множество элементов из Λn, которое само является пространством, т.е. из x ∈ Λ1, y ∈Λ1 => α x + β y ∈Λ1.
Свойства подпространства линейного пространства Λn 1. Размерность любого подпространства пространства Λn не превосходит n . Очевидно, что само линейное пространство Λn является пространством наибольшей размерности, 2. Если Λm - подпространство линейного пространства Λn (m
§2 Евклидово пространство Εn 1. Определение евклидова пространства Определение 1. Вещественное линейное пространство называется евклидовым, если в нём определена операция, ставящая в соответствие любым двум векторам x и y из этого пространства число, называемое скалярным произведением векторов x и y и обозначаемое (x,y) , для которого выполнены условия: 1. (x, y) = (y, x) ; 2. (x + y,z) = (x, z) + (y,z) , где z - любой вектор, принадлежащий данному линейному пространству; 3. (α x,y) = α (x, y) , где α - любое число; 4. (x,x) ≥ 0 , причём (x,x) = 0 Ù x = 0 . Например, в линейном пространстве одностолбцовых матриц скалярное произведение векторов ⎛ x1 ⎞ ⎛ y1 ⎞ ⎜ ⎟ ⎜ ⎟ x2 ⎟ y ⎜ x= и y =⎜ 2 ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝xn ⎠ ⎝y n ⎠ можно определить формулой 113
T
⎛ x1 ⎞ ⎜ ⎟ x (x,y) = ⎜ 2 ⎟ ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎝ xn ⎠
⎛ y1 ⎞ ⎛ y1 ⎞ ⎜ ⎟ ⎜ ⎟ y y 2 ⋅ ⎜ ⎟ = (x1 x 2 ... xn ) ⋅ ⎜ 2 ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝y n ⎠ ⎝y n ⎠
Евклидово пространство размерности n обозначают Εn. Заметим, что существуют как конечномерные, так и бесконечномерные евклидовы пространства. Определение 2. Длиной (модулем) вектора x в евклидовом пространстве Εn называют (x,x) и обозначают её так: x = (x,x) . Очевидно, что у всякого вектора евклидова пространства существует длина, причём у нулевого вектора она равна нулю. 1 Далее, умножая ненулевой вектор x на число α = , мы получим векx x тор x0 = , длина которого равна единице. Эта операция называется x нормированием вектора x . Например, в пространстве одностолбцовых матриц длину вектора T x = (x 1 x 2 ... x n ) можно определить формулой: 2
2
2
x = x 1 + x 2 + ... + x n .
2. Неравенство Коши-Буняковского 1 Пусть x ∈ Εn и y ∈Εn – любые два вектора. Докажем, что для них имеет место неравенство: (x,y) ≤ x ⋅ y (Неравенство Коши-Буняковского)
Доказательство. Пусть α - любое вещественное число. Очевидно,
что (α x − y,α x − y) ≥ 0 . С другой стороны, в силу свойств скалярного произведения можем написать
(α x − y,α x − y) = (α x,α x − y) − (y,α x − y) = (α x,α x) − (α x,y) − (y,α x) + (y,y) =
α 2 (x,x) − 2α (x,y) + (y,y). Итак, α 2 (x,x) − 2α (x,y) + (y,y) ≥ 0 .
1
Коши О.Л. (1789-1857) – французский математик. Буняковский В.Я (1804 – 1889) – русский математик.
114
Дискриминант этого квадратного трёхчлена не может быть положительным, т.е. (x,y)2 − (x,x) ⋅ (y,y) ≤ 0 , откуда вытекает: (x, y)2 ≤ (x, x) ⋅ (y, y) => (x,y) ≤ x ⋅ y . Неравенство доказано.
3. Неравенство треугольника Пусть x и y - произвольные векторы евклидова пространства Εn, т.е. x ∈ Εn и y ∈Ε n. Докажем, что x + y ≤ x + y . (Неравенство треугольника). 2
Доказательство. Очевидно, что (x + y,x + y) = x + y . 2
2
С другой стороны, (x + y,x + y) = (x, x) + 2(x, y) + (y, y) = x + 2(x,y) + y . Принимая во внимание неравенство Коши-Буняковского, получим 2 2 2 x + y ≤ x + 2 x ⋅ y + y = ( x + y )2 => x + y ≤ x + y . Неравенство треугольника доказано.
4. Норма евклидова пространства Определение 1. Линейное пространство Λ называется метрическим, если любым двум элементам этого пространства x и y поставлено в соответствие неотрицательное число ρ (x,y) , называемое расстоянием между x и y , ( ρ (x,y) ≥ 0) , причём выполняются условия (аксиомы): 1) ρ (x, y) = 0 Ù x = y 2) ρ (x, y) = ρ (y, x) (симметрия); 3) для любых трёх векторов x , y и z этого пространства ρ (x,y) ≤ ρ (x,z) + ρ (z,y) . Замечание. Элементы метрического пространства обычно называют точками. Очевидно, что евклидово пространство Εn – метрическое, причём в качестве расстояния между векторами x ∈ Εn и y ∈Εn можно взять x − y . Так, например, в пространстве одностолбцовых матриц, где ⎛ y1 ⎞ ⎛ x1 ⎞ ⎜ ⎟ ⎜ ⎟ y x2 ⎟ ⎜ x= , y = ⎜ 2 ⎟, ⎜ ... ⎟ ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝y n ⎠ ⎝xn ⎠ получим 115
x − y = (x 1 − y 1 x 2 − y 2
... x n − y n ) , T
следовательно,
ρ (x , y ) = (x 1 − y 1 )2 + (x 2 − y 2 )2 + ... + (x n − y n )2 Определение 2. Линейное пространство Λ называется нормированным, если каждому вектору x из этого пространства поставлено в соответствие неотрицательное число, называемое его нормой x . При этом выполняются аксиомы: 1) x ≥ 0 ∀x ∈; x = 0 Ù x = 0 ; 2) λ x = λ ⋅ x для ∀x ∈Λ и любого числа λ ; 3) x + y ≤ x + y для ∀x ∈Λ и ∀y ∈ Λ (неравенство треугольника). Нетрудно видеть, что нормированное пространство является метрическим пространством. В самом деле, в качестве расстояния между x и y можно взять x − y . В евклидовом пространстве Εn в качестве нормы любого вектора x ∈ Εn принимается его длина, т.е. x = x . Нетрудно убедиться, что все аксиомы нормы выполняются для выбранной таким образом нормы евклидова пространства Εn. Итак, евклидово пространство Εn является метрическим пространством и более того, евклидово пространство Εn является нормированным пространством.
5. Угол между векторами Заметим, что из неравенства Коши-Буняковского следует, что (x,y) ≤1 ( x ≠ 0, y ≠ 0 ) x⋅y
Определение 1. Углом между ненулевыми векторами a и b евкли-
дова пространства Εn называют число ϕ ∈ [0,π ] , для которого (a,b) cos ϕ = . a⋅b
Определение 2. Векторы x и y евклидова пространства Ε называются ортогональными, если для них выполняется равенство (x,y) = 0 . Если x и y - ненулевые, то из определения следует, что угол между ни-
π
. Заметим, что нулевой вектор по определению считается 2 ортогональным любому вектору. ми равен
116
Пример. В геометрическом (координатном) пространстве Ρ3, которое является частным случаем евклидова пространства, орты i , j и k взаимно ортогональны.
6. Ортонормированный базис
Определение 1. Базис e1 ,e2 ,...,en евклидова пространства Εn называется ортогональным, если векторы этого базиса попарно ортогональны, т.е. если (ei ,e j ) = 0 (i ≠ j , i = 1, 2,..., n ; j = 1, 2,...,n )
Определение 2. Если все векторы ортогонального базиса e1 ,e2 ,...,en единичны, т.е. ei = 1 (i = 1, 2,..., n ) , то базис называется ортонормиро-
ванным, т.е. для ортонормированного базиса
⎧0, i ≠ j (ei ,e j ) = ⎨ (i = 1, 2,..., n ; j = 1, 2,..., n ) . , i = j 1 ⎩
Теорема. (о построении ортонормированного базиса)
Во всяком евклидовом пространстве Εn существуют ортонормированные базисы.
Доказательство. Докажем теорему для случая n = 3 . Пусть E1 , E2 , E3 - некоторый произвольный базис евклидова пространства 0
0
0
Ε3. Построим какой-нибудь ортонормированный базис e1 , e 2 ,e3 в этом пространстве. Положим e1 = E1 , e 2 = E2 + α e1 , где α - некоторое вещественное число, которое выберем таким образом, чтобы было (e1 ,e 2 ) = 0 , тогда получим (E , E ) (E1 , E2 + α E1 ) = (E1 , E2 ) + α (E1 , E2 ) = 0 => α = − 1 2 , (E1 , E1 ) причём очевидно, что α = 0 , если E1 и E2 ортогональны, т.е. в этом случае e 2 = E2 , а E2 ≠ 0 , т.к. это базисный вектор. Далее, определим вектор e3 равенством e3 = E3 + β1e1 + β 2e 2 , причём числа β1 и β 2 определяется из условия ортогональности вектора e3 с векторами e1 и e 2 , т.е. (e3 ,e1 ) = 0 ⎫ (e1 , E3 ) + β1 (e1 ,e1 ) + β 2 (e1 ,e 2 ) = 0 ⎫ ⎬ => ⎬. (e3 ,e 2 ) = 0 ⎭ (e 2 , E3 ) + β1 (e1 ,e 2 ) + β 2 (e 2 ,e 2 ) = 0 ⎭ Учитывая, что (e1 ,e 2 ) = 0 , получим 117
(e1 , E3 ) (e , E ) ; β2 = − 2 3 . (e1 ,e1 ) (e 2 ,e 2 ) Очевидно, что β1 = β 2 = 0 , если e1 и e 2 ортогональны с вектором E3 , т.е. в этом случае следует взять e3 = E3 . Вектор E3 ≠ 0 , т.к. E1 , E2 и E3 линейно независимы, следовательно e3 ≠ 0 . Кроме того, из приведённого рассуждения следует, что e3 нельзя представить в виде линейной комбинации векторов e1 и e 2 , следовательно векторы e1 ,e 2 ,e3 линейно независимы и попарно ортогональны, следовательно, их можно взять в качестве базиса евклидова пространства Ε3. Остаётся только пронормировать построенный базис, для чего достаточно каждый из построенных векторов разделить на его длину. Тогда получим e e e 0 0 0 e1 = 1 ; e 2 = 2 ; e3 = 3 . e1 e2 e3
β1 = −
0
0
0
Итак, мы построили базис e1 ,e 2 ,e3 - ортонормированный базис. Теорема доказана. Применённый способ построения ортонормированного базиса из произвольного базиса называется процессом ортогонализации. Заметим, что в процессе доказательства теоремы мы установили, что попарно ортогональ0 0 0 ные векторы линейно независимы. Кроме того, если e1 ,e 2 ,..., en - ортонормированный базис в Εn, тогда для любого вектора x∈ Εn имеет место единственное разложение 0 0 0 x = x 1e1 + x 2e 2 + ... + x n en , (1) где x 1 , x 2 ,..., x n - координаты вектора x в этом ортонормированном базисе. Так как ⎧ 0, i ≠ j 0 0 (ei ,e j ) = ⎨ (i = 1, 2,..., n ; j = 1, 2,..., n ) , 1 i = j , ⎩ 0
то умножив скалярно равенство (1) на ei , получим 0
x i = (xi ,ei ) (i = 1, 2,..., n ) . В дальнейшем мы будем рассматривать только ортонормированные базисы, а потому для простоты их записи нолики сверху у базисных векторов 0 ei мы будем опускать.
§3. Линейные операторы и действия над ними. Матрица линейного оператора 1. Линейный оператор, матрица линейного оператора 118
Определение 1. Если задан закон, который каждому вектору x∈Λ ставит в соответствие вектор y ∈Λ, то говорят, что в линейном пространстве Λ задан оператор A , при этом пишут: (1) y =Ax. Определение 2. Оператор A называется линейным, если для любых x1 ∈Λ и x 2 ∈ Λ и произвольного числа α выполняются условия: 1) A (x1 + x 2 ) = A x1 + A x 2 , 2) A (α x) = α A x . Рассмотрим теперь в евклидовом пространстве Εn базис e1 ,e2 ,...,en , и пусть в этом пространстве определён линейный оператор A : y = A x . Разложим векторы x и y по базису e1 ,e2 ,...,en :
x = x 1e1 + x 2e 2 + ... + x n en y = y 1e1 + y 2e 2 + ... + y n en
(2) (3)
В силу линейности оператора A можно написать A x = x 1A e1 + x 2A e2 + ... + x n A en . (4) n Заметим, что каждый вектор A ei ∈Ε (i = 1, 2,..., n ) , следовательно, его также можно разложить по базису e1 ,e2 ,...,en , т.е. A ei = a 1i e1 + a 2i e2 + ... + a ni en (i = 1, 2,...,n ) . А тогда y = A x = x 1 (a 11e 1 + a 21e 2 + ... + a n 1e n ) + + x 2 (a 12 e1 + a 22 e 2 + ... + a n 2 e n ) + +.
.
.
.
+
.
+ x n (a 1n e 1 + a 2 n e 2 + ... + a n n e n ) = = (a 11x 1 + a 12x 2 + ... + a 1n ) ⋅ e 1 + + x 2 (a 21x 1 + a 22x 2 + ... + a n 2 ) ⋅ e 2 +
(5)
. . . +. . + + x n (a n 1x 1 + a n 2x 2 + ... + a n n ) ⋅ e n .
В силу единственности разложения по данному базису мы можем приравнять коэффициенты при базисных векторах в правых частях формул (3) и (5); тогда получим: y 1 = a 11x 1 + a 12x 2 + ... + a 1n x n ,
y 2 = a 21x 1 + a 22x 2 + ... + a 2n x n , .
.
.
.
.
y n = a n 1x 1 + a n 2x 2 + ... + a nn x n .
119
(6)
Итак, линейному оператору A в данном базисе соответствует квадратная матрица ⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ (7) a 21 a 22 ... a 21 ⎟ ⎜ A= , ⎜ . . ... . ⎟ ⎜⎜ a ⎟⎟ ⎝ n 1 a n 2 ... a nn ⎠ которая называется матрицей линейного оператора A , i -й столбец которой состоит из координат вектора A ei (i = 1, 2,...,n ) относительно данного базиса. Отметим, что матрица A оператора A зависит от выбора базиса e1 ,e 2 ,...,en пространства Λn. Введём теперь в рассмотрение одностолбцовые матрицы T T X = (x 1 x 2 ... x n ) и Y = (y 1 y 2 ... y n ) , n n соответствующие векторам x∈ Ε и y ∈Ε . Тогда соотношения (6) в матричном виде можно записать так: (8)
Y = A ⋅X
Итак, мы показали, что всякому линейному оператору A в евклидовом пространстве Εn соответствует матрица A ; можно доказать и обратное утверждение: всякую квадратную матрицу A можно рассматривать как матрицу некоторого линейного оператора A в данном базисе e1 ,e 2 ,...,en . Представляют интерес невырожденные линейные операторы, т.е. такие операторы, матрицы которых имеют обратную A −1 , т.е. также являются невырожденными. В этом случае каждому вектору y (образу), определённому соотношением (1), отвечает единственный вектор x (прообраз) и при этом имеет место матричное равенство: X = A −1 ⋅Y .
2. Примеры линейных операторов e2
M 2 (x 2 , y 2 ) r2
α
r1
ϕ e1
O
Рис.5.3.1 120
M 1 (x 1 , y 1 )
1. Возьмём в пространстве Ε2 ортонормированный базис e1 ,e 2 и рассмотрим в этом базисе вектор r1 = x 1e1 + y 1e 2 (или точку M 1 (x 1 , y 1 ) ) (рис.5.4.1). Повернём вектор r1 вокруг начала координат на угол α против часовой стрелки. Он займёт положение r2 = x 2e1 + y 2e 2 , а точка M 1 перейдёт в точку M 2 (x 2 , y 2 ) , т.е. r2 = A r1 , где A - оператор поворота против часовой стрелки на угол α относительно точки 0. Очевидны равенства x 2 = r ⋅ cos(ϕ + α ) = x 1 cosα − y 1 sinα , y 2 = r ⋅ sin(ϕ + α ) = x 1 sin α + y 1 cosα . Или в матричном виде ⎛ x 2 ⎞ ⎛ cosα − sin α ⎞ ⎛ x 1 ⎞ ⎜ ⎟=⎜ ⎟ ⋅ ⎜y ⎟ y α α sin cos ⎠ ⎝ 1⎠ ⎝ 2⎠ ⎝ Здесь матрица ⎛ cosα − sin α ⎞ A =⎜ ⎟ ⎝ sin α cosα ⎠ является матрицей поворота. Тождественным называется преобразование, определяемое соотношением E x = x, ∀x ∈Εn. В частности E ei = ei (i = 1, 2,..., n ) . Матрица тождественного линейного оператора в любом базисе имеет вид ⎛ 1 0 0 ... 0 ⎞ ⎜ ⎟ ⎜ 0 1 0 ... 0 ⎟ E = ⎜ 0 0 1 ... 0 ⎟ ⎜ ⎟ ⎜ . . . ... . ⎟ ⎜ 0 0 0 ... 1 ⎟ ⎝ ⎠
3. Действия над операторами 1. Сложение линейных операторов. Пусть x∈Εn, A и B - два линейных оператора в этом пространстве. Определение 1. Суммой линейных операторов A и B в Εn называ-
ется оператор C , определяемый равенством Cx = A x + B x , где x - любой вектор из Εn . Очевидно, что сумма линейных операторов является линейным оператором, причём его матрица C = A + B , где A и B - матрицы линейных операторов A и B .
121
2. Умножение линейного оператора на число. Пусть x∈Εn , линейный оператор A определён в Εn , α - некоторое число. Определение 2. Произведением линейного оператора A на число α
называется оператор α A , определяемый равенством n (α A ) ⋅ x = α (A x), ∀x ∈ Ε . Очевидно, что α A является линейным оператором, а матрица этого линейного оператора получается из матрицы A умножением её на число α , т.е. она равна α ⋅ A . 3. Умножение линейных операторов. Пусть x∈Εn, y ∈Εn, z ∈Εn и кроме того в Εn определены линейные операторы A и B таким образом, что y = B x, z = A y . Определение 3. Произведением A ⋅ B линейных операторов A и B называется оператор C , определяемый соотношением Cx = A (Bxx) . Таким образом, перемножение линейных операторов состоит в последовательном их применении по отношению к вектору x . Рассмотрим матрицы – столбцы:
⎛ x1 ⎞ ⎛ y1 ⎞ ⎛ z1 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ x y z 2 2 X = ⎜ ⎟; Y = ⎜ ⎟ ; Z = ⎜ 2 ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎝xn ⎠ ⎝y n ⎠ ⎝z n ⎠ и обозначим через A , B и C - соответственно матрицы линейных операторов A , B и C . Тогда очевидно, что Z = A ⋅ (B ⋅ X ) = (A ⋅ B ) ⋅ X = C ⋅ X , таким образом, C = A ⋅ B , т.е. матрица произведения линейных операторов также является линейным оператором. Действительно, a) (A ⋅ B )(x + y) = A (B (x + y)) = A (B x + B y) = A (B x) + A (B y) = = (A ⋅ B ) ⋅ x + (A ⋅ B ) ⋅ y б) (A ⋅ B )(α x) = A (B (α x)) = A (α B x) = α A (B x) = α (A ⋅ B )x Свойства умножения линейных операторов вытекают из свойств умножения матриц.
§4. Замена базиса. 1. Матрица преобразования координат. Возьмём в пространстве Εn два различных базиса e1 ,e 2 ,...,en E1 , E2 ,..., En . 122
и
Рассуждение проведём для случая n = 3 . Очевидно, что один и тот же вектор x относительно различных базисов имеет различные координаты. Действительно, ограничиваясь случаем n = 3 , можем написать: x = x 1e1 + x 2e 2 + x 3e3 (1) (2) x = x ′E + x ′E + x ′E 1
1
2
2
3
3
Любой вектор второго базиса можем разложить по первому базису, т.е. E1 = τ 11e1 + τ 21e 2 + τ 31e3 E2 = τ 12e1 + τ 22e 2 + τ 32e3 (3) E3 = τ 13e1 + τ 23e 2 + τ 33e3 Подставим (3) в (2): x = x1′ (τ11e1 + τ 21e2 + τ 31e3 ) + x 2′(τ12e1 + τ 22e2 + τ 32e3 ) + x 3′(τ13e1 + τ 23e2 + τ 33e3 ) = (4) ′ ′ ′ ′ ′ ′ ′ ′ ′ = (τ11x 1 + τ12x 2 + τ13x 3 )e1 + (τ 21x 1 + τ 22x 2 + τ 23x 3 )e2 + (τ 31x 1 + τ 32x 2 + τ 33x 3 )e3 В силу единственности разложения по данному базису мы должны приравнять коэффициенты при векторах e1 , e 2 , e3 в правых частях формул (1) и (4). Тогда получим: x =τ x ′ +τ x ′ +τ x ′ 1
11 1
12 2
13 3
x 2 = τ 21x 1′ + τ 22x 2′ + τ 23x 3′
(5)
x 3 = τ 31x 1′ + τ 32x 2′ + τ 33x 3′ Введём в рассмотрение матрицы ⎛x ′ ⎞ ⎛ x1 ⎞ ⎛ τ11 τ12 ... τ1n ⎞ ⎜ 1 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜x ′ ⎟ τ τ ... τ x n 2 21 22 2 ⎟. X = ⎜ ⎟; X ′ = ⎜ 2 ⎟; T = ⎜ ⎜ ... ⎟ ⎜ ⎟ . . ... . ⎜ ... ⎟ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜ ⎟ ⎝xn ⎠ ⎝τ n 1 τ n 2 ... τ nn ⎠ ⎜x ′ ⎟ ⎝ n ⎠ Тогда соотношения (5) можно записать в матричном виде X =T ⋅ X ′ . Матрица T называется матрицей преобразование координат при переходе от старого базиса к новому, т.е. от базиса e1 ,e2 ,...,en к базису E1 , E2 ,..., En . Причём, столбцами матрицы преобразования координат являются координаты вектора нового базиса E1 , E2 ,..., En относительно старого базиса e1 ,e2 ,...,en . Если преобразования координат состоит в повороте координатных осей, то матрица T называется матрицей поворота. Пример. При повороте координатных осей xOy на угол α мы имели (рис.5.4.1) 123
x = x 1 cosα − y 1 sinα ⎫ ⎬ y = x 1 sinα + y 1 cosα ⎭
Здесь ⎛ cosα T =⎜ ⎝ sinα y y1
− sinα ⎞ ⎟ - матрица поворота. cosα ⎠
M (x , y ) x1
α O
x
Рис.5.4.1
2. Ортогональный оператор и замена базиса Определение 1. Оператор A , матрица которого относительно дан-
ного ортонормированного базиса e1 ,e 2 ,...,en евклидова пространства Εn ортогональна, называется ортогональным оператором. Предположим, что в пространстве Εn переход от ортонормированного 0 0 0 0 0 0 базиса e1 ,e 2 ,...,en к другому ортонормированному базису E1 , E2 ,..., En осуществляется с помощью преобразования координат X = T X ′ . Так как 0 0 0 базис E1 , E2 ,..., En - ортонормированный, то ⎧1, i = j 0 0 (Ei , Ej ) = ⎨ (i , j = 1, 2,...,n ) ⎩ 0, i ≠ j 0
0
Выражая скалярные произведения (Ei , Ej ) (i , j = 1, 2,...,n ) через координаты этих векторов, получим: 2 2 2 τ11 + τ 21 + ... + τ n 1 = 1 ⎫ τ11τ 12 + τ 21τ 22 + ... + τ n 1τ n 2 = 0 ⎫ ⎪ 2 2 2 τ 11τ 13 + τ 21τ 23 + ... + τ n 1τ n 3 = 0 ⎪⎪ τ 12 + τ 22 + ... + τ n 2 = 1 ⎪ (14) ⎬ ⎬ . . . . . . . . . ⎪ ⎪ 2 2 2 ⎪ + + + = τ τ τ τ τ τ 0 ... n ,n −1 n ,n ⎭⎪ τ1n + τ 2n + ... + τ nn = 1⎭ 1,n −1 1n 2 ,n −1 2n Из равенств (14) следует, что T T ⋅T = E или T T = T −1 , т.е. матрица T , осуществляющая переход от одного ортонормированного базиса к другому, ортогональная.
§5. Изменение матрицы линейного оператора при переходе к новому базису. 124
Пусть в пространстве Εn определён линейный оператор A , т.е. y =A ⋅x (1) или (2) Y = A ⋅X , T T где Y = (y 1 y 2 ... y n ) , X = (x 1 x 2 ... x n ) - матрицы-столбцы, составленные из координат векторов x и y относительно данного базиса e1 ,e 2 ,...,en , A - матрица линейного оператора A . Выберем в том же пространстве Εn другой базис E1 , E2 ,..., En . Относительно нового базиса матрица линейного оператора A будет иной. Обозначим через T матрицу преобразования координат, а через X ′ и Y ′ - одностолбцовые матрицы, составленные из координат векторов x и y относительно нового базиса, т.е. (3) X =T ⋅ X ′ , (4) Y = T ⋅Y ′ Подставим (3) и (4) в (2), тогда получим: (5) T ⋅Y ′ = A ⋅T ⋅ X ′ −1 Умножая левую и правую части равенства (5) слева на T , получим: (6) Y ′ = T −1 ⋅ A ⋅T ⋅ X ′ . Если к тому же T - ортогональная матрица, т.е. осуществляет переход от одного ортонормированного базиса к другому, то (7) Y ′ = T T ⋅ A ⋅T ⋅ X ′ . Итак, если в Εn перейти к новому базису, то матрица линейного оператора также изменится и в самом общем случае будет равна T −1 ⋅ A ⋅T .
§6. Сопряженный и самосопряженный оператор Пусть в вещественном евклидовом пространстве Εn определён линейный оператор A . Определение 1. Оператор A ∗ в вещественном евклидовом пространстве Εn называется сопряженным по отношению к линейному оператору A в том же пространстве, если его матрица в любом ортонормированном базисе этого пространства является транспонированной по отношению к матрице оператора A .
1. Свойства сопряженного оператора 1. E∗ = E , где E - тождественный оператор, т.е. оператор, матрица которого E единичная в Εn ; 2. (A + B )∗ = A ∗ + B ∗ 125
3. (A ⋅ B )∗ = B ∗ ⋅ A
∗
существует, то (A −1 )∗ = (A ∗ )−1 . Определение 2. Линейный оператор A , определённый в вещественном евклидовом пространстве Εn , называется самосопряженным, или симметрическим, если он совпадает со своим сопряженным оператором A ∗ , т.е. если A ∗ = A . Очевидно, что матрица самосопряженного оператора совпадает с транспонированной в любом ортонормированном базисе, т.е. является симметричной относительно главной диагонали. 5. если A
−1
2. Свойства самосопряженного оператора 1. если A ∗ = A , B ∗ = B , то (A + B )∗ = A ∗ + B ∗ = A + B ; 2. если A - невырожденный самосопряженный оператор, то (A −1 )∗ = (A ∗ )−1 = A −1 . Доказательство. Действительно, если существует A −1 и кроме того A ∗ = A , то в силу свойства 4 сопряженного оператора, получим (A −1 )∗ = (A ∗ )−1 = A −1 ; 3. Если A -самосопряженный оператор в вещественном пространстве Εn , то имеет место равенство: (A x,z) = (x, A ∗z), ∀x,z ∈Εn (1) Действительно, вводя в рассмотрение одностолбцовые матрицы X и Z , и учитывая, что (A ⋅ B)T = BT ⋅ AT , для скалярного произведения (A x,z) получим: (A ⋅ X )T ⋅ Z = X T ⋅ AT ⋅ Z . В свою очередь для скалярного произведения
(x, A ∗z)
имеем
X ⋅ A ⋅Z . Следовательно, равенство (1) верно. T
T
§7.Собственные векторы и собственные значения линейного оператора. Пусть A - линейный оператор. Пусть x∈ Ε1, где Ε1 некоторое подпространство пространства Εn. Вектор y = A x может принадлежать подпространству Ε1, а может и не принадлежать. Определение 1. Подпространство Ε1 называется инвариантным по отношению к оператору A , если A x ∈Ε1 , ∀x ∈Ε1. Определение 2. Ненулевой вектор x называется собственным вектором линейного оператора A , если найдётся такое число λ , что будет выполняться равенство 126
A x = λx .
При этом число λ называют собственным значением (собственным числом) оператора A , соответствующим вектору x . Множество всех собственных значений оператора A называется его спектром. Остановимся на отыскании собственных значений и собственных векторов линейного оператора A . Рассмотрение проведём для случая n = 3 . Итак, пусть в некотором базисе оператор A имеет матрицу ⎛ a 11 a 12 a 13 ⎞ ⎜ ⎟ A = ⎜ a 21 a 22 a 23 ⎟ ⎜a ⎟ ⎝ 31 a 32 a 33 ⎠ T и пусть одностолбцовая матрица X = (x 1 x 2 ... x n ) соответствует вектору x . Тогда в силу определения
A ⋅ X = λX => A ⋅ X − λ EX = 0 => (1) (A − λ E) ⋅ X = 0 Итак, дело свелось к решению системы линейных однородных уравнений, записанной в матричном виде. Очевидно, что эта система имеет ненулевое решение, если det(A − λ E) = 0 . Уравнение det(A − λ E) = 0 называется характеристическим, или вековым уравнением оператора A ; многочлен det(A − λ E) называется соответственно характеристическим многочленом оператора A . В координатной форме характеристическое уравнение выглядит так: a 11 − λ a 12 a 13
a 21 a 31
a 22 − λ a 23 = 0 a 32 a 33 − λ
Решив его, найдём λ1 , λ2 , λ3 - собственные значения линейного оператора. Можно показать, что собственные значения оператора A не зависят от выбора базиса, т.е. матрицы A и T −1 ⋅ A ⋅T имеют одинаковый набор собственных значений. Далее, для суммы диагональных элементов матрицы A , которую называют следом этой матрицы trA или следом оператор A (trA ) , справедлива формула λ1 + λ2 + λ3 = a 11 + a 22 + a 33 . Кроме того, det A = λ1λ2λ3 . После того как найдены собственные значения линейного оператора A , остаётся подставить их по очереди в уравнение (1) и найти соответствующие собственные векторы x(1) , x( 2 ) , x( 3) . 127
Пример 1. Найти собственные значения и собственные числа линейного оператора, матрица которого ⎛1 2⎞ A=⎜ ⎟ ⎝2 1⎠ Решение. В силу определения собственного вектора можем написать T A ⋅ X − λ ⋅ X = 0 => (A − λ ⋅ E) ⋅ X = 0 , где X = (x 1 x 2 ) - матрица – столбец, соответствующая искомому вектору x линейного оператора A ; В матричной форме получим: 2 ⎞ ⎛ x1 ⎞ ⎛ 0 ⎞ ⎛1 − λ (2) ⎜ ⎟ ⋅ ⎜x ⎟ = ⎜ ⎟ 1− λ ⎠ ⎝ 2 ⎠ ⎝ 0⎠ ⎝ 2 Система однородная, следовательно, она имеет бесчисленное множество решений, если определитель системы равен нулю, т.е. имеем характеристическое уравнение: 1− λ 2 =0 2 1− λ Решая его, получим такие собственные значения λ1 = −1; λ2 = 3 . Найдём соответствующие собственные векторы. 1) λ1 = −1 подставим в (2), получим (1) ⎛ 2 2 ⎞ ⎛ x1 ⎞ ⎛ 0 ⎞ (1) (2) (1) (1) (1) ⎜ ⎟ ⋅ ⎜⎜ (1) ⎟⎟ = ⎜ ⎟ Ù x 1 + x 2 = 0 => x 1 = −x 2 = t , ⎝ 2 2 ⎠ ⎝x 2 ⎠ ⎝ 0⎠
где t (1) - некоторый параметр. Таким образом, имеем множество коллинеарных векторов, соответствующих первому собственному числу λ1 = −1 : ⎛ t (1) ⎞ X (1) = ⎜ (1) ⎟ ⎝ −t ⎠ Этот вектор нетрудно пронормировать, тогда мы получим единичный собственный вектор, соответсвующий первому собственному числу λ1 = −1 т.е. ⎛ 1 ⎞ ⎜ 2 ⎟ ⎟ X (10 ) = ⎜ ⎜ 1 ⎟ ⎜− ⎟ 2⎠ ⎝
2) λ2 = 3 подставим в (10), получим 128
(1) ⎛ −2 2 ⎞ ⎛ x 1 ⎞ ⎛ 0 ⎞ ( 2) ( 2) ( 2) ( 2) ( 2) ⎜ ⎟ ⋅ ⎜⎜ ( 2 ) ⎟⎟ = ⎜ ⎟ => x 1 − x 2 = 0 => x 1 = x 2 = t , т.е. ⎝ 2 −2 ⎠ ⎝ x 2 ⎠ ⎝ 0 ⎠ ⎛ 1 ⎞ ( 2) ⎜ 2⎟ ⎛t ⎞ ⎟ X ( 2 ) = ⎜ ( 2 ) ⎟ ; X ( 20 ) = ⎜ 1 t ⎜ ⎟ ⎝ ⎠ ⎜ ⎟ ⎝ 2⎠ В заключение заметим, что множество всех векторов y = A x , где x ∈ Εn, называется областью значений линейного оператора A в Εn, а множество всех векторов x ∈ Ε1 ⊂ Εn, таких, что A x = 0 , называется ядром линейного оператора.
1. Свойства собственных чисел и собственных векторов самосопряженного оператора Рассмотрим самосопряженный оператор A , определённый в вещественном евклидовом пространстве Εn. В силу определения матрица его A симметрическая. Теорема 1. Собственные числа самосопряженного оператора A есть вещественные числа. (Без доказательства) Теорема 2. Собственные векторы, отвечающие двум различным собственным значениям самосопряженного оператора, ортогональны. Доказательство. Пусть λ1 и λ2 - различные собственные значения самосопряженного оператора A , а x1 и x 2 - соответствующие им собственные значения. Очевидны равенства:
Следовательно,
A x1 = λ1x1 A x 2 = λ2 x 2
(1) (2)
(A x1 ,x 2 ) = λ1 (x1 ,x 2 ) ⎫ ⎬ (x1 , A x 2 ) = λ2 (x1 ,x 2 ) ⎭
(3)
Но (A x1 ,x 2 ) = (x1 , A x 2 ) т.е. левые части равенств (3) равны, следовательно, вычитая их почленно, получим: (λ1 − λ2 ) ⋅ (x1 ,x 2 ) = 0 => (x1 ,x 2 ) = 0 , 129
а это и означает, что собственные векторы x1 и x 2 ортогональны. Замечание. Так как собственные векторы самосопряженного оператора A ортогональны, их можно принять за базис линейного пространства, в котором определён этот линейный оператор. Поделив далее каждый вектор на его длину, мы получаем ортонормированный базис.
Теорема 3. В базисе из единичных собственных векторов самосопряженного оператора матрица этого оператора диагональная, причём элементами диагонали являются её собственные числа. Доказательство. Доказательство проведём для случая n = 3 . Пусть e1 ,e 2 ,e3 - единичные векторы самосопряженного оператора A относительно некоторого базиса линейного пространства Ε3, отвечающие собственным значениям λ1 , λ2 , λ3 этого линейного оператора, т.е. A e1 = λ1e1 , A e 2 = λ2e 2 , A e3 = λ3e3 . Примем векторы e1 ,e 2 ,e3 за базис линейного пространства. Очевидно, что в этом базисе векторы λ1e1 , λ2e2 , λ3e3 имеют координаты: λ1e1 = (λ1 , 0, 0); λ2e2 = (0, λ2 , 0); λ3e3 = (0, 0, λ3 ) . Следовательно, матрица A оператора A в базисе e1 ,e 2 ,e3 имеет вид:
⎛ λ1 0 0 ⎞ ⎜ ⎟ ⎜ 0 λ2 0 ⎟ . ⎜0 0 λ ⎟ 3⎠ ⎝ Выбор такого базиса, в котором матрица линейного оператора имеет диагональный вид, называется приведением матрицы к диагональному виду.
§8. Квадратичные формы и их приведение к каноническому виду Пусть в вещественном пространстве Εn выбран произвольный базис e1 ,e 2 ,...,en , в котором некоторый вектор x∈ Εn имеет координаты x1 , x 2 ,…, xn , тогда этому вектору можно поставить в соответствие одно-
столбцовую матрицу X = (x 1 x 2
... x n ) . T
Определение. Выражение вида 2
Φ(x 1 ,x 2 ,...,x n ) = a 11x 1 + 2a 12x 1x 2 + 2a 13x 1x 3 + ... + 2a 1n x 1x n + 2
+ a 22x 2 + 2a 23x 2x 3 + ... + 2a 2n x 2x n + +.
.
.
.
.
.
+ a nn x n , 130
+
(1)
содержащее в качестве слагаемых только квадраты координат x 1 , x 2 ,..., x n и все их попарные произведения, называются квадратичной формой координат x 1 , x 2 ,..., x n , а числа a ij (i , j = 1, 2,..., n ) - коэффициентами квадратичной формы. Положим a ij = a ji (i , j = 1, 2,..., n ) , тогда квадратичную форму (1) можно переписать в виде 2
Φ(x1,x 2 ,...,xn ) = a11x1 + a12x1x 2 + a13x1x 3 + ... + a1n x1xn + 2
+ a 21x 2x1 + a 22x 2 + a 23x 2x 3 + ... + 2a 2n x 2xn + +.
.
.
.
.
+ a n 1xn x1 + a n 2xn x 2 +
. ...
(2)
+ + a nn x n .
Рассмотрим матрицу, составленную из коэффициентов этой квадратичной формы: ⎛ a 11 a 12 ... a 1n ⎞ ⎜ ⎟ a 21 a 22 ... a 2n ⎟ ⎜ (3) A= ⎜ . . ... . ⎟ ⎜⎜ ⎟⎟ ⎝ a n 1 a n 2 ... a n n ⎠ Матрица A называется матрицей квадратичной формы. Очевидно, что она симметрична относительно главной диагонали и квадратичную форму (1) в матричном виде можно записать так: (4) Φ(x 1 , x 2 ,..., x n ) = X T ⋅ A ⋅ X Оператор A , имеющий матрицу A , самосопряженный. Допустим, что оператор A имеет n различных собственных значений λ1 , λ2 ,..., λn , которым соответствуют n взаимно ортогональных собственных векторов e1 ,e 2 ,...,en . Примем эти векторы за новый базис. Обозначим через T матрицу преобразования координат. Ясно, что матрица T ортогональная. Итак, положим (5) X =T ⋅ X ′ ,
(
где X ′ = x 1′ x 2′ ... x n ′
)
T
- вектор – столбец, составленный из коор-
динат вектора относительно нового базиса. Подставим (5) в (4), тогда получим квадратичную форму относительно нового базиса Φ(x ′ , x ′ ,..., x ′ ) = (T X ′)T ⋅ A ⋅ (T X ′). 1 T
2
n T
Напомним, что (A ⋅ B) = B ⋅ A . Учитывая кроме того, что T T = T так как T - ортогональная матрица, получим T
131
−1
,
Φ′(x 1′ , x 2′ ,..., x n ′ ) = X ′T ⋅T −1 ⋅ A ⋅T ⋅ X ′ Итак, матрица квадратичной формы относительно нового базиса равна −1 T ⋅ A ⋅T . Нетрудно заметить, что она диагональная, причём на главной диагонали стоят собственные значения λ1 , λ2 ,..., λn оператора A . Заметим (это было показано раньше), что в качестве столбцов матрицы T следует взять координаты собственных векторов оператора A в исходном базисе. Приведение квадратичной формы к виду, при котором матрица квадратичной формы имеет диагональный вид, называется приведением квадратичной формы к каноническому виду.
§9. Геометрические приложения теории квадратичных форм в пространствах Ρ2 и Ρ3 Рассмотрим общее уравнение кривой второго порядка: a 11x 2 + 2a 12xy + a 22y 2 + a 1x + a 2y + a 0 = 0 (1) На первые три слагаемых можно смотреть как на квадратичную форму Φ(x , y ) = a 11x 2 + 2a 12xy + a 22y 2 . Матрица этой квадратичной формы a 12 ⎞ ⎛a A = ⎜ 11 ⎟. a a ⎝ 21 22 ⎠ Найдём характеристические числа этой матрицы λ1 и λ2 и соответствующие им единичные векторы X (10 ) и X ( 20 ) , которые примем за орты нового базиса E1 и E2 . Переход от базиса i , j к новому базису E1 , E2 осуществляется матрицей T . X =T ⋅ X ′ , (2) где ⎛E E ⎞ (3) T = ⎜ 11 12 ⎟ , ⎝ E21 E22 ⎠ причём в качестве столбцов этой матрицы берутся координаты векторов E1 и E2 в исходном базисе i , j . После такого преобразования квадратичная форма относительно базиса E1 , E2 имеет вид Φ(x ′, y ′) = λ1x ′2 + λ2y ′2 . Теперь остаётся преобразовать линейные члены уравнения (1). Для этого достаточно заменить в линейных слагаемых x и y по формулам x = E11x ′ + E12y ′ (4) , y = E21x ′ + E22y ′ которые следуют из формул (2) и (3). 132
Заметим, что это преобразование представляет собой переход от старой системы координат xO y к новой x ′O y ′ , повёрнутой относительно старой системы на некоторый угол α . Напомним, что формулы преобразования координат при повороте координатных осей на угол α имеют вид: x = x ′ cosα − y ′ sinα , ⎫ (5) ⎬. y = x ′ sin α + y ′ cosα ⎭ Правые части этих соотношений совпадают с правыми частями соотношений (4), откуда и можно определить угол α . В результате таких преобразований уравнение (7) будет иметь вид:
λ1x ′2 + λ2y ′2 + a 1′x ′ + a 2′y ′ + a 0 = 0 .
(6)
Теперь остаётся выполнить второй этап упрощения кривой, т.е. сделать параллельный перенос координатных осей. При этом возможны следующие ситуации: 1) λ1 и λ2 отличны от нуля и имеют одинаковый знак. Выполняя параллельный перенос, мы приведём далее уравнение (6) к виду: λ x ′′2 + λ y ′′2 + a ′′ = 0 . 1
2
0
Очевидно, что если a 0′′ имеет такой же знак, что и собственные числа λ1 и λ2 , или обращается в нуль, то либо данному уравнению не отвечает никакая кривая, либо соответствует точка (0, 0) ; если a 0′′ имеет противоположный знак, то данная кривая – эллипс; 2) λ1 и λ2 имеют противоположные знаки. Если после параллельного переноса свободный член не обращается в нуль, то получим гиперболу, в противном случае – пару пересекающихся прямых; 3) λ1 или λ2 обращается в ноль. После параллельного переноса мы можем получить параболу. Отметим, что не может оказаться, что оба собственных числа обращаются в нуль, так как в противном случае уравнение (1) было бы линейным. Приведённые рассуждения позволяют сделать вывод, что общее уравнение второго порядка вида (1) является уравнением либо эллипса (окружности), либо гиперболы, либо параболы. Заметим, что здесь содержатся и вырожденные кривые: эллипс (окружность), сжавшийся в точку, пара пересекающихся прямых, мнимый эллипс, пара параллельных прямых и т.п. Остановимся теперь кратко на идее приложения теории квадратичных форм к приведению общего уравнения поверхности второго порядка к каноническому виду. Общее уравнение поверхности второго порядка имеет вид: 133
a 11x 2 + a 22y 2 + a 33z 2 + 2a 12xy + 2a 13xz + 2a 33y z + 2a 1x + 2a 2y + 2a 3z + a 0 = 0 . Суть метода совершенно аналогична изложенному. А именно: в начале рассматривается квадратичная форма Φ(x , y , z ) = a 11x 2 + a 12xy + a 13xz + a 21y x + a 22y 2 + a 23y z + a 31zx + a 32zy + a 33z 2 (a ij = a ji , i , j = 1, 2, 3) , которая приводится к каноническому виду. Затем, используя матрицу преобразования координат, следует преобразовать линейные члены, и на втором этапе осуществить параллельный перенос координатных осей. Пример. Привести к каноническому виду уравнение поверхности x 2 + 4xz + 6y 2 + z 2 = 0 . Решение. Рассмотрим квадратичную форму Φ(x ,y ,z ) = x 2 + 4xz + 6y 2 + z 2 , Запишем её так: Φ(x , y , z ) = 1 ⋅ x 2 + 0 ⋅ xz + 2xz + 0 ⋅ y x + 6y 2 + 0 ⋅ y z + . 2 ⋅ zx + 0 ⋅ zy + 1 ⋅ z 2 Ясно, что матрица данной квадратичной формы ⎛1 0 2⎞ ⎜ ⎟ A = ⎜0 6 0⎟ . ⎜2 0 1⎟ ⎝ ⎠ Найдём единичные собственные векторы матрицы A : γ (1) , γ ( 2 ) , γ ( 3) . Напомним, что γ называется собственным вектором матрицы A , если A γ = λγ => (A − λE ) ⋅ γ = 0 . Для данной матрицы A имеем
0 2 ⎞ ⎛ γ1 ⎞ ⎛ 0⎞ ⎛1 − λ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 0 6 λ 0 − ⎜ ⎟ ⋅ ⎜γ 2 ⎟ = ⎜ 0⎟ . ⎜ 2 0 1 − λ ⎟⎠ ⎜⎝ γ 3 ⎟⎠ ⎜⎝ 0 ⎟⎠ ⎝
(1)
Эта однородная система линейных алгебраических уравнений, записанная в матричном виде, имеет ненулевые решения, если её определитель равен нулю, т.е. должно быть
1− λ 0 2
0
2
6−λ 0 = 0. 0 1− λ
134
Получим характеристическое уравнение, корни которого равны собственно λ1 = 3, λ2 = 6, λ3 = −1 . Найдём соответствующие им собственные вектора γ (1) , γ ( 2 ) и γ ( 3) . 1. λ1 = 3 подставим в систему (1): (1) ⎛ −2 0 2 ⎞ ⎛ γ 1 ⎞ ⎛ 0 ⎞ (1) (1) −2γ 1 + 2γ 3 = 0 ⎫⎪ (1) (1) (1) ⎜ ⎟ ⎜ (1) ⎟ ⎜ ⎟ ⎬ => γ 1 = γ 3 = t , γ 2 = 0 , (1) ⎜ 0 3 0 ⎟ ⋅ ⎜ γ 2 ⎟ = ⎜ 0 ⎟ => 3 ⋅ γ 2 = 0 ⎪⎭ ⎜ 2 0 −2 ⎟ ⎜⎜ (1) ⎟⎟ ⎜ 0 ⎟ ⎝ ⎠ ⎝γ 3 ⎠ ⎝ ⎠
где t - параметр.
Имеем γ (1)
⎛t ⎞ ⎜ ⎟ = ⎜ 0 ⎟ , нормируем этот вектор, получим γ (10 ) ⎜t ⎟ ⎝ ⎠
⎛ ⎜ ⎜ =⎜ ⎜ ⎜⎜ ⎝
1 ⎞ 2 ⎟⎟ 0 ⎟. 1 ⎟ ⎟⎟ 2⎠
2. λ2 = 6 . Аналогично ( 2) ⎛ −5 0 2 ⎞ ⎛ γ 1 ⎞ ⎛ 0 ⎞ (2) ( 2) −5γ 1 + 2γ 3 = 0 ⎫⎪ ( 2) ( 2) ( 2) ⎜ ⎟ ⎜ ( 2) ⎟ ⎜ ⎟ => 0 0 0 0 γ = γ = 0 , γ =t ⋅ = => γ ⎜ ⎟ ⎬ 1 3 2 2 ( 2) ( 2) ⎜ ⎟ ⎜ ⎟ 2γ 1 − 5γ 3 = 0 ⎪⎭ ⎜ 2 0 −5 ⎟ ⎜⎜ ( 2 ) ⎟⎟ ⎜ 0 ⎟ ⎝ ⎠ ⎝γ 3 ⎠ ⎝ ⎠ T T γ ( 2 ) = ( 0 t 0 ) , γ ( 20 ) = ( 0 1 0 )
3. λ3 = −1 . Имеем ( 3) ⎛ 2 0 2⎞ ⎛ γ1 ⎞ ⎛ 0⎞ ( 3) ( 3) 2γ 1 + 2γ 3 = 0 ⎫⎪ ⎜ ⎟ ⎜ ( 3) ⎟ ⎜ ⎟ ⎬ => ( 3) ⎜ 0 7 0 ⎟ ⋅ ⎜ γ 2 ⎟ = ⎜ 0 ⎟ => 7 γ 0 ⋅ = ⎪⎭ ⎜ 2 0 2 ⎟ ⎜⎜ ( 3) ⎟⎟ ⎜ 0 ⎟ 2 ⎝ ⎠ ⎝γ 3 ⎠ ⎝ ⎠
γ
( 3) 1
= −γ 3
( 3)
= −t , γ 2
( 3)
= 0;γ
( 3)
= ( −t
0 t) ,γ T
( 30 )
⎛ 1 = ⎜− 2 ⎝
T
0
1 ⎞ ⎟ . 2⎠
Возьмём теперь координаты единичных собственных векторов в качестве матрицы преобразования координат
135
1 ⎞ ⎛ 1 ⎜ 2 0 − 2⎟ ⎜ ⎟ T =⎜ 0 1 0 ⎟. ⎜ 1 1 ⎟ ⎜⎜ ⎟⎟ 0 2 2 ⎝ ⎠ Преобразование X = T ⋅ X ′ даёт: 1 1 ⎫ x= x′ − y′ 2 2 ⎪ ⎪⎪ y = y ′⎬ . 1 1 ⎪ ′ z= x + z ′⎪ 2 2 ⎪⎭ Ясно, что при таком преобразовании совершается поворот координатных осей вокруг оси Oy на угол α =
π
. Относительно новых координат Ox’y’z’ 4 квадратичная форма Φ(x ′, y ′, z ′) = 3x ′2 + 6y ′2 − z ′2 . Следовательно наша поверхность относительно новой системы координат имеет уравнение 3x ′2 + 6y ′2 − z ′2 = 0 . Ясно, что это конус (рис.5.9.1), вытянутый вдоль оси O z ′ . z
z′
π 4
0
y
y′ π 4
x
x′
Рис. 5.9.1 136
ЛИТЕРАТУРА 1. Беклемишев Д.В. Курс аналитической геометрии и линейной алгебры. –М.: Наука, 1980 2. Бугров Я.С., Никольский С.М. Элементы линейной алгебры и аналитической геометрии. –М.: Наука, 1980 3. Головина Л.И., Линейная алгебра и некоторые её приложения. –М.: Наука, 1979 4. Ильин В.А., Позняк Э.Г. Аналитическая геометрия. –М.: Наука, 1981 5. Ильин В.А., Позняк Э.Г. Линейная алгебра. –М.: Наука, 1983 6. Крутицкая Н.И., Шишкин А.А. Линейная алгебра в вопросах и задачах. -М.:Высшая школа, 1985 7. Мантуров О.В., Матвеев Н.М. Курс высшей математики, –М.: Высшая школа , 1986 8. Боревич З.И. Определители и матрицы. –М.: Наука, 1988 9. Стрент Г. Линейная алгебра и её применение. –М., Мир , 1985 10. Гусятников П.Б., Резниченко С.В. Векторная алгебра в примерах и задачах. –М.: Наука, 1980 11. Сборник задач по математике для ВТУЗов: Линейная алгебра и основы математического анализа. Под ред. А.В. Ефимова и Б.П. Демидовича. –М.: Наука, 1986 12. Клетенин Д.В. Сборник задач по аналитической геометрии, –М.: Наука, 1984 13. Наумов В.А. Руководство к решению задач по аналитической геометрии и линейной алгебре. –М.: Наука, 1993 14. Гусак А.А, Высшая математика. В двух томах. Том1. Минск, Тетра Системс, 1998
138
Кафедра высшей математики (ВМ) была организована в 1930 году. Первым заведующим кафедрой был профессор Г.Д.Гродский. С конца 1936 года кафедрой ВМ заведовал профессор И.П.Натансон, известный специалист по теории функций действительной переменной. В 1944 году заведующим кафедрой ВМ становится профессор В.А.Тартаковский [1901-1973], замечательный математик и педагог. Владимир Абрамович Тартаковский является одним из крупнейших советских алгебраистов. Им получены пользующиеся мировой известностью результаты по проблеме тождества в теории бесконечных групп. Известность получили также его работы по использованию теоретико-числовых методов в теории изгибания поверхностей, теории диофантовых уравнений. Обладая исключительной энергией, В.А.Тартаковский уделял много внимания научной и общественной работе. Ещё в тридцатые годы он в составе комиссии Наркомпроса участвовал в разработке программы по математике для средней школы. В течение долгого времени был членом президиума учебно-методического совета при МВ ССО СССР, входил в комиссию по реформе математического образования в стране, был одним из инициаторов проведения среди школьников Ленинграда первой математической олимпиады. В.А. Тартаковский участвовал в организации ленинградского отделения математического института им. В.А.Стеклова и был первым его директором. 139
В разное время на кафедре ВМ преподавали академик В.И.Смирнов, член-корреспондент АН АН СССР Д.К.Фаддеев, проф. И.С.Соминский, проф. Ф.И.Харшиладзе, проф. А.Ф.Андреев, проф. Ю.В.Аленицын проф. И.А.Молотков. В 1979 году кафедру возглавил доктор технических наук, профессор В.Г.Дегтярёв, специалист по теории устойчивости и теории движения космических аппаратов. C 1997 года кафедрой руководит доктор физико-математических наук, профессор И.Ю.Попов, в область научных интересов которого входят теория рассеяния, теория операторов, моделирование сложных физических систем. Кафедра ВМ осуществляет обучение студентов всех специальностей университета по дисциплине «Высшая математика» и читает ряд специальных дисциплин математического цикла. Кафедра ВМ является самой большой кафедрой в университете по числу преподавателей. Среди её сотрудников 4 доктора и 16 кандидатов наук. Преподаватели кафедры активно участвуют как в фундаментальных исследованиях по математике и теоретической физике, так и в прикладных научно-технических исследованиях. Преподаватели кафедры принимают активное участие в работе российских и международных научных конференций, выступают с докладами и преподают за рубежом. За последние 5 лет сотрудниками кафедры опубликовано более 300 работ в отечественных и зарубежных научных изданиях. Областью научных интересов профессора А.Г.Петрашеня является теория взаимодействия излучения с веществом, оптика и спектроскопия. Профессор В.П.Смирнов – специалист по теории твёрдого тела и теории групп в квантовой механике. Профессор В.Ю.Тертычный, член Нью-Йоркской академии и Соросовский профессор, занимается теорией оптимального управления механическими системами. 140
Элементы теории линейных пространств Под общей редакцией Л.С. Ратафьевой Учебное пособие. Коллектив авторов Лариса Ивановна Брылевская Иван Александрович Лапин Лариса Семёновна Ратафьева Ольга Леонидовна Суслина В авторской редакции Компьютерный дизайн Пухов Илья Владимирович Дизайн обложки Пухов Илья Владимирович Лицензия ИД № 00408 от 05.11.99 Отпечатано на ризографе Заказ №
Подписано к печати Тираж 1500 экз
Редакционно-издательский отдел Санкт-Петербургского государственного института точной механики и оптики (технического университета) 197101, Санкт-Петербург, ул. Саблинская д.14