ВЫСШЕЕ ЭКОНОМИЧЕСКОЕ ОБРАЗОВАНИЕ В.А. Малугин
Математика для экономистов
ЛИНЕЙНАЯ АЛГЕБРА Курс лекций Допущено УМО
по
классическому университетскому образованию
в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 080100 «Экономика»
УДК 512 ББК 22.143 М 18
Об авторе: Малугин В.А. — кандидат физико-математических наук, доцент кафедры «Математические методы анализа экономики» экономического факультета МГУ им. М.В. Ломоносова Рецензенты: Черемных Ю.Н. — доктор экономических наук, профессор кафедры «Математические методы анализа экономики» экономического факультета МГУ им. М.В. Ломоносова Гаврилец Ю.Н. — доктор экономических наук, профессор, заведующий лабораторией математической социологии ЦЭМИ РАН
Малугин В.А.
М 18 Математика для экономистов: Линейная алгебра. Курс лекций. — М.: Эксмо, 2006. — 224 с. — (Высшее экономическое образование). ISBN 5-699-12627-9 Книга входит в состав учебного комплекса «Математика для экономистов», специально созданного для экономических вузов страны экономическим факультетом МГУ им. М.В. Ломоносова. Ее цель — в ясной и удобной для восприятия форме дать студенту-экономисту весь объем необходимых ему математических знаний в части линейной алгебры. При этом студент четко сориентирован, для чего и когда ему будет полезно знание тех или иных разделов дисциплины: для решения каких экономических задач нужна матричная алгебра, как с помощью систем линейных уравнений можно построить модель многоотраслевой экономики, какие методы оптимизации позволяют решить задачу максимизации прибыли и т.д. Издание предназначено для студентов и преподавателей экономических факультетов и вузов. УДК 512 ББК 22.143
ISBN 5-699-12627-9
© В.А. Малугин, 2006 © ООО «Издательство «Эксмо», 2006
СОДЕРЖАНИЕ
Предисловие ГЛАВА 1. МАТРИЧНАЯ АЛГЕБРА
9 11
§1.1. Матрицы Основные сведения о матрицах Виды матриц
11 11 12
§1.2. Операции над матрицами Умножение числа на матрицу Сложение матриц одинакового размера Вычитание матриц одинакового размера Умножение матрицы на матрицу Возведение матрицы в целую положительную степень Транспонирование матрицы Свойства транспонирования матрицы
14 14 14 14 15 16 16 17
§1.3. Определители квадратных матриц Введение определителя Свойства определителей Вычисление определителя
17 17 22 26
§1.4. Обратная матрица Теорема о существовании обратной матрицы Свойства обратных матриц
28 28 30
§ 1.5. Матрицы элементарных преобразований Типы матриц элементарных преобразований
33 33
3
Элементарные преобразования матрицы Способ построения обратной матрицы
34 39
§ 1.6. Ранг матрицы Определение ранга матрицы Ранг матрицы при элементарных преобразованиях Линейные комбинации строк или столбцов Связь ранга с числом независимых строк (столбцов) Строка матрицы как линейная комбинация независимых строк матрицы Вопросы для повторения
48 49
ГЛАВА 2. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
51
§2.1. Общие понятия системы линейных уравнений
51
41 41 43 45 47
§2.2. Нахождение единственного решения системы линейных уравнений Метод обратной матрицы Метод с использованием расширенной матрицы Метод с использованием формул Крамера
52 52 54 55
§ 2.3. Общий подход к решению систем уравнений Равносильность систем линейных уравнений при элементарных преобразованиях Метод Гаусса Теорема Кронекера — Капелли Схема решений системы уравнений
58
§ 2.4. Базисные решения системы уравнений
65
§ 2.5. Однородные системы линейных уравнений Свойства однородной системы линейных уравнений Фундаментальные решения
66 67 68
§ 2.6. Общее решение системы неоднородных линейных уравнений
73
§ 2.7. Модель Леонтьева многоотраслевой экономики Вопросы для повторения
75 78
4
58 59 63 64
ГЛАВАЗ. ВЕКТОРНАЯ АЛГЕБРА § 3.1. Векторы на плоскости и в пространстве (геометрические векторы) Линейные операции над векторами Координаты вектора Скалярное произведение векторов Свойства скалярного произведения Векторы в трехмерном пространстве
80 80 81 82 82 84 84
§ 3.2. Линейные векторные пространства Понятие линейного векторного пространства Вектор в n-мерном пространстве Линейная зависимость и независимость векторов Свойства линейной зависимости векторов
86 86 87 88 89
§ 3.3. Размерность. Базис векторного пространства Размерность векторного пространства Базис векторного пространства Разложение вектора по базису Дополнение до базиса
91 91 92 93 96
§ 3.4. Переход к новому базису Матрица перехода к новому базису Свойства матрицы перехода
99 99 100
§ 3.5. Линейные подпространства Линейные подпространства Сумма и пересечение линейных подпространств Свойства суммы и пересечения подпространств Линейная оболочка Свойства линейной оболочки
102 102 103 104 104 105
§ 3.6. Евклидовы пространства Евклидовы пространства Свойства длины вектора Ортонормированная система векторов Ортогональное дополнение Свойства ортогонального дополнения Вопросы для повторения
105 105 107 108 112 113 116
5
ГЛАВА 4. ЛИНЕЙНЫЕ ОТОБРАЖЕНИЯ
117
§ 4.1. Общие сведения о линейных отображениях Отображения Образ, ранг, ядро, дефект отображения Отображение базиса
117 117 118 119
§ 4.2. Линейные операторы Линейные операторы и их свойства Структура линейного оператора Матрицы оператора в разных базисах Определитель оператора в разных базисах
121 121 122 125 126
§ 4.3. Собственные векторы и собственные значения линейного оператора Собственные векторы и собственные значения Независимость собственных векторов
127 127 129
§ 4.4. Симметричный оператор Симметричный оператор Ортогональность собственных векторов
131 131 132
§ 4.5. Квадратичные формы Понятие квадратичной формы
133 133
Связь между квадратичной формой и оператором Приведение квадратичной формы к каноническому виду . . . Свойства канонических форм Критерий Сильвестра Вопросы для повторения
136 137 139 140 145
ГЛАВА 5. ВЕКТОРНЫЕ ФУНКЦИИ
146
§ 5.1. Векторные функции скалярного аргумента Определение векторной функции скалярного аргумента . . . . Предел и непрерывность векторной функции скалярного аргумента Дифференцирование векторной функции скалярного аргумента Свойства производной векторной функции скалярного аргумента
146 146
6
147 148 149
Правила дифференцирования векторной функции скалярного аргумента
149
§ 5.2. Векторные функции векторного аргумента Определение векторной функции векторного аргумента Потенциальное поле вектора Дифференцирование векторной функции векторного аргумента Вопросы для повторения
150 150 152
ГЛАВА 6. КЛАССИЧЕСКИЕ МЕТОДЫ ОПТИМИЗАЦИИ
157
§ 6.1. Локальный экстремум Определение локального экстремума Необходимые условия локального экстремума Достаточные условия локального экстремума Использование квадратичных форм
157 157 158 161 163
§ 6.2. Условный экстремум Определение условного экстремума Первый метод нахождения условного экстремума Второй метод нахождения условного экстремума (метод Лагранжа) Геометрическая интерпретация необходимых условий для условного экстремума Окаймленный гессиан Последовательность действий при отыскании условных экстремумов функции двух переменных
168 168 170
155 156
173 174 175 178
§ 6.3. Экстремум неявной функции
183
§ 6.4. Глобальный экстремум
187
§ 6.5. Экстремум в системах функций
190
§
6.6.
Экстремум
в
системах
§ 6.7. Оптимизация потребительского поведения (функция спроса)
7
неравенств
194 198
§ 6.8. Максимизация прибыли в проектном анализе
200
§ 6.9. Глобальный экстремум в задачах математического программирования
206
Вопросы для повторения
210
СПИСОК ЛИТЕРАТУРЫ
211
ТЕМАТИЧЕСКИЙ УКАЗАТЕЛЬ
212
Предисловие
Учебник создан в помощь студентам-экономистам и дополнен сборником задач и упражнений по линейной алгебре. Автору, в течение ряда лет ведущему математические курсы на экономическом факультете, пришлось столкнуться с проблемами, связанными с отсутствием математических учебников и задачников, адаптированных к требованиям современной математизированной экономической науки. Рекомендуемые студентам пособия (выпуска 60-х годов прошлого века) стали устаревать. Современная же математическая литература ориентирована в основном на студентов математических специальностей. В созданных специально для студентов-экономистов учебниках высшая математика дается на элементарном уровне, недостаточном для полноценного освоения специальных экономических дисциплин. В связи с этим назрела потребность в обновлении учебной экономико-математической литературы для студентов экономических отделений университетов. Учебник написан в рамках требований университетского общеобразовательного стандарта в области математики. Он базируется на работах [1—7], при этом автор использовал наиболее интересные педагогические находки по изложению материала в доходчивой форме, а также наиболее удачные примеры и иллюстрации. В связи с последовательным изучением математического анализа и линейной алгебры на многих экономических отделениях вузов раздел функций нескольких переменных (ФНП) разбит на две части. Первую часть составляет собственно инструментарий ФНП. Этот материал включен в учебник по математическому 9
анализу. Вторую часть составляют методы оптимизации, содержащие исследования на экстремум. Эти методы используют как инструменты математического анализа, так и аппарат линейной алгебры. Поэтому данный материал изложен в учебнике по линейной алгебре. Он заканчивается понятием глобального экстремума в задачах линейного и нелинейного программирования, что составляет предмет следующего изучаемого математического курса — «Исследование операций». Начало и конец доказательства основных утверждений и теорем выделены в учебнике значками и
ГЛАВА 1
Матричная алгебра
§1.1. Матрицы Основные сведения о матрицах Виды матриц Матричная алгебра является важным элементом экономических расчетов. Многие экономико-математические модели рассматриваются и решаются в матричной форме. Основные сведения о матрицах Определение. Матрицей с размерами т х п называется прямоугольная таблица чисел, содержащая т строк и п столбцов. Числа, составляющие матрицу, называются элементами матрицы. Матрицы обычно обозначают заглавными буквами латинского алфавита, например А, В, С,..., а для обозначения элементов матрицы используются строчные буквы с двойной индексацией: аф где i — номер строки, j — номер столбца. Числа i и j определяют расположение элемента аи в матрице А и играют роль координат этого элемента в прямоугольной таблице чисел. Например, матрица
имеет т строк и п столбцов. 11
Линейная алгебра. Курс лекций
Набор называется /-й строкой матрицы А, а набор
называется у-м столбцом матрицы А. Любые строки и столбцы матрицы А, в свою очередь, являются матрицами. Две матрицы An В одинакового размера называются равными, если они совпадают поэлементно. Равенство записывается как А - В. Виды матриц Матрица произвольного размера, все элементы которой равны нулю, называется нулевой и обозначается О. Матрица, состоящая из одной строки А = (аи, а12, ..., а1п), называется матрицей-строкой или вектором.
Матрица, состоящая из одного столбца А =
, называется
матрицей-столбцом или также вектором. Матрица называется квадратной п-го порядка, если число ее строк равно числу столбцов и равно п. Элементы квадратной матрицы aip у которых номер строки совпадает с номером столбца, называются диагональными и образуют главную диагональ. Если все недиагональные элементы квадратной матрицы равны нулю, то матрица называется диагональной. Например,
— диагональная матрица третьего порядка. 12
Глава 1. Матричная алгебра
Квадратная матрица, на главной диагонали которой стоят единицы, а все остальные элементы равны нулю, называется единичной и обозначается Е. Например, матрица
является единичной матрицей четвертого порядка. Квадратная матрица, у которой все элементы выше или ниже главной диагонали равны нулю, называется треугольной. Произвольная матрица вида С=(А\ В), составленная из двух матриц, разделенных вертикальной чертой, называется расширенной. Например, матрица
является расширенной. Она составлена из квадратной матрицы третьего порядка и единичной матрицы третьего порядка. Матрица может содержать своими элементами другие матрицы. Например, матрица
может быть записана в виде А =
, где а,, аъ ..., ап — матри-
цы-строки исходной матрицы. Квадратная матрица А n-го порядка называется симметричной, если ее элементы подчиняются следующему равенству: где 13
Линейная алгебра. Курс лекций
§1.2. Операции над матрицами Умножение числа на матрицу Сложение матриц одинакового размера Вычитание матриц одинакового размера Умножение матрицы на матрицу Возведение матрицы в целую положительную степень Транспонирование матрицы Свойства транспонирования матрицы Над матрицами возможно проведение некоторых арифметических операций. Умножение числа на матрицу Эта операция производится по следующему правилу: число умножается на каждый элемент матрицы. Произведением числа на матрицу называется матрица такая, что Элементы матрицы В вычисляются по формуле где З а м е ч а н и е . Общий множитель всех элементов матрицы можно выносить за знак матрицы. Сложение матриц одинакового размера Соответствующие элементы матриц складываются. Суммой матриц называется матрица такая, что С = А + В. Элементы матрицы С вычисляются по формуле где Вычитание матриц одинакового размера Соответствующие элементы матриц вычитаются. Разностью матриц называется матрица такая, что Элементы матрицы С вычисляются по формуле где 14
Глава 1. Матричная алгебра
Умножение матрицы на матрицу Элемент новой матрицы, стоящий на пересечении /-и строки и у-го столбца, равен сумме произведений элементов /-й строки первой матрицы на соответствующие элементы у-го столбца второй матрицы. Операция определена при условии, что число столбцов первой матрицы равно числу строк второй. Произведением матрицы А = (я,у) на матрицу В= (6,у) называется матрица С= (с,у) такая, что С-А • В. Элементы матрицы С вычисляются по формуле
(О ПРИМЕР.
З а м е ч а н и е 1. Используя знак сокращенного суммирования, формулу (1) можно записать в виде
З а м е ч а н и е 2. Введем обозначение матрицы в виде , означающее, что матрица содержит т строк и п столбцов. Тогда произведение матриц можно записать следующим образом: З а м е ч а н и е 3. Порядок матриц-сомножителей существен. Поэтому говорят об умножении матрицы А на матрицу В справа или слева. Если произведение матриц Л В существует, то произведение матриц В • А может не существовать. Если существуют произведения матриц А • Ви В А, они могут быть матрицами разных размеров. Если матрицы А и В квадратные, то их произведения А • В и В А существуют и имеют одинаковый порядок, но в общем случае 15
Линейная алгебра. Курс лекций
З а м е ч а н и е 4. Умножение единичной матрицы Ена квадратную матрицу А не изменяет последней: Е • А = А • Е= А. З а м е ч а н и е 5. Произведение двух ненулевых матриц может дать нулевую матрицу О, например:
Возведение матрицы в целую положительную степень Возведение матрицы в целую положительную степень к сводится к произведению к одинаковых матриц:
Дополнительно определим З а м е ч а н и е 1. Возведение в степень матрицы может привести к нулевой матрице. Например:
З а м е ч а н и е 2. Операция возведения в степень определена только для квадратных матриц. Транспонирование матрицы (переход к матрице, у которой строки и столбцы меняются местами). Матрица
называется транспонированной по отношению к матрице
16
Линейная алгебра. Курс лекций
назовем число, равное
где (индексу равен 1 или 2) — определитель матрицы первого порядка, полученный вычеркиванием из матрицы А 1-й строки и у-го столбца. Например, определитель получен из матрицы А вычеркиванием 1 -й строки и 1-го столбца. Следовательно, величина определителя равна Тогда
Определителем матрицы третьего порядка А = назовем число, равное
(2) где (индекс j равен 1, 2 или 3) — определитель матрицы второго порядка, полученный вычеркиванием из матрицы А 1-й строки и столбца. Например, определитель получен из матрицы Л вычеркиванием 1 -й строки и 1 -го столбца:
18
Глава 1. Матричная алгебра Т
и обозначается А . Замечание. Из определения следует, что если матрица А имеет размер m x п, то транспонированная матрица А1 имеет размер пхт. Операции транспонирования, а также операции сложения и умножения матриц обладают легко проверяемыми свойствами. Свойства транспонирования матрицы
Свойства операций сложения и умножения:
§1.3. Определители квадратных матриц Введение определителя Свойства определителей Вычисление определителя Введение определителя Свяжем с каждой квадратной матрицей А некоторое число, вводимое по определенному правилу. Назовем это число определителем матрицы и обозначим его \А \. Определителем матрицы первого порядка А = (аи) назовем число Определителем матрицы второго порядка 17
Глава 1. Матричная алгебра
Подставим полученные соотношения в (2):
Из структуры формулы видно, что в каждое слагаемое в правой части равенства входит по одному элементу из каждой строки и каждого столбца матрицы. Формулу (3) несложно запомнить, если воспользоваться правилом треугольников (рис. 1.1). Берутся произведения элементов, соединенных линиями. На рисунке слева линиями указаны произведения элементов, которые следует взять со знаком «+». справа — со знаком «—».
Рис. 1.1
Например, величина определителя матрицы
равна \А\ -(-2)-1-(-1)-1-1-0-0-2-3 = -1 . Предположим, что определители матриц, порядок которых меньше п, введены. Определителем квадратной матрицы я-го порядка 19
Линейная алгебра. Курс лекций
где My — определитель матрицы (п - 1)-го порядка, полученной из матрицы А вычеркиванием 1-й строки и j-го столбца. Введем понятия минора и алгебраического дополнения. Минором элемента матрицы А п-го порядка называется определитель (п - 1)-го порядка, полученный из матрицы А вычеркиванием i-й строки и j-го столбца. Например, минор Мп элемента матрицы третьего порядка получается вычеркиванием из матрицы 2-й строки и 3-го столбца:
Алгебраическим дополнением элемента матрицы А п-го порядка называется минор взятый со знаком
Используя понятие алгебраического дополнения, формулу (4) можно записать в виде
(5) З а м е ч а н и е 1. Рассмотренные нами выше определители есть миноры соответствующих элементов матрицы. З а м е ч а н и е 2. Формула (5) допускает сокращенную запись:
20
Глава 1. Матричная алгебра
Иными словами, определитель квадратной матрицы равен сумме произведений элементов 1 -й строки на их алгебраические дополнения. З а м е ч а н и е 3. Формула (5) называется разложением определителя по 1-й строке. З а м е ч а н и е 4. Величина алгебраического дополнения элемента зависит только от положения этого элемента в матрице А. При замене элемента матрицы на другое число величина алгебраического дополнения не изменяется. ТЕОРЕМА
(о величине определителя квадратной матрицы) Определитель квадратной матрицы равен сумме произведений элементов любой строки или любого столбца на их алгебраические дополнения:
При доказательстве ограничимся для простоты рассмотрением матрицы третьего порядка. Мы получили формулу разложения определителя по 1-й строке (2). Разложим теперь определитель, например, по 2-му столбцу: (6) Каждый минор го порядка:
является определителем второ-
Подставим эти выражения в формулу (6), раскроем скобки и соберем положительные слагаемые, затем отрицательные. Получим 21
Линейная алгебра. Курс лекций
(7)
Сравнивая правые части соотношений (3) и (7), убеждаемся в том, что Подобным образом проверяются и другие равенства, получаемые разложением определителя по определенной строке или столбцу. • ПРИМЕР. Вычислить определитель треугольной матрицы п -го порядка
Решение. Имеем
Мы убедились, что определитель треугольной матрицы равен произведению ее диагональных элементов. Свойства определителей 1) Определитель с нулевой строкой или нулевым столбцом равен нулю. Для доказательства этого свойства достаточно разложить определитель по нулевой строке или по нулевому столбцу. 2) Умножение определителя на число равносильно умножению какой-либо строки или столбца определителя на это число. Умножим любую строку или столбец исходного определителя на число, разложим определитель по этой строке или столбцу, 22
Линейная алгебра. Курс лекций
При перестановке двух строк определитель изменит знак. Переставим местами одинаковые строки. Определитель останется таким же. Значит, — \А\ = \А\. Отсюда следует, что \А\ = 0. 6) Определитель, содержащий две пропорциональные строки (столбца), равен нулю. Вынесем коэффициент пропорциональности за знак определителя. В нем образуются две одинаковые строки. Поэтому такой определитель равен нулю. 7) Определитель можно разложить на сумму определителей. Представим элементы /-и строки определителя в виде суммы двух слагаемых. Получим
где а, р — некоторые коэффициенты, равные в частном случае единице. Разложим определитель \А\ по i-й строке, используя алгебраические дополнения, преобразуем полученную сумму. Тогда
где
8) Определитель матрицы не изменится, если к элементам одной строки прибавить элементы другой строки, умноженные на одно и то же число. Полученный определитель можно разложить на сумму двух определителей. Один из них является исходным. Другой содержит две пропорциональные строки и, следовательно, равен нулю. 24
Глава 1. Матричная алгебра
вынесем это число за скобки и свернем оставшееся в скобках выражение в исходный определитель. 3) При транспонировании матрицы величина ее определителя не изменяется: \Л\ - \АТ\. Разложим определитель \А\ по 1-й строке, транспонируем его. Разложим полученный определитель \АТ\ по 1-му столбцу. Из доказанной выше теоремы следует, что результат будет одинаков. 4) При перестановке двух строк или столбцов определитель меняет знак. В определителе
переставим, например, первую и вторую строки. Получим
Разложим определитель — по первой. Получим
по второй строке, а определитель
откуда следует Теперь переставим i-ю строку с (i + k)-й. Для этого сместим i-ю строку на к строк вниз. Определитель изменит знак к раз. Строка с номером окажется при этом на -м месте. Переставим эту строку на место строки, для чего поднимем ее на к — 1 строк вверх. Определитель изменит знак к — 1 раз. В результате процедуры определитель изменит знак нечетное число раз: , т.е. знак определителя при любой перестановке строк изменится. 5) Определитель матрицы с двумя одинаковыми строками (столбцами) равен нулю. 23
Глава I. Матричная алгебра 9) Сумма произведений произвольных чисел на алгебраические дополнения элементов любой строки (столбца) равна определителю матрицы, полученной из данной заменой элементов этой строки (столбца) на числа Свойство вытекает из замечания 4 к алгебраическим дополнениям и доказанной теоремы. 10) Сумма произведений элементов одной строки матрицы на алгебраические дополнения к элементам другой строки этой матрицы равна нулю. Умножим элементы /-и строки исходной матрицы на алгебраические дополнения j-й строке и составим сумму:
Подобная сумма получается из матрицы, у которой на месте /-й строки стоит /-я строка:
Эта матрица имеет две одинаковые строки, поэтому величина ее определителя равна нулю. 11) Определитель произведения квалрагных матриц равен произведению определителей этих матриц, т.е. В силу громоздкости преобразований ограничимся рассмотрением матриц второго порядка. Пусть
Тогда
25
Линейная алгебра. Курс лекций
Рассчитаем величины определителей трех матриц, а также величину \А * \В\:
После сокращения подобных (они подчеркнуты) получаем справа одинаковые выражения для \АВ\ и \А\ * \В\. Вычисление определителя Существует несколько способов вычисления величины определителя. Выбор способа диктуется видом и порядком определителя. Удачно выбранный способ позволяет существенно сократить вычисления. Рассмотрим их на примере определителя матрицы третьего порядка. ПРИМЕР. Вычислить определитель матрицы
1-й способ. Использование теоремы о разложении определителя по любой строке или столбцу. Разложим определитель, например, по 3-му столбцу:
26
Глава 1. Матричная алгебра
2-й способ. Использование правила треугольников:
-2-2-2-(-2)-1-2 = - 1 6 - 4 + 4 + 8-8 + 4 =-12. 3-й способ. Использование свойств определителя для преобразования его к виду, когда он содержит строку или столбец с максимальным количеством нулей. Разложение определителя по этой строке (столбцу): = {прибавим к 1-й строке 3-ю} = {разложим определитель по 1-й строке} =
4-й способ. Использование свойств определителя для преобразования его к треугольному виду. Величина определителя вычисляется как произведение элементов, стоящих на главной диагонали: 2 2-1 2 -4 1 = {1-ю строку умножим на — 1 и сложим со 2-й -2 -2 2 строкой, поместив результат на месте 2-й строки} = 2
2-1
0-6 -2 -2
2 = {1-ю строку сложим с 3-й и поместим результат на 2
2 2-1 месте 3-й строки} = 0 - 6 2 = {перемножим элементы главной 0 0 1 диагонали} = —12. 27
Линейная алгебра. Курс лекций
§1.4. Обратная матрица Теорема о существовании обратной матрицы Свойства обратных матриц Теорема о существовании обратной матрицы Матрица А называется невырожденной, если ее определитель отличен от нуля, т.е. В противном случае она называется вырожденной. О п р е д е л е н и е . Матрица называется обратной по отношению к квадратной матрице А, если выполняется равенство (8) Следующая теорема устанавливает условия существования обратной матрицы. ТЕОРЕМА (о существовании обратной матрицы) Обратная матрица существует и единственна тогда и только тогда, когда исходная матрица невырожденна. Необходимость. Пусть матрица А имеет обратную матрицу . получаем
Тогда
. Используя свойство 11 определителя, , откуда в ы т е к а е т С л е д о в а т е л ь -
но,
Матрица А является невырожденной. Достаточность. Пусть матрица А является невырожденной: . Матрицу А транспонируем и на основе транспонированной матрицы построим новую матрицу элементами которой являются алгебраические дополнения элементов матрицы Назовем матрицу присоединенной. Итак,
28
Глава 1. Матричная алгебра
Запишем новую матрицу В как произведение матриц Она имеет вид
иА:
Элементы матрицы В вычислим по отдельности и воспользуемся равенством , которое легко проверяется.
Продолжая вычисления, обратим внимание на то, что отличными от нуля окажутся только диагональные элементы матрицы В:
Поэтому матрица В имеет вид
29
Линейная алгебра. Курс лекций
Следовательно,
Аналогично можно доказать, что
Рассмотрим соотношение Разделив его на
получим
Поскольку для матрицы
выполнено равенство (8), эта
матрица является обратной по определению:
Единственность обратной матрицы. Пусть, кроме обратной матрицы к матрице А, существует еще одна обратная матрица Тогда выполняется р а в е н с т в о У м н о ж и м это равенство справа на Получим откуда. или. Таким образом, не существует обратной матрицы X, отличной от Аналогично доказывается, что равенство выполняется в том единственном случае, когда Свойства обратных матриц
Умножим обе части равенства слева на Слева стоит произведение матрицы на обратную ей которое равно единичной матрице, справа — произведение обратной матрицы на исходную, также равное единичной матрице. Следовательно, равенство верно. • 30
Глава I. Матричная алгебра
< Умножим обе части равенства слева на Л1: Далее воспользуемся свойством 4 транспонирования матрицы и перепишем левую часть соотношения так: Правая часть равенства есть произведение матрицы Ат на обратную ей. Получаем ЕТ=Е. Откуда следует тождество Е=Е. • Умножим равенство слева на
Левую часть равенства представим в виде произведения 2т сомножителей:
Левая часть равенства свертывается до матрицы Е, правая часть равенства есть произведение матрицы на обратную ей. Следовательно, равенство обращается в тождество 4) Для равенства
воспользуемся свойством 11 опре-
делителей. Получим
откуда следует
Поэтому 5) < Умножим равенство слева на матрицу В:
Правая часть соотношения примет вид
31
или
Итак,
Линейная алгебра. Курс лекций
Умножим последнее равенство слева на А. Получим =А-А].
А-В-(АВ)'
Слева стоит произведение матрицы АВ на обратную ей (АВ)~], справа — произведение матрицы А на обратную ей А'\ Следовательно, Е-Е. Свойство 5 доказано. • Доказанная теорема дает способ вычисления обратной матрицы. ПРИМЕР. Найти матрицу, обратную данной ' 1 2 -1Л 2 -1 1 -2 -2 1, v Решение. Обратную матрицу будем искать, делая последовательно следующие шаги: 1) Находим определитель матрицы А. Его величина \А\ = — 1. Следовательно, обратная матрица существует. 2) Находим транспонированную к А матрицу А1:
3) Находим алгебраические дополнения к элементам матрицы Л 7 :
Записываем присоединенную матрицу:
4) Вычисляем обратную матрицу: 32
Глава 1. Матричная алгебра
Другой способ вычисления обратной матрицы дает метод Жордана. Но вначале познакомимся с матрицами элементарных преобразований, на использовании которых основан этот метод. § 1.5. Матрицы элементарных преобразований > Типы матриц элементарных преобразований > Элементарные преобразования матрицы > Способ построения обратной матрицы Типы матриц элементарных преобразований Матрицами элементарных преобразований называются матрицы следующих трех типов. 1-й тип. Матрицей элементарных преобразований 1-го типа называется любая матрица, полученная из единичной матрицы перестановкой каких-либо двух строк или столбцов. Например, если в единичной матрице пятого порядка
переставить местами вторую и третью строки, получается матрица элементарных преобразований 1-го типа:
В матрице 123 все элементы вне главной диагонали равны нулю, за исключением тех, которые стоят в позициях (2, 3) и (3, 2). 33
Линейная алгебра. Курс лекций
2-й тип. Матрицей элементарных преобразований 2-го типа называется любая матрица, полученная из единичной заменой диагонального элемента на любое действительное число, не равное нулю. Например, матрицей элементарных преобразований 2-го типа является матрица
у которой в позиции (4, 4) находится число а Ф 0. 3-й тип. Матрицей элементарных преобразований 3-го типа называется любая матрица, отличающаяся от единичной наличием одного внедиагонального элемента, не равного нулю. Например,
является матрицей элементарных преобразований 3-го типа. У нее в позиции (2,4) стоит не равное нулю число b..
Элементарные преобразования матрицы Назовем элементарными преобразованиями матрицы А такие изменения в ее строках и столбцах, которые возникают при умножении матрицы А на матрицы элементарных преобразований слева или справа. 1. Умножение матрицы А на матрицу 10 слева переставляет строки с номерами i и j Например,
34
Глава 1. Матричная алгебра
переставляет 2-ю и 3-ю строки местами. 2. Умножение матрицы А на матрицу слева равносильно умножению i-й строки матрицы А на число а. Например,
умножает 4-ю строку на число а. 3. Умножение матрицы A на матрицу слева равносильно прибавлению к i-й строке матрицы A ее j-й строки, предварительно умноженной на b. Например,
35
Линейная алгебра. Курс лекций прибавляет ко 2-й строке матрицы А ее 4-ю строку с коэффициентом b. Легко проверяются преобразования со столбцами матрицы А. 4. Умножение матрицы А на матрицу справа переставляет столбцы с номерами i иj 5. Умножение матрицы А на матрицу справа равносильно умножению /-го столбца матрицы А на число а. 6. Умножение матрицы А на матрицу 1Щ справа равносильно прибавлению к i-му столбцу матрицы А ее j-го столбца. З а м е ч а н и е 1. Элементарные матрицы всех трех типов являются невырожденными. Элементарные матрицы второго и третьего типов не вырождены, поскольку они имеют треугольный вид. Элементарная матрица первого типа не вырождена, так как при разложении определителя элементарной матрицы первого типа по любой строке (столбцу) образуется определитель единичной матрицы с ненулевым коэффициентом. Разложим, например, определитель матрицы по 1-й строке:
З а м е ч а н и е 2. Ни одно из элементарных преобразований не может превратить невырожденную матрицу в вырожденную. Следовательно, умножение исходной матрицы на матрицу элементарных преобразований, меняя в большинстве случаев величину определителя матрицы, не приводит к его обнулению. ТЕОРЕМА (об умножении матрицы на матрицы элементарных преобразований) Любая невырожденная матрица А путем умножения на матрицы элементарных преобразований Ev Е2, ..., Ек может быть сведена к единичной, т.е. найдутся такие матрицы элементарных преобразований Е{, Е2,..., Ек, последовательное умножение которых на матрицу А слева преобразует исходную матрицу А в единичную:
36
Глава 1. Матричная алгебра
< Пусть матрица А невырожденная. Сведем матрицу А с помощью элементарных преобразований к матрице треугольного вида. Поскольку матрица А невырожденная, она ненулевая. Найдем в 1-м столбце ненулевой элемент и, меняя строки местами, поставим этот элемент в позицию (1,1), если ранее там стоял нулевой элемент. Итак, а Ф 0. Прибавим ко 2-й строке матрицы 1-ю строку, предварительно умноженную на -а2[/аи. В позиции (2,1) появляется нуль. Прибавим к 3-й строке матрицы 1-ю строку, предварительно умноженную на -ам /ап. Тогда в позиции (3,1) также появится нуль. Продолжив эти элементарные преобразования (п — 1) раз, получим матрицу
В дальнейших преобразованиях 1 -я строка не участвует. Найдем во 2-м столбце ненулевой элемент и, меняя строки местами, поставим этот элемент в позицию (2,2), если ранее там стоял нулевой элемент. Имеем а'1Л . Прибавим к 3-й строке матрицы 2-ю строку, предварительно умноженную на -а32 /а22. В позиции (3, 2) появляется нуль. Продолжив эти элементарные преобразования (п — 1) раз, получим матрицу
Теперь в дальнейших преобразованиях уже не участвуют 1-я и 2-я строки. Продолжив этот процесс (совершив t раз элементарные преобразования), придем к треугольной матрице
37
Линейная алгебра. Курс лекций
На главной диагонали стоят элементы, отличные от нуля. Приведение матрицы к треугольному виду с ненулевыми элементами на главной диагонали всегда возможно, так как в противном случае (если бы не нашлось ни одного не равного нулю элемента в каждом столбце) определитель матрицы оказался бы равным нулю. Элементарные преобразования строк матрицы равносильны умножению этой матрицы слева на соответствующие матрицы элементарных преобразований. Поэтому процесс преобразования матрицы к треугольному виду можно представить в виде последовательного умножения t раз слева исходной матрицы на матрицы элементарных преобразований
Продолжим элементарные преобразования матрицы А,. Умножив 1-ю строку матрицы А, на число
, получим в позиции
(1, 1) единицу. Аналогичными элементарными преобразованиями (преобразования 2-го типа) получим единицы во всех позициях главной диагонали. Матрица А, приводится к следующему виду:
Следующий, последний, шаг — получить нули во всех позициях выше главной диагонали. Опираемся на последнюю строку. Последовательно прибавляя к первым п — 1 строкам последнюю, умноженную соответственно на приходим к матрице, у которой первые п — 1 элементов последнего столбца равны нулю. Действуя аналогичным образом, опираясь на предпоследнюю строку, получаем в первых п — 2 позициях предпоследнего столбца нули. Продолжая совершать подобные элементарные преобразования, окончательно получаем 38
Глава 1. Матричная алгебра
Таким образом, совершив к элементарных преобразований в матрице А, мы привели ее к единичной. Используя матрицы элементарных преобразований, запишем результат в матричной форме:
или
(9) Теорема доказана. • Способ построения обратной матрицы Умножим обе части равенства (9) на матрицу.
справа. Тогда
После преобразований получим
(10) Это равенство лежит в основе способа построения обратной матрицы. Пусть А — невырожденная матрица п-го порядка. Составим новую матрицу, которую назовем расширенной: (А\Е). Пусть единичная матрица Е имеет также порядок п. Будем последовательно совершать с расширенной матрицей такие элементарные преобразования, которые равносильны умножению этой матрицы слева на матрицы элементарных преобразований Получим
Подставив (9) и (10) в полученную расширенную матрицу, будем иметь
39
Линейная алгебра. Курс лекций
Таким образом, если путем элементарных преобразований с расширенной матрицей слева от черты получить единичную матрицу, то справа от черты образуется обратная матрица. Замечание. Применяя элементарные преобразования к расширенной матрице (А\В), можно получить матрицу (Е\А~1 • В). Матрица А~] В широко используется при решении систем линейных уравнений. Для получения этой матрицы следует проводить элементарные преобразования только со строками расширенной матрицы, так как эти действия равносильны умножению матриц элементарных преобразований слева на расширенную матрицу. ПРИМЕР. Найти матрицу, обратную матрице
Решение. Составим расширенную матрицу:
Поменяем местами 1-ю и 2-ю строки:
Прибавим ко 2-й строке 1 -ю строку, умноженную на —2:
Умножим 3-ю строку на —2 и сложим со 2-й:
40
Глава 1. Матричная алгебра
Ниже главной диагонали получили треугольник нулей. Образуем теперь нули выше главной диагонали, для чего ко 2-й строке прибавим 3-ю:
Умножим 1-ю строку на 2 и сложим со 2-й:
Умножим 1-ю и 2-ю строки на 0,5, 3-ю строку — на— 1:
Слева от черты получена единичная матрица, значит, справа — обратная матрица
§ 1.6. Ранг матрицы > > > > >
Определение ранга матрицы Ранг матрицы при элементарных преобразованиях Линейные комбинации строк или столбцов Связь ранга с числом независимых строк (столбцов) Строка матрицы как линейная комбинация независимых строк матрицы Определение ранга матрицы
Понятие ранга матрицы — одно из фундаментальных в линейной алгебре. В матрице А размером т х п вычеркиванием каких-либо строк или столбцов можно образовать квадратную 41
Линейная алгебра. Курс лекций
матрицу k-го порядка (к * к). Определитель Мк такой матрицы называется минором к-го порядка. У матрицы размера m x n есть миноры первого порядка, второго порядка и так далее до k-то порядка, где k = min(m, n). Например, у матрицы имеются миноры первого, второго и третьего порядков. О п р е д е л е н и е . Рангом матрицы
называется наивыс-
ший порядок отличных от нуля миноров этой матрицы. О б о з н а ч е н и е : rang А или r(А). Свойства ранга: 1) Ранг нулевой матрицы считается равным нулю. 2) 3) у матрицы п-го порядка тогда и только тогда, когда ПРИМЕР. Вычислить ранг матрицы
Решение. Для матрицы А ранг r(А)<min(3, 4) = 3. Чтобы проверить, может ли ранг быть равным 3, вычислим все миноры 3-го порядка, которые можно образовать из матрицы вычеркиванием одного столбца:
Следовательно, ранг не может быть более 2. Легко найти минор 2-го порядка, отличный от нуля. Например, Но тогда r(А) = 2. Поиск ранга матрицы большого порядка перебором миноров является трудоемкой задачей. Развиты эффективные методы определения ранга матрицы. 42
Глава 1. Матричная алгебра
К введенным ранее трем типам элементарных преобразований матрицы добавим еще два: 4-й тип. Отбрасывание нулевой строки или столбца. 5-й тип. Транспонирование матрицы. Ранг матрицы при элементарных преобразованиях ТЕОРЕМА (о ранге матрицы при элементарных преобразованиях) Элементарные преобразования не изменяют ранга матрицы.
< Рассмотрим последовательно все типы элементарных преобразований матрицы. Элементарные преобразования 1 -го типа меняют строки или столбцы в матрице. В этом случае определитель матрицы меняет знак, но не может обратиться в нуль. Элементарные преобразования 2-го типа умножают строку или столбец на не равное нулю число. Но тогда определитель матрицы умножится на это число, что не может привести к его обнулению. Элементарные преобразования 3-го типа приводят к прибавлению к i-й строке матрицы Л ее j-й строки, что не меняет величины определителя. Элементарные преобразования 4-го типа позволяют отбросить все миноры к-гo порядка, равные нулю, и перейти к рассмотрению миноров к— 1 порядка. На величине ранга это, очевидно, не отразится. Элементарные преобразования 5-го типа транспонируют матрицу, отчего величина ее определителя, как известно (свойство 3 определителей), не изменяется. Мы установили, что при элементарных преобразованиях матриц их определители либо сохраняются, либо изменяют свою величину, не обращаясь при этом в нуль. В результате сохраняется наивысший порядок отличных от нуля миноров исходной матрицы, т.е. ее ранг не изменяется. • Теорема дает возможность посредством элементарных преобразований привести матрицу к определенному виду, когда ее ранг вычисляется без труда. Рассмотрим задачу эффективного вычисления ранга подробнее. 43
Линейная алгебра. Курс лекций
Матрица А называется матрицей ступенчатого вида или ступенчатой матрицей, если она имеет вид
где . Ранг ступенчатой матрицы равен r, так как существует минор порядка r, отличный от нуля:
Таким образом, произвольную матрицу следует привести к ступенчатому виду. Число ненулевых строк матрицы будет равно ее рангу. Если квадратная матрица примет треугольный вид, ее ранг будет равен п. При проведении элементарных преобразований с матрицей знак равенства ставиться не может (матрицы не равны), ставится обычно знак тильды « ~ » . ПРИМЕР. Найти ранг матрицы
Решение. Ко 2-й строке прибавим 1-ю, предварительно умноженную на — 2, к 3-й строке прибавим 1 -ю, предварительно умноженную на — 1. Получим
44
Глава 1. Матричная алгебра
К 3-й строке прибавим 2-ю, предварительно умноженную на — 2. Получим
Число ненулевых строк равно 2. Тогда r(А) = 2. При ином обосновании выделим из матрицы минор максимального поряд-1 3 = 1 . Тогда ка, не равный нулю. Это, например, М2 = 0 -1 r(А) = 2. Линейные комбинации строк или столбцов Познакомимся с понятием линейной зависимости строк или столбцов. В матрице
введем обозначения строк:
Эти строки являются n-мерными и представляют собой матрицы размерностью . В новых обозначениях исходная матрица записывается в виде
Строка
, определяемая равенством
00 45
Линейная алгебра. Курс лекций называется
линейной комбинацией строк где — любые действительные числа. В развернутом матричном виде последнее равенство выглядит так:
Для элементов строки е имеем систему уравнений
Строки называются линейно зависимыми, если существуют такие не равные нулю одновременно, что линейная комбинация этих строк равна нулевой строке Строки называются линейно независимыми, если линейная комбинация этих строк равна нулевой строке только при ТЕОРЕМА (о линейной комбинации строк матрицы) Если строки матрицы линейно зависимы, то одна из них является линейной комбинацией остальных. Пусть строки найдутся числа такие, что
линейно зависимы. Тогда не все равные нулю одновременно и
Пусть, например, Перенесем первые т-\ слагаемых направо и разделим равенство на
ИЛИ
46
Глава 1. Матричная алгебра
где Замечание 1. Верно и обратное утверждение: если одна из строк является линейной комбинацией остальных, то эти строки линейно зависимы. З а м е ч а н и е 2. Аналогичными свойствами обладает множество m-мерных столбцов. Связь ранга с числом независимых строк (столбцов) ТЕОРЕМА (о связи ранга с числом независимых строк) Ранг матрицы равен числу ее независимых строк (столбцов).
Пусть матрица имеет ранг r. По определению ранга матрицы, существует минор порядка r, отличный от нуля. Пусть для определенности это минор
Тогда строки линейно независимы. Предположим противное. Например, строка с номером r есть линейная комбинация остальных строк. В этом случае Проведем элементарные преобразования, не изменяющие величину определителя. Прибавим к этой строке 1-ю строку, предварительно умноженную на 2-ю строку, умноженную на , и т. д., наконец, (r-1)-ю строку, умноженную на Получим на месте строки с номером r последовательно строку
47
Линейная алгебра. Курс лекций
Координаты вектора Координатами вектора а в декартовой системе координат называются координаты его конечной точки при условии, что начальная точка вектора лежит в начале координат. В дальнейшем по умолчанию будем считать, что все векторы отложены от начала координат. На рис. 3.3 координатами вектора а на плоскости ОХУ являются два числа JC, и у{, что обычно записывается в виде Запишем линейные операции над векторами в координатах. Рис. 3.3 Пусть заданы векторы и Ь = (х2,у2).
Скалярное произведение векторов О п р е д е л е н и е . Скалярным произведением двух векторов называется произведение модулей этих векторов, умноженное на косинус угла между векторами и обозначаемое (а, Ь): (1) Найдем скалярное произведение, выраженное через координаты векторов. На координатной плоскости построим векторы и Они образуют треугольник, изображенный на рис. 3.4. По теореме косинусов найдем длину стороны, образуемой вектором с:
Отсюда следует
82
Глава 3. Векторная алгебра
Выразим векторы через их координаты:
Тогда
Раскроем скобки и приведем подобные. Получим (2) т.е. скалярное произведение двух векторов равно сумме произведений соответствующих координат этих векторов. Рассмотрим некоторые следствия формулы (2). 1) В скалярном произведении положим а = Ь. Тогда
т.е. скалярный квадрат вектора равен квадрату его длины. 2) Найдем из равенства (1) величину
3) Пусть вектор Ь направлен вдоль оси ОХ и имеет единичную длину Тогда для всякого в е к т о р а в е личина
описывает косинус угла между вектором а и положительным направлением оси ОХ. Точно так же при направлении единичного вектора Ь вдоль оси ОУ(b = (О, 1)) величина
описывает косинус угла между вектором а и положительным направлением оси ОУ (рис. 3.5); называются направляющими косинусами вектора а. 83
Линейная алгебра. Курс лекций
Свойства скалярного произведения 1)(a,b) = (b,a). Справедливость свойства вытекает из формулы (1), если учесть четность функции 2) Пусть векторы а, b, с заданы своими координатами Запишем скалярное произведение (я + Ь, с) в координатах:
Выражения, представленные в скобках, есть соответственно скалярные произведения (а, с) и (b, с). Отсюда следует свойство 2. 3) Действительно,
При
имеем
Правые части трех равенств
равны При имеем т.е. опять получаем равенство правых частей. При свойство 3 очевидно. Векторы в трехмерном пространстве В трехмерном пространстве вектор задается тремя числами: Линейные операции над векторами и в пространстве аналогичны операциям над векторами на плоскости:
84
Глава 3. Векторная алгебра
6) направляющие косинусы вектора а равны:
где — углы между вектором а и положительными направлениями осей Ox, Oy, Oz соответственно (рис. 3.6), причем З а м е ч а н и е . Пусть вектор ным, т.е.
является единич-
В этом случае
Следовательно, единичный вектор полностью задается своими направляющими косинусами Пусть заданы векторы единичной длины i,j, к, направленные вдоль осей х, у, z соответственно (рис. 3.6). Они обладают следующими свойствами. 1) Заданные в координатах, они имеют вид i = (1, 0, 0), j = 2) Матрица, составленная из координат векторов
имеет ранг, равный 3. Отсюда следует, что строки линейно независимы. На этом основании будем считать геометрические векторы i,j, k линейно независимыми. 3) Векторы i,j, к перпендикулярны друг к другу (взаимно ортогональны). 4)Пусть задан произвольный в е к т о р В е к т о р ы лежат на соответствующих координатных осях, а их сумма по правилу параллелограмма равна
(3)
Линейная алгебра. Курс лекций
Тройка векторов, обладающих перечисленными свойствами, называется ортонормированным базисом (ортобазысом). Всякий вектор может быть разложен по ортонормированному базису. Формула (3) называется разложением вектора а по векторам i,j, k. ПРИМЕР. Найти скалярное произведение двух векторов
Решение. Запишем скалярное произведение векторов а и Ь\ Пользуясь вторым свойством скалярного произведения, находим
Учитывая, что получаем § 3.2. Линейные векторные пространства Понятие линейного векторного пространства Вектор в n-мерном пространстве Линейная зависимость и независимость векторов Свойства линейной зависимости векторов Понятие линейного векторного пространства Для дальнейшего изучения векторного анализа нам понадобится понятие векторного пространства. О п р е д е л е н и е . Множество W элементов . называется линейным пространством, если по некоторому правилу: 1. Любым двум элементам х и у из W поставлен в соответствие элемент из W, обозначаемый х + у и называемый суммой элементов X И >'. 2. Любому элементу х из W и каждому числу поставлен в соответствие элемент из W, обозначаемый • х и называемый про86
Глава 3. Векторная алгебра
изведением числа X на элемент х, причем справедливы следующие аксиомы:
7) существует нулевой элемент 0 такой, что х + 0 = х для любого х е W; 8) для каждого элемента х существует противоположный элемент — х такой, что х+ (—х) = 0. Элементы любой природы, удовлетворяющие двум правилам и восьми аксиомам, по определению, образуют линейное пространство. Например, совокупность любых матриц размера т х л образует линейное пространство, поскольку для них выполнены оба правила и все аксиомы. Легко проверить, что совокупность геометрических векторов, например трехмерного пространства, также является линейным пространством. Линейное пространство называется пустым, если оно состоит из нулевого элемента. Вектор в n-мерном пространстве О п р е д е л е н и е , п-мерным вектором называется математический объект, который состоит из упорядоченной совокупности действительных чисел, называемых компонентами вектора, и записывается в виде Название «л-мерный вектор» связано с тем, что при п = 2 или л = 3 совокупность чисел можно интерпретировать как совокупность координат вектора на плоскости или в пространстве. Два n-мерных вектора называются равными, если равны все компоненты векторов, т.е. Пусть для л-мерных векторов выполнены правила сложения и умножения на число, удовлетворяющие аксиомам линейного пространства. Тогда множество всех л-мерных векторов называется линейным векторным пространством и обозначается W. 87
Линейная алгебра. Курс лекций
Декларируя правила сложения и умножения для «-мерных векторов, мы должны уточнить, как следует производить эти действия над совокупностями « действительных чисел. Иначе говоря, введем операции над «-мерными векторами. Суммой двух векторов назовем вектор z = x + y такой, что Произведением действительного числа X на вектор х назовем вектор у = X х такой, что З а м е ч а н и е . Введенные согласно определению операции над «-мерными векторами аналогичны операциям над прямоугольными матрицами. Поэтому «-мерные векторы можно рассматривать как матрицы-строки или как
матрицы-столбцы X =
и совершать над векторами матрич-
ные операции. Линейная зависимость и независимость векторов Пусть каждый из векторов в наборе есть «-мерный вектор. О п р е д е л е н и е . Вектор х называется линейной комбинацией векторов ах, а2, ..., ат, если найдутся такие действительные числа что Векторы ах, а2, ..., ат называются линейно зависимыми, если существуют такие числа Хх, Xj,..., Хт, не все одновременно равные нулю, что
(4)
88
Глава 3. Векторная алгебра
Если равенство (4) выполняется только при то векторы называются линейно независимыми. ПРИМЕР. Даны два неколлинеарных вектора. Доказать, что они линейно независимы. Решение. Предположим иное: векторы линейно зависимы. Тогда существуют не равные одновременно нулю числа такие, что Пусть для определенности Разделив обе части равенства на
п о л у ч а е м . Значит, векто-
ры коллинеарны, что противоречит условию. Свойства линейной зависимости векторов 1) Если среди нескольких векторов (набора векторов) один из них есть линейная комбинация части остальных, то весь набор векторов линейно зависим. Пусть имеются векторы причем вектор , где Перенесем все члены в одну часть и дополним с л а г а е м ы м и П о л у ч и м линейную комбинацию
в которой нашлись не все одновременно равные нулю. Значит, векторы линейно зависимы. 2) Если среди набора векторов имеется нулевой вектор, то весь набор векторов линейно зависим. Пусть, например, нулевым является вектор «,. Тогда равенство (4) останется справедливым при 3) Если векторы линейно независимы и существует вектор х, являющийся линейной комбинацией, т.е. , то коэффициенты определяются по вектору х единственным образом. Пусть вектор х можно представить как две линейные комбинации с различными коэффициентами:
89
Линейная алгебра. Курс лекций
Тогда откуда Из линейной независимости векторов «,, а2, ..., ат вытекает, что а значит, ПРИМЕР.
Являются
ли
векторы
линейно зависимыми? Если да, найти всю совокупность значений коэффициентов, реализующих линейную зависимость. Решение. Составим векторное равенство Запишем его в матричном виде, представив векторы как матрицы-столбцы:
(5)
Равенство (5) есть система линейных однородных уравнений с четырьмя переменными. Составим матрицу из коэффициентов и определим ее ранг:
90
Глава 3. Векторная алгебра
Очевидно, ранг матрицы равен 3. Система (5) имеет, кроме нулевого решения бесконечное множество решений. Следовательно, векторы линейно зависимы. Далее найдем структуру бесконечного множества решений, для чего продолжим элементарные преобразования со строками матрицы по методу Гаусса — Жордана:
Отсюда следует (6)
Решение (6) представляет всю совокупность значений коэффициентов реализующих линейную зависимость векторов З а м е ч а н и е . Как видно из примера, вопрос о линейной зависимости векторов сводится к исследованию существования ненулевого решения у линейной однородной системы уравнений. § 3.3. Размерность. Базис векторного пространства Размерность векторного пространства Базис векторного пространства Разложение вектора по базису Дополнение до базиса Размерность векторного пространства О п р е д е л е н и е . Векторное пространство называется п-мерным, если среди множества его векторов найдутся п линейно независимых векторов, а любые п+1 векторов уже окажутся зависимыми. Число п называется размерностью векторного пространства. Например, среди бесконечного множества векторов, расположенных в одной плоскости, любые два неколлинеарных векто91
Линейная алгебра. Курс лекций
ра являются линейно независимыми. Выберем какие-либо два неколлинеарных вектора Добавление третьего вектора к выбранным двум делает их линейно зависимыми. Действительно, система уравнений, полученная из векторного равенства будет иметь вид
Матрица коэффициентов
имеет ранг, равный
двум, откуда следует, что один из трех столбцов есть линейная комбинация двух других. Следовательно, размерность такого линейного векторного пространства равна двум. Базис векторного пространства О п р е д е л е н и е . Упорядоченная совокупность п линейно независимых векторов n-мерного векторного пространства называется базисом этого пространства. Выбранные нами в рассмотренном выше примере в определенном порядке два неколлинеарных вектора составляют базис в двухмерном пространстве. Если векторы поменять местами, они также составят базис этого пространства, но другой. Если выбрать два других неколлинеарных вектора в определенном порядке, на них можно построить свой базис. В общем случае пусть в «-мерном векторном пространстве содержится т векторов (т > п). Количество способов выбора п линейно независимых векторов из общего числа т не превышает величины
Kpoме того, выбрав п векторов, можно построить п\ упорядоченных совокупностей. Тогда количество базисов в таком «-мерном векторном пространстве может достигать величины
Если в векторном пространстве определен базис, другие векторы могут быть выражены через этот базис. 92
Глава 3. Векторная алгебра
Разложение вектора по базису ТЕОРЕМА (о разложении вектора по базису) Каждый вектор линейного пространства можно представить, и притом единственным образом, в виде линейной комбинации векторов базиса. Пусть векторы образуют базис. Возьмем произвольный вектор х . Тогда совокупность векторов линейно зависима, т.е. найдутся такие не равные одновременно нулю числа что причем Если бы выполнялось равенство то хотя бы один из коэффициентов обязан быть не равным нулю. Но это противоречит определению линейной независимости векторов Разделим обе части уравнения на . Получим
(7) Равенство (7) есть линейная комбинация векторов базиса (У) где. Представление вектора х в виде линейной комбинации (7') является единственным в силу свойства 3 линейной зависимости векторов. • З а м е ч а н и е . Равенство (7') называется разложением вектора х п о базису а ч и с л а — координатами вектора x в этом базисе. Считая компоненты вектора его координатами, можно представить вектор х набором своих координат . Таким образом, упорядоченная совокупность действительных чисел (так определяется n-мерный вектор) есть набор координат в определенном базисе некоторого n-мерного вектора. 93
Линейная алгебра. Курс лекций
ПРИМЕР. Векторы действительных чисел
заданы совокупностями
1. Найти размерность и базис линейного пространства, в котором заданы векторы. 2. Сколько базисов можно построить на данных векторах? 3. Задав базис, разложить остальные векторы по этому базису. Решение. Составим матрицу из координат всех векторов:
1. Ранг матрицы равен двум. Только два линейно независимых столбца содержатся в этой матрице. Остальные столбцы могут быть представлены как линейные комбинации двух выбранных линейно независимых столбцов. Следовательно, размерность пространства равна двум. Базисными векторами можно выбрать векторы л, = (1, 1), а2 = (О, 1), расположив их в следующем порядке: а{, а2. 2. Число базисов, которые можно построить, не превышает величины
На самом деле их меньше. На векторах построить базис невозможно. Они коллинеарны и, следовательно, линейно зависимы: Число возможных базисов равно 28. 3 . Разложим в е к выбранному базису я,, а,. Начнем с векторов а3 и a4:
т
о
р
ы
Представим векторы равенства как матрицы-столбцы:
94
п
о
Глава 3. Векторная алгебра
В матричной форме
или в сокращенной матричной форме решение матричного уравнения имеет вид
или
Следовательно, Действуя аналогично, для векторов жения
и
получаем разло-
З а м е ч а н и е . Рассмотрим однородную линейную систему т уравнений с п переменными
имеющую ненулевые решения. Пусть ранг системы равен г. Она обладает фундаментальным набором решений (ФНР) (см. гл. 2, § 2.5 «Однородные системы уравнений»)
95
Линейная алгебра. Курс лекций
которые линейно независимы. Эти независимые решения, являющиеся совокупностями из п чисел, можно представить как «-мерные линейно независимые векторы. Любое решение системы представляется в виде линейной комбинации ФНР. Если взять векторы eXi е2, ..., еп_г в качестве базиса некоторого линейного векторного пространства, то все множество решений однородной системы и будет этим векторным пространством, называемым пространством решений однородной системы. Размерность пространства равна числу независимых векторов, т.е. п — г. Вопрос о нахождении базиса «-мерного линейного векторного пространства сводится к перебору наборов из п произвольных векторов этого пространства и изучению ранга матрицы, составленной из координат выбранных векторов. При нахождении матрицы с величиной ранга г - п соответствующие векторы можно брать как базис векторного пространства. Если уже имеются к линейно независимых векторов (к < п), возникают вопросы: 1. Можно ли создать базис в рассматриваемом векторном пространстве, опираясь на имеющиеся к векторов и дополняя их другими п - к векторами? 2. Если можно, то как это сделать? Ответ на первый вопрос дает следующая теорема.
Дополнение до базиса ТЕОРЕМА (о дополнении до базиса) Пусть векторы линейного пространства W размерности п линейно независимы, причем . Тогда в пространстве W найдутся векторы такие, что совокупность п векторов составит базис этого пространства. Пусть х — произвольный вектор линейного векторного пространства W. Представить любой вектор х в виде линейной комбинации векторов нельзя, так как в противном случае совокупность векторов была бы базисом. Однако в силу условия это невозможно. Поэтому должен су96
Глава 3. Векторная алгебра
шествовать вектор такой, что дополненная система векторов будет линейно независимой. Если то эта система является базисом пространства W Если следует повторить рассуждения с векторами Следовательно, любая заданная совокупность линейно независимых векторов может быть дополнена до базиса векторного пространства. • Перейдем к методу дополнения к линейно независимых векторов до базиса. Пусть даны векторы Составим из координат векторов матрицу, расположив для удобства координаты векторов по строкам:
Поскольку векторы линейно независимы и к < п, элементарными преобразованиями строк матрица приводится к ступенчатому виду. Дополним полученную матрицу п — к строками вида (О, ..., 1, ..., 0) так, чтобы ранг новой матрицы, например такой:
стал равен п. Тогда векторы вместе с векторами координаты которых расположены в последних п - к строках матрицы, составят базис n-мерного линейного векторного пространства. Замечание. Дополнение векторов до базиса произвольными векторами 97
Линейная алгебра. Курс лекций
соответствующей размерности может не дать п линейно независимых векторов. ПРИМЕР. Дополнить набор векторов Й,=(1 2 -1 0), а 2 = ( - 1 1 -2 1) четырехмерного векторного пространства до базиса этого пространства. Решение. Если выбирать векторы с произвольными координатами, дополняя базис, среди них могут оказаться векторы, являющиеся линейными комбинациями данных векторов. Например, вектором а 3 =(2 1 1 -1) нельзя дополнить базис, поскольку а3=а{-а2. Составим матрицу из координат данных векторов, приведем ее к ступенчатому виду и дополним ее двумя строками, чтобы она приняла вид
Векторы линейно независимы и составляют базис четырехмерного пространства. В векторном пространстве не всегда удобно работать с уже заданным базисом. Например, если вектор задан в базисе (рис. 3.7), имеет смысл перейти к другому базису, составленному из единичных и взаимно перпендикулярных векторов. В новом базисе вектор имеет координаты . Возникает вопрос: как, зная координаты вектора в старом базисе и взаимное расположение векторов старого и нового базисов, вычислить координаты вектора в новом базисе?
Глава 3. Векторная алгебра
§ 3.4. Переход к новому базису Матрица перехода к новому базису Свойства матрицы перехода Матрица перехода к новому базису Пусть — старый и новый базисы линейного n-мерного векторного пространства W. Каждый из векторов нового базиса можно выразить через векторы старого базиса:
а также представить в матричной форме:
(8)
или в сокращенной матричной форме: Матрица
называется матрицей перехода от старого базиса e к новому базису е'. Замечание. Следует обратить внимание на то, что координаты разложения векторов нового базиса по старому базису располагаются в матрице перехода по столбцам. 99
Линейная алгебра. Курс лекций
Свойства матрицы перехода 1) Матрица перехода является невырожденной, т.е. |Г| * 0. Действительно, из равенства \Т\ = 0 следует, что один из столбцов матрицы Т является линейной комбинацией остальных столбцов. Тогда один из векторов есть линейная комбинация других векторов этого базиса, что невозможно. 2) Матрица перехода от нового базиса к старому имеет вид Т~]. Умножив равенство (8) на Т~ справа, получим
Найдем зависимость между координатами вектора в разных базисах. Пусть некоторый вектор х имеет координаты (х,, х>, ..., хп) в старом базисе и координаты (х,', х'2, ..., х,') в новом базисе. Тогда Подставив в это выражение разложения векторов (е[, е'7, ..., е'п) по базису (ех, е2, ..., еп), получим
Перенесем все влево и сгруппируем слагаемые с одинаковыми сомножителями е':
Это равенство выполняется при условии, что все коэффициенты перед равны нулю. Следовательно,
100
Глава 3. Векторная алгебра
В матричной форме
или Х= Т X'.
Координаты вектора в новом базисе выражаются через координаты вектора в старом базисе: В развернутой матричной форме
ПРИМЕР. Векторы заданы своими координатами в старом базисе Выразить координаты вектора х в новом базисе Решение. Матрица перехода от старого базиса к новому базису имеет вид
Вычисляется обратная матрица:
Координаты вектора в новом базисе:
101
Линейная алгебра. Курс лекций
§ 3.5. Линейные подпространства > > > > >
Линейные подпространства Сумма и пересечение линейных подпространств Свойства суммы и пересечения линейных подпространств Линейная оболочка Свойства линейной оболочки Линейные подпространства
Из множества векторов линейного пространства W выберем некоторую совокупность векторов и обозначим ее V. Пусть для любых векторов x и у из V И любого числа R выполняются следующие условия: 1) 2) Тогда множество векторов V называется линейным подпространством пространства W. Примеры линейных подпространств: 1. Каждое линейное пространство обладает двумя подпространствами: нулевым подпространством и самим пространством. Эти подпространства называют тривиальными. 2. Линейное пространство Wx векторов на прямой, проходящей через начало координат, имеет два тривиальных подпространства. 3. Линейное пространство W2 векторов на плоскости (рис. 3.8) имеет, кроме двух тривиальных подпространств, беско-
Рис. 3.8
102
Глава 3. Векторная алгебра
нечное множество подпространств V{, V2, .... Каждое из них состоит из векторов, которые лежат на прямой, проходящей через начало координат (предполагается, что все векторы отложены от начала координат). 4. В геометрическом пространстве W3 векторов пространства каждая прямая и каждая плоскость, проходящие через начало координат, определяют линейное подпространство. Сумма и пересечение линейных подпространств Суммой Vx + V2 линейных подпространств Ух и У2 линейного пространства W называется совокупность всех векторов а е W, которые можно представить в виде (разложить)
Если для каждого вектора а это разложение единственное, сумма линейных подпространств V{ и V2 называется прямой и записывается в виде Пересечением линейных подпространств F, и V2 линейного пространства W называется совокупность всех векторов b, которые принадлежат одновременно подпространствам V{\\ V2. На рис. 3.9 пересечению подпространств V] и V2 геометрического пространства \¥ъ принадлежат векторы А, и Ь-,.
Линейная алгебра. Курс лекций
Свойства суммы и пересечения линейных подпространств 1) Сумма и пересечение линейных подпространств являются линейными подпространствами. 2) Размерность суммы линейных подпространств равна сумме размерностей подпространств минус размерность их пересечения. Линейная оболочка О п р е д е л е н и е . Линейной оболочкой двух векторов дс, и х2, принадлежащих линейному пространству W, называется совокупность всех линейных комбинаций этих векторов
Иначе говоря, линейная оболочка состоит из бесконечного множества векторов а, представимых в виде линейных комбинаций векторов JCJ и х2. На рис. 3.10 построены векторы xlnx2,a также приведено несколько их линейных комбинаций я,, ..., а5. В общем случае линейной оболочкой множества X векторов, принадлежащих линейному пространству W, называется совокупность всех линейных комбинаций этих векторов
Глава 3. Векторная алгебра Свойства линейной оболочки 1) Линейная оболочка содержит само множество X. 2) Если линейное пространство W содержит множество X, то: а) пространство W содержит и его линейную оболочку L(X); б) L(X) — линейное подпространство пространства W. ПРИМЕР. Н айти линейную оболочку множества решений системы уравнений
Решение. Ранг матрицы коэффициентов системы уравнений равен 2. Выберем свободными переменными х2 и х4. Тогда общее решение однородной системы уравнений имеет вид
Векторы образуют фундаментальный набор решений однородной системы. Любое решение системы является их линейной комбинацией. Значит, линейная оболочка векторов и и есть множество решений однородной системы уравнений, т.е. § 3.6. Евклидовы пространства Евклидовы пространства Свойства длины вектора Ортонормированная система векторов Ортогональное дополнение Свойства ортогонального дополнения Евклидовы пространства Введенное нами линейное векторное пространство не содержит информации о том, как измерять длины и углы в этом пространстве. Иначе говоря, оно не содержит метрики. Неожидан105
Линейная алгебра. Курс лекций
ной на первый взгляд является возможность решить этот вопрос, если ввести понятие скалярного произведения. Определение. Линейное векторное пространство W называется евклидовым, если любым двум векторам х и у из W ставится в соответствие число, обозначаемое как (х, у), причем выполняются следующие условия:
4) если х — ненулевой вектор; (х, х) - О, если х — нулевой вектор. Евклидовым линейное пространство названо по имени древнегреческого математика Евклида, создавшего в 3 в. до н. э. Евклидову геометрию — «первое приближение для описания структуры реального физического пространства» (БСЭ). Определение. Число (х, у) называется скалярным произведением векторов х и у. Поскольку векторы задаются набором своих координат, надо определить, какие действия следует совершить с координатами векторов, чтобы получить число (х, у). Определим скалярное произведение векторов и формулой Заданное таким образом скалярное произведение n-мерных векторов для случая п - 2 или п - 3 обращается в рассмотренное ранее скалярное произведение геометрических векторов. Теперь появляется возможность определить длины и углы в пространстве. Замечание. Очевидно, что из равенства х = у следует равенство Переход от равенства векторов к равенству скалярных произведений назовем скалярным умножением. О п р е д е л е н и е . Длиной (нормой) вектора х в евклидовом пространстве называется величина В двух- или трехмерном евклидовом пространстве длина вектора имеет ясный геометрический смысл. Однако в четырех-, пяти- или «-мерном евклидовом пространстве смысл длины вектора теряется. Поэтому вместо длины вектора часто вводят понятие нормы вектора. 106
Глава 3. Векторная алгебра
О п р е д е л е н и е . Углом между ненулевыми векторами х и у евклидова пространства называется число определяемое из равенства (9) Определение требует доказательства того, что для любых пар ненулевых векторов х и у, о чем речь пойдет ниже. Свойства длины вектора 1) Если вектор х нулевой, т.е. и обратно: если
то его длина то вектор х ну-
левой. 2) Действительно,
3) — неравенство Коши — Буняковского. Для доказательства введем параметр По определению скалярного произведения, неравенство верно для любых векторов х и у. Преобразуем неравенство к квадратному относительно t: При неравенство верно. Следовательно, дискриминант квадратного трехчлена должен быть меньше либо равен нулю: Отсюда
З а м е ч а н и е . Из неравенства Коши — Буняковского следует
Определение утла в (9) становится коррект-
ным. 107
Линейная алгебра. Курс лекций
— неравенство треугольника. С одной стороны, С другой стороны, Воспользуемся неравенством Тогда
Значит,
Извлечем квадратный корень и в результате получим неравенство треугольника. Определившись с длинами и углами, используем новые открывающиеся возможности в развитии векторной алгебры. Два ненулевых вектора х и у называются ортогональными, если их скалярное произведение равно нулю, т. е. (х, у) = 0. Из равенства
следует, что
или угол
. Для двух- или трехмерного пространства ортогональность векторов означает, что они взаимно перпендикулярны. Для ортогональных векторов неравенство в свойстве 4 заменяется равенством
Ортонормированная система векторов Система векторов называется ортогональной, если при и нормированной, е с л и д л я всех Если векторы системы ортогональны и нормированы, они называются ортонормированными. 108
Глава 3. Векторная алгебра Замечание. Чтобы нормировать ненулевой вектор, необходимо разделить его на норму. Пусть задан вектор Его норма
. Нормированный вектор имеет
вид
Его длина
ТЕОРЕМА (о независимости ортонормированной системы векторов) Ортонормированная система векторов линейно независима. Л Докажем, что ортогональные и нормированные векторы линейно независимы, т.е. докажем, что равенство справедливо лишь при венства скалярно на вектор е] получим
Умножив обе части ра-
или Отсюда следует скалярно на
Умножая последовательно равенство будем иметь
ТЕОРЕМА (о существовании ортобазиса) Во всяком n-мерном евклидовом пространстве существует ортонормированный базис. Ч Доказательство теоремы представляет собой алгоритм последовательного построения ортонормированного базиса по заданному базису названный методом ортогонализации. Положим вектор
и нормируем его:
, получив
первый вектор ортонормированного базиса. Построим вектор (10) так, чтобы он был ортогонален вектору . Должно выполняться условие Из этого условия найдем . Умножив скалярно равенство (10) на , получим 109
Линейная алгебра. Курс лекций
откуда а, =(/ 2 , е,) . Тем самым вектор g 2 =/ 2 -(/ 2 , е,)^ станет ортогональным вектору е,. Тогда вторым вектором ортонормированного базиса станет вектор е2 - ~ . §2
Пользуясь найденными векторами ех, е2 и заданным вектором / 3 , построим вектор (11) ортогональный единичным векторам с, и е2, для чего умножим скалярно равенство (11) последовательно на с , и е 2 и приравняем к нулю:
Поскольку
, получим
Теперь вычислим вектор:
Затем нормируем его, сделав третьим вектором ортонормированного базиса по заданному базису базис (или ортобазис)
Продолжая процесс ортогонализации, построим ортонормированный
З а м е ч а н и е . Если векторы х и у разложены по произвольному базису (7'):
то скалярное произведение векторов, имея и2 слагаемых, выглядит довольно громоздко: 110
Глава 3. Векторная алгебра
В ортонормированием базисе е,, е2,..., еп скалярное произведение векторов вычисляется просто:
В частности,
Тогда длина вектора равна
ПРИМЕР. Методом ортогонализации построить ортонормированный базис по базису евклидова пространства Решение. Положим вектор
и нормируем его:
Построим вектор вие . Получим
так, чтобы выполнялось усло-
откуда Вычислим вектор g2:
Нормируем вектор g2:
111
Линейная алгебра. Курс лекций
Векторы е, и е2 образуют ортонормированный базис евклидова пространства. Проверка:
Ортогональное дополнение Пусть задано евклидово пространство W и пусть — некоторое линейное подпространство евклидова пространства W. О п р е д е л е н и е . Совокупность векторов у пространства W, обладающих свойством где х — произвольный вектор из называется ортогональным дополнением к подпространству На рис. 3.11 изображено трехмерное евклидово пространство. В нем стрелками указаны векторы, из которых состоит ортогональное дополнение и которые ортогональны всем векторам из линейного подпространства В изображении векторов мы отказались от соглашения об откладывании всех векторов от начала координат.
Рис. 3.11
112
Глава 3. Векторная алгебра
Свойства ортогонального дополнения х
1) Ортогональное дополнение V есть линейное подпространство евклидова пространства W. Пусть векторы ух и у2 принадлежат Vх, вектор х — произвольный вектор из V. Тогда (ylt х) = (у2, х) = 0 • Сложив скалярные произведения, получим Следовательно, у] +у2 е Vх. Если (у, х) = 0 , то и (а-у, х) = 0, где а <= R, т.е из yzVL следует a -у &VX. 2) Линейное пространство W есть прямая сумма подпространств Vе и Vх, т.е. не содержит пересечений V и Vх. Пусть ех, е2, ..., ek — ортонормированный базис У: eh el+l, ..., ер— ортонормированный базис Vх. Среди системы векторов ех, е2, ..., еь eh el+], ...,ер нет одинаковых, и эта система ортонормированна, следовательно, линейно независима. Докажем, что она образует базис я-мерного евклидова пространства. Предположим, что это не так, что число (1 + 2 + ... + /:) + (/ + (/ + 1) + ... + р)<п. Тогда существует вектор JC пространства, такой, что система векторов ех, е2,..., еь eb el+l, ..., ер, х линейно независима. Применим к этой системе процесс ортогонализации. Построенный на осно1 ве х вектор ер+1 будет ортогонален ех, е2, ..., ек, значит, е^ е V . С другой стороны, вектор е^ ортогонален eh eM, ..., ер, значит, су, 1 V . Таким свойством обладает только нулевой вектор. Поэтому е ^ = о. Отсюда вытекает линейная зависимость ех, е2,..., ек, eh el+], ..., ер, х, что противоречит допущению. Таким образом, система векторов even,...,ek, eh e!+],..., ер является базисом «-мерного евклидова пространства, т.е. 1 + 2 + ... + & + / + (/ + 1) + ... + р = п . Из свойства 2 следует, что любой вектор пространства W можно представить, причем единственным образом, в виде суммы векторов из К= и V1: а = х + у.
Свойство 2 в общем виде можно записать так: 113
Линейная алгебра. Курс лекций
Вектор х е V называется ортогональной проекцией вектора а на линейное подпространство V", а вектор у е V1 — его ортогональной составляющей (рис. 3.11).
Если задан вектор а и известен ортонормированный базис е,, е2, ••-,ек подпространства V=, то могут быть найдены ортогональная проекция и ортогональная составляющая вектора а. Разложим искомый вектор JC e V по базису е}, е2, ..., ек с неизвестными пока коэффициентами разложения X., Д 2 , ..., А,А.: Представим вектор а в виде суммы ортогональной проекции д: и ортогональной составляющей у: Умножим обе части последнего равенства скалярно на вектор ех: откуда первый коэффициент разложения действия с векторами енты х£ Г представляется как
Повторив
получим остальные коэффициСледовательно, искомый вектор (12)
L
а вектор у е V — как
Аналогично решается задача нахождения ортогональной проекции и ортогональной составляющей вектора а при заданном векторе а и известном ортонормированном базисе ех, е9, ..., ек, подпространства V1. ПРИМЕР. Подпространство V= линейного четырехмерного пространства ^задано системой уравнений
Найти ортогональную проекцию вектора а = (1, —2, —1, 0) на подпространство V и его ортогональную составляющую. 114
Глава 4. Линейные отображения Отсюда следует, что а^ — Xt, если / —j и atj — 0, если /V/ Поэтому в базисе, составленном из собственных векторов, матрица оператора будет иметь диагональный вид:
§ 4.4. Симметричный оператор > Симметричный оператор > Ортогональность собственных векторов Симметричный оператор Определение. Линейный оператор Р в евклидовом пространстве R" называется симметричным, если для любых векторов JC и у из пространства R" выполняется равенство
ТЕОРЕМА (об условии симметричности оператора) Для того чтобы линейный оператор был симметричен, необходимо и достаточно, чтобы его матрица в ортонормированном базисе была симметрична. < Рассмотрим для простоты евклидово пространство R2. Пусть в ортобазисе е,, е2 заданы векторы х = (х], х2), у = (у}, у2). Линейные операторы Р{ и Р2 определены своими матрицами: . Вычислим векторы Р^х) и Р2(у):
131
Линейная алгебра. Курс лекций
Координаты вектора Координатами вектора а в декартовой системе координат называются координаты его конечной точки при условии, что начальная точка вектора лежит в начале координат. В дальнейшем по умолчанию будем считать, что все векторы отложены от начала координат. На рис. 3.3 координатами вектора а на плоскости ОХУ являются два числа JC, и у{, что обычно записывается в виде Запишем линейные операции над векторами в координатах. Рис. 3.3 Пусть заданы векторы и Ь = (х2,у2).
Скалярное произведение векторов О п р е д е л е н и е . Скалярным произведением двух векторов называется произведение модулей этих векторов, умноженное на косинус угла между векторами и обозначаемое (а, Ь): (1) Найдем скалярное произведение, выраженное через координаты векторов. На координатной плоскости построим векторы и Они образуют треугольник, изображенный на рис. 3.4. По теореме косинусов найдем длину стороны, образуемой вектором с:
Отсюда следует
82
Глава 3. Векторная алгебра
Выразим векторы через их координаты:
Тогда
Раскроем скобки и приведем подобные. Получим (2) т.е. скалярное произведение двух векторов равно сумме произведений соответствующих координат этих векторов. Рассмотрим некоторые следствия формулы (2). 1) В скалярном произведении положим а = Ь. Тогда
т.е. скалярный квадрат вектора равен квадрату его длины. 2) Найдем из равенства (1) величину
3) Пусть вектор Ь направлен вдоль оси ОХ и имеет единичную длину Тогда для всякого в е к т о р а в е личина
описывает косинус угла между вектором а и положительным направлением оси ОХ. Точно так же при направлении единичного вектора Ь вдоль оси ОУ(b = (О, 1)) величина
описывает косинус угла между вектором а и положительным направлением оси ОУ (рис. 3.5); называются направляющими косинусами вектора а. 83
Линейная алгебра. Курс лекций
Свойства скалярного произведения 1)(a,b) = (b,a). Справедливость свойства вытекает из формулы (1), если учесть четность функции 2) Пусть векторы а, b, с заданы своими координатами Запишем скалярное произведение (я + Ь, с) в координатах:
Выражения, представленные в скобках, есть соответственно скалярные произведения (а, с) и (b, с). Отсюда следует свойство 2. 3) Действительно,
При
имеем
Правые части трех равенств
равны При имеем т.е. опять получаем равенство правых частей. При свойство 3 очевидно. Векторы в трехмерном пространстве В трехмерном пространстве вектор задается тремя числами: Линейные операции над векторами и в пространстве аналогичны операциям над векторами на плоскости:
84
Глава 3. Векторная алгебра
6) направляющие косинусы вектора а равны:
где — углы между вектором а и положительными направлениями осей Ox, Oy, Oz соответственно (рис. 3.6), причем З а м е ч а н и е . Пусть вектор ным, т.е.
является единич-
В этом случае
Следовательно, единичный вектор полностью задается своими направляющими косинусами Пусть заданы векторы единичной длины i,j, к, направленные вдоль осей х, у, z соответственно (рис. 3.6). Они обладают следующими свойствами. 1) Заданные в координатах, они имеют вид i = (1, 0, 0), j = 2) Матрица, составленная из координат векторов
имеет ранг, равный 3. Отсюда следует, что строки линейно независимы. На этом основании будем считать геометрические векторы i,j, k линейно независимыми. 3) Векторы i,j, к перпендикулярны друг к другу (взаимно ортогональны). 4)Пусть задан произвольный в е к т о р В е к т о р ы лежат на соответствующих координатных осях, а их сумма по правилу параллелограмма равна
(3)
Линейная алгебра. Курс лекций
Тройка векторов, обладающих перечисленными свойствами, называется ортонормированным базисом (ортобазысом). Всякий вектор может быть разложен по ортонормированному базису. Формула (3) называется разложением вектора а по векторам i,j, k. ПРИМЕР. Найти скалярное произведение двух векторов
Решение. Запишем скалярное произведение векторов а и Ь\ Пользуясь вторым свойством скалярного произведения, находим
Учитывая, что получаем § 3.2. Линейные векторные пространства Понятие линейного векторного пространства Вектор в n-мерном пространстве Линейная зависимость и независимость векторов Свойства линейной зависимости векторов Понятие линейного векторного пространства Для дальнейшего изучения векторного анализа нам понадобится понятие векторного пространства. О п р е д е л е н и е . Множество W элементов . называется линейным пространством, если по некоторому правилу: 1. Любым двум элементам х и у из W поставлен в соответствие элемент из W, обозначаемый х + у и называемый суммой элементов X И >'. 2. Любому элементу х из W и каждому числу поставлен в соответствие элемент из W, обозначаемый • х и называемый про86
Глава 3. Векторная алгебра
изведением числа X на элемент х, причем справедливы следующие аксиомы:
7) существует нулевой элемент 0 такой, что х + 0 = х для любого х е W; 8) для каждого элемента х существует противоположный элемент — х такой, что х+ (—х) = 0. Элементы любой природы, удовлетворяющие двум правилам и восьми аксиомам, по определению, образуют линейное пространство. Например, совокупность любых матриц размера т х л образует линейное пространство, поскольку для них выполнены оба правила и все аксиомы. Легко проверить, что совокупность геометрических векторов, например трехмерного пространства, также является линейным пространством. Линейное пространство называется пустым, если оно состоит из нулевого элемента. Вектор в n-мерном пространстве О п р е д е л е н и е , п-мерным вектором называется математический объект, который состоит из упорядоченной совокупности действительных чисел, называемых компонентами вектора, и записывается в виде Название «л-мерный вектор» связано с тем, что при п = 2 или л = 3 совокупность чисел можно интерпретировать как совокупность координат вектора на плоскости или в пространстве. Два n-мерных вектора называются равными, если равны все компоненты векторов, т.е. Пусть для л-мерных векторов выполнены правила сложения и умножения на число, удовлетворяющие аксиомам линейного пространства. Тогда множество всех л-мерных векторов называется линейным векторным пространством и обозначается W. 87
Линейная алгебра. Курс лекций
Декларируя правила сложения и умножения для «-мерных векторов, мы должны уточнить, как следует производить эти действия над совокупностями « действительных чисел. Иначе говоря, введем операции над «-мерными векторами. Суммой двух векторов назовем вектор z = x + y такой, что Произведением действительного числа X на вектор х назовем вектор у = X х такой, что З а м е ч а н и е . Введенные согласно определению операции над «-мерными векторами аналогичны операциям над прямоугольными матрицами. Поэтому «-мерные векторы можно рассматривать как матрицы-строки или как
матрицы-столбцы X =
и совершать над векторами матрич-
ные операции. Линейная зависимость и независимость векторов Пусть каждый из векторов в наборе есть «-мерный вектор. О п р е д е л е н и е . Вектор х называется линейной комбинацией векторов ах, а2, ..., ат, если найдутся такие действительные числа что Векторы ах, а2, ..., ат называются линейно зависимыми, если существуют такие числа Хх, Xj,..., Хт, не все одновременно равные нулю, что
(4)
88
Глава 3. Векторная алгебра
Если равенство (4) выполняется только при то векторы называются линейно независимыми. ПРИМЕР. Даны два неколлинеарных вектора. Доказать, что они линейно независимы. Решение. Предположим иное: векторы линейно зависимы. Тогда существуют не равные одновременно нулю числа такие, что Пусть для определенности Разделив обе части равенства на
п о л у ч а е м . Значит, векто-
ры коллинеарны, что противоречит условию. Свойства линейной зависимости векторов 1) Если среди нескольких векторов (набора векторов) один из них есть линейная комбинация части остальных, то весь набор векторов линейно зависим. Пусть имеются векторы причем вектор , где Перенесем все члены в одну часть и дополним с л а г а е м ы м и П о л у ч и м линейную комбинацию
в которой нашлись не все одновременно равные нулю. Значит, векторы линейно зависимы. 2) Если среди набора векторов имеется нулевой вектор, то весь набор векторов линейно зависим. Пусть, например, нулевым является вектор «,. Тогда равенство (4) останется справедливым при 3) Если векторы линейно независимы и существует вектор х, являющийся линейной комбинацией, т.е. , то коэффициенты определяются по вектору х единственным образом. Пусть вектор х можно представить как две линейные комбинации с различными коэффициентами:
89
Линейная алгебра. Курс лекций
Тогда откуда Из линейной независимости векторов «,, а2, ..., ат вытекает, что а значит, ПРИМЕР.
Являются
ли
векторы
линейно зависимыми? Если да, найти всю совокупность значений коэффициентов, реализующих линейную зависимость. Решение. Составим векторное равенство Запишем его в матричном виде, представив векторы как матрицы-столбцы:
(5)
Равенство (5) есть система линейных однородных уравнений с четырьмя переменными. Составим матрицу из коэффициентов и определим ее ранг:
90
Глава 3. Векторная алгебра
Очевидно, ранг матрицы равен 3. Система (5) имеет, кроме нулевого решения бесконечное множество решений. Следовательно, векторы линейно зависимы. Далее найдем структуру бесконечного множества решений, для чего продолжим элементарные преобразования со строками матрицы по методу Гаусса — Жордана:
Отсюда следует (6)
Решение (6) представляет всю совокупность значений коэффициентов реализующих линейную зависимость векторов З а м е ч а н и е . Как видно из примера, вопрос о линейной зависимости векторов сводится к исследованию существования ненулевого решения у линейной однородной системы уравнений. § 3.3. Размерность. Базис векторного пространства Размерность векторного пространства Базис векторного пространства Разложение вектора по базису Дополнение до базиса Размерность векторного пространства О п р е д е л е н и е . Векторное пространство называется п-мерным, если среди множества его векторов найдутся п линейно независимых векторов, а любые п+1 векторов уже окажутся зависимыми. Число п называется размерностью векторного пространства. Например, среди бесконечного множества векторов, расположенных в одной плоскости, любые два неколлинеарных векто91
Линейная алгебра. Курс лекций
ра являются линейно независимыми. Выберем какие-либо два неколлинеарных вектора Добавление третьего вектора к выбранным двум делает их линейно зависимыми. Действительно, система уравнений, полученная из векторного равенства будет иметь вид
Матрица коэффициентов
имеет ранг, равный
двум, откуда следует, что один из трех столбцов есть линейная комбинация двух других. Следовательно, размерность такого линейного векторного пространства равна двум. Базис векторного пространства О п р е д е л е н и е . Упорядоченная совокупность п линейно независимых векторов n-мерного векторного пространства называется базисом этого пространства. Выбранные нами в рассмотренном выше примере в определенном порядке два неколлинеарных вектора составляют базис в двухмерном пространстве. Если векторы поменять местами, они также составят базис этого пространства, но другой. Если выбрать два других неколлинеарных вектора в определенном порядке, на них можно построить свой базис. В общем случае пусть в «-мерном векторном пространстве содержится т векторов (т > п). Количество способов выбора п линейно независимых векторов из общего числа т не превышает величины
Kpoме того, выбрав п векторов, можно построить п\ упорядоченных совокупностей. Тогда количество базисов в таком «-мерном векторном пространстве может достигать величины
Если в векторном пространстве определен базис, другие векторы могут быть выражены через этот базис. 92
Глава 3. Векторная алгебра
Разложение вектора по базису ТЕОРЕМА (о разложении вектора по базису) Каждый вектор линейного пространства можно представить, и притом единственным образом, в виде линейной комбинации векторов базиса. Пусть векторы образуют базис. Возьмем произвольный вектор х . Тогда совокупность векторов линейно зависима, т.е. найдутся такие не равные одновременно нулю числа что причем Если бы выполнялось равенство то хотя бы один из коэффициентов обязан быть не равным нулю. Но это противоречит определению линейной независимости векторов Разделим обе части уравнения на . Получим
(7) Равенство (7) есть линейная комбинация векторов базиса (У) где. Представление вектора х в виде линейной комбинации (7') является единственным в силу свойства 3 линейной зависимости векторов. • З а м е ч а н и е . Равенство (7') называется разложением вектора х п о базису а ч и с л а — координатами вектора x в этом базисе. Считая компоненты вектора его координатами, можно представить вектор х набором своих координат . Таким образом, упорядоченная совокупность действительных чисел (так определяется n-мерный вектор) есть набор координат в определенном базисе некоторого n-мерного вектора. 93
Линейная алгебра. Курс лекций
ПРИМЕР. Векторы действительных чисел
заданы совокупностями
1. Найти размерность и базис линейного пространства, в котором заданы векторы. 2. Сколько базисов можно построить на данных векторах? 3. Задав базис, разложить остальные векторы по этому базису. Решение. Составим матрицу из координат всех векторов:
1. Ранг матрицы равен двум. Только два линейно независимых столбца содержатся в этой матрице. Остальные столбцы могут быть представлены как линейные комбинации двух выбранных линейно независимых столбцов. Следовательно, размерность пространства равна двум. Базисными векторами можно выбрать векторы л, = (1, 1), а2 = (О, 1), расположив их в следующем порядке: а{, а2. 2. Число базисов, которые можно построить, не превышает величины
На самом деле их меньше. На векторах построить базис невозможно. Они коллинеарны и, следовательно, линейно зависимы: Число возможных базисов равно 28. 3 . Разложим в е к выбранному базису я,, а,. Начнем с векторов а3 и a4:
т
о
р
ы
Представим векторы равенства как матрицы-столбцы:
94
п
о
Глава 3. Векторная алгебра
В матричной форме
или в сокращенной матричной форме решение матричного уравнения имеет вид
или
Следовательно, Действуя аналогично, для векторов жения
и
получаем разло-
З а м е ч а н и е . Рассмотрим однородную линейную систему т уравнений с п переменными
имеющую ненулевые решения. Пусть ранг системы равен г. Она обладает фундаментальным набором решений (ФНР) (см. гл. 2, § 2.5 «Однородные системы уравнений»)
95
Линейная алгебра. Курс лекций
которые линейно независимы. Эти независимые решения, являющиеся совокупностями из п чисел, можно представить как «-мерные линейно независимые векторы. Любое решение системы представляется в виде линейной комбинации ФНР. Если взять векторы eXi е2, ..., еп_г в качестве базиса некоторого линейного векторного пространства, то все множество решений однородной системы и будет этим векторным пространством, называемым пространством решений однородной системы. Размерность пространства равна числу независимых векторов, т.е. п — г. Вопрос о нахождении базиса «-мерного линейного векторного пространства сводится к перебору наборов из п произвольных векторов этого пространства и изучению ранга матрицы, составленной из координат выбранных векторов. При нахождении матрицы с величиной ранга г - п соответствующие векторы можно брать как базис векторного пространства. Если уже имеются к линейно независимых векторов (к < п), возникают вопросы: 1. Можно ли создать базис в рассматриваемом векторном пространстве, опираясь на имеющиеся к векторов и дополняя их другими п - к векторами? 2. Если можно, то как это сделать? Ответ на первый вопрос дает следующая теорема.
Дополнение до базиса ТЕОРЕМА (о дополнении до базиса) Пусть векторы линейного пространства W размерности п линейно независимы, причем . Тогда в пространстве W найдутся векторы такие, что совокупность п векторов составит базис этого пространства. Пусть х — произвольный вектор линейного векторного пространства W. Представить любой вектор х в виде линейной комбинации векторов нельзя, так как в противном случае совокупность векторов была бы базисом. Однако в силу условия это невозможно. Поэтому должен су96
Глава 3. Векторная алгебра
шествовать вектор такой, что дополненная система векторов будет линейно независимой. Если то эта система является базисом пространства W Если следует повторить рассуждения с векторами Следовательно, любая заданная совокупность линейно независимых векторов может быть дополнена до базиса векторного пространства. • Перейдем к методу дополнения к линейно независимых векторов до базиса. Пусть даны векторы Составим из координат векторов матрицу, расположив для удобства координаты векторов по строкам:
Поскольку векторы линейно независимы и к < п, элементарными преобразованиями строк матрица приводится к ступенчатому виду. Дополним полученную матрицу п — к строками вида (О, ..., 1, ..., 0) так, чтобы ранг новой матрицы, например такой:
стал равен п. Тогда векторы вместе с векторами координаты которых расположены в последних п - к строках матрицы, составят базис n-мерного линейного векторного пространства. Замечание. Дополнение векторов до базиса произвольными векторами 97
Линейная алгебра. Курс лекций
соответствующей размерности может не дать п линейно независимых векторов. ПРИМЕР. Дополнить набор векторов Й,=(1 2 -1 0), а 2 = ( - 1 1 -2 1) четырехмерного векторного пространства до базиса этого пространства. Решение. Если выбирать векторы с произвольными координатами, дополняя базис, среди них могут оказаться векторы, являющиеся линейными комбинациями данных векторов. Например, вектором а 3 =(2 1 1 -1) нельзя дополнить базис, поскольку а3=а{-а2. Составим матрицу из координат данных векторов, приведем ее к ступенчатому виду и дополним ее двумя строками, чтобы она приняла вид
Векторы линейно независимы и составляют базис четырехмерного пространства. В векторном пространстве не всегда удобно работать с уже заданным базисом. Например, если вектор задан в базисе (рис. 3.7), имеет смысл перейти к другому базису, составленному из единичных и взаимно перпендикулярных векторов. В новом базисе вектор имеет координаты . Возникает вопрос: как, зная координаты вектора в старом базисе и взаимное расположение векторов старого и нового базисов, вычислить координаты вектора в новом базисе?
Глава 3. Векторная алгебра
§ 3.4. Переход к новому базису Матрица перехода к новому базису Свойства матрицы перехода Матрица перехода к новому базису Пусть — старый и новый базисы линейного n-мерного векторного пространства W. Каждый из векторов нового базиса можно выразить через векторы старого базиса:
а также представить в матричной форме:
(8)
или в сокращенной матричной форме: Матрица
называется матрицей перехода от старого базиса e к новому базису е'. Замечание. Следует обратить внимание на то, что координаты разложения векторов нового базиса по старому базису располагаются в матрице перехода по столбцам. 99
Линейная алгебра. Курс лекций
Свойства матрицы перехода 1) Матрица перехода является невырожденной, т.е. |Г| * 0. Действительно, из равенства \Т\ = 0 следует, что один из столбцов матрицы Т является линейной комбинацией остальных столбцов. Тогда один из векторов есть линейная комбинация других векторов этого базиса, что невозможно. 2) Матрица перехода от нового базиса к старому имеет вид Т~]. Умножив равенство (8) на Т~ справа, получим
Найдем зависимость между координатами вектора в разных базисах. Пусть некоторый вектор х имеет координаты (х,, х>, ..., хп) в старом базисе и координаты (х,', х'2, ..., х,') в новом базисе. Тогда Подставив в это выражение разложения векторов (е[, е'7, ..., е'п) по базису (ех, е2, ..., еп), получим
Перенесем все влево и сгруппируем слагаемые с одинаковыми сомножителями е':
Это равенство выполняется при условии, что все коэффициенты перед равны нулю. Следовательно,
100
Глава 3. Векторная алгебра
В матричной форме
или Х= Т X'.
Координаты вектора в новом базисе выражаются через координаты вектора в старом базисе: В развернутой матричной форме
ПРИМЕР. Векторы заданы своими координатами в старом базисе Выразить координаты вектора х в новом базисе Решение. Матрица перехода от старого базиса к новому базису имеет вид
Вычисляется обратная матрица:
Координаты вектора в новом базисе:
101
Линейная алгебра. Курс лекций
§ 3.5. Линейные подпространства > > > > >
Линейные подпространства Сумма и пересечение линейных подпространств Свойства суммы и пересечения линейных подпространств Линейная оболочка Свойства линейной оболочки Линейные подпространства
Из множества векторов линейного пространства W выберем некоторую совокупность векторов и обозначим ее V. Пусть для любых векторов x и у из V И любого числа R выполняются следующие условия: 1) 2) Тогда множество векторов V называется линейным подпространством пространства W. Примеры линейных подпространств: 1. Каждое линейное пространство обладает двумя подпространствами: нулевым подпространством и самим пространством. Эти подпространства называют тривиальными. 2. Линейное пространство Wx векторов на прямой, проходящей через начало координат, имеет два тривиальных подпространства. 3. Линейное пространство W2 векторов на плоскости (рис. 3.8) имеет, кроме двух тривиальных подпространств, беско-
Рис. 3.8
102
Глава 3. Векторная алгебра
нечное множество подпространств V{, V2, .... Каждое из них состоит из векторов, которые лежат на прямой, проходящей через начало координат (предполагается, что все векторы отложены от начала координат). 4. В геометрическом пространстве W3 векторов пространства каждая прямая и каждая плоскость, проходящие через начало координат, определяют линейное подпространство. Сумма и пересечение линейных подпространств Суммой Vx + V2 линейных подпространств Ух и У2 линейного пространства W называется совокупность всех векторов а е W, которые можно представить в виде (разложить)
Если для каждого вектора а это разложение единственное, сумма линейных подпространств V{ и V2 называется прямой и записывается в виде Пересечением линейных подпространств F, и V2 линейного пространства W называется совокупность всех векторов b, которые принадлежат одновременно подпространствам V{\\ V2. На рис. 3.9 пересечению подпространств V] и V2 геометрического пространства \¥ъ принадлежат векторы А, и Ь-,.
Линейная алгебра. Курс лекций
Свойства суммы и пересечения линейных подпространств 1) Сумма и пересечение линейных подпространств являются линейными подпространствами. 2) Размерность суммы линейных подпространств равна сумме размерностей подпространств минус размерность их пересечения. Линейная оболочка О п р е д е л е н и е . Линейной оболочкой двух векторов дс, и х2, принадлежащих линейному пространству W, называется совокупность всех линейных комбинаций этих векторов
Иначе говоря, линейная оболочка состоит из бесконечного множества векторов а, представимых в виде линейных комбинаций векторов JCJ и х2. На рис. 3.10 построены векторы xlnx2,a также приведено несколько их линейных комбинаций я,, ..., а5. В общем случае линейной оболочкой множества X векторов, принадлежащих линейному пространству W, называется совокупность всех линейных комбинаций этих векторов
Глава 3. Векторная алгебра Свойства линейной оболочки 1) Линейная оболочка содержит само множество X. 2) Если линейное пространство W содержит множество X, то: а) пространство W содержит и его линейную оболочку L(X); б) L(X) — линейное подпространство пространства W. ПРИМЕР. Н айти линейную оболочку множества решений системы уравнений
Решение. Ранг матрицы коэффициентов системы уравнений равен 2. Выберем свободными переменными х2 и х4. Тогда общее решение однородной системы уравнений имеет вид
Векторы образуют фундаментальный набор решений однородной системы. Любое решение системы является их линейной комбинацией. Значит, линейная оболочка векторов и и есть множество решений однородной системы уравнений, т.е. § 3.6. Евклидовы пространства Евклидовы пространства Свойства длины вектора Ортонормированная система векторов Ортогональное дополнение Свойства ортогонального дополнения Евклидовы пространства Введенное нами линейное векторное пространство не содержит информации о том, как измерять длины и углы в этом пространстве. Иначе говоря, оно не содержит метрики. Неожидан105
Линейная алгебра. Курс лекций
ной на первый взгляд является возможность решить этот вопрос, если ввести понятие скалярного произведения. Определение. Линейное векторное пространство W называется евклидовым, если любым двум векторам х и у из W ставится в соответствие число, обозначаемое как (х, у), причем выполняются следующие условия:
4) если х — ненулевой вектор; (х, х) - О, если х — нулевой вектор. Евклидовым линейное пространство названо по имени древнегреческого математика Евклида, создавшего в 3 в. до н. э. Евклидову геометрию — «первое приближение для описания структуры реального физического пространства» (БСЭ). Определение. Число (х, у) называется скалярным произведением векторов х и у. Поскольку векторы задаются набором своих координат, надо определить, какие действия следует совершить с координатами векторов, чтобы получить число (х, у). Определим скалярное произведение векторов и формулой Заданное таким образом скалярное произведение n-мерных векторов для случая п - 2 или п - 3 обращается в рассмотренное ранее скалярное произведение геометрических векторов. Теперь появляется возможность определить длины и углы в пространстве. Замечание. Очевидно, что из равенства х = у следует равенство Переход от равенства векторов к равенству скалярных произведений назовем скалярным умножением. О п р е д е л е н и е . Длиной (нормой) вектора х в евклидовом пространстве называется величина В двух- или трехмерном евклидовом пространстве длина вектора имеет ясный геометрический смысл. Однако в четырех-, пяти- или «-мерном евклидовом пространстве смысл длины вектора теряется. Поэтому вместо длины вектора часто вводят понятие нормы вектора. 106
Глава 3. Векторная алгебра
О п р е д е л е н и е . Углом между ненулевыми векторами х и у евклидова пространства называется число определяемое из равенства (9) Определение требует доказательства того, что для любых пар ненулевых векторов х и у, о чем речь пойдет ниже. Свойства длины вектора 1) Если вектор х нулевой, т.е. и обратно: если
то его длина то вектор х ну-
левой. 2) Действительно,
3) — неравенство Коши — Буняковского. Для доказательства введем параметр По определению скалярного произведения, неравенство верно для любых векторов х и у. Преобразуем неравенство к квадратному относительно t: При неравенство верно. Следовательно, дискриминант квадратного трехчлена должен быть меньше либо равен нулю: Отсюда
З а м е ч а н и е . Из неравенства Коши — Буняковского следует
Определение утла в (9) становится коррект-
ным. 107
Линейная алгебра. Курс лекций
— неравенство треугольника. С одной стороны, С другой стороны, Воспользуемся неравенством Тогда
Значит,
Извлечем квадратный корень и в результате получим неравенство треугольника. Определившись с длинами и углами, используем новые открывающиеся возможности в развитии векторной алгебры. Два ненулевых вектора х и у называются ортогональными, если их скалярное произведение равно нулю, т. е. (х, у) = 0. Из равенства
следует, что
или угол
. Для двух- или трехмерного пространства ортогональность векторов означает, что они взаимно перпендикулярны. Для ортогональных векторов неравенство в свойстве 4 заменяется равенством
Ортонормированная система векторов Система векторов называется ортогональной, если при и нормированной, е с л и д л я всех Если векторы системы ортогональны и нормированы, они называются ортонормированными. 108
Глава 3. Векторная алгебра Замечание. Чтобы нормировать ненулевой вектор, необходимо разделить его на норму. Пусть задан вектор Его норма
. Нормированный вектор имеет
вид
Его длина
ТЕОРЕМА (о независимости ортонормированной системы векторов) Ортонормированная система векторов линейно независима. Л Докажем, что ортогональные и нормированные векторы линейно независимы, т.е. докажем, что равенство справедливо лишь при венства скалярно на вектор е] получим
Умножив обе части ра-
или Отсюда следует скалярно на
Умножая последовательно равенство будем иметь
ТЕОРЕМА (о существовании ортобазиса) Во всяком n-мерном евклидовом пространстве существует ортонормированный базис. Ч Доказательство теоремы представляет собой алгоритм последовательного построения ортонормированного базиса по заданному базису названный методом ортогонализации. Положим вектор
и нормируем его:
, получив
первый вектор ортонормированного базиса. Построим вектор (10) так, чтобы он был ортогонален вектору . Должно выполняться условие Из этого условия найдем . Умножив скалярно равенство (10) на , получим 109
Линейная алгебра. Курс лекций
откуда а, =(/ 2 , е,) . Тем самым вектор g 2 =/ 2 -(/ 2 , е,)^ станет ортогональным вектору е,. Тогда вторым вектором ортонормированного базиса станет вектор е2 - ~ . §2
Пользуясь найденными векторами ех, е2 и заданным вектором / 3 , построим вектор (11) ортогональный единичным векторам с, и е2, для чего умножим скалярно равенство (11) последовательно на с , и е 2 и приравняем к нулю:
Поскольку
, получим
Теперь вычислим вектор:
Затем нормируем его, сделав третьим вектором ортонормированного базиса по заданному базису базис (или ортобазис)
Продолжая процесс ортогонализации, построим ортонормированный
З а м е ч а н и е . Если векторы х и у разложены по произвольному базису (7'):
то скалярное произведение векторов, имея и2 слагаемых, выглядит довольно громоздко: 110
Глава 3. Векторная алгебра
В ортонормированием базисе е,, е2,..., еп скалярное произведение векторов вычисляется просто:
В частности,
Тогда длина вектора равна
ПРИМЕР. Методом ортогонализации построить ортонормированный базис по базису евклидова пространства Решение. Положим вектор
и нормируем его:
Построим вектор вие . Получим
так, чтобы выполнялось усло-
откуда Вычислим вектор g2:
Нормируем вектор g2:
111
Линейная алгебра. Курс лекций
Векторы е, и е2 образуют ортонормированный базис евклидова пространства. Проверка:
Ортогональное дополнение Пусть задано евклидово пространство W и пусть — некоторое линейное подпространство евклидова пространства W. О п р е д е л е н и е . Совокупность векторов у пространства W, обладающих свойством где х — произвольный вектор из называется ортогональным дополнением к подпространству На рис. 3.11 изображено трехмерное евклидово пространство. В нем стрелками указаны векторы, из которых состоит ортогональное дополнение и которые ортогональны всем векторам из линейного подпространства В изображении векторов мы отказались от соглашения об откладывании всех векторов от начала координат.
Рис. 3.11
112
Глава 3. Векторная алгебра
Свойства ортогонального дополнения х
1) Ортогональное дополнение V есть линейное подпространство евклидова пространства W. Пусть векторы ух и у2 принадлежат Vх, вектор х — произвольный вектор из V. Тогда (ylt х) = (у2, х) = 0 • Сложив скалярные произведения, получим Следовательно, у] +у2 е Vх. Если (у, х) = 0 , то и (а-у, х) = 0, где а <= R, т.е из yzVL следует a -у &VX. 2) Линейное пространство W есть прямая сумма подпространств Vе и Vх, т.е. не содержит пересечений V и Vх. Пусть ех, е2, ..., ek — ортонормированный базис У: eh el+l, ..., ер— ортонормированный базис Vх. Среди системы векторов ех, е2, ..., еь eh el+], ...,ер нет одинаковых, и эта система ортонормированна, следовательно, линейно независима. Докажем, что она образует базис я-мерного евклидова пространства. Предположим, что это не так, что число (1 + 2 + ... + /:) + (/ + (/ + 1) + ... + р)<п. Тогда существует вектор JC пространства, такой, что система векторов ех, е2,..., еь eb el+l, ..., ер, х линейно независима. Применим к этой системе процесс ортогонализации. Построенный на осно1 ве х вектор ер+1 будет ортогонален ех, е2, ..., ек, значит, е^ е V . С другой стороны, вектор е^ ортогонален eh eM, ..., ер, значит, су, 1 V . Таким свойством обладает только нулевой вектор. Поэтому е ^ = о. Отсюда вытекает линейная зависимость ех, е2,..., ек, eh el+], ..., ер, х, что противоречит допущению. Таким образом, система векторов even,...,ek, eh e!+],..., ер является базисом «-мерного евклидова пространства, т.е. 1 + 2 + ... + & + / + (/ + 1) + ... + р = п . Из свойства 2 следует, что любой вектор пространства W можно представить, причем единственным образом, в виде суммы векторов из К= и V1: а = х + у.
Свойство 2 в общем виде можно записать так: 113
Линейная алгебра. Курс лекций
Вектор х е V называется ортогональной проекцией вектора а на линейное подпространство V", а вектор у е V1 — его ортогональной составляющей (рис. 3.11).
Если задан вектор а и известен ортонормированный базис е,, е2, ••-,ек подпространства V=, то могут быть найдены ортогональная проекция и ортогональная составляющая вектора а. Разложим искомый вектор JC e V по базису е}, е2, ..., ек с неизвестными пока коэффициентами разложения X., Д 2 , ..., А,А.: Представим вектор а в виде суммы ортогональной проекции д: и ортогональной составляющей у: Умножим обе части последнего равенства скалярно на вектор ех: откуда первый коэффициент разложения действия с векторами енты х£ Г представляется как
Повторив
получим остальные коэффициСледовательно, искомый вектор (12)
L
а вектор у е V — как
Аналогично решается задача нахождения ортогональной проекции и ортогональной составляющей вектора а при заданном векторе а и известном ортонормированном базисе ех, е9, ..., ек, подпространства V1. ПРИМЕР. Подпространство V= линейного четырехмерного пространства ^задано системой уравнений
Найти ортогональную проекцию вектора а = (1, —2, —1, 0) на подпространство V и его ортогональную составляющую. 114
Глава 4. Линейные отображения Отсюда следует, что а^ — Xt, если / —j и atj — 0, если /V/ Поэтому в базисе, составленном из собственных векторов, матрица оператора будет иметь диагональный вид:
§ 4.4. Симметричный оператор > Симметричный оператор > Ортогональность собственных векторов Симметричный оператор Определение. Линейный оператор Р в евклидовом пространстве R" называется симметричным, если для любых векторов JC и у из пространства R" выполняется равенство
ТЕОРЕМА (об условии симметричности оператора) Для того чтобы линейный оператор был симметричен, необходимо и достаточно, чтобы его матрица в ортонормированном базисе была симметрична. < Рассмотрим для простоты евклидово пространство R2. Пусть в ортобазисе е,, е2 заданы векторы х = (х], х2), у = (у}, у2). Линейные операторы Р{ и Р2 определены своими матрицами: . Вычислим векторы Р^х) и Р2(у):
131
Линейная алгебра. Курс лекций
Найдем скалярные произведения \Р(х), у) и (х, P(y)j
Найдем разность скалярных произведений:
Если для любых векторов х и у из пространства R2 равенство
выполнено (необходимость), то верна система
(4)
И обратно: если условия (4) соблюдены для любых векторов х и у, то равенство (3) выполнено (достаточность). Система равенств (4) означает, что Р]-Р2-Р. • Ортогональность собственных векторов ТЕОРЕМА (об ортогональности собственных векторов) Собственные векторы симметричного линейного оператора, соответствующие различным собственным числам, взаимно ортогональны. 132
Глава 4. Линейные отображения
Пусть JC и у — собственные векторы оператора Р , соответствующие собственным числам и , причем По определению симметричного оператора, Подставив сюда правые части равенства , , получим . Вынесем числа и за знак скалярного произведения, перенесем слагаемые влево и разложим на множители: = 0. Поскольку получаем (х, у) — 0, что и означает взаимную ортогональность векторов х и у. • Отметим другие важные свойства симметричного оператора. 1) Характеристическое уравнение симметричного оператора имеет только действительные корни. 2) Если в евклидовом пространстве задан симметричный оператор , то в существует ортонормированный базис е,, составленный из собственных векторов 3) Если все собственные числа симметричного оператора положительны, то го вектора х.
для любого ненулево-
§ 4.5. Квадратичные формы > > > > >
Понятие квадратичной формы Связь между квадратичной формой и оператором Приведение квадратичной формы к каноническому виду Свойства канонических форм Критерий Сильвестра Понятие квадратичной формы Пусть
— симметричная матрица «-го порядка, т.е.
О п р е д е л е н и е . Выражение (5) 133
Линейная алгебра. Курс лекций
называется квадратичной формой переменных Выражение (5) есть сумма всех квадратов переменных плюс сумма всех удвоенных произведений разных переменных, причем каждый член суммы взят с некоторым коэффициентом. Матрица L называется матрицей квадратичной формы. Построим квадратичную форму. Введем матрицу-столбец
переменных Х =
, матрицу-строку этих переменных Хт =
= (xl,x2,..., хп) и найдем произведение матриц:
После перемножения получим
Следовательно, в матричной форме квадратичная форма может быть представлена в виде Матрице-столбцу переменных можно поставить в соответствие вектор х, координатами которого в ортобазисе ех, е2, ..., еп будут элементы матрицы-столбца. Тогда выражение (5) можно интерпретировать как числовую функцию векторного аргумента ПРИМЕР. Найти матрицу квадратичной формы Решение. Общий вид заданной квадратичной формы 134
Глава 4. Линейные отображения
Поэтому
Пусть оператор Р переводит вектор у в вектор х. Поскольку действие линейного оператора Р на вектор у сводится к умножению некоторой матрицы Р = (а^) на матрицу-столбец Y, составленную из координат вектора у, запишем линейное преобразование в матричном виде: Х= Р Y. Выясним, как изменяется матрица квадратичной формы при линейном преобразовании векторов
где Пусть дополнительно выполняется условие невырожденности матрицы оператора , а квадратичная форма является числовой функцией вектора . Найдем, как изменяется матрица квадратичной формы при линейном преобразовании векторов у х. Решим матричное уравнение Х= Р Y, умножив обе части равенства слева на Тогда
где ПРИМЕР. Как изменится матрица квадратичной формы
при линейном преобразовании векторов Решение. Матрица заданной квадратичной формы равна матрица линейного оператора Р при линейном пре-
135
Линейная алгебра. Курс лекций образовании векторов
имеет
в
и
д
П
о
д дей-
ствием линейного оператора матрица квадратичной формы станет равной
а квадратичная форма примет более простой вид:
Связь между квадратичной формой и оператором В линейной алгебре часто возникает необходимость приведения квадратичной формы к наиболее простому виду. Хотя в разобранном примере квадратичная форма стала проще (одно слагаемое вместо трех), в общем случае таким видом является диагональный вид квадратичной формы. Определение. Квадратичная форма называется канонической, если все коэффициенты при произведениях различных переменных равны нулю, т.е. при
Матрица канонической квадратичной формы является диагональной:
ТЕОРЕМА (о связи между формой и оператором) Пусть матрицы симметричного линейного оператора и квадратичной формы, заданные в ортонормированном базисе, совпадают. Тогда квадратичная форма связана с оператором в евклидовом пространстве формулой (6) 136
Глава 4. Линейные отображения
< Определим в евклидовом пространстве ортонормированный базис в котором симметричный оператор Р имеет матрицу произвольный вектор x — координаты Тогда
Найдем скалярное произведение векторов Р(х) их:
Вычислим
Вектор
разложим по базису
Тогда
Следовательно,
Таким образом, если матрица симметричного оператора совпадает с матрицей квадратичной формы, то симметричный линейный оператор связан с квадратичной формой в евклидовом пространстве посредством скалярного произведения (6). •
Приведение квадратичной формы к каноническому виду ТЕОРЕМА (о приведении квадратичной формы к каноническому виду) Любая квадратичная форма, заданная в евклидовом пространстве, может быть приведена к каноническому виду. 137
Линейная алгебра. Курс лекций
< Пусть матрица симметричного оператора в евклидовом пространстве совпадает с матрицей квадратичной формы и задан ортонормированный базис состоящий из собственных векторов линейного симметричного оператора Р (в силу одного из свойств симметричного оператора это всегда возможно):
Скалярное произведение запишем в виде
Разложим произвольный вектор х по этому базису и найдем скалярное произведение
Отсюда
что означает канонический вид (диагональность) матрицы квадратичной формы:
ПРИМЕР. Квадратичную форму привести к диагональному виду. Решение. Вектор x задан в некотором ортобазисе своими координатами Введем симметричный о п е р а т о р , матрицу которого примем равной матрице квадратичной формы
138
Глава 4. Линейные отображения
Составим характеристическое уравнение
Корни уравнения —- 3 , = 0. В новом ортобазисе, составленном из собственных векторов матрицы, вектор x имеет координаты . Поэтому
З а м е ч а н и е . Канонический вид квадратичной формы не является однозначно определенным. Например, заданную квадратичную форму легко преобразовать без использования симметричного оператора:
Линейное преобразование приводит квадратичную форму к каноническому виду . Однако в этом случае вектор , уже не является разложенным по ортобазису, составленному из собственных векторов матрицы. Свойства канонических форм Полученные разными способами канонические формы обладают некоторыми общими свойствами. 1) Закон инерции: число положительных, число отрицательных и число нулевых коэффициентов при квадратах переменных в канонической форме не зависит от способа приведения квадратичной формы к этому виду. 2) Свойство ранга: ранг матрицы квадратичной формы равен числу отличных от нуля коэффициентов канонической формы и не изменяется при линейных преобразованиях. О п р е д е л е н и е . Квадратичная форма называется положительно определенной, или знакоположительной, если для любого ненулевого вектора х выполняется неравенство 139
Линейная алгебра. Курс лекций
О п р е д е л е н и е . Квадратичная форма L{x) называется неотрицательно определенной, или положительно полу определенной, если для любого ненулевого вектора х выполняется неравенство L(x) > 0. Аналогично определяются отрицательно определенная и неположительно определенная (отрицательно полуопределенная) квадратичная форма. Определение. Миноры, примыкающие к левому верхнему углу матрицы, называются угловыми. О п р е д е л е н и е . Миноры, имеющие своей диагональю главную диагональ матрицы, называются главными. ТЕОРЕМА (об определении знака формы по собственным числам) Для того чтобы квадратичная форма была положительно (отрицательно) определенной, необходимо и достаточно, чтобы все собственные числа матрицы квадратичной формы были положительными (отрицательными). Пусть для определенности квадратичная форма положительно определена. Представим квадратичную форму в каноническом виде . Здесь — собственные числа матрицы в базисе Необходимость.
Пусть
. Квадратичная форма свя-
зана с оператором: В частности, Из условия
вытекает
Достаточность. < Если все
положительны, то
Критерий Сильвестра Иногда при исследовании знакоопределенности квадратичной формы более удобным становится применение критерия английского математика, профессора Оксфордского университета Джеймса Джозефа Сильвестра (1814—1897). 140
Глава 4. Линейные отображения ТЕОРЕМА (об определении знака формы по угловым минорам) Для того чтобы квадратичная форма с матрицей
была положительно (отрицательно) определенной, необходимо и достаточно, определив знаки угловых миноров ее матрицы
руководствоваться следующим: 1) если все угловые миноры положительны, квадратичная форма будет положительно определенной; 2) если миноры чередуют знаки, начиная с отрицательного, квадратичная форма будет отрицательно определенной. - Из четырех сформулированных в критерии утверждений докажем, например, что при угловые миноры Пусть положительно определенная квадратичная форма задана в базисе Рассмотрим подпространство построенное на базисе где и квадратичную форму которая на подпространстве примет вид . Квадратичная форма для любого ненулевого вектора из п о д п р о с т р а н с т в а и тем самым все собственные числа положительны. Отсюда определитель матрицы квадратичной формы
141
Линейная алгебра. Курс лекций
также положителен: бирая все
Но Значит, придем к неравенствам
Пере-
В заключение приведем таблицу оценки знакоопределенности квадратичной формы.
ПРИМЕР. Квадратичную форму исследовать на знакоопределенность. 142
Глава 4. Линейные отображения
Решение.
1-й способ. Составим характеристическое уравнение для матрицы квадратичной формы:
Решая уравнение 3-й степени, получаем Собственные числа матрицы положительны, квадратичная форма является положительно определенной. 2-й способ. Найдем угловые миноры матрицы квадратичной формы
Все угловые миноры положительны. По критерию Сильвестра имеем знакоположительную квадратичную форму. 3-й способ. Приведем квадратичную форму к каноническому виду с помощью алгебраических преобразований:
Выражение представляет собой сумму квадратов и обращается в нуль только при . Тем самым для любого ненулевого вектора x выполняется неравенство Форма положительно определена. 4-й способ заключается также в проведении алгебраических преобразований. Группировку 3-го способа трудно угадать. Но можно делать целенаправленные и последовательные алгебраи143
Линейная алгебра. Курс лекций
ческие преобразования, используя метод выделения полного квадрата. Выпишем сначала все слагаемые, содержащие переменную А:,, и преобразуем алгебраическую сумму:
Положим
Получим
Выражение
является квадратичной формой, зависящей от меньшего числа переменных. При необходимости вновь выделяем полный квадрат и т. д. В данном случае требуется привести только подобные члены:
Очевидно, что форма положительно определена. Если все коэффициенты при квадратах равны нулю, то следует начинать преобразование с введения новых переменных:
Тогда образуются квадраты, и мы перейдем к обычному варианту. 144
Глава 4. Линейные отображения Вопросы для повторения 1. Привести определение отображения линейного пространства. 2. Что такое образ, ранг, ядро, дефект отображения? 3. Сформулировать определение линейного оператора и привести его свойства. 4. В чем заключается действие линейного оператора на вектор? 5. Как связаны матрицы линейных операторов в разных базисах? 6. Что такое собственные векторы и собственные значения линейного оператора? 7. Дать определение симметричного оператора и привести условие его симметричности. 8. Какова связь между квадратичной формой и линейным оператором, имеющими одинаковые матрицы? 9. Как определить знак квадратичной формы по собственным числам ее матрицы? 10. Как определить знак квадратичной формы по угловым минорам ее матрицы?
Векторные функции
§ 5.1. Векторные функции скалярного аргумента > Определение векторной функции скалярного аргумента > Предел и непрерывность векторной функции скалярного аргумента > Дифференцирование векторной функции скалярного аргумента > Свойства производной векторной функции скалярного аргумента > Правила дифференцирования векторной функции скалярного аргумента Определение векторной функции скалярного аргумента Предположим, что каждому значению скалярного аргумента х ставится в соответствие п функций Набор этих функций положим координатами вектора у
и будем считать, что задана векторная функция (вектор-функция) у скалярного аргумента х. Если вектор-функцию у(х) представить как радиус-вектор г(х), начало которого помещено в начало координат, то конец радиуса-вектора г(х) будет описывать некоторую кривую, называемую годографом векторной функции. На рис. 5.1 для евклидова 146
Глава 5. Векторные функции
Рис. 5.1
векторного пространства с размерностью, равной трем, построена векторная функция
где Перед нами пример годографа, изображающего спираль. Для четырех последовательных значений аргумента показаны радиусы-векторы, выходящие из начала координат. Пусть — базис п-мерного векторного пространства. Разложим вектор-функцию по векторам базиса:
Предел и непрерывность векторной функции скалярного аргумента Вектор-функция называется ограниченной, если существует такое число M, что для всех значений аргумента x из области определения справедливо неравенство Из определения ограниченности функции следует ограниченность ее координат Действительно, из неравенства 147
Линейная алгебра. Курс лекций
следует
Вектор называется пределом векторной функции при если для любого сколь угодно малого числа е > О существует такое число 5 > 0, что для всех значений аргумента х из области справедливо неравенство Математическая запись Если предел существует, то
Векторная функция у(х) называется непрерывной в точке х0, если Последнее равенство следует понимать так:
Дифференцирование векторной функции скалярного аргумента Пусть для векторной функции у(х) существует предел:
Он называется производной от и обозначается
по переменной х в точке
. Для координат вектора
по определению, что
148
это означает,
Глава 5. Векторные функции
Свойства производной векторной функции скалярного аргумента 1) Производная
является вектором (вектор-
производной) с координатами
2) Вектор
лежит на каса-
тельной к кривой для вектора
В частности,
вектор
сов-
падает с касательной к годографу в точке М (рис. 5.2). 3) Скалярное произведение вектор-функции на вектор-производную равно нулю:
Рис. 5.2
Это непосредственно следует из свойства 2. 4) Из условия не следует равенство нулю вектор-производной, поскольку при изменении аргумента х векторная функция может менять только направление. Например, радиус-вектор описывает сферу, радиус которой — величина постоянная, а направление радиуса-вектора от точки к точке на сфере меняется. Правила дифференцирования векторной функции скалярного аргумента
, где
функция. 149
скалярная
Линейная алгебра. Курс лекций
dx
4.
dx
^"'••^"'
dx
dy(u(x))_dy du_ dx du dx § 5.2. Векторные функции векторного аргумента
> Определение векторной функции векторного аргумента > Потенциальное поле вектора > Дифференцирование векторной функции векторного аргумента Определение векторной функции векторного аргумента Пусть в некоторой области D заданы п функций от т переменных:
Другими словами, пусть заданы п функций от векторного аргумента
Набор переменных можно представить как координаты некоторого нового вектора у: Тогда будем говорить, что задана п-мерная векторная функция у от т-мерного вектор-аргумента х:
Если в каждой точке евклидова векторного пространства определена векторная величина то говорят, что задано векторное поле у. Координаты образуют две скалярные функции. 150
Глава 5. Векторные функции
Рис. 5.3
Пример векторного поля векторной функции изображен на рис. 5.3. В каждой точке М с координатами где вычисляются и которые являются координатами вектора у(М). Направления стрелок на рисунке указывают направления векторов в каждой точке. Длина стрелки пропорциональна величине вектора в данной точке (коэффициент пропорциональности равен 0,25).
Линейная алгебра. Курс лекций
Для геометрической характеристики векторного поля служат векторные линии. Векторной линией называется кривая, касательная к которой в любой точке М имеет то же направление, что и вектор поля у в этой точке. На рис. 5.4 пунктиром изображена векторная линия на плоскости. Потенциальное поле вектора Векторное поле вектора у(М) называется потенциальным, если существует скалярная функция и(М) такая, что (2) При этом функция и(М) называется потенциалом поля, а ее поверхности уровня в евклидовом пространстве R3 — эквипотенциальными поверхностями. Для евклидова векторного пространства R2 вместо поверхностей вводятся линии уровня, называемые эквипотенциальными линиями. Пусть
По определению градиента,
Поэтому соотношение (2) равносильно следующим скалярным равенствам:
ПРИМЕР 1. Для функции Кобба - Дугласа найти вектор-функцию. Решение.
Вектор-функция у векторного аргумента х(хх. х2), разложенная по векторам базиса, имеет вид
(3) 152
Глава 5. Векторные функции
Рис. 5.5
Она называется градиентом функции и. Модуль вектора функции и указывает величину изменения потенциала и{х) и позволяет на графике функции и(х) найти участки с наибольшей скоростью ее изменения. На рис. 5.5 приведен график модуля функции (3) примера 1, изображенный в первом октанте системы координат при в области На стенках поверхности, указанных светлыми стрелками, происходит наибольшее изменение векторной функции. Они обрезаны сверху на уровне чтобы выявить характерные особенности нижней части поверхности. Темная стрелка указывает место минимального изменения модуля векторной функции на графике. Градиент функции Кобба — Дугласа является полноценной векторной функцией векторного аргумента. Градиент функции
имеет вид
Векторное поле градиента представлено на рис. 5.6. Длина стрелки пропорциональна величине вектора в данной точке (коэффициент пропорциональности равен 0,25). Пунктиром изображены векторные линии, сплошной линией — эквипотенциальные поверхности (линии уровня). 153
Линейная алгебра. Курс лекций
0.2
0.4
0.6
0.8
Рис. 5.6
Скалярные функции определяют у(r) — векторную функцию векторного аргумента, где — вектор с началом в начале координат и концом в точке М. тора
ПРИМЕР 2. Найти потенциал векторного поля радиуса-веки эквипотенциальные линии поля. Решение.
где u — скалярная функция, производные которой п о и равны соответственно и Очевидно, что Следовательно, Линии уровня функции
можно найти из равенства
где С — константа. Линиями уровня, или эквипотенциальными линиями, будут концентрические окружности с радиусами
154
Глава 5. Векторные функции
Дифференцирование векторной функции векторного аргумента Предположим, что все функции дифференцируемы в области D. Производной ту
в точке
вектор-функции у по вектор-аргумен-
называется предел
Для координат вектора у(х) это означает, по определению,
что
В свою очередь, производная скалярной функции векторного аргумента определяется так:
где Таким образом, производной от по переменной х является матрица размерностью составленная из частных производных функций по следующему правилу:
Эта матрица получила название матрицы Якоби. 155
Линейная алгебра. Курс лекций ПРИМЕР. Найти матрицу Якоби вектор-функции
Решение.
Укажем важное свойство дифференцирования сложной вектор-функции. Если задана n-мерная дифференцируемая векторфункция у от m-мерного вектор-аргумента и, а вектор-аргумент, в свою очередь, является дифференцируемой вектор-функцией от k-мерного вектор-аргумента x, то
(4) Равенство (4) есть произведение матриц Якоби ностью
иразмерностью
размер-
В результате получим
матрицу размерностью Вопросы для повторения 1. Сформулировать определение векторной функции скалярного аргумента. 2. Что такое годограф векторной функции? 3. Как берется производная векторной функции скалярного аргумента? 4. Перечислить свойства производной вектор-функции. 5. Сформулировать определение векторной функции векторного аргумента. 6. Что такое потенциальное поле вектора? 7. Как берется производная векторной функции векторного аргумента?
ГЛАВА 6
Классические методы оптимизации
Классические методы оптимизации построены на использовании как инструментов математического анализа (теория функций нескольких переменных), так и на аппарате линейной алгебры (матричная алгебра, векторная алгебра, квадратичные формы). § 6.1. Локальный экстремум > Определение локального экстремума > Необходимые условия локального экстремума > Достаточные условия локального экстремума > Использование квадратичных форм Определение локального экстремума Пусть функция существует в некоторой области, и точка — внутренняя точка этой области. Определение. Точка называется точкой локального максимума (минимума) функции если существует окрестность точки такая, что для всех точек М(х, у) из этой окрестности Определение можно интерпретировать в терминах приращений. Если приращение функции соответствующее приращению аргументов и , в некоторой окрестности точки сохраняет знак, т о т о ч к а я в ляется точкой локального максимума (минимума). Значение функции в точке называется локальным максимумом ИЛИ локальным минимумом функции. Точки максиму157
Линейная алгебра. Курс лекций
Рис. 6.1
ма и точки минимума функции называются точками экстремума функции, а сами максимумы и минимумы функции — ее экстремумами. Будем различать строгий экстремум (его условие или и нестрогий экстремум (условие
или
Например, функ-
ция имеет в точке (0,0) строгий локальный минимум, равный нулю (рис. 6.1), а функция — нестрогий локальный минимум, равный нулю на линии у — х (рис. 6.2). Необходимые условия локального экстремума ТЕОРЕМА (о необходимом условии экстремума) Если — точка экстремума функции, то все частные производные в этой точке равны нулю либо не существуют. -4 Пусть в точке функция имеет экстремум. Зафиксируем переменную у, придав ей значение Тогда функция будет функцией одной переменной по х. Поскольку она имеет экстремум в точке ее производная по х, рав158
3. Векторная алгебра
Решение. Найдем ортонормированный базис подпространства V, для чего определим набор фундаментальных решений системы. Общее решение однородной системы:
, где
Векторы а - (0, -1, 1, 0) и а = (—1, 0, 0, 1) образуют фундаментальный набор решений и, следовательно, базис подпространства Векторы ортогональны. Их нормы и Поэтому ортонормированный базис подпространства
Найдем скалярные произведения
Ортогональная проекция вектора а на подпространство (см. формулу (12))
Ортогональная составляющая
Проверка:
Векторы д: и у ортогональны. 115
Линейная алгебра. Курс лекций Вопросы для повторения 1. Сформулировать определение геометрического вектора и перечислить линейные операции над векторами. 2. Определить скалярное произведение векторов и перечислить свойства скалярного произведения. 3. Дать определение линейного векторного пространства. 4. Что такое n-мерный вектор? Перечислить операции над n-мерными векторами. 5. Какие векторы называются линейно зависимыми? 6. Сформулировать определение размерности и базиса векторного пространства. 7. Как разложить произвольный вектор линейного пространства по базису? 8. В чем заключается идея дополнения линейно независимых векторов до базиса? 9. Как перейти от одного базиса векторного пространства к другому? 10.Что называется линейным подпространством векторного пространства? 11.Сформулировать определения суммы и пересечения линейных подпространств. 12. Какое векторное пространство называется евклидовым? 13.Что такое норма вектора? 14. Какой базис называется ортонормированным? 15. В чем суть метода ортогонализации? 16. Какие векторы составляют ортогональное дополнение?
ГЛАВА 4
Линейные отображения
§ 4.1. Общие сведения о линейных отображениях Отображения Образ, ранг, ядро, дефект отображения Отображение базиса Отображения Пусть и — линейные пространства размерности п и т. О п р е д е л е н и е . Отображением линейного пространства в линейное пространство называется правило , по которому каждому элементу ставится в соответствие единственный элемент . Запишем отображение в виде Под элементом пространства будем понимать не обязательно вектор. Это может быть скалярный элемент, матрица и т.д. Частным случаем отображения является функция , поскольку каждому значению аргумента х ставится в соответствии по определенному правилу единственный элемент у. Например,
та
Отображение называется линейным, если для любого элеменпространства и любого числа выполняются соотношения: 1) 2) 117
Линейная алгебра. Курс лекций Примеры линейных отображений. 1. Если каждому вектору ставится в соответствие вектор , где , то говорят, что задано отображение (преобразование) подобия. Процесс отображения представляет собой умножение каждого вектора на число. 2. Если каждой матрице-столбцу X размерности п 1 из пространства матриц ставится в соответствие матрица-столбец Y размерности из пространства м а т р и ц , то задано отображение пространства столбцов в пространство столбцов Процесс отображения представляет собой умножение матрицы на столбцы
Равными называются линейные отображения для любого элемента выполняется равенство
и
, если
Образ, ранг, ядро, дефект отображения Образом линейного отображения называется множество всех элементов пространства , для каждого из которых найдется элемент , такой, что Рангом линейного отображения называется размерность образа этого отображения. Ядром линейного отображения называется множество всех элементов пространства , каждый из которых отображение переводит в нулевой элемент у = 0 пространства Дефектом линейного отображения называется размерность ядра этого отображения. ТЕОРЕМА (об образе и ядре) Образ и ядро линейного отображения являются линейными подпространствами соответственно пространств и 118
Глава 4. Линейные отображения
ния
Пусть и — элементы образа линейного отображе. Тогда существуют такие элементы и из , что и . Найдем линейную к о м б и н а ц и ю +
Из равенства следует, что для элемента из нашелся элемент . Следовательно, произвольная линейная комбинация также лежит в т.е. образ линейного отображения является линейным подпространством пространства Пусть теперь и , — элементы ядра линейного отображения Р. Тогда справедливы равенства
Составим линейную комбинацию рацию линейного отображения:
и проведем опе-
Следовательно, отображение переводит линейную комбинацию в нулевой элемент у = 0. Значит, ядро линейного отображения является линейным подпространством. • Отображение базиса ТЕОРЕМА (об отображении базиса) Пусть — произвольный базис пространства Тогда, каким бы ни был набор элементов линейного пространства , существует отображение Р , переводящее векторы в в е к т о р ы , г д е т . е . , Это отображение линейно и является единственным. < Разложим произвольный элемент х из пространства базису е: 119
по
Линейная алгебра. Курс лекций
Построим элемент
Введем отображение
по следующему правилу:
:
Запишем равенство в развернутой форме:
или Перенесем все слагаемые влево и сгруппируем их:
Равенство справедливо для произвольных ловии
при ус-
Линейность. < Воспользуемся сокращенной формой записи. Пусть
. Составим линейную комбинацию
этих элементов и найдем ее отображение:
Условие линейности отображения выполнено. • Единственность. Предположим существование еще одного отображения Q, такого, что
Тогда
Значит, отображения Р и Q совпадают. • 120
Глава 4. Линейные отображения
Следствие. Линейное отображение из пространства Щ в пространство Щ может быть определено преобразованием векторов базиса (действием линейного отображения на векторы базиса). •4 Действительно, если задать линейное отображение системой уравнений
то действие линейного отображения на произвольный элемент х, разложенный по базису е = (е19 е2,..., еп), будет существовать. • § 4.2. Линейные операторы > > > >
Линейные операторы и их свойства Структура линейного оператора Матрицы оператора в разных базисах Определитель оператора в разных базисах Линейные операторы и их свойства
Определение. Будем рассматривать линейные отображения, действующие из векторного пространства в это же пространство Подобные отображения называются линейными операторами. Введем арифметические операции с линейными операторами. 1. Суммой операторов и называется оператор Р = Р1+Р2, который действует по следующему правилу: 2.Произведением операторана числоназывается оператор действующий по правилу: 3. Произведением оператора на оператор называется оператор определяемый из равенства: Оператор называется тождественным или единичным, если
121
Линейная алгебра. Курс лекций
Все введенные операторы являются линейными. Докажем, например, что оператор произведения линеен:
Структура линейного оператора Пусть в пространстве задан базис Произвольный вектор х может быть разложен по этому базису:
Подействуем на вектор х оператором
Величины являются векторами из поэтому могут быть разложены по базису
и
Тогда
С другой стороны, есть некоторый вектор рый может быть разложен по заданному базису:
кото-
Разложение вектора у по базису единственно. Поэтому
Уп=а)1]х]+ап2х2+...
+
аппхп.
Система уравнений в развернутой матричной форме имеет вид 122
Глава 4. Линейные отображения
или в сокращенной матричной форме Таким образом, действие линейного оператора на вектор х сводится к умножению некоторой матрицы на матрицустолбец X, составленный из координат вектора х. Матрица Р называется матрицей линейного оператора в базисе Исследуем ранг линейного оператора . Оператор Р , являясь частным случаем линейного отображения, имеет ранг, равный размерности образа этого отображения, а следовательно, размерности соответствующего подпространства. Подпространство составлено из векторов и их линейных комбинаций. Число линейно независимых векторов среди них составляет размерность подпространства. Координаты векторов образуют столбцы матрицы Р. Поэтому число линейно независимых столбцов матрицы Р (им соответствуют линейно независимые векторы) и есть ранг оператора Р . Вывод: ранг матрицы Р линейного оператора Р равен рангу оператора. В том случае, когда ранг r линейного оператора равен п (r = п, т.е. матрица оператора не вырождена , только нулевой вектор преобразуется оператором в нулевой вектор. Действительно, матричное уравнение имеет единственное решение, что обеспечивает взаимно-однозначное соответствие между векторами x и у, причем нулевому вектору соответствует нулевой вектор. Если матрица линейного оператора является вырожденной , некоторые векторы, отличные от нулевого, такой оператор переводит в нулевые векторы. Возникает дефект линейного оператора. Соответствующее подпространство ядра оператора перестает быть нулевым. По виду матрицы оператора можно найти ядро, а именно базис ядра и размер дефекта. 123
Линейная алгебра. Курс лекций
Р задан матрицей ПРИМЕР. Линейный оператор 1-12 3 Р= -2 -2 1 1 в некотором базисе векторного пространства R . -10 3 Найти базис ядра и размер дефекта оператора. Решение. Пусть вектор х-(х{, х2, х3) принадлежит ядру линейного оператора Р , т.е. оператор переводит вектор х в нулевой вектор Р(х) = О- Поскольку Р{х) = Р X, запишем матричное уравнение Р X— О в развернутом виде:
1 -1 2^1 (х, \ (0л -2 -1 Найдем решение системы, для чего матрицу коэффициентов приведем к ступенчатому виду:
Отсюда следует решение системы:
где се R. Совокупность векторов х составляет подпространство решений уравнения Р(х) = О, а следовательно, ядро оператора Р . Базисом подпространства можно выбрать вектор а = (7, 5, 1), размерность подпространства или размер дефекта оператора равны единице. Продолжим обсуждение задачи и выясним, что представляет собой подпространство, в которое оператор Р переводит векторы пространства . Пусть е{, е-,, е3 — базис пространства , в котором задана матрица оператора . Образ есть линейное подпространство, построенное на векторах (можно сказать: линейная оболочка, натянутая на векторы . Тогда 124
Глава 4. Линейные отображения
Ранг матрицы
коэффициентов полученной системы равен двум. Тем самым только два вектора из трех являются линейно независимыми, например:
Значит, базис образа
оператора равен двум. Следовательно, оператор Р , имея дефект, равный единице, переводит векторы из пространства (dimR — 2) в подпространство Вообще, для любого линейного отображения справедлива формула
Матрицы оператора в разных базисах Перейдем к вопросу о поведении линейного оператора при замене базиса. При переходе от старого базиса к новому в пространстве матрица Р линейного оператора изменяется, однако определитель матрицы оператора сохраняет свою величину. ТЕОРЕМА (о связи матриц оператора в разных базисах) Матрицы Р и Р' линейного оператора Р в старом базисе е,, и новом базисе связаны соотношением где Т— матрица перехода от старого базиса к новому. < Пусть в пространстве заданы два базиса: и . Воздействие оператора на вектор х порождает вектор у. В старом базисе имеем в новом базисе — Пусть Т— матрица перехода от старого базиса к новому. Тогда 125
Линейная алгебра. Курс лекций Умножим равенство слева на матрицу Р: Р X или Умножим обе части последнего равенства на или Сравнив полученное равенство с получим
Определитель оператора в разных базисах ТЕОРЕМА (об определителе оператора в разных базисах) Определитель матрицы линейного оператора не зависит от выбора базиса. •< Вычислим определитель матрицы Р', используя свойство определителя произведения матриц, а также свойство определителей обратных матриц:
Следствие. Ранг матрицы линейного оператора не зависит от выбора базиса. ПРИМЕР. В базисе цей
линейный оператор задан матри-
Найти матрицу оператора в новом базисе связанном со старым базисом матрицей перехода
Решение. Найдем матрицу, обратную матрице перехода:
Матрица линейного оператора в новом базисе будет иметь вид 126
Глава 4. Линейные отображения
Проверка показывает, что т.е. определитель матрицы оператора не изменился при переходе к другому базису.
§ 4.3. Собственные векторы и собственные значения линейного оператора > Собственные векторы и собственные значения > Независимость собственных векторов Собственные векторы и собственные значения О п р е д е л е н и е . Ненулевой вектор х называется собственным вектором линейного оператора если найдется такое число называемое собственным значением линейного оператора, что (1) Равенство (1) означает, что вектор х, подвергнутый действию линейного оператора, умножается на число X. Появляется коллинеарный вектор. Среди векторов линейного векторного пространства могут существовать такие, воздействие оператора на которые переводит эти векторы в коллинеарные самим себе. Если на таких векторах построить базис, преобразования линейной алгебры значительно упростятся. Не всякий линейный оператор обладает собственными векторами. Например, в геометрической плоскости R2 оператор поворота на угол, не кратный к, не имеет ни одного собственного вектора, поскольку ни один ненулевой вектор после поворота не останется коллинеарным самому себе. Решим задачу нахождения собственных векторов оператора. Запишем равенство (1) в матричной форме: 127
Линейная алгебра. Курс лекций
Преобразуем матричное уравнение: Матричное уравнение всегда имеет нулевое решение:
Для существования ненулевых решений ранг матрицы коэффициентов должен быть меньше числа переменных т.е. число линейно независимых уравнений должно быть меньше числа переменных. В этом случае должно быть выполнено условие (2) Расписав уравнение (2) относительно
подробнее, получим
Раскрыв определитель, получим уравнение п-й степени относительно X: которое называется характеристическим уравнением оператора Р . Корни уравнения называются характеристическими или собственными числами оператора. Множество всех собственных чисел оператора Р называется спектром этого оператора. Многочлен левой части уравнения называется характеристическим многочленом. Решив характеристическое уравнение, получаем собственные числа Для каждого найденного собственного значения найдем ненулевые векторы ядра оператора Именно они будут собственными векторами, соответствующими собственному значению Другими словами, необходимо решить однородную систему уравнений Ее общее решение дает всю совокупность собственных векторов, отвечающих 128
Глава 4. Линейные отображения
Общее решение однородной системы, как известно, структурировано. Оно представляет собой линейную комбинацию фундаментального набора линейно независимых решений (векторов). Число линейно независимых векторов в фундаментальном наборе называется геометрической кратностью собственного значения Вводится также алгебраическая кратность — кратность как корня характеристического многочлена. Независимость собственных векторов Существование линейно независимых векторов среди собственных, отвечающих различным собственным числам определяется следующей теоремой. ТЕОРЕМА (о независимости собственных векторов) Собственные векторы собственным значениям
оператора, отвечающие различным линейно независимы.
Не останавливаясь на доказательстве теоремы, укажем на важное следствие теоремы. На п линейно независимых собственных векторах можно построить базис n-мерного линейного векторного пространства. З а м е ч а н и е . Определитель матрицы (соответственно характеристический многочлен) не зависит от выбора базиса. Л Действительно,
Следовательно, при переходе к новому базису собственные числа сохраняются. • ПРИМЕР. Найти собственные значения и собственные векторы линейного оператора
, заданного матрицей
в пространстве Решение. Составим характеристическое уравнение: 129
Линейная алгебра. Курс лекций
Из квадратного уравнения найдем собственные значения линейного оператора Чтобы найти собственные векторы, решим матричные уравнения: В развернутом виде
Соответствующие однородные системы:
Общие решения систем:
Таким образом, множество собственных векторов, отвечающих собственным значениям , где
имеет вид ел
Векторы
;
например,
являются линейно независимыми. Они могут быть приняты в качестве нового базиса в пространстве Пусть — собственные векторы линейного оператора Р в пространстве которые примем в качестве базиса. Тогда разложение векторов по базису примет вид
130
Глава 6, Классические методы оптимизации
Рис. 6.2
ная
, обратится в нуль или не будет существовать. Подоб-
ным образом убеждаемся, что
также равна нулю или не
существует. • Следствие. Если — точка экстремума функции то первый дифференциал функции равен нулю. Следствие вытекает из определения дифференциала
Если частные производные обращаются в нуль в точке она может и не оказаться точкой экстремума. Например, функция
имеет частные производные
и
, которые в точке (0,0) равны нулю. Из графика (рис. 6.3) видно, что в точке (0, 0), указанной стрелкой, минимума или максимума нет. Таким образом, необходимые условия не оказываются достаточными. 159
Линейная алгебра. Курс лекций
Точки, в которых производные
либо они не су-
ществуют, называются критическими точками функции. Те из критических точек, в которых
называются стаци-
онарными. Среди стационарных точек есть точки, в которых экстремум функции не достигается. Они называются седловыми точками, или точками минимакса. На рис. 6.3 стрелкой указана подобная точка. На рис. 6.4 приведены возможные варианты критических точек.
Рис. 6.3
Стационарные точки
не существуют Точки минимакса
Есть экстремум
Нет экстремума Рис. 6.4 160
Глава 6. Классические методы оптимизации Достаточные условия локального экстремума Достаточные условия рассмотрим вначале для функции двух переменных, затем перейдем к общему случаю. ТЕОРЕМА (об исследовании на экстремум по угловым минорам) Пусть всюду в окрестности точки 1) определена функция 2) непрерывны, причем 3) непрерывны. В этом случае угловые миноры
матрицы
определяют поведение функции в точкепричем: 1) если угловые миноры Л/, > О, М2 > 0, функция z = z(x, у) имеет в точке минимум; 2) если угловые миноры М1 < О, М2 > О, функция z — z(x, у) имеет в точке максимум; 3) если угловой минор М2 < 0, функция z — z(x, у) не имеет в точке экстремума. < Разложим приращение функции в точке в ряд Тейлора до второго дифференциала включительно:
В точке
первый д и ф ф е р е н ц и а л П о в е д е н и е
функции (ее приращение) определяется вторым дифференциалом. Слагаемое является бесконечно малым по отношению к
. Поэтому можно выбрать столь малую окрестность 161
Линейная алгебра. Курс лекций
точки , что знак точке. Итак, если точки
будет определяться знаком в этой , то т.е. при выходе из
функция возрастает. В противном случае при будем иметь
Функция будет убывать при
движении из точки (х0, у0). Раскроем второй дифференциал:
и вынесем dy за скобки, обозначив
через t. При вариации dx и
в произвольных пределах переменная до
изменяется от
Тогда (1)
Выражение (1) представляет собой квадратный трехчлен, описывающий параболу. Поведение параболы определяется ее коэффициентом при квадрате неизвестной и знаком дискриминанта D. Проведем это исследование. 1. При
и
квадратный трехчлен
описывает параболу, направленную ветвями вверх и всю лежащую выше оси абсцисс. Это означает, что при второй 2 дифференциал d z > О, следовательно, Az > 0. Функция имеет в точке (х0, у0) минимум. 2. При
квадратный трехчлен
описывает параболу, направленную ветвями вниз и всю лежащую ниже оси абсцисс. Это означает, что при второй 2 дифференциал d z < 0, следовательно, Az < 0. Функция имеет в точке максимум. 3. При выполнении условия в некотором интервале изменения t часть параболы расположена выше оси абсцисс, для других значений t часть параболы расположена ниже оси. Соответственно при движении из точки в на162
Глава 6. Классические методы оптимизации
правлениях, для которых t > 0, т.е. дифференциалы dx и dy имеют одинаковый знак, будем иметь один знак Az. При движении в других направлениях, по которым t < 0, а значит, дифференциалы dx и dy имеют разные знаки, получим другой знак Экстремума нет. Из вторых производных составим матрицу
Условия
означают, что угловые
миноры
В точке
Условия
наблюдается минимум. соответствующие макси-
муму, приводят к неравенствам
Наконец, условие
приводит к неравенству М2 < О, означающему отсутствие экстремума. Теорема доказана. • Использование квадратичных форм Для рассмотрения общего случая привлечем теорию квадратичных форм. Второй дифференциал функции нескольких переменных можно рассматривать как симметричную квадратичную форму относительно дифференциалов переменных. Ее частным случаем является второй дифференциал от функции двух переменных, рассмотренный выше. Второй дифференциал функции п переменных имеет вид
Матрица этой квадратичной формы, составленная из вторых частных производных функции называется матрицей Гессе*. * В действительности, рассматривая теорию алгебраических линий на плоскости и алгебраических поверхностей, профессор Гессе ввел понятие определителя подобной матрицы, названного позднее гессианом.
163
Линейная алгебра. Курс лекций
Как и в случае двух переменных, приращение функции Aw в точке возможного экстремума разложим в ряд Тейлора:
Знак приращения при непрерывности частных производных до второго порядка включительно в точке и ее некоторой окрестности будет определяться знаком второго дифференциала, являющегося квадратичной формой. Условия знакоопределенности квадратичной формы известны как критерий Сильвестра. Напомним, что критерий Сильвестра основан на изучении знаков угловых миноров матрицы квадратичной формы. На основе этих рассуждений сформулируем теорему. ТЕОРЕМА (об исследовании на экстремум по второму дифференциалу) Пусть всюду в окрестности точки 1) определена функция 2) все частные производные первого порядка непрерывны, причем 3) все частные производные второго порядка , где непрерывны; 4) второй дифференциал в точке является знакоопределенной квадратичной формой. Тогда функция имеет в точке локальный экстремум, причем: а) при — локальный минимум, б) при i — локальный максимум. 164
Глава 6. Классические методы оптимизации Если же является знакопеременной квадратичной формой в точке то функция не имеет локального экстремума. Дадим еще одну формулировку достаточных условий локального экстремума, удобную в использовании. ТЕОРЕМА (об исследовании на экстремум по угловым минорам) Пусть всюду в окрестности точки 1) определена функция 2) все частные производные первого порядка непрерывны, причем 3) все частные производные второго порядка , где непрерывны. В этом случае угловые миноры матрицы Гессе Н определяют поведение функции в точке , причем: а) если все угловые миноры положительны, функция имеет в точке минимум; б) если знаки миноров чередуются, начиная с отрицательного, функция и = и(хх, x 2 ,..., хп) имеет в точке Мо максимум. З а м е ч а н и е . Теорема дает достаточные условия локального экстремума. Интересно отметить, что эти достаточные условия не являются необходимыми. Например, функция и = х4 + у4 имеет в точке (0, 0) строгий минимум, хотя d2u > 0 не выполнено в силу равенства нулю в этой точке всех вторых производных. Для этой функции при любых dx и dy имеет место d2u = 0. Одну из идей нахождения экстремума в таких случаях рассмотрим ниже. ПРИМЕР 1. Функцию z - х3 - у3 - Зху исследовать на локальный экстремум. Решение. Найдем критические точки функции
165
Линейная алгебра. Курс лекций
Решениями системы являются координаты двух точек:
Найдем вторые частные производные: и составим из них матрицу Гессе:
Глава 6. Классические методы оптимизации
Экстремум есть;
Следовательно, в точке (—1, 1)
функция имеет локальный максимум На рис. 6.5 приведен график функции Темной стрелкой указано положение максимума функции, светлой стрелкой — седловая точка (точка минимакса). ПРИМЕР 2. Функцию исследовать на локальный экстремум. Решение. Эту функцию мы уже рассматривали в Замечании к теореме и обнаружили, что все вторые частные производные в стационарной точке (0, 0) равны нулю. Обратимся непосредственно к приращению функции
которое в точке (0, 0) имеет вид
-0.5
Рис. 6.6 167
Линейная алгебра. Курс лекций
Очевидно, что при любых значениях Ах и Ау, таких, что (Ах) +(Лу) Ф О , приращение
По определению, функция z- х4 + у4 имеет в точке (0, 0) минимум. На рис. 6.6 представлен график функции z = х4 + у 4 , на котором выделена точка минимума и стрелкой указано местонахождение этой точки. § 6.2. Условный экстремум > Определение условного экстремума > Первый метод нахождения условного экстремума > Второй метод нахождения условного экстремума (метод Лагранжа) > Геометрическая интерпретация необходимых условий для условного экстремума > Окаймленный гессиан > Последовательность действий при отыскании условных экстремумов функции двух переменных Определение условного экстремума О п р е д е л е н и е . Условным экстремумом функции z = z(x,у) называется максимум или минимум функции, достигнутый при условии, что ее аргументы связаны некоторым уравнением g(x, у) - 0:
В дальнейшем экстремумы, не являющиеся условными, будем называть безусловными. При нахождении условных экстремумов функции аргументы х и у уже нельзя рассматривать как независимые переменные. Они связаны между собой соотношением, которое называется уравнением связи. 168
Глава 6. Классические методы оптимизации
Для пояснения различия между локальным (безусловным) и условным экстремумом рассмотрим функцию
Она описывает так называемый параболоид вращения и имеет безусловный минимум в точке, указанной темной стрелкой. Добавим уравнение связи (ограничение в виде равенства)
описывающее плоскость. Задача формулируется теперь так: найти экстремум функции z = x2 + y2, рассматривая среди всех значений (х,у) только те, которые в совокупности образуют плоскость Р. Другими словами, экстремум следует искать среди точек, принадлежащих одновременно обеим поверхностям, изображенным на рис. 6.7. Эти точки образуют белую линию. Минимальное значение (условный минимум) достигается в точке, указанной светлой стрелкой. Замечание. Условный экстремум может существовать не в одной точке. В частном случае это может быть линия, как представлено на рис. 6.8. Здесь стрелкой указан достигаемый на отрезке прямой условный минимум функции при дополнительном условии связи
Локальный
Линейная алгебра. Курс лекций х
Рис. 6.8
минимум функции также существует. Он находится в точке с координатами (0, 0). Опишем два метода поиска условного экстремума. Первый метод нахождения условного экстремума Пусть уравнение связи может быть разрешено относительно зависимой переменной: . Подставим функцию в исследуемую на экстремум ф у н к ц и ю П о лучим функцию одного аргумента
в которой учтено условие связи. Далее надо исследовать функцию на локальный экстремум, который будет являться для функции условным экстремумом. ПРИМЕР 1. Исследовать на условный экстремум функцию Z = х • у при условии Решение. Из уравнения связи найдем и подставим в исследуемую функцию: Исследуем ее на экстремум:
170
Глава 6. Классические методы оптимизации О
Рис. 6.9
Критическая точка Поэтому в точке
Вторая производная существует минимум функции
соответственно в точке с координатами ный минимум функции
Его значение
— услов. На рис. 6.9
представлены описываемые обеими функциями поверхности, пересекающиеся по белой линии. На точку условного минимума указывает стрелка. ПРИМЕР 2. Исследовать на условный экстремум функцию при условии Решение. Подставим в исследуемую функцию величину у= - 1 из уравнения связи. Получим 1. Если 2. Если причем значение больше либо равно значению Z\ в любой точке х при условии Следовательно, 1 будет максимальным значением функции аргументы которой связаны уравнением Поверхность и плоскость представлены на 171
Линейная алгебра. Курс лекций
Рис. 6.10
рис. 6.10. Линии их пересечения, где функция z достигает максимального значения, выделены белым цветом. Непосредственная подстановка используется в простейших случаях. Часто подобная подстановка приводит к громоздким выражениям для исследуемой функции или бывает невозможно решить уравнение связи относительно зависимой переменной. В этих случаях используется эффективный метод, предложенный французским математиком Жозефом Луи Лагранжем (1736-1813). З а м е ч а н и е . Рассмотренная нами в последнем примере функция является обобщением двухфакторной (зависящей от двух переменных) производственной функции Леонтьева, которая имеет вид
Здесь переменные полагаются неотрицательными и обозначают соответственно затраты капитала и затраты труда, параметры являются положительными и отвечают соответственно за фондоемкость продукции и трудоемкость продукции. 172
Глава 6. Классические методы оптимизации
Второй метод нахождения условного экстремума (метод Лагранжа) Уравнение связи g(x, y) = 0 определяет величину у как функцию у - у(х) от переменной х. При подстановке у = у(х) в исследуемую функцию получим функцию одной переменной производная которой в точке возможного условного экстремума равна нулю, или, что равносильно этому, должен быть равен нулю дифференциал функции:
(2) Из уравнения связи g(x, y) = 0 соотношение между дифференциалами аргумента и функции в любой точке, а следовательно, и в точке Мо определяется равенством
Умножим равенство (3) на некоторое число А, (множитель Лагранжа), которое определим ниже, и сложим с равенством (2):
(4) Слева в равенстве (4) стоит дифференциал dL(x, у) функции , которую называют функцией Лагранжа. Равенство dL(x, v) = 0 при изучении нами локального экстремума получалось исходя из того, что . Это давало необходимые условия локального экстремума. В рамках логической цепочки рассуждений о локальном экстремуме функции L(x, у) потребуем выполнения условий в точке С этой целью выберем множитель так, чтобы было выполнено равенство (5) Тогда из соотношения
получим
Теперь можно сказать, что равенства (5) и (6) выражают необходимые условия локального экстремума в точке М0(х0, у0) функ173
Линейная алгебра. Курс лекций
ции Лагранжа L(x,y) = z(x,y) + "kg(x,y) . Иногда говорят, что система
определяет условия первого порядка при нахождении условного экстремума. Геометрическая интерпретация необходимых условий для условного экстремума Интересна геометрическая интерпретация решений системы. Введем векторы grad z(x, у)= и grad g(x, у) = Из системы легко получить равенство
откуда следует коллинеарность векторов grad z(x, у) и grad g(x, у). Построим фрагмент карты линий уровня функции z = z(x, у) (рис. 6.11). Пунктиром обозначен график функции g(x,y) = 0. •У
Линии уровня
Глава 6. Классические методы оптимизации
Градиенты grad и grad перпендикулярны к линиям уровня функции z=z(x,y) в точках и Мх соответственно. Векторы grad и grad перпендикулярны к линии g(x, у) = 0 также в точках Л/о и Л/,. При движении справа налево вдоль кривой g(x, у) = 0 пересекаются линии уровня функции Z = z(x, у) , причем каждое следующее пересечение происходит с линией более низкого уровня. Градиенты grad z и grad g в каждой точке направлены под разными углами, как это имеет место, например, в точке Л/,. Коллинеарность векторов grad z и grad g возникает в точке Мо. Следовательно, в этой точке выполнены необходимые условия локального экстремума функции Лагранжа. При дальнейшем движении вдоль кривой уравнения связи g(x,у)=0 пересекаются линии более высокого уровня. Можно заключить, что в точке Мо имеется минимум. Если бы кривая уравнения связи, выйдя из точки Л/о, продолжала пересекать линии все более низкого уровня, точка Мо оказалась бы седловой (или точкой минимакса). Окаймленный гессиан Для функции Лагранжа L(x, у) получены необходимые условия локального экстремума. Теорема о достаточных условиях локального экстремума функции L(x, у) подобна ранее сформулированной теореме о достаточных условиях локального экстремума для функции но между ними существуют отличия. ТЕОРЕМА (об исследовании на экстремум по окаймленному гессиану) Пусть всюду в окрестности точки 1) определена функция 2) обе частные производные первого порядка
непрерывны,
причем 3) все частные производные второго порядка непрерывны; 4) дифференциалы dx и dy связаны между собой соотношением , причем 175
Линейная алгебра. Курс лекций 5) второй дифференциал d2L в точке Мо является знакоопределенной квадратичной формой. Тогда функция L(x, у) имеет в точке Мо локальный экстремум, а функция — условный экстремум: а) при — локальный минимум; б) при — локальный максимум.
Доказательство теоремы заключается в обосновании использования в данной теореме выводов ранее рассмотренной теоремы о достаточных условиях для функции при исследовании на локальный экстремум. Уравнение связи g(x, у) = О приводит к существованию зависимости между дифференциалам и dx и dy. Как известно, второй дифференциал не обладает инвариантностью формы. Поэтому выражение для требует уточнения. Найдем дифференциал от дифференциала в точке Мо, считая у зависимой переменной:
Здесь в силу непрерывности вторых производных, в стационарной точке Мо. Поэтому второй дифференциал функции Лагранжа в точке Мо будет совпадать со вторым дифференциалом функции Лагранжа двух независимых переменных:
Следовательно, можно воспользоваться выводами о знакоопределенности d2L и соответственно знаке AL по знакам угловых миноров матрицы Гессе: 1) если М} > О, М2 > О, функция Цх, у) имеет в точке Мо минимум; 2) если Мх < О, М, > 0, функция Цх, у) имеет в точке Мо максимум. Если сделать вывод о наличии экстремума при произвольных dx и dy невозможно, найдем dy из равенства и подставим в d2L: 176
Глава 6. Классические методы оптимизации
Вынесем за скобки множитель
Эта формула может быть приведена к удобному для использования виду. Второй сомножитель в произведении вычисляется как определитель матрицы в точке
Матрица Я называется окаймленной матрицей Гессе, а определитель \Н\ — окаймленным гессианом. Если гессиан то d2L < О, что указывает на безусловный максимум функции L(x, у) и условный максимум функции z- z(x, у). Если то d2L > 0. Это соответствует безусловному минимуму функции L(x, у) и условному максимуму функции z- z(x, у). Если метод не работает. Обоснование закончено. • Замечание 1 . Метод Лагранжа не указывает условий, при которых условный экстремум отсутствует. Замечание 2. При составлении функции Лагранжа можно брать неопределенный множитель с любым знаком. Выбор определяется соображениями удобства. З а м е ч а н и е 3. Вычисляемый неопределенный множитель X может оказаться любым действительным числом, включая иррациональное число. В частном случае при X = 0 условный экстремум исследуемой функции совпадает с ее локальным экстремумом, если таковой существует. На рис. 6.12 представлено графическое решение задач и на условный экстремум функции z=1-x2 -у2 177
Линейная алгебра. Курс лекций
с уравнением связи g(x,y) - у - х = 0. Линия пересечения выделена темным цветом. Стрелкой указан условный экстремум функции z=1-x2 -у1, совпадающий с ее локальным максимумом. Вычисленное значение множителя Последовательность действий при отыскании условных экстремумов функции двух переменных Задача. Найти условный экстремум функции z = z(x, у) при наличии уравнения связи g(x, у) - 0. Краткая формулировка:
(7) Решение. 1) Составляем функцию Лагранжа 2) Находим производные функции L(х, у) и приравниваем их к нулю. Присоединяем уравнение связи, получая систему из трех уравнений для определения координат возможных точек экстремума и множителя Лагранжа 3) Строим окаймленную матрицу Гессе, вычисляем окаймленный гессиан в точке (х0, у0) и делаем вывод о наличии услов178
Глава 6. Классические методы оптимизации
ного экстремума. Находим значение функции z = z(x, у) в точке условного экстремума. ПРИМЕР. Провести исследование на условный экстремум \z - х1 +12ху + у2 -> extr, {4х2+у2=25. Решение. Составим функцию Лагранжа: L(x,y) = x2 + \2xy + y2 -l(4x2 +у2 -25) и запишем систему уравнений из первых производных и уравнения связи: (8)
Из первых двух уравнений получаем (9) Очевидно, что точка с координатами (0, 0) является решением системы (9), но не удовлетворяет последнему уравнению системы (8). Полагая теперь разделим первое уравнение системы (9) на второе
и решим полученное уравнение. Корни уравнения Подставив
в первое или во второе уравнения системы (8),
найдем связь между переменными х и у: выражения Соответственно
Подстановка
в третье уравнение системы (8) дает Д л я п о л у ч и м
Итак, получены четыре стационарные точки 179
Линейная алгебра. Курс лекций
Найдем все вторые производные функции Лагранжа:
Составим матрицу Гессе из вторых производных:
Подстановка любого значения множителя из приводит к равенству нулю минора М-,. Поэтому обратимся к окаймленной матрице Гессе
Рассмотрим последовательно четыре стационарные точки. 1)4(2,-3,-2).
В точке
достигается условный минимум
2).
Здесь условный минимум 180
Глава 6. Классические методы оптимизации
В точке
достигается условный максимум
Здесь условный максимум На рис. 6.13 и 6.14 представлено графическое решение задачи на условный экстрему. Пересечения поверхностей изображены с двух точек обзора, отличающихся приблизительно на 90°. Стрелками показан один из минимумов (рис. 6.13) и один из максимумов (рис. 6.14). Метод неопределенных множителей Лагранжа может быть перенесен на случай функции от любого числа аргументов. Пусть требуется определить условный экстремум функции п переменных при наличии т уравнений связи
181
Линейная алгебра. Курс лекций
Рис. 6.13
Рис. 6.14
Глава 6. Классические методы оптимизации
где т < п . Составляем функцию Лагранжа, используя т множителей Лагранжа
Приравняв к нулю все частные производные первого порядка, получим систему из п + т уравнений для определения множителей и координат возможных точек условного экстремума. Если матрица Гессе не показывает наличие экстремума, находим дифференциалы всех уравнений связи
Решаем систему из т уравнений с п переменными dx}, dx2,..., dxn. Предполагая, что ранг r матрицы системы r= т, находим т переменных, которые выражены через свободные п — т переменных. Подставим их в квадратичную форму d2L и составим квадратную матрицу размера (п-т)*(п-т) квадратичной формы. Далее, применив критерий Сильвестра, сделаем вывод о наличии экстремума.
§ 6.3. Экстремум неявной функции Пусть функция z=z(x,y) определяется уравнением F(x,y,z)=0. Потребуем, чтобы функция z = z(x,y) была дважды непрерывно дифференцируема и Первый дифференциал в стационарной точке равен нулю:
что может иметь место в силу независимости дифференциалов dx и dy только при
183
Линейная алгебра. Курс лекций
Уравнения (10) выражают необходимые условия существования экстремума, определяя точку (х0, у0) возможного экстремума. Для нахождения достаточных условий найдем второй дифференциал в стационарной точке (лс0, у0):
(11) Найдем отдельно каждое из слагаемых в правой части равенства (11):
В стационарной точке F^ = 0 , поэтому равенство значительно упростится:
Аналогично можно доказать, что
Подставим полученные равенства в (11) и преобразуем квадратичную форму, используя (12) Матрица Гессе для квадратичной формы (12) примет вид 184
Глава 6. Классические методы оптимизации
Применяя критерий Сильвестра к найденной матрице, исследуем знакоопределенность квадратичной формы d2z и сделаем вывод о существовании экстремума неявной функции. ПРИМЕР. Найти локальный экстремум неявной функции в области считая
z = z(x,y). Решение. Найдем частные производные функции F(x,y,z) по всем переменным:
Чтобы определить стационарные точки, решим систему уравнений:
Выразим переменную у из первого уравнения и подставим во второе
Получим критические точки Рх с координатами^ = 0, v, = 0 и Р2 с координатами х2 = — 1, у2 = — 1. Подстановка этих значений аргументов в уравнение F(x, у, z) = 0 с учетом даст значения . Итак, имеем Р{ = (0, 0,1) и Р2 (-1, - 1 , >/5 -1). Найдем вторые частные производные: и составим матрицу Гессе квадратичной формы для неявной функции: 185
Линейная алгебра. Курс лекций
Обращаем внимание на следующее: из матрицы можно вынести множитель 3, но нельзя вынести множитель
, так как z+l нужна информация о знаке первого углового минора Мх. Рассмотрим вначале точку 1. Здесь ке достигается локальный максимум, равный
В этой точ-
Глава 6. Классические методы оптимизации 2.
З д е с ь П о э т о м у обратимся к о
второму дифференциалу:
Очевидно, не является знакоопределенной квадратичной формой. Поэтому в данной точке экстремума нет. На рис. 6.15 приведен фрагмент поверхности заданной неявной функции. Стрелками указаны точки /J и . Р2.
§6.4. Глобальный экстремум Глобальным экстремумом называются наибольшее и наименьшее значения функции в замкнутой ограниченной области D. Пусть функция z = x(x, у) непрерывна в этой области. Тогда найдется точка в которой функция принимает наибольшее (наименьшее) значение. Если точка (хо,уо) лежит внутри области Д она является стационарной, и в ней может достигаться локальный максимум или минимум. Наибольшее или наименьшее значение функция может принимать также на границе области. Следовательно, задачу исследования функции на глобальный (global) экстремум в области можно сформулировать так:
Решение задачи разбивается на две части: 1) исследование функции z = х(х, у) на локальный (local) экстремум в области g(x, у) < 0:
2) исследование функции z = x(x, у) на условный (conditional) экстремум на границе области g(x, y) = 0:
187
Линейная алгебра. Курс лекций
Наибольшее (наименьшее) из всех этих чисел и будет искомым наибольшим (наименьшим) значением функции z- x(x, у) в области D. ПРИМЕР. Исследовать на глобальный экстремум функцию в области Решение. Для решения задачи
надо рассмотреть несколько случаев:
Находим стационарные точки: Единственная стационарная точка (0, 0) не входит в рассматриваемую область.
Подставим выражение в исследуемую функцию. Получаем Во всех точках окружности функция принимает одно и то же постоянное значение z=l.
В силу симметрии задачи из двух случаев достаточно рассмотреть один, например х=2. Подставим х-2 в функцию z: Это парабола с ветвями, направленными вниз. Критическая точка >> = 0, в которой функция принимает значение, равное z= —2. На концах отрезка [—2, 2] функция равна z=-6. 188
Глава 6. Кгассические методы оптимизации
Система рассматривается аналогично случаю 3. Собираем все полученные значения функции t
Выбираем наибольшее и наименьшее значения из всех этих чисел:
График функции приведен на рис. 6.16.
в области
З а м е ч а н и е . При исследовании функции на глобальный экстремум можно ограничиться отысканием значения функции в критических точках. Достаточные условия обычно не используют.
-2
Линейная алгебра. Курс лекций
В математическом анализе существует класс так называемых выпуклых функций, примерами которых могут служить функции, представленные на рис. 6.6—6.8 и 6.12. Они широко применяются в экономике и в дальнейшем будут нами изучаться. Выпуклая функция не имеет седловых точек. Поэтому равенство ее частных производных нулю является не только необходимым, но и достаточным условием локального экстремума. Локальный экстремум выпуклой функции является также и глобальным, т.е. наибольшим значением функции в случае, когда функция выпукла вверх, и наименьшим, когда она выпукла вниз.
§ 6.5. Экстремум в системах функций Изучение экстремумов математических объектов, задаваемых несколькими функциями, является значительно более сложной задачей. В общем случае задачу можно сформулировать так: найти экстремум функции z=z(x, у), заданной системой функций
Поиск решения начнем с нахождения множества таких точек на координатной плоскости Оху, в которых значения функций системы равны Решение этого уравнения у = у (х) подставим в одну из функций и исследуем на экстремум функцию z = Z (х). Критическая точка х0 для функции задает стационарную точку (х0, у0) на плоскости Оху, в которой возможен экстремум zextr=f(x0,y0). Геометрически это означает, что в пространстве разыскивается совокупность линий пересечения поверхностей, описываемых заданными функциями. На линиях пересечения находим наибольшее или наименьшее значение ZQПолучим необходимые условия экстремума системы функций. Считая в системе (13) переменные х и у функциями переменной z, продифференцируем оба уравнения по z^
190
Глава 6. Классические методы оптимизации
Вычтем из первого уравнения второе:
и, полагая, что
, разделим обе части равенства
на эти величины. Получим
Очевидно,
Поскольку найдем производную по х, которая в критической точке ZQ будет равна нулю:
Отсюда при условии
получим
Подставим в уравнение
производную
и после несложных преобразований, считая
, получим
ПРИМЕР. Исследовать на экстремум функцию z = z(x, у), заданную системой уравнений
191
Линейная алгебра. Курс лекций
Решение. Область значений функции уравнения
Найдем корни
для чего возведем его в квадрат: После сокращения уравнение примет вид ху = 0. Следовательно, х =0 или у - 0. При х = 0 получим . Очевидно, минимальное значение z равно при у=0 и х = 0. Другой случай (у-0) приводит к тому же результату. Отметим, что Zmin(0, 0) = 0 представляет собой глобальный минимум функции z. На рис. 6.17 изображены графики функций и пересекающиеся по плоскостям у = 0 и х= 0. Линии пересечения поверхностей указаны белым цветом. Некоторые из функций системы могут быть заданы в неявном или параметрическом виде. ПРИМЕР. Исследовать на экстремум функцию z= z(x, у), заданную системой уравнений
192
Глава 6. Классические методы оптимизации
Решение. Подставим z = х + у в первое уравнение:
Представим уравнение как квадратное относительно у:
Его решение подставим во второе уравнение системы. Получим
Исследуем функцию z(x) на экстремум с помощью производной
Линейная алгебра. Курс лекций
Уравнение
при
При х < О решение
. Исследование знаков производной
показывает, что в точке в точке
имеет решение
достигается максимум
,
— минимум
Окончательно получаем
Графики обеих функций представлены на рис. 6.18. Стрелками указаны минимум и максимум функции z = (х, у), причем минимум хорошо виден, а максимум скрыт под поверхностью сферы. Для улучшения обзора из сферы удалена часть поверхности.
§ 6.6. Экстремум в системах неравенств Математическими объектами, задаваемыми системами неравенств, в трехмерном случае являются объемные геометрические фигуры, границы которых описываются некоторыми функциями. Формулировка задачи выглядит следующим образом: найти экстремум функции z = z(x, у), заданной системой неравенств
Задача отыскания подобного экстремума математического объекта сводится к решению нескольких систем 1. Исследование функции z = z(x, у), определяемой из уравнения F(x, у, z) = 0, на локальный экстремум при условии справедливости неравенства G(x, у, z) < 0, т. е.
194
Глава 6. Классические методы оптимизации
2. Исследование функции определяемой из уравнения G(x, у, z) - 0, на локальный экстремум при условии справедливости неравенства F(x, у, <) < 0, т. е.
3. Исследование функции z=z(x,y), определяемой из уравнения F(x, у, z)= G(x, у, z), описывающего линию пересечения поверхностей. ПРИМЕР. Исследовать на экстремум функцию z= z(x, у), заданную системой неравенств
Решение. Первая из систем
позволяет найти максимальное значение х2 + у2 = О, что не противоречит условию л 2 + у2 < z2-
при условии
Линейная алгебра. Курс лекций
Из второй системы
можно сделать вывод о росте функции z с ростом чения на
следуют из неравенства
. Ограни. Следователь-
но, На границе, являющейся пересечением поверхностей, выполняется равенство
откуда следует ция
В точках на этой окружности функ-
. Следовательно, наибольшее значение функции
наименьшее значение функции На рис. 6.19 приведена область, ограниченная данными неравенствами. Стрелками указаны точки, в которых функция z=x(x, у) принимает наибольшее и наименьшее значения. ПРИМЕР. Исследовать на экстремум функцию z=x(x, у), заданную системой неравенств
Решение. 1. Исследуем функцию z = х2 - ху + у2 на локальный экстремум в области z<x + y + \ , т.е. рассмотрим систему
Необходимые условия
дают стационарную
точку с координатами в которой Неравенство z<x + y + l в стационарной точке выполнено. 2. Функция z = x + y + \ не имеет локального экстремума, поэтому система 196
Глава 6. Классические методы оптимизации
не дает решений при исследовании на локальный экстремум. 3. Рассмотрим поведение функции z на пересечении поверхностей. Решим систему
Выразив переменную у из второго уравнения как подставим ее в первое уравнение. Тогда
После преобразования получим функцию z-z(x) в неявном виде: Приравняв к нулю производную неявной функции z = z(x)
Линейная алгебра. Курс лекций
получим: F'x = 0 при z = 2х + 1. Из системы уравнений
а также из равенства координатами
найдем стационарную точку Р2 с
и стационарную точку Ръ с координатами
Выбирая из Z\, z->, Zj, наибольшее и наименьшее значения, окончательно получим 0) = 0. На рис. 6.20 построены области Стрелками указаны полученные точки
и
§ 6.7. Оптимизация потребительского поведения (функция спроса) Рассмотрим задачу зависимости объема личного потребления или спроса от доходов, цен и социально-демографических факторов. Пусть U(x) — целевая функция потребления, характеризующая предпочтения потребителя, — вектор объемов потребления благ х{, п — количество рассматриваемых благ. Покупая для личного потребления товары х{ по ценам Pj, покупатель ограничен размером своего дохода /. Ставится задача оптимизации потребительского поведения с бюджетным ограничением
Решением задачи потребительского выбора является функция спроса — вектор каждая координата которого и дохода /. 198
зависит
от
..., вектора
цен
Глава 6. Классические методы оптимизации
Рассмотрим задачу на условный экстремум для функции двух переменных \U(x) = -х^х,' 2 -» max, 1/>,х,+/>2х2 = /. Целевая функция является выпуклой. Поэтому, как указывалось ранее, при исследовании функции на экстремум достаточные условия можно не использовать. Составим функцию Лагранжа:
и запишем систему уравнении из первых производных и уравнения связи:
Разделив первое уравнение на второе, придем к системе
решением которой являются В стационарной точке выпуклая функция симальна. Векторная функция спроса имеет вид
мак-
Следовательно, количество приобретаемого товара прямо пропорционально доходу и обратно пропорционально цене товара. 199
Линейная алгебра. Курс лекций
§ 6.8. Максимизация прибыли в проектном анализе В процессе принятия инвестиционных решений приходится решать задачу максимизации планируемой прибыли. Одна из функций, с помощью которой в проектном анализе принимается инвестиционное решение (критерий), называется чистым дисконтированным доходом NPV (Net Present Value). Экономический смысл этой функции состоит в максимизации разности между всеми проектными доходами и затратами, т.е. прибыли. Однако, следуя теории проектного анализа, в этом расчете необходимо учитывать время произведения затрат и время получения доходов, а также процентную ставку. Все это находит отражение в критерии ЛТКблагодаря применению теории изменения ценности денег во времени. Кладя деньги в банк, мы рассчитываем на денежный прирост. Он определяется по формуле сложных процентов
где ДО) — первоначальный вклад, положенный в банк на t лет под r годовых процентов. Поставим теперь задачу следующим образом. Какую сумму надо положить в банк под r % в год, чтобы через t лет получить X(f) денежных единиц? Другими словами, найти стоимость суммы денег, полученной через t лет, но приведенной к настоящему времени. Очевидно, она равна
Величину r можно назвать ставкой дисконта, отражающей изменение стоимости денег во времени. Предположим, рассчитывается проект, который принесет через год доход в размере b (1) денежных единиц, через два года — b (2) денежных единиц и т.д. Тогда, пересчитанный к настоящему времени, он составит в течение t лет величину, равную
200
Глава 6. Юшссические методы оптимизации
Реализация проекта потребует затрат в каждом году жиз ненного цикла проекта £(1), е{2), ..., e{t). Пересчитанные к на стоящему времени ежегодные затраты составят величину
Рассчитаем чистый дисконтированный доход NPV (Net Present Value), составляющий, как уже указывалось, разность между приведенными к настоящему времени будущими потоками доходов и затрат с учетом инвестиции в начальный момент. Получим
Чистый дисконтированный доход NPV, как уже говорилось, характеризует эффективность проекта и является одним из основных критериев при выборе проекта. Рассмотрим подробнее. Он представляет собой функцию двух переменных: ставки дисконта r и времени жизни проекта (или горизонта его планирования) t. Время жизни проекта оказывается конечной величиной, обычно равной 5—10 годам, после чего требуется радикальная реорганизация, новое инвестирование или ликвидация проекта. В противном случае проект начнет приносить убытки. Функция чистого дохода (прибыли) (доходы минус затраты) для каждого проекта индивидуальна. Однако некоторые свойства функции являются общими для реальных проектов: первоначальный рост, достижение максимума и последующий спад. Несколько конкретизируем немного проект. Пусть он рассчитан на 10 лет. Рассмотрим два различных случая, отличающихся различным поведением на заключительной стадии проекта. 1. В начале стадии убывания чистого дохода менеджеры поддерживают проект различными мерами, добиваясь превышения доходов над затратами. Пусть функция прибыли имеет вид (рис. 6.21) 201
Линейная алгебра. Курс лекций
р 0.6 0.5 0.4 0.3 0.2 0.1
2
4
6
8
10
Рис. 6.21
В начале проекта прибыль растет медленно, в течение трех лет выходит на максимум. Затем в течение последующих 7 лет она падает по экспоненте до 10 % от своей максимальной величины.
Глава 6. Классические методы оптимизации
Зависимость функции NPV от ставки дисконта r в пределах 5—50 % и времени развития проекта п по годам приведена на рис. 6.22. Плоскость на рисунке проведена на уровне NPV = 0 и отсекает участки с NPV> 0. Для каждого года проекта можно определить величину r (норму дисконта IRR), при которой затраты на проект окупятся. Для r= 44 % это произойдет только в конце проекта (NPV станет больше нуля). При r> 44 % проект станет убыточным. На рис. 6.22. красная линия отсекает ставку процента r= 44 %. Если ставка процента равна, например, 27 %, проект окупится к четвертому году (дисконтированный период окупаемости — критерий DPBP= 3). Светлой стрелкой на рис. 6.22 указана точка на поверхности, соответствующая
IRR = 27% u DPBP=3. 2. Проект не поддерживается новыми идеями, инвестициями, живет за счет внутренних ресурсов. Вся прибыль извлекается из проекта. Или в проекте обнаружились проблемы, которые привели во второй половине жизненного цикла проекта к превышению расходов над доходами Пусть в этом случае функция прибыли имеет вид (рис. 6.23) В начале проекта прибыль растет медленно, в течение четырех лет она выходит на максимум. Затем в течение последующих двух лет прибыль падает до нуля. Расходы продолжают расти.
Рис. 6.23
203
Линейная алгебра. Курс лекций
Зависимость в этом случае функции NPV ОТ ставки дисконта r в пределах 5—50 % и времени развития проекта п по годам приведена на рис. 6.24. По-прежнему плоскость на рисунке проходит через ординату со значением NPV= 0. В первые годы проект развивается благополучно. При невысокой ставке процента прибыль появляется на четвертом году реализации и на 5—6-м году достигает максимальных значений. Однако последние три года могут развиться катастрофические события. Что на первый взгляд удивительно, катастрофа возникает при малых ставках дисконта, в то время как при больших ставках проект затухает медленно. Это видно из рис. 6.25. Причина этого явления состоит в том, что при низкой процентной ставке деньги с течением времени остаются «дорогими». Потери денежных средств на 7—10-м году проекта весьма чувствительны. При высокой ставке процента деньги на 7—10-м году проекта становятся «дешевыми». Их потеря не столь чувствительна. Действительно, доход, полученный от проекта на п-м году жизненного цикла, пересчитанный к началу проекта, равен
204
Глава 6. Классические методы оптимизации
Отношение прибылей, а в данном случае — убытков при низкой ставке гх и высокой ставке г2 составит величину
Для rx - 5 % и г-, = 50 % на 7-м году жизни проекта будем иметь
Это означает, что потери составят при низкой процентной ставке в 12 раз большую величину, чем при высокой. Отсюда вывод: при низкой ставке процента следует более зорко следить за прибылями—убытками. По достижении максимума прибыли и в начале спада следует принимать решительные меры, ибо
Линейная алгебра. Курс лекций
«промедление смерти подобно». Проект при низкой процентной ставке и неблагоприятном стечении обстоятельств может быть потерян для инвестора с большими убытками. § 6.9. Глобальный экстремум в задачах математического программирования В общем виде задача математического программирования
для двух переменных записывается следующим образом:
1)
или 2)
где f(х, у) — целевая функция, не имеющая локальных экстремумов, — функции, ограничивающие поиск решения. Ограничения указывают на поиск решения только в первой четверти координатной плоскости. Точка называется оптимальным решением системы уравнений и неравенств, если в этой точке целевая функция достигает максимального значения в первом случае и минимального — во втором. Максимум или минимум целевой функции являются глобальными экстремумами. В этом отличие задачи математического программирования от задач на условный или локальный и даже на глобальный экстремум, который может достигаться как на границе области, так и во внутренних точках. Задачи 1 и 2 называются сопряженными и образуют двойственную пару. К необходимости решать задачу математического программирования (ЗМП) приводят: 1. Проблема планирования производства, т. е. планирование производства определенных видов продукции так, чтобы было обеспечено наиболее рациональное использование материальных, финансовых и других ресурсов. Должен быть достигнут максимум или минимум (в экономике — оптимум) некоторой функции, описывающей прибыль, объем производства и т.д. 206
Глава 6. Классические методы оптимизации
2. Проблема оптимального смешения. Требуется выбрать количество каждого из исходных ингредиентов для составления смеси, если известна стоимость единицы ингредиента. Смесь надо получить с заданными свойствами, причем с наименьшими затратами. Такие задачи оптимального смешения возникают в металлургии, сельском хозяйстве, пищевой промышленности и т.д. 3. Транспортная задача перевозки произведенного продукта от различных производителей нескольким потребителям. Поставки должны осуществляться таким образом, чтобы издержки на транспортировку были минимальными. 4. Проблема оптимального планирования финансов и др. Если все функции, входящие в задачу математического программирования, линейны, имеем задачу линейного программирования (ЗЛП). В случае же нелинейности хотя бы одной из функций имеем дело с задачей нелинейного программирования (ЗНП). Приведем примеры нескольких задач математического программирования, обратив внимание на их геометрическую интерпретацию. На рис. 6.26—6.28 в трехмерной системе координат построены модели следующих видов. Модель ЗЛП (рис. 6.26):
Модель ЗНП (рис. 6.27):
207
Рис. 6.26
Рис. 6.27
Глава 6. Классические методы оптимизации 0
Рис. 6.28
Модель ЗНП (рис. 6.28):
На рис. 6.26 представлена геометрическая интерпретация ЗЛП, в которой требуется найти максимальное значение линейной функции изображающей плоскость, ограниченную линейными неравенствами, также изображающими плоскости, расположенные вертикально. На рис. 6.27 дана геометрическая интерпретация ЗНП, в которой нелинейной частью является исследуемая на максимум функция, представляющая собой параболоид вращения Наконец, на рис. 6.28 нелинейность ЗНП представлена функцией ограничения Это цилиндроид с плоскостью внутри, на которой требуется обнаружить максимальное значение Часть цилиндроида вырезана для улучшения обзора. Визуально глобальный максимум на каждой из исследуемых поверхностей легко определяется. Максимальное значение отмечено темной точкой. 209
Линейная алгебра. Курс лекций Разработаны различные методы решения ЗМП, например симплекс-метод. Их изучением занимается экономико-математическая дисциплина «Исследование операций», которая полностью опирается на пройденный материал. Вопросы для повторения 1. Сформулировать определение экстремума функции нескольких переменных. 2. Привести необходимые условия локального экстремума. 3. Сформулировать теорему об исследовании на локальный экстремум по угловым минорам. 4. Дать определение условного экстремума. 5. Дать геометрическую интерпретацию необходимых условий условного экстремума. 6. Описать метод Лагранжа по исследованию функции на условный экстремум. 7. Что такое окаймленный гессиан? 8. Записать достаточные условия при исследовании неявной функции на экстремум. 9. Описать схему исследования функции на глобальный экстремум.
Список литературы
1. Краснов М. Л., Киселев А. И., Макаренко Г. И. и др. Высшая ма-
тематика. Т. 1. М.: Эдиториал УРСС, 2000. 2. Красc М. С. Математика для экономических специальностей. М.: Дело, 2002. 3. Пискунов И. С. Дифференциальное и интегральное исчисление Т.1. M.: Наука, 1985. 4. Высшая математика для экономистов/Под ред. проф. Н.Ш. Кремера. М.: Банки и биржи, изд. Объединение "ЮНИТИ", 1998. 5. Задачи и упражнения по математическому анализу/Под ред. Б. П. Демидовича. М.: Интеграл-пресс, 1997. 6. Ильин В. А., Ким Г. Д. Линейная алгебра и аналитическая геометрия. М.: Изд-во Моск. ун-та, 1998. 7. Ильин В. А., Позняк Э. Г. Линейная алгебра. М.: Наука, 1999.
Тематический указатель
Б Базис векторного пространства 92 Базисные решения системы уравнений 65
в
Введение определителя 17 Вектор в n-мерном пространстве 90 Векторы в трехмерном пространстве 87 Виды матриц 12 Возведение матрицы в целую положительную степень 16 Второй метод нахождения условного экстремума (метод Лагранжа) 175 Вычисление определителя 26 Вычитание матриц одинакового размера 14
г
Геометрическая интерпретация необходимых условий для условного экстремума 174 Глобальный экстремум 187 Глобальный экстремум в задачах математического программирования 206
Д Дефект отображения 118 Дифференцирование векторной функции векторного аргумента 155 212
Дифференцирование векторной функции скалярного аргумента 148 Дополнение до базиса 96 Достаточные условия локального экстремума 161
Е Евклидовы пространства 105
и Использование квадратичных форм 163
к Координаты вектора 82 Критерий Сильвестра 140
л Линейная зависимость и независимость векторов 8! Линейная оболочка 104 Линейные комбинации строк или столбцов 45 Линейные операторы и их свойства 121 Линейные операции над векторами 81 Линейные подпространства 102
м Максимизация прибыли в проектном анализе 200 Матрица перехода к новому базису 99 Матрицы оператора в разных базисах 125 Метод Гаусса 59 Метод обратной матрицы 52 Метод с использованием расширенной матрицы 54 Метод с использованием формул Крамера 55 Модель Леонтьева многоотраслевой экономики 75
н Независимость собственных векторов 129 Необходимые условия локального экстремума 158 213
о
Образ отображения 118 Общее решение системы неоднородных линейных уравнений 73 Окаймленный гессиан 175 Определение локального экстремума 157 Определение ранга матрицы 41 Определитель оператора в разных базисах 126 Оптимализация потребительского поведения (функция спроса) 198 Ортогональное дополнение 112 Ортогональность собственных векторов 132 Ортонормированная система векторов 108 Определение векторной функции скалярного аргумента 146 Определение векторной функции векторного аргумента 150 Определение условного экстремума 168 Основные сведения о матрицах 11 Отображение базиса 119 Отображения 117
п
Первый метод нахождения условного экстремума 170 Понятие квадратичной формы 133 Понятие линейного векторного пространства 86 Последовательность действий при отыскании условных экстремумов функции двух переменных 178 Потенциальное поле вектора 152 Правила дифференцирования векторной функции скалярного аргумента 149 Предел и непрерывность векторной функции скалярного аргумента 147 Приведение квадратичной формы к каноническому виду 137
р Равносильность систем линейных уравнений при элементарных преобразованиях 58 Разложение вектора по базису 93 Размерность векторного пространства 91 Ранг матрицы при элементарных преобразованиях 43 Ранг отображения 118 214
с Свойства длины вектора 107 Свойства канонических форм 139 Свойства линейной зависимости векторов 89 Свойства линейной оболочки 105 Свойства матрицы перехода к новому базису 100 Свойства обратных матриц 30 Свойства однородной системы линейных уравнений 67 Свойства определителей 22 Свойства ортогонального дополнения 113 Свойства производной векторной функции скалярного аргумента 149 Свойства скалярного произведения 84 Свойства суммы и пересечения подпространств 104 Свойства транспонирования матрицы 17 Связь между квадратичной формой и оператором 136 Связь ранга с числом независимых строк (столбцов) 47 Симметричный оператор 131 Скалярное произведение векторов 82 Сложение матриц одинакового размера 14 Собственные векторы и собственные значения 127 Способ построения обратной матрицы 39 Строка матрицы как линейная комбинация независимых строк матрицы 48 Структура линей ного оператора 122 Сумма и пересечение линейных подпространств 103 Схема решения системы уравнений 64
т Теорема Кронекера — Капелл и 63 Теорема о существовании обратной матрицы 28 Типы матриц элементарных преобразований 33 Транспонирование матрицы 16
у Умножение матрицы на матрицу 15 Умножение числа на матрицу 14 215
ф Фундаментальные решения 68
э Экстремум в системах неравенств 194 Экстремум в системах функций 190 Экстремум неявной функции 183 Элементарные преобразования матрицы 34
я Ядро отображения 118
Малугин Виталий Александрович МАТЕМАТИКА Д Л Я Э К О Н О М И С Т О В : ЛИНЕЙНАЯ АЛГЕБРА Курс лекций Ответственный редактор И. Ескевич Редакторы Т. Косолапова, В. Зеленько Художественный редактор Е. Брынчик Технический редактор Н. Тростянская Компьютерная верстка А. Мусаев Корректор И. Боровая ООО «Издательство «Эксмо» 127299, Москва, ул. Клары Цеткин, д. 18/5. Тел.: 411-68-86, 956-39-21. Home page: www.eksmo.ru E-mail:
[email protected] Подписано в печать 28.10.2005 Формат 60x90 '/те- Гарнитура «Таймc». Печать офсетная. Бумага тип. Усл. печ. л. 14,0. Тираж 4000 экз. Заказ 6238 Отпечатано во ФГУП ИПК «Ульяновский Дом печати» 432980,г. Ульяновск, ул. Гончарова,14
Оптовая торговля книгами «Эксмо» и товарами «Эксмо-канц»: 0 0 0 «ТД «Эксмо». 142700, Московская обл., Ленинский р-н, г. Видное, Белокаменное ш., д. 1. Тел./факс: (095)378-84-74, 378-82-61, 745-89-16, многоканальный тел. 411 -50-74. E-mail:
[email protected] Мелкооптовая торговля книгами «Эксмо» и товарами «Эксмо-канц»: 117192, Москва, Мичуринский пр-т, д. 12/1. Тел./факс: (095)411-50-76. 127254, Москва, ул. Добролюбова, д. 2. Тел.: (095) 745-89-15, 780-58-34. www.eksmo-kanc.ru e-mail:
[email protected] Полный ассортимент продукции издательства «Эксмо» в Москве в сети магазинов «Новый книжный»: Центральный магазин — Москва, Сухаревская пл., 12 (м. «Сухаревская»,ТЦ «Садовая галерея»). Тел. 937-85-81. Москва, ул. Ярцевская, 25 (м. «Молодежная», ТЦ «Трамплин»). Тел. 710-72-32. Москва, ул. Декабристов, 12 (м. «Отрадное», ТЦ «Золотой Вавилон»). Тел. 745-85-94. Москва, ул. Профсоюзная, 61 (м. «Калужская», ТЦ «Калужский»). Тел. 727-43-16. Информация о других магазинах «Новый книжный» по тел. 780-58-81. В Санкт-Петербурге в сети магазинов «Буквоед»: «Книжный супермаркет» на Загородном, д. 35. Тел. (812) 312-67-34 и «Магазин на Невском», д. 13. Тел. (812)310-22-44. Полный ассортимент книг издательства «Эксмо»: В Санкт-Петербурге: ООО СЗКО, пр-т Обуховской Обороны, д. 84Е. Тел. отдела реализации (812) 265-44-80/81/82/83. В Нижнем Новгороде: ООО ТД «Эксмо НН», ул. Маршала Воронова, д. 3. Тел.(8312)72-36-70. В Казани: ООО «НКП Казань», ул. Фрезерная, д. 5. Тел. (8432) 70-40-45/46. В Киеве: ООО ДЦ «Эксмо-Украина», ул. Луговая, д. 9. Тел./факс (044) 537-35-52; e-mail:
[email protected] Во Львове: Торговое Представительство ООО ДЦ «Эксмо-Украина», ул. Бузкова, д. 2 Тел./факс (032) 245-00-19, тел. (032)245-01-71; e-mail:
[email protected]