ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования
С...
55 downloads
185 Views
743KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования
СЕВЕРО-ЗАПАДНЫЙ ГОСУДАРСТВЕННЫЙ ЗАОЧНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
АФАНАСЬЕВА О.В. ПОТАПЕНКО А.А.
ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ В ЗАДАЧАХ УПРАВЛЕНИЯ
САНКТ-ПЕТЕРБУРГ 2005
1 ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования
СЕВЕРО-ЗАПАДНЫЙ ГОСУДАРСТВЕННЫЙ ЗАОЧНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
АФАНАСЬЕВА О.В. ПОТАПЕНКО А.А.
ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ В ЗАДАЧАХ УПРАВЛЕНИЯ
УЧЕБНОЕ ПОСОБИЕ
САНКТ-ПЕТЕРБУРГ 2005
2 Утверждено редакционно-издательским советом университета. УДК 517 (070) Афанасьева О.В., Потапенко А.А. Функциональный анализ в задачах управления: Учеб. пособие. – СПб: СЗТУ, 2005. – 97---?с.
Учебное пособие предназначено для студентов пятого курса факультета Системного
анализа
и
естественных
наук,
изучающих
дисциплину
«Функциональный анализ в задачах управления». В учебном пособии излагаются основы функционального анализа (линейные пространства, евклидовы пространства, метрические пространства, линейные операторы), показаны приложения этого аппарата при изучении операторных уравнений, в теории квадратичных форм, для нахождения приближенных решений уравнений. Учебное
пособие
соответствует
требованиям
Государственного
образовательного стандарта высшего профессионального образования по направлению подготовки магистра
553000 – «Системный анализ и
управление». Рецензенты: В.Е. Марлей, док. техн. наук, проф., зам. Директора СПИРАН; А.А. Кондратьев, док. техн. наук, проф., директор института экономики и управления транспортными системами АГА. © Северо-Западный государственный заочный технический университет, 2005 © Афанасьева О.В., Потапенко А.А., 2005
3
Предисловие Дисциплина «Функциональный анализ в задачах управления» является основой ряда дисциплин: «Основы теории эффективности сложных систем», «Теория принятия решений» и других дисциплин. Указанную дисциплину изучают на первом курсе подготовки магистра по направлению 553000 – «Системный анализ и управление». Теоретической базой для освоения являются материалы дисциплин «Математика», «Математические методы системного анализа и теории принятия решений», «Системный анализ и принятие решений». В учебном пособии излагаются основы функционального анализа, показаны приложения этого аппарата при изучении линейных операторов, в теории квадратичных форм, нахождения приближенных решений уравнений и других вопросов. Учебное пособие предназначено для студентов первого курса подготовки магистра по направлению 553000 – «Системный анализ и управление».
4
Введение Функциональный анализ имеет множество приложений в различных областях математики; его методы проникают в смежные технические дисциплины. Описать все прикладные методы функционального анализа в одном учебном пособии не представляется возможным, поэтому в нём освещаются лишь некоторые из методов, играющие важную роль. В данном учебном пособии излагаются некоторые теоретические положения и результаты функционального анализа в теории линейных пространств, эвклидовых пространств, метрических пространств и линейных операторов, а также показаны их применения при решении операторных уравнений, в теории квадратичных форм, для нахождения приближенных решений уравнений. Целью
данного
учебного
пособия
является
сделать
методы
функционального анализа, позволяющие получать определённые решения в задачах управления, более понятными для тех, кто занимается приложением математики к получению определённых управленческих решений в конкретных практических задачах.
5
Глава 1. Линейные пространства § 1. Введение Рассмотрим три множества:
A – множество всех свободных векторов на плоскости; B – множество всех квадратных матриц третьего порядка; C – множество всех многочленов не выше 5 степени с вещественными коэффициентами. Обратим внимание только на две операции с элементами этих множеств. 1. Сложение. 2. Умножение на вещественное число. Напомним их определения. →
Для
A.
Сумма векторов
a
→
и
– вектор, найденный по правилу
b
→
треугольника, построенного на векторах на число
α
a
→
→
и
b ; произведение вектора a →
– вектор, имеющий длину, равную | a | ⋅α , и направленный в →
a , если α > 0 , и в противоположную, если α < 0 . Для B . Сумма матриц M и N – матрица с элементами, равными суммам соответствующих элементов матриц M и N ; произведение матрицы M на число α – матрица с элементами, равными произведениям сторону вектора
числа α на соответствующие элементы матрицы М. Для
C.
Сумма многочленов
P
и
Q
– многочлен, коэффициенты
которого равны суммам коэффициентов членов с одинаковыми степенями многочленов; произведение многочлена которого
равны
P на число α
произведению
коэффициенты многочлена
P.
числа
– многочлен, коэффициенты
α
на
соответствующие
6 На первый взгляд кажется, что, так как природа элементов множеств
B, C
A,
различна, а операции «сложения» и «умножения на вещественные
числа» для каждого из этих множеств определяются по-разному, то указанные операции не имеют ничего общего друг с другом, кроме названия. Однако если присмотреться внимательней, то можно заметить, что в каждом из множеств
B, C
A,
операция сложения обладает перестановочным (коммутативным) и
сочетательным
(ассоциативным)
свойствами,
которые
выражаются
соответствующими равенствами
a + b = b + a, (a + b ) + c = a + (b
(1.1) +
c ),
(1.2)
a , b , c можно взять произвольные элементы любого из либо из A, либо из B , либо из C . Точно также в каждом из A, B , C удовлетворяется распределительное (дистрибутивное)
где в качестве множеств: множеств
свойство умножения произвольного вещественного числа элементов ( a +
α
на сумму
b ) и суммы числа (α + β ) на элемент a
α (a + b ) = α a + α b ; (α + β ) a = α a + β a . Естественно, что в каждом из множеств
A, B , C
(1.3) (1.4) вместе с указанными
свойствами сохраняют свою силу и все те соотношения, которые выводятся только из этих свойств. Если нас интересуют только такие общие вопросы, то нет необходимости учитывать конкретную природу элементов множеств. Чтобы не получать для каждого из конкретных множеств в отдельности [при условии выполнения равенств (1.1), (1.2), (1.3), (1.4)] всех тех результатов, которые могут быть получены из перечисленных четырех свойств, рассмотрим некоторое абстрактное множество
L
(без учета конкретной природы
элементов) при условии, что над его элементами можно производить два действия, именуемые условно «сложение» и «умножение на вещественное число», которые обладают свойствами, выражаемыми равенствами (1.1), (1.2), (1.3), (1.4). Каков конкретный смысл этих свойств – нельзя сказать до тех пор,
7 пока природа элементов не указана (при решении прикладных задач природа элементов и оба указанные действия всегда известны). Ниже мы введем термин «линейное пространство». Под этим термином мы будем понимать совокупность объектов любой природы при условии, что указанные два действия, именуемые чисто условно «сложение» и «умножение на вещественное число», удовлетворяют указанным четырем условиям и еще некоторым довольно общим условиям. Элементы линейного пространства мы будем называть векторами, несмотря на то, что их конкретная природа может не иметь ничего общего с привычными для нас терминами. В дальнейшем будет видно, что употребление термина
«вектор»
оправдано
тем,
что
привычные
геометрические
представления, связанные с векторами, помогут не только уяснить, но и предвидеть важные результаты.
§ 2. Определение линейного пространства Определение.
L
Множество
называется
линейным
(векторным)
пространством, если: I. Дано правило, указывающее, как для любых двух элементов
a, b
из
L
L
найти в
и обозначаемый символом
некоторый элемент, называемый их суммой
a + b.
II. Дано правило, указывающее, как для любого вещественного (или комплексного) числа
α
и любого элемента
новый элемент, называемый произведением символом α
α
на
a
из
a
L
найти в
L
и обозначаемый
a или a α .
III. Определено
понятие равенства элементов в
L,
обозначаемое
знаком «=». IV. I и II операции называются соответственно сложением и умножением на число и удовлетворяют следующим восьми условиям:
8 1) сложение коммутативно
a + b = b + a;
(1.5)
2) сложение ассоциативно (a +
b ) + c = a + (b
+
c );
(1.6)
3) умножение ассоциативно
α ( β a ) = (α β ) a ;
(1.7)
4) умножение дистрибутивно по отношению к сложению элементов из
L
α (a + b ) = α a + α β ;
(1.8)
5) умножение дистрибутивно по отношению к сложению чисел (α + β ) a = α
a + β a;
(1.9)
0 , называемый нулевым, что a+0=a
(1.10)
a · 1 = a;
(1.11)
6) существует такой элемент для любого элемента
a;
7) для любого элемента
a
a существует такой элемент – a , называемый противоположным элементу a , что a + (– a ) = 0 . (1.12) Если произведение α a определено только для вещественных чисел, то линейное пространство L называется вещественным, если же произведение α a определено для любого комплексного числа α , то линейное пространство L называется комплексным. Элементы линейного пространства называются векторами (или точками) и обозначаются буквами a , b , x , y . 8) для любого элемента
9 § 3. Свойства линейного пространства Основные примеры линейных пространств будут указаны ниже, а вначале приведем (без доказательства) простейшие свойства, которые непосредственно вытекают из определения линейного пространства. Свойство 1. В каждом линейном пространстве существует единственный нулевой вектор. Свойство 2. В каждом линейном пространстве для каждого вектора существует единственный противоположный вектор. Свойство 3. В любом линейном пространстве для всякого вектора имеет место равенство
В левой части равенства
0 · a = О. символ 0 означает
(1.13) число нуль, а в правой –
нулевой вектор О. Свойство 4. Произведение любого числа
α
на нулевой вектор равно ну-
левому вектору, т. е.
α Свойство 5. Для
· О = О.
каждого элемента
a
(1.14)
противоположный элемент равен
произведению этого элемента на число – 1, т. е. – a = (– 1) · Если природа элементов, входящих в
a. L, а
(1.15) также правила образования
суммы элементов и произведения элемента на число указаны (причем III пункт и аксиомы IV пункта выполнены), то линейное пространство называют конкретным. Примеры конкретных линейных пространств Пример 1. Множество вещественных чисел по отношению к обычным операциям сложения и умножения чисел является вещественным линейным пространством.
10 Пример 2. Множество всех свободных векторов в пространстве представляет собой линейное пространство, ибо все аксиомы IV пункта выполнены (операции сложения векторов по правилу параллелограмма и умножения вектора на число определены обычным образом). Пример 3. Пусть
a = (α1,α 2 ,...,α n ) и
b = ( β1, β 2 ,..., β n ) означают два решения некоторой системы линейных однородных уравнений a
∑a x j =0
ij
j
=0
(i = 1,2,..., n ) .
(1.16)
Ранее было показано, что их сумма
a + b = (α1 + β1,α 2 + β 2 ,...,α n + β n ) и произведение любого из них (для определенности вещественное число
a)
на произвольное
C C a = ( C α1 , C α 2 , … , C α n )
также будут решениями системы (1.16). Нетрудно показать, что множество всех решений однородной системы (1.16) является линейным пространством, у которого нулевым элементом является элемент О (0, 0, . . . , 0), а противоположным для элемента (α1 ,α 2 ,...,α n ) является элемент (–α1 ,–α 2 ,...,– α n ). Это утверждение следует из выполнимости восьми условий IV пункта, в чем легко убедиться в результате элементарной проверки каждого из них. Пример 4. Множество совокупности Множество
Tn
n
Tn , элементами которого служат упорядоченные
произвольных вещественных чисел
a
= (α1 ,α 2 ,...,α n ).
можно рассматривать как совокупность всевозможных строк,
11 каждая из которых содержит
n
вещественных упорядоченных чисел. При этом
две строки а = ( a1, a2 ,..., an ) b = ( b1, b2 ,...,bn ) считаются различными, если нарушено хотя бы одно из равенств
a1 = b1, a2 = b2 , ..., α n = bn . Операции сложения элементов элемента
a и b множества Tn , умножения
a на вещественное число C
определим правилами
(a1, a2 , ..., an )+ (b1, b2 , ..., bn ) = (a1 +b1, a2 +b2 , ..., an +bn ); C(a1, a2 , ..., an ) = (Ca1, Ca2 , ..., Can ).
Если в качестве нулевого
элемента
возьмем
совокупность
n
нулей О = (0, 0, …, 0), а элементом, противоположным для элемента
(a1, a2,...,an ), будет элемент (−a1, −a2,...,−an ), то справедливость условий
IV пункта устанавливается элементарной проверкой каждого из них. Пример 5. Множество всех многочленов
Pn (x) от одной переменной x ,
степень которых меньше либо равна заданному числу сумма любых двух многочленов
Pn (x)и Qn (x )
из
L
n.
Легко видеть, что
есть также многочлен,
n , т. е. принадлежит L , а произведение произвольного числа C на любой многочлен Pn (x) из L есть тоже многочлен степени не выше n ,
степени не выше
и, следовательно, принадлежит многочленов степенях
x,
Pn (x)
и
Qn (x)
L.
Понимая, как обычно, под равенствами
равенство их коэффициентов при одинаковых
легко непосредственно проверить, что все аксиомы IV пункта
выполнены. Заметим, что под нулевым элементом понимается многочлен, у которого все коэффициенты равны нулю.
12 Пример 6. Множество всех непрерывных функций от одной переменной
t ∈ [a, b] ,
которое обозначают символом
непрерывных на
[
C [a, b] ,
так как для любых
[a, b] функций x(t ) и y(t ) их сумма x(t ) + y(t ) непрерывна
]
на a, b как сумма непрерывных функций и произведения числа α и функции
x(t ) также непрерывна, то C [a, b] является линейным пространством. § 4. Линейная зависимость При изучении векторной алгебры было введено понятие линейной комбинации
векторов.
Обобщим
это
понятие
на
случай
линейного
векторы
линейного
пространства. Пусть пространства
a1, a 2 , ..., a n
означают
произвольные
L.
Определение 1. Линейной комбинацией векторов называется
сумма
вещественные числа
произведений
этих
элементов
на
a1, a 2 , ..., a n , произвольные
C1, C2 ,..., Cn , т. е. вектор C1a1 + C2a 2 + ... + Cna n .
Числа
C1, C2 ,..., Cn ,
называются
(1.17)
коэффициентами
этой
линейной
комбинации. Определение
2.
Векторы
a1, a 2 , ..., a n
называются
линейно
C1* , C*2 ,..., C*n
не все равные нулю,
C1*a1, C*2a 2 ,...,C*na n = 0 .
(1.18)
зависимыми, если существуют
n
чисел
такие, что выполняется равенство
Если же равенство (2.18) возможно только в единственном случае, когда
C1* = C*2 = ... = C*n = 0 ,
13 то векторы a1, a 2 ,..., a n называются линейно независимыми. Рассмотрим примеры.
L,
Пример 1. Обратимся к линейному пространству
Pn (x)
которого являются многочлены
от одной переменной
которых меньше либо равна заданному числу Элементы пространства
элементами
x,
степень
n.
L 1, x, x 2 , ..., x n
(1.19)
образуют в этом пространстве линейно независимую систему. Линейная независимость системы (1.19) следует из того, что соотношение
C1 ⋅1+ C2 ⋅ x + C3 ⋅ x 2 + ...+ Cn +1x n = 0 x только в том случае, если C1 = C2 = C3 = ... = Cn +1 = 0 .
может быть выполнено для любого
Пример 2. В линейном пространстве, элементами которого являются →→→
свободные векторы на плоскости, любые три вектора зависимы, т. е. существуют такие числа
C1*, C2*, C3* ,
a, b, c
линейно
не равные нулю
одновременно, что выполняется соотношение → → → * * * C1 a + C2 b + C3 c = 0 .
Пример
3.
Функции
a1 = sin2 t, a2 = cos2 t, a3 =1
линейно
зависимы, так как соотношение
C1 sin2 t + C2 cos2 t + C3 ⋅1 = 0 выполняется тождественно, если положить Теорема. Если векторы
a1, a 2 , ..., a n
C1 =1, C2 =1, C3 = −1.
линейно зависимы, то один из них
может быть представлен в виде линейной комбинации остальных векторов. Доказательство. Действительно, если векторы
a1, a 2 , ..., a n
линейно
14 зависимы, т.е. выполняется определенности, что
соотношение (1.18), и при этом допустить для
Cn* ≠ 0 , то
Cn*an = −C1*a1 − C2*a2 − ... − Cn*−1an −1 или, поделив обе части последнего равенства на
Cn* получим
C1* C2* Cn*−1 an = − * a1 − * a2 − ...− * an . Cn Cn Cn Ясно,
что верно и обратное утверждение.
называется разложением вектора
Последнее равенство
an по векторам a1, a 2 , ..., a n −1 .
§ 5. Базис и координаты
n
Определение 1. Система линейного пространства всякий вектор
a
L
линейно независимых векторов
e1, e 2 , ..., e n
называется базисом этого пространства, если
из этого пространства можно представить в виде линейной
комбинации векторов e1, e 2 , ..., e n , т.е.
a = a1e1 + a2e2 + ... + anen ,
(1.20)
где a1, a2 , ..., an означают коэффициенты линейной комбинации. Теорема. Коэффициенты
a1, a2 , ..., an
в разложении (2.20) определяются
единственным образом. Доказательство. Действительно, допустим напротив, что для вектора существует два разложения по векторам e1, e 2 , ..., e n :
a = a1e1 + a2e2 + ... + anen ; a = a1′e1 + a2′ e2 + ... + an′ en . Вычитая почленно из первого равенства второе, будем иметь
a
15
0 = (a1 −a1′ )e1 + (a2 −a2′ )e2 + ...+ (an −an′ )en . Но так как векторы e1, e 2 , ..., e n линейно независимы, то последнее равенство возможно только в том случае, если
a1 = a1′, a2 = a2′ ,..., an = an′ откуда и следует единственность представления вектора комбинации
e1, e 2 , ..., e n .
векторов
определяемые числа
a1, a2 , ..., an ,
Эти,
,
a
в виде линейной
единственным
образом
называются координатами вектора
a
относительно базиса e1, e 2 , ..., e n , и при этом записываются
a = (a1, a2 , ..., an ), либо a = [a1 , a 2 ,..., a n ] , либо a = {a1, a2 , ..., an}, либо в виде столбца
a1 a2 # an
,
который называют координатным столбцом. Рассмотрим примеры. Пример 1. В множестве всех свободных векторов в пространстве тройка → → →
единичных взаимно ортогональных векторов
i , j, k
образует базис.
→
Координатами вектора
a
относительно этого базиса служат проекции вектора
→
a
на координатные оси. Пример 2. В линейном пространстве многочленов
которых меньше либо равна
n , одночлены 1, x, x 2 , ..., x n
образуют базис.
Pn (x),
степень
16 Координатами всякого многочлена
Pn (x) = a0 + a1x + ... +a n x n
в этом базисе являются его коэффициенты Во всяком фиксированном базисе задавать системами из
n
a0 , a1, a2 , ..., a n . e1, e 2 , ..., e n
все векторы можно
чисел – их координатами в выбранном базисе.
Нетрудно проверить, что если векторы заданы своими координатами, то их сложение, вычитание и умножение на число сводятся к соответствующим действиям над координатами. § 6. Размерность Определение 1. Линейно пространство
n
векторов,
пространства
называют
n -мерным,
L , в котором существует базис из а число n – размерностью
L.
Иногда, чтобы указать размерность пространства пишут
Ln .
Рассмотрим примеры. Пример 1. Множество всех свободных векторов на плоскости является двумерным линейным пространством, а множество всех свободных векторов в пространстве является трехмерным линейным пространством. Пример 2. Линейное пространство многочленов
P4 (x)
степень которых не
выше 4, является пятимерным. Определение
2.
Линейное
пространство
L
называется
бесконечномерным, если для каждого натурального числа существует
n линейно независимых векторов.
n
в
L
17 § 7. Подпространства Определение
1.
Подпространством
линейного
называется такое множество элементов из
L,
пространства
L
которое само является
линейным пространством с теми же операциями сложения и умножения на число. Рассмотрим примеры. Пример 1. В линейном пространстве свободных векторов на плоскости множество всех векторов, параллельных какой-либо прямой, является подпространством. Пример 2. В пространстве векторов, элементами которого являются одностолбцовые матрицы
x1 x2 # xn где
x1, x2 ,..., xn
,
– любые вещественные числа, множество векторов,
удовлетворяющих системе однородных линейных уравнений
⎧a11 x1 + a12 x2 +...+a1n xn =0, ⎪a x + a x +...+a x =0, ⎪ 21 1 22 2 2n n ⎨ ⎪" " " " " " ⎪⎩an1x1 + an2 x2 +...+a nn xn =0,
(1.21)
образует линейное подпространство. Это следует из того, что сумма решений системы (1.21) и произведения решения на любое вещественное число являются также ее решениями. Пример 3. Множество всех многочленов
P2 (x),
степень которых не
больше двух, является подпространством в пространстве всех многочленов
P4 (x), степень которых не более четырех.
18
L образует, очевидно, наименьшее из возможных подпространств пространства L . Пример 5. Само линейное пространство L является наибольшим из возможных подпространств пространства L . Пример 4. Нулевой вектор линейного пространства
Отметим два свойства подпространств: Свойство 1. Размерность любого подпространства в
n -мерном
линейном
L не превосходит числа n . Свойство 2. Если в m -мерном подпространстве n -мерного пространства L выбран базис e1, e 2 , ..., e m , то всегда можно дополнительно так выбрать пространстве
векторы e m +1, e m + 2 , ..., e m , что система векторов e1, e 2 , ..., e m , e m +1, ..., e n образует базис в
L.
19
Глава 2. Евклидовы пространства § 1. Введение Одна из важных черт изучения в средней школе разделов математики состоит в том, что она дает возможность вычислять длины, углы, площади, объемы и т. д. Для того чтобы распространить возможность таких измерений на абстрактные линейные пространства, обратимся к понятию скалярного произведения двух векторов
a и b , которое было введено в векторной алгебре.
В согласии с определением можем написать формулу
a ⋅ b = a ⋅ b ⋅ cos(a, b),
которая по известным длинам
a
и
b
векторов
a
и
b
(2.1)
и углу
(a, b)
между
ними позволяет найти их скалярное произведение. Было также показано, что если векторы
aиb
заданы своими координатами
ax , a y , az
и
bx , by , bz , то
скалярное произведение может быть вычислено по формуле
a ⋅ b = axbx + a y by + az bz . Заметим, что если известны координаты векторов
a
и
(2.2)
b , то, используя
формулу (2.2), мы сможем вычислить их скалярное произведение и квадрат длины (как скалярное произведение на самого себя.) Зная же скалярное произведение векторов и длины каждого из них, мы сможем с помощью формулы (2.1) найти угол между векторами. Используя
понятие
координат
вектора
абстрактного
линейного
пространства, повторим только что приведенное для векторов рассуждение, т. е. сначала укажем правило отыскания «скалярного произведения» векторов
b
aи
линейного пространства по их координатам (понятие «длины» вектора
линейного пространства определяется как корень квадратный из скалярного произведения вектора на самого себя), а затем с помощью формулы (2.1) получим определение «угла» между векторами. Такое формальное определение
20 понятия длины вектора и угла между векторами линейного пространства, т. е. выбор метрики, может показаться, на первый взгляд, бесполезным. Однако оно оказывается весьма плодотворным в самых различных разделах математики и ее приложениях. Ниже мы введем термин «евклидово пространство», под которым будем понимать линейное пространство, в котором определена операция «скалярное произведение» двух векторов, удовлетворяющая некоторым условиям. § 2. Определение евклидова пространства Определение 1. Вещественное линейное пространство
R
называют
евклидовым, если в нем определена операция, ставящая в соответствие любым двум векторам
a
и
b
произведением и обозначаемое
вещественное число, называемое скалярным
(a,b),
и
при этом выполнены следующие условия:
(a,b) = (b,a); 2) (a +b, c) = (a, c)+ (b, c), для любого вектора c ; 1)
3)
(αa, b) = α (a, b), для любого числа α ;
4)
(a, a) > 0 , если a ≠ 0 .
Рассмотрим примеры. Пример 1. В векторной алгебре для множества свободных векторов было определено скалярное произведение двух векторов, как произведение их длин на косинус угла между ними. Было доказано, что таким образом определенное скалярное произведение обладает всеми свойствами 1–4 определения евклидова пространства.
21 Пример 2. В линейном пространстве одностолбцовых матриц можно ввести скалярное произведение векторов
a1 a=
a2 #
b1 , b=
an по формуле
b2 # bn
(a, b) = a1b1 + a2b2 + ...+ anbn .
(2.3)
На это определение можно смотреть как на обобщение формулы, выражающей скалярное произведение векторов в векторной алгебре, заданных своими координатами. Нетрудно проверить непосредственно, что все 1–4 условия выполнены.
[ ]
[ ]
Пример 3. В линейном пространстве C a, b непрерывных функций на a, b можно ввести скалярное произведение функций
x(t ) и y(t ) по формуле
b (x, y) = ∫ x(t )y(t )dt . a Выполнение условий 1–4 легко проверить, применяя основные правила интегрирования.
Пространство
C [a, b] , с так введенным скалярным
[ ]
произведением обозначается через C 2 a, b .
22 § 3. Длина вектора Определение 1. Длиной (модулем) вектора
R
a
в евклидовом пространстве
называют корень квадратный из скалярного произведения вектора
самого себя и обозначают
a
на
a , так что
a=
(a, a)
(2.4)
Всякий вектор евклидова пространства имеет длину. У нулевого вектора длина равна нулю, у всякого другого – положительна. Вектор называют нормированным, если его длина равна единице. Легко видеть, что если любой ненулевой вектор
a
умножить на число
1 , a
то вектор
1 ⋅a a
имеет длину,
равную единице. Эту операцию получения нормированного вектора называют нормированием. Рассмотрим примеры. Пример 1. Для множества свободных векторов введенное определение длины вектора совпадает с обычным понятием длины вектора. Пример 2. В линейном пространстве одностолбцовых матриц выражение для длины вектора
a1 a=
a2 # an
имеет вид
a = a12 + a22 +...+ an2 .
23 § 4. Неравенство Коши-Буняковского Теорема. В евклидовом пространстве скалярное произведение произвольных векторов
a
и
b
не превышает произведения длин этих векторов, т. е. имеет
место неравенство
(a,b)≤ a ⋅ b .
(2.5)
Заметим, что неравенство называют неравенством Коши-Буняковского. Доказательство. Для доказательства неравенства (2.5) заметим, что в согласии с условием 4 определения евклидова пространства, можем написать
(αa−b, αa−b)≥ 0 ,
где
α
(2.6)
– любое вещественное число. Используя дважды условие 2, можем
написать левую часть неравенства (2.6) в виде
(αa−b, αa−b) = (αa, αa−b)− (b, αa−b) = = (αa, αa)− (αa, b)− (b, αa)+ (b, b).
Воспользовавшись теперь условием 3, получим
(αa−b, αa−b) = α 2 (a, a)−α (a, b)−α (b, a)+ (b, b).
Обратившись к условию 1, запишем неравенство (2.6) окончательно в виде
α 2 (a, a)− 2α (a, b)+ (b, b) ≥ 0 . В левой части последнего неравенства стоит квадратный трехчлен
относительно
α . Так как этот трехчлен неотрицателен при любом α , то его
дискриминант не может быть положительным, т. е.
(a, b)2 − (a, a)(b, b)≤ 0 . Записав последнее неравенство в виде
(a, b)2 ≤ (a, a)(b, b) и извлекая, квадратный корень из обеих частей неравенства, получим (2.5).
24 § 5. Неравенство треугольника Для
произвольных
векторов
a
и
b
евклидового
пространства
выполняется неравенство
a +b ≤ a + b ,
(2.7)
называемое неравенством треугольника. Для доказательства справедливости (2.7) заметим, что квадрат длины вектора
a
+
b
равен скалярному произведению вектора
a
+
b
на самого себя,
т. е.
a+b = (a+b, a+b). 2
(2.8)
Обращаясь последовательно к условию 2 в определении евклидова пространства два раза, а затем к условию 1, можем написать
(a+b, a+b) = (a, a+b)+ (b, a+b) = (a, a)+ (a, b)+ (b, a)+ (b, b) = 2 2 = (a, a)+ 2(a, b)+ (b, b) = a + 2(a, b)+ b . Используя неравенство Коши-Буняковского, получим
(a+b, a+b)≤ a 2 + 2a ⋅ b + b 2 = (a + b )2 .
(2.9)
Из сравнения (2.8) и (2.9) следует справедливость (2.7). Заметим, что если
b
a
и
означают векторы, изученные ранее в курсе геометрии, то неравенство (2.7)
означает, что длина стороны треугольника не больше суммы длин других его сторон.
25 § 6. Угол между векторами Вначале заметим, что на основании неравенства Коши-Буняковского можно утверждать, что величина
(a, b) меньше 1. a ⋅b
Поэтому можно ввести следующее определение. Определение 1. Углом между векторами такое число ϕ (от
Определение 2. Векторы
a
выполнено равенство
между
a
a
и
и
b
b
и
b (a≠0, b ≠0)
называют
0 до π ), для которого выполняется равенство
cosϕ =
Если
a
и
b
(a, b) a ⋅b
называются ортогональными, если
(a, b) = 0
– оба ненулевые, то это равен
(2.10)
π 2
(2.11)
определение означает, что угол
. Нулевой вектор, по определению, считается
ортогональным любому вектору. Рассмотрим примеры. Пример 1. В пространстве векторов, изученных ранее в курсе геометрии, → → →
скалярное произведение определено известным образом. попарно взаимно ортогональны.
Орты
i , j, k
26 Пример 2. В евклидовом пространстве одностолбцовых матриц, в котором скалярное произведение определено равенством (2.3), векторы
2 1
1 0 0 #
и
0
0 # 0
ортогональны. § 7. Ортонормированный базис Определение
1.
Базис
e1, e 2 , ..., e n
евклидова
пространства
R
называется ортогональным, если векторы базиса попарно ортогональны, т. е.
(ei ,e j ) = 0
при
i ≠ j.
Если при этом все векторы базиса единичные, т. е.
ei = 1,
(i =1, 2, 3, ..., n),
то базис называется ортонормированным. Теорема. Во всяком
n -мерном
евклидовом пространстве
R
имеются
ортонормированные базисы. Доказательство. Доказательство проведем для случая
n = 3.
Пусть
e1′ , e′2 , e′3 – произвольный базис пространства R . Докажем, что с его помощью можно построить ортонормированный базис. Положим e1 = e1′ , e 2 где
α
= e′2 + α1e1 ,
– некоторое вещественное число, которое мы подберем так, чтобы
векторы e1 и e 2 были ортогональны, то есть
(e′2 +α1e1, e1 ) = 0 .
27 Используя условия 2 и 3 определения евклидова пространства, получим
(e′2 , e1 )+ α1(e1, e1 ) = 0 , откуда получим (так как (e1, e1 ) ≠ 0 ) α1 = − Итак, если в качестве векторы
e1
и
e2
(e′2 , e1 ) . (e1, e1 )
(2.12)
α1 взять число, определяемое равенством (2.12), то
будут ортогональны, а так как векторы
независимы, то из формулы, определяющей вектор
e2 ,
e1′
и
e′2
линейно
следует, что он не
может стать нулевым. Вектор e3 определим с помощью равенства
e3 = e′3 + β1e1 + β 2e 2 , где вещественные числа
β1
и
β2
определим так, чтобы вектор
(2.13)
e3
был
ортогонален к векторам e1 и e 2 , т. е. чтобы выполнялись равенства
(e′3 + β1e1 + β2e2 , e1 ) = 0 ; (e′3 + β1e1 + β2e2 , e2 ) = 0 .
Используя, как и выше, условия 2 и 3 определения евклидова пространства, можем написать
откуда, учитывая
(e′3, e1)+ β1(e1, e1)+ β2 (e2 , e1) = 0 ; (e′3, e2 )+ β1(e1, e2 )+ β2 (e2 , e2 ) = 0 , ортогональность векторов e1 и e 2 (т. е. (e1, e 2 ) = 0 ),
получим выражение для
β1 и β 2
β1 = −
(e′3, e1) , (e1, e1 )
β2 = −
(e′3, e2 ) . (e2 , e2 )
(2.14)
28 Итак, если в качестве (2.14), то вектор
e 2 , e′3
e3
β1 и β 2
взять числа, определяемые равенствами
будет ортогонален векторам e1 и
линейно независимы, то вектор
e3
e 2 , так как векторы e1 , e3
не может быть нулевым (вектор
выражается с помощью (2.13) в виде линейной комбинации векторов e1 ,
e2 ,
e′3 ). Базис
e1 , e 2 , e3
– ортогональный. Но для того чтобы сделать его
ортонормированным, следует каждый из векторов e1 ,
e 2 , e3
поделить на его
длину. Векторы
e1 e1
;
e2 e2
;
e3 e3
образуют искомый ортонормированный базис. Для случая
n >3
этот процесс следует продолжать до тех пор, пока не
найдем последний вектор. Примененный здесь способ получения ортонормированного базиса из произвольного
базиса
носит
Естественно, что каждый вектор
название
a
в
процесса
n -мерном
ортогонализации.
евклидовом пространстве
R
можно представить в виде
a = a1e1 + a2e2 + ... + anen , где
e1, e 2 , ..., e n
– некоторый ортонормированный базис,
(2.15)
a1, a2 , ..., an
–
координаты вектора в этом базисе. Отметим, что для координат a1, a2 , ..., an имеют место равенства
ai = (a, ei ),
(i =1, 2, 3, ..., n),
которые получатся, если умножить обе части равенства (2.15) на e i .
29
Глава 3. Линейные операторы § 1. Определение линейного оператора В общем курсе математического анализа изучаются функции одного или нескольких вещественных переменных. Например, в случае функции трех вещественных переменных можно говорить о функции, аргументом которой является свободный вектор трехмерного пространства. Ниже мы будем изучать функции, аргументом которых будет вектор произвольного линейного пространства. Причем мы рассмотрим простейшие типы таких функций, а именно линейные функции. При этом линейные числовые функции векторного аргумента, т.е. функции, значения которых суть числа называют линейными формами (функционалами), а линейные векторные функции векторного аргумента, значения которых суть векторы называют линейными операторами (отображениями, преобразованиями). Пусть заданы два различных непустых множества которых будем обозначать буквами соответственно
x
и
X
и
X ′,
элементы
x′ .
Определение 1. Правило (закон), по которому любому элементу ставится в соответствие единственный элемент оператором, действующим из
X
в
x′ ∈ X ′
x∈ X
называется
X ′. D
Если оператор обозначить буквой элементу
x
A , то результат x′
его применения к
записывают в виде D
x′ = A x . D
Множество элемент
x′
X
называется областью определения оператора
при этом называется образом элемента
прообразом элемента
x′ . A.
а сам элемент
x
–
Совокупность всех образов называется областью
D
значений оператора
x,
A,
Если каждый элемент
x′ ∈ X ′ имеет только один
30 D
A
прообраз, то оператор
называется взаимно однозначным. Множество D
x ∈ X , удовлетворяющих равенству A x = 0 , называются ядром
элементов
D
оператора
A.
X
Будем в дальнейшем под
и
X ′ понимать линейное пространство L .
D
Определение 2. Оператор векторов
x
и
y
из
A
называется линейным, если для любых дух
L и произвольного числа α 1. 2.
D
D
D
D
выполняются условия:
D
A(x+y) = A x + A y (аддитивность); A(αx) = α A x (однородность). D
Покажем, что любой линейный оператор
A
можно задать, указав
некоторый набор чисел. Действительно, выберем в пространстве базис e1, e 2 ,..., e n и обозначим через
x
произвольный вектор из
L некоторый L , а через x′
его образ, то есть D
x′ = A x . Выпишем разложения векторов x и x′ по выбранному базису x = x1e1 + x2e2 + ... + xnen x′ = x1′e1 + x2′ e 2 + ... + xn′ e n , где x1, x2 ,..., xn и x1′, x2′ ,..., xn′ координаты векторов соответственно
x
и
x′ в
базисе e1, e 2 ,..., e n . Если подставить первое из последних равенств в правую D
часть предыдущего равенства и использовать линейность оператора получим D
D
D
x′ = x1 A e1 + x2 A e 2 + ... + xn A e n .
A,
то
31 D
D
D
A e1, A e 2 , ..., A e n
Векторы
принадлежат
L
пространству
и,
следовательно, в выбранном базисе можем написать
⎧D ⎪A e1 = a11e1 + a21e 2 +...+a n1e n , ⎪D ⎪A e 2 = a12e1 + a22e 2 +...+a n2 e n , ⎨ ⎪" " " " " " ⎪D ⎪⎩A e n = a1ne1 + a2ne 2 +...+a nn e n , где
a1k , a2k ,..., ank (k =1,2,3,...,n)
e1, e 2 ,..., e n .
D
– координаты вектора
A ek
в базисе
Подставив последние равенства в правую часть предыдущего
x′ в выбранном x1′e1 + x2′ e 2 + ... + xn′ e n = (a11 x1 + a12 x2 +...+ a1n xn )e1 +
равенства и, используя разложение вектора
+
базисе, получим
(a21x1 + a22 x2 +...+ a2n xn )e2 + (an1x1 + an2 x2 + ... + ann xn )en .
Используя единственность разложения вектора в данном базисе, приравняем коэффициенты при базисных векторах в левой и правой частях последнего равенства. При этом получим
⎧x1′ = a11x1 + a12 x2 +...+a1n xn , ⎪x′ = a x + a x +...+a x , ⎪ 2 21 1 22 2 2n n ⎨ ⎪" " " " " " " ⎪⎩xn′ = an1x1 + an2 x2 +...+a nn xn .
(3.1)
Непосредственно из формулы (3.1) видно, что правило перехода от вектора
x(x1, x2 ,..., xn )
M (x1, x2 ,...,xn ) ∗
к
вектору
к новой точке
x′(x1′, x2′ ,..., xn′ )
M1(x1′, x2′ ,...,xn′ ) ∗
или
от
точки
полностью определяется
Иногда апеллируя к привычным геометрическим представлениям, элементы линейного пространства называют не векторами, а точками; естественно, такое изменение названия не влечет никаких изменений в содержании изложенного.
32 квадратной матрицей
a11 a12 " a1n " a2n a a A = 21 22 " " " "
,
(3.2)
an1 an2 " ann составленной из коэффициентов формул (3.1).
Определение. Матрица D
A
A
называется матрицей линейного оператора
в базисе e1, e 2 ,..., e n , а сам этот оператор называют оператором с матрицей
A в базисе e1, e 2 ,..., e n . Если ввести в рассмотрение одностолбцовую матрицу
x1 X=
x2
(3.3)
# xn
и вычислить произведение матриц
a11x1 + a12 x2 +...+a1n xn A⋅X =
a21x1 + a22 x2 +...+a 2n xn " " " " " an1 x1 + an2 x2 +...+a nn xn
,
то получим одностолбцовую матрицу, элементами которой являются суммы, стоящие в правых частях равенств (3.1).
33 Если же ввести в рассмотрение матрицу
X′ =
x1′ x2′
(3.4)
# xn′
и воспользоваться понятием равенства матриц, то система (3.1) может быть записана в виде
A ⋅ X = X′ .
(3.5)
§ 2. Примеры линейных операторов Отметим
матричную
запись
указанных
выше
свойств
линейных
операторов линейного пространства: 1. Образ суммы векторов равен сумме образов складываемых векторов. Если
X1
и
X2
векторам, то
2. Если
– одностолбцовые матрицы, соответствующие складываемым
A ⋅ (X1 + X 2 ) = AX1 + AX 2 .
λ
– произвольное число, а
X
– одностолбцовая матрица,
соответствующая данному вектору, то
A(λX) = λ ⋅ AX . Наибольший интерес представляют такие операторы, при которых для каждого вектора (точки) существует единственный прообраз. Это значит, что уравнение (3.5) должно быть разрешено относительно
X
X′ . Ранее матрица A
при любом
было показано, что это возможно только в том случае, если
34 неособенная. В этом случае можем написать
X = A −1X′ . Если матрица
A
неособенная, то соответствующий линейный оператор
является невырожденным. Он преобразует (причем взаимно однозначно) пространство в себя самого, то есть каждая его точка является образом его некоторой
единственной
соответствующий
точки.
линейный
Если
оператор
матрица является
A
особенная,
вырожденным.
то При
вырожденном линейном операторе линейное пространство преобразуется в некоторую свою часть. Примеры линейных операторов Приведем
наиболее известные примеры
линейных операторов и
соответствующие им матрицы. 1. Поворот плоскости
Ox1x2
вокруг начала координат на угол →
часовой стрелки, так что произвольный вектор
ϕ
против →
OA переходит в вектор OA′ .
Для вывода формул преобразования координат сделаем чертеж (рис.1).
Рис. 1
35 Обозначим через →
x1, x2
и
x1′, x2′
соответственно координаты векторов
→
OA и OA′ . Непосредственно видно, что x1′ = OA′ ⋅ cos(ϕ +α ) = OA′ ⋅ cosα ⋅ cosϕ − OA′ ⋅ sinα ⋅ sinϕ ; x2′ = OA′ ⋅ sin(ϕ +α )= OA′ ⋅ cosα ⋅ sinϕ + OA′ ⋅ sinα ⋅ cosϕ .
Учитывая, что
OA′ = OA и x1 = OA⋅ cosα ; x2 = OA⋅ sinα ,
получаем формулы преобразования координат
x1′ = x1 ⋅ cosϕ − x2 ⋅ sinϕ ; x2′ = x1 ⋅ sinϕ + x2 ⋅ cosϕ , а тогда для матрицы оператора имеем
cosϕ −sinϕ A= sinϕ cosϕ 2. Растяжение вдоль оси
.
Ox1 в k1 раз, а вдоль оси Ox2 , в k2 раз. Формулы
преобразования координат в этом случае имеют вид:
⎧x1′ =k1 x1; ⎨ ⎩x2′ =k2 x2 , а матрица оператора
k1 0 A= 0 k2
.
36
Рис.2 3. Зеркальное отражение относительно оси
Ox2 .
В этом случае формулы
преобразования имеют вид
⎧x1′ =− x1; ⎨ ⎩x2′ = x2 , матрица оператора
−1 0 A= , 0 1 а на чертеже (рис.2) произвольной точке точка
M1(− x1, x2 ).
M (x1, x2 )
4. Поворот в обычном трехмерном пространстве оси
будет соответствовать
Ox1x2 x3 на угол ϕ
вокруг
Ox3 . Формулы преобразования координат имеют в этом случае следующий
вид
⎧x1′ = x1 cosϕ − x2 sin ϕ; ⎪x′ = x sin ϕ + x cosϕ; 2 ⎨ 2 1 ⎪x′ = x , ⎩ 3 3
37 а матрица оператора
cosϕ −sinϕ 0 A = sinϕ cosϕ 0 . 0 0 1 5. Тождественный оператор. Так называется оператор, при котором преобразование координат определяется формулами
x1′ = x1; x2′ = x2 ; " " xn′ = xn , и, следовательно, матрица оператора в любом базисе имеет вид
0 " 0 0 " 0 . E= " " " " " 0 0 0 " 1 1 0
6. Нулевой оператор.
Для
0 1
всех
имеем
x1′ = 0, x2′ =0, "" xn′ =0.
векторов
(x1, x2,..., xn ) из Rn
38 Матрица этого оператора обозначается
0
и состоит из одних нулей, так
что
0 " 0 0 " 0 . 0= " " " " " 0 0 0 " 0 0 0
0 0
§ 3. Действия над линейными операторами Над линейными операторами, определяемыми в линейном пространстве, можно производить различные действия, приводящие к новым линейным операторам. Рассмотрим здесь действия сложения операторов, умножения на число и умножения операторов друг на друга. 1. Сложения линейных операторов D
Пусть в пространстве
D
L заданы линейные операторы A и B . D
Определение. Суммой операторов
A
D
и
B
в пространстве
L
называется
D
такой оператор
C , для которого выполняется равенство D
D
D
Cx = A x + B x , где
x – любой вектор из L . Можно показать, что сумма линейных операторов является линейным
оператором, причем его матрица
C
D
равна сумме матриц
A и B операторов A
D
и
B , то есть C = A + B . 2. Умножение линейного оператора на число D
Определение. Произведением линейного оператора
A
на число
α
39 D
называется оператор α A , определяемый равенством D ⎛ D⎞ ⎜⎜α A ⎟⎟x =α A x , ⎠ ⎝
где
x – любой вектор из L . D
Можно показать, что оператор α A является линейным оператором, а его матрица равна произведению числа α на матрицу оператора
A, то есть αA.
3. Умножение линейных операторов D
x из L сначала оператор A , а затем
Применим к произвольному вектору D
оператор
B , получим вектор x′ D⎛ D
⎞ x′ = B⎜⎜ A x ⎟⎟ . ⎝ ⎠ D
Определение. Оператор
C , переводящий вектор x
непосредственно в
D
называется произведением оператора векторов
B
x′ ,
D
на оператор
A,
т.е. для всех
x из L имеет место равенство ⎞ Cx = B⎜⎜ A x ⎟⎟ , ⎝ ⎠ D⎛ D
D
D
при этом используется запись
D D
C= BA.
Можно показать, что произведение линейных операторов есть снова линейный оператор, а его матрица
C
равна произведению матриц этих
операторов, взятых в порядке, обратном действию операторов, то есть
C = BA.
40 4. Сопряженный оператор Определение.
A*
Оператор
называется
сопряженным
D
отношению к оператору пространства
A,
если для любых векторов
x
и
y
по из
L выполняется равенство
(
)
⎞ ⎛D ⎜⎜ A x,y ⎟⎟ = x,A*y . ⎠ ⎝ D
Можно показать, что если оператор единственный сопряженный оператор
A
линейный, то у него существует
A* . При этом, если матрица
a11 a12 a13 " a1m a21 a22 a23 " a2m A = a31 a32 a33 " a3m " " " " " an1 an2 an3 " anm D
является матрицей оператора
A , то матрицей оператора A* является матрица
a11 a12 A* = a13
a21 a22 a23
a31 " an1 a32 " an2 a33 " an3
.
" " " " " a1m a2m a3m " anm Такая матрица
A*
называется сопряженной по отношению к матрице D
A . При этом, если оператор A действует из L в L , то m= n .
41 Можно показать, что имеет место следующая теорема. Теорема (Альтернатива Фредгольма) Пусть пространства
A
– линейный оператор, который действует из евклидова
R на евклидово пространство R , а A* – оператор, сопряженный D
по отношению к оператору
A.
Тогда или уравнение D
Ax = y , где
x и y – произвольные вектора из R , имеет единственное решение, или
уравнение
A*x = 0 имеет, по крайней мере, одно ненулевое решение. D
Определение. Линейный оператор
A называется самосопряженным (или
Эрмитовым), если он совпадает со своим сопряженным, т.е. если для любого вектора
x из L выполняется равенство D
A x = A*x . Определение. Квадратная матрица A называется симметричной, если для ее элементов выполняется равенство
aij = a ji ,
(i, j =1,2,3,...,n). D
Можно показать, что матрица симметричная.
A
самосопряженного оператора
A
42
Глава 4. Преобразование координат § 1. Замена базиса Нетрудно заметить, что если в базиса
e1, e 2 ,..., e n
и
e1′ , e′2 ,..., e′n ,
n -мерном
пространстве имеется два
то координаты произвольного вектора в
одном базисе будут отличаться от координат того же вектора в другом базисе. Выясним, как связаны координаты произвольного вектора базиса
e1, e 2 ,..., e n
x
относительно
с координатами этого вектора относительно базиса
e1′ , e′2 ,..., e′n . Не уменьшая общности, рассмотрим трехмерный случай. Обозначив через x1, x2 , x3 и x1′, x2′ , x3′ координаты вектора
x
относительно базисов
e1, e 2 , e3 и e1′ , e′2 , e′3 соответственно, сможем написать
Для каждого из ортов
x = x1e1 + x2e 2 + x3e3 ;
(4.1)
x′ = x1′e1′ + x2′ e′2 + x3′ e′3 .
(4.2)
e1′ , e′2 , e′3
имеют место следующие разложения в
базисе e1, e 2 , e3
e1′ = τ11e1 +τ 21e2 +τ 31e3 ; e′2 = τ12e1 +τ 22e2 +τ 32e3 ; e′3 = τ13e1 +τ 23e2 +τ 33e3 , где τ ij
(i, j =1, 2, 3) – координаты вектора e′j в базисе e1,e2 ,e3 .
(4.3)
43 Подставляя (4.3) в (4.2), получим
x = (τ11x1′ +τ12 x2′ +τ13 x3′ )⋅ e1 + (τ 21x1′ +τ 22 x2′ +τ 23 x3′ )⋅ e2 +
+ (τ 31 x1′ +τ 32 x2′ +τ 33 x3′ )⋅ e3 (4.4)
Сравнивая теперь (4.1) с (4.4) и учитывая единственность разложения вектора
x
в базисе e1, e 2 , e3 , получим формулы, выражающие его координаты
относительно базиса e1, e 2 , e3 через координаты относительно базиса e1′ , e′2 , e′3
⎧x1 =τ11x1′ +τ12 x2′ +τ13 x3′ ; ⎪x =τ x′ +τ x′ +τ x′ ; ⎨ 2 21 1 22 2 23 3 ⎪x =τ x′ +τ x′ +τ x′ . ⎩ 3 31 1 32 2 33 3
(4.5)
Если ввести в рассмотрение одностолбцовые матрицы
x1′ X = x2 , X′ = x2′ x3′ x3 x1
и матрицу
τ11 τ12 τ13 T = τ 21 τ 22 τ 23 τ 31 τ 32 τ 33
,
то систему (4.5) можно заменить одним матричным равенством.
X = T⋅ X′ .
(4.6)
44
T называют матрицей поворота координатной системы. Итак, координаты вектора x относительно базиса e1, e 2 , e3 линейно выражаются с Матрицу
помощью формулы (4.5) через его координаты относительно базиса e1′ , e′2 , e′3 . Матрица системы (4.5) совпадает с матрицей, получающейся в результате транспонирования матрицы перехода от базиса
e1′ , e′2 , e′3
к базису
e1, e 2 , e3
[см. равенства (4.3)]. § 2. Ортогональные преобразования В евклидовом пространстве наибольший интерес представляет случай, когда каждый из базисов
e1, e 2 ,..., e n
и
e1′ , e′2 ,..., e′n
ортонормированный.
Ограничиваясь по-прежнему трехмерным случаем, будем считать базисы
e1, e 2 , e3
и
e1′ , e′2 , e′3
ортонормированными. Так как векторы
e1′ , e′2 , e′3
единичные и взаимно ортогональные, то имеют место 6 равенств
e1′ ⋅ e1′ = e′2 ⋅ e′2 = e′3 ⋅ e′3 = 1 , e1′ ⋅ e′2 = e1′ ⋅ e′3 = e′2 ⋅ e′3 = 0 . Подставляя (4.3) в (4.7) и учитывая, что векторы
e1, e 2 , e3
(4.7)
тоже
единичные и взаимно ортогональные, получим 2 +τ 2 = 1; τ τ +τ τ +τ τ = 0 ; τ112 +τ 21 31 11 12 21 22 31 32
2 +τ 2 = 1; τ τ +τ τ +τ τ = 0 ; τ122 +τ 22 32 11 13 21 23 31 33
(4.8)
2 +τ 2 = 1; τ τ +τ τ +τ τ = 0 . τ132 +τ 23 33 12 13 22 23 32 33
Определение. Всякая матрица соотношениям (4.8), называется
T,
элементы которой удовлетворяют
ортогональной, а соответствующее
45 преобразование – ортогональным преобразованием. Можно показать, что при ортогональном преобразовании сохраняются длины векторов и углы между ними. Докажем, что если матрица ортогональная, то обратная для нее
T−1 и транспонированная TT
T
совпадают,
т.е.
T−1 = TT .
(4.9)
Для доказательства вычислим произведение
TT ⋅ T
τ11 τ 21 τ 31 τ11 τ12 τ13 TT ⋅T = τ12 τ 22 τ 32 ⋅ τ 21 τ 22 τ 23 = E . τ13 τ 23 τ 33 τ 31 τ 32 τ 33 Умножая обе части матричного равенства
TT ⋅ T = E
(4.10)
справа на
T−1,
получим (4.9). Справедливо утверждение, обратное доказанному. Иногда условие (4.9) берут за определение ортогональной матрицы. Учитывая, что определитель произведения квадратных матриц равен произведению их определителей, можем, используя (4.10), написать
detTT ⋅ det T = det E . Но так как
detTT = detT ,
а
detE =1,
то предыдущее равенство можно
записать в виде
(det T)2 =1, откуда следует
detT = ±1.
46 Таким либо
+1,
образом,
либо
определитель
ортогональной
матрицы
равен
−1. § 3. Матрица оператора при замене базиса
Легко видеть, что один и тот же линейный оператор в разных базисах имеет различные матрицы. Выясним, как изменяется матрица линейного оператора при изменении базиса. Обозначим через линейного оператора в старом базисе, а через
B
оператора в новом базисе. Если обозначить через
A
матрицу некоторого
– матрицу того же самого
X
и
Y
– одностолбцовые
матрицы, элементами которых являются координаты векторов прообраза и образа в старом базисе, а через
X′
и
Y′
– одностолбцовые матрицы,
элементами которых являются координаты векторов – прообраза и образа в новом базисе, то сможем написать
Y = A⋅ X; Y′ = B ⋅ X′ . Обозначив через
T – матрицу
поворота координатной
(4.11) (4.12) системы,
будем иметь
X = T ⋅ X′ ; Y = T ⋅ Y′ .
(4.13) (4.14)
Подставив (4.11) и (4.13) в (4.14), получим
TY′ = A ⋅ T⋅ X′ , откуда следует
Y′ = T−1 ⋅ A ⋅ T ⋅ X′ . Сравнивая последнее равенство с (4.12) и используя определение равенства матриц, сможем написать выражение для матрицы рассматриваемого оператора в новом базисе
B = T−1 ⋅ A ⋅ T .
(4.15)
47
Глава 5. Несовместные системы линейных уравнений и метод наименьших квадратов § 1. Задача о проекции вектора и перпендикуляре к нему Введем в рассмотрение евклидово пространство вектор
y
этого пространства. Обозначим через
R
и произвольный
R′ некоторое подпространство
R . Требуется представить вектор y в виде суммы y = x+h, x
где вектор
(5.1)
принадлежит подпространству
этому подпространству. Вектор
R′ ,
x
R′ ,
h
а вектор
ортогонален к
h – перпендикуляром к (перпендикуляром к проекции вектора y на подпространство R′ ).
подпространство
а вектор
выберем в нем ортонормированный базис
x
на
вектору
x
R′ k -мерное
Примем для определенности, что подпространство
вектор
y
называется проекцией вектора
e1, e 2 ,..., e k .
и
Тогда некоторый
можно представить в виде
x = x1e1 + x2e 2 + ... + xk e k , где числа
x1, x2 ,..., xk
h = y−x
должен быть ортогональным к подпространству
(5.2)
подлежат определению. Согласно условию вектор
R′ ,
должен быть ортогонален к каждому из векторов базиса
то есть он
e1, e 2 ,..., e k .
Необходимым и достаточным условием этой ортогональности должно быть выполнение
k
равенств
(h,ei ) = (y −x,ei ) = 0 ,
(i =1,2,...,k ).
(5.3)
48 Подставив выражение для вектора
x
в (5.3), получим
k
равенств
(y −x,ei ) = (y − x1e1 − x2e2 −...− xk ek ,ei ) = (y,ei )− x1(e1,ei )− x2 (e2 ,ei )− ... − xi (ei ,ei )− ... − xk (ek ,ei ) = 0 , (i =1,2,...,k ). (5.4) Так как векторы
e1, e 2 ,..., e k
ортогональны и нормированы, то
равенства (5.4) могут быть записаны в виде
(y,ei )− xi = 0 , (i =1,2,...,k ),
откуда следует
k
выражений для искомых чисел xi .
xi = (y,ei )
.
(5.5)
Отсюда следует существование и единственность разложения (5.2). § 2. Несовместные системы линейных уравнений Рассмотрим несовместную систему линейных уравнений
⎧a11x1 + a12 x2 +...+a1m xm =b1; ⎪a x + a x +..+a x =b ; ⎪ 21 1 22 2 2m m 2 ⎨ ⎪" " " " " " " ⎪⎩an1 x1 + an2 x2 +...+a nm xm =bn ,
(5.6)
относительно неизвестных x1, x2 ,..., xm . Так как система (5.6) несовместна, то это значит, что не существует такого набора чисел c1, c2 ,..., cm , которые при подстановке в систему (5.6) вместо неизвестных каждое уравнение системы в тождество.
x1, x2 ,..., xm
обращали бы
49 Подставляя различные наборы чисел
x1, x2 ,..., xm
c1, c2 ,..., cm
вместо неизвестных
в левые части уравнений (5.6), мы будем получать наборы чисел
z1, z2 ,..., zm . Требуется найти такой набор чисел
c1, c2 ,..., cm ,
квадратное отклонение соответствующих чисел
чтобы среднее
z1, z2 ,..., zm
от данных
величин b1, b2 ,..., bn , т.е. значение выражения
δ2=
n ∑ j =1
(z j −b j )2
(5.7)
было наименьшим по сравнению с другими возможными значениями. Заметим, что требование отыскать наименьшее значение величины (5.7) означает требование найти такие значения коэффициентов абсолютные величины ошибок
z j −bj
x1, x2 ,..., xm ,
для которых
были в каком-то смысле малыми в
совокупности. Для решения поставленной задачи введем в рассмотрение
a1, a 2 ,..., a m , x1, x2 ,..., xm
m
векторов
компонентами которых являются столбцы коэффициентов при
соответственно, то есть
a1 = {a11, a21,..., an1}, a 2 = {a12 , a22 ,..., an2 },…, a m = {a1m , a2m ,..., anm },
b = {b1, b2 ,..., bn }.
Обозначим через
z
(5.8)
линейную комбинацию векторов (5.8), так что
z = α1a1 + α 2a 2 + ... + α ma m , где числа α1, α 2 ,..., α m принимают любые значения.
(5.9)
50 Совокупность подпространство
всех
линейных
L = L(a1, a 2 ,..., a m ).
комбинаций
(5.9)
образуют
С геометрической точки зрения ясно,
z −b b на подпространство L , а
что выражение (5.7) принимает наименьшее значение тогда, когда вектор совпадает с перпендикуляром к проекции вектора
z −b
это значит, что вектор
должен быть ортогонален каждому из векторов
a1, a 2 ,..., a m , т.е. должны выполняться m
равенств
(z −b, a1 ) = 0 ; (z −b, a2 ) = 0 ; (z −b, am ) = 0 . z
Заменив вектор
во всех
m
(5.10)
уравнениях (5.10) на соответствующие
выражения из (5.9) и произведя очевидные операции, получим систему
m
линейных неоднородных уравнений относительно неизвестных α1, α 2 ,..., α m .
Так
( (
) )
( (
) )
( (
) ( ) ) ( )
(
)
(
)
(
) (
⎧α a ,a + α a ,a + ... + α a ,a = b,a , 1 2 2 1 m m 1 ⎪ 1 1 1 ⎪ ⎪α1 a1,a 2 + α 2 a 2 ,a 2 + ... + α m a m ,a 2 = b,a 2 , ⎨ ⎪" " " " " " " " " " " " " " " ⎪ ⎪α a1,a m + α a 2 ,a m + ... + α a m ,a m = b,a m m 2 ⎩ 1
).
как
решение,
поставленная
задача
имеет
единственное
(5.11)
то
определитель системы (5.11)
D=
(a1,a1 ) (a 2 ,a1 ) (a1,a 2 ) (a 2 ,a 2 ) " (a1,a m )
" (a 2 ,a m )
" " " "
(a m ,a1 ) (a m ,a 2 ) " (a m ,a m )
(5.12)
отличен от нуля и, следовательно, по теореме Крамера получаем выражения
51
( j =1,2,...,m)
для коэффициентов α j ,
αj =
1 D
(a1,a1 ) (a 2 ,a1 ) (a1,a 2 ) (a 2 ,a 2 ) "
"
(a1,a m ) (a 2 ,a m )
" " " "
(a j −1,a1 ) (b,a1 ) (a j +1,a1 ) (a j −1,a2 ) (b,a2 ) (a j +1,a2 ) "
"
"
(a j −1,am ) (b,am ) (a j +1,am )
" "
(a m ,a1 ) (am ,a 2 )
"
"
(a m ,a m )
"
(5.13) Из изложенного следует, что полученный набор чисел
α1, α 2 ,..., α m
решает поставленную задачу. § 3. Метод наименьших квадратов На практике часто возникает такая задача: известно, что величина
b
линейно зависит от величин a1, a2 ,..., am так, что имеет место равенство
b = x1a1 + x2 a2 + ... + xm am , но коэффициенты x1, x2 ,..., xm неизвестны. Для их определения произведено
n > m)
с одинаковой точностью
(здесь
известны
соответствующие
числа
a1, a2 ,..., am ,
n замеров b1, b2 ,..., bn и
то есть известны числа
значит, что должны выполняться
n
величины
a j1, a j 2 ,..., a jm
b,
замеры
то есть величин
( j =1,2,...,n). Это
уравнений системы (5.6). Но вследствие
неизвестных ошибок при измерениях эта система будет, вообще говоря, несовместной.
x1, x2 ,..., xm
Возникает
задача
по
определению
коэффициентов
так, чтобы каждое уравнение удовлетворялось приблизительно,
но с общей наименьшей погрешностью. Если за меру погрешности принять
52 среднее квадратичное из отклонений величин
z j = a j1 x1 + a j 2 x2 + ... + a jm xm , ( j =1,2,...,n) от известных величин
b j , т.е. выражение (5.7), то придем к задаче, решенной в
§ 2. Пример В
«Основах химии» Д.И. Менделеева приводятся экспериментальные
данные о растворимости азотно-кислого натрия
NaNO3
в зависимости от
температуры воды. В 100 частях воды растворялось следующее число условных частей
NaNO3 при соответствующих температурах
Температура воды
4°
10°
15°
21°
29°
36°
71,0
76,3
80,6
85,7
92,9
99,4
Число условных частей
NaNO3 Из теоретических соображений следует, что количественная сторона этого процесса может быть описана уравнением
b = x1 ⋅ a + x2 , где
a
– температура в градусах,
частей воды, а вместо
x1
и
x2
b
(5.14)
– растворимость в условных частях на 100
– неизвестны. Если подставить в уравнение (5.14)
a и b соответствующие числа из данной таблицы, то получим систему
53 из шести уравнений
⎧71= 4⋅ x1 + x2 ⎪76,3=10⋅ x + x 1 2 ⎪ ⎪80,6=15⋅ x1 + x2 , ⎨ ⎪85,7 = 21⋅ x1 + x2 ⎪92,9= 29⋅ x1 + x2 ⎪ ⎩99,4=36⋅ x1 + x2 которая несовместна. В согласии с изложенным в п. 2 введем в рассмотрение 3 вектора
a1 = {4; 10; 15; 21; 29; 36}, a 2 = {1; 1; 1; 1; 1; 1},
b = {71; 76,3; 80,6; 85,7; 92,9; 99,4},
а затем вычислим 5 скалярных произведений
(a1,a1 ) = 2919 , (a1,a 2 ) = (a 2 ,a1 ) = 115 , (a 2 ,a2 ) = 6 , (b,a1 ) = 10328,2 ,
(b,a2 ) = 505,9 .
Система уравнений (5.11) в нашем случае примет вид
⎧2919 x1 +115x2 =10328,2 , ⎨ ⎩115x1 + 6 x2 =505,9 решив которую получим x1 = 0,88 ;
x2 = 67,38 , так что искомая зависимость
примет вид
b = 0,88a + 67,38 .
(5.15)
Если подставить в уравнение значения температуры воды из данной таблицы, то получим числа условных частей
NaNO3
70,9; 76,18; 80,58; 85,86; 92,9; 99,06 , что свидетельствует о неплохом совпадении с экспериментальными данными.
54
Глава 6. Собственные векторы и собственные числа § 1. Определение собственных векторов и собственных чисел D
Пусть в линейном пространстве Определение.
Подпространство
R задан линейный оператор A . R′ линейного пространства
R
D
называется инвариантным относительно оператора вектора
x
из подпространства
принадлежит
R′
A,
если для всякого D
следует, что вектор
Ax
так же
R′ .
Рассмотрим некоторые примеры. D
Пример 1. Для оператора подобия (линейный оператор каждый вектор
x
в
λx , где λ
A,
переводящий
– фиксированное число, называется оператором
подобия) каждое подпространство является инвариантным. Пример 2. Пусть
λ1, λ2 , λ3
e1, e 2 , e3
– базис в трехмерном пространстве
R3 ,
а
D
– фиксированные числа. Определим оператор
A
для векторов
базиса условиями D
D
A e1 = λ1e1 , а для любого другого вектора
A e 2 = λ2e 2 ,
D
A e3 = λ3e3 ,
x = x1e1 + x2e 2 + x3e3 условием
D
A x = λ1 x1e1 + λ2 x2e 2 + λ3 x3e3 . Этот оператор называется диагональным. Каждое подпространство, порожденное
некоторыми
из
базисных
векторов D
инвариантным для диагонального оператора
A.
e1, e 2 , e3 ,
является
55 Особую роль играют одномерные инвариантные подпространства D
оператора
A.
Определение. Всякий (ненулевой) вектор, принадлежащий одномерному D
A
называется собственным
x≠0
называется собственным
инвариантному подпространству оператора D
вектором оператора
A,
то есть вектор
D
вектором оператора
A,
D
если оператор
A
переводит вектор
x
в
коллинеарный ему вектор: D
A x = λx ,
λ
где число
называется собственным значением (собственным числом)
D
оператора
A , соответствующим собственному вектору x .
§ 2. Вычисление собственных векторов и собственных чисел в конечномерном пространстве
Пусть
e1, e 2 , ..., e n
D
– базис
n -мерного
пространства
Rn
и
A
–
некоторый линейных оператор. Допустим, что вектор
x=
n ∑ xk e k k =1
D
есть собственный вектор оператора
A , так что D
A x = λx , где
λ
(6.1)
– собственное значение, соответствующее собственному вектору
x.
Повторив рассуждения, проведенные при получении равенств (3.1), можем
56 записать последнее равенство в координатной форме
⎧a11 x1 + a12 x2 +...+a1n xn =λx1; ⎪a x + a x +..+a x =λx ; ⎪ 21 1 22 2 2n n 2 ⎨ ⎪" " " " " " " ⎪⎩an1 x1 + an2 x2 +...+a nn xn =λxn , где
x1, x2 , ..., xn
aij (i, j =1,2,...,n)
– координаты вектора
x
(6.2)
в выбранном базисе, а D
– элементы матрицы
A
линейного оператора
A
в базисе
e1, e 2 , ..., e n . Систему уравнений (6.2) можно записать в виде
⎧(a11 −λ )x1 + a12 x2 +...+a1n xn =0; ⎪a x + (a −λ )x +..+a x =0; ⎪ 21 1 22 2 2n n ⎨ ⎪" " " " " " " ⎪⎩an1 x1 + an2 x2 +...+ (a nn −λ )xn =0.
(6.3)
Так как искомый собственный вектор ненулевой, то среди его координат
x1, x2 , ..., xn
должна быть хоть одна отличная от нуля, а это значит, что
система (6.3) должна иметь ненулевое решение. Для того чтобы система линейных однородных уравнений (6.3) имела ненулевое решение, необходимо и достаточно, чтобы ее определитель был равен нулю
a11 −λ Δ(λ ) ≡
a21
" an1
a13 " a22 −λ " a23 = 0. " " " an 2 " ann −λ a12
(6.4)
57 Уравнение (6.4) называется характеристическим уравнением оператора D
A . Итак, если вещественное число λ
есть какое-нибудь собственное значение
D
оператора
A,
то оно является корнем характеристического уравнения (6.4) и
наоборот. Отсюда следует, что, найдя вещественное собственное число
λ
и
подставив его в систему (6.3), мы сможем найти координаты соответствующего собственного вектора. Если все
n
λ1, λ2 , ..., λn
корней
уравнения (6.4) вещественны и D
различны, то можно найти решая систему (6.3)
n
n
A, λ = λ1, λ = λ2 ,..., λ = λn .
различных собственных векторов оператора
раз последовательно при
Можно показать, что полученные собственные векторы
x1, x 2 , ..., x n
линейно
независимы. Примем их за новый базис. Тогда в этом базисе сами векторы
x1, x 2 , ..., x n
имеют соответственно координаты
(1,0,0,...,0), (0,1,0,...,0), (0,0,0...,1) и
n систем уравнений, получающихся из (6.2) для каждого случая, примут вид ⎧a11x1 =λ1x1, ⎪a x =0, ⎪ 21 1 ⎨ ⎪ " ⎪⎩an1x1 =0,
⎧a12 x2 =0, ⎪a x =λ x , ⎪ 22 2 2 2 ⎨ ⎪ " ⎪⎩an2 x2 =0,
⎧a1n xn =0, ⎪a x =0, ⎪ 1n n ⎨ ⎪ " ⎪⎩ann xn =λn xn ,
(6.5)
58 D
а тогда матрица оператора
A имеет вид
λ1
" 0 0 λ2 " 0 A = 0 0 λ3 " 0 " " " " " 0 0 0 " λn 0
0 0
.
(6.6)
Сформулируем полученный результат следующим образом: в
n -мерном
пространстве
матрица
всякого
характеристическое уравнение которого имеет
n
линейного
оператора
различных вещественных
корней, в базисе из его собственных векторов диагональна и ее диагональные элементы есть собственные значения оператора. § 3. Собственные векторы симметричных операторов D
A , действующий в евклидовом пространстве R , называется симметричным, если для любых векторов x и y пространства Определение. Оператор
R имеет место равенство ⎞ ⎛ D ⎞ ⎛D ⎜⎜ A x,y ⎟⎟ = ⎜⎜ x, A y ⎟⎟ . ⎠ ⎠ ⎝ ⎝ Важно отметить, что в
n -мерном
(6.7)
евклидовом пространстве матрица
A
симметричного оператора в любом ортогональном нормированном базисе совпадает со своей транспонированной матрицей, то есть
A есть симметричная D
матрица. Верно и обратное утверждение: каждый оператор
A,
имеющий в
некотором ортогональном и нормированном базисе симметричную матрицу,
59 является симметричным оператором. D
Теорема. Собственные векторы симметричного оператора
A,
отвечающие
различным собственным значениям, взаимно ортогональны. Доказательство. Пусть имеют место равенства D
A x1 = λ1x1,
(6.8)
D
A x 2 = λ2x 2 , где
λ1
и
λ2
(6.9) D
– собственные значения оператора
Умножим равенство (6.8) скалярно на
x2 ,
а (6.9) на
A, x1
причем
λ1 ≠ λ2 .
и вычтем второе из
первого. Тогда можем написать
⎞ ⎛ D ⎞ ⎛D ⎜⎜ A x1,x 2 ⎟⎟ − ⎜⎜ x1, A x 2 ⎟⎟ = (λ1 −λ2 )(x1,x 2 ). ⎠ ⎠ ⎝ ⎝
(6.10)
D
A симметричный, то левая часть равенства (6.10) равна нулю, а это значит, что при λ1 ≠ λ2 выполняется равенство (x1,x 2 ) = 0 , что и Так как оператор
требовалось доказать. Примем без доказательства следующие теоремы. D
Теорема. Симметричный оператор
A
в
n -мерном
евклидовом пространстве
R имеет n взаимно ортогональных собственных векторов. Теорема. Если матрица A симметрична, то соответствующее
ей
характеристическое уравнение (6.4) не имеет комплексных корней. Каждому вещественному корню
λ
уравнения (6.4) отвечает ровно столько линейно
независимых решений системы (6.3), какова кратность корня
λ.
60
Глава 7. Квадратичные формы и их приведение к каноническому виду § 1. Приведение квадратичной формы к каноническому виду Пусть в
e1, e 2 , ..., e n ,
n -мерном
линейно пространстве задан произвольный базис
так что произвольные вектора
координаты x1, x2 , ..., xn и y1,
и
y
и
y
имеют соответственно
y2 , ..., yn .
A(x,y ) от двух векторных аргументов
Определение. Числовая функция
x
x
R
в линейном пространстве
называется билинейной функцией или
билинейной формой, если она является линейной функцией от каждом фиксированном значении каждом фиксированном значении
y
и линейной функцией от
x y
при при
x.
Можно показать, что любая билинейная форма в
n -мерном
линейном
пространстве имеет вид
A(x,y ) =
где aik
n n ∑ ∑ aik xi yk , i =1 k =1
(i,k =1,2,...,n) – фиксированные числа.
Коэффициенты aik образуют матрицу
a11 A=
которую
называют
e1, e 2 , ..., e n .
a12 " a1n
a21 a22 " a2n
" an1
матрицей
" " " an2 " ann билинейной
,
формы
A(x,y )
в
базисе
61
Определение. Билинейная форма для любых векторов
x
и
A(x,y ) называется симметричной, если
y выполняется равенство A(x,y ) = A(y,x).
Если билинейная форма базисе
e1, e 2 , ..., e n
A(x,y )
пространства
симметрична, то ее матрица в любом
R
тоже симметрична. Справедливо и
обратное утверждение.
R x∈ R ,
Определение. Квадратичной формой в линейном пространстве называется функция
A(x,x)
от одного векторного аргумента
которая получается из билинейной формы
A(x,y ) заменой y
на
x.
Другими словами, выражение вида
Φ(x1, x2 ,..., xn ) = a11x12 + 2a12 x1x2 + 2a13 x1 x3 + ... + 2a1n x1xn + + a22 x22 + 2a23 x2 x3 + ... + 2a2n x2 xn + + a33 x32 + ... + 2a3n x3 xn + + " " " + + ann xn2 , (7.1) содержащее только квадраты координат
x1, x2 , ..., xn
произведения, называют квадратичной формой числа aij
n
и все их попарные
координат
x1, x2 , ..., xn ,
(i, j =1,2,...,n) – коэффициентами квадратичной формы (7.1).
а
62 В слагаемых, содержащих произведения координат с различными номерами, специально выделим множитель 2, ибо выражение
2akl xk xl , (k =1,2,...,n−1; l =2,3,...,n) всегда можно представить в виде
akl xk xl + alk xl xk , если положить по определению, что
akl = alk ,
а тогда квадратичная форма
(7.1) может быть представлена в виде
Φ(x1, x2 ,..., xn ) = a11 x12 + a12 x1 x2 + a13 x1x3 + ... + a1n x1 xn + + a21 x2 x1 + a22 x22 + a23 x2 x3 + ... + a2n x2 xn + + " " " " " " +
an1 xn x1 + an2 xn x2 + an3 xn x3 + ... + ann xn2 (7.2) Из коэффициентов квадратичной формы
Φ(x1, x2 , ..., xn ), записанной в
виде (7.2), составим симметричную матрицу
a11 a12 " a1n a a " a2n A = 21 22 " " " " an1 an2 " ann которую назовем матрицей квадратичной формы
e1, e 2 , ..., e n .
,
Φ(x1, x2 , ..., xn )
(7.3)
в базисе
63 Так,
Φ(x1, x2 )
двух
координат
Φ(x1, x2 ) = a11 x12 + a12 x1 x2 + a21 x2 x1 + a22 x22 ,
(7.4)
например,
квадратичная
форма
x1 и x2 может быть записана в виде
причем из ее координат можно составить симметричную матрицу
a11 a12 A= a21 a22
.
Легко видеть, что квадратичная форма (7.4) может быть записана в виде
Φ(x1, x2 ) = x1(a11x1 +a12 x2 )+ x2 (a21x1 +a22 x2 ).
(7.5)
Используя операцию произведения матриц, можем записать (7.5) в виде произведения однострочной матрицы на одностолбцовую
Φ(x1, x2 ) = x1 x2 ⋅
a11x1 +a12 x2 a21x1 +a22 x2
.
В свою очередь второй множитель можно представить в виде произведения квадратной матрицы на одностолбцовую так, что сможем написать
Φ(x1, x2 ) = x1 x2 ⋅
a11 a12
x1
⋅ a21 a22 x2
.
(7.6)
64 Если ввести в рассмотрение одностолбцовую матрицу
x1 X= x2
(7.7)
то равенство (7.6) можно записать в виде
Φ(x1, x2 ) = XT ⋅ A ⋅ X . Точно
также
показывается,
что
для
(7.8)
квадратичной
формы
n
координат имеет место формула
Φ(x1, x2 , ..., xn ) = XT ⋅ A ⋅ X , где
A
определяется равенством (7.3), а
X
(7.9)
означает одностолбцовую матрицу,
элементами которой являются координаты x1, x2 , ..., xn . Будем считать числа
x1, x2 , ..., xn
R,
координатами некоторого вектора
x
евклидова пространства
имеющего базис e1, e 2 , ..., e n в котором скалярное произведение векторов
x(x1, x2 , ..., xn ) и y(y1, y2 , ..., yn ) определено по формуле
(x,y) = x1 y1 + x2 y2 + ...+ xn yn , а симметричную матрицу Рассмотрим
λ1, λ2 , ..., λn
A – матрицей некоторого линейного оператора.
случай,
матрицы
A
когда
вещественные
собственные
числа
различны. В этом случае все собственные векторы
взаимно ортогональны и, следовательно, их можно принять за новый базис.
65 Обозначим через векторов матрицы одностолбцовую
x1′, x2′ , ..., xn′ ,
A.
e1′ , e′2 , ..., e′n
базис из единичных собственных
X′
Ранее было показано, что если через
матрицу,
вектора
x
элементами
которой
e1′ , e′2 , ..., e′n ,
в базисе
являются а через
T
обозначить координаты – матрицу
поворота, то имеет место формула
X = T ⋅ X′ . Перейдем в квадратичной форме
(7.10)
Φ от координат x1, x2 , ..., xn
к новым
координатам x1′, x2′ , ..., xn′ . Для этого подставим (7.10) в (7.9)
Φ = XT ⋅ A ⋅ X = (TX′)T A(TX′). Учитывая, что транспонирование произведения двух матриц равносильно произведению транспонированных матриц, взятых в обратном порядке. Запишем предыдущее, равенство в виде T Φ = (X′) TT ATX′ .
Обозначив
через
B1
матрицу
квадратичной
формы
в
базисе
e1′ , e′2 , ..., e′n , сможем написать
B1 = TT AT .
(7.11)
Ранее было показано, что если некоторый линейный оператор имеет в базисе
e1, e 2 , ..., e n
матрицу
A,
а в базисе
e1′ , e′2 , ..., e′n
матрицу
B2 ,
то
66 между ними существует связь
B2 = T−1AT.
(7.12)
Так как базис e1′ , e′2 , ..., e′n состоит из единичных собственных векторов рассматриваемого линейного преобразования, то матрица
B2
диагональная,
при этом элементами диагонали являются ее собственные числа λ1, λ2 , ..., λn . Сравнивая правые части равенств (7.11) и (7.12), и учитывая, что матрица ортогональная, то есть следовательно, матрица
TT = T−1 , B1
можем утверждать, что
тоже диагональная с элементами
это значит, что квадратичная форма
B1 = B 2
T и,
λ1, λ2 , ..., λn , а
Φ имеет вид
Φ = λ1 x1′2 + λ2 x2′2 + ... + λn xn′2 . Сформулируем последовательность действий, которые нужно произвести для приведения квадратичной формы к диагональному виду и получения формул перехода: 1. По квадратичной форме построить симметричную матрицу 2. Составить характеристическое уравнение корни (имеется
A.
det(A−λE) = 0 и найти его
n вещественных корней, которые будем считать различными).
3. Зная корни характеристического уравнения, написать квадратичную форму в диагональном (каноническом) виде. 4. Подставить собственное значение λ1 в систему
⎧(a11 −λ )x1 + a12 x2 +...+ a1n xn =0; ⎪a x +(a −λ )x +...+ a x =0; ⎪ 21 1 22 2 2n n ⎨ ⎪" " " " " " " ⎪⎩an1x1 + an2 x2 +...+(ann −λ )xn =0
67 и, пользуясь правилами решения однородных систем линейных уравнений, найти решение полученной системы (если корни различны, то оно будет определено с точностью до произвольного множителя) и написать разложение первого собственного вектора по старому базису. 5. Проделать указанные в п. 4 операции с остальными собственными числами
λ2 , ..., λn .
6. Пронормировать
каждый
из
собственных
векторов,
разделив
координатной
системы,
используя
на его длину. 7. Написать
матрицу
поворота
результаты вычислений п. 6. 8. Написать формулы перехода от старых координат к новым, используя матрицу поворота координатной системы, полученной в п. 7,
⎧x1 =e11x1′ +e12 x2′ +...+e1n xn′ ; ⎪x =e x′ +e x′ +...+e x′ ; ⎪ 2 21 1 22 2 2n n ⎨ ⎪" " " " " " ⎪⎩xn =en1x1′ +en2 x2′ +...+enn xn′ . Рассмотрим пример, иллюстрирующий вышеприведенный алгоритм. Пример 1. Привести квадратичную форму
Φ = 11x 2 − 20xy − 4 y 2
каноническому виду и найти соответствующее ортогональное преобразование. Решение. Выпишем вначале матрицу квадратичной формы
A=
11 −10 , −10 −4
а затем характеристическое уравнение
11−λ −10 =0. −10 −4−λ Раскрывая определитель, получим квадратное уравнение
λ2 − 7λ −144 = 0 ,
к
68 корни которого равны 16 и – 9. Примем для определенности, что
λ2 = −9 .
λ1 = 16 , а
Тогда данная квадратичная форма имеет следующий канонический
вид (в новых координатах
x′, y′ ):
Φ(x′; y′) = 16x′2 − 9 y′2 . Для определения собственных векторов имеем две системы уравнений
⎧−5x −10 y =0 ⎧20x −10 y =0, и ⎨ ⎨ 10 x 20 y 0 − − = ⎩ ⎩−10x +5 y =0. Обратите внимание на то, что в каждой системе одно из уравнений есть следствие другого. Для отыскания первого собственного вектора положим в первом уравнении первой системы
x =t ,
где
нуля. Тогда из уравнения найдем
t
– произвольное число, отличное от
1 y=− t. 2
Вектор
⎛ 1 ⎞ E1 = ⎜ t,− t ⎟ , ⎝ 2 ⎠
–
собственный, но не единичный. Чтобы получить единичный собственный вектор e1′ , следует разделить обе координаты вектора
2
⎛ 1 ⎞ 5 t 2 +⎜ − t ⎟ = t . 2 2 ⎝ ⎠ В результате получим
1 ⎞ ⎛ 2 e1′ ⎜ ;− ⎟ . 5⎠ ⎝ 5
E1
на его длину, т.е. на
69 Аналогично находим из второй системы второй единичный собственный вектор: сначала
E 2 (t,2t ), а затем
⎛ 1 2 ⎞ e′2 ⎜ ; ⎟. 5 5 ⎝ ⎠ Матрица поворота при этом примет вид
2 T= 5 1 − 5
1 5 2 5
,
а формулы преобразования координат можно записать в виде
⎧ 2 ′ 1 ′ ⎪⎪x = 5 x + 5 y , ⎨ ⎪ y =− 1 x′+ 2 y′. ⎪⎩ 5 5 Легко видеть, что
det T = +1. Это значит, что новая система координат
(как и старая) – правая. § 2. Приведение двух квадратичных форм к каноническому виду В некоторых вопросах математики и физики требуется решить следующую задачу: привести две квадратичные формы заданные в
n -мерном пространстве R
A(x,x)
и
B(x,x),
к каноническому (диагональному) виду
70 и указать соответствующий базис в пространстве
R.
Можно показать, что эта задача не всегда имеет решение. Если же допустить дополнительно, что одна из этих форм, например
B(x,x),
положительно определенная, то поставленная задача имеет решение. Для того чтобы в этом убедиться обозначим через
B(x,y ) симметричную
билинейную форму, соответствующую квадратичной форме пространстве
B(x,x)
R евклидову метрику, положив (x,y ) = B(x,y ).
Так как квадратичная форма
B(x,x)
и в
(7.13)
симметричная и положительно
определенная, то аксиомы скалярного произведения выполняются. Ранее было показано, что существует ортонормированный базис (относительно введенной нами метрики), в котором квадратичная форма принимает вид
A(x,x) = λ1 x12 + λ2 x22 + ... + λn xn2 ,
где x1, x2 , ..., xn – координаты вектора
x
(7.14)
в построенном базисе.
В этом же базисе вторая квадратичная форма
B(x,x) имеет вид
B(x,x) = x12 + x22 + ... + xn2 , а это значит, что базис, в котором обе квадратичные формы
A(x,x) и B(x,x)
имеют канонический вид, существует. Для того чтобы найти координаты векторов искомого базиса, рассмотрим вопрос о значениях, которые принимает квадратичная форма единичной сфере
(x,x) = 1
евклидова пространства
R
A(x,x)
на
и о нахождении
стационарных значений формы. Заметим, что дифференцируемая функция
f (x)
71 определенная в точках поверхности
стационарное значение, если в точке любому направлению на поверхности
x0
S
S
принимает в точке
производная функции
x0 ∈ S
f (x)
по
равна нулю. Можно показать, что
имеет место следующее утверждение:
A(x,x)
Квадратичная форма
принимает стационарные значения на тех
векторах единичной сферы, которые являются собственными векторами D
симметричного оператора
A , соответствующего форме A(x,x).
Задача об определении стационарных значений есть задача на условный экстремум. Для решения воспользуемся методом Лагранжа. Будем считать, что в исходном базисе квадратичные формы
A(x,x)
и
B(x,x)
имели следующие
выражения:
A(x,x) = B(x,x) =
n ∑ aik xi xk , i, k =1 n ∑ bik xi xk . i, k =1
В согласии с методом Лагранжа составим функцию
F (x1, x2 , ..., xn ) =
n ∑ aik xi xk i, k =1
−μ
n ∑ bik xi xk i, k =1
(7.15)
и приравняем нулю каждую ее частную производную по всем координатам
x1, x2 , ..., xn . Получим систему n
однородных уравнений
⎧(a11 − μb11 )x1 + (a12 − μb12 )x2 +...+ (a1n − μb1n )xn =0, ⎪(a − μb )x + (a − μb )x +...+ (a − μb )x = 0, ⎪ 21 21 1 22 22 2 2n 2n n ⎨ ⎪ " " " " " " " " " " ⎪⎩(an1 − μbn1 )x1 + (an2 − μbn2 )x2 +...+ (ann − μbnn )xn = 0,
(7.16)
72 которая имеет ненулевые решения тогда и только тогда, когда ее определитель равен нулю, то есть
a11 − μb11 a21 − μb21
a12 − μb12 " a1n − μb1n a22 − μb22 " a2n − μb2n
" an1 − μbn1
" " " an2 − μbn2 " ann − μbnn
Решив уравнение (7.17), мы найдем
n
корней
= 0.
(7.17)
μ1, μ 2 , ..., μ n , подставляя
их последовательно в систему (7.16) мы будем находить координаты соответствующего искомого базисного вектора. Доказано, что уравнение (7.17) имеет только вещественные корни, причем каждому кратному корню соответствует столько линейно независимых решений системы (7.16) какова его кратность. Находить эти линейно независимые решения следует используя правила решения однородных систем линейных уравнений. Показано также, что коэффициенты записи (7.14) квадратичной формы корнями определителя (7.17)
A(x,x)
λ1, λ2 , ..., λn
в канонической
совпадают с соответствующими
μ1, μ 2 , ..., μ n .
Рассмотрим пример. Пример 1. Привести квадратичные формы
A(x,x) = x12 + 2 x1 x2 + 3x22 + 2 x2 x3 − 2 x1 x3 + 6 x32 ,
B(x,x) = x12 + 2 x1 x2 + 2 x22 − 2 x1 x3 + 3x32
(7.18) (7.19)
к каноническому виду и получить формулы перехода от старых координат к новым.
73
В нашем случае функция
F (x1, x2 , x3 ) будет иметь вид
F (x1, x2 , x3 ) = x12 + 2 x1 x2 + 3x22 + 2 x2 x3 − 2 x1 x3 + 6 x32 −
(
− μ x12 + 2 x1 x2 + 2 x22 − 2 x1 x3 +3x32 Вычислим частные производные функции
F (x1, x2 , x3 ) по x1, x2 , x3
приравняем каждую из них нулю. Будем иметь
⎧2 x1 + 2 x2 − 2 x3 − μ (2 x1 + 2 x2 − 2 x3 )= 0, ⎪2 x + 6 x + 2 x − μ (2 x + 4 x )= 0, 2 3 1 2 ⎨ 1 ⎪− 2 x + 2 x +12 x − μ (− 2 x + 6 x )=0. 1 2 3 1 3 ⎩ Сократим каждое уравнение этой системы на 2 и запишем ее в виде
⎧(1− μ )x1 + (1− μ )x2 + (−1+ μ )x3 = 0, ⎪(1− μ )x + (3− 2μ )x + x = 0, 1 2 3 ⎨ ⎪(−1+ μ )x + x + (6−3μ )x = 0. 1 2 3 ⎩
(7.20)
Приравняем нулю определитель этой системы
1− μ 1− μ −1+ μ
1− μ 3− 2μ 1
−1+ μ 1 = 0. 6 −3μ
Последнее равенство можно записать в виде
1
(1− μ ) 1− μ −1+ μ или после вычисления определителя
1
−1
3− 2μ
1
1
6−3μ
(1− μ )(μ 2 −5μ +6)= 0 .
=0
(7.21)
). и
74 Отсюда находим три решения:
μ1 = 1, μ 2 = 2 , μ3 = 3 . Подставляя их в
систему уравнений (7.20), находим координаты искомых базисных векторов
(1, 0, 0), (−1, 1, 0), (2,−1, 1), а тогда формулы перехода от старых координат x1, x2 , x3 к новым
y1, y2 , y3
имеют вид
x1 = y1 − y2 + 2y3 , x2 = y2 − y3 , x3 = y3 .
(7.22)
Данные квадратичные формы имеют следующий канонический вид
A(y,y ) = y12 + 2 y22 + 3 y32 , B(y,y ) = y12 + y22 + y32 .
Полученный результат легко проверить, если в правых частях равенств (7.18) и (7.19) заменить x1, x2 , x3 соответствующими выражениям из (7.22).
§ 3. Малые колебания механических систем Из
курса
«Теоретическая
механической системы с
механика»
n степенями обобщенных координат q1, q2 , ..., qn .
известно,
что
положение
свободы задается с помощью
n
В случае голономных связей уравнения Лагранжа второго рода имеют вид:
d ∂T ∂T − = Qk , dt ∂qk ∂qk
(k =1,2,...,n),
(7.23)
75 где
Qk
– обобщенные силы, а
T
– кинетическая энергия системы, равная
половине суммы произведений масс точек системы на квадрат их скоростей, то есть выражается в виде некоторой квадратичной формы относительно обобщенных скоростей q1, q 2 , ..., q n
T=
n n i q j , ∑ ∑ aij q 1 j = i =1
(7.24)
коэффициенты которой зависят от координат q1, q2 , ..., qn . Для консервативных действующих сил элементарная работа равна уменьшению потенциальной энергии
Π,
которую также можно считать
выраженной через обобщенные координаты, при этом
Qk = − Пусть
точка
∂Π , ∂qk
q10 , q20 , ..., qn0
(k =1,2,...,n). означает
рассматриваемой системы. В состоянии равновесия
(7.25)
состояние
равновесия
q1 = q2 = ... = qn = 0 ,
а
тогда кинетическая энергия системы равна нулю и все ее частные производные по
qk
также равна нулю, ибо они представляют собой линейные формы от
q1, q2 , ..., qn .
Отсюда следует, что левые части уравнений Лагранжа
обращаются тождественно в нули и величины
q10 , q20 , ..., qn0
удовлетворяют
уравнениям
∂Π = 0, ∂qk
(k =1,2,...,n),
то есть положения равновесия системы возможны только в стационарных точках потенциальной энергии. Можно показать, что точка минимума потенциальной
энергии
отвечает
устойчивому
положению
равновесия.
Рассмотрим такую точку. Без ограничения общности можно считать, что в этой точке
q10 = q20 = ... = qn0 = 0
и само значение потенциальной энергии также
76 равно нулю. Если ограничиться изучением движения системы в малой окрестности нулевой точки, то коэффициенты квадратичной формы
T
можно
считать постоянными, равными своим значениям в нулевой точке. Если потенциальную энергию
Π
разложить в ряд Тейлора в окрестности точки
q10 = q20 = ... = qn0 = 0 по переменным q1, q2 , ..., qn
и отбросить члены выше
второго порядка, то получим квадратичную форму относительно координат
q1, q2 , ..., qn
с постоянными коэффициентами (линейные члены относительно
q1, q2 , ..., qn
будут отсутствовать, так как все частные производные от
q1, q2 , ..., qn
в положении равновесия равны нулю), то есть
Π=
q1, q2 , ..., qn
то
существует
в координаты
qi =
Π
и
линейное
T
являются положительно
преобразование
p1, p2 , ..., pn
n ∑ cij p j , j =1
qi =
приводящие квадратичные формы
по
n n ∑ ∑ bij qi q j . i =1 k =1
Так как обе квадратичные формы определенными,
Π
n j, ∑ cij p j =1
Π иT
к виду
n
T = ∑ p i2 , i =1
n
Π = ∑ωi2 pi2 . i =1
(i=1,2,...,n),
координат
77 В обобщенных координатах
p1, p2 , ..., pn
уравнения Лагранжа (7.23) с
использованием (7.25) примут вид
pi + ωi2 pi = 0 , (i =1,2,...,n), решения которых могут быть записаны в виде
pi = Ai cosωi (t −ti ), где константы
Ai
и ti определяются из начальных условий. Величины
ωi
называются собственными частотами системы. Следовательно, каждая из координат
pi совершает гармонические колебания с собственной частотой ωi .
78
Глава 8. Элементы теории метрических пространств § 1. Определение метрического пространства Потребности науки и техники потребовали изучения значительно более общего понятия пространства по сравнению с эвклидовым пространством. Ниже мы рассмотрим основные понятия теории метрических пространств, то есть множеств, состоящих из элементов произвольной природы, на которое накладывается только одно требование: должно быть определено понятие расстояния между его элементами, удовлетворяющее некоторым условиям. Определение. Метрическим пространством называется всякое множество элементов
X
произвольной
природы
неотрицательной, действительной функцией любых элементов
x
и
y
из
X,
вместе
ρ (x, y ),
с
однозначной,
определенной для
удовлетворяющих следующим трем
условиям: 1. 2.
ρ (x, y ) = 0 тогда и только тогда, когда x = y ; ρ (x, y ) = ρ (y, x ) аксиома симметрии;
3. для
любых
трех
элементов
x, y, z
выполняется
неравенство
ρ (x, y ) ≤ ρ (x, z )+ ρ (z, y ) аксиома треугольника. x
Определение. Элементы называют точками, функцию
и
y
метрического пространства
ρ (x, y ) – расстоянием между точками x и
y , а само метрическое пространство, т.е. пару X , ρ буквой
X
обозначают одной
R = (X , ρ ).
Рассмотрим примеры. Пример 1. Множество действительных чисел с расстоянием
ρ (x, y ) = x − y образует метрическое пространство
R′ .
79 Пример 2. Множество всевозможных наборов из
n
упорядоченных
(x1, x2 , ..., xn ), (y1, y2 , ..., yn ), принимаемых x = (x1, x2 , ..., xn ), y = (y1, y2 , ..., yn ) расстояния между
чисел
вида
за
точки
которыми
определяется равенством
ρ (x, y ) = называется
n ∑ i =1
( yi − xi )2
n -мерным арифметическим евклидовым пространством R n .
Пример 3. Множество, точками которого является всевозможные последовательности
x = (x1, x2 , ..., xn ,...)
вещественных чисел, удовлетворяющие условию ∞ 2 ∑ xi <∞ , i =1
а расстояние определяется равенством
ρ (x, y ) =
∞ ∑ i =1
( yi − xi )2 ,
является метрическим пространством, которое обозначают символом l2 . Пример 4. Множество всех непрерывных действительных функций определенных на промежутке элементов
[a, b] ,
причем расстояние для любых двух
x(t ) и y(t ) определено по формуле
ρ (x, y ) = max x(t )− y(t ) , т.е. в этом случае расстояние есть максимальное отклонение одной функции от
[ ]
другой. Это метрическое пространство обозначают символом C a, b .
80 Пример 5. Как и примере 4, рассмотрим множество всех функций непрерывных на
[a, b] , но расстояние определим иначе, а именно, положим ρ (x, y ) = ∫ [x(t )− y(t )]2 dt . b
a
Такое метрическое пространство называют пространством непрерывных функций с квадратичной метрикой и обозначают символом
C 2 [a, b ] .
Пример 6. Если для множества функций, рассмотренных в примерах 4 и 5, определять расстояние с помощью равенства
ρ (x, y ) = ∫ x(t )− y(t )dt , b
a
то получим метрическое пространство, которое обозначают символом
CL .
Из трех последних примеров следует, что метрические пространства, хотя и состоящие из одних и тех же элементов, но с различными определениями расстояний, следует считать различными. § 2. Сходимость. Полные метрические пространства Введем некоторые понятия теории метрических пространств, которые будут использованы в дальнейшем. Пусть
x0 означает некоторую точку метрического пространства R , а r
–
положительное число. Определение. Совокупность точек неравенству
x
пространства
R , удовлетворяющих
ρ (x, x0 ) ≤ r
[
]
называется замкнутым шаром и обозначается символом B x 0 , r . Точка x0 называется центром этого шара, а число
r
– радиусом шара.
81 Определение. Совокупность точек
x ∈ R , удовлетворяющих неравенству
ρ (x, x0 ) < r ,
B(x0 , r ).
называется открытым шаром и обозначается символом Открытый шар радиуса
ε
с центром в точке
окрестностью точки x0 и обозначают символом Определение. Точка
x∈ R
x0
называют
ε
–
Oε (x0 ).
называется точкой прикосновения множества
M ⊂ R , если любая ее окрестность содержит хотя бы одну точку из M . Совокупность всех точек прикосновения множества M называется замыканием этого множества и обозначается символом Определение. Точка
x∈ R
[M ].
называется предельной точкой множества
M ⊂ R , если любая ее окрестность содержит M. Определение. Точка x , принадлежащая M
бесконечно много точек из
называется изолированной
точкой этого множества, если в достаточно малой ее окрестности нет точек из Пусть пространстве
M , отличных от x . x1, x2 , ..., xn ,... – последовательность R.
Oε (x)
точек в метрическом
{xn } сходится к точке x , если lim ρ (x, xn ) = 0 . n →∞
Определение. Последовательность
Следующая теорема устанавливает связь между понятиями предела и точкой прикосновения множества. Теорема. Для того чтобы точка
x
была точкой прикосновения множества
необходимо и достаточно, чтобы существовала последовательность из
{xn} точек
M , сходящаяся к x . Пусть в метрическом пространстве
M,
R имеется два множества A и B .
82 Определение. Множество
[A] ⊃ B .
A
называется плотным в множестве
В частности, множество
пространстве
R ),
пространством
R.
если
его
A
B,
если
называется всюду плотным (в
замыкание
[A]
совпадает
со
всем
Например, множество рациональных чисел всюду плотно на числовой прямой. Пространства, в которых имеется счетные всюду плотные множества, называют сепарательными. Определение. Множество
M ⊂R
называется замкнутым, если оно
содержит все свои предельные точки или, что то же самое, если оно
[ ]
совпадает со своим замыканием: M = M . Определение. пространства
Последовательность
R
точек
метрического
называется фундаментальной, если для любого
существует такое число неравенство
{xn }
Nε , что для всех n > N ε
и
ρ (xn , xm ) < ε .
m > Nε
ε >0
выполняется
Нетрудно заметить, что всякая сходящаяся последовательность является фундаментальной. Однако обратное утверждение верно не во всяком метрическом пространстве. Определение.
Если
в
метрическом
пространстве
R
любая
фундаментальная последовательность сходится, то это пространство называется полным. Например, евклидовы пространства
C [a, b] являются полными.
R′ , R n ,
а также пространство
83 § 3. Принцип сжимающих отображений Вопрос о существовании и единственности решений алгебраических, трансцендентных, дифференциальных и других типов уравнений можно сформулировать в виде неподвижной
точки
вопроса о существовании и единственности
при
некотором
отображении
соответствующего
метрического пространства в себя. Одним из критериев существования и единственности неподвижной точки при такого рода отображениях является так называемый принцип сжимающих отображений. Отображение
A
метрического пространства
R
в себя называется
сжимающим отображением, если существует такое число любых двух точек
x
и
y
пространства
α < 1,
что для
R выполняется неравенство
ρ (Ax, Ay ) ≤ αρ (x, y ). Точка
x
A,
называется неподвижной точкой отображения
если
выполняется равенство
Ax = x . Можно показать, что имеет место следующее утверждение. Теорема
(Принцип
сжимающих
отображений).
Всякое
сжимающее
R,
имеет
использовать
для
отображение, определенное в полном метрическом пространстве одну и только одну неподвижную точку. Принцип
сжимающих
доказательства существования
отображений
можно
и единственности решений для уравнений
различных типов. Следует отметить, что принцип сжимающих отображений позволяет не только доказать существование и единственность решения, но и дает метод нахождения приближенного решения. Этот метод называют методом итераций или методом последовательных приближений.
84 Рассмотрим применение этого метода к отысканию приближенного решения уравнения
где функция
f (x) = x ,
(8.1)
f (x) определена на промежутке [a, b ] и удовлетворяет условию
Липшица
f (x2 )− f (x1 ) ≤ K x2 − x1 ,
с константой В
(8.2)
K < 1 и отображает промежуток [a, b ] в себя.
этом
случае
f
есть
сжимающее
отображение
и,
согласно
сформулированной выше теореме последовательность чисел
x0 , x1 = f (x0 ), x2 = f (x1 ), x3 = f (x2 ),…, xn = f (xn −1 )…
сходится к единственному корню уравнения (8.1). Если функция
f (x) имеет на промежутке [a, b ]
производную
f ′(x) и
при этом выполняется неравенство
f ′(x) ≤ K < 1, где
K
(8.3)
– некоторая постоянная, то легко видеть, что условие сжатости (8.2)
выполнено. Рассмотрим примеры. Пример 1. На промежутке
[0, 3]
найти действительный корень уравнения
− 0,03x 3 + 0,27 x 2 − 0,9 x + 0,66 = 0 .
85 Записав данное уравнение в виде (8.1), получим
f (x) = −0,03x3 + 0,27 x 2 + 0,1x + 0,66 = x .
Легко проверяется, что производная промежутке
f ′(x) = −0,09x 2 + 0,54x + 0,1
на
[0, 3] принимает только положительные значения и удовлетворяет
условию (8.2). Заметим, что вычисления целесообразно производить при помощи специальных
компьютерных
программ,
например
Используя метод итераций и положив в первом шаге x0
Mathcad
= 2 , получим
В результате получили приближенное значение корня значение корня данного уравнения
x = 1.
Professional.
1,001.
Точное
86
Пример 2. На промежутке
[0, 3] найти действительный корень уравнения
0,03x3 − 0,2x 2 −1,1x +1,27 = 0 . Как и в предыдущем примере запишем данное уравнение в виде
f (x) = 0,03x3 − 0,2x 2 − 0,1x +1,27 = x .
В этом примере производная
[0, 3]
f ′(x) = 0,09 x 2 − 0,4 x − 0,1 на промежутке
принимает только отрицательные значения, но условие (8.2) по
прежнему выполняется. Используя метод итераций и положив вначале
x0 = 2
будем производить вычисления с помощью Mathcad Professional.
Таким образом корнем исходного уравнения является
x = 1.
Геометрически метод итераций можно пояснить следующим образом.
y=x
y = f (x).
Построим на плоскости
Oxy
вещественный корень
уравнения (8.1) является абсциссой точки пересечения
кривой
x
графики функций
y = f (x) с прямой y = x (рис.3).
и
Каждый
87
Рис.3 Отправляясь от некоторой точки линию
A0 B1 A1B2 A2 B3...
параллельны оси кривой
Ox
y = f (x),
абсциссы точек
A1
и оси
A(x0 , f (x0 )),
(«Лестница»),
Oy ,
звенья
так что вершины
а вершины
B1, B2 , B3 , B4 ...
и
и
B1, A2
B2 , A3
и
построим ломаную
которой
A0 , A1, A2 A3...
на прямой
B3
попеременно лежат на
y = x.
Общие
… представляют собой
последовательные приближения x1, x2 , x3 , x4 ... к корню
x.
Рис.4 Возможен также (рис.4) другой вид ломаной
A0 B1 A1B2 A2 , B3 A3...
(«Спираль»). Легко заметить, что решение в виде «лестницы» получается, если
производная
f ′(x)
88 положительна, а решение
в виде спирали, если
f ′(x)
отрицательна. Если
f ′(x) > 1, то процесс итерации может быть расходящимся (рис.5).
Рис. 5 Пусть теперь требуется решить уравнение определенности, что
F (x ) = 0 , причем примем для
F (a ) < 0 , F (b) > 0 и на [a, b ] выполнено неравенство 0 < K1 ≤ F ′(x ) ≤ K 2 ,
где
K1 и K 2 – некоторые постоянные. Введем в рассмотрение функцию f (x ) = x − λF (x),
где
(8.4)
λ
– некоторая постоянная и заметим, что решение уравнения
равносильно решению уравнения Так как
F (x) = 0 .
x = f (x )
f ′(x ) = 1− λF ′(x ), то, используя (8.4) будем иметь 1− λK 2 ≤ f ′(x) ≤ 1− λK1 .
Выберем теперь число
λ
так, чтобы выполнялось неравенство (8.3), т.е.
потребуем выполнения двух равенств
1 − λK 2 = − K , 1− λK1 = K
(8.5)
89 Решая систему (8.5) двух уравнений относительно
K= и заметим, что условие
λ
и
K , получим
2 K 2 − K1 ,λ= K1 + K 2 K1 + K 2
(8.6)
K < 1 выполнено.
Пример. Требуется найти приближенное значение корня уравнения
F (x ) ≡ e0,8 x + 2 x − 3 на промежутке
[0, 3] .
Легко проверяется, что
F ′(x ) = 0,8e 0,8 x + 2
F (0) < 0 ,
а
F (3) > 0 .
Выпишем производную
и заметим, что на промежутке
неравенство
[0, 3]
выполняется
2 < F ′(x ) < 12 ,
а тогда в соответствии с равенствами (8.6), получим
K=
5 1 ,λ= . 7 7
Введем в рассмотрение функцию
(
) (
)
1 1 f (x ) = x − e0,8 x + 2 x −3 = −e0,8 x +5x +3 7 7 и используя метод итераций положим сначала x0
= 2 , а затем, производя
90 вычисления с помощью Mathcad Professional, получим
То есть
x = 0,656
является приближенным значением корня исходного
уравнения и при этом для получения искомого решения потребовалось проделать 12 шагов.
91
Библиографический список 1. Вулих Б.З. Введение в функциональный анализ. ГИФМЛ, М, 1958. 2. Колмогоров
А.Н.,
Фомин
С.В.
Элементы
теории
функций
и
функционального анализа. Изд-во «Наука». Гл. ред. физ-мат. лит. М. – 1972. 3. Линник Ю.В. Метод наименьших квадратов и основы теории обработки наблюдений. Гос. Изд-во физ-мат. лит. М, 1962. 4. Треногин В.А. Функциональный анализ. Изд-во «Наука». Гл. ред. физмат. лит. М. – 1980. 5. Шилов Г.Е. Введение в теорию линейных пространств. Гос. Изд-во технтеор. лит. М, 1956.
92
Предметный указатель А альтернатива Фредгольма – 41 Б билинейная функция – 60 форма – 60 В вещественные линейные пространства –8 векторные линейные пространства – 8 Г длина вектора в евклидовом пространстве – 22 Д диагональный оператор – 54 Е, Ж евклидово пространство – 20
линейные комбинации векторов – 12 линейно зависимые вектора – 12 линейно независимые вектора – 13 линейные формы – 29 операторы – 29 М множество плотное – 82 замкнутое – 82 метрическое пространство – 78 матрица линейного оператора – 32 поворота – 44 билинейной формы – 60 Н нормирование – 22 неравенство Коши-Буняковского – 23 треугольника – 24
О ортогональные З замкнутый шар – 80 вектора – 25 базис – 26 матрица – 44 И инвариантность – 54 преобразование – 44 ортонормированный базис – 26 область определения К комплексные линейные пространства – оператора – 29 8 значений оператора – 29 конкретное линейное пространство – 9 образ элемента – 29 координатный столбец – 15 квадратичная форма – 61 П произведение векторов – 5 Л матриц – 5 линейные пространства – 7 многочленов – 5 вещественные – 8 оператора – 39 векторные – 8 процесс ортогонализации – 28 комплексные – 9 проекция вектора – 47 конкретные – 9 бесконечномерные – 16
93 плотное множество – 82 пространство – 82 Р размерность пространства – 16 С самосопряженный линейный оператор – 41 сепарательные пространства – 82 сжимающее отображение – 83 симметричная билинейная форма – 61 матрица – 41 оператор – 58 собственный вектор – 55 значение – 55 частота системы – 77 сопряженный по отношению к оператору – 40 к матрице – 41 сумма векторов – 5 матриц – 5 многочленов – 5 операторов – 38 Т точка прикосновение множества – 81 предельного множества – 81 изолированная – 81 У угол между векторами – 25 Ф фундаментальная последовательность – 82 Х, Ц, Ч характеристическое уравнение – 57
Ш, Щ, Э, Ю, Я шар замкнутый – 81 открытый – 81
94
ОГЛАВЛЕНИЕ Предисловие.....................................................................................................................................3 Введение ...........................................................................................................................................4 Глава 1. Линейные пространства ...............................................................................................5 § 1. Введение ...............................................................................................................................5 § 2. Определение линейного пространства .........................................................................7 § 3. Свойства линейного пространства ..................................................................................9 § 4. Линейная зависимость ......................................................................................................12 § 5. Базис и координаты ...........................................................................................................14 § 6. Размерность ........................................................................................................................16 § 7. Подпространства ................................................................................................................17 Глава 2. Евклидовы пространства ............................................................................................19 § 1. Введение .............................................................................................................................19 § 2. Определение евклидова пространства ........................................................................20 § 3. Длина вектора .....................................................................................................................22 § 4. Неравенство Коши-Буняковского ...................................................................................23 § 5. Неравенство треугольника ..............................................................................................24 § 6. Угол между векторами ......................................................................................................25 § 7. Ортонормированный базис .............................................................................................26 Глава 3. Линейные операторы ..................................................................................................29 § 1. Определение линейного оператора .............................................................................29 § 2. Примеры линейных операторов ....................................................................................33 § 3. Действия над линейными операторами ......................................................................38 Глава 4. Преобразование координат .......................................................................................42 § 1. Замена базиса ...................................................................................................................42 § 2. Ортогональные преобразования ..................................................................................44 § 3. Матрица оператора при замене базиса ......................................................................46 Глава 5. Несовместные системы линейных уравнений и метод наименьших квадратов.........................................................................................................................................47 § 1. Задача о проекции вектора и перпендикуляре к нему ............................................47 § 2. Несовместные системы линейных уравнений ............................................................48 § 3. Метод наименьших квадратов ........................................................................................51 Глава 6. Собственные векторы и собственные числа .........................................................54 § 1. Определение собственных векторов и собственных чисел ..................................54 § 2. Вычисление собственных векторов и собственных чисел в конечномерном
95 пространстве ...............................................................................................................................55 § 3. Собственные векторы симметричных операторов ....................................................58 Глава 7. Квадратичные формы и их приведение к каноническому виду ........................60 § 1. Приведение квадратичной формы к каноническому виду .....................................60 § 2. Приведение двух квадратичных форм к каноническому виду................................69 § 3. Малые колебания механических систем......................................................................74 Глава 8. Элементы теории метрических пространств .........................................................78 § 1. Определение метрического пространства ..................................................................78 § 2. Сходимость. Полные метрические пространства ......................................................80 § 3. Принцип сжимающих отображений ...............................................................................83 Библиографический список ........................................................................................................91 Предметный указатель ................................................................................................................92
96
Ольга Владимировна Афанасьева Александр Алексеевич Потапенко
Функциональный анализ в задачах управления Учебное пособие Редактор И.Н. Садчикова Сводный темплан 2005 г. Лицензия ЛР № 020308 от 14.02.97 Санитарно-эпидемиологическое заключение № 78.01.07.953.П.005641.11.03. от 24.11.2003 г.
Подписано в печать Б.кн.-журн.
Формат 60×84 1/16 П.л. Тираж 100
Б.л.
РТП РИО СЗТУ
Заказ
Северо-Западный государственный заочный технический университет РИО СЗТУ, член Издательско-полиграфической ассоциации университетов России 191186, Санкт-Петербург, ул. Миллионная, 5