МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М. В. ЛОМОНОСОВА Механико-математический факультет
Курс лекций по математи...
1 downloads
171 Views
962KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М. В. ЛОМОНОСОВА Механико-математический факультет
Курс лекций по математическому анализу Лектор — Валериан Иванович Гаврилов
I курс, 2 семестр, поток механиков
Москва, 2006 г.
2
Оглавление 1.
2.
Неопределённый интеграл 1.1. Точная первообразная функция и неопределённый интеграл . . . . . . . 1.1.1. Предварительные обсуждения . . . . . . . . . . . . . . . . . . . . . 1.1.2. Точная первообразная функция на промежутке . . . . . . . . . . . 1.1.3. Дифференциальные формы на промежутке . . . . . . . . . . . . . 1.1.4. Неопределённый интеграл . . . . . . . . . . . . . . . . . . . . . . . 1.1.5. Линейные операции над неопределёнными интегралами . . . . . . 1.1.6. Таблица интегралов . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.7. Интегрирование по частям в неопределенном интеграле . . . . . . 1.1.8. Замена переменной интегрирования в неопределенном интеграле 1.2. Первообразная функция на промежутке . . . . . . . . . . . . . . . . . . . 1.2.1. Первообразная функция на промежутке . . . . . . . . . . . . . . . 1.2.2. Множество первообразных функций на промежутке . . . . . . . . 1.2.3. Неопределённый интеграл . . . . . . . . . . . . . . . . . . . . . . . 1.2.4. Линейное свойство . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.5. Интегрирование по частям . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
7 7 7 7 8 8 8 9 10 10 11 11 11 11 12 12
Определённый интеграл Римана 2.1. Определение и основные свойства интеграла Римана . . . . . . . . . . . . . 2.1.1. Размеченные разбиения отрезка . . . . . . . . . . . . . . . . . . . . . 2.1.2. База размеченных разбиений отрезка . . . . . . . . . . . . . . . . . . 2.1.3. Интегральные суммы . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.4. Определённый интеграл Римана . . . . . . . . . . . . . . . . . . . . . 2.1.5. Критерий Коши существования интеграла Римана . . . . . . . . . . 2.1.6. Необходимое условие существования определённого интеграла . . . 2.1.7. Контрпример . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.8. Свойство линейности определённого интеграла . . . . . . . . . . . . 2.2. Критерии интегрируемости функций . . . . . . . . . . . . . . . . . . . . . . 2.2.1. Нижние и верхние суммы Дарбу . . . . . . . . . . . . . . . . . . . . . 2.2.2. Свойство монотонности суммы Дарбу . . . . . . . . . . . . . . . . . 2.2.3. Свойство отделимости множеств суммы Дарбу . . . . . . . . . . . . 2.2.4. Нижний и верхний интегралы Дарбу . . . . . . . . . . . . . . . . . . 2.2.5. Теорема Дарбу . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.6. Критерий Дарбу существования интеграла Римана . . . . . . . . . . 2.2.7. Критерий интегрируемости в терминах колебаний f . . . . . . . . . 2.2.8. Третий критерий интегрируемости функции . . . . . . . . . . . . . . 2.3. Классы интегрируемых функций . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1. Интегрируемость непрерывных функций . . . . . . . . . . . . . . . . 2.3.2. Интегрируемость функций с конечным множеством точек разрыва 2.3.3. Применение теоремы пункта 3.2 . . . . . . . . . . . . . . . . . . . . . 2.3.4. Свойство монотонности определённого интеграла . . . . . . . . . . . 2.3.5. Интегрируемость произведения функций . . . . . . . . . . . . . . . . 2.3.6. Интегрируемость монотонной функции . . . . . . . . . . . . . . . . . 2.3.7. Свойство аддитивности определённого интеграла . . . . . . . . . . . 2.3.8. Оценка модуля определённого интеграла . . . . . . . . . . . . . . . . 2.3.9. Первая теорема о среднем значении для определённого интеграла . 2.4. Интеграл и производная . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1. Непрерывность интеграла с переменным верхним пределом . . . . . 2.4.2. Дифференцируемость интеграла по верхнему пределу . . . . . . . . 2.4.3. Основная формула интегрального исчисления . . . . . . . . . . . . . 2.4.4. Интегрирование по частям в определённом интеграле . . . . . . . . 2.4.5. Замена переменной интегрирования в определённом интеграле . . . 2.4.6. Формула Тейлора с остаточным членом в интегральной форме . . . 2.4.7. Вторая теорема о среднем значении . . . . . . . . . . . . . . . . . . . 2.4.8. Формула суммирования Эйлера–Маклорена (слабая версия) . . . . 2.5. Функции ограниченной вариации . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1. Определение и обозначение . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13 13 13 13 13 13 14 14 14 15 15 15 16 16 16 16 17 18 18 18 18 18 19 19 20 20 20 22 23 24 24 24 25 25 26 26 27 28 28 28
3
2.5.2. Лемма 1 . . . . . . . . . . . . . . . . . . . . . . 2.5.3. Лемма 2 . . . . . . . . . . . . . . . . . . . . . . 2.5.4. Лемма 3 . . . . . . . . . . . . . . . . . . . . . . 2.5.5. Леммы 4, 5 . . . . . . . . . . . . . . . . . . . . 2.5.6. Основная теорема . . . . . . . . . . . . . . . . 2.5.7. Примеры . . . . . . . . . . . . . . . . . . . . . 2.6. Приложения определённого интеграла . . . . . . . . 2.6.1. Площадь криволинейной трапеции . . . . . . 2.6.2. Плоские кривые . . . . . . . . . . . . . . . . . 2.6.3. Спрямляемые кривые . . . . . . . . . . . . . . 2.6.4. Критерий спрямляемости кривой . . . . . . . 2.6.5. Вычисление длины кривой . . . . . . . . . . . 2.6.6. Свойство аддитивности спрямляемых кривых 3.
4.
. . . . . . . . . . . . .
29 29 29 29 30 30 30 30 30 31 31 32 33
Обобщение интеграла Римана 3.1. Несобственные интегралы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1. Интегралы по промежутку [a, b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.2. Интегралы по промежуткам (a, b] и [a, b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.3. Критерий Коши сходимости несобственного интеграла . . . . . . . . . . . . . . . . . . . . . 3.1.4. Остаток несобственного интеграла . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Основные свойства несобственных интегралов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1. Свойства, аналогичные свойствам определённого интеграла . . . . . . . . . . . . . . . . . 3.2.2. Теорема о существовании и оценке модуля несобственного интеграла . . . . . . . . . . . . 3.3. Интегрирование по частям и подстановкой в несобственном интеграле . . . . . . . . . . . . . . . 3.3.1. Интегрирование по частям . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2. Интегрируемость заменой переменной интегрирования или подстановкой в несобственном интеграле . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4. Признак сходимости несобственного интеграла. Приложения . . . . . . . . . . . . . . . . . . . . . 3.4.1. Признак сходимости . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.2. Неполная формула Стирлинга . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5. Интеграл Стилтьеса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.1. Интегральные суммы Стилтьеса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.2. Определение интеграла Стилтьеса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.3. Свойство линейности интеграла Стилтьеса . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.4. Существование интеграла Стилтьеса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.5. Интегрируемость по частям в интеграле Стилтьеса . . . . . . . . . . . . . . . . . . . . . . 3.5.6. Вычисление интеграла Стилтьеса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33 33 33 34 36 36 37 37 37 39 39
Непрерывные отображения нескольких действительных переменных 4.1. Многомерное евклидово пространство . . . . . . . . . . . . . . . . . . . . . . 4.1.1. Векторное пространство в Rm . . . . . . . . . . . . . . . . . . . . . . . 4.1.2. Скалярное произведение . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.3. Неравенство Коши – Буняковского . . . . . . . . . . . . . . . . . . . . 4.1.4. Метрика в Rm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.5. Углы. Ортогональность . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Множества в метрическом пространстве . . . . . . . . . . . . . . . . . . . . . 4.2.1. Метрические пространства . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2. Шары, δ—окрестности . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.3. Общее понятие окрестности . . . . . . . . . . . . . . . . . . . . . . . . 4.2.4. Свойства окрестностей точек метрического пространства . . . . . . . 4.2.5. Открытые и замкнутые множества метрического пространства . . . 4.2.6. Критерий замкнутости множества . . . . . . . . . . . . . . . . . . . . 4.2.7. Кубические окрестности в пространстве Rm . . . . . . . . . . . . . . 4.2.8. Компакты в метрическом пространстве . . . . . . . . . . . . . . . . . 4.2.9. Ограниченные множества метрического пространства . . . . . . . . . 4.2.10. Компактность и замкнутость . . . . . . . . . . . . . . . . . . . . . . . 4.3. Предел и непрерывность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1. Сходящиеся последовательности в метрическом пространстве . . . . 4.3.2. Сходящиеся последовательности в Rm . . . . . . . . . . . . . . . . . .
46 46 46 46 47 48 49 49 49 49 50 50 50 51 52 52 52 53 53 53 54
4
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
40 40 40 41 41 41 42 42 43 43 44
5.
6.
4.3.3. Полные метрические пространства . . . . . . . . . . . . . . . . . . . . . . . . 4.3.4. Предел отображений метрических пространств . . . . . . . . . . . . . . . . . 4.3.5. Непрерывность функции нескольких переменных . . . . . . . . . . . . . . . 4.3.6. Предел отображения из Rm в Rn . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.7. Непрерывные отображения из Rm в Rn . . . . . . . . . . . . . . . . . . . . . 4.3.8. Непрерывные отображения открытых множеств метрических пространств 4.3.9. Непрерывность композиции . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.10. Равномерно непрерывные отображения из Rm в Rn . . . . . . . . . . . . . . 4.4. Глобальные свойства непрерывных отображений . . . . . . . . . . . . . . . . . . . . 4.4.1. Линейно связные множества в Rm . . . . . . . . . . . . . . . . . . . . . . . . 4.4.2. Непрерывный образ линейно связного множества в Rm . . . . . . . . . . . . 4.4.3. Непрерывные отображения компактов в Rn . . . . . . . . . . . . . . . . . . . 4.4.4. Непрерывные отображения линейно связных множеств . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
54 55 55 56 57 57 58 58 59 59 60 60 60
Дифференцируемые функции нескольких переменных 5.1. Частные производные . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1. Основные определения и обозначения . . . . . . . . . . . . . . . . . 5.1.2. Производная по направлению . . . . . . . . . . . . . . . . . . . . . . 5.2. Дифференцируемость функций нескольких переменных . . . . . . . . . . 5.2.1. Понятие дифференцируемости функции . . . . . . . . . . . . . . . . 5.2.2. Дифференцируемость и частные производные . . . . . . . . . . . . 5.2.3. Градиент . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.4. Достаточное условие дифференцируемости . . . . . . . . . . . . . . 5.2.5. Частные производные сложной функции . . . . . . . . . . . . . . . 5.2.6. Дифференциал функции нескольких переменных . . . . . . . . . . 5.2.7. Геометрический смысл дифференциала функции двух переменных 5.3. Частные производные и дифференциалы высших порядков . . . . . . . . . 5.3.1. Частные производные высших порядков . . . . . . . . . . . . . . . . 5.3.2. Достаточное условие равенства смешанных производных . . . . . . 5.3.3. Дифференциалы высших порядков . . . . . . . . . . . . . . . . . . . 5.4. Формула Тейлора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1. Вспомогательные леммы . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.2. Формула Тейлора с остаточным членом в форме Лагранжа . . . . 5.5. Локальные экстремумы функций нескольких переменных . . . . . . . . . 5.5.1. Необходимое условие экстремума . . . . . . . . . . . . . . . . . . . . 5.5.2. Достаточное условие локального экстремума . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
61 61 61 62 62 62 63 64 65 65 66 67 67 67 67 68 69 69 69 70 70 70
Дифференцируемые отображения конечномерных евклидовых пространств 6.1. Дифференцируемые отображения из Rm в Rn . . . . . . . . . . . . . . . . . . . . . 6.1.1. Предварительные определения и обозначения . . . . . . . . . . . . . . . . . 6.1.2. Матрица Якоби . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.3. Производная вектор–функции . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.4. Критерий дифференцируемости отображения . . . . . . . . . . . . . . . . . . 6.1.5. Композиция дифференцируемых отображений . . . . . . . . . . . . . . . . . 6.2. Неявные отображения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1. Предварительные замечания . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2. Существование и дифференцируемость неявной функции . . . . . . . . . . 6.2.3. Отображения, заданные неявно . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3. Отображения с ненулевыми якобианами . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1. Существование локальных диффеоморфизмов . . . . . . . . . . . . . . . . . 6.3.2. Принцип сохранения области . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.3. Зависимость функций . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4. Относительные (или условные) экстремумы . . . . . . . . . . . . . . . . . . . . . . . 6.4.1. Понятие относительных экстремумов . . . . . . . . . . . . . . . . . . . . . . 6.4.2. Общий случай . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.3. Метод множителей Лагранжа . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5. Дополнительные результаты . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5.1. Теорема Эйлера о дифференцируемости однородных функций . . . . . . . 6.5.2. Теорема о пределе частных производных . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
72 72 72 72 73 73 73 74 74 74 76 79 79 79 79 80 80 81 82 83 83 83
5
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . .
6.5.3. 6.5.4. 6.5.5.
Преобразование Лежандра . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Теорема С. Банаха о неподвижной точке . . . . . . . . . . . . . . . . . . . . . . . . . . . . Усиленная форма теоремы Банаха . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
84 84 85
Часть 3.
Интегральное
исчисление
1. Неопределённый интеграл 1.1. Точная первообразная функция и неопределённый интеграл 1.1.1. Предварительные обсуждения Основная задача дифференциального исчисления — по данной функции найти её производную. Основная задача интегрального исчисления обратная: по данной производной восстановить исходную функцию. Первая задача проще второй по следующим основаниям. Прежде всего, решение первой задачи, если оно существует — единственное; при этом, если функция f имеет производную f ′ , то область определения последней всегда содержится в области определения исходной функции; то есть, Df ′ ⊂ Df . Напротив, если для функции f существует функция F , производная которой совпадает с f (то есть, F ′ = f ), то Df ⊂ DF и вложение может 1 быть строгим, как показывает пример функции f (x) = √1−x с областью определения Df = (−1, 1), которая 2 в интервале (−1, 1) служит производной для F (x) = arcsin x, определённой на отрезке [−1, 1] = DF ; отметим также, что F (x) непрерывна в DF . Далее, если F ′ = f в Df , то (F + c)′ = F ′ = f для любой постоянной c, поскольку производная постоянной равна нулю. Таким образом, решение обратной задачи всегда неоднозначно (даже «бесконечнозначно»). Степень этой неоднозначности зависит от области определения исходной функции. Пусть, например, f (x) = x1 . Тогда Df распадается на две открытые полупрямые (−∞, 0) и (0, +∞). Производная функции F (x) = ln |x| совпадает с f на каждой из них. Действительно, если x > 0, то ln |x| = ln x, поэтому (ln |x|)′ = x1 ; если же x < 0, то ln |x| = ln(−x) и опять (ln |x|)′ = (−x)′ /(−x) = x1 . Так как каждая точка x ∈ Df содержится в одной из этих полупрямых вместе с некоторой своей окрестностью, а значение производной функции в точке зависит лишь от поведения функции в окрестности этой точки, то функция Φ(x), ( ln |x| + c1 при x < 0, Φ(x) = ln |x| + c2 при x > 0, где c1 и c2 — произвольные, не зависящие друг от друга постоянные, также имеет Φ′ (x) = f (x) = x1 для всех x ∈ Df = DΦ . Но если Df — промежуток, то неоднозначность функции F , у которой F ′ = f , исчерпывается произволом в выборе только одной постоянной c. 1.1.2. Точная первообразная функция на промежутке Определение 1. Функцию F , определенную на промежутке ha, bi, −∞ 6 a 6 b 6 +∞, называют точной первообразной функцией для функции f , если: 1◦ F — непрерывна на ha, bi, 2◦ F дифференцируема в (a, b), и 3◦ F ′ (x) = f (x), x ∈ (a, b).
Теорема 1.1. Всякие две точные первообразные функции для одной и той же функции, заданные на промежутке, отличаются друг от друга на постоянную. Пусть F1 и F2 — точные первообразные функции для функции f на ha, bi. Согласно определению 1, F1 , F2 непрерывны на ha, bi и F1′ (x) = F2′ (x) = f (x), x ∈ (a, b) Тогда ϕ = F2 − F1 непрерывна на ha, bi и ϕ′ (x) = (F2 (x) − F1 (x))′ = F2′ (x) − F1′ (x) = f (x) − f (x) = 0. Поэтому ϕ(x) = c, c ∈ R, x ∈ ha, bi, и F2 = F1 + c, x ∈ ha, bi.
Следствие 1.1. Если F — какая-либо точная первообразная функция для функции f на ha, bi, то совокупность всех точных первообразных для f совпадает с совокупностью функций F + c, где c = const (любая), т.е. совпадает с множеством {F + c | c ∈ R} (1)
Множество (1) часто обозначают F + C (точно говоря, это F + R, но такое обозначение не привилось) и C называют произвольной постоянной; однако, мы этим обозначением пользоваться не будем. Чтобы выделить определённую точную первообразную Φ функции f из всей их совокупности (1), где F — какая-то точная первообразная, нужно наложить на Φ некоторое дополнительное условие. Обычно это начальное условие; то есть, требование, чтобы Φ в какой-либо фиксированной точке x0 имела наперёд заданное значение y0 . Действительно, постоянная c однозначно определяется условием F (x0 ) + c = Φ(x0 ) = y0 .
7
1.1.3. Дифференциальные формы на промежутке Определение 2. Дифференциальной формой на промежутке I называют семейство однородных линейных функций на R, зависящих от параметра, пробегающего I. Таким образом, с каждой точкой x ∈ I ассоциирована однородная линейная функция на R, скажем, l(x). Всякая однородная линейная функция имеет вид kh, где h — аргумент, k ∈ R, k — число, не зависящее от h. Следовательно, l(x)(h) = k(x)h, h ∈ R, где k(x) — некоторая функция, определённая на I. Напомню, что дифференциалом df (x) функции f в точке x её дифференцируемости называется однородная линейная функция f ′ (x)h независимого переменного h, так что df (x)(h) = f ′ (x)h, h ∈ R. В частности, для функции f (x) = x имеем f ′ (x) = 1 при всех x ∈ R, и следовательно, dx(h) = h, h ∈ R. Поэтому l(x)(h) = k(x)h = k(x) dx(h), h ∈ R, или, для значков функций, l(x) = k(x) dx для всех x ∈ I. В частности, если F (x) — точная первообразная функции f (x) на промежутке ha, bi, то есть, F ′ (x) = f (x), x ∈ ha, bi, то dF (x) = f (x) dx, x ∈ ha, bi. 1.1.4. Неопределённый интеграл ′
Равенство F (x) = f (x) имеет место тогда и только тогда, когда dF (x) = f (x) dx. Поэтому точную первообразную функции f называют также точной первообразной дифференциальной формы f (x) dx. Определение 3. Пусть функция f имеет на ha, bi точную первообразную функцию F . Произвольную функцию {F + c | c ∈ R} из множества (1) назовём неопределенным интегралом функции f (x), а также дифференR циальной формы f (x) dx на ha, bi и обозначим символом f (x) dx. f — подинтегральная функция, f (x) dx подынтегральное выражение. Таким образом, согласно определению 3 и следствию 1.1 к теореме 1.1, Z f (x) dx = F (x) + c, x ∈ ha, bi , (2) где c — произвольная постоянная. Примеры R dx = arcsin x + c, x ∈ [−1, 1] 1. √1−x 2 R 2. Если k — Rчисло, то k dx = kx + c, x ∈ R 3. k = 1, то R 1 dx = x + c, x ∈ R 4. k = 0, то 0 dx = c. R Теорема 1.2. Если функция f имеет f (x) dx на ha, bi, то Z ′ Z f (x) dx = f (x), d f (x) dx = f (x) dx, Z
dF (x) = F (x) + c,
(3)
x ∈ (a, b)
(2′ )
x ∈ ha, bi .
Согласно (2), Z
′ f (x) dx = (F (x) + c)′ = F ′ (x) = f (x),
и
d
Z
f (x) dx =
Z
′ f (x) dx dx = f (x) dx.
Так как F — точная первообразная дифференциальной формы F ′ (x) dx, то, согласно (2), где c ∈ ha, bi.
R
dF (x) = F (x) + c,
1.1.5. Линейные операции над неопределёнными интегралами Предложение 1.3. Пусть k — число, k 6= 0. Функция f имеет точную первообразную на ha, bi, если и только если её имеет функция kf , причём тогда Z Z kf (x) dx = k f (x) dx (4) Функция F — точная первообразная функция f на ha, bi, если и только если kF — точная первообразная функция для kf на ha, bi (в силу свойств и линейности операции R линейности множества непрерывных функций R дифференцирования). Согласно (2), kf (x) dx = kF (x) + c = k(F (x) + kc ) = k f (x) dx, т.к. kc — такая же произвольная постоянная, как и c. R R R Замечание. Условие k 6= 0 — важное, т.к. 0f (x) dx = c, но 0 · f (x) dx = 0 (если ∃ f (x) dx). 8
Предложение 1.4. Если f и g имеют точные первообразные на ha, bi, то это же верно и для f +g, причём Z Z Z (f (x) + g(x)) dx = f (x) dx + g(x) dx, x ∈ ha, bi (5) Пусть F и G — точные первообразные функции для f и g на ha, bi соответственно. Тогда F и G непрерывны на ha, bi. F ′ (x) = f (x), G′ (x) = g(x), x ∈ (a, b). Поэтому F (x) + G(x) непрерывна на ha, bi и (F (x) + G(x))′ = f (x) + g(x), x ∈ (a, b), т.е. F + G — точная первообразная функция для f + g на ha, bi. Согласно (2), Z (6)
(f (x) + g(x)) dx = F (x) + G(x) + c, x ∈ ha, bi
R R С другой стороны, согласно (2), f (x) dx = F (x) + c1 и g(x) dx = G(x) + c2 , x ∈ ha, bi , c1 , c2 — произвольные постоянные. Следовательно, Z Z f (x) dx + g(x) dx = F (x) + G(x) + c1 + c2 , x ∈ ha, bi , (7) так как c1 + c2 — такая же произвольная постоянная, как и c (R + R = R). Таким образом, из (6) и (7) следует формула (5). 1.1.6. Таблица интегралов 1.
Z
2.
3.
Т.к. d
xα+1 α+1
4.
5.
6.
7.
Z
Z ax dx =
10.
xα+1 +c α+1
Z
dx = x
(
ln x + c1 ,
x > 0;
ln(−x) + c2 , x < 0.
ax + c, 0 < a 6= 1, x ∈ R, в силу равенства d ln a Z ex dx = ex + c, x ∈ R
cos x dx = sin x + c,
ax ln a
= ax dx.
x ∈ R, в силу равенства d(sin x) = cos x dx и формулы (2’).
sin x dx = − cos x + c,
x ∈ R, так как d(− cos x) = sin x dx.
Z
π π x ∈ − + kπ, + kπ , 2 2
8.
9.
xα dx =
0 dx = c, x ∈ R
= xα dx, то согласно (2′ ) справедливо 2.
Z
Z
k dx = kx + c,
Z
dx = tg x + ck , cos2 x Z
Z
dx = − ctg x + ck , sin2 x
x ∈ (kπ, (k + 1)π),
dx √ = arcsin x + c = − arccos x + c, 1 − x2 Z
dx = arctg x + c = − arcctg x + c, 1 + x2
9
k∈Z k∈Z
x ∈ [−1, 1]. x∈R
1.1.7. Интегрирование по частям в неопределенном интеграле Теорема 1.5. Если у функций u(x) и v(x) на промежутке ha, bi существуют производные u′ (x) и v ′ (x) (в концевых точках предполагается существование соответствующих односторонних производных), то из R R существования на ha, bi одного из неопределённых интегралов v(x)u′ (x) dx, u(x)v ′ (x) dx следует существование другого и равенство Z Z u(x)v ′ (x) dx = u(x)v(x) − v(x)u′ (x) dx (8) По условию, функции u, v дифференцируемы в (a, b) (и, следовательно, непрерывны в (a, b)) и имеют односторонние производные в концевых точках ha, bi, и, следовательно, u, v — непрерывны на ha, bi. Таким образом, на ha, bi и (u(x)v(x))R′ = u′ (x)v(x) + u(x)v ′ (x), x ∈ (a, b). Пусть, для определённости, существует Ruv — непрерывна R ′ ′ ′ v(x)u (x) dx на ha, bi, т.е. функция v(x)u (x) dx непрерывна на ha, bi и ( v(x)u (x) dx)′ = v(x)u′ (x), x ∈ (a, b). R ′ Тогда функция u(x)v(x) — v(x)u (x) dx непрерывна на ha, bi и дифференцируема в (a, b) и
u(x)v(x) −
x ∈ (a, b), и
Z
′ Z ′ v(x)u′ (x) dx = v ′ (x)u(x) + v(x)u′ (x) − v(x)u′ (x) dx) =
= v ′ (x)u(x) + v(x)u′ (x) − v(x)u′ (x) = u(x)v ′ (x),
Z
u(x)v ′ (x) dx = u(x)v(x) −
Z
v(x)u′ (x) dx + c, x ∈ ha, bi
Формула (10) ⇔ (8), так как произвольная постоянная c убирается в любом интеграле: Z Z u dv = uv − v du.
(9)
(10)
(8′ )
Пример. Z
Z 2 u = arctg x du = dx x2 x dx 1+x2 x arctg x dx = = arctg x − = 2 x v= 2 2 2 1 + x2 dv = x dx Z Z 2 Z x2 1 x +1−1 x2 1 dx x2 1 1 = arctg x − dx = arctg x − dx − = arctg x − x + arctg x + c. 2 2 2 2 1+x 2 2 1+x 2 2 2 1.1.8. Замена переменной интегрирования в неопределенном интеграле
Теорема 1.6. Пусть функция F (t) есть точная первообразная функция для функции f (t) на промежутке hα, βi, а функция ω(x) = t непрерывна Rна промежутке ha, bi, дифференцируема в интервале (a, b) и f (ha, bi) ⊂ ⊂ hα, βi. Тогда на промежутке ha, bi ∃ f (ω(x))ω ′ (x) dx и Z f (ω(x))ω ′ (x) dx = F (ω(x)) + c, x ∈ ha, bi . (1) Согласно определению 1, F непрерывна на hα, βi, дифференцируема в интервале (α, β) и F ′ (t) = f (t) для всех t ∈ (α, β). Из условий теоремы следует, что сложная функция F (ω(x)) непрерывна на ha, bi (как композиция непрерывных функций) и дифференцируема в интервале (a, b) (как композиция дифференцируемых функций), причём (F (ω(x)))′ = F ′ (t)·ω ′ (x) = f (t)ω ′ (x) = f (ω(x))ω ′ (x), x ∈ (a, b). Таким образом, функция F (ω(x)), согласно определению 1, есть точная первообразная для функции f (ω(x)) · ω ′ (x) на промежутке ha, bi. По теореме 1, R ′ ∃ f (ω(x))ω (x) dx на ha, bi, следовательно, в силу (2), пункт 1.1.4, справедливо (1).
Теорема 1.7. Пусть функция ω(x) = t непрерывна на промежутке ha, bi, дифференцируема в интервале (a, b) и ω ′ (x) > 0 для всех x ∈ (a, b). Обозначим α = inf ω(x), β = sup ω(x) (возможно, α = −∞ или x∈ha,bi
x∈ha,bi
β = +∞), так что ω(ha, bi) = hα, βi и на hα, βi определена функция Ω(t) = x, обратная к ω(x) = t. Если для функции f (t), определенной на hα, βi, функция f (ω(x))ω ′ (x) имеет на ha, bi точную первообразную функцию Φ(x), то функция F (t) = Φ(Ω(t)) будет точной первообразной функцией для функции f (t) и справедливо Z f (t) dt = F (t) + c = Φ(Ω(t)) + c, t ∈ hα, βi (2) 10
Из условий теоремы следует, что обратная функция Ω(t) непрерывна на hα, βi, дифференцируема в (α, β) и Ω′ (t) = ω′1(x) для всех t ∈ (α, β) (по теореме о существовании непрерывной и дифференцируемой обратной функции). Кроме того, согласно определению 1, функция Φ(x) непрерывна на ha, bi дифференцируема в (a, b) и Φ′ (x) = f (ω(x)) · ω ′ (x), x ∈ (a, b). Поэтому, функция F (t) = Φ(Ω(t)) непрерывна на hα, βi (как композиция непрерывных функций), дифференцируема в (α, β) (как композиция дифференцируемых функций), и F ′ (t) = Φ′ (x) · Ω′ (t) = f (ω(x))ω ′ (x) ·
1 = f (ω(x)) = f (t) ω ′ (x)
для всех t ∈ (α, β). Таким образом, функция F (t) = Φ(Ω(t)) есть точная первообразная функция для функции f (t) на hα, βi. R Согласно формуле (2), пункт 1.1.4, ∃ f (t) dt на hα, βi и справедливо (2) из условия теоремы. Одним из важных следствий результата следующей главы служит следующая Теорема 1.8. Всякая функция, непрерывная на отрезке, имеет на нём точную первообразную.
1.2. Первообразная функция на промежутке Функция f (x) = sgn x, x ∈ ha, bi , a < 0 < b не имеет точной первообразной F (x) на ha, bi, т.е. не существует на ha, bi функции F (x), F ′ (x) = sgn(x), x ∈ (a, b), т.к. sgn x имеет разрыв первого рода в x0 ∈ (a, b), а производная функция может иметь точки разрыва только второго рода. 1.2.1. Первообразная функция на промежутке Определение 4. Функцию F (x), определенную на промежутке ha, bi назовём первообразной функцией для функции f (x), определённой на ha, bi, если: 1)F (x) непрерывна на ha, bi, 2)F (x) дифференцируема всюду в интервале (a, b), за возможным исключением некоторого конечного множества K точек на (a, b) и 3)F ′ (x) = f (x) для всех x ∈ (a, b) r K.
Замечание. В соответствии с этим определением, точная первообразная функция есть первообразная функция с пустым исключительным множеством K (то есть, если K = ∅, то определение 1 → определение 1 из параграфа 1). Согласно определению 1, функция F (x) = |x| будет первообразной функцией для f (x) = sgn x на любом ha, bi , a < 0 < b, с исключительным множеством K = {0} (одноэлементное множество). Т.к. |x|′ = sgn x, x 6= 0 и |x| — непрерывная функция. Замечание. Функция F (x) = sgn x не является первообразной (в смысле определения 1) для f (x) = 0 на ha, bi , a < 0 < b, хотя F ′ (x) = 0, x 6= 0, но F (x) = sgn x не является непрерывной на ha, bi. 1.2.2. Множество первообразных функций на промежутке Теорема 1.9. Если функция f (x) определена на ha, bi и имеет на ha, bi первообразную F (x), то она имеет на ha, bi бесконечно много первообразных и их множество состоит из функций Φ(x) = F (x) + c, x ∈ ha, bi, c — произвольная постоянная. По условию и определению 1, функция F (x) непрерывна на ha, bi, существует F ′ (x) = f (x) для всех x ∈ (a, b) r K, где K — некоторое конечное множество точек из (a, b). Тогда для произвольного c ∈ R функция Φ(x) = F (x) + c непрерывна на ha, bi и Φ′ (x) = (F (x) + c)′ = F ′ (x) = f (x) для всех x ∈ (a, b) r K. Таким образом, функция Φ(x) = F (x)+c есть первообразная для f (x) на ha, bi с исключительным множеством K. Обратно, пусть функция Φ(x) есть первообразная для f (x) на ha, bi (в смысле определения 1) с некоторым исключительным множеством K1 ⊂ (a, b), то есть Φ(x) непрерывна на ha, bi и Φ′ (x) = f (x) для всех x ∈ (a, b) r K1 . Тогда функция g(x) = Φ(x) − F (x) непрерывна на ha, bi (как разность непрерывных функций) и g ′ (x) = (Φ(x) − F (x))′ = Φ′ (x) − F ′ (x) = f (x) − f (x) = 0 для всех x ∈ (a, b) r (K ∪ K1 ). Множество K ∪ K1 — конечное, и следовательно по теореме о стирании особенностей непрерывной функции (материал первого семестра), g(x) = c, x ∈ ha, bi. Итак, Φ(x) = F (x) + c, x ∈ (a, b) и K1 = K. 1.2.3. Неопределённый интеграл Определение 5. Неопределенным интегралом функции f , определённой на ha, bi и имеющей на ha, bi первообразную F (x) с исключительным множеством K, назовём произвольную функцию Φ(x) из множества {F (x) + c | c ∈ R} 11
(2)
R и обозначим f (x) dx = F (x) + c, x ∈ ha, bi , c ∈ R. R sgn x dx = |x| + c, x ∈ ha, bi На ha, 0], [0, bi функция F (x) = |x| есть точная первообразная для f (x) = sgn x. Теорема 1.10. Если функция f Rимеет первообразнуюR F на ha, bi с исключительным множеством K, то в любой x ∈ (a, b) r К справедливо ( f (x) dx)′ = f (x) и d f (x) dx = f (x) dx. Следствие формулы (2) и определения 5. 1.2.4. Линейное свойство Теорема 1.11. Если функции f, g имеют R на ha, bi неопределенные интегралы любых λ1 , λ2 ∈ R функция λ1 f + λ2 g имеет (λ1 f (x) + λ2 g(x)) dx и Z Z Z (λ1 f (x) + λ2 g(x)) dx = λ1 f (x) dx + λ2 g(x) dx.
R
f (x) dx,
R
g(x) dx, то для
(3)
4 и 5 и теоремам 9 и 10, в (a, b) существуют конечные множества K1 и K2 , что R Согласно определениям R R R ( f (x) dx)′ = f (x) и ( g(x) dx)′ = g(x) для всех x ∈ (a, b) r (K ∪ K ) и также f (x) dx, g(x) dx непрерывны 1 2 R R на ha, bi. Тогда функция F (x) = λ1 f (x) dx + λ2 g(x) dx непрерывна на ha, bi и F ′ (x) =
Z ′ Z ′ Z ′ Z λ1 f (x) dx+λ2 g(x) dx = λ1 f (x) dx +λ2 g(x) dx = λ1 f (x)+λ2 g(x), x ∈ (a, b)r(K1 ∪K2 ).
Так как множество K1 ∪ K2 — конечное, то, согласно определению 1, функция F (x) есть первообразная для λ1 f + λ2 g на ha, bi с исключительным множеством K = K1 ∪ K2 . По определению 5, существует интеграл Z Z Z (λ1 f (x) + λ2 g(x)) dx = F (x) + c = λ1 f (x) dx + λ2 g(x) dx + c, x ∈ ha, bi ⇔ (3), так как постоянную c можно убрать в любом из неопределённых интегралов правой части. 1.2.5. Интегрирование по частям Теорема 1.12. Пусть функции u(x), v(x) определены на ha, bi, дифференцируемы в (a, b) и Rимеют односторонние производные в его концевых точках (входящих в ha, bi). Если на ha, bi существует v(x)u′ (x) dx R ′ с некоторым исключительным множеством K ⊂ (a, b), то на ha, bi существует u(x)v (x) dx с тем же исключительным множеством K и справедлива формула Z Z u(x)v ′ (x) dx = u(x)v(x) − v(x)u′ (x) dx, x ∈ ha, bi . (4) Из условий следует, что функция u(x)v(x) непрерывна на ha, в (a, b) и (u(x)v(x))′ = R bi, дифференцируема ′ ′ u (x)v(x) + u(x)v (x), x ∈ (a, b), а также, что функция Φ(x) = v(x)u (x) dx непрерывна на ha, bi и Φ′ (x) = v(x)u′ (x) для всех x ∈ (a, b) r K. Поэтому, функция u(x)v(x) − Φ(x) непрерывна на ha, bi, дифференцируема в (a, b) r K. Значит, ′
(u(x)v(x) − Φ(x))′ = u′ (x)v(x) + u(x)v ′ (x) − Φ′ (x) = u(x)v ′ (x) + v(x)u′ (x) − v(x)u′ (x) = u(x)v ′ (x),
x ∈ (a, b) r K.
Таким образом, функция u(x)v(x) − Φ(x) есть первообразная для u(x)v ′ (x) на ha, bi с исключительным множеством K. Согласно определению 5, существует интеграл Z Z u(x)v ′ (x) dx = u(x)v(x) − Φ(x) + c = u(x)v(x) − v(x)u′ (x) dx + c, x ∈ ha, bi , что равносильно (4), т.к. постоянную c можно убрать в любом интеграле в правой части. Замечание. Из результатов последующей главы вытекает, что всякая функция, имеющая конечное множество точек разрыва на отрезке, обладает на нём первообразной.
12
2. Определённый интеграл Римана 2.1. Определение и основные свойства интеграла Римана 2.1.1. Размеченные разбиения отрезка Рассмотрим на R произвольный отрезок [a, b]. Разбиение T отрезка [a, b] — всякое множество x0 , x1 , . . . , xn точек xk ∈ [a, b], k = 0, n, удовлетворяющих условиям a = x0 < x1 < · · · < xn−1 < xn = b. Отрезок ∆k = [xk−1 , xk ], k = 1, n — отрезок разбиения T . Его длина |∆k | = ∆xk = xk − xk−1 , k = 1, n. Число d(T ) = max ∆xk 16k6n
— диаметр T , 0 < d(T ) 6 b − a. На каждом ∆k рассмотрим произвольную точку ζk ∈ ∆k , k = 1, n и рассмотрим {ζ1 , . . . , ζn } = ζ. Присоединяя множество ζ к разбиению T , получим размеченное разбиение Tζ , где T : a = x0 < x1 < · · · < xn−1 < xn = b — точки размеченного разбиения Tζ . По определению, d(Tζ ) = d(T ). Множество всех размеченных разбиений [a, b] обозначается P. 2.1.2. База размеченных разбиений отрезка На P рассмотрим систему B = {Bδ }, где Bδ = {Tζ ∈ P | d(Tζ ) < δ} , δ > 0. Покажем, что B образует базу. Чтобы проверить свойство 1) базы, рассмотрим произвольное δ > 0 и выберем n ∈ N, чтобы n > b−a δ . b−a Разделим [a, b] на n отрезков ∆k = [xk−1 , xk ], k = 1, n одинаковой длины n . Получим некоторое разбиение T, d(T ) = b−a < δ. Выбирая, например, ζk = xk−1 ∈ ∆k , k = 1, n, получим ζ = {ζ1 , . . . , ζn } и размеченное n разбиение Tζ , d(Tζ ) = d(T ) < δ, то есть Tζ ∈ Bδ . Чтобы проверить свойство 2) базы, заметим, что Bδ1 ⊂ Bδ2 , если 0 < δ1 6 δ2 , так как для произвольного Tζ ∈ Bδ1 , d(Tζ ) < δ1 6 δ2 , и, следовательно, Tζ ∈ Bδ2 . Теперь для произвольных Bδ1 и Bδ2 , Bδ ⊂ Bδ1 ∩ Bδ2 . Итак, положим δ = min(δ1 , δ2 ), δ > 0, и на основании предыдущего заключаем, что система B = {Bδ } образует базу на P, которую обозначим d(T ) → 0 . 2.1.3. Интегральные суммы Рассмотрим на [a, b] произвольную функцию f и произвольное размеченное разбиение Tζ : a = x0 < x1 < · · · < xn = b,
∆k = [xk−1 , xk ],
и ζ = {ζ1 , . . . , ζn } , ζk ∈ ∆k , k = 1, n. Число σ(f, Tζ ) : σ(f, Tζ ) =
n X
k = 1, n,
∆xk = |∆k | , k = 1, n
f (ζk )∆xk
(1)
k=1
называют интегральной суммой функции f , отвечающей размеченному разбиению Tζ отрезка [a, b]. Суммы (1) определяют на P отображение (функцию) Φf по правилу Φf : P → R; Φf (Tζ ) = σ(f, Tζ ), Tζ ∈ P.
(2)
2.1.4. Определённый интеграл Римана Определение 1. Число I ∈ R называют определённым интегралом функции f на отрезке [a, b], если для произвольного числа ε > 0 ∃ δ > 0 такое, что для любого размеченного разбиения Tζ отрезка [a, b], имеющего d(Tζ ) < δ, справедливо неравенство n X |σ(f, Tζ ) − I| = I − f (ζk )∆xk < ε. (3) k=1
для ∀ Tζ : d(Tζ ) < δ, то есть ∀ Tζ ∈ Bδ . Неравенство (3)⇔(3’).
|Φf (Tζ ) − I| = |σ(f, Tζ ) − I| < ε,
(3′ )
Определение 1′ . Число I ∈ R — определённый интеграл Римана функции f , определённой на [a, b], если I = lim Φf , где Φf определена условием (2). d(T )→0
Обозначение: I =
Rb
f (x) dx, где a, b — начальная и концевая точки интеграла.
a
Определение 1 ⇔ определению 1′ (1′ — лучше, так как из него следует единственность определённого интеграла, если он существует, поскольку интеграл — предел некоторой функции по некоторой базе). 13
Zb
f (x) dx = lim Φf = lim σ(f, Tζ ) = lim d(T )→0
d(T )→0
d(T )→0
a
n X
(4)
f (ζk )∆xk .
k=1
Определение 2. Множество всех функций f , имеющих определённый интеграл на [a, b], обозначается R[a, b], а сами функции называются интегрируемыми (по Риману) на [a, b]. Обозначение: f ∈ R[a, b].
Утверждение. R[a, b] 6= ∅ для ∀ [a, b]. Рассмотрим произвольный [a, b] и fc (x) = c, x ∈ [a, b], c ∈ R. Для любого Tζ , x0 , . . . , xn , ζ = (ζ1 , . . . , ζn ), n n Rb P P σ(fc ; Tζ ) = c∆xk = c ∆xk = c(b − a), и следовательно, существует lim σ(fc ; Tζ ) = c(b − a) = c dx. k=1
d(T )→0
k=1
a
2.1.5. Критерий Коши существования интеграла Римана
Теорема. Функция f , определённая на [a, b], имеет
Rb a
f (x) dx ⇔ для ∀ ε > 0 ∃ δ > 0 такое, что на элементе
Bδ ∈ d(T ) → δ колебание ω(Φf ; Bδ ) < ε, то есть для любого ε > 0 ∃ δ > 0 такое, что для любых Tζ′ ′ и Tζ′′′′ , имеющих d(Tζ′ ′ ) < δ, d(Tζ′′′′ ) < δ, выполнено условие Φδ (T ′ ′ ) − Φδ (T ′′′′ ) = σ(f ; T ′ ′ ) − σ(f ; T ′′′′ ) < ε ζ
то есть
ζ
ζ
ζ
n′ n′′ X X ′′ ′ ′ ′′ f (ζ ) ∆x − f (ζ ) ∆x k k k < ε. k k=1 k=1
2.1.6. Необходимое условие существования определённого интеграла Теорема 2.1. Всякая функция, интегрируемая на отрезке, ограничена на этом отрезке. (От противного) Пусть ∃ [a, b] и функция f , интегрируемая и неограниченная на [a, b]. Тогда существует предел I = lim σ(f ; Tζ ). Рассмотрим ε0 = 1 > 0. ∃ δ0 > 0 : |I − σ(f ; Tζ )| < ε0 = 1 для всех Tζ : d(Tζ ) < δ0 ⇒ d(T )→0
|σ(f ; Tζ )| 6 |σ(f ; Tζ ) − I| + |I| < |I| + 1 ∀ Tζ : d(Tζ ) < δ0 .
(5)
e Рассмотрим n ∈ N, n > b−a δ0 и T отрезка [a, b] на ∆k = [xk−1 , xk ], k = 1, n, одинаковой длины |∆k | = ∆xk = = 1, n. Тогда d(Te) < δ0 . Так как, по условию, f неограничена на [a, b], она будет неограничена на некотором 6 l 6 n. Рассмотрим ζk = xk−1 ∈ ∆k , для всех k ∈ [1; n] таких, что k 6= l, и неполный набор ζ ∗ = n P ζ1 , . . . , ζl−1 , ζl+1 , . . . , ζn и неполную сумму σ ∗ = f (ζk )∆xk . Так как f неограничена на ∆l и ∆xl > 0,
b−a n ,k ∆l , 1
k=1,k6=l
то найдётся ζl ∈ ∆l , в которой |f (ζl )| ∆xl > |σ ∗ | + |I| + 1. Добавляя ζl к ζ ∗ , получим полный набор ζ = n P {ζ1 , . . . , ζl−1 , ζl , . . . , ζn } и полную сумму σ(f, Teζ ) = f (ζk )∆xk с d(Teζ ) = d(Te) < δ0 , для которого справедливо: k=1
σ(f ; Teζ ) = |σ ∗ + f (ζl )∆xl | > |f (ζl )∆xl | − |σ ∗ | = |f (ζl )| ∆xl − |σ ∗ | > |σ ∗ | + |I| + 1 − |σ ∗ | = |I| + 1,
(6)
для Teζ , d(Teζ ) < δ0 . Неравенства (5) и (6) взаимоисключающие, так как (5) справедливо для всех Tζ : d(Tζ ) < δ0 , и и в частности, для Teζ , d(Teζ ) < δ0 . 2.1.7. Контрпример
Свойство ограниченности подинтегральной функции не является достаточным условием существования интеграла Римана. ( 1, x ∈ Q Пример: Функция Дирихле: D(x) = неинтегрируема на ∀ [a, b]. 0, x ∈ R r Q Рассмотрим произвольное T отрезка [a, b]; T : a = x0 < · · · < xn = b. По свойству плотности множеств ′ ′′ Q и R r Q на ∀∆k = [xk−1 , xk ], k = 1, n, существуют ζk ∈ ∆k ∩ Q и ζk ∈ ∆k ∩ (R r Q). Обозначим наборы ′ ′ ′′ ′′ ζ ′ = (ζ1 , . . . , ζn ) и ζ ′′ = (ζ1 , . . . , ζn ) и рассмотрим Tζ ′ и Tζ ′′ . Тогда 14
σ(D; Tζ ′ ) =
n P
k=1
f (ζk′ )∆xk = b − a > 0 и σ(D; Tζ ′′ ) =
n P
k=1
f (ζk′′ )∆xk =
n P
0∆k = 0.
k=1
Итак, для произвольного δ > 0 найдутся разбиения Tζ ′ и Tζ ′′ такие, что d(Tζ ′ ) < δ и d(Tζ ′′ ) < δ и σ(D; Tζ ′ ) = b − a > 0 и σ(D; Tζ ′′ ) = 0, так что ω(D; Bδ ) = |σ(D; Tζ ′ ) − σ(D; Tζ ′′ )| = b − a > 0. Таким образом, для D(x) не выполнен критерий Коши существования интеграла, как предела интегральных сумм по базе D(T ) → 0. 2.1.8. Свойство линейности определённого интеграла Теорема 2.2. Если f, g ∈ R[a, b], то для ∀ λ1 , λ2 ∈ R функция (λ1 f + λ2 g) ∈ R[a, b] и справедливо Zb
(λ1 f (x) + λ2 g(x)) dx = λ1
a
Zb
f (x) dx + λ2
a
Zb
(7)
g(x) dx.
a
Рассмотрим функции Φf : P → R, Φg : P → R, Φλ1 f +λ2 g : P → R. Тогда, на основании (2),
Φλ1 f +λ2 g = σ(λ1 f + λ2 g; Tζ ) =
n X
(λ1 f (ζk ) + λ2 g(ζk ))∆xk = λ1
k=1
n X
f (ζk )∆xk + λ2
k=1
n X
g(ζk )∆xk =
k=1
= λ1 σ(f ; Tζ ) + λ2 σ(g; Tζ ) = λ1 Φf (Tζ ) + λ2 Φg (Tζ )
(8)
для любого Tζ отрезка [a, b]. Так как f, g ∈ R[a, b], то ∃
lim Φf =
d(T )→0
Rb
f (x) dx и
lim Φg =
d(T )→0
a
предела функции по базе, существует предел lim Φλ1 f +λ2 g =
d(T )→0
Zb
Rb
g(x) dx и, в силу (8) и свойств линейности
a
(λ1 f (x) + λ2 g(x)) dx
a
и справедливо (7).
2.2. Критерии интегрируемости функций 2.2.1. Нижние и верхние суммы Дарбу Пусть функция f определена и ограничена на [a, b] (условие ограниченности функции необходимо для её интегрируемости). Рассмотрим произвольное T : a = x0 < x1 < · · · < xn = b и на каждом ∆k = [xk−1 , xk ], k = 1, n, рассмотрим числа mk = inf f (x); Mk = sup f (x) и обозначим: x∈∆k
s(f ; T ) =
n X
x∈∆k
mk ∆xk (нижняя) ; S(f ; T ) =
k=1
n X
k=1
Mk ∆xk (верхняя) , ∆xk = |∆k | , k = 1, n
(1)
— нижняя и верхняя суммы Дарбу функции f , порождённые разбиением T отрезка [a, b]. Так как 0 6 Mk − mk = ω(f ; ∆k ), k = 1, n, то S(f ; T ) − s(f ; T ) =
n X
ω(f ; ∆k )∆xk .
(2)
k=1
Так как для любого ζk ∈ ∆k справедливо mk 6 f (ζk ) 6 Mk , то из (1), для любой интегральной суммы σ(f ; Tζ ), ζ = (ζ1 , . . . , ζn ), ζk = ∆k , k = 1, n, справедливо s(f ; T ) 6 σ(f ; Tζ ) 6 S(f ; T )
(3)
для любых T и ζ. Теорема (основное свойство сумм Дарбу). Если f определена и ограничена на [a, b], то для ∀ T отрезка [a, b] верхняя (нижняя) сумма Дарбу S(f ; T ) (s(f ; T )) равна точной верхней (точной нижней) грани множества интегральных сумм {σ(f ; Tζ )}, в котором T — фиксировано и меняются всевозможные наборы точек ζ; т.е. S(f ; T ) = sup σ(f ; Tζ ) и s(f ; T ) = inf σ(f ; Tζ ). ζ
ζ
15
(Для верхней суммы). Рассмотрим произвольное ε > 0. По (3), σ(f ; Tζ ) 6 S(f ; T ) для любых наборов ε ζ. Так как Mk = sup f (x), k = 1, n, то ∃ ζk′ ∈ ∆k , в котором Mk − b−a < f (ζk′ ) 6 Mk , так что получим набор x∈∆k
ζk′ = (ζ1′ , . . . , ζn′ ) и размеченное разбиение Tζ ′ , для которого σ(f ; Tζ ′ ) =
n X
f (ζk′ )∆xk
k=1
(так как
n P
k=1
n X > Mk − k=1
ε b−a
∆xk = S(f ; T ) − ε
∆xk = b − a и ∆xk > 0).
Последнее неравенство вместе с σ(f ; Tζ ) 6 S(f ; T ) для всех ζ означают, что S(f ; T ) = sup σ(f ; Tζ ). ζ
Аналогично для нижней суммы. 2.2.2. Свойство монотонности суммы Дарбу Теорема. Если f определена и ограничена на [a, b] и разбиение T1 отрезка [a, b] получено из разбиения T добавлением любого конечного множества точек, то s(f ; T1 ) > s(f ; T ) и S(f ; T1 ) 6 S(f ; T ). Утверждение достаточно доказать для случая, когда к T добавляется единственная новая точка x. В этом случае ∃ k ∈ [1, n] : x ∈ (xk−1 , xk ) и ∆k = [xk−1 , xk ] = [xk−1 , x] ∪ [x, xk ] = ∆1k ∪ ∆2k . К числам mk = inf f (x) и Mk = sup f (x) добавим числа mik = inf i f (x) и Mki = sup f (x). Тогда известно x∈∆k
(из первого семестра), что
x∈∆k
x∈∆k
mik
= inf i f > x∈∆k
mk , Mki
x∈∆ik
6 Mk , i = 1, 2. Поэтому,
S(f ; T1 )−S(f ; T ) = Mk1 (x−xk−1 )+Mk2 (xk −x)−Mk (xk −xk−1 ) 6 Mk (x−xk−1 )+Mk (xk −x)−Mk (xk −xk−1 ) = 0 и s(f ; T1 )−s(f ; T ) = m1k (x−xk−1 )+m2k (xk −x)−mk (xk −xk−1 ) > mk (x−xk−1 )+mk (xk −x)−mk (xk −xk−1 ) = 0. Замечание. Так как Mk − Mki 6 ω(f, [a, b]), то 0 < S(f, T ) − S(f, T1 ) = (Mk − Mk1 )(x − xk−1 ) + (Mk − Mk2 )(xk − x) 6 ω(f ; [a, b])∆xk 6 ω(f ; [a, b])d(T ). Аналогично: 0 6 s(f, T1 ) − s(f, T ) 6 ω(f ; [a, b])d(T ). Оба неравенства справедливы в случае, когда в отрезке разбиения ∆k содержится несколько новых точек разбиения. 2.2.3. Свойство отделимости множеств суммы Дарбу Теорема. Если f определена и ограничена на [a, b], то для любых разбиений T1 и T2 отрезка [a, b] справедливо s(f ; T1 ) 6 S(f ; T2 ). Рассмотрим T = T1 ∪ T2 . По теореме пункта 2.2.2 и неравенству (3), имеем: s(f ; T1 ) 6 s(f ; T ) 6 S(f ; T ) 6 S(f ; T2 ). 2.2.4. Нижний и верхний интегралы Дарбу Так как множества {s(f ; T )} и {S(f ; T )} обладают свойством отделимости, то, по принципу отделяющего отрезка, ∃ sup {s(f ; T )} = I и inf {S(f ; T )} = I и справедливо T
T
s(f ; T ) 6 I 6 I 6 S(f ; T )
(4)
для любого разбиения T . I — нижний интеграл Дарбу функции f , I — верхний интеграл Дарбу функции f . 2.2.5. Теорема Дарбу Рассмотрим на множестве P функции ψf , Ψf вида ψf : P → R, ψf (Tζ ) = s(f ; T ), Tζ ∈ P и Ψf : P → R, Ψf (Tζ ) = S(f ; T ), Tζ ∈ P. (Таким образом, ψf , Ψf — постоянные для каждого фиксированного T относительно всевозможного выбора наборов точек ζ). По неравенству (3) справедливо ψf (Tζ ) 6 Φf (Tζ ) 6 Ψf (Tζ ) 16
(5)
для любого Tζ ∈ P. Обозначение. lim ψf = lim s(f ; T ),
d(T )→0
d(T )→0
lim Ψf = lim S(f ; T ),
d(T )→0
d(T )→0
lim Φf = lim σ(f ; Tζ ).
d(T )→0
d(T )→0
Следующую теорему называют теоремой Дарбу. Теорема. Если f определена и ограничена на [a, b], то I = lim ψf ,
I = lim Ψf ,
d(T )→0
d(T )→0
или же I = lim s(f ; T ),
I = lim S(f ; T ).
d(T )→0
d(T )→0
(Для I). По неравенству (4), I 6 S(f, T ), ∀ T , и I = inf S(f ; T ). T
Рассмотрим произвольное ε > 0. Тогда ∃ T1 отрезка [a, b]:
ε I 6 S(f ; T1 ) < I + . 2
(6)
Пусть T1 имеет m точек разбиения. Так как f ограничена на [a, b], то ω = ω(f ; [a, b]) < +∞ (конечно) и ω > 0. Если ω = 0, то f = const, т.е. f (x) = c, x ∈ [a, b] и тогда mk = Mk = c, k = 1, n ⇒ s(f ; T ) = S(f ; T ) = c(b − a) ε и ∃ lim s(f, T ) = I = c(b − a) и ∃ lim S(f ; T ) = I = c(b − a). Пусть ω > 0 и δ = 2mω > 0 (m — число d(T )→0
d(T )→0
точек разбиения T1 ). Рассмотрим произвольное Tζ , d(Tζ ) < δ, которое определяет разбиение T, d(T ) = d(Tζ ) < δ. Рассмотрим T2 = T ∪ T1 . По свойству монотонности верхних сумм: S(f ; T2 ) 6 S(f ; T ) и S(f ; T2 ) 6 S(f ; T1 ). По замечанию теоремы пункта 2.2.2, 0 6 S(f ; T ) − S(f ; T2 ) 6 ωmd(T ) < ωmδ =
ε . 2
(7)
По неравенствам (6) и (7) имеем: I 6 S(f ; T ) 6 S(f ; T2 ) + то есть
ε ε ε ε 6 S(f ; T1 ) + < I + + = I + ε, ∀ Tζ : d(Tζ ) < δ, 2 2 2 2
I − S(f ; T ) < ε, ∀ Tζ : d(Tζ ) < δ
или I = lim S(f ; T ). d(T )→0
2.2.6. Критерий Дарбу существования интеграла Римана Rb
Теорема. f определена и интегрируема на [a, b] ⇔ f — ограничена на [a, b] и I = I. При этом I = I = I = f (x) dx.
a
(⇐) По условию, f — ограничена и пусть I = I = I. По теореме Дарбу (пункт 2.2.5), I =
lim ψf и
d(T )→0
I = lim Ψf . По неравенству (5) и оценочному признаку существования предела функции по базе, существует d(T )→0
предел
lim Φf = I = I = I и I =
d(T )→0
(⇒) По условию, существует
Rb
f (x) dx.
a
Rb
f (x) dx = I. Рассмотрим произвольное ε > 0. Так как I =
a
lim Φf =
d(T )→0
lim σ(f ; Tζ ), то ∃ δ > 0 : ∀ Tζ , d(Tζ ) < δ, справедливо:
d(T )→0
I−
ε ε < σ(f ; Tζ ) < I + , ∀ Tζ , d(Tζ ) < δ. 3 3 17
(8)
По неравенству (8) и основному свойству сумм Дарбу, справедливо неравенство I−
ε ε 6 s(f ; T ) = inf σ(f ; Tζ ) 6 sup σ(f ; Tζ ) = S(f ; T ) 6 I + , ζ 3 3 ζ
откуда, с учётом (4), получаем ε ε 6 s(f ; T ) 6 I 6 I 6 S(f ; T ) 6 I + . 3 3 < ε, I − I 6 2ε 3 < ε и I = I = I в силу произвольности ε > 0. I−
Из (9) следует, что |I − I| 6
2ε 3
(9)
2.2.7. Критерий интегрируемости в терминах колебаний f Теорема. f ∈ R[a, b] ⇔ f — ограничена на [a, b] и lim (S(f ; T ) − s(f ; T )) = 0 или
d(T )→0
lim
d(T )→0
n X
ω(f ; ∆k )∆xk = 0,
k=1
то есть для любого ε > 0 найдётся δ > 0 такое, что для произвольного разбиения T отрезка [a, b], у которого d(T ) < δ, справедливо неравенство 0 6 S(f ; T ) − s(f ; T ) =
По (2) пункта 2.2.1, S(f ; T ) − s(f ; T ) =
n P
n X
ω(f ; ∆k )∆xk < ε.
k=1
ω(f ; ∆k )∆xk . По теореме Дарбу,
k=1
lim (S(f ; T ) − s(f ; T )) =
d(T )→0
I − I > 0. По критерию Дарбу, f ∈ R[a, b] ⇔ f — ограничена на [a, b] и I = I. 2.2.8. Третий критерий интегрируемости функции Теорема. f ∈ R[a, b] ⇔ ∀ ε > 0 ∃ разбиение T отрезка [a, b], для которого S(f ; T ) − s(f ; T ) < ε. Так как множества {s(f ; T )} и {S(f ; T )} обладают свойствами отделимости, то, по принципу отделяющего отрезка, I = I ⇔ для любого ε > 0 ∃ разбиения T1 и T2 отрезка [a, b], для которых выполнено: 0 6 S(f ; T1 ) − s(f ; T2 ) < ε. Тогда T1 ∪ T2 = T — некоторое разбиение отрезка [a, b], для которого s(f ; T ) > s(f ; T2 ) и S(f ; T ) 6 S(f ; T1 ) и, следовательно, 0 6 S(f ; T ) − s(f ; T ) 6 S(f ; T1 ) − s(f ; T2 ) < ε. По формуле (4): s(f ; T ) 6 I 6 I 6 S(f ; T ) для любого T отрезка [a, b].
2.3. Классы интегрируемых функций 2.3.1. Интегрируемость непрерывных функций Теорема. Если f ∈ C[a, b], то f ∈ R[a, b]. Так как f ∈ C[a, b], то, по теореме Вейерштрасса, f ограничена на [a, b]. Более того, f — равномерно ε непрерывна на [a, b] и, следовательно, для любого ε > 0 ∃ δ > 0 : ω(f ; ∆) < b−a для любого ∆ ⊂ [a, b], |∆| < δ. Рассмотрим произвольное T отрезка [a, b] на ∆k = [xk−1 ; xk ], k = 1, n, a = x0 , xn = b, d(T ) < δ. Тогда |∆k | 6 ε d(T ) < δ, ∀k = 1, n, и ω(f ; ∆k ) < b−a , k = 1, n. Поэтому n X
k=1
n
ω(f ; ∆k )∆xk <
ε X ε ∆xk = (b − a) = ε, b−a b−a k=1
∀ T : d(T ) < δ.
По второму критерию интегрируемости, f ∈ R[a, b]. 2.3.2. Интегрируемость функций с конечным множеством точек разрыва Теорема. Всякая функция, определённая и ограниченная на [a, b] и имеющая только конечное число l точек разрыва, интегрируема на [a, b]. (По индукции). Если l = 0, то есть f непрерывна на [a, b], то используем теорему предыдущего пункта. Пусть теорема доказана для всех l < n, и f удовлетворяет её условиям для l = n. Рассмотрим сначала случай, когда f имеет точку разрыва c, внутреннюю для [a, b], a < c < b.
18
Так как f ограничена на [a, b], то ∃ C > 0 : |f (x)| 6 C, ∀ x ∈ [a, b]. Рассмотрим произвольное ε > 0 и точки ε c1 ∈ (a, c), c2 ∈ (c, b), для которых c2 − c1 < 6C . Пусть m = inf f (x) и M = sup f (x). Тогда M 6 C, а x∈[c1 ,c2 ]
x∈[c1 ,c2 ]
ε 3.
m > −C ⇒ M − m 6 2C и (M − m) · (c2 − c1 ) < На отрезках [a, c1 ] и [c2 , b] функция может иметь менее, чем n точек разрыва, и, по предположению индукции, функция интегрируема на каждом из этих отрезков. f ∈ R[a, c1 ] и f ∈ R[c2 , b]. По третьему критерию интегрируемости, ∃ T1 отрезка [a, c1 ] и T2 отрезка [c2 , b], для которых S(f ; T1 ) − s(f ; T1 ) < 3ε и S(f ; T2 ) − s(f ; T2 ) < 3ε . Образуем разбиение T отрезка [a, b] добавлением к отрезкам разбиений T1 и T2 отрезка [c1 , c2 ], для которого ε ε ε S(f ; T ) − s(f ; T ) = S(f ; T1 ) − s(f ; T1 ) + (M − m)(c2 − c1 ) + S(f ; T2 ) − s(f ; T2 ) < + + = ε. 3 3 3 По третьему критерию, f ∈ R[a, b]. Пусть n = 1 и функция имеет единственную точку разрыва в одной из концевых точек. ε Пусть x = a — точка разрыва функции f . Рассмотрим c2 ∈ (a, b) : c2 − a < 4C . На [c2 , b] функция непрерывна ε ⇒ f ∈ R[c2 , b]. Обозначим M = sup f (x) и m = inf f (x). Тогда (M − m)(c2 − a) < 4C · 2C = 2ε . По x∈[a,c2 ]
x∈[a,c2 ]
третьему критерию, ∃ T2 отрезка [c2 , b], для которого S(f ; T2 ) − s(f ; T2 ) < 2ε . Образуем разбиение T отрезка [a, b] добавлением к отрезку разбиения T2 отрезка [a, c2 ], для которого S(f ; T ) − s(f ; T ) = (M − m)(c2 − a) + S(f ; T2 ) − s(f ; T2 ) < 2ε + 2ε = ε. По третьему критерию, f ∈ R[a, b]. Аналогично рассматривается случай, когда x = b — единственная точка разрыва. 2.3.3. Применение теоремы пункта 3.2 Теорема 2.3. Если f определена на [a, b] и f (x) = 0 для любого x ∈ [a, b] за возможным исключением Rb некоторого конечного множества K на отрезке [a, b], то f (x) dx = 0. a
По условию теоремы, f ограничена на [a, b] и, следовательно, по теореме пункта 3.2 ∃ (p)
(p)
Rb
f (x) dx = I.
a
Рассмотрим произвольное p ∈ N и размеченное разбиение Tζ отрезка [a, b] с d(Tζ ) < p1 с набором точек ζ = (ζ1 , . . . , ζn ), в которых все ζk ∈ / K, что возможно в силу конечности множества K. Тогда (p)
σp = σ(f ; Tζ ) =
n X
f (ζk )∆xk =
k=1
Так что lim σp = 0. Так как ∃ p→∞
n X
k=1
(p)
0 · ∆xk = 0, d(Tζ ) <
1 , p ∈ N. p
lim σ(f ; Tζ ) = I, то I = 0.
d(T )→0
Теорема 2.4. Если f ∈ R[a, b]; g — определена и ограничена на [a, b] и g(x) = f (x) для любого x ∈ [a, b] за Rb Rb возможным исключением некоторого конечного множества K ⊂ [a, b], то g ∈ R[a, b] и g(x) dx = f (x) dx. a
a
h = g − f ограничена на [a, b] (так как f ∈ R[a, b] и, следовательно, f — ограничена на [a, b]) и h(x) = Rb Rb Rb g(x) − f (x) = 0 для любого x ∈ [a, b] r K. По теореме 2.3, h(x) dx = 0 ⇒ g(x) dx = f (x) dx (по линейному
a
a
a
свойству).
2.3.4. Свойство монотонности определённого интеграла Теорема. Если f, g ∈ R[a, b] и f (x) > g(x), x ∈ [a, b], то
Rb a
f (x) dx >
Rb
g(x) dx.
a
Для любого размеченного разбиения Tζ отрезка [a, b] на ∆k = [xk−1 , xk ], k = 1, n, a = x0 , xn = b и набора ζ = {ζ1 , . . . , ζn } , ζk ∈ ∆k , k = 1, n, справедливо: σ(f ; Tζ ) =
n X
f (ζk )∆xk >
k=1
n X
g(ζk )∆xk = σ(g; Tζ ) (так как ∆xk > 0, k = 1, n),
k=1
или Φf (Tζ ) > Φg (Tζ ), ∀ Tζ ∈ P. Rb Rb Так как f (x) dx = lim Φf ; g(x) dx = a
lim Φf > lim Φg , то
d(T )→0
d(T )→0
d(T )→0 Rb
a
f (x) dx >
a
Rb
lim Φg и предел по базе обладает свойством монотонности
d(T )→0
g(x) dx.
a
19
2.3.5. Интегрируемость произведения функций Лемма. Если f ∈ R[a, b], то f 2 ∈ R[a, b]. По условию, ∃ C > 0 : |f (x)| 6 C, ∀ x ∈ [a, b] и, следовательно, f 2 ограничена на [a, b]. Для произвольных ′ x и x′′ ∈ [a, b] справедливо: 2 ′ f (x ) − f 2 (x′′ ) = |f (x′ ) − f (x′′ )| · |f (x′ ) + f (x′′ )| 6 (|f (x′ )| + |f (x′′ )|) · |f (x′ ) − f (x′′ )| 6 2C · |f (x′ ) − f (x′′ )| . (1) Рассмотрим произвольное разбиение T отрезка [a, b] на отрезки ∆k = [xk−1 ; xk ], k = 1, n. По (1): ω(f 2 ; ∆k ) 6 2C · ω(f ; ∆k ), k = 1, n и 0 6 Так как f ∈ R[a, b], то, по второму критерию, lim
n P
d(T )→0 k=1
lim
n X
ω(f 2 ; ∆k )∆xk 6 2C
k=1
n P
d(T )→0 k=1
n X
k=1
ω(f ; ∆k ) · ∆xk .
(2)
ω(f ; ∆k ) · ∆xk = 0, откуда, с учётом (2),
ω(f 2 , ∆k ) · ∆xk = 0 ⇒ f 2 ∈ R[a, b] (по второму критерию).
Теорема. Если f и g ∈ R[a, b], то (f · g) ∈ R[a, b]. Так как f · g = 14 (f + g)2 − (f − g)2 и (f ± g) ∈ R[a, b], (f ± g)2 ∈ R[a, b] (по лемме), то f g ∈ R[a, b]. 2.3.6. Интегрируемость монотонной функции
Теорема. Всякая монотонная функция, определённая на [a, b], интегрируема на [a, b]. Пусть, например, f ↑ на [a, b]. Тогда для произвольного разбиения T отрезка [a, b] на ∆k = [xk−1 , xk ], k = 1, n; a = x0 , xn = b; на каждом ∆k , k = 1, n имеем: Mk = f (xk ), mk = f (xk−1 ), k = 1, n и, следовательно, S(f ; T ) − s(f ; T ) =
n X
k=1
(Mk − mk )∆xk =
n X
k=1
(f (xk ) − f (xk−1 )) ∆xk 6
n X
k=1
(f (xk ) − f (xk−1 )) · d(T ) =
= [f (x1 ) − f (x0 ) + f (x2 ) − f (x1 ) + · · · + f (xn ) − f (xn−1 )] d(T ) = (f (xn ) − f (x0 )) d(T ) = (f (b) − f (a)) d(T ) и S(f ; T ) − s(f ; T ) < ε, если d(T ) <
ε f (b)−f (a)+1 .
2.3.7. Свойство аддитивности определённого интеграла Теорема. Если f ∈ R[a, b] и c, a < c < b — произвольное, то f ∈ R[a, c] и f ∈ R[c, b]. Обратно, если функция f ∈ R[a, c] и f ∈ R[c, b], a < c < b, то f ∈ R[a, b]. В обоих случаях справедливо Zb a
f (x) dx =
Zc
f (x) dx +
a
Zb
f (x) dx.
(1)
c
Рассмотрим сначала случай, когда f ∈ R[a, b] и a < c < b и проверим справедливость третьего критерия интегрируемости функции на [a, c] и [c, b]. Для этого рассмотрим произвольное ε > 0. Так как f ∈ R[a, b], то по третьему критерию интегрируемости существует такое разбиение Te отрезка [a, b], для которого S(f ; Te)−s(f ; Te) < ε. Добавляя точку c к точкам разбиения Te, получим новое разбиение T , для которого s(f ; T ) > s(f ; Te) и S(f ; T ) 6 S(f ; Te) и, следовательно, S(f ; T ) − s(f ; T ) 6 S(f ; Te) − s(f ; Te) < ε. Разбиение T есть T ′ ∪ T ′′ некоторого разбиения T ′ отрезка [a, c] и T ′′ отрезка [c, b], для которого справедлива формула S(f ; T ) − s(f ; T ) = S(f ; T ′) − s(f ; T ′ ) + S(f ; T ′′ ) − s(f ; T ′′ ).
(2)
Так как все разности в формуле (2) неотрицательные и разность в левой её части меньше ε, то S(f ; T ′ ) − s(f ; T ′ ) < ε и S(f ; T ′′ ) − s(f ; T ′′ ) < ε. Так что по третьему критерию интегрируемости, функция f ∈ R[a, c] и f ∈ R[c, b]. Пусть теперь f ∈ R[a, c] и f ∈ R[c, b] и число ε > 0 — произвольное. Согласно третьему критерию интегрируемости, существует такое разбиение T ′ отрезка [a, c], что S(f ; T ′) − s(f ; T ′ ) < 2ε , и такое разбиение T ′′ отрезка [c, b], что S(f ; T ′′ ) − s(f ; T ′′ ) < 2ε . Объединение T ′ ∪ T ′′ образует некоторое разбиение T отрезка [a, b], для которого справедливо (2). Поэтому, S(f ; T ) − s(f ; T ) < 2ε + 2ε = ε. Так что по третьему критерию интегрируемости функция f ∈ R[a, b].
20
Чтобы доказать формулу (1), обозначим
Rb a
Rc Rb f (x) dx = I, f (x) dx = I1 , f (x) dx = I2 и рассмотрим произa
c
вольное ε > 0. Согласно определению интеграла Римана, существует такое δ1 > 0, что |I − σ(f ; Tζ )| <
ε 3
(3)
для всех размеченных разбиений Tζ отрезка [a, b] с d(Tζ ) < δ1 . Существует такое δ2 > 0, что I1 − σ(f ; Tζ′ ′ ) < ε 3
(4)
для всех размеченных разбиений Tζ′ ′ отрезка [a, c] с d(Tζ′ ′ ) < δ2 и существует такое δ3 > 0, что I2 − σ(f ; Tζ′′′′ ) < ε 3
(5)
для всех размеченных разбиений Tζ′′′′ отрезка [c, b] с d(Tζ′′′′ ) < δ3 . Положим δ = min(δ1 , δ2 , δ3 ), δ > 0 и рассмотрим такие разбиения Tζ′ ′ с d(Tζ′ ′ ) < δ 6 δ2 и размеченные разбиения Tζ′′′′ отрезка [c, b] с d(Tζ′′′′ ) < δ 6 δ3 , для которых точка c не входит в наборы ζ ′ и ζ ′′ . Тогда Tζ′ ′ и Tζ′′′′ образует некоторое размеченное разбиение Tζ отрезка [a, b] с d(Tζ ) < δ 6 δ1 , для которого справедливы формулы σ(f ; Tζ ) = σ(f ; Tζ′ ′ ) + σ(f ; Tζ′′′′ ). Поэтому, с учётом формул (3)—(5), имеем |I − (I1 + I2 )| = |I − σ(f ; Tζ ) − (I1 + I2 − σ(f ; Tζ ))| 6
6 |I − σ(f ; Tζ )| + |I1 + I2 − σ(f ; Tζ )| = |I − σ(f ; Tζ )| + I1 − σ(f ; Tζ′ ′ ) + I2 − σ(f ; Tζ′′′′ ) 6 ε ε ε 6 |I − σ(f ; Tζ )| + I1 − σ(f ; Tζ′ ′ ) + I2 − σ(f ; Tζ′′′′ ) < + + = ε. (6) 3 3 3
В силу произвольного выбора числа ε, число, стоящее в левой части (6), равно нулю, то есть I = I1 + I2 , что равносильно формуле (1). Замечание. Формально можно рассмотреть случай, когда a > b и в качестве размеченного разбиения T ∗ считать точки a = x∗0 > x∗1 > · · · > x∗k−1 > x∗k > · · · > x∗n−1 > x∗n = b, где ∆x∗k = x∗k − x∗k−1 < 0, k = 1, n. В качестве формального набора ζ ∗ = (ζ1∗ , . . . , ζn∗ ) , x∗k−1 > ζk∗ > x∗k , k = 1, n, и формальное размеченное n P разбиение Tζ∗∗ , которому отвечает формальная интегральная сумма σ ∗ (f ; Tζ∗∗ ) = f (ζk∗ )∆x∗k . Если обозначить k=1
l = n − k, xl = x∗n−k , то b = x0 < x1 < · · · < xl < xl−1 < · · · < xn−1 < xn = a; при этом ζk∗ = ζn−l , l = 1, n, и n P Tζ — размеченное разбиение отрезка [b, a] с интегральной суммой σ(f ; Tζ ) = f (ζl )∆xl , где ∆xl = xl − xl−1 = k=1
x∗n−k − x∗n−k+1 = −∆x∗n−k > 0, l = 1, n. Таким образом, σ(f ; Tζ∗∗ ) = −σ(f ; Tζ ). Ra Если функция f ∈ R[b, a], то f (x) dx = lim σ(f ; Tζ ). Поскольку предел функции обладает свойством
линейности, то существует предел ∗
d(T )→0
b
I = lim σ d(T )→0
∗
(f ; Tζ∗∗ )
= − lim σ(f ; Tζ ) = − d(T )→0
Za
f (x) dx.
b
Число I ∗ обозначается символом
Rb
f (x) dx, a > b и по определению
a
Zb a
Таким образом, 0 =
Rb a
f (x) dx +
Ra
f (x) dx = −
f (x) dx =
Za
f (x) dx, a > b.
(7)
b
Ra
f (x) dx.
a
b
Теорема. Если функция f интегрируема на наибольшем из отрезков с концевыми точками a, b, c (или f интегрируема на двух отрезках, объединение которых образует максимальный отрезок), то Zc a
f (x) dx +
Zb
f (x) dx +
c
Za b
21
f (x) dx = 0.
(8)
Не ограничивая общности, считаем a < c < b. Согласно предыдущей теореме этого пункта, Zc
f (x) dx +
a
Zb
f (x) dx =
c
Zb
f (x) dx,
a
откуда 0=
Zc
f (x) dx +
a
Zb
f (x) dx −
c
Zb
f (x) dx =
a
Zc
f (x) dx +
a
Zb
f (x) dx +
c
Za
f (x) dx,
b
что есть (8). Следствие. Если функция f ∈ R[a, b], то f ∈ R[c, d] для любых c, d, a 6 c < d 6 b. f ∈ R[a, b] ⇒ f ∈ R[c, b] ⇒ f ∈ R[c, d]. 2.3.8. Оценка модуля определённого интеграла Лемма 2.5. Если функция f ∈ R[a, b], то |f | ∈ R[a, b]. Так как f ∈ R[a, b], то f ограничена на [a, b] и ∃ C > 0 : |f (x)| 6 C, x ∈ [a, b]. Так как ||f (x′ )| − |f (x′′ )|| 6 |f (x′ ) − f (x′′ )| для всех x′ , x′′ ∈ [a, b], то для любого множества E ⊂ [a, b] справедлива оценка ω(|f | , E) = sup ||f (x′ )| − |f (x′′ )|| 6 sup |f (x′ ) − f (x′′ )| = ω(f, E). x′ ,x′′ ∈E
x′ ,x′′ ∈E
Поэтому для любого разбиения T отрезка [a, b] на отрезки ∆k = [xk−1 , xk ], k = 1, n, a = x0 , . . . , xn = b n n P P ω(|f | , ∆k )∆xk 6 ω(f ; ∆k )∆xk (∆xk > 0, k = 1, n).
k=1
k=1
Так как f ∈ R[a, b], то по второму критерию, lim
функции по базе
lim
n P
d(T )→0 k=1
n P
d(T )→0 k=1
ω(f, ∆k )∆xk = 0 и по свойству монотонности предела
ω(|f | , ∆k )∆xk = 0, так что |f | ∈ R[a, b] (по второму критерию).
( +1, если x ∈ Q, Замечание. Функция h(x) = не интегрируема ни на каком отрезке [a, b] в R, в то −1, если x ∈ R r Q. время как |h(x)| = 1, x ∈ R интегрируема на любом отрезке [a, b]. Кроме того, h2 (x) = 1 и h2 ∈ R[a, b]. Теорема. Если f ∈ R[a, b], то справедлива оценка b Z Zb f (x) dx 6 |f (x)| dx. a
(9)
a
Так как − |f (x)| 6 f (x) 6 |f (x)| для любого x ∈ [a, b], то, согласно свойствам монотонности и линейности Rb Rb Rb определённого интеграла и лемме, справедливо − |f (x)| dx 6 f (x) dx 6 |f (x)| dx, что равносильно (9).
a
a
a
Следствие. Если f ∈ R[a, b], |f (x)| 6 C для любого x ∈ [a, b], то b Z f (x) dx 6 C(b − a).
(10)
a
Rb Rb Rb Согласно (9), f (x) dx 6 |f (x)| dx 6 C dx (свойство монотонности) = C(b − a). a a a
Замечание. Оценки типа (9) и (10) справедливы также для случая a > b, так как b a a Z Z Z f (x) dx = − f (x) dx = f (x) dx a
и имеют вид
b
b
b b Z Z f (x) dx 6 |f (x)| dx , a
a
22
(9′ )
b Z f (x) dx 6 C |b − a| .
(10′ )
a
2.3.9. Первая теорема о среднем значении для определённого интеграла Теорема. Если функции f, g ∈ R[a, b] и функция g сохраняет знак на [a, b] (то есть g(x) > 0, x ∈ [a, b], либо g(x) 6 0, x ∈ [a, b]) и m = inf f (x), M = sup f (x), то существует некоторое µ ∈ [m; M ], m 6 µ 6 M , что x∈[a,b]
x∈[a,b]
Zb
f (x)g(x) dx = µ
a
Zb
(11)
g(x) dx.
a
Если f ∈ C[a, b], то существует некоторое ξ ∈ [a, b], в которой Zb
Zb
f (x)g(x) dx = f (ξ)
a
(12)
g(x) dx.
a
Рассмотрим сначала случай, когда g(x) > 0, x ∈ [a, b]. Тогда m 6 f (x) 6 M и mg(x) 6 f (x)g(x) 6 M g(x) при x ∈ [a, b] и по свойству монотонности и линейности интеграла m
Zb
g(x) dx 6
a
Поскольку
Rb a
Пусть
Rb a
g(x) dx >
Rb
Zb
f (x)g(x) dx 6 M
a
Zb
g(x) dx.
a
0 dx = 0, то формула (11) в случае
a
Rb
g(x) dx = 0 справедлива для всех µ.
a
g(x) dx 6= 0 (то есть
m6
Rb
g(x) dx > 0). Тогда
a
Rb
f (x)g(x) dx
a
Rb
6M
иµ=
g(x) dx
Rb
f (x)g(x) dx
a
a
Rb
, m 6 µ 6 M. g(x) dx
a
Rb
Если g(x) 6 0, то −g(x) > 0, x ∈ [a, b] и по доказанному
a
Rb f (x)(−g(x)) dx = µ (−g(x)) dx, что равносильно (11) a
в силу свойства линейности интеграла. Если f ∈ C[a, b], то m = inf f (x) = min f (x), а M = sup f (x) = max f (x) (по теореме Вейерштрасса). Так x∈[a,b]
[a,b]
x∈[a,b]
[a,b]
как m 6 µ 6 M , то по теореме Коши о промежуточных значениях непрерывной функции на [a, b], ∃ ξ ∈ [a, b], в которой µ = f (ξ) и формула (11) переходит в (12). Следствие. Если f ∈ R[a, b] и m = inf f (x), M = sup f (x), то существует µ ∈ [m, M ], что x∈[a,b]
x∈[a,b]
µ(b − a) (11′ ). Если f ∈ C[a, b], то ∃ ξ ∈ [a, b], в котором Zb a
f (x) dx = f (ξ)(b − a).
Полагая g(x) = 1, x ∈ [a, b], получим (11′ ) и (12′ ) из (11) и (12) соответственно, так как Zb a
g(x) dx =
Zb a
23
1 dx = b − a.
Rb
f (x) dx =
a
(12′ )
2.4. Интеграл и производная 2.4.1. Непрерывность интеграла с переменным верхним пределом Рассмотрим произвольную f ∈ R[a, b]. По свойству аддитивности интеграла, для произвольного x ∈ [a, b] существует функция F (x): Zx F (x) = f (t) dt, x ∈ [a, b], F (a) = 0 (1) a
— интеграл с переменным верхним пределом. Теорема. Для произвольной f ∈ R[a, b] функция F , определяемая (1), непрерывна на [a, b]. Фиксируем ∀x ∈ [a, b] и рассмотрим все h, x + h ∈ [a, b]. По свойству аддитивности, F (x + h) − F (x) =
x+h Z
f (t) dt −
a
Zx
f (t) dt =
a
x+h Z
(2)
f (t) dt.
x
Так как f ∈ R[a, b], то ∃ M > 0 : |f (x)| 6 M, x ∈ [a, b], в силу оценки модуля интеграла, x+h x+h x+h Z Z Z f (t) dt 6 |f (t)| dt 6 M dt = M · |h| . x
x
(3)
x
Так как lim M |h| = 0, то на основании (3) и (2), lim (F (x + h) − F (x)) = 0 или F (x) = lim F (x + h), x ∈ [a, b], h→0
h→0
h→0
т.е. F ∈ C[a, b].
2.4.2. Дифференцируемость интеграла по верхнему пределу Теорема. Если f ∈ R[a, b] и f непрерывна в точке x0 ∈ (a, b), то F , определяемая (1), дифференцируема в точке x, и x ′ Z F ′ (x) = f (x), f (t) dt = f (x). a
Так как
получим
x+h R x
f (x) dt = f (x)(x + h − x) = f (x) · h, то на основании (2) и свойства линейности интеграла,
F (x + h) − F (x) = f (x) · h −
x+h Z
f (x) dt +
x
x+h Z
f (t) dt = f (x) · h −
x
x+h Z x
(f (t) − f (x)) dt,
откуда F (x + h) − F (x) 1 = f (x) − h h
x+h Z x
(4)
(f (t) − f (x)) dt, h 6= 0.
Так как f непрерывна в точке x, то для любого ε > 0 ∃δ > 0 : |f (t) − f (x)| < 2ε , ∀t : |t − x| 6 |h| < δ или |f (t) − f (x)| < ε для ∀ |h| < δ; |t − x| 6 |h| < δ. Согласно оценке модуля интеграла, x+h x+h Z Z 1 1 1 6 6 (f (t) − f (x)) dt |f (t) − f (x)| dt sup |f (t) − f (x)| |x + h − x| = sup |f (t) − f (x)| < ε h |h| |h| |t−x|6|h| |t−x|6|h| x x (5) x+h R F (x+h)−F (x) 1 = F ′ (x). для ∀ 0 < |h| < δ. Так как (5)⇔ lim h (f (t)−f (x)) dt = 0, то, на основании (4), f (x) = lim h h→0
h→0
x
Следствие 2.1. f ∈ C[a, b] ⇒ F , определяемая (1) — точная первообразная для f на [a, b]. Так как F ∈ C[a, b], то по теореме пункта 2.4.1 (так как f ∈ R[a, b]), существует F ′ (x) = f (x) для любого x ∈ (a, b) по предыдущей теореме.
Следствие 2.2. Если f — ограничена на [a, b] и имеет только конечное множество точек разрыва на [a, b], то F , определяемая (1), образует первообразную функцию для f с конечным исключительным множеством. 24
По условию, f непрерывна в каждой точке x ∈ (a, b), за возможным исключением некоторого конечного множества K, и f ∈ R[a, b]. По теореме пункта 4.1, F ∈ C[a, b] и, по предыдущей теореме, F ′ (x) = f (x) для ∀ x ∈ (a, b) r K. 2.4.3. Основная формула интегрального исчисления Теорема. Если f ограничена на [a, b] и имеет только конечное множество точек разрыва на [a, b], то Zb a
(6)
f (x) dx = Φ(b) − Φ(a),
где Φ(x) — произвольная первообразная функция для f на [a, b]. По следствию 2, функция F , определяемая (1), есть первообразная для f на [a, b]. Произвольная первообразная Φ(x) = F (x) + c, x ∈ [a, b], c = const. Так как значение F в точке a = 0 : F (a) = 0, то Φ(a) = c ⇒ Zx a
f (t) dt = Φ(x) − Φ(a),
для любого x ∈ [a, b]. В частности, при x = b получаем (6). (6) называют также формулой Ньютона–Лейбница. 2.4.4. Интегрирование по частям в определённом интеграле Теорема. Если u, v ∈ C[a, b]; u′ , v ′ ∈ R[a, b] (в концевых точках — односторонние производные), то Zb a
где
b Zb u(x)v (x) dx = (u(x)v(x)) − v(x)u′ (x) dx, ′
a
(7)
a
b (u(x)v(x)) = u(b)v(b) − u(a)v(a). a
Если f ∈ C[a, b], то
Zb a
(6′ )
f (x) dx = Φ(b) − Φ(a),
для любой точной первообразной Φ(x) для f (x) на [a, b]. Так как u, v ∈ C[a, b] и u′ , v ′ ∈ R[a, b], то оба интеграла в (7) существуют. (uv)′ = u′ v + v ′ u, x ∈ (a, b).
(8)
Таким образом, u(x)v(x) — точная первообразная для своей производной на [a, b] и её представления (8). По (6’), b Zb ′ (u(x)v(x)) dx = u(b)v(b) − u(a)v(a) = (u(x)v(x)) . a
a
С другой стороны,
b Zb Zb ′ (u(x)v(x)) = (u(x)v(x)) dx = (u(x)v ′ (x) + u′ (x)v(x)) dx ⇔ (7) в силу свойства линейности интеграла. a
a
a
25
2.4.5. Замена переменной интегрирования в определённом интеграле Теорема. Пусть функция x = ω(t) ∈ C[α, β], α < β и имеет производную ω ′ (t) > 0 и ω ′ (t) ∈ R[α, β], так что образ ω([α, β]) = [a, b], a = ω(α), b = ω(β). Если функция f ∈ C[a, b], то Zb
f (x) dx =
a
Zβ α
(f (ω(t))) · ω ′ (t) dt.
(10)
Сложная функция f (ω(t)) ∈ C[α, β] как композиция непрерывных функций, следовательно, f (ω(t)) · ω ′ (t) интегрируема на [α, β] как произведение интегрируемых функций. Таким образом, оба интеграла из (10) определены. По (6’): Zb f (x) dx = Φ(b) − Φ(a), a
где Φ(x) — некоторая точная первообразная для функции f на [a, b], то есть Φ ∈ C[a, b] и Φ′ (x) = f (x), x ∈ (a, b). Сложная функция F (t) = Φ(ω(t)) ∈ C[α, β] как композиция непрерывных функций и F ′ (t) = Φ′ (x) · ω ′ (t) = f (x) · ω ′ (t) = f (ω(t)) · ω ′ (t), t ∈ (α, β), таким образом, F — точная первообразная для f (ω(t)) · ω ′ (t) на [α, β] и Zβ α
′
(f (ω(t))) · ω (t) dt = F (β) − F (α) = Φ(ω(β)) − Φ(ω(α)) = Φ(b) − Φ(a) =
Zb
f (x) dx.
a
2.4.6. Формула Тейлора с остаточным членом в интегральной форме Пусть f определена на невырожденном промежутке I и имеет в I производную (непрерывную) до порядка n + 1, n ∈ N включительно и x, a ∈ I; согласно (6’) f (x) − f (a) =
Zx a
′
f (t) dt = − ′
= − (f (t)(x −
Zx
f ′ (t)(x − t)′ dt =
a
x t))|a
+
Zx a
1 f (t)(x − t) dt = f (a)(x − a) − 2 ′′
′
Zx a
f ′′ (t)((x − t)2 )′ dt =
x Zx f ′ (a) 1 ′′ 1 2 = (x − a) + − f (t)(x − t) + f ′′′ (t)(x − t)2 dt = 1! 2 2! a a
=
f ′ (a) f ′′ (a) 1 (x − a) + (x − a)2 − 1! 2! 2·3 ′
′′
′
′′
f (a) f (a) = (x − a) + (x − a)2 + 1! 2! =
=
Zx a
f ′′′ (t)((x − t)3 )′ dt =
x Zx 1 ′′ 1 3 f (t)(x − t) + f (4) (t)(x − t)3 dt = 3! 3! a a
′′′
f (a) f (a) f (a) 1 (x − a) + (x − a)2 + (x − a)3 + 1! 2! 3! 3! f ′ (a) f ′′ (a) 1 (x − a) + (x − a)2 + · · · + 1! 2! n!
Zx
Zx a
f (4) (t)(x − t)3 dt =
f (n+1) (t)(x − t)n dt.
a
Итак,
Z n X 1 f (k) (a) (x − a)k + f (n+1) (t)(x − t)n dt. k! n! x
f (x) = f (a) +
k=1
a
26
Так как f (n+1) ∈ C(I), то по первой теореме о среднем значении Zx
1 rn (x, f, a) = n!
f
(n+1)
1 (t)(x − t) dt = f (n+1) (ζ) n! n
a
Zx
(x − t)n dt =
f (n+1) (ζ) (x − a)n+1 , (n + 1)!
a
где ζ = a + θ(x − a), 0 < θ < 1. 2.4.7. Вторая теорема о среднем значении Теорема. Если f ∈ R[a, b], g — монотонна на [a, b], то Zb
f (x)g(x) dx = g(a)
a
Zξ
f (x) dx + g(b)
a
Zb
(∗)
f (x) dx, ξ ∈ [a, b].
ξ
Так как g монотонна на [a, b], то g ∈ R[a, b] и, следовательно, существуют все три интеграла в (*). Дальнейшее доказательство проведём при дополнительных предположениях, что g ∈ D[a, b] и g ′ ∈ R[a, b], а функция f ∈ C[a, b]. Тогда, как известно, g ′ сохраняет знак на [a, b], а функция F (x), F (x) =
Zx a
f (t) dt, x ∈ [a, b], F (a) = 0,
непрерывна на [a, b] и F ′ (x) = f (x), x ∈ (a, b). По первой теореме о среднем значении для интеграла, Zb
′
F (x)g (x) dx = F (ξ)
a
Zb
′
g (x) dx = F (ξ)[g(b) − g(a)] = [g(b) − g(a)]
a
Zξ
(1)
f (t) dt.
a
На основании (1) и свойства аддитивности интеграла, имеем Zb a
f (x)g(x) dx =
Zb
′
g(x)F (x) dx =
b [g(x)F (x)]a
a
= g(b)F (b) − g(a)F (a) − (g(b) − g(a)) = g(a)
Zξ a
−
Zξ a
Zb
F (x)g ′ (x) dx =
a
f (x) dx = g(b) F (b) −
f (x) dx + g(b)
Zb a
f (x) dx −
Zξ a
Zξ a
f (x) dx + g(a)
f (x) dx = g(a)
Zξ a
Zξ
f (x) dx =
a
f (x) dx + g(b)
Zb
f (x) dx.
ξ
Доказательство общего случая не столь сложно, но оно не приводится по той причине, что рассмотренный случай — типичный в практических применениях. Употребительны также конкретные формы теоремы, называемые формулами Бонне. Формула 1. Если f ∈ R[a, b], g убывает и неотрицательна на [a, b], то Zb
f (x)g(x) dx = g(a)
a
Zξ
f (x) dx,
a
ξ ∈ [a, b].
Формула 2. Если f ∈ R[a, b], g возрастает и неотрицательна на [a, b], то Zb a
f (x)g(x) dx = g(b)
Zb ξ
27
f (x) dx,
ξ ∈ [a, b].
2.4.8. Формула суммирования Эйлера–Маклорена (слабая версия) Известно, что [x] удовлетворяет неравенствам [x] 6 x < [x] + 1, x ∈ R и x − [x] = {x}. Рассмотрим функцию ρ(x) = 12 − {x}, x ∈ R. Функция ρ(x) имеет разрывы только в x ∈ Z и ∀x ∈ / Z ∃ ρ′ (x) = −1. Если k ∈ Z, то lim ρ(x) =
x→k+0
1 2
lim ρ(x) = − 21 ,
x→k−0
= ρ(k), то есть функция ρ(x) непрерывна справа ∀k ∈ Z.
На произвольном [a, b], a < b рассмотрим произвольную функцию f и образуем F (x) ( по формуле F (x) = P x > a, f (k). Доопределим F (a) = 0, тогда F (x) определена для всех x ∈ [a, b]. Для всех справедx < [a] + 1 a
x→k+0
Для всех x ∈ (a, b) r Z существует F ′ (x) = 0. Теорема. Если функция f имеет f ′ ∈ R[a, b], то X
a
f (k) =
Zb a
f (x) dx + ρ(b)f (b) − ρ(a)f (a) −
Zb
ρ(x)f ′ (x) dx.
(1)
a
Рассмотрим функцию Φ(x) = F (x) − ρ(x)f (x), x ∈ [a, b]. Если x ∈ (a, b) r Z, то Φ′ (x) = F ′ (x) − ρ′ (x)f (x) − f (x)ρ(x) = f (x) − ρ(x)f ′ (x). И Φ′ не существует ∀x ∈ (a, b) ∩ Z, которые образуют конечное множество. Функция Φ(x) может иметь разрывы только в x ∈ [a, b] ∩ Z. Пусть k ∈ (a, b) ∩ Z. ′
1 lim Φ(x) = lim F (x) − lim ρ(x)f (x) = F (k − 1) + f (k); x→k−0 x→k−0 2
(2)
1 1 lim Φ(x) = lim F (x) − lim ρ(x)f (x) = F (k − 1) + f (k) − f (k) = F (k − 1) + f (k). x→k+0 x→k+0 2 2
(3)
x→k−0
x→k+0
1 lim Φ(x) = lim Φ(x) = F (k − 1) + f (k), x→k+0 2 1 1 Φ(x) = F (x) − ρ(x)f (x), Φ(k) = F (k) − ρ(k)f (k) = F (k − 1) + f (k) − f (k) = F (k − 1) + f (k). 2 2 Итак, lim Φ(x) = lim Φ(x) = Φ(k). Если b = k ∈ Z, то, согласно (2), функция Φ(x) непрерывна слева в x→k−0
x→k−0
x→k+0
точке b = k. Если a ∈ Z, то, по определению, F (x) = 0, x ∈ [a, [x] + 1], F (a) = 0. Таким образом, lim F (x) = 0 = F (a). x→a+0
lim Φ(x) = lim F (x) − lim ρ(x)f (x) = 0 − 12 f (a) = − 12 f (a) = Φ(a) x→a+0 x→a+0 x→a+0 Φ(a) = F (a) − ρ(a)f (a) = 0 − 12 f (a) = − 21 f (a) . Итак, Φ(x) непрерывна на [a, b] и Φ′ (x) = f (x) − ρ(x)f ′ (x) на [a, b] с конечным исключительным множеством. Согласно формуле Ньютона-Лейбница, Zb a
[f (x) − ρ(x)f ′ (x)] dx = Φ(b) − Φ(a) = F (b) − ρ(b)f (b) − F (a) + ρ(a)f (a) =
X
a
f (k) − ρ(b)f (b) + ρ(a)f (a) ⇔ (1)
согласно свойству линейности интеграла.
2.5. Функции ограниченной вариации 2.5.1. Определение и обозначение Рассмотрим произвольную функцию f на [a, b], произвольное разбиение T отрезка [a, b] точками a = x0 < x1 < · · · < xn = b и число n _ X |f (xk ) − f (xk−1 )| > 0. (f, T ) = k=1
Обозначим P0 — множество всех разбиений отрезка [a, b]. 28
Определение 1. Функция f называется функцией ограниченной вариации (изменения) на [a, b], если W ∃ sup { (f, T ) | T ∈ P0 } < +∞ и неограниченной вариации — в противном случае. b W W Число f = sup { (f, T ) | T ∈ P0 } называется полной вариацией функции f на [a, b]. a
2.5.2. Лемма 1
Лемма 2.6. Если функция f возрастает на [a, b], то она имеет ограниченную вариацию на [a, b] и
b W
f =
a
f (b) − f (a). Для любого разбиения T , a = x0 < x1 < · · · < xn = b справедливо
n n _ X X (f, T ) = |f (xk ) − f (xk−1 )| = (f (xk ) − f (xk−1 )) = f (x1 ) − f (x0 ) + f (x2 ) − f (x1 ) + · · · + f (xn ) − f (xn−1 ). k=1
k=1
b W W Итак, { (f, T ) | T ∈ P0 } = {f (b) − f (a)} и, следовательно, f = f (b) − f (a). a
2.5.3. Лемма 2
Лемма 2.7. Если функции f и g возрастают на [a, b], то их разность h = f − g имеет ограниченную вариацию на [a, b]. Для произвольного разбиения T : a = x0 < · · · < xn = b справедливо n n n _ X X X (h, T ) = |h(xk ) − h(xk−1 )| = |f (xk ) − g(xk ) − f (xk−1 ) + g(xk−1 )| 6 |f (xk ) − f (xk−1 )| + k=1
k=1
k=1
+
n X
k=1
b b _ _ _ _ |g(xk ) − g(xk−1 )| = (f, T ) + (g, T ) 6 f + g. a
a
b b b b b W W W W W W Таким образом, { (h; T ) | T ∈ P0 } ограничено сверху числом f + g, так что h 6 f + g. a
a
a
a
a
2.5.4. Лемма 3
Лемма 2.8. Если функция f имеет ограниченную вариацию на [a, b], то ∀c; a < c < b, функция f имеет c b W W ограниченную вариацию на [a, c] и f 6 f − |f (b) − f (c)|. a
a
Для любого T , a = x0 < · · · < xn−1 = c отрезка [a, c] рассмотрим разбиение Te отрезка [a, b], получающегося из T добавлением точки xn = b. Тогда n n−1 b _ X X _ _ (f, Te) = |f (xk ) − f (xk−1 )| = |f (xk ) − f (xk−1 )| + |f (xn ) − f (xn−1 )| = (f, T ) + |f (b) − f (c)| 6 f. k=1
a
k=1
b W W Таким образом, { (f, T ) | T ∈ P0 } ограничено сверху числом f − |f (b) − f (c)|, так что a
c _
f6
a
b _ a
f − |f (b) − f (c)| .
2.5.5. Леммы 4, 5 x W Согласно лемме 3, ∀x, a < x 6 b определена функция P (x) = f > 0. Положим P (a) = 0. a
Лемма 2.9. Функция P (x) возрастает на [a, b]. Рассмотрим произвольные a 6 x1 < x2 6 b. Согласно лемме 3, P (x1 ) =
x1 _ a
f6
x2 _ a
f − |f (x2 ) − f (x1 )| 6 29
x2 _ a
f = P (x2 ).
Лемма 2.10. Функция N (x) = P (x) − f (x) возрастает на [a, b]. Согласно леммам 3 и 4, N (x2 ) − N (x1 ) = P (x2 ) − P (x1 ) − [f (x2 ) − f (x1 )] > |f (x2 ) − f (x1 )| − [f (x2 ) − f (x1 )] > 0. 2.5.6. Основная теорема Теорема. Для того, чтобы функция f была ограниченной вариации на [a, b], необходимо и достаточно, чтобы f представлялась в виде разности возрастающих на [a, b] функций. Прямое следствие леммы 1 (достаточность) и лемм 4, 5. 2.5.7. Примеры Теорема. Всякая функция, удовлетворяющая условиям Липшица на отрезке, имеет на этом отрезке ограниченную вариацию. Пусть функция f определена на [a, b] и ∃ M > 0, что |f (x′ ) − f (x′′ )| 6 M |x′ − x′′ | ∀x′ , x′′ ∈ [a, b]. тогда ∀T , a = x0 < x1 < · · · < xn = b справедливо n n n _ X X X (f ; T ) = |f (xk ) − f (xk−1 )| 6 M |xk − xk−1 | = M (xk − xk−1 ) = M (b − a). k=1
k=1
k=1
2.6. Приложения определённого интеграла 2.6.1. Площадь криволинейной трапеции Рассмотрим f ∈ R[a, b], a < b и f (x) > 0, x ∈ [a, b]. На Π : Oxy фигура, ограниченная графиком Γf , y = f (x), Ox, x = a, x = b — криволинейная трапеция (подграфик f на [a, b]). Рассмотрим произвольное T [a, b] : a = x0 < · · · < xn = b и ∆k = [xk−1 , xk ], k = 1, n. Для любых k = 1, n ∃ mk = inf f и Mk = sup f : 0 < mk 6 Mk . Число mk · ∆xk равно площади Rk′ , где Rk′ — прямоугольник с ∆k
∆k
основанием ∆k , высотой mk , вписанным в подграфик функции f на ∆k . n S R′ (T ) = Rk′ — ступенчатая прямоугольная фигура, вписанная в подграфик f на [a, b]. k=1
Площадь R′ (T ) =
n P
mk ∆xk = s(f ; T ).
k=1
Аналогично, число Mk ∆xk равно площади Rk′′ — прямоугольника с основанием ∆xk и высотой Mk , которая описывает подграфик f на ∆k . n S R′′ (T ) = Rk′′ — ступенчатая прямоугольная фигура, описывающая подграфик f на [a, b]. k=1
Площадь R′′ (T ) =
n P
k=1
Mk · ∆xk = S(f ; T ).
Если T ′ получено из T добавлением конечного множества точек (условно, T ′ > T ), то, по свойству монотонности сумм Дарбу, s(f, T ′ ) > s(f, T ), а S(f, T ′ ) 6 S(f, T ). Так как f ∈ R[a, b], то для ∀ε > 0 ∃ Tε : S(f, T )−s(f, T ) < ε для всех T > Tε . По теореме Дарбу, lim s(f, T ) = lim S(f, T ) =
d(T )→0
d(T )→0
Zb
f (x) dx = I = площади подграфика Πf .
a
R(T ) = R′′ (T ) r R′ (T ), площадь R(T ) = площади R′′ (T ) − площадь R′ (T ) = S(f, T ) − s(f, T ) < ε. 2.6.2. Плоские кривые Определение 1. Плоская кривая Z — график функции, заданной параметрически t ∈ [α, β], α < β и ϕ(t) и ψ(t) ∈ C[α, β]. ∀t ∈ [α, β], соответственно, P (ϕ(t), ψ(t)) ∈ Z. 30
(
x = ϕ(t), y = ψ(t).
Точка P ∈ Z — двойная точка, если ∃ t1 , t2 ∈ [α, β], t1 6= t2 и ϕ(t1 ) = ϕ(t2 ) и ψ(t1 ) = ψ(t2 ).
Определение 2. Простая кривая (Жорданова) Z — если она не содержит двойных точек, за возможным исключением значений t = α и t = β. Если A(ϕ(α), ψ(α)) = B(ϕ(β), ψ(β)), то Z — замкнутая жорданова кривая (например — окружность). Иначе — незамкнутая. 2.6.3. Спрямляемые кривые ( x = ϕ(t), Рассмотрим жорданову кривую Z : t ∈ [α, β] и произвольное разбиение T [α, β] : α = t0 < · · · < y = ψ(t) tn = β. На Z заданы точки Pk = Pk (ϕ(tk ), ψ(tk )), k = 0, n, и отрезки [Pk−1 , Pk ], k = 1, n, образуем ломаную Λ(T ) = P0 P1 . . . Pk−1 Pk . . . Pn−1 Pn . Длина этой ломаной l(Λ(T )) =
n X
k=1
|Pk−1 Pk | =
n p X (ϕ(tk ) − ϕ(tk−1 ))2 + (ψ(tk ) − ψ(tk−1 ))2 .
(1)
k=1
Лемма 2.11. Если T ′ > T , то l(Λ(T ′ )) > l(Λ(T )). Утверждение достаточно проверить для случая, когда T ′ получено из T добавлением одной точки t′ ∈ (α, β). В этом случае ∃ k : 1 6 k 6 n и t′ ∈ (tk−1 , tk ), tk−1 < t′ < tk . Тогда, по (1), l(Λ(T ′ )) − l(Λ(T )) = |Pk−1 P ′ | + |P ′ Pk | − |Pk−1 Pk | , где P ′ = P ′ (ϕ(t′ ), ψ(t′ )). Но в ∆P ′ Pk−1 Pk справедливо: |P ′ Pk−1 | + |P ′ Pk | > |Pk−1 Pk | ⇒ l(Λ(T ′ )) > l(Λ(T )). Определение 3. Кривая Z — спрямляемая (имеющая длину), если числовое множество длин ломаных {l(Λ(T )) | T ∈ P0 } ограничено сверху (P0 — множество всех разбиений T отрезка [α, β]). sup {l(Λ(T )) | T ∈ P0 } = l(Z) — длина кривой Z. Утверждение 2.12. Если Z спрямляема, то её длина l(Z) = sup {l(Λ(T )) | ∀ T > T0 , ∃ T0 ∈ P0 }. Следствие леммы 1.1.
2.6.4. Критерий спрямляемости кривой ( x = ϕ(t) Теорема. (Жордана) Кривая Z, задаваемая t ∈ [α, β] спрямляема тогда и только тогда, когда y = ψ(t) ϕ, ψ имеют ограниченную вариацию на [α, β]. Необходимость. p p max(|a| , |b|) 6 a2 + b2 6 (|a| + |b|)2 = |a| + |b| , ∀ a, b ∈ R. (2) По (2) и (1),
max (|ϕ(tk ) − ϕ(tk−1 )| ; |ψ(tk ) − ψ(tk−1 )|) 6
q 2 2 (ϕ(tk ) − ϕ(tk−1 )) + (ψ(tk ) − ψ(tk−1 )) 6
6 |ϕ(tk ) − ϕ(tk−1 )| + |ψ(tk ) − ψ(tk−1 )| ,
k = 1, n
откуда n n _ _ X X max (ϕ, T ); (ψ, T ) = max |ϕ(tk ) − ϕ(tk−1 )| ; |ψ(tk ) − ψ(tk−1 )| k=1
6 l (Λ(T )) =
k=1
n X
k=1
|ϕ(tk ) − ϕ(tk−1 )| +
n X
k=1
!
6
|ψ(tk ) − ψ(tk−1 )| =
Если кривая Z спрямляема, то l (Λ(T )) 6 l(Z) для ∀T ∈ P0 и, следовательно, _ _ (ϕ; T ) 6 l(Z), (ψ, T ) 6 l(Z), ∀T ∈ P0 , 31
_ _ (ϕ; T ) + (ψ; T ). (3)
так что
β W
ϕ 6 l(Z),
α
β W
ψ 6 l(Z), то есть функции ϕ и ψ имеют ограниченную вариацию.
α
Достаточность. β β β β β β W W W W W W W W Если ϕ < +∞, ψ < +∞, то (ϕ, T ) 6 ϕ; (ψ, T ) 6 ψ и, согласно (3), l (Λ(T )) 6 ϕ + ψ для α
α
α
α
α
α
∀T ∈ P0 , то есть Z — спрямляема по определению 3.
2.6.5. Вычисление длины кривой Определение 4. Функция f , имеющая на [a, b] непрерывную производную f ′ , относится к классу C 1 [a, b]. Определение 5. Z — кривая класса C 1 , если её параметрические функции ϕ(t) и ψ(t) ∈ C 1 [α, β]. ( x = ϕ(t), Теорема. ∀Z : t ∈ [α, β] класса C 1 спрямляема и её длина y = ψ(t) Zβ p l(Z) = ϕ′2 (t) + ψ ′2 (t) dt.
(4)
α
1) Интеграл I в правой части (4) существует, так как ϕ′ , ψ ′ ∈ C[α, β]. Кроме того, ∃ M > 0 : |ϕ′ (t)| 6 M , |ψ (t)| 6 M, t ∈ [α, β]. По теореме Лагранжа, |ϕ(t1 ) − ϕ(t2 )| = |ϕ′ (ξ)| · |t1 − t2 | 6 M |t1 − t2 | и |ψ(t1 ) − ψ(t2 )| = |ψ ′ (ξ)| · |t1 − t2 | 6 M |t1 − t2 | ∀ t1 , t2 ∈ [α, β]. Так что ϕ и ψ принадлежат классу Липшица на [α, β] и, следовательно, имеют ограниченные вариации на [α, β]. По теореме Жордана, Z спрямляема, то есть ∃ l(Z). 2) Лемма 2.13. p p p (5) a2 + b2 − c2 + d2 6 (a − c)2 + (b − d)2 6 |a − c| + |b − d| ∀ a, b, c, d ∈ R. ′
√ √ 2 2 2 2 p На Π : Oxy рассмотрим точки A(a, b) и B(c, d). Тогда |OA| = a + b , |OB| = c + d и |AB| = 2 2 (a − c) + (b − d) . В ∆OAB : |AB| > ||OA| − |OB|| ⇔ (5) (с учётом (2)). Рассмотрим произвольное разбиение T [α, β] : α = t0 < · · · < tn = β; ∆k = [tk−1 , tk ], k = 1, n. Обозначим ak = inf |ϕ′ | , bk = inf |ψ ′ | , ck = sup |ϕ′ | и dk = sup |ψ ′ | , k = 1, n. ∆k
∆k
∆k
∆k
По теореме Лагранжа, |ϕ(tk ) − ϕ(tk−1 )| = |ϕ′ (ξk )| · |tk − tk−1 | = |ϕ′ (ξk )| ∆tk , |ψ(tk ) − ψ(tk−1 )| = |ψ ′ (ζk )| · ∆tk , k = 1, n. Тогда n q X 2 2 l(Λ(T )) = |ϕ′ (ξk )| + |ψ ′ (ζk )| · ∆tk . (6) k=1
′
′
p Так как ak 6 |ϕ (t)| 6 ck и bk 6 |ψ (t)| 6 dk , ∀ t ∈ [tk−1 , tk ] = ∆k , k = 1, n, то c2k + d2k , для всех t ∈ ∆k и всех k = 1, n. Интегрируя по ∆k , получим
p p a2k + b2k 6 ϕ′2 (t) + ψ ′2 (t) 6
Ztk p q q 2 2 ak + bk ∆tk 6 ϕ′2 (t) + ψ ′2 (t) dt 6 c2k + d2k · ∆tk , k = 1, n.
(7)
tk−1
Суммируя (7) по k = 1, n, получим: Zβ p n q n Ztk p n q X X X 2 2 ′2 ′2 ak + bk ∆tk 6 ϕ (t) + ψ (t) dt = ϕ′2 (t) + ψ ′2 (t) dt = I 6 c2k + d2k ∆tk . k=1
k=1t k−1
(8)
k=1
α
На основании (6) и (8), используя оценку (5), получим n n q n n X q X X X 2 2 2 2 |l(Λ(T )) − I| = ck + dk · ∆tk − ak + bk · ∆tk 6 (ck − ak ) · ∆tk + (dk − bk )∆tk = k=1
k=1
k=1
k=1
= S(|ϕ′ | ; T ) − s(|ϕ′ | ; T ) + S(|ψ ′ | ; T ) − s(|ψ ′ | ; T ). (9)
32
Так как |ϕ′ | , |ψ ′ | ∈ R[a, b], то для ∀ ε > 0 ∃Tε ∈ P0 , что правая часть в (9) < ε для T = Tε (по третьему критерию интегрируемости) и она, тем более, < ε для всех разбиений T > Tε (по свойству монотонности сумм Дарбу). Итак, I − ε < l(Λ(T )) < I + ε, ∀ T > Tε . (10) Переходя в (10) к точной верхней грани sup {l(Λ(T )) | T > Tε } = l(Z) по утверждению 2.12, получим: I − ε < l(Z) 6 I + ε и I = l(Z) в силу произвольности ε > 0. Если Z — график f ∈ C 1 [a, b], то её параметрические функции x = t, y = f (t), C 1 [a, b], так pt ∈ [a, b] из класса p ′ ′ ′ ′2 ′2 что Z — спрямляемая кривая. Вычислим её длину. Так как xt = 1; yt = f (t) и xt + yt = 1 + f ′2 (t), то, по формуле (4), длина l(Z) Zb q Zb p Zb p ′2 ′2 ′2 l(Z) = xt + yt dt = 1 + f (t) dt = 1 + f ′2 (x) dx. a
a
(4′ )
a
2.6.6. Свойство аддитивности спрямляемых кривых ( x = ϕ(t), Теорема. Если кривая Z = t ∈ [α, β] спрямляема, то для любого γ, α < γ < β, кривые y = ψ(t) Zi , (i = 1, 2) с теми же параметрическими функциями, но на [α, γ] и [γ, β], соответственно — спрямляемы и ( x = ϕ1 (t), l(Z1 ) + l(Z2 ) = l(Z). Обратно, если кривые Zi , (i = 1, 2), заданные параметрически , t ∈ [α1 , β1 ] и y = ψ1 (t) ( x = ϕ2 (t), t ∈ [α2 , β2 ] спрямляемы и ϕ1 (β1 ) = ϕ2 (α2 ); ψ1 (β1 ) = ψ2 (α2 ), то Z1 ∪ Z2 = Z есть спрямляемая y = ψ2 (t) кривая Z и l(Z) = l1 (Z1 ) + l2 (Z2 ). При дополнительном предположении кривых класса C 1 , утверждение теоремы, с учётом (4), есть прямое следствие свойства аддитивности определённого интеграла (хотя утверждение теоремы справедливо и без дополнительного предположения).
3. Обобщение интеграла Римана 3.1. Несобственные интегралы 3.1.1. Интегралы по промежутку [a, b) Рассмотрим функцию f , определённую на [a, b), −∞ < a < b 6 +∞ и f ∈ R[a, b] для ∀ t : a < t < b, так что на [a, b) определена непрерывная функция Ff (t) =
Zt a
f (x) dx, t ∈ [a, b), Ff (a) = 0.
(1)
Условимся символом t → b− обозначать как базу t → b − 0 , если b — число, так и базу t → +∞ , если b = +∞. Определение 1. Если ∃ lim Ff (t) = I, то число I называют несобственным интегралом по промежутку t→b−
[a, b).
Обозначение: I =
b− R
f (x) dx. Говорят, что при этом интеграл сходится, а f интегрируема на [a, b). Если
a
Ff (t) не имеет lim , то будем говорить, что интеграл t→b−
b− R
f (x) dx расходится.
a
Теорема 3.1. Если в условии определения 1 b — число, а f ограничена на [a, b), то f будет интегрируема на промежутке [a, b) (в смысле определения 1) ⇔ f интегрируема по Риману на [a, b] (f ∈ R[a, b]), какое бы значение не придать f (b). При этом Zb− Zb f (x) dx = f (x) dx, (∗) a
a
33
где
Rb
f (x) dx — интеграл Римана f на [a, b].
a
(⇐) Придадим произвольное значение f (b). По условию, f ∈ R[a, b] и
Rb
f (x) dx не зависит от выбора
a
значения f (b). Функция Ff (t), определяемая (1), в этом случае непрерывна на [a, b] и, в частности, в x = b, Rb так что ∃ lim Ff (t) = Ff (b) = f (x) dx. Таким образом, справедливо определение 1, то есть lim Ff (t) = I и t→b−0
t→b−0
a
I = Ff (b).
(⇒) По условию, ∃
b− R a
f (x) dx = lim Ff (t), где Ff (t) определено (1) и f — ограничена на [a, b] и ∃ M > 0, t→b−0
что |f (x)| 6 M, x ∈ [a, b], так что ω = ω(f ; [a, b]) =
sup x1 ,x2 ∈[a,b]
|f (x1 ) − f (x2 )| 6
sup x1 ,x2 ∈[a,b]
|f (x1 )| + |f (x2 )| 6 2M .
Свойство f ∈ R[a, b] проверим на основании третьего критерия интегрируемости. Рассмотрим ε > ε выберем точку c, a < c < b такую, что b − c < 4M . Функция, по условию, интегрируема на [a, c] и ε > 0 существует такое разбиение T1 : [a, c] отрезками ∆k = [xk−1 , xk ], k = 1, n − 1, a = x0 , c = xn−1 , n−1 P S(f ; T1 ) − s(f ; T1 ) = ω(f ; ∆k )∆xk < 2ε . Добавляя точку b = xn к T1 , получим разбиение T отрезка [a, b],
0 и для что для
k=1
которого
S(f ; T ) − s(f ; T ) =
n−1 X k=1
ω(f ; ∆k )∆xk + (b − c)ω(f ; [c, b]) <
ε ε ε ε + (b − c)ω 6 + (b − c) · 2M < + = ε. 2 2 2 2
Итак, f ∈ R[a, b] по третьему критерию интегрируемости, следовательно, Ff (t), определённая (1), непрерывна b− Rb R f (x) dx, так что на [a, b] и, в частности, lim Ff (t) = F (b) = f (x) dx. С другой стороны, lim Ff (t) = t→b−0
t→b−0
a
a
справедливо (*). Таким образом, определение 1 вводит новые объекты лишь если b — число, а f — неограничена на [a, b), b− R либо если b = +∞. В этих случаях f (x) dx — несобственный интеграл, в отличие от интегралов в прежних a
случаях — собственных. Если b — число, то вместо
b− R
f (x) dx принято обозначать
a
b− R a
f (x) dx =
+∞ R
f (x) dx.
Rb
f (x) dx, если b = +∞, то
a
a
Пример 1.1. f (x) =
1 xs ,
на [a, +∞), a > 0. Если s 6= 1, то Ff (t) =
Zt
dx = xs
a
и
x−s+1 −s + 1
Если s = 1, то Ff (t) =
Rt a
dx x
1 , s > 1, s−1 (s − 1)a lim Ff (t) = t→+∞ + ∞, s < 1.
= ln t − ln a lim Ff (t) = +∞.
Таким образом, несобственный При этом, если s > 1, то
+∞ R a
dx xs
t −s+1 a−s+1 = t − −s + 1 −s + 1 a
=
t→+∞ +∞ R dx интеграл xs , a
1 (s−1)as−1 ,
где a > 0, сходится при всех s > 1 и расходится при ∀ s 6 1.
в частности,
+∞ R 1
dx xs
=
1 s−1 .
3.1.2. Интегралы по промежуткам (a, b] и [a, b) Рассмотрим функцию f , определённую на (a, b], −∞ 6 a < b < +∞, и f ∈ R[t, b] для любого t : a < t < b, так что на (a, b] справедлива непрерывность Φf (t) : Φf (t) =
Zb t
f (x) dx, t ∈ (a, b], Φf (b) = 0. 34
(2)
Определение 2. Если ∃ lim Φf (t) = I, то I — интеграл f по (a, b]. t→a+
Обозначение:
Rb
f (x) dx. Интеграл сходится, а f — интегрируема на (a, b].
a+
Rb
Если Φf (t) не имеет lim , то t→a+
f (x) dx — расходится.
a+
Как и в предыдущем пункте, убеждаемся, что определение 2 вводит новые объекты лишь если a — число, Rb f — неограничена на (a, b] или если a = −∞. В этих случаях f (x) dx — несобственный и обозначается a+
Rb
Rb
f (x) dx =
a+
f (x) dx (a — число) и
−∞
a
Пример 1.2. f (x) = Если
1 xs
Rb
f (x) dx (a = −∞).
на (0, a], где a > 0 — число.
Φf (t) =
Za t
( +∞, s > 1, lim Φf (t) = a1−s t→0+0 1−s , s < 1.
dx a−s+1 t−s+1 = − и s x −s + 1 −s + 1
Таким образом, несобственный интеграл
Ra 0
dx xs ,
a > 0 — число, сходящийся при s < 1 и расходящийся при
s > 1. Интегралы в примерах 1 и 2 — стандартные интегралы. При этом
Ra 0
R1 0
dx xs
=
1 1−s .
dx xs
=
a1−s 1−s ,
s < 1, в частности,
Пусть теперь функция f задана на промежутке (a, b), −∞ 6 a < b 6 +∞ и f интегрируема на каждом отрезке, лежащем в (a, b). Rc Rb Утверждение 3.2. Если несобственные интегралы f (x) dx и f (x) dx сходятся для какого-либо c : a < a
c
c < b, то они сходятся для всех c : a < c < b, причём их сумма Zc
f (x) dx +
a
Zb
(3)
f (x) dx
c
не зависит от выбора c. Для произвольного c′ : a < c′ < b имеем (согласно определениям 1 и 2 и условию) Zc′
f (x) dx = ′lim
t →a+
a
Zc′ t′
c Z Zc′ Zc Zc′ f (x) dx = ′lim f (x) dx + f (x) dx = f (x) dx + f (x) dx, t →a+
c
t′
a
(4)
c
так как, по условию, существует предел на t → a+ первого интеграла в скобках формулы (4), а второй интеграл — постоянная функция на базе t′ → a+. Аналогично, ′′
Zt
c′
··· =
Zc
′′
··· +
c′
Zt
... и
c
Zb
c′
′′
= ′′lim
t →b−
Zt
c′
c ′′ Zt Zc Zb Z · · · = ′′lim + = + t →b−
⇒
Zc′
c
c′
··· +
a
Zb
c′
c
c′
=
Zc a
+
Zc′ c
+
Zc
c′
⇒
···+
Zb c
=
Zc a
f (x) dx +
Zb
f (x) dx.
(5)
c
Определение 3. Пусть −∞ 6 a < b 6 +∞ и f определена на (a, b) и интегрируема на каждом отрезке из Rc Rb (a, b). Если интегралы f (x) dx и f (x) dx сходятся для некоторого c : a < c < b, то сумма (3) (по доказанному, a
c
независимая от c) — интеграл f по (a, b). Rb Обозначение: f (x) dx. Говорят, что интеграл сходится и f интегрируема на (a, b). В противном случае a
— интеграл расходится.
35
Таким образом, по определению, Zb
f (x) dx =
a
если интегралы
Rc
Rb
f (x) dx,
a
Zc
f (x) dx +
a
Zb
(6)
f (x) dx,
c
f (x) dx сходятся (a < c < b). Формула (6) определяет свойство аддитивности
c
несобственных интегралов по промежутку (a, b). Аналогичная формула справедлива и для [a, b) и (a, b]. При этом один из интегралов в правой части (6) — интеграл Римана, а другой — несобственный. R∞ dx Пример. Вычислим 1+x2 . По свойству аддитивности, −∞
+∞ Z
−∞
dx = 1 + x2
Z0
−∞
dx + 1 + x2
+∞ Z 0
dx = ′ lim t →−∞ 1 + x2
Z0 t′
′′
dx + lim 1 + x2 t′′ →+∞
Zt
dx = 1 + x2
0
= ′ lim [− arctg t′ ] + t →−∞
π π + = π. lim [arctg t′′ ] = − − 2 2
t′′ →+∞
3.1.3. Критерий Коши сходимости несобственного интеграла Теорема. Несобственный интеграл
Rb a
f (x) dx по промежутку [a, b) (по (a, b]) сходится ⇔ для любого ε > 0
можно указать bε , a < bε < b (aε : a < aε < b), что неравенство t Z 2 f (x) dx < ε
(1)
t1
справедливо для любых ti , bε < ti < b, i = 1, 2 (для любых ti , a < ti < aε , i = 1, 2). Пусть a < t1 < t2 < b. По свойству аддитивности определённого интеграла, Zt2
f (x) dx =
t1
Zt2 a
f (x) dx −
Zt1 a
f (x) dx = Ff (t2 ) − Ff (t1 ) (= Φf (t1 ) − Φf (t2 )) ,
где Ff и Φf определены посредством формул (1) (пункт 1.1) и (2) (пункт 1.2), следовательно, неравенство (1) ⇔ |Ff (t2 ) − Ff (t1 )| < ε для любых ti : bε < ti < b, i = 1, 2 (|Φf (t2 ) − Φf (t1 )|< ε, ∀ti : a < ti < aε , i = 1, 2),
что, в свою очередь, есть критерий Коши существования lim Ff (t) t→b−
несобственного интеграла
Rb
lim Φf (t) , что равносильно исходимости
t→a+
f (x) dx.
a
3.1.4. Остаток несобственного интеграла
Пусть f интегрируема по [a, b) (по (a, b]), то есть сходится несобственный интеграл
f (x) dx =
a
или же
где rf (t) =
Rb t
f (x) dx rf (t) =
Zb a
Rt a
f (x) dx =
Zt a
Zb t
|
f (x) dx. По свойству
a
аддитивности, для любого t : a < t < b, справедливо Zb
Rb
f (x) dx + {z
=Ff (t)
f (x) dx +
Zt a
}
Zb t
|
f (x) dx, {z
=rf (t)
(2)
}
f (x) dx = Φf (t) + rf (t),
(2′ )
f (x) dx — несобственный интеграл с особенностью в x = b− (x = a+) и для
любого t : a < t < b остаток rf (t) сходится.
36
Так как lim Ff (t) = t→b−
Rb
f (x) dx
a
lim Φf (t) =
t→a+
Rb
!
f (x) dx , то, на основании (2) ((2′ )),
a
lim rf (t) = 0
t→b−
(3 (3′ ))
lim rf (t) = 0 .
t→a+
Обратно, пусть f определена на [a, b) (на (a, b]), f ∈ R[a, t] (f ∈ R[t, b]) для любого t : a < t < b справедливо (3)((3’)), так что, в частности, несобственные интегралы rf (t) сходятся для некоторого t, a < t < b. Тогда, согласно утверждению 3.2, суммы в правых частях формул (2) и (2’) существуют и не зависят от выбора t, a < t < b. Это означает сходимость несобственных интегралов в левых частях формул (2) и (2’). Таким образом, доказана следующая теорема. Rb Теорема. Несобственный интеграл f (x) dx по [a, b) ((a, b]) сходится ⇔ lim rf (t) = 0 lim rf (t) = 0 . t→a+
t→b−
a
3.2. Основные свойства несобственных интегралов 3.2.1. Свойства, аналогичные свойствам определённого интеграла Теорема 1. Пусть f, g интегрируемы по промежутку [a, b). Тогда: Rb Rb 1) для любого k ∈ R функция kf интегрируема по [a, b) и kf (x) dx = k f (x) dx; a
2) (f + g) интегрируема по [a, b) и
Rb
(f + g) dx =
a
3) если f (x) > g(x), x ∈ [a, b), то 4) f (x) > 0, x ∈ [a, b) ⇒ Rb
a Rb
Rb
Rb
Rb
f (x) dx +
a
f (x) dx >
a
Rb
a
Rb
g(x) dx;
a
g(x) dx;
a
f (x) dx > 0.
a
1) Так как Fkf (t) = kFf (t), a < t < b (по свойству линейности определённого интеграла) и ∃ lim Ff (t) = t→b− Rb
f (x) dx, то, по свойству линейности предела функции по базе, ∃ lim Fkf (t) = k lim Ff (t) = k t→b−
t→b−
kf (x) dx.
f (x) dx =
a
a
2) Так как Ff +g (t) = Ff (t) + Fg (t), a < t < b и lim Ff (t) = t→b−
t→b−
f (x) dx, lim Fg (t) = t→b−
a
∃ lim Ff +g (t) = lim Ff (t) + lim Fg (t) = t→b−
Rb
t→b−
Zb
f (x) dx +
a
3) Так как для любого t, a < t < b, Fg (t) =
Rt
f (x) dx >
a
свойством монотонности, то
Rb
Rb
Rt
t→b− a
a
g(x) dx, то
a
Zb
(f + g) dx.
a
g(x) dx = Fg (t) и предел функции по базе обладает
a
t→b−
f (x) dx = lim
g(x) dx =
a
f (x) dx = lim Ff (t) > lim Fg (t) =
a
4) По пункту 3),
Rt
Zb
Rb
f (x) dx > lim
t→b− Rt
Rb
g(x) dx.
a
0 dx = lim 0 = 0.
t→b− a
t→b−
3.2.2. Теорема о существовании и оценке модуля несобственного интеграла Теорема 2. (Критерий существования несобственного интеграла от положительной функции). Если f ∈ R[a, t), для любого a < t < b и f (x) > 0, x ∈ [a, b), то f интегрируема по [a, b) (то есть сходится несобственный Rt Rb интеграл f (x) dx) ⇔ Ff (t) = f (x) dx ограничен сверху на [a, b). a
a
По свойству определённых интегралов, 0 6
Rt a
справедливо Ff (t2 ) =
Zt2 a
f (x) dx =
Zt1 a
f (x) dx +
f (x) dx = Ff (t), ∀t : a < t < b. Для ∀a < t1 < t2 < b
Zt2
t1
37
f (x) dx >
Zt1 a
f (x) dx = F (t1 ) > 0,
то есть Ff (t) ↑ на [a, b). По свойству монотонности функций, lim Ff (t) существует ⇔ Ff (t) ограничена сверху t→b−
на [a, b). Следовательно,
Rb a
f (x) dx = lim Ff (t) сходится ⇔ Ff (t) ограничена сверху на [a, b). t→b−
Теорема 3. (Признак существования несобственного интеграла от положительной функции). Если f, g ∈ Rb R[a, t] для ∀t : a < t < b и 0 6 f (x) 6 g(x), x ∈ [a, b), то из сходимости несобственного интеграла g(x) dx a
следует сходимость несобственного интеграла
Rb
f (x) dx (и, следовательно, из расходимости несобственного
a
интеграла
Rb
Rb
f (x) dx следует расходимость
a
g(x) dx).
a
Пусть сходится
Так как 0 6 Ff (t) =
Rb
a Rt
g(x) dx = lim Fg (t) = lim f (x) dx 6
a
t→ Rt a
Rt
g(x) dx.
a
g(x) dx = Fg (t), ∀ t : a < t < b, и, по теореме 2, Fg (t) ограничена сверху на
[a, b) то, следовательно, Ff (t) ограничена сверху на [a, b) и, по теореме 2, сходится
Rb
f (x) dx.
a
Замечание. Утверждение теоремы 3 остаётся справедливым, если 0 6 f (x) 6 g(x) справедливо на некотором Rb [c, b) a < c < b. Действительно, в этом случае сходится интеграл f (x) dx, являющийся остатком несобственного c
интеграла
Rb
f (x) dx и, следовательно,
a
Rb
f (x) dx сходится.
a
2
Пример. Так как e−x 6 e−x ∀x > 1,
+∞ R
e−x dx = lim
t→+∞ a
a
a ∈ R, то, по теореме 3, собственный интеграл
Rt
+∞ R a
2
e−x dx = lim [−e−t + e−a ] = e−a для любого t→+∞
e−x dx сходится при любом a ∈ R.
+∞ Z 2 e−x dx — интеграл Эйлера–Пуассона (значение которого мы вычислим в третьем семестре). 0
Rb Теорема 4. Если f ∈ R[a, t], ∀ t : a < t < b и сходится несобственный интеграл |f (x)| dx по промежутку a Rb Rb Rb [a, b), то сходится несобственный интеграл f (x) dx и справедливо: f (x) dx 6 |f (x)| dx. a a a
6 |f | , 0 6 h = |f |−f 6 |f | на [a, b), тогда f, |f | , g, h ∈ R[a, t] для 2 Rb ∀ a < t < b. Так как сходится несобственный интеграл |f (x)| dx, то, по теореме 3, сходятся несобственные
Рассмотрим функции 0 6 g =
|f |+f 2
a
интегралы
Rb
g(x) dx,
a
Rb a
h(x) dx. Так как f = g − h, то, по теореме 1,
f (x) dx =
a
Rb a
g(x) dx −
Rb
h(x) dx — сходится.
a
Учитывая теорему 1, 4) и равенство |f | = g + h, имеем: b b b Z Z Z Zb Zb Zb f (x) dx 6 g(x) dx + h(x) dx = g(x) dx + h(x) dx = |f (x)| dx. a
Rb
a
a
Определение. Несобственный интеграл
Rb
a
a
a
f (x) dx называют абсолютно сходящимся, если сходится
a
Rb a
|f (x)| dx.
Следствие. (К теореме 4). Всякий абсолютно сходящийся несобственный интеграл сходится. +∞ +∞ R sin kx R cos kx Пример. Несобственные интегралы dx, s x xs dx, где a > 0 — постоянная, абсолютно сходятся
для s > 1 и ∀ k 6= 0 ∈ R.
a
a
38
sin kx s 6
x
1 xs ,
cos kx s 6 x
По теореме 3, сходятся
1 xs ,
+∞ R
∀x > a и
|sin kx| xs
a
dx,
+∞ R a
+∞ R a
dx xs
сходится для любого s > 1.
|cos kx| xs
dx, s > 1.
Утверждения, аналогичные данным, остаются справедливыми для (a, b] и [a, b) с аналогичными доказательствами.
3.3. Интегрирование по частям и подстановкой в несобственном интеграле 3.3.1. Интегрирование по частям Теорема. Если f, u, v принадлежат классу C 1 на [a, b), где −∞ < a < b 6 +∞, произведение u(x)v(x) Rb Rb имеет предел lim u(x)v(x), и сходится интеграл v(x)u′ (x) dx, то сходится другой интеграл u(x)v ′ (x) dx x→b−
a
и справедлива формула:
Zb
′
u(x)v (x) dx =
a
b− [u(x)v(x)]a
a
−
Zb
u′ (x)v(x),
(1)
a
b−
где [u(x)v(x)]a = lim u(x)v(x) − u(a)v(a). x→b−
В силу условий теоремы, для произвольного t : a < t < b, на [a, t] справедлива формула интегрирования по частям в определённом интеграле (в слабой форме): Zt a
Rt
Так как существует lim
t→b− a
′
u(x)v (x) dx = u(t)v(t) − u(a)v(a) −
v(x)u′ (x) dx =
Rb
Zt
v(x)u′ (x) dx.
(2)
a
v(x)u′ (x) dx, то остаётся перейти к lim в (2) и воспользоваться t→b−
a
свойством линейности предела функции по базе. +∞ +∞ R cos kx R sin kx Пример. xs dx, xs dx, a > 0, k 6= 0 — фиксированы, сходятся (но не абсолютно) для любого a
a
s : 0 < s 6 1. Применяя формально формулу (1), получим для второго интеграла: +∞ Z
cos kx dx = xs
a
+∞ Z a
1 xs
sin kx k
′
sin kx sin ka s dx = lim − + x→+∞ kxs kas k
Z
sin kx sin ka s dx = − + xs+1 kas k
+∞ Z
sin kx dx. xs+1
a
Так как s + 1 > 1, то последний интеграл сходится (абсолютно), так что, по предыдущей теореме, сходится и исходный интеграл. Покажем, что он не сходится абсолютно при 0 < s 6 1. Если бы это было так, то есть сходился бы +∞ +∞ +∞ +∞ R |cos kx| R cos2 kx R 1+cos 2kx R cos 2kx 2 dx, то, поскольку |cos kx| > cos kx > 0, сходился бы dx = dx. Так как s s s x x 2x 2xs dx a
a
сходится, по доказанному, то сходился бы интеграл
+∞ R a
dx 2xs ,
a
a
но последний расходится для s 6 1 ⇒ противоречие.
Определение. Несобственный интеграл называют сходящимся условно, если он сходится, но не сходится абсолютно. +∞ R sin kx Пример. Интеграл Дирихле dx сходится условно. x 0
Этот интеграл рассматривается на промежутке (0; +∞). Поэтому, по определению, +∞ Z
sin kx dx = x
0
Функция
sin kx x
sin kx dx + x
0
— непрерывна на (0, 1] и имеет
поэтому, по теореме пункта 1.1, интеграл
Z1
R1 0
sin x x
+∞ Z
sin kx dx. x
(3)
1
lim sinxkx x→0+
= k < +∞, следовательно, она ограничена на (0, 1],
dx сходится.
39
Второй интеграл в правой части (3) — сходящийся условно, так как s = 1 (по предыдущему примеру), +∞ R sin kx π dx = sgn k . следовательно, сходится условно интеграл Дирихле материал третьего семестра: x 2 0
3.3.2. Интегрируемость заменой переменной интегрирования или подстановкой в несобственном интеграле Теорема. Пусть f непрерывна на [a, b), −∞ < a < b 6 +∞, а ϕ ∈ C 1 [α, β), −∞ < α < β 6 +∞, строго возрастает на [α, β) и ϕ(α) = a; ϕ(β−) = b; то есть lim ϕ(τ ) = ϕ(β−) = b. Если сходится интеграл Rβ
f (ϕ(τ ))ϕ′ (τ )dτ , то сходится
α
Rb
f (x) dx и справедливо:
a
Rb
τ →β−
f (x) dx =
a
Rβ
f (ϕ(τ ))ϕ′ (τ )dτ .
α
По условию, образ ϕ([α, β)) = [a, b) и на [α, β) ϕ удовлетворяет условию теоремы о существовании и дифференцируемости обратной функции, по которой на [a, b) существует ϕ−1 = ψ, возрастающая на [a, b), ψ([a, b)) = [α, β); ψ(a) = α, ϕ(b−) = β, то есть lim ψ(x) = β. x→b−
Поэтому, для произвольного t : a < t < b, на [a, t] справедлива теорема о замене переменной в определённом интеграле, по которой ψ(t) Z Zt f (x) dx = f (ϕ(τ ))ϕ′ (τ )dτ. (5) a
α
Так как lim ψ(t) = β и интеграл в правой части (4) сходится, то t→b−
lim
t→b−
ψ(t) Z
′
f (ϕ(τ ))ϕ (τ )dτ =
a
и, по (5), существует lim
Rt
t→b− a
Zβ
f (ϕ(τ ))ϕ′ (τ )dτ,
α
f (x) dx и справедливо (4).
Пример. Интегралы Френеля
+∞ R 0
sin(x2 ) dx,
+∞ R
cos(x2 ) dx сходятся условно.
0
+∞ +∞ Z Z1 Z 2 2 sin(x ) dx = sin(x ) dx + sin(x2 ) dx. 0
0
(6)
1
2
Так как sin(x ) непрерывна на [0, 1], то первый интеграл — интеграл Римана. +∞ R R 1 √ t dt — сходится условно (s = 1 ; k = 1). dt ⇒ sin(x2 ) dx = 12 sin Во втором интеграле: x2 = t, dx = 2√ 2 t t 1
Аналогично для
+∞ R
2
cos(x ) dx.
0
3.4. Признак сходимости несобственного интеграла. Приложения 3.4.1. Признак сходимости Теорема. Если f определена и ограничена на [a, +∞), a > 0, и на каждом отрезке [a, t], t > a имеет +∞ Rt R f (x) только конечное множество точек разрыва, а F (t) = f (x) dx ограничена на [a, +∞), то xα dx сходится a
a
при всех α > 0. По условию, ∃ M > 0 : |F (t)| 6 M ∀ t ∈ [a; +∞), и также F (a) = 0. Кроме того, для любого t > a на [a, t] справедлива теорема об интегрировании по частям в определённом интеграле в полной своей формулировке, согласно которой Zt a
t Zt Zt Zt 1 F (x) 1 F (t) F (a) F (x) F (t) F (x) f (x) dx = + α F (x) α+1 dx = α − α + α dx = α + α dx. α α α+1 x x x t a x t xα+1 a a
a
(F ′ (x) = f (x); x ∈ (a, t)) . 40
a
(7)
+∞ R F (x) F (x) M = 0 (α > 0, |F (t)| 6 M, t > a) и dx сходится абсолютно (поскольку 6 xα+1 α+1 α+1 x x a +∞ +∞ R F (x) R F (x) F (t) при x > a и α + 1 > 1), то существует lim tα + α xα+1 dx = α xα+1 dx, и, по (7), сходится изучаемый F (t) α t→+∞ t
Так как lim
t→+∞
a
несобственный интеграл.
a
3.4.2. Неполная формула Стирлинга 1
Теорема. Существует число c > 0 : n! = cnn+ 2 · e−n [1 + o(1)] , n → ∞. Применим формулу Эйлера–Маклорена к f (x) = ln x, x ∈ [1, n], n ∈ N: ln(n!) =
n X
ln k =
k=1
Zn 1
Rn 1
1 x ρ(x) dx.
1 ρ(x) dx = x
x]n1
1 + ln n − 2
ln x dx + ρ(n) ln n − ρ(1) ln 1 − = [x ln x −
где an =
Zn 1
Zn 1
1 1 ρ(x) dx = n ln n + ln n − n + 1 − an , (8) x 2
Потенцируя, получим: 1
n! = nn+ 2 e−n e1−an .
(9)
Покажем, что ∃ lim an = a. Для этого проверим, что сходится несобственный интеграл Рассмотрим µ(t) = ρ(x) =
1 2
− {x} =
1 2
n→∞ Rt
+∞ R 1
1 x ρ(x) dx
= a.
ρ(x) dx. ρ(x) имеет лишь конечное множество точек разрыва на [1, n] и ограничена на [0; 1),
0
− x, x ∈ [0, 1), следовательно, для t : 0 6 t 6 1, µ(t) =
Zt 0
и µ имеет период T = 1.
t 1 1 1 2 1 1 − x dx = x − x = t − t2 , t ∈ [0, 1] 2 2 2 2 2 0
По теореме предыдущего пункта, сходится
+∞ R 1
1 x ρ(x) dx
= a и a = lim an по определению. Итак, ∃ lim e1−an n→∞
n→∞
и e1−an = c [1 + o(1)] , n → ∞, c > 0. Следовательно, (8) доказана.
3.5. Интеграл Стилтьеса 3.5.1. Интегральные суммы Стилтьеса Рассмотрим функции f и g, определённые на [a, b] и произвольное размеченное разбиение Tζ отрезка [a, b] на ∆k = [xk−1 , xk ], |∆k | = ∆xk , k = 1, n, a = x0 , xn = b и набор ζ = {ζ1 , . . . , ζn } , ζk ∈ ∆k , k = 1, n. n P Числа σ(f ; g; Tζ ) = f (ζk ) [g(xk ) − g(xk−1 )] — интегральные суммы f по g, отвечающие размеченk=1
ному разбиению Tζ . Обозначим P — множество всех размеченных разбиений Tζ [a, b] : T : a = x0 < x1 < · · · < xn = b и набор ζ = {ζ1 , . . . , ζn } , ζk ∈ ∆k , k = 1, n, ∆k = [xk−1 ; xk ]. Для f и g, определённых на [a, b], рассмотрим функцию (отображение) Ψgf : P → R, определяемую формулой: Ψgf (Tζ ) = σ(f ; g; Tζ ) =
n X
k=1
f (ζk ) [g(xk ) − g(xk−1 )] , ∀Tζ ∈ P.
(1)
Функция Ψgf обладает свойствами: Предложение 3.3. Для произвольных f1 , f2 , g, определённых на [a, b] и произвольных чисел λ1 , λ2 ∈ R справедливо Ψgλ1 f1 +λ2 f2 = λ1 Ψgf1 + λ2 Ψgf2 .
41
Все Ψ определены на P. Для ∀ Tζ ∈ P, по (1), справедливо:
Ψgλ1 f1 +λ2 f2 (Tζ ) = σ(λ1 f1 + λ2 f2 ; g; Tζ ) =
n X
k=1
= λ1
n X
k=1
f1 (ζk ) [g(xk ) − g(xk−1 )]+λ2
n X
k=1
(λ1 f1 (ζk ) + λ2 f2 (ζk )) [g(xk ) − g(xk−1 )] =
f (ζk ) [g(xk ) − g(xk−1 )] = λ1 σ(f1 ; g; Tζ )+λ2 σ(f2 ; g; Tζ ) = λ1 Ψgf1 (Tζ )+λ2 Ψgf2 (Tζ ).
Предложение 3.4. Для произвольных f, g1 , g2 , определённых на [a, b] и произвольных чисел λ1 , λ2 ∈ R, справедливо Ψλf 1 g1 +λ2 g2 = λ1 Ψgf1 + λ2 Ψgf2 . Для ∀Tζ ∈ P, по (1), справедливо: Ψλf 1 g1 +λ2 g2 (Tζ ) = σ(f ; λ1 g1 + λ2 g2 ; Tζ ) =
n X
k=1
=
n X
k=1
f (ζk ) [λ1 g1 (xk ) + λ2 g2 (xk ) − λ1 g1 (xk−1 ) − λ2 g2 (xk−1 )] =
f (ζk ) [λ1 g1 (xk ) − λ1 g1 (xk−1 )] +
n X
k=1
f (ζk ) [λ2 g2 (xk ) − λ2 g2 (xk−1 )] =
= λ1 σ(f ; g1 ; Tζ ) + λ2 σ(f ; g2 ; Tζ ) = λ1 Ψgf1 (Tζ ) + λ2 Ψgf2 (Tζ ).
3.5.2. Определение интеграла Стилтьеса Определение 1. Число I ∈ R называют интегралом Стилтьеса функции f по g на отрезке [a, b], если I = lim Ψgf . d(T )→0
Обозначение: I = lim
d(T )→0
Ψgf
=
Zb
f (x) dg(x).
a
Определение 2. Говорят, что функция f интегрируема (по Стилтьесу) на отрезке [a, b] по функции g, Rb если существует интеграл f (x) dg(x); обозначение: f ∈ Sg [a, b]. a
Если g(x) = x на [a, b], то σ(f ; g; Tζ ) = σ(f, Tζ ) и
Rb
f (x) dg(x) =
a
Rb
f (x) dx.
a
3.5.3. Свойство линейности интеграла Стилтьеса Теорема 3.5. Если f1 и f2 интегрируемы по g на [a, b], то для произвольных чисел λ1 , λ2 ∈ R функция f = λ1 f1 + λ2 f2 интегрируема по g на [a, b] и справедливо: Zb
(λ1 f1 (x) + λ2 f2 (x)) dg(x) = λ1
a
Zb
f1 (x) dg(x) + λ2
a
Zb
(2)
f2 (x) dg(x).
a
По условию и определению 1, ∃
lim
d(T )→0
Ψgf1
=
Zb
f1 (x) dg(x) и
lim
d(T )→0
Ψgf2
a
=
Zb
(3)
f2 (x) dg(x).
a
Так как (предложение 3.3), Ψgf = λ1 Ψgf1 + λ2 Ψgf2 , то, в силу (3) и свойства линейности предела функции по базе, Rb Rb Rb ∃ lim Ψgf = λ1 lim Ψgf1 + λ2 lim Ψgf2 = λ1 f1 (x) dg(x) + λ2 f2 (x) dg(x). По определению 1, f (x) dg(x) = d(T )→0
lim Ψgf = λ1
d(T )→0
d(T )→0
Rb a
d(T )→0 Rb
f1 (x) dg(x) + λ2
a
a
a
f2 (x) dg(x).
a
Теорема 3.6. Если f интегрируема по g1 и g2 на отрезке [a, b], то для произвольных чисел λ1 , λ2 ∈ R функция f будет интегрируемой по g = λ1 g1 + λ2 g2 и справедливо: 42
Zb
f (x) d(λ1 g1 (x) + λ2 g2 (x)) = λ1
a
Zb
f (x) dg1 (x) + λ2
a
Zb
f (x) dg2 (x).
(4)
a
По условию и определениям 1 и 2, ∃
lim
d(T )→0
Ψgf1
=
Zb
f (x) dg1 (x) и
lim
d(T )→0
Ψgf2
=
a
Zb
f (x) dg2 (x).
(5)
a
Так как Ψgf = λ1 Ψgf1 + λ2 Ψgf2 (предложение 3.4) и предел по базе d(T ) → 0 обладает свойством линейности, то, с учётом (5): ∃
lim
d(T )→0
Ψgf
= λ1 lim
d(T )→0
Ψgf1
+ λ2 lim
d(T )→0
Ψgf2
= λ1
Zb
f (x) dg1 (x) + λ2
a
По определению 1,
Rb a
f (x) dg(x) = lim Ψgf = λ1 d(T )→0
Rb
Zb
f (x) dg2 (x).
a
f (x) dg1 (x) + λ2
a
Rb
f (x) dg2 (x).
a
3.5.4. Существование интеграла Стилтьеса
Теорема. Всякая функция, непрерывная на отрезке [a, b], интегрируема по любой функции g ограниченной вариации на [a, b]. Так как g = g1 − g2 , gi , i = (1, 2) ↑ на [a, b], то, в силу свойства линейности интеграла Стилтьеса, нужно доказать, что Теорема. Всякая функция, непрерывная на [a, b], интегрируема по любой функции g, возрастающей на [a, b]. Доказательство — дополнительный материал на распечатках. 3.5.5. Интегрируемость по частям в интеграле Стилтьеса Теорема. Если f интегрируема по g на [a, b], то g будет интегрируема по f и справедливо: Zb a
f (x) dg(x) = f (b)g(b) − f (a)g(a) −
Zb
g(x) df (x).
(6)
a
Рассмотрим произвольное размеченное разбиение Tζ [a, b] : a = x0 < · · · < xn = b и ζ = {ζ1 , . . . , ζn }, где ζk ∈ ∆k = [xk−1 , xk ], k = 1, n. По формуле (1), σ(g; f ; Tζ ) =
n X
k=1
g(ζk ) [f (xk ) − f (xk−1 )] = = g(ζ1 ) [f (x1 ) − f (x0 )] + g(ζ2 ) [f (x2 ) − f (x1 )] + . . . + g(ζn ) [f (xn ) − f (xn−1 )] =
= −f (x0 )g(x0 ) − f (x0 ) [g(ζ1 ) − g(x0 )] − f (x1 ) [g(ζ2 ) − g(ζ1 )] − . . . − f (xn ) [g(xn ) − g(ζn )] + f (xn )g(xn ) = = −f (x0 )g(x0 ) + f (xn )g(xn ) −
n+1 X k=1
f (xk−1 ) [g(ζk ) − g(ζk−1 )] , (7)
где переобозначено ζ0 = a и ζn+1 = b. Рассмотрим Tµ′ : a = ζ0 6 . . . 6 ζn+1 = b и набор x = {x0 , . . . , xn }, тогда (7) переходит в (8): Диаметр d(T ′ ) =
σ(g; f ; Tζ ) = f (b)g(b) − f (a)g(a) − σ(f ; g; Tµ′ ).
max
06k6n+1
(8)
|ζk − ζk−1 | = (ζl − ζl−1 ) 6 ∆xl + ∆xl+1 6 2d(Tζ ). Таким образом, d(Tµ′ ) 6 2d(Tζ ).
По условию теоремы, ∃ I =
Rb a
f (x) dg(x) = lim σ(f ; g; Tζ ). Так что для любого ε > 0 ∃ δ > 0 : d(T )→0
|I − σ(f ; g; Tζ )| < ε, ∀ Tζ : d(Tζ ) < δ. 43
(9)
Пусть δ ′ = δ2 > 0 и рассмотрим произвольное размеченное разбиение Tζ : d(Tζ ) < δ ′ . Тогда d(Tµ′ ) 6 2d(Tζ ) < ′ 2δ = δ, следовательно (по формуле (9)), I − σ(f ; g; Tµ ) < ε. По (8), |σ(g; f ; Tζ ) − [f (b)g(b) − f (a)g(a) − I]| = σ(f ; g; Tµ′ ) − I < ε для всех разбиений Tζ : d(Tζ ) < δ ′ , δ ′ = Rb δ ′ (ε) > 0, то есть f (b)g(b) − f (a)g(a) − I = lim σ(g; f ; Tζ ) = g(x) df (x), что равносильно (6). ′
d(T )→0
Следствие. Если g ∈ R[a, b], то
Rb a
a
x dg(x) = bg(b) − ag(x) −
Rb
g(x) dx.
a
3.5.6. Вычисление интеграла Стилтьеса Теорема. Если g имеет на [a, b] ограниченную производную g ′ ∈ R[a, b], то для любой функции f ∈ C[a, b], справедливо Zb Zb f (x) dg(x) = f (x)g ′ (x) dx. (10) a
′
a
′
Так как g ∈ R[a, b], то g — ограничена на [a, b], и, следовательно, g удовлетворяет условию Липшица на [a, b] и g имеет ограниченную вариацию на [a, b], следовательно, интегралы в формуле (10) существуют. Так как g ′ ∈ R[a, b], то ∃ M > 0 : |g ′ (x)| 6 M, x ∈ [a, b]. Рассмотрим произвольное размеченное разбиение Tζ [a, b] точками a = x0 < · · · < xn = b и набор ζ = {ζ1 , . . . , ζn }, ζk ∈ ∆k = [xk−1 , xk ], |∆k | = ∆xk = xk − xk−1 , k = 1, n. Тогда, с учётом теоремы Лагранжа о конечных приращениях, имеем σ(f ; g; Tζ ) =
n X
k=1
f (ζk )[g(xk ) − g(xk−1 )] =
n X
f (ζk ) · g ′ (ck )(xk − xk−1 ) =
k=1 n X
=
f (ck )g ′ (ck )∆xk +
k=1
n X
k=1
g ′ (ck )[f (ζk ) − f (ck )]∆xk = σ(f ; g; Tζ ), (1)
где ζk , ck ∈ ∆k . Рассмотрим Tc [a, b] : a = x0 < · · · < xn = b и c = {c1 , . . . cn } , ck ∈ ∆k , k = 1, n. Тогда n X
f (ck )g ′ (ck )∆xk = σ(f g ′ ; Tc ),
k=1
и так как произведение f g ′ ∈ R[a, b], то существует lim
d(T )→0
n X
′
′
f (ck )g (ck )∆xk = lim σ(f g ; Tζ ) = d(T )→0
k=1
Zb
f (x)g ′ (x) dx.
(2)
a
Оценка второй суммы в правой части (1) даёт неравенство: n n n X X X ′ g (ck )[f (ζk ) − f (ck )]∆xk 6 |g ′ (ck )| [f (ζk ) − f (ck )]∆xk 6 M ω(f ; ∆k )∆xk . k=1
Так как f ∈ R[a, b],
k=1
lim
n P
d(T )→0 k=1
ω(f ; ∆k )∆xk = 0, следовательно, с учётом (3), получаем, что
lim
d(T )→0
n X
k=1
g ′ (ck )[f (ζk ) − f (ck )]∆xk = 0.
На основании (1), (2) и (4), заключаем существование
lim σ(f ; g; Tζ ) =
d(T )→0
a
f (x) dg(x) = f (b)g(b) − f (a)g(a) −
44
(4) Rb
f (x)g ′ (x) dx =
a
Следствие. Если g ∈ R[a, b], f имеет f ′ ∈ R[a, b], то Zb
(3)
k=1
Zb a
g(x)f ′ (x) dx.
Rb
f (x) dg(x).
a
(5)
Так как f ′ ∈ R[a, b], то f ′ ограничена на [a, b] некоторым числом M > 0, |f ′ (x)| 6 M, x ∈ [a, b], и, следовательно, f удовлетворяет условию Липшица с L = M , и, следовательно, f имеет ограниченную вариацию Rb на [a, b], так что существует g(x) df (x) (см. пункт 3.5.4). a
По свойству интегрирования по частям, существует
Zb a
f (x) dg(x) = f (b)g(b) − f (a)g(a) −
Zb a
g(x) df (x) = f (b)g(b) − f (a)g(a) −
45
Zb a
g(x)f ′ (x) dx (по предыдущей теореме).
Часть 4.
Многомерный
анализ
4. Непрерывные отображения нескольких действительных переменных 4.1. Многомерное евклидово пространство 4.1.1.
Векторное пространство в Rm
Символ Rm = R × R × . . . × R (m экземпляров множества R действительных чисел, где m ∈ N — фиксиро| {z } m раз
вано). Множество Rm состоит из всех упорядоченных m–наборов (x1 , x2 , . . . , xm ) чисел xi ∈ R, i = 1, m. Элементы 1 (x , . . . , xm ) множества Rm принято называть точками, а числа x1 , . . . , xm — соответственно первой, второй, . . ., m–ой координатами точки (x1 , x2 , . . . , xm ). Точки в Rm часто будем обозначать одной буквой: в аналитических рассмотрениях строчной буквой — x = (x1 , . . . , xm ); в геометрических рассмотрениях прописной — M или с указанием координат M (x1 , . . . , xm ). При m = 1, 2, 3 и иногда 4 индексация не применяется: для R1 = R обычна запись точки одной буквой; для R2 = R × R запись вида (x, y); для R3 — (x, y, z); для R4 — (x, y, z, t). R2 отождествляем с координатной плоскостью, R3 отождествляем с координатным пространством. Но Rm есть не только множество. Оно наделяется некоторыми математическими операциями, а именно: 1. в Rm вводится операция покоординатного сложения; 2. в Rm вводится умножение на действительные числа (называемые скалярами). По определению полагают (x1 , x2 , . . . , xm ) + (y 1 , y 2 , . . . , y m ) := (x1 + y 1 , . . . , xm + y m ),
λ · (x1 , x2 , . . . , xm ) := (λx1 , . . . , λxm ), λ ∈ R.
(1)
Формулы (1) превращают Rm в линейное пространство. Итак, Rm , m > 1 — векторные пространства над R (или действительные векторные пространства). В векторном пространстве Rm с нулём 0 = (0, . . . , 0) имеется стандартный базис, образованный векторами e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , em = (0, 0, . . . , 1), в котором для любой точки x = (x1 , . . . , xm ) ∈ Rm справедливо представление: x = x1 e1 + x2 e2 + . . . + xn en =: xi ei и это представление единственно. Так как Rm — m–мерное векторное пространство, отметим также, что элементы пространства Rm будем называть как точками, так и векторами. Замечание. Запись x = xi ei , в которой индексы у координат верхние, а у векторов — нижние, подразумевает суммирование по повторяющемуся индексу (тензорная запись, предложенная Эйнштейном). Поскольку в R2 и R3 точки с координатами (x, y) [(x, y, z)] можно называть радиус-векторами, то возникает термин «векторное пространство». 4.1.2.
Скалярное произведение
Определение 1. Скалярным произведением в действительном векторном пространстве X называют функцию, относящую каждой упорядоченной паре векторов (u, v) из X действительное число, — обозначим его hu, vi — так, что выполнены следующие условия (аксиомы скалярного произведения): 1. 2. 3. 4.
hx + y, zi = hx, zi + hy, zi для всех (x, y, z) ∈ X 3 ; hλx, zi = λ hx, zi для всех (x, y, λ) ∈ X 2 × R; hx, yi = hy, xi для всех (x, y) ∈ X 2 ; если x ∈ X и x 6= 0, то hx, xi > 0.
Первое условие распространяется по индукции на любые конечные суммы: hx1 + x2 + . . . + xk , zi = hx1 , zi + hx2 , zi + . . . + hxk , zi , k ∈ N. Из первого и второго условия следует линейность скалярного произведения по первому множителю при каждом фиксированном значении второго: hλ1 x1 + . . . + λk xk , yi = λ1 hx1 , yi + . . . + λk hxk , yi , k ∈ N, (x1 , . . . , xk , y) ∈ X k+1 , (λ1 , . . . , λk ) ∈ Rk . В соединении с третьим условием последнее влечёт линейность скалярного произведения по второму множителю при каждом фиксированном значении первого. Таким образом, скалярное произведение hu, vi — билинейная форма. 46
Беря во втором условии λ = 0 получим, что h0, zi = 0 ∀z ∈ X, что влечёт hz, 0i = 0 для всех z ∈ X; в частности, h0, 0i = 0. Таким образом, четвёртое условие означает, что hx, xi > 0 для всех x ∈ X, причём hx, xi = 0 тогда и только тогда, когда x = 0. Легко проверяется, что формула m X hx, yi = xi y i (2) i=1
1
определяет скалярное произведение векторов (x , . . . , x ) и (y 1 , . . . , y m ) в Rm , m > 1. Условие (3) очевидно выполнено. Проверим условие (1): x = (x1 , . . . , xm ), y = (y 1 , . . . , y m ), z = (z 1 , . . . , z m ). x + y = (x1 + y 1 , . . . , xm + y m ). m m m P P P xi z i + y i z i = hx, zi + hy, zi. hx + y, zi = (xi + y i )z i = i=1
i=1
m
i=1
Условие (2) проверяется аналогично. Проверим условие (4): если x ∈ Rm и x 6= 0, то x = (x1 , . . . , xm ) и xj 6= 0 для некоторого j, 1 6 j 6 m, тогда m P hx, xi = xi xi = (x1 )2 + (x2 )2 + . . . + (xm )2 > (xj )2 > 0. i=1
На самом деле, в Rm существует бесконечное множество скалярных произведений: например, hx, yi =
m P
ρi xi y i ,
i=1
где все ρi > 0, i = 1, m, поэтому скалярное произведение, определяемое формулой (2) называют стандартным скалярным произведением в Rm (евклидовым скалярным произведением) и Rm становится евклидовым векторным пространством. 4.1.3.
Неравенство Коши – Буняковского
Теорема. Скалярное произведение hx, yi в действительном векторном пространстве X удовлетворяет неравенству 2 hx, yi 6 hx, xi · hy, yi . (3)
Для произвольного числа λ ∈ R hλx − y, λx − yi > 0. Следовательно, λ2 hx, xi − 2λ hx, yi + hy, yi > 0.
(4) 2
hx,yi Если x 6= 0, то hx, xi = 6 0(> 0) и для λ = hx,xi неравенство (4) имеет вид: − hx,yi hx,xi + hy, yi > 0, откуда следует (3). Если x = 0, то hx, xi = 0 и hx, yi = 0 для любого y ∈ X, следовательно, (3) превращается в равенство.
Замечание. Знак равенства в (3) справедлив тогда и только тогда, когда векторы x и y линейно зависимы. Необходимость. Если x = 0, то доказано равенство (3) для любого y. hx,yi Если x 6= 0, то hx, xi = 6 0 и y = λx, так что hx, yi = λ · hx, xi и λ = hx,xi .
Далее, hy, yi = λ hx, yi =
hx,yi2 hx,xi ,
итак hy, yi = 2
hx,yi2 hx,xi ,
то есть (3) — равенство.
Достаточность. Обратно, пусть hx, yi = hx, xi · hy, yi. Если x 6= 0, то hx, xi = 6 0 и для λ = ние (4) имеет вид 2 2 2 2 2 hx, yi hx, yi hx, yi hx, yi hx, yi −2 + hy, yi = −2 + = 0, hx, xi hx, xi hx, xi hx, xi hx, xi
hx,yi hx,xi
соотноше-
то есть hλx − y, λx − yi = 0, откуда λx − y = 0, y = λx. При x = 0 линейная зависимость очевидна. 1◦ X = Rm , m > 1 и x = (x1 , . . . , xm ), y = (y 1 , . . . , y m ) ∈ Rm и hx, yi = hy, yi =
m P
(y i )2 и (3) имеет вид
m P
i=1
xi y i . Тогда hx, xi =
m P
(xi )2 ,
i=1
i=1 m X i=1
i i
xy
!2
6
m X i=1
(xi )2
m X
(y i )2 — неравенство Коши.
(3a )
i=1
2◦ X = C[a, b], a < b — векторное пространство относительно операции сложения функций и умножения их на λ.
47
Покажем, что для любых функций x, y ∈ C[a, b] формула hx, yi :=
Zb
x(t)y(t) dt
a
задаёт скалярное произведение в X = C[a, b]. Скалярное произведение удовлетворяет следующим аксиомам: Rb Rb Rb 1. hx + y, zi = (x(t) + y(t))z(t) dt = x(t)z(t) dt + y(t)z(t) dt = hx, zi + hy, zi. a
2. hλx, zi = 3. hx, yi =
Rb
a Rb
a
a
λx(t)z(t) dt = λ hx, zi.
x(t)y(t) dt =
a
Rb
y(t)x(t) dt = hy, xi.
a
Заметим, что нулевым вектором в пространстве X = C[a, b] служит функция ϕ(t) = 0, t ∈ [a, b]. Пусть теперь x ∈ C[a, b] и x 6= 0, то есть функция x(t) непрерывна на [a, b] и ∃ t0 ∈ [a, b], в котором x(t0 ) 6= 0. Предположим сначала, что t0 ∈ (a, b), a < t0 < b. Согласно теореме о сохранении знака, ∃ δ > 0 : x(t) 6= 0 ∀t ∈ [t0 − δ, t0 + δ] ⊂ t0R−δ t0R+δ t0R+δ Rb Rb 2 [a, b]. Тогда hx, xi = x2 (t) dt = x2 (t) dt + x2 (t) dt + x (t) dt > x2 (t) dt = x2 (ξ)2δ > 0, a
a
t0 −δ
t0 +δ
t0 −δ
так как ξ ∈ [t0 − δ, t0 + δ]. Случаи t0 = a, t0 = b проверяются аналогично.
Zb a
2
Zb
x(t)y(t) dt 6
a
x2 (t) dt ·
Zb
y 2 (t) dt.
(3b )
a
1
Неравенство принадлежит В. Я. Буняковскому .
Метрика в Rm m P стандартное скалярное произведение hx, yi = xi y i . Тогда x − y = (x1 − y 1 , . . . , xm − y m ) 4.1.4.
Рассмотрим в Rm и hx − y, x − yi =
m P
i=1
i=1
i 2
i
(x − y ) .
p Функция dm (x, y) = hx − y, x − yi =
s
m P
i=1
обладает свойствами:
(xi − y i )2 , называемая расстоянием между векторами x и y,
1. dm (x, y) = 0 ⇔ x = y; 2. dm (x, y) 6 dm (x, z) + dm (y, z).
dm (x, y) =
m X i=1
6
m X i=1
i
i 2
(x − y ) i
i 2
(x − z )
! 12
! 12
=
+
m X i 2 x − z i + z i − yi i=1
m X i=1
i
i 2
(y − z )
! 12
! 21
6
m X i x − z i + y i − z i 2 i=1
! 12
6
= dm (x, z) + dm (y, z) — неравенство Минковского при p = 2.
Если m = 1, R1 = R, то d1 (x, y) = |x − p y|. Если m = 2, R2 = R × R, то d2 (x, y) = (x1 − x2 )2 + (y1 − y2 )2 . Теорема. Rm — m–мерное евклидово и метрическое пространство. s m P 1 m m Для произвольной x = (x , . . . , x ) ∈ R число dm (x, 0) = (xi )2 называют длиной вектора x ∈ R (нормой x) и обозначают kxkm = 1А
m P
i=1
(xi )2
12
i=1
, kxkm =
p hx, xi.
также Шварцу, Коши и многим другим математикам, получившим его независимо от Буняковского. В англоязычной литературе пишут «Schwartz inequality». (прим. ред.)
48
4.1.5.
Углы. Ортогональность
m
Рассмотрим произвольные x, y ∈ R , x 6= 0, y 6= 0. Тогда kxkm > 0, kykm > 0 и из (3) следует |hx, yi| 6 kxkm · kykm . hx, yi kxk kyk 6 1. m m Всякое число r, |r| 6 1, есть косинус однозначно определённого угла ϕ ∈ [0, π]. Таким образом, hx, yi = kxkm kykm cos ϕ,
(5)
ϕ ∈ [0, π].
Величину ϕ называют углом между векторами x и y. При этом, формула (5) показывает, что скалярное произведение двух ненулевых векторов есть произведение длин этих векторов и косинуса угла между ними, как в векторной алгебре на плоскости и в пространстве, но там это утверждение есть определение скалярного произведения, а здесь оно — следствие неравенства Коши–Буняковского. Векторы x, y называют ортогональными, если их скалярное произведение hx, yi равно нулю. Если x и y — ненулевые векторы, то их ортогональность означает, что угол между этими векторами прямой (отсюда и термин «ортогональность»). Нулевой вектор ортогонален всякому. Rb Если X = C[a, b], то функции x, y ∈ X ортогональны (на отрезке [a, b]), когда x(t)y(t) dt = 0. Понятие a
ортогональности функций играет важную роль в теории рядов Фурье (материал третьего семестра).
4.2. Множества в метрическом пространстве 4.2.1.
Метрические пространства
Определение 1. Метрикой (расстоянием) в непустом множестве X называют функцию, ставящую в соответствие каждой упорядоченной паре (x, y) элементов из X действительное число (назовём его расстоянием от x до y и обозначим символом d(x, y)), такое, что выполнены следующие условия (аксиомы метрики): 1. d(x, y) 6 d(x, z) + d(y, z) для произвольных (x, y, z) ∈ X 3 ; 2. d(x, y) = 0 ⇔ x = y. Если положить z = x в неравенстве аксиомы (1) и воспользоваться аксиомой (2), то получим d(x, y) 6 d(x, x) + d(y, x) = d(y, x) и аналогично d(y, x) 6 d(x, y), то есть d(x, y) = d(y, x) (расстояние от x до y равно расстоянию от y до x). Если положить y = x в неравенстве аксиомы (1) и воспользоваться (2), то получим 0 = d(x, x) 6 2d(x, z), откуда заключаем, что d(x, z) > 0 для произвольных (x, z) ∈ X 2 . (1) ⇒ d(x, y) 6 d(x, z) + d(z, y), то есть неравенство треугольника. Определение 2. Непустое множество с определённой на нём метрикой называется метрическим пространством и обозначается (X; d). Вместо (Rm , dm ) пишем Rm , m > 1 (как для множества Rm ). На Rm можно определить бесконечно много метрик, из которых выделим одну: а) для произвольных x = (x1 , . . . , xm ), y = (y 1 , . . . , y m ) из Rm функция d1m (x, y) = max xi − y i определяет 16i6m метрику. 4.2.2.
Шары, δ—окрестности
Рассмотрим произвольное метрическое пространство (X; d). Множество U(a; r) = {x ∈ X | d(x, a) < r} называется открытым шаром в Xс центром a ∈ X и радиусом r. Если X = R1 , то U(a; r) = x ∈ R1| |x − a| < r = (a − r, a + r) ⊂ R. При m = 2, X = R2 , U((a; b); r) = (x, y) ∈ R2 | (x − a)2 + (y − b)2 < r2 . При m = 3, X = R3 , U((a, b, c); r) = (x, y, z) ∈ R3 | (x − a)2 + (y − b)2 + (z − c)2 < r2 — шар с центром в точке (a, b, c) и радиусом r. Определение 1. δ—окрестностью (δ > 0) точки a ∈ (X; d) называют открытый шар U(a, δ). Если (X; d) = (Rm , dm ) = Rm , то при m = 1 U(a, δ) = (a − δ, a + δ). При m = 2 имеем U((a, b), δ) — окрестность радиуса δ.
49
4.2.3.
Общее понятие окрестности
Определение 2. Окрестностью точки в метрическом пространстве назовём любое подмножество метрического пространства, содержащее некоторую δ—окрестность этой точки. Так, множество U является окрестностью точки a ∈ X, если U ⊂ X и U ⊃ U(a, δ). Заметим, что a ∈ U(a, r) (ибо d(a, a) = 0 < r) и если 0 < r1 < r2 , то шар U(a, r1 ) < U(a, r2 ) (в силу неравенства d(x, a) < r1 < r2 ). Любая δ—окрестность точки есть её окрестность в смысле определения 2. B(a; r) = {x ∈ X | d(x, a) 6 r} — замкнутый шар, окрестность точки a. Также всё множество X есть окрестность каждой своей точки a ∈ X, так как U(a, δ) ⊂ X. В метрическом пространстве (X; d) рассмотрим U(a, r) — открытый шар с центром a и радиуса r > 0. Тогда a ∈ U(a, r). Теорема 1. Любой открытый шар в метрическом пространстве есть окрестность каждой своей точки. Рассмотрим произвольный шар U(a, r), a ∈ X, r > 0 и рассмотрим произвольную точку x ∈ U(a, r), так что d(x, a) < r и δ = r − d(x, a) > 0. Докажем, что U(x; δ) ⊂ U(a; r). Действительно, для любой y ∈ U(x, δ)(d(y, x) < δ) справедливо неравенство d(y, a) 6 d(y, x) + d(x, a) < r − d(x, a) + d(x, a) = r, так что y ∈ U(a, r) и, следовательно, U(x, δ) ⊂ U(a, r). 4.2.4.
Свойства окрестностей точек метрического пространства
Теорема. Окрестности точки в метрическом пространстве обладают свойствами: 1) всякое множество метрического пространства, содержащее окрестность точки — окрестность. 2) пересечение любых двух окрестностей точки образует окрестность этой точки. 3) точка принадлежит всем своим окрестностям. 4) любая окрестность точки метрического пространства содержит такую окрестность этой точки, которая будет окрестностью каждой своей точки. 5) (свойство отделимости): для любых различных точек метрического пространства можно указать такие их δ—окрестности, которые не пересекаются. Рассмотрим метрическое пространство (X; d) и произвольную a ∈ X. Обозначим символом U(a) систему всех окрестностей точки a в (X; d). 1) Рассмотрим произвольное множество U ∈ U(a) и произвольное множество V ⊂ X такое, что V ⊃ U. По определению, существует δ > 0 такое, что U(a, δ) ⊂ U ⊂ V, следовательно, U(a, δ) ⊂ V, и V — окрестность точки a по определению. 2) Рассмотрим произвольные U1 , U2 ∈ U(a). По определению, ∃ δ1 > 0, δ2 > 0 такие, что U(a, δi ) ⊂ Ui (i = 1, 2). Положим δ = min(δ1 , δ2 ). Тогда U(a, δ) ⊂ U(a, δi ) и, следовательно, U(a, δ) ⊂ Ui . Тогда U ⊂ U1 ∩U2 , следовательно, U1 ∩ U2 ∈ U(a). 3) Рассмотрим произвольное U ∈ U(a). По определению, ∃ δ > 0 такое, что U(a, δ) ⊂ U. Так как точка a ∈ U(a, δ)(d(a, a) = 0), то a ∈ U. 4) Рассмотрим произвольное U ∈ U(a). По определению, ∃ δ > 0 такое, что U(a; δ) ⊂ U. По теореме 1, U(a, δ) удовлетворяет условиям утверждения. 5) Пусть a, b ∈ X и a 6= b, так что d(a, b) > 0. Положим δ = d(a,b) и предположим, что U(a, δ) ∩ U(b, δ) 6= ∅, 3 так что ∃ x ∈ U(a, δ) ∩ U(b, δ), для которого d(x, a) < δ, d(x, b) < δ, следовательно, d(a, b) 6 d(a, x) + d(x, b) < δ + δ = 23 d(a, b) < d(a, b). Поэтому U(a, δ) ∩ U(b, δ) = ∅. Следствие. Система окрестностей U(a) любой точки метрического пространства образует базу в метрическом пространстве. Прямое следствие свойств 2, 3 и определения базы. 4.2.5.
Открытые и замкнутые множества метрического пространства
Определение 1. Множество G ⊂ (X; d) называется открытым множеством, если каждая его точка входит в G вместе с некоторой своей δ-окрестностью, или G есть окрестность каждой своей точки. Примеры: 1) U(a; r); a ∈ X, r > 0 — открытое множество. 2) X — открытое множество (по теореме пункта 4.2.4, утверждение 1). 3) ∅ — открытое множество. Действительно, импликация «x ∈ ∅ ⇒ ∅ — окрестность точки x» истинна, поскольку её посылка «x ∈ ∅» ложна. Иными словами, пустое множество — окрестность каждой своей точки (за неимением их), то есть, открытое множество. 4) дополнение замкнутого шара G(a; r) = X r B(a; r) = {x ∈ X | d(x; a) > r} — открытое множество.
50
Действительно, рассмотрим произвольное y ∈ G(a; r), то есть d(y, a) > r и положим δ = d(y; a) − r > 0. Если U(y, δ) ∩ B(a; r) 6= ∅, то для z ∈ U(y, δ) ∩ B(a; r) справедливо: d(z; y) < δ и d(z; a) 6 r, тогда d(y; a) 6 d(z; y) + d(z; a) < δ + r = d(y; a). Поэтому U(y, δ) ∩ B(a; r) = ∅, и поэтому U(y, δ) ⊂ G(a; r). Теорема. Открытые множества метрического пространства обладают свойствами: 1) объединение любого непустого набора открытых множеств есть открытое множество. 2) пересечение двух (а следовательно, и любого конечного набора) открытых множеств образует открытое множество. 3) ∅ — открытое. 4) всё X — открытое. Свойства (3) и (4) установлены в примерах (примеры 2.3). 1) РассмотримSпроизвольный непустой набор {Gα } , α ∈ A открытых множеств Gα в пространстве X и множество G = Gα . Рассмотрим произвольное x ∈ G, тогда x ∈ Gα0 для некоторого α0 ∈ A и Gα0 — α∈A
окрестность точки x в пространстве (X; d), ибо Gα0 — открытое множество. Тогда Gα0 ⊂ G, следовательно, G — открытое множество. 2) Рассмотрим произвольные открытые множества G1 , G2 в (X; d) и множество G = G1 ∩ G2 . Если G = ∅, то G — открытое. Если G 6= ∅, то для любой его точки x ∈ G = G1 ∩ G2 , имеем x ∈ G1 и x ∈ G2 . Так как Gi , i = 1, 2 — открытое, то по определению Gi — окрестности точки x. Тогда G1 ∩ G2 также окрестность точки x, то есть G — открытое множество. Определение 2. Множество F метрического пространства (X; d), F ⊂ X, называется замкнутым множеством, если его дополнение X r F — открытое множество. Примеры: 1) Замкнутый шар B(a; r), a ∈ X, r > 0. 2) X — замкнутое множество. 3) ∅ — замкнутое. Теорема. Замкнутые множества в (X; d) обладают свойствами: 1) пересечение произвольного непустого набора замкнутых множеств образует замкнутое множество. 2) объединение любых двух (а следовательно, и любого конечно набора) замкнутых множеств есть замкнутое множество. 3) ∅ — замкнуто. 4) X — замкнуто. Свойства 3 и 4 установлены выше. T 1) Рассмотрим произвольный набор {Fα } , α ∈ A замкнутых множеств в (X; d) и F = Fα . Тогда C F = α∈A S X rF = (X r Fα ) и X r Fα = Gα — открытые множества. Согласно предыдущей теореме — свойство 1 α∈A S — множество (X r Fα ) = C F — открытое множество, следовательно, по определению 2, множество F — α∈A
замкнутое. 2) Рассмотрим произвольные замкнутые множества F1 и F2 в (X; d) и F = F1 ∪F2 . Тогда Gi = X rFi (i = 1, 2), согласно определению 2 — открытые множества и G1 ∩G2 = X r(F1 ∪F2 ) — открытое множество, следовательно, F — замкнутое множество. Рассмотрим произвольное метрическое пространство (X; d), точку a ∈ X и произвольное число r > 0. Множество S(a, r) = {x ∈ X | d(x, a) = r} называют сферой с центром a и радиусом r. Так как X r S(a; r) = U(a; r) ∪ G(a; r) и множества U(a; r) и G(a; r) — открытые, то S(a; r) — замкнутое множество. 4.2.6.
Критерий замкнутости множества
Определение 1. Точка a метрического пространства (X; d) называется точкой прикосновения для множества E ⊂ X, если любая её окрестность U(a) пересекает множество E, то есть U(a) ∩ E 6= ∅.
Теорема. Множество F метрического пространства (X; d) замкнуто тогда и только тогда, когда оно содержит все свои точки прикосновения. Необходимость. Рассмотрим произвольное замкнутое множество F в метрическом пространстве (X; d), так что его дополнение G — открытое множество. Следовательно, G — окрестность каждой своей точки x ∈ G и G ∩ F = ∅. Согласно обращению определения 1, каждая точка x ∈ G не является точкой прикосновения множества F , другими словами — F содержит все свои точки прикосновения. Достаточность. Пусть множество F ⊂ X содержит все свои точки прикосновения. Обозначим X r F = G. Так как F ∩G = ∅, то все точки x ∈ G не являются точками прикосновения множества F . Согласно определению 1, для любой x ∈ G существует такая окрестность U1 (x), что U1 (x) ∩ F = ∅. Но U1 (x) ⊂ X и, следовательно,
51
U1 (x) ⊂ G, так что G — окрестность каждой своей точки, то есть открытое множество, следовательно, F — замкнутое множество. 4.2.7.
Кубические окрестности в пространстве Rm
В метрическом пространстве (X; d) = (Rm , dm ) = Rm , m > 1, кроме открытых шаров используются открытые кубы. Рассмотрим произвольную точку a = (a1 , . . . , am ) ∈ Rm и произвольное число h > 0. Множество Q(a; h) = x = (x1 , . . . , xm ) ∈ Rm | xi ; ai < h, i = 1, m = x ∈ Rm | d1m (x; a) < h
называют открытым кубом с центром в точке a и стороной 2h. Если m = 1, это интервал (a − h, a + h). Если m = 2, то Q((a, b), h) = (x, y) ∈ R2 | a − h < x < a + h; b − h < y < b + h — квадрат на R2 . Если m = 3, то Q((a, b, c), h) — куб. Так как справедлива формула √ (1) d1m (x, y) 6 dm (x, y) 6 md1m (x, y), где x = (x1 , . . . , xm ) ∈ Rm , y = (y 1 , . . . , y m ) ∈ Rm , то Q(a, h) ⊃ U(a, h), так как dm (x, a) < h влечёт d1m (x, a) < h. Следовательно, каждый открытый куб Q(a, h) есть окрестность своей точки a ∈ X. Так же, как и в случае открытого шара, можно доказать, что каждый открытый куб есть окрестность каждой своей точки. Неравенство (1) определяет свойство эквивалентности метрик dm и d1m в Rm , так что √ 1 каждый открытый √ куб Q(a, r) содержится в открытом шаре Q(a, mh), так как неравенство dm (x, a) < h влечёт dm (x, a) < m · h. 4.2.8.
Компакты в метрическом пространстве
Рассмотрим метрическое пространство (X; d) и непустой набор {Gα } , α ∈ A открытых множеств Gα ⊂ X. S Набор Gα , α ∈ A называют открытым покрытием множества E ⊂ X, если E ⊂ Gα , то есть для любой α∈A
точки x ∈ E ∃ Gα , α ∈ A, что x ∈ Gα . Если множество индексов A — конечно, то открытое покрытие Gα , α ∈ A множества E называют конечным открытым покрытием множества E. Определение 2. Множество C из (X; d) называют компактом (или компактным множеством), если любое открытое покрытие Gα , α ∈ A множества C содержит конечное множество множеств G1 , . . . , Gn , которое n S образует конечное покрытие множества C, то есть C ⊂ Gk . k=1
Примеры: 1) любое конечное множество в пространстве (X; d) — компакт (согласно свойству отделимости, теорема пункта 2.4). 2) если (X; d) = R1 , то любой отрезок [a, b] — компакт в R1 (материал первого семестра). Если (X; d) = Rm и существуют точки a = (a1 , . . . , am ), b = (b1 , . . . , bm ), где ai < bi , i = 1, m, то множество m i i i I = x ∈ R | a 6 x 6 b , i = 1, m называют m–мерным параллелепипедом (или m–мерным брусом). Утверждение 4.1. Любой m–мерный брус — компакт. Предположим, что существует брус I и бесконечное открытое покрытие его множествами Gα , α ∈ A, S то есть I ⊂ Gα , такие, что I не допускает конечного покрытия множествами Gα . α∈A
Разделим каждый [ai , bi ] на два равных отрезка, так что брус I разобьётся на 2m равных m–мерных бруса, из которых выберем такой брус, который обладает свойством исходного бруса I и обозначим его I1 ⊂ I. С брусом I1 поступим так же, как и с брусом I и выберем брус I2 такой, что I2 ⊂ I1 ⊂ I и I2 обладает свойством брусом I и I1 . Продолжая эту процедуру, получим набор брусов I ⊃ I1 ⊃ I2 ⊃ . . . ⊃ In ⊃ . . ., обладающих свойством бруса I и имеющих диаметры diam In → 0 при n → +∞. Если обозначим In = x ∈ Rm | ain 6 xi 6 bin , i = 1, m , n ∈ N, то для каждого i, 1 6 i 6 m отрезки [ain ; bin ], n ∈ N образуют систему стягивающихся T i i отрезков. По теореме о системе стягивающихся отрезков, для каждого i, 1 6 i 6 m существует ζ i ∈ [an ; bn ], 1 6 i 6 m. Рассмотрим n∈N T ζ = (ζ 1 , . . . , ζ m ) и убеждаемся, что ζ ∈ In . Так как ζ ∈ I, то существует открытое множество Gα , α ∈ A n∈N
такое, что ζ ∈ Gα . Открытое множество Gα содержит открытый шар Um (ζ, δ), δ > 0 такое, что ζ ∈ U(ζ, δ) ⊂ Gα . Так как diam In → 0, то для δ > 0 существует N = Nδ , N ∈ N такое, что IN ⊂ U(ζ; δ) для любого n > N . Так что In ⊂ U(ζ; δ) ⊂ Gα , n > N , что противоречит свойству бруса In . 4.2.9.
Ограниченные множества метрического пространства
Рассмотрим произвольное метрическое пространство (X; d) и произвольное множество E ⊂ X. Обозначим d(E) = sup {d(x1 , x2 ) | x1 , x2 ∈ E} и назовём d(E) диаметром множества E, если d(E) < +∞. Определение 3. Множество E метрического пространства (X; d) называют ограниченным, если E имеет конечный диаметр. 52
Утверждение. E ограничено в метрическом пространстве (X; d) тогда и только тогда, когда ∃ M > 0 такое, что d(x, a) 6 M для всех x ∈ E и некоторого a ∈ X. Фиксируем a ∈ X. Тогда d(x1 , x2 ) 6 d(x1 , a) + d(x2 , a) 6 2M для любых x1 , x2 ∈ E и применяем определение 3. Теорема. Любой компакт в метрическом пространстве есть ограниченное множество. Рассмотрим произвольный компакт C в (X; d) и фиксируем произвольную точку a ∈ X. Для любой S x∈C число d(x; a) > 0 и ∃ n ∈ N такое, что n > d(x, a), так что точка x ∈ U(a, n). Следовательно, C ⊂ U(a; n).
Так как C — компакт, то ∃ n1 , n2 , . . . , np ∈ N, что C ⊂ U(a; nj ) ⊂ U(a, q), j = 1, p и, следовательно, C ⊂ 4.2.10.
p S
j=1
p S
j=1
n∈N
U(a; nj ). Обозначим q = max(n1 , . . . , np ) ∈ N. Тогда
U(a; nj ) ⊂ U(a; q), то есть C — ограниченное множество.
Компактность и замкнутость
Теорема 1. Всякий компакт метрического пространства есть замкнутое множество. Рассмотрим произвольный компакт C в (X; d), C ⊂ X и рассмотрим произвольную точку a ∈ X rC. Так как x 6= a для всех x ∈ C и метрическое пространство (X;Sd) — отделимое пространство, то существуют открытые шары U(x) и O(a), не пересекающиеся. Поскольку C ⊂ U(x), то система шаров образует покрытие компакта x∈C
C, которое обязано содержать некоторое конечное покрытие U1 (x1 ), . . . , U(xn ), xj ∈ C, j = 1, n и C ⊂
n S
j=1
U(xj ).
n T Для каждого U(xj ) рассмотрим Oj (a), что U(xj ) ∩ Oj (a) = ∅. Так как Oj (a) = O(a) — окрестность точки n j=1 S a (по свойству окрестностей) и O(a) ∩ U(xj ) = ∅, то O(a) ∩ U(xj ) = ∅ и, следовательно, O(a) ∩ C = ∅. j=1
Итак, O(a) ⊂ X r C и, следовательно, X r C — открытое, тогда C — замкнутое множество.
Теорема 2. Всякое замкнутое подмножество любого компакта в метрическом пространстве есть компакт. Рассмотрим произвольный компакт C в метрическом пространстве (X; d), произвольное замкнутое множество F ⊂ C и произвольное открытое покрытие {Gα } , α ∈ A множества F . Добавляя к Gα , α ∈ A открытое X r F = G, получим открытое покрытие всего множества X, и, в частности, n S компакта C ⊂ X. Так как C — компакт, существует конечное его покрытие множествами G1 , . . . , Gn ; C ⊂ Gk . k=1
Если множество G входит в набор этих множеств G1 , . . . , Gn , то после его удаления из этого набора получим конечное покрытие множества F ⊂ C, так что F — компакт по определению.
Теорема 3 (критерий компакта в Rm ). Множество C метрического пространства Rm , m > 1 является компактом только и только тогда, когда C ограничено и замкнуто в Rm . Необходимость. Если C — компакт в метрическом пространстве (X; d), то по теореме 1 и теореме пункта 2.9, множество C замкнуто и ограничено. Достаточность. Рассмотрим произвольное замкнутое и ограниченное множество C в Rm , m > 1. Согласно свойствам метрик dm и d1m в Rm , существует m–мерный брус I, который содержит ограниченное множество C, C ⊂ U(a; r) ⊂ I. Так как брус I — компакт в Rm , то C — компакт в Rm по теореме 2. Пример 2.1. Все замкнутые шары и кубы в Rm — компакты.
Пример 2.2. Все сферы в Rm — компакты.
4.3. Предел и непрерывность 4.3.1.
Сходящиеся последовательности в метрическом пространстве
Рассмотрим произвольное метрическое пространство (X; d). Всякое отображение ϕ : N → X определяет последовательность (xn ) точек xn = ϕ(n), n ∈ N в (X; d). Последовательность (xn ) назовём сходящейся в (X; d), если существует некоторый элемент a ∈ X, что lim d(xn , a) = 0. Точка a ∈ X называется пределом последоваn→∞
тельности (xn ) и обозначается a = lim xn . Если (X; d) = R1 , то (xn ) становится числовой последовательностью n→∞
— a ∈ R — число и d(x, y) = |x − y| , x, y, ∈ R1 , так что свойство lim d(xn , a) = 0 принимает вид lim |xn − a| = 0, n→∞
n→∞
что равносильно свойству a = lim xn (число a есть предел числовой последовательности (xn )). n→∞
53
Теорема. Всякая сходящаяся последовательность в метрическом пространстве имеет единственный предел. Предположим, что в метрическом пространстве (X; d) последовательность (xn ) имеет lim xn = a, n→∞
lim xn = b и a 6= b. Так как d(a, b) > 0, то для числа δ = 12 d(a, b) > 0, по определению, существуют натуральные
n→∞
числа Ni ∈ N, i = 1, 2, что d(xn , a) < δ для всех n ∈ N, n > N1 и d(b, xn ) < δ для всех n ∈ N, n > N2 . В частности, для N = max(N1 , N2 ) справедливо d(xN , a) < δ и d(xN , b) < δ. Поэтому расстояние d(a; b) 6 d(xN , a) + d(xN , b) < 2δ = d(a, b), что невозможно. 4.3.2.
Сходящиеся последовательности в Rm
m Пусть (X; d) = Rm , m > 1. Тогда для любой последовательности (xn ) точек xn = (x1n , . . . , xm n ) ∈ R ,n ∈ N i определены координатные числовые последовательности (xn ), i = 1, m. Последовательность (xn ) будет сходящейся в Rm , если существует точка a = (a1 , . . . , am ) ∈ Rm , что lim dm (xn , a) = 0, то есть n→∞
v um uX lim t (xi − ai )2 = 0.
n→∞
i=1
Теорема 1 (критерий сходимости последовательности). Последовательность (xn ), xn = (x1n , . . . , xm n)∈ R , n ∈ N, сходится к точке a = (a1 , . . . , am ) ∈ Rm тогда и только тогда, когда каждая координатная числовая последовательность (xin ), i = 1, m, имеет lim xin = ai . m
n→∞
Необходимость. Пусть a = lim xn , то есть lim dm (xn , a) = 0. Так как d1m 6 dm , то n→∞
n→∞
i xn − ai 6 d1m (xn ; a) 6 dm (xn , a)
для каждого 1 6 i 6 m. Следовательно, lim xin − ai = 0, i = 1, m, или ai = lim xin . n→∞
√
n→∞
Достаточность. Пусть lim xin = ai , i = 1, m. Тогда lim d1m (xn , a) = 0. Так как dm 6 n→∞
n→∞
√ 1 mdm , то dm (xn , a) 6
md1m (xn , a), и, следовательно, lim dm (xn , a) = 0 или a = lim xn . n→∞
n→∞
Напомним, что числовая последовательность (xin ), 1 6 i 6 m, называется фундаментальной (или последова тельностью Коши), если для произвольного ε > 0 существует Ni ∈ N, Ni = Ni (ε), 1 6 i 6 m, что xip − xiq < ε для всех p, q ∈ N, p, q > Ni , 1 6 i 6 m. Определение 1. Последовательность (xn ), xn ∈ Rm , n ∈ N. называется фундаментальной последовательностью (или последовательностью Коши), если для произвольного ε > 0 существует N ∈ N, N = N (ε), что dm (xp , xq ) < ε для всех p, q ∈ N, p, q > N .
Теорема 2 (критерий фундаментальной последовательности в Rm ). Последовательность (xn ), xn = ∈ Rm , n ∈ N, будет фундаментальной в Rm тогда и только тогда, когда каждая её координатная последовательность (xin ) — фундаментальная. Необходимость. Пусть (xn ), xn ∈ Rm , n ∈ N — фундаментальная в смысле определения 1, то есть, для произвольного ε > 0 существует N ∈ N, N = N (ε), что dm (xp , xq ) < ε для всех p, q ∈ N, p, q > N . Так как d1m 6 dm , то d1m (xp , xq ) < ε для всех p, q ∈ N, p, q > N и, следовательно, xip − xiq 6 d1m (xp , xq ) < ε для всех p, q ∈ N, p, q > N ; то есть, каждая (xin ), i = 1, m — фундаментальная. Достаточность. Пусть каждая (xin ), i = 1, m — фундаментальная. Рассмотрим произвольное ε > 0. Тогда существует Ni ∈ N, Ni = Ni (ε), 1 6 i 6 m, что xip − xiq 6 √εm для всех p, q ∈ N, p, q > Ni . Обозначим N = max(N1 , . . . , Nm ). Тогда неравенство xip − xiq < √εm справедливо для всех p, q ∈ N, p, q > N , √ и всех i, 1 6 i 6 m, или d1m (xp , xq ) < √εm для всех p, q ∈ N, p, q > N . Поэтому dm (xp , xq ) 6 md1m (xp , xq ) < ε для всех p, q ∈ N, p, q > N , то есть (xn ) — фундаментальная в Rm . (x1n , . . . , xm n)
Теорема 3 (критерий сходящейся последовательности в Rm ). Последовательность (xn ) точек xn ∈ R , n ∈ N сходится тогда и только тогда, когда (xn ) — фундаментальная (или последовательность Коши). Прямое следствие теорем 1, 2 и критерия Коши сходимости числовой последовательности. m
4.3.3.
Полные метрические пространства
Определение 2. Метрическое пространство называется полным, если в нём сходится каждая последовательность Коши. Пример. Пространства Rm , m > 1 — полные.
54
Определение 3. Последовательность (xn ) точек xn , n ∈ N из метрического пространства (X; d) называют фундаментальной (или последовательностью Коши), если для любого числа ε > 0 существует N ∈ N, N = N (ε), что d(xp , xq ) < ε для всех p, q ∈ N, p, q > N .
Утверждение. Всякая сходящаяся последовательность в метрическом пространстве — фундаментальная. Пусть (X; d) — метрическое пространство и последовательность (xn ), xn ∈ X, n ∈ N, имеет lim xn = n→∞
a, a ∈ X. Рассмотрим произвольное ε > 0. Согласно определению, существует N ∈ N, N = N (ε), что d(xn , a) < для всех n > N , тогда d(xp , xq ) 6 d(xp , a) + d(xq , a) < 2ε + 2ε = ε для всех p, q ∈ N, p, q > N . 4.3.4.
ε 2
Предел отображений метрических пространств
Рассмотрим произвольные метрические пространства (X; d) и (Y, ρ) и произвольную базу B в X. Определение 4. Элемент b ∈ Y есть предел отображения f из X в Y по базе B, если для произвольного ε > 0 существует элемент Bε базы B, что ρ(f (x), b) < ε справедливо для всех точек x ∈ Df ∩ Bε . Напомним, что в (X; d) система U(a) окрестностей точки a ∈ X образует базу. Определение 5. Отображение из Rm , m > 1 в R1 называют функцией (от) m действительных переменных. Если Df ⊂ Rm — область определения функции f , то для любой точки x = (x1 , . . . , xm ) ∈ Df ⊂ Rm число f (x) = f (x1 , . . . , xm ) называют значением функции f в точке x. Если m = 2, обозначают f (x, y); если m = 3, обозначают f (x, y, z). В общем случае функции f (x) = f (x1 , . . . , xm ), область определения Df ⊂ Rm , а множество значений Rf — числовое множество. Определение. Число l = lim f (x), где B — база в Rm тогда и только тогда, когда для любого ε > 0 B
существует Bε ∈ B, что |f (x) − l| < ε для всех x ∈ Bε ; тогда и только тогда, когда для любой окрестности V числа l в R1 = R существует B ∈ B, что f (B ∩ Df ) ⊂ V. Примеры баз 1. Система U(a), a = (a1 , . . . , am ) ∈ Rm — база в Rm ; m 2. Если a — точка прикосновения для множества E ⊂ R и a — не изолированная точка множества E, то ◦
есть для любой U(a, r) ∩ E 6= ∅, r > 0, то система ◦
◦
◦
E ∩ U (a; r) | r > 0 ◦
— база в Rm , обозначаемая E ∋ x → a. ◦
3. Если существует U(a; r0 ), r0 > 0, что U(a; r0 ) ⊂ E, то есть U (a; r0 ) ∩ E = U(a; r0 ), то база E ∋ x → a ◦ обозначается x → a = U(a; δ); δ > 0 . 4. {G(a; r); r > 0} — база в Rm , обозначается x → ∞ , m > 2. l = lim f (x) тогда и только тогда, когда для любого ε > 0 существует δ > 0 такое, что для всех x ∈ E = Df E∋x→a
и 0 < dm (x, a) < δ справедливо |f (x) − l| < ε (или d1 (f (x), l) < ε). Теорема (локальные свойства функций, имеющих предел по базе). Если функции f (x), g(x), x = (x1 , . . . , xm ) ∈ E = Df = Dg имеют пределы lim f (x) = l1 , lim g(x) = l2 , то E∋x→a
1) существует 2) существует
E∋x→a
lim (λ1 f (x) + λ2 g(x)) = λ1 l1 + λ2 l2 для любых λ1 , λ2 ∈ R;
E∋x→a
lim f (x)g(x) = l1 l2 ;
E∋x→a
3) если l2 6= 0, то существует
lim f (x) E∋x→a g(x)
=
l1 l2 ;
4) функции f (x) и g(x) ограничены в некоторой U(a; r0 ) r0 > 0, то есть |f (x)| 6 M, |g(x)| 6 M с некоторым M > 0 для всех x ∈ E = Df = Dg и x ∈ U(a; r0 ); ◦
5) если f (x) 6 g(x) для всех x ∈ E = Df = Dg и x ∈ U(a; r0 ) для некоторого r0 > 0, то l1 =
lim f (x) 6
E∋x→a
lim g(x) = l2 ;
E∋x→a
◦
◦
6) если l2 6= 0, то существует U(a; δ0 ), δ0 > 0, что g(x) 6= 0, x ∈ E ∩ U(a, δ0 ) и sgn g(x) = sgn l2 для всех ◦
x ∈ E ∩ U(a; δ0 ), E = Dg ;
◦
7) если f (x) 6 h(x) 6 g(x) для всех x ∈ U (a; δ0 ) для некоторого δ0 > 0 и x ∈ E = Df = Dg = Dh и l1 = l2 , то существует lim h(x) = l и l = l1 = l2 . E∋x→a
Перечисленные свойства доказаны в первом семестре для произвольных баз и функций. 4.3.5.
Непрерывность функции нескольких переменных
Определение 1. Функция f (x) = f (x1 , . . . , xm ) называется непрерывной в x0 = (x10 , . . . , xm 0 ), если 1) x0 ∈ Df ⊂ Rm ; 55
2) для произвольного ε > 0 существует такое δ > 0, что |f (x) − f (x0 )| < ε для всех x ∈ Df и dm (x, x0 ) < δ.
Утверждение. Если x0 ∈ Df , f (x) = f (x1 , . . . , xm ), x0 = (x10 , . . . , xm 0 ) и x0 — не изолированная точка множества Df = E, то функция f (x) непрерывна в x0 ⇔ f (x0 ) = lim f (x) ⇔ существует lim f (x) = l E∋x→x0
E∋x→x0
и l = f (x0 ). Если Df = G — открытое множество в Rm , то любая точка x0 ∈ G входит в G вместе с некоторой своей окрестностью U(x0 ; r0 ), r0 > 0, и тогда вместо lim f (x) пишут lim f (x). x→x0
E∋x→x0
Итак, если Df = G — открытое множество в Rm , x0 ∈ G, то функция f (x) непрерывна в x0 ⇔ для любого ε > 0 существует δ > 0 такое, что |f (x) − f (x0 )| < ε справедливо для всех x, dm (x, x0 ) < δ (0 < δ 6 r0 , U(x0 ; r0 ) ⊂ Df ) ⇔ для любой окрестности V числа f (x0 ) в R1 существует такая окрестность U точки x0 в Rm , x0 ∈ U ⊂ G, что образ f (U) ⊂ V. Теорема (критерий непрерывности функции в точке). Функция f (x) непрерывна в x0 ∈ E = Df ⇔ для любой последовательности (xn ), xn = (x1n , . . . , xm n ) ∈ E, n ∈ N, lim xn = x0 , числовая последовательность n→∞
(f (xn )) имеет lim f (xn ) = f (x0 ). n→∞
Теорема (локальные свойства непрерывных функций). Если функции f (x), g(x) непрерывны в x0 = m (x10 , . . . , xm 0 ) ∈ E = Df = Dg ⊂ R , то: 1) λ1 f (x) + λ2 g(x) непрерывна в x0 для всех λ1 , λ2 ∈ R; 2) f (x)g(x) непрерывна в x0 ; 3) функции f (x) и g(x) ограничены в некоторой окрестности U(x0 ); (x) 4) если g(x0 ) 6= 0, то fg(x) непрерывна в x0 ; 5) если g(x0 ) 6= 0, то существует U(x0 , δ0 ), δ0 > 0, что sgn g(x) = sgn g(x0 ) для всех x ∈ E = Dg ∩ U(x0 , δ0 ). 4.3.6.
Предел отображения из Rm в Rn
Опишем структуру отображения f из Rm в Rn . Область его определения Df ⊂ Rm , то есть аргумент x = (x , . . . , xm ) ∈ Df ⊂ Rm . Значение f (x) = (f 1 (x), . . . , f n (x)) ∈ Rn , где каждая функция f k (x) = f k (x1 , . . . , xm ), Df = Df k , Df k ⊂ m R , k = 1, n. В частности, если m = 1, имеем отображение из R1 = R в Rn , у которого Df — числовое множество (Df ⊂ R), аргумент x ∈ R — число, а значение f (x) = (f 1 (x), . . . , f n (x)), где f k (x), k = 1, n — числовые функции и Df k = Df — числовое множество. Отображение f (x) = (f 1 (x), . . . , f n (x)), x ∈ E = Df = Df k , k = 1, n — числовое множество, называется векторной функцией. Определение 2. Точка A = (A1 , . . . , An ) ∈ Rn называется пределом отображения f из Rm в Rn с Df = Df k = E ⊂ Rm , k = 1, n по базе E ∋ x → a, a = (a1 , . . . , am ) ∈ Rm , если для любого ε > 0 существует δ > 0, что dn (f (x), A) < ε для всех x ∈ E = Df и 0 < dm (x, a) < δ. Обозначается A = lim f (x). 1
E∋x→a
Теорема. A =
lim f (x) тогда и только тогда, когда для каждого k, k = 1, n справедливо равенство
E∋x→a
Ak =
lim f k (x) =
E∋x→a
Необходимость. Дано, что A =
lim f k (x1 , . . . , xm ).
E∋x→a
lim f (x). Согласно определению 2, для любого ε > 0 существует
E∋x→a
δ > 0, что dn (f (x), A) < ε для всех x ∈ Df = E и 0 < dm (x, a) < δ. Так как f (x) = (f 1 (x), . . . , f n (x)), f k (x) = 1 f k (x1 , . . . , xm ), k = 1, n и A = (A1 , . . . , An ) и метрика d1n (f (x), A) 6 dn (f (x), A) < ε для всех k dn 6k dn , то 1 x ∈ Df = Df k , k = 1, n, и 0 < dm (x, a) < δ, так что f (x) − A 6 dn |f (x); A| < ε для всех x ∈ Df k , k = 1, n, и 0 < dm (x, a) < δ. Иными словами, Ak = lim f k (x), k = 1, n. E∋x→a
Достаточность. Дано, что существует
lim f k (x) = Ak , k = 1, n. Рассмотрим произвольное ε > 0. Со-
E∋x→a
гласно определению предела функции нескольких переменных по базе E ∋ x → a, существует δk > 0, k = 1, n, что k f (x) − Ak < √ε (1) n
для всех x ∈ Df k = Df и 0 < dm (x, a) < δk , k = 1, n. Положим δ = min(δ1 , . . . , δn ), δ > 0. Для всех x ∈ Df = Df k , k = 1, n, и 0 < dm (x, a) < δ неравенство (1) справедливо для любого k, k = 1, n. Поэтому, d1n (f (x), A) < √εn для всех x ∈ Df и 0 < dm (x, a) < δ.
56
√ √ √ Так как dn 6 nd1n , то dn (f (x), A) 6 nd1n (f (x), A) < n · √εn = ε для всех x ∈ Df и 0 < dm (x, a) < δ, то есть A = lim f (x). E∋x→a
4.3.7.
Непрерывные отображения из Rm в Rn
Определение 3. Отображение f : E → Rn , E ⊂ Rm , E = Df , называется непрерывным в неизолированной точке x0 ∈ E, если существует lim f (x) = A и A = f (x0 ). E∋x→x0
Если множество E = Df — открытое в Rm , Df = G, и x0 ∈ G, то отображение f : G → Rn непрерывно в x0 , если для произвольного ε > 0 существует такое δ > 0, что dn (f (x), f (x0 )) < ε для всех x, dm (x, x0 ) < δ(x ∈ G). Теорема (критерий непрерывного отображения из Rm в Rn ). Отображение f из Rm в Rn непрерывно m в точке x0 = (x10 , . . . , xm и 2) каждая функция f k (x) = f k (x1 , . . . , xm ), k = 1, n, где 0 ) ⇔ 1) x0 ∈ Df ⊂ R 1 n f (x) = (f (x), . . . , f (x)), непрерывна в x0 . Прямое следствие теоремы пункта 3.6 и определения непрерывной функции, f k (x0 ) = lim f k (x), k = E∋x→x0
1, n. Рассмотрим функцию f (x) = f (x1 , . . . , xm ), определённую на открытом множестве G ⊂ Rm и некоторую точку x0 = (x10 , . . . , xm 0 ) ∈ G. Функция f (x) называется непрерывной в x0 (f ∈ C(x0 )) ⇔ для произвольного ε > 0 существует δ > 0, что |f (x) − f (x0 )| < ε для всех x, dm (x, x0 ) < δ (x = (x1 , . . . , xm ) ∈ G). i+1 i m i Фиксируем xk = xk0 , k = 1, m, k 6= i, i = 1, m. Тогда f (x10 , . . . , xi−1 0 , x , x0 , . . . , x0 ) = ϕi (x ), i = 1, m. i i Утверждение. Если f ∈ C(x0 ), то каждая ϕi (x ), i = 1, m, непрерывна в x0 . Рассмотрим произвольное ε > 0, находим δ > 0 такое, что |f (x) − f (x0 )| < ε для всех x, dm (x, x0 ) < δ. i+1 i m В частности, для x = (x10 , . . . , xi−1 0 , x , x0 , . . . , x0 ), имеем v um uX dm (x, x0 ) = t (xk0 − xk0 )2 + (xi − xi0 )2 = xi − xi0 < δ, k=1
а |f (x) − f (x0 )| = ϕi (xi ) − ϕi (xi0 ) < ε, то есть ϕi (xi ) непрерывна в xi0 , i = 1, m. Пример.
xy , если (x, y) 6= (0, 0); + y2 f (x, y) = 0, если (x, y) = (0, 0). x2
f (x, 0) = 0, x ∈ R; f (0, y) = 0, y ∈ R. f (0, 0) = 0. Функции f (x, 0) и f (0, y) непрерывны соответственно в x = 0 и y = 0. С другой стороны, предел lim f (x, y) не существует, так как
(x,y)→(0,0)
lim
(x,0)→(0,0)
f (x, y) = lim f (x, 0) = 0 = f (0, 0),
lim
x→0
(0,y)→(0,0)
однако lim
(x,y)→(0,0)
f (x, y) = lim f (x, x) = lim x→0 x6=0
x→0
f (x, y) = lim f (0, y) = 0 = f (0; 0), y→0
1 1 = 6= f (0, 0). 2 2
По определению, f ∈ C(x0 ), x0 ∈ G ⊂ Rm — открытое множество ⇔ для любого ε > 0 найдётся δ > 0 такое, что |f (x) − f (x0 )| < ε (или d1 (f (x), f (x0 )) < ε) для всех x ∈ G, dm (x, x0 ) < δ ⇔ для любой окрестности V точки f (x0 ) в R1 существует окрестность U точки x0 в Rm , U ⊂ G, что образ f (U) ⊂ V. 4.3.8.
Непрерывные отображения открытых множеств метрических пространств
Рассмотрим произвольные метрические пространства (X; d) и (Y ; ρ) и множество G ⊂ X — открытое в (X; d), x0 ∈ G — произвольное. Определение 1. Отображение f : G → Y называют непрерывным в x0 ∈ G, если для произвольного ε > 0 существует δ > 0 такое, что ρ(f (x), f (x0 )) < ε для всех x ∈ G, d(x, x0 ) < δ.
Определение 1’. Отображение f : G → Y называют непрерывным в x0 ∈ G, если для любой окрестности V точки f (x0 ) в (Y, ρ) существует окрестность U точки x0 в (X; d), U ⊂ G, что образ f (U) ⊂ V.
Теорема (критерий непрерывности отображения открытого множества). Отображение f : G → Y открытого множества G в (X; d) непрерывно в каждой точке множества G (то есть непрерывно на G) тогда и только тогда, когда прообраз f −1 (V) любого открытого множества V в (Y, ρ) есть открытое множество в (X; d). 57
Необходимость. Дано, что f : G → Y непрерывно в каждой точке x0 ∈ G — открытого множества. Рассмотрим произвольное открытое V в (Y, ρ). Если f −1 (V) = ∅, то f −1 (V) — открытое в (X; d). Пусть f −1 (V) 6= ∅ и x0 ∈ f −1 (V). Тогда x0 ∈ G, и так как f (x0 ) ∈ V и V — открытое множество, то согласно определению 1′ , существует шар U(x0 , r), что f (U(x0 ; r)) ⊂ V. Тогда U(x0 , r) = f −1 (f (U(x0 ; r)) ⊂ f −1 (V). Таким образом, x0 входит в f −1 (V) вместе с некоторым своим открытым шаром, так что f −1 (V) — окрестность (каждой) своей точки x0 , то есть f −1 (V) — открытое. Достаточность. Дано, что f −1 (V) каждого открытого множества V в (Y, ρ) есть открытое множество в (X; d). Рассмотрим произвольное x0 ∈ G и y0 = f (x0 ) ∈ Y . Рассмотрим произвольную окрестность V точки T f (x0 ) в (Y, ρ). Тогда f −1 (V) — открытое, x0 ∈ f −1 (V) и x0 ∈ f −1 (V) ∩TG. Множество f −1 (V) G — открытое (как пересечение открытых множеств). Следовательно, U = f −1 (V) G — некоторая окрестность точки x0 и T −1 f (f (V) G) ⊂ f (f −1 (V)) = V. Согласно определению 1′ , отображение f непрерывно в точке x0 . 1
4.3.9.
Непрерывность композиции
1
1
Рассмотрим функции x = ϕ (t) = ϕ (t1 , t2 , . . . , tk ), . . . , xm = ϕm (t) = ϕm (t1 , . . . , tk ), где t = (t1 , . . . , tk ) ∈ E ⊂ Rk , E ∗ — множество в Rk . Эти функции задают отображение x = ϕ(t), ϕ(t) = (ϕ1 (t), . . . , ϕm (t)) множества E ∗ в Rm . Обозначим образ ϕ(E ∗ ) = E — множество в Rm . Рассмотрим на E ⊂ Rm функцию f (x) = f (x1 , . . . , xm ) и её композицию (f ◦ ϕ)(t) = F (t) = F (t1 , . . . , tk ). Теорема (о непрерывности сложной функции). Если отображение x = ϕ(t) непрерывно на множестве E ∗ , а функция f (x) непрерывна на E = ϕ(E ∗ ), то сложная функция F (t) = (f ◦ ϕ)(t) непрерывна на E ∗ . Рассмотрим произвольную точку t0 ∈ E ∗ и произвольную последовательность (tn ) точек tn ∈ E ∗ такую, что lim tn = t0 (t0 = (t10 , . . . , tk0 ), tn = (t1n , . . . , tkn ), n ∈ N). Так как отображение x = ϕ(t) непрерывно в t0 , то ∗
n→∞
каждая функция ϕj (t) = ϕj (t1 , . . . , tk ), j = 1, m непрерывна в t0 , следовательно, lim ϕj (tn ) = ϕj (t0 ), j = 1, m. n→∞
1 m j j Таким образом, если xn = ϕ(tn ) = (x1n , . . . , xm n ) = (ϕ (tn ), . . . , ϕ (tn )), то lim xn = lim ϕ (tn ) = ϕ (t0 ) = n→∞
n→∞
xj0 , j = 1, m, и x0 = (x10 , . . . , xn0 ) ∈ E. Так как функция f (x) непрерывна в x0 ∈ E, то f (x0 ) = lim f (xn ), где n→∞
xn = (x1n , . . . , xm n ). Поэтому lim F (tn ) = lim (f ◦ϕ)(tn ) = lim f (ϕ(tn )) = lim f (xn ) = f (x0 ) = (f ◦ϕ)(t0 ) = F (t0 ) n→∞
n→∞
n→∞
n→∞
для любой последовательности (tn ) точек tn ∈ E ∗ , lim tn = t0 . Согласно критерию, F непрерывна в t0 ∈ E ∗ . n→∞
Рассмотрим отображение f множества E = ϕ(E ∗ ) ⊂ Rm в Rn , то есть f (x) = (f 1 (x), . . . , f n (x)), где f j (x) = f j (x1 , . . . , xm ), j = 1, n, x = (x1 , . . . , xm ) ∈ E ⊂ Rm .
Теорема. Если отображение x = ϕ(t) непрерывно на множестве E ∗ , и отображение f множества E = ϕ(E ∗ ) ⊂ Rm в пространство Rn непрерывно на множестве E, то их композиция f ◦ ϕ, являющаяся отображением множества E ∗ ⊂ Rk в пространство Rn , непрерывна на множестве E ∗ ⊂ Rk . Отображение (f ◦ ϕ)(t), t ∈ E ∗ , имеет компоненты (f ◦ ϕ)(t) = (F 1 (t), . . . , F k (t)), где F j (t) = F j (ϕ1 (t), . . . , ϕk (t)), j = 1, n, t = (t1 , . . . , tk ). Согласно предыдущей теореме, каждая функция F j (t), j = 1, n непрерывна на E ∗ . Таким образом, непрерывно и отображение (f ◦ ϕ)(t) на E ∗ . 4.3.10.
Равномерно непрерывные отображения из Rm в Rn
Определение. Отображение f (x) из Rm в Rn называется равномерно непрерывным на множестве E ⊂ Rm , если E ⊂ Df и для любого ε > 0 существует δ > 0 такое, что dn (f (x′ ), f (x′′ )) < ε для всех x′ , x′′ ∈ E, для которых dm (x′ , x′′ ) < δ. Теорема. Всякое равномерно непрерывное отображение множества непрерывно в каждой точке множества. Фиксируем произвольное x0 ∈ E. Согласно определению, для любого ε > 0 существует δ > 0, что dn (f (x), f (x0 )) < ε для всех x ∈ E, dn (f (x), f (x0 )) < ε для всех x ∈ E, dm (x, x0 ) < δ, то есть f непрерывна в x0 ∈ E. Аффинное отображение A(x) = y пространства Rm в Rn , m > 1, n > 1 задаётся матрицей A = aji , i =
1, m, j = 1, n и вектором b = (b1 , . . . , bn ) ∈ Rn , так что для любого x = (x1 , . . . , xm ) ∈ Rm его образ y = A(x), y = m P (y 1 , . . . , y n ) ∈ Rn и y j = aji xi + bj , j = 1, n. i=1
В матричной форме
58
1 y1 a1 .. .. . = . yn
an1
a12 .. . an2
1 1 . . . a1m x b .. · .. + .. .. . . . . . . . anm xm bn
Таким образом, y = A(x) = L(x) + b, где L(x) — линейное отображение из Rm в Rn , задаваемое матрицей A. Утверждение. Любое аффинное отображение A(x) равномерно непрерывно на Rm . 1 m Рассмотрим произвольные точки x1 = (x11 , x21 , . . . , xm 1 ), x2 = (x2 , . . . , x2 ) и y1 = A(x1 ), y2 = A(x2 ). Тогда y2 − y1 = L(x2 ) + b − L(x1 ) − b = L(x2 ) − L(x1 ) = L(x2 − x1 ). Если y1 = (y11 , . . . , y1n ), y2 = (y21 , . . . , y2n ), то m P y2j − y1j = aji (xi2 − xj1 ), j = 1, m. Обозначим α = max aji > 0. i,j i=1 Если dm (x1 , x2 ) < r, то xi2 − xi1 6 dm (x1 , x2 ) < r, i = 1, m, и y2j − y1j 6 m · α · r, j = 1, n, так что √ √ dn (y1 , y2 ) 6 n · max y2j − y1j < m · n · α · r. Рассмотрим произвольное ε > 0 и положим δ = m√εn·α > 0, δ = δ(ε). j √ Тогда, если dm (x1 , x2 ) < δ, то dn (y1 , y2 ) < m nα · δ = ε, то есть y = A(x) равномерно непрерывно в Rm . В частности, любое линейное отображение L(x) пространства Rm в Rn равномерно непрерывно на Rm . При n = 1 заключаем, что любая линейная функция L(x) = a1 x1 + . . . + am xm равномерно непрерывна на Rm .
4.4. Глобальные свойства непрерывных отображений 4.4.1.
Линейно связные множества в Rm
Определение 1. Непрерывной кривой Γ в Rm называют всякую непрерывную функцию (вектор–функцию) x = ϕ(t), областью определения Dϕ которой служит некоторый отрезок [α, β] ⊂ R. То есть Γ = (ϕ1 (t), . . . , ϕm (t)) | ϕi (t) ∈ C[α, β], [α, β] ⊂ R, i = 1, m .
Точки с координатами (ϕ1 (α), . . . , ϕm (α)) и (ϕ1 (β), . . . , ϕm (β)) ∈ Rm называются концевыми точками кривой Γ. Прямолинейный отрезок [a, b] с концевыми точками a = (a1 , . . . , am ), b = (b1 , . . . , bm ) ∈ Rm , задаваемый вектор–функцией x = x(t) = (x1 (t), . . . , xm (t)) и xi (t) = tbi + (1 − t)ai , t ∈ [0, 1], i = 1, m. x(0) = a, x(1) = b, и все xi (t), i = 1, m непрерывны на [0, 1]. Определение 2. Множество E ⊂ Rm называют линейно связным, если для любых его точек x1 , x2 ∈ E можно указать непрерывную кривую Γ, лежащую в E и соединяющую x1 и x2 . Определение 3. Всякое открытое и линейно связное множество в Rm называется областью в Rm .
Определение 4. Множество E ⊂ Rm называется выпуклым, если вместе с любыми своими точками x1 , x2 ∈ E оно содержит прямолинейный отрезок [x1 , x2 ]. Утверждение. Любой открытый шар U(a; r), a = (a1 , . . . , am ) ∈ Rm , r > 0, есть выпуклая область в Rm . Шар U(a; r) — открытое множество в Rm . Рассмотрим произвольные точки x1 = (x11 , . . . , xm 1 ) и x2 = 1 (x2 , . . . , xm ), лежащие в U(a; r), то есть d (x , a) < r, k = 1, 2. m k 2 Прямолинейный отрезок [x1 , x2 ] задаётся вектор-функцией x(t) = x1 (t), . . . , xm (t) , xi (t) = txi2 + (1 − t)xi1 , t ∈ [0, 1], i = 1, m. С учётом dm (xk , a) < r, k = 1, 2, и неравенства Минковского, имеем оценку (в этой выкладке все суммы по индексу i от 1 до m): qX qX 2 dm (x(t), a) = (xi (t) − ai )2 = txi2 + (1 − t)xi1 − tai − (1 − t)ai = qX 2 = t(xi2 − ai ) + (1 − t)(xi1 − ai ) 6 qX qX 6 t2 (xi2 − ai )2 + (1 − t)2 (xi1 − ai )2 = t · dm (x2 , a) + (1 − t) dm (x1 , a) < t r + (1 − t) r = r. Итак, отрезок [x1 , x2 ] ⊂ U(a, r), то есть U(a, r) — выпуклая область в Rm .
59
4.4.2.
Непрерывный образ линейно связного множества в Rm
Теорема. Если E — линейно связное множество в Rm , то для любого непрерывного на E отображения f в Rn множество f (E) — связное в Rn . Рассмотрим произвольные y1 , y2 ∈ f (E) ⊂ Rn и выберем некоторые x1 , x2 ∈ E такие, что f (x1 ) = y1 , f (x2 ) = y2 . Так как E — линейно связное, то существует непрерывная кривая Γ, соединяющая x1 и x2 и лежащая в E; то есть, существует непрерывная вектор–функция x = ϕ(t) = (ϕ1 (t), . . . , ϕm (t)), t ∈ [α, β] ⊂ R, что ϕ(t) ∈ E, t ∈ [α, β] и ϕ(α) = x1 , ϕ(β) = x2 . Композиция (f ◦ ϕ)(t) непрерывных отображений f и ϕ — непрерывная вектор–функция, определённая на [α, β]. При этом F (α) = f (ϕ(α)) = f (x1 ) = y1 и F (β) = f (ϕ(β)) = f (x2 ) = y2 , а также F ([α, β]) = f (Γ) ⊂ f (E). Таким образом, f (Γ) непрерывно в f (E) и f (E) — связное в Rn . 4.4.3.
Непрерывные отображения компактов в Rn
Рассмотрим произвольный компакт C в Rm . Теорема 1. Если отображение f : C → Rn непрерывно на C, то f равномерно непрерывно на C. Так как отображение f непрерывно в произвольной точке x T ∈ C, то для любого ε > 0 существует δ = δ(x, ε) > 0, δ = δ(x), что dn (f (x′ ), f (x)) < 3ε для всех x′ ∈ U(x, δ(x)) C ⊂ Rm . Тогда ε ε + <ε 3 3 T S для любых x′ , x′′ ∈ U(x, δ(x)) C. Обозначим V(x) = U x, δ(x) , x ∈ C. Тогда V(x) ⊃ C есть открытое 2 dn (f (x′ ), f (x′′ )) 6 dn (f (x′ ), f (x)) + dn (f (x′′ ), f (x)) <
x∈C
покрытие компакта C, которое обязано содержать некоторое конечное покрытие V(x1 ), . . . , V(xk ) компакта C, k S то есть V(xj ) ⊃ C. Положим δ = min δ(x2 1 ) , . . . , δ(x2k ) , δ > 0, δ = δ(ε). j=1
Рассмотрим произвольные x′ , x′′ ∈ C, для которых dm (x′ , x′′ ) < δ. Существует V(xj ) ∋ x′ , то есть dm (x′ , xj ) < δ(xj ) 2 . Тогда δ(xj ) δ(xj ) δ(xj ) dm (x′′ , xj ) 6 dm (x′′ , x′ ) + dm (x′ , xj ) < δ + 6 + = δ(xj ), 2 2 2 то есть x′′ ∈ U(xj , δ(xj )) и x′ ∈ U(xj , δ(xj )), так что dn (f (x′ ), f (x′′ )) < ε. C.
Теорема 2. Если отображение f : C → Rn непрерывно на компакте C, то отображение f ограничено на
Как и в доказательстве теоремы 1, заключаем, что для произвольной точки x ∈ C существует такая её окрестность U(x) ⊂ Rm , в которой непрерывной отображение f локально ограничено, то есть существует S M = M (x) > 0, что dn (f (x′ ), 0) 6 M (x) для всех x′ ∈ U(x) ∩ C. Так как U(x) ⊃ C, то это открытое покрытие x∈C
компакта C содержит некоторое конечное покрытие U(x1 ), . . . , U(xk ), то есть C ⊂
k S
j=1
U(xj ).
Положим M = max(M (x1 ), . . . , M (xk )), M > 0. Для любой x ∈ C существует U(xj ) ∋ x, и, следовательно, dn (f (x), 0) 6 M (xj ) 6 M . Теорема 3. Если функция f (x) = f (x1 , . . . , xm ) непрерывна на компакте C ⊂ Rm , то существуют такие точки x1 , x2 ∈ C, в которых f (x1 ) 6 f (x) 6 f (x2 ) для всех x ∈ C. Согласно теореме 2, существует число m = inf f (x), M = sup f (x) и m 6 f (x) 6 M для всех x ∈ C. x∈C
x∈C
Если предположить, что f (x) < M для всех x ∈ C, то для произвольного ε > 0 существует xε ∈ C такое, 1 1 что M − ε < f (xε ) и функция M−f (x) определена и непрерывна на C. Согласно теореме 2, функция M−f (x) ограничена на C, но её значение M−f1 (xε ) > 1ε , что ведёт к противоречию в силу произвольности ε > 0. 4.4.4. Непрерывные отображения линейно связных множеств Теорема. Если множество E ⊂ Rm линейно связно, то для любой непрерывной функции f (x) = f (x1 , . . . , xm ) на E, и любых точек a = (a1 , . . . , am ), b = (b1 , . . . , bm ) ∈ E, в которых f (a) = A; f (b) = B, на E существует точка c ∈ E, в которой f (c) = C для любого числа C, лежащего между A и B. Так как E — линейно связно, существует непрерывная вектор–функция x = ϕ(t) = (ϕ1 (t), . . . , ϕm (t)), t ∈ [α, β], что ϕ(α) = a, ϕ(β) = b и ϕ(t) ⊂ C, t ∈ [α, β], композиция (f ◦ϕ)(t) непрерывной функции f и непрерывного отображения ϕ непрерывна на [α, β] и (f ◦ϕ)(α) и (f ◦ϕ)(α) = f (ϕ(α)) = f (a) = A; (f ◦ϕ)(β) = f (ϕ(β)) = f (b) = B. 60
По теореме Коши о промежуточных значениях, существует γ ∈ [α, β] такое, что f (ϕ(γ)) = C, при этом ϕ(γ) = c ∈ E (так как ϕ(t) ∈ E, t ∈ [α, β]). Получаем, что f (c) = C.
5. Дифференцируемые функции нескольких переменных 5.1. Частные производные 5.1.1.
Основные определения и обозначения
Рассмотрим функцию f (x) = f (x1 , . . . , xm ), область определения Df которой есть окрестность каждой своей точки; то есть, множество Df — открытое в Rm . Фиксируем точку x = (x1 , . . . , xm ) ∈ Df . Для любой точки x1 = (x11 , . . . , xm 1 ) ∈ Df разность x1 − x = ∆x называется (полным) приращением аргумента функции f в точке m P m 1 m x. На самом деле, ∆x — вектор в Rm и ∆x = (x11 − x1 , . . . , xm ∆xk ek , 1 − x ) = (∆x , . . . , ∆x ). При этом ∆x = k=1
где ek , k = 1, m — стандартный базис. ek = (0, . . . , 0, 1, 0, . . . , 1), k = 1, m, и ∆xk ek = (0, . . . , ∆xk , . . . , 0), k = 1, m и f (x + ∆xk ek ) − f (x) = ∆k f (x) — k
частное приращение функции f в точке x по k-й переменной xk . Разность f (x + ∆x) − f (x) = ∆f (x) — (полное) приращение функции f в точке x, отвечающее приращению ∆x аргумента в точке x. Определение 1. Частной производной функции f (x) = f (x1 , . . . , xm ) по k–ой переменной («по xk ») назовём функцию — будем обозначать её ∂k f (x) — задаваемую следующими условиями: а) областью определения функции ∂k f (x) служат все те точки x ∈ Df , для которых разностное отношение f (x+∆xk ek )−f (x) ∆xk
имеет предел по базе ∆xk → 0 (при ∆xk → 0) б) в каждой такой точке значение ∂k f (x) равно этому пределу, то есть f (x + ∆xk ek ) − f (x) . ∆xk ∆xk →0
(1)
∂k f (x) = lim В координатной форме формула (1) имеет вид ∂k f (x) = lim
∆xk →0
f (x1 , . . . , xk−1 , xk + ∆xk , xk+1 , . . . , xm ) − f (x1 , . . . , xm ) . ∆xk
(1′ )
Для f (x, y) справедливо ∂1 f (x, y) = lim
h→0
f (x + h, y) − f (x, y) , h
∂2 f (x, y) = lim
k→0
f (x, y + k) − f (x, y) k
(h = ∆x, k = ∆y).
Рассмотрим частную функцию ϕk (z) = f (x1 , . . . , xk−1 , z, xk+1 , . . . , xm ). Тогда ϕk (xk ) = f (x1 , . . . , xm ),
ϕk (xk + ∆xk ) = f (x1 , . . . , xk−1 , xk + ∆xk , xk+1 , . . . , xm )
и формула (1’) принимает вид ϕk (xk + ∆xk ) − ϕk (xk ) = ϕ′k (xk ); ∆xk ∆xk →0
∂k f (x) = lim
В частности, для f (x, y) имеем fx′ = Пример. Функция
∂f ′ ∂x , fy
=
∂k f :=
∂f = fx′ k ; ∂xk
∂f ∂y .
xy , если x2 + y 2 6= 0; 2 + y f (x, y) = 0, если x2 + y 2 = 0 (x = y = 0). x2
имеет f (x, 0) = 0, f (0, y) = 0 и, следовательно, fx′ (0, 0) = 0, fy′ (0, 0) = 0, но f (x, y) разрывна в (0, 0) (не имеет предела).
61
5.1.2.
Производная по направлению
Единичный орт (вектор единичной длины) e задаёт направление в Rm . Когда говорят, что точка x′ находится от точки x в направлении орта e, то имеют в виду, что x′ = x + ρe, где ρ > 0. В частности, координатные орты ek , k = 1, m задают положительные направления координатных осей. Для любых x, y ∈ Rm однозначно или hx, yi = kxkm · kykm cos ϕ. определён угол ϕ между векторами x и y по формуле cos ϕ = kxkhx,yi ·kyk m
m
Если x = (x1 , . . . , xm ), то xk = hx, ek i, где ek , k = 1, m — стандартный базис. Если орт e = (e1 , . . . , em ), то ek = he, ek i , k = 1, m. Обозначим αk — угол между e и ek , k = 1, m. Тогда k e = he, ek i = kekm · kek km · cos αk = cos αk , k = 1, m. Итак, e = (cos α1 , . . . , cos αm ) и числа cos α1 , . . . , cos αm — направляющие косинусы орта e. m P cos2 αk = 1. k=1
Определение 2. Производной по направлению орта e функции f (x) = f (x1 , . . . , xm ) называют функцию — будем обозначать её ∂e f (x) — заданную следующими условиями: (x) а) областью её определения служит множество тех точек x ∈ Df , для которых f (x+te)−f имеет предел при t t → 0; б) в каждой такой точке значение ∂e f (x) равно этому пределу, т.е. ∂e f (x) = lim
t→0
f (x + te) − f (x) . t
(2)
В частности, ∂k f (x) = ∂ek f (x), k = 1, m. Так как e = (cos α1 , . . . , cos αm ), то te = (t cos α1 , . . . , t cos αm ). f (x1 + t cos α1 , . . . , xm + t cos αm ) − f (x1 , . . . , xm ) . t→0 t
∂e f (x) = lim
(2′ )
Рассмотрим функцию ϕ(t) = f (x1 + t cos α1 , . . . , xm + t cos αm ), считая фиксированной точку x = (x1 , . . . , xm ) и орт e с направляющими косинусами. ∂e f (x) = lim
t→0
(
ϕ(t) − ϕ(0) = ϕ′ (0). t
(2′′ )
1, если 0 < y < x2 ; в точке (0, 0) разрывна. Однако на каждой пря0, если y 6 0 или y > x2 . мой, проходящей через точку (0, 0), имеется окрестность этой точки, на которой f постоянна, а отсюда следует, что f в точке (0, 0) по любому направлению имеет производную (равную нулю) (нарисуйте чертёж на плоскости Oxy). Пример. Функция f (x, y) =
5.2. Дифференцируемость функций нескольких переменных 5.2.1.
Понятие дифференцируемости функции
Определение 1. Функцию f (x) = f (x1 , . . . , xm ) называют дифференцируемой в точке x ∈ Df , если Df — окрестность точки x и справедливо представление: f (x + ∆x) − f (x) = l(∆x) + α(∆x) · k∆xkm , где l(h) =
m P
k=1
(1)
ak hk , h = (h1 , . . . , hm ) ∈ Rm — некоторая линейная функция в Rm , а функция α(∆x) =
= α(∆x1 , . . . , ∆xm ) непрерывна в нуле, и lim α(∆x) = 0 = α(0). Обозначение: f ∈ D(x). ∆x→0
Отметим, что функция kxkm непрерывна в каждой x ∈ Rm как композиция непрерывных функций — v um uX kxkm = t (xk )2 . k=1
Теорема 1. Функция f (x) = f (x1 , . . . , xm ) дифференцируема в точке x ∈ Df тогда и только тогда, когда справедлива формула m X f (x + ∆x) − f (x) = l(∆x) + αk (∆x) · ∆xk , (1′ ) k=1
62
в которой l(∆x) — некоторая линейная функция в Rm , а функции αk (∆x) = αk (∆x1 , . . . , ∆xm ) непрерывны в ∆x = 0 и lim αk (∆x) = 0 = αk (0), k = 1, m. ∆x→0
Пусть f ∈ D(x) в смысле определения 1, то есть справедливо (1). Но α(∆x) k∆xkm
и (1) переходит в (1’) с
m X α(∆x) · (∆xk )2 , если ∆x 6= 0; = k=1 k∆xkm 0, если ∆x = 0
α(∆x) · (∆xk )2 , если ∆x 6= 0, k = 1, m; αk (∆x) = k∆xkm 0, если ∆x = 0. При этом |αk (∆x)| = |α(∆x)| · ∆xk 6 |α(∆x)| и, следовательно, lim αk (∆x) = 0, k = 1, m, так как k∆xk ∆x→0
m
lim (∆x) = 0.
∆x→0
Пусть выполнено (1’). Положим
α(∆x) =
Согласно неравенству Коши,
m X 1 · αk (∆x) · ∆xk , если ∆x 6= 0; k∆xkm k=1
0, если ∆x = 0.
v v v um um um X uX uX 1 u 2 2 k t t |α(∆x)| 6 αk (∆x) · (∆x ) = t α2k (∆x), k∆xkm k=1
k=1
k=1
и, следовательно, lim α(∆x) = 0, так как lim αk (∆x) = 0, k = 1, m. ∆x→0
∆x→0
Теорема 2. Если функция f (x) дифференцируема в точке x ∈ Df , то f непрерывна в x. Так как f ∈ D(x), то справедлива формула (1), в которой функции l(∆x), α(∆x) и k∆xkm непрерывны на Rm , и следовательно, lim l(∆x) = l(0) = 0, lim α(∆x) = 0, lim k∆xkm = k0km = 0. Поэтому ∆x→0
∆x→0
∆x→0
lim (f (x + ∆x) − f (x)) = 0, то есть f (x) = lim f (x + ∆x).
∆x→0
∆x→0
5.2.2.
Дифференцируемость и частные производные
Теорема 3. Функция f , дифференцируемая в x = (x1 , . . . , xm ) ∈ Df ⊂ Rm , имеет в x все частные производные ∂k f (x), k = 1, m. По условию теоремы и теореме 1, справедливо представление f (x + ∆x) − f (x) =
m X
ak ∆xk +
k=1
m X
αk (∆x)∆xk .
k=1
Фиксируем k, 1 6 k 6 m, и рассмотрим ∆x = ∆xk ek . Тогда f (x + ∆xk ek ) − f (x) = ak ∆xk + αk (∆xk )∆xk
и
f (x + ∆xk ek ) − f (x) = ak + αk (∆xk ). ∆xk
Так как lim αk (∆xk ) = 0, то ∆xk →0
ak = lim
∆xk →0
f (x + ∆xk ek ) − f (x) = ∂k f (x), ∆xk
63
k = 1, m.
Следствие. Если функция f (x) = f (x1 , . . . , xm ) дифференцируема в x = (x1 , . . . , xm ) ∈ Df , то f (x + ∆x) − f (x) =
m X ∂f (x) · ∆xk + α(∆x) k∆xkm , ∂xk
(1)
k=1
где lim α(∆x) = 0 = α(0) и ∆x→0
f (x + ∆x) − f (x) =
m m X X ∂f k (x) · ∆x + αk (∆x) · ∆xk , ∂xk
(1′ )
k=1
k=1
где lim αk (∆x) = 0 = αk (0), k = 1, m. ∆x→0
f (x + ∆x) − f (x) =
m X ∂f (x)∆xk + o(∆x), ∆x → 0, ∂xk
(1′′ )
k=1
где o(∆x) непрерывна в ∆x = 0. Теорема 4. Если функция f (x) дифференцируема в точке x ∈ Df — открытое множество в Rm , то в x существуют все ∂e f (x) по любому направлению e и если e = (cos α1 , . . . , cos αm ), то ∂e f (x) =
m X ∂f (x) cos αk . ∂xk
(2)
k=1
Согласно условию теоремы, справедливо (1’) и если ∆x = t e = (t cos α1 , . . . , t cos αm ), то "m # m m m X X ∂f X X ∂f (x) · t cos αk + αk (t e)t cos αk = t (x) cos αk + αk (t e) cos αk . f (x + t e) − f (x) = ∂xk ∂xk k=1
k=1
k=1
и
k=1
m X ∂f f (x + t e) − f (x) (x) cos αk = lim = ∂e f (x). k t→0 ∂x t k=1
5.2.3. 1
Градиент
Рассмотрим функцию f (x) = f (x , . . . ,x ), дифференцируемую в x = (x1 , . . . , xm ) ∈ Df . Согласно теореме ∂f ∂f ∂f 3, существуют ∂x k (x), k = 1, m. Вектор ∂x1 (x), . . . , ∂xm (x) называют градиентом функции f в точке x и обозначают grad f (x). Тогда, согласно (2), ∂e f (x) = hgrad f (x), ei. Утверждение. Если grad f (x) 6= 0, то функция ∂e f (x) имеет наибольшее значение тогда, когда e = grad f (x) kgrad f (x)k , то есть когда e — направляющий орт градиента. m
e
Согласно неравенству Коши – Буняковского и (2),
|∂e f (x)| = |hgrad f (x), ei| 6 kgrad f (x)km · kekm = kgrad f (x)km . С другой стороны,
grad f (x),
grad f (x) kgrad f (x)km
= kgrad f (x)km .
Значит, число kgrad f (x)km — наибольшее значение для ∂e f (x), которое достигается для e =
grad f (x) kgrad f (x)km .
Истолковывая производную f (x) по направлению e в точке x как скорость изменения функции f в этом направлении, можно сказать, что grad функции в точке есть вектор, указывающий направление и скорость наибольшего роста функции в этой точке. v um 2 uX ∂f kgrad f (x)km = t (x) . ∂xk k=1
64
5.2.4.
Достаточное условие дифференцируемости
Теорема. Функция двух переменных f (x, y) будет дифференцируемой в точке M (x, y), если частная производная fy′ по y определена и конечна в точке M , а fx′ определена в некоторой окрестности U точки M (x, y) и непрерывна в M (x, y). Функции fx′ и fy′ можно поменять местами. Рассмотрим (∆x, ∆y) такие, что (x + ∆x, y + ∆y) ∈ U, а также точка (x + ∆x, y) ∈ U и разность f (x + ∆x, y + ∆y) − f (x, y) представим в виде ∆f (M ) = f (x + ∆x, y + ∆y) − f (x, y) = [f (x + ∆x, y + ∆y) − f (x, y + ∆y)] + [f (x, y + ∆y) − f (x, y)] .
(3)
Так как существует fy′ (x, y), то [f (x, y + ∆y) − f (x, y)] = fy′ (x, y)∆y + α2 (∆y)∆y,
(4)
где lim α2 (∆y) = 0 и (4), определённую первоначально для ∆y 6= 0, можно доопределить в ∆y = 0, положив ∆y→0
α2 (0) = 0, так что α2 (∆y) — непрерывная бесконечно малая функция аргумента ∆y. lim α2 (∆y) = 0 = α(0). (∆x,∆y)→(0,0)
Согласно теореме о среднем значении, f (x + ∆x, y + ∆y) − f (x, y + ∆y) = fx′ (x + θ∆x, y + ∆y)∆x,
0 < θ < 1.
(5)
Так как fx′ непрерывна в точке (x, y), то fx′ (x + θ∆x, y + ∆y) = fx′ (x, y) + α1 (∆x, ∆y),
(6)
где lim
(∆x,∆y)→(0,0)
α1 (∆x, ∆y) = 0 = α1 (0, 0).
Подставляем (4),(5),(6) в (3); получим ∆f (M ) = fx′ (x, y)∆x + fy′ (x, y)∆y + α1 ∆x + α2 ∆y, где
lim
(∆x,∆y)→(0,0)
αi = 0, i = 1, 2, то есть, согласно (1’), f (x, y) дифференцируема в (x, y).
Доказанная выше теорема справедлива при более сильных предположениях о существовании обеих fx′ и fy′ в некоторой окрестности U точки M (x, y) и непрерывности их в точке M (x, y). Теорема. Функция f (x) = f (x1 , . . . , xm ) будет дифференцируемой в x = (x1 , . . . , xm ) ∈ Df — открытое ∂f множество в Rm , если все частные производные ∂x k (x), k = 1, m существуют в некоторой окрестности U точки x ∈ U ⊂ Df и непрерывны в x.
Определение. Функцию f (x) = f (x1 , . . . , xm ) назовём принадлежащей классу C 1 на открытом множестве ∂f ∂f G ⊂ Df , если в каждой x ∈ G существуют все ∂x k (x), k = 1, m и все ∂xk непрерывны на G. 5.2.5.
Частные производные сложной функции
Теорема. Пусть функция f (x) = f (x1 , . . . , xm ) имеет областью определения Df = G открытое множество в Rm и f дифференцируема в точке x = (x1 , . . . , xm ) ∈ Df . Пусть функции xi = ϕi (t), ϕi (t) = ϕi (t1 , . . . , tk ), i = 1, m образуют непрерывное отображение x = ϕ(t) из Rk в Rm , имеющее Dϕ = ϕ−1 (G) и все функции ϕi (t), i = 1, m дифференцируемы в точке t = (t1 , . . . , tk ) ∈ ϕ−1 (G). Тогда композиция F (t) = (f ◦ ϕ)(t) = F (t1 , . . . , tk ) дифференцируема в t = (t1 , . . . , tk ) и справедливы формулы: ∂F ∂f ∂x1 ∂f ∂xm = · + . . . + · , ∂t1 ∂x1 ∂t1 ∂xm ∂t1 .......................................
(∗)
∂F ∂f ∂x1 ∂f ∂xm = · + . . . + · . ∂tk ∂x1 ∂tk ∂xm ∂tk i
∂f ∂F ∂x Все ∂t j , ∂tj , j = 1, k, i = 1, m берутся в точке t, а все ∂xi — в точке x = ϕ(t). Так как отображение x = ϕ(t) непрерывно, то множество ϕ−1 (G) — открытое (как прообраз открытого множества при непрерывном отображении).
65
Рассмотрим окрестность U точки x ∈ U ⊂ G и приращение ∆x = (∆x1 , . . . , ∆xm ) такое, что x + ∆x ∈ U. Тогда m X ∂f (x)∆xk + o(∆x), ∆x → 0, f (x + ∆x) − f (x) = (7) ∂xk k=1
где o(∆x) непрерывна в ∆x = 0. j Обозначим V = ϕ−1 (U) ⊂ Dϕ и V — окрестность точки t ∈ V ⊂ Dϕ ⊂ Dϕ , j = 1, k. ∆xi = ϕi (t + ∆t) − ϕi (t) =
k X ∂ϕi j=1
∂tj
(t) · ∆tj + αi (∆t) · k∆tkk ,
(8)
где lim αi (∆t) = 0 = αi (0), i = 1, m. ∆t→0
Имеем, на основании неравенства Коши, v v u k 2 uX i u k i uX ∂ϕ 2 t ∆x 6 t (t) · (∆tj ) + |αi (∆t)| · k∆t kk 6 M · k∆tkk + |αi (∆t)| k∆tkk , i = 1, m, j ∂t j=1 j=1
(9)
где постоянная M зависит от t и не зависит от ∆t. Следовательно, справедлива формула ∆xi = O(∆t), ∆t → 0, i = 1, m
(10)
и все функции O(∆T ) непрерывны в ∆t = 0. Теперь представление для F (t + ∆t) − F (t) = (f ◦ ϕ)(t + ∆t) − (f ◦ ϕ)(t) получается подстановкой формул (8), m P ∂f i (9) и (10) (в формуле (7) f (x + ∆x) − f (x) = ∂xi (x)∆x + o(∆x), ∆x → 0) в формулу (7), так что i=1
m k X ∂f X ∂ϕi j F (t + ∆t) − F (t) = ∆t + αi (∆t) k∆tkk + o(O(∆t)) = ∂xi j=1 ∂tj k=1
m k m X ∂f X ∂ϕi j X ∂f ∆t + αi (∆t) k∆tkm + o(O(∆t)) = ∂xi j=1 ∂tj ∂xi i=1 i=1 ! k m X X ∂f ∂ϕi = · j ∆tj + o(∆t) + o(O(∆t)) = i ∂x ∂t j=1 i=1 ! k m X X ∂f ∂ϕi = · j ∆tj + o(∆t), ∆t → 0. i ∂x ∂t j=1 i=1
=
Согласно (11), функция F (t) — дифференцируема в точке t, и справедливы формулы
∂F ∂tj
1, k, равносильные (∗). 5.2.6.
=
(11)
m P
i=1
∂f ∂xi
·
∂ϕi ∂tj ,
j=
Дифференциал функции нескольких переменных
Рассмотрим функцию f (x) = f (x1 ,. . . , xm ), дифференцируемую в точке x = (x1 , . . . , xm ) ∈ Df . Тогда суще ∂f ∂f ∂f ∂f 1 m ствует grad f (x) = ∂x1 (x), . . . , ∂x и определена линейная функция L(h) = ∂x ; h= m (x) 1 (x)·h +. . .+ ∂xm (x)·h
∂f 1 (h1 , . . . , hm ) ∈ Rm , называемая дифференциалом функции f в точке x и обозначаемая df (x)(h) = ∂x 1 (x) · h + ∂f ∂fk m k m k + . . . + ∂xm (x) · h . Если fk (x) = x , то ∂xk (x) = 1, x ∈ R и dfk (x)(h) = dx (h) = h, k = 1, m. Поэтому ∂f ∂f 1 m df (x)(h) = ∂x (h); h ∈ R, или 1 (x)dx (h) + . . . + ∂xm (x)dx
df (x) =
∂f ∂f (x)dx1 + . . . + m (x)dxm ; ∂x1 ∂x df (x) =
m X ∂f (x)dxi ; i ∂x i=1
(1)
Эта величина является инвариантной относительно того, являются ли xi , 1 6 i 6 m, независимыми переменными или функциями xi = xi (t) = xi (t1 , . . . , tk ), 1 6 i 6 m, дифференцируемыми в соответствующей 66
точке t = (t1 , . . . , tk ) ∈ Dx , где x = x(t) = (x1 (t), . . . , xm (t)) и x = (x1 , . . . , xm ). Действительно, полагая (f ◦ x)(t) = f (x1 (t), . . . , xm (t)) = F (t) и используя формулу (1) и теорему о дифференцировании сложной функции, имеем ! k k m m k m i i X X X X X X ∂F ∂f ∂f i ∂x ∂f ∂x j j j d(f ◦ x)(t) = dF (t) = (t)dt = · dt = dt = dx = df (x). j i j i j ∂t ∂x ∂t ∂x ∂t ∂xi j=1 j=1 i=1 i=1 j=1 i=1
Свойства дифференциалов Если функции u, v дифференцируемы в одной и той же точке, то справедливо: 1) d(u ± v) = du ± dv; 2)d(cu) ∈ R. = c du, c dv ; 5)d c = 0, c ∈ R. 3)d(uv) = v du + u dv; 4)d uv = v du−u v2 Приведём доказательство свойства 3). Рассмотрим функцию z = uv. Согласно свойству инвариантности ∂z ∂z первого дифференциала, dz = ∂u du + ∂v dv = vdu + udv. 5.2.7.
Геометрический смысл дифференциала функции двух переменных
Определение. Пусть функция f (x, y) непрерывна в точке P0 (x0 , y0 ) ∈ Df (Df — открытое множество в R2 ). Касательной плоскостью к графику функции f в точке M0 (x0 , y0 , z0 ), z0 = f (x0 , y0 ) называют такую плоскость, проходящую через M0 , что расстояние M N от точки M (x, y, f (x, y)), P (x, y) ∈ Df , графика до этой плоскости бесконечно мало по сравнению с M0 M при P (x, y) → P0 (x0 , y0 ). Теорема. Если функция f (x, y) дифференцируема в точке P0 (x0 , y0 ), то график z = f (x, y) этой функции обладает в точке M0 (x0 , y0 , f (x0 , y0 )) касательной плоскостью, которая задаётся уравнением Z − z0 = fx′ (x0 , y0 )(x − x0 ) + fy′ (x0 , y0 )(y − y0 ),
(2)
так что значение дифференциала функции f в точке P0 при приращениях x − x0 , y − y0 аргументов равно приращению Z − z аппликаты точки касательной плоскости (текущие координаты касательной плоскости x, y, Z в отличие от текущих координат x, y, z поверхности z = f (x, y)). pПлоскость, задаваемая уравнением (2), проходит через M0 (x0 , y0 , z0 ), z0 = f (x0 , y0 ). Обозначим ρ = P0 P = (x − x0 )2 + (y − y0 )2 и, в силу дифференцируемости функции f в точке (x0 , y0 ), справедливо z − z0 = fx′ (x0 , y0 )(x − x0 ) + fy′ (x0 , y0 )(y − y0 ) + α(∆x, ∆y)ρ,
где
lim
P (x,y)→P0 (x0 ,y0 )
(3)
α(∆x, ∆y) = 0.
Обозначим Π плоскость, задаваемую уравнением (2). Вычитая (2) из (3), получим Z − z = αρ. Пусть N — основание перпендикуляра, опущенного на Π из точки M (x, y, z), z = f (x, y) и M ′ — точка плоскости Π, имеющая ту же абсциссу x и ординату y, что и точка M . Тогда, M N 6 |M M ′ | и M0 M > P P0 . Поэтому, |MM ′ | |Z−z| MN MN 06 M 6 = |α|. Следовательно, M → 0 при ρ → 0, так как lim |α| = 0. M P0 P = ρ 0 0M ρ→0
Итак, плоскость, задаваемая уравнением (2) — касательная к графику в точке M0 .
5.3. Частные производные и дифференциалы высших порядков 5.3.1.
Частные производные высших порядков
Рассмотрим функцию f (x) = f (x1 , . . . , xm ), определённую на открытом множестве Df в Rm , и предположим, ∂f что частная производная ∂x i (x) = ϕi (x), 1 6 i 6 m, определена на некотором открытом множестве G ⊂ Df . i Если в точке x ∈ G ⊂ Df существует ∂ϕ второго порядка ∂xj (x), 1 6 j 6 m, то её называют частной производной функции f по аргументам xi и xj и обозначают 5.3.2.
∂2 f ∂xi ∂xj (x),
то есть
∂2f ∂xi ∂xj (x)
=
∂ ∂xj
∂f ∂xi (x)
, k ∈ N.
Достаточное условие равенства смешанных производных
Теорема Шварца. Если в окрестности точки (x, y) функция f (x, y) обладает частными производными ′ ′′ ′′ , и fxy непрерывна в (x, y), то другая смешанная производная fyx существует в этой точке и fx′ , fy′ и fxy ′′ совпадает с fxy . ′′ По условию, существует такое δ0 > 0, что функции f, fx′ , fy′ и fxy определены для всех (x + h, y + k) с |h| < δ0 , |k| < δ0 . Положим ϕ(x) = f (x, y+k)−f (x, y). Тогда, применяя дважды формулу конечных приращений, для всех h, |h| < δ0 и k, |k| < δ0 , имеем ′′ ϕ(x + h) − ϕ(x) = hϕ′ (x + θ1 h) = h [fx′ (x + θ1 h, y + k) − fx′ (x + θ1 h, y)] = hkfxy (x + θ1 h, y + θ2 k),
67
(1)
0 < θ1 < 1, 0 < θ2 < 1. ′′ Так как функция fxy непрерывна в (x, y), то ′′ ′′ fxy (x + θ1 h, y + θ2 k) = fxy (x, y) + α(h, k),
где
lim
(h,k)→(0,0)
(2)
α(h, k) = 0 = α(0, 0).
Подставляя (2) и в (1), получим 1 ϕ(x + h) ϕ(x) ′′ − − fxy (x, y) = α(h, k) h k k
(3)
для всех 0 < |h| < δ0 , 0 < |k| < δ0 . Так как lim α(h, k) = 0, то для произвольного числа ε > 0 существует δ > 0, 0 < δ 6 δ0 , что |α(h, k)| < (h,k)→(0,0)
для всех 0 < |h| < δ, 0 < |k| < δ, и следовательно, на основании (3), получим оценку 1 ϕ(x + h) ϕ(x) ε ′′ < , 0 < |h| < δ, 0 < |k| < δ. − − f (x, y) xy h 2 k k Так как lim
k→0
k → 0, получим
ϕ(x) k
= lim
k→0
f (x,y+k)−f (x,y) k
= fy′ (x, y) и lim
k→0
ϕ(x+h) k
ε 2
(4)
= fy′ (x + h, y), то, переходя в (4) к пределу при
′ ε fy (x + h, y) − fy′ (x, y) ′′ 6 < ε, 0 < |h| < δ. − f (x, y) xy 2 h
(5)
Неравенство (5) означает, что
fy′ (x + h, y) − fy′ (x, y) ′′ = fyx (x, y). h→0 h
′′ fxy (x, y) = lim
Замечание. Поскольку утверждение о равенстве смешанных производных сохраняется, если в условии тео′′ ′′ , то утверждение заведомо справедливо, обе смешанные произремы Шварца производную fxy заменить на fyx водные существуют и непрерывны в точке (x, y). Определение. Функцию f (x) = f (x1 , . . . , xm ) называют принадлежащей классу C n , n ∈ N, на открытом множестве G ⊂ Rm , если все её частные производные порядка n (а следовательно, и все частные производные низших порядков) непрерывны на G. Для производных высших порядков аналогом теоремы Шварца служит следующая теорема. Теорема. Если функция f (x) = f (x1 , . . . , xm ) принадлежит классу C n в своей области Df (Df — открытое множество), то для любого k, 2 6 k 6 n, у каждой её частной производной k–го порядка любые входящие в неё дифференцирования по различным аргументам перестановочны. 5.3.3.
Дифференциалы высших порядков
Пусть f (x, y) дифференцируема в (x, y). Тогда её дифференциал df (x, y)(h, k) = ∂1 f (x, y)h + ∂2 f (x, y)k,
∂1 f (x, y) = fx′ (x, y), ∂2 f (x, y) = fy′ (x, y),
а (h, k) — независимые переменные, (h, k) ∈ R2 . Фиксируем h и k, можно рассматривать d как операцию d = h∂1 + k∂2 , применяемую к f (x, y). Такая операция линейна, то есть d(f + g) = df + dg, d(cf ) = cdf . Пусть функция f (x, y) дифференцируема в (x, y) ∈ Df и Df — открытое множество в R2 . Дифференциал функции f в (x, y) имеет вид: ∂f 2 df (x, y)(h, k) = ∂f ∂x (x, y)h + ∂y (x, y)k = h∂1 f (x, y) + k∂2 f (x, y); (h, k) ∈ R — произвольные и формула справедлива, если f принадлежит классу C 1 в Df . Фиксируя h и k, можно рассматривать d как операцию h∂1 + k∂2 над f , состоящую в применении дифференцирований ∂1 и ∂2 , умножении полученных частных производных соответственно на h и k и сложении этих произведений. При этом операция d = h∂1 + k∂2 линейна, то есть d (f + g) = d f + d g, d (cf ) = cd f, c ∈ R. Если операция d применима к fx′ (x, y) и fy′ (x, y), (например, когда fx′ , fy′ ∈ C 1 в Df или f ∈ C 2 в Df ), то можно рассмотреть её повторение d2 f = d (d f ) по правилам d2 f (x, y)(h, k) = (h∂1 + k∂2 )(h∂1 + k∂2 )f (x, y) = (h∂1 + k∂2 )(h∂1 + f (x, y) + k∂2 f (x, y)) = = h2 ∂12 f (x, y) + hk∂1 ∂2 f (x, y) + kh∂2 ∂1 f (x, y) + k 2 ∂22 f (x, y). 68
Если функция f ∈ C 2 в Df , то дифференцирование ∂1 и ∂2 перестановочно и формула примет вид (в более обычных обозначениях): d2 f (x, y)(h, k) =
∂2f ∂2f ∂2f 2 (x, y)h + 2 (x, y)hk + (x, y)k 2 . ∂x2 ∂x∂y ∂y 2
Если функция f принадлежит классу C n в Df , n ∈ N, то n
n
d f (x, y)(h, k) = (h∂1 + k∂2 ) f (x, y) =
n X i=0
Cni
∂nf (x, y)hn−i k i . ∂xn−i ∂y i
(2)
Действительно, так как дифференцирование ∂1 и ∂2 линейно и перестановочно, то совершенно так же, как если бы ∂1 и ∂2 были числами, доказывается, что (h∂1 + k∂2 )n =
n X i=0
1
m
Cni ∂1n−i · ∂2i hn−i k i .
Если функция f (x) = f (x , . . . , x ) принадлежит классу C n на открытом множестве Df ⊂ Rm , то (2) принимает вид n ∂ ∂ dn f (x)(h) = h1 1 + . . . + hm m f (x), h = (h1 , . . . , hm ) ∈ Rm . ∂x ∂x
5.4. Формула Тейлора 5.4.1.
Вспомогательные леммы
Рассмотрим f (x1 , x2 ) класса C k на открытом множестве Df ⊂ R2 и произвольное x = (x1 , x2 ) ∈ Df , так что существует открытый шар U(x; r) ⊂ Df , r > 0. Рассмотрим произвольное приращение h = (h1 , h2 ), чтобы x + h ∈ U(x; r) и функцию ϕ(t) = f (x + th) = f (x1 + th1 , x2 + th2 ), t ∈ [0, 1]. Тогда ∀ t ∈ [0, 1] ∃ ϕ′ (t) =
d ∂f d ∂f 1 (x + th1 , x2 + th2 ) (x1 + th1 ) + 2 (x1 + th1 , x2 + th2 ) (x2 + th2 ) = ∂x1 dt ∂x dt ∂f ∂f = (x + th)h1 + 2 (x + th)h2 = (h1 ∂1 + h2 ∂2 )f (x + th) 1 ∂x ∂x
d ′ ϕ (t) = h1 (∂12 h1 + ∂1 ∂2 h2 )f (x + ht) + h2 (∂2 ∂1 h1 + ∂22 h2 )f (x + ht) = (h1 ∂1 + h2 ∂2 )2 f (x + th). dt По индукции: k (k) 1 ∂ 2 ∂ ϕ (t) = h +h f (x + th), t ∈ [0, 1]. ∂x1 ∂x2 ϕ′′ (t) =
Лемма. Если функция f (x) = f (x1 , . . . , xm ) принадлежит классу C k на открытом множестве Df ⊂ Rm , то ∀ x = (x1 , . . . , xm ) ∈ Df и ∀ h = (h1 , . . . , hm ), для которых x + h ∈ U(x; r) ⊂ Df , функция ϕ(t) = f (x + th) на [0,1] имеет k ∂ ∂ ϕ(k) (t) = h1 1 + . . . + hm m f (x + ht). (1) ∂x ∂x 5.4.2.
Формула Тейлора с остаточным членом в форме Лагранжа
Теорема. Если функция f (x) = f (x1 , . . . , xm ) ∈ C n+1 , n ∈ N на открытом множестве Df ⊂ Rm , то для любой x = (x1 , . . . , xm ) ∈ Df и любого h = (h1 , . . . , hm ), что x + h ∈ U(x, r) ⊂ Df , r > 0, справедливо f (x + h) − f (x) = f (x1 + h1 , . . . , xm + hm ) − f (x1 , . . . , xm ) = k n+1 n X 1 ∂ ∂ 1 ∂ ∂ = h1 1 + . . . + hm m f (x) + h1 1 + . . . + hm m f (x + θh), 0 < θ < 1. k! ∂x ∂x (n + 1)! ∂x ∂x
(2)
k=1
Как и в лемме, рассмотрим ϕ(t) = f (x + th), t ∈ [0, 1], так что ϕ(0) = f (x), ϕ(1) = f (x + h). Применением к ϕ(t) формулы Тейлора на [0, 1] с остаточным членом в форме Лагранжа, получим ϕ(1) − ϕ(0) =
n X 1 (k) 1 ϕ (0) + ϕ(n+1) (θ), 0 < θ < 1. k! (n + 1)! k=1
Подставим в (3) формулы (1), t = 0, получим (2), т.к. ϕ(1) = f (x + h), ϕ(0) = f (x). 69
(3)
5.5. Локальные экстремумы функций нескольких переменных 5.5.1.
Необходимое условие экстремума
Теорема 1 (Ферма). Если функция f (x) = f (x1 , . . . , xm ) принимает во внутренней точке (x10 , . . . , xm 0 ) множества E ⊂ Df наибольшее или наименьшее значение на E и дифференцируема в этой точке, то все её частные производные первого порядка в этой точке равны нулю. Пусть, например, x0 — точка наибольшего значения на E. Тогда существует r > 0, что открытый шар U(x0 , r) ⊂ E и f (x0 ) > f (x) для всех x ∈ U(x0 , r). i+1 m i Рассмотрим i–ую частную функцию ϕi (z) = f (x10 , . . . , xi−1 0 , z, x0 , . . . , x0 ), i = 1, m, определённую на (x0 − i r, x0 + r). Мы знаем, что существует ϕ′i (xi0 ) и ϕi (xi0 ) = f (x0 ) > ϕi (z), z ∈ (xi0 − r, xi0 + r). По теореме Ферма: ϕ′i (xi0 ) = 0 ∂f ′ i или ∂x i (x0 ) = ϕi (x0 ) = 0, i = 1, m. Определение. Точку x = (x1 , . . . , xm ), в которой функция f (x) = f (x1 , . . . , xm ) дифференцируема и все = 0, i = 1, m, называется стационарной точкой функции f .
∂f ∂xi (x)
Замечание. В этом определении функция f предполагается дифференцируемой в точке (а не просто существование частных производных). Для того, чтобы во внутренней точке x множества E ⊂ Df функция f принимала наибольшее или наименьшее значение на E, необходимо, чтобы x была стационарной точкой функции f . Пример. Функция f (x, y) = xy, точка (0,0) — стационарная, f (0, 0) = 0, но в любой окрестности точки (0,0) существуют точки (x, y), в которых f (x, y) > 0 и точки (x, y), в которых f (x, y) < 0. 5.5.2.
Достаточное условие локального экстремума
Пусть функция f (x) = f (x1 , . . . , xm ) определена на открытом множестве G = Df ⊂ Rm и x0 = (x10 , . . . , xm 0 ) ∂f — стационарная точка функции f , так что ∂x i (x0 ) = 0, i = 1, m. Рассмотрим открытый шар U(x0 , r) ⊂ G, r > 0 и предположим, что функция f (x) ∈ C 2 в U(x0 , r). Тогда для произвольного h = (h1 , . . . , hm ), что x0 + h ∈ U(x0 , r), согласно формуле Тейлора: f (x0 + h) − f (x0) = Так как
∂f ∂xi (x0 )
1 1!
2 ∂f ∂f 1 ∂ ∂ h1 1 (x0 ) + . . . + hm m (x0 ) + h1 1 + . . . + hm m f (x0 + θh), 0 < θ < 1. (1) ∂x ∂x 2! ∂x ∂x
= 0, i = 1, m, то (1) примет вид f (x0 + h) − f (x0 ) =
Так как f ∈ C 2 , то
∂2f ∂xi ∂xj (x0
+ θh) =
1 2
2 ∂ ∂ h1 1 + . . . + hm m f (x0 + θh). ∂x ∂x
∂2f ∂xi ∂xj (x0 )
(1′ )
+ αij (h), где lim αij (h) = 0 = αij (0), i, j = 1, m. h→0
′
Поэтому, из (1 ) следует 1 2
2 2 2 ∂ ∂ 1 ∂ ∂ 1 h1 1 + . . . + hm m f (x0 + θh) = h1 1 + . . . + hm m f (x0 ) + h1 β1 (h) + . . . + hm βm (h) , (2) ∂x ∂x 2 ∂x ∂x 2
где все функции βi (h), i = 1, m явно выражаются через αij (h) и lim βi (h) = 0 = βi (0), i = 1, m. h→0
Кроме того,
n m X X 1 2 2 2 h β1 (h) + . . . + hm βm (h) 2 6 (hi )2 (βi (h))2 = khk kβ(h)k = o(khk ), h → 0. i=1
(3)
i=1
Подставляя (2) и (3) в (1′ ), получим
1 f (x0 + h) − f (x0 ) = 2 где
∂ ∂ h + . . . + hm m 1 ∂x ∂x 1
2
f (x0 ) + o(khk2 ), h → 0,
2 m X ∂2f 1 ∂ m ∂ h + . . . + h f (x ) = (x0 )hi hj . 0 i ∂xj ∂x1 ∂xm ∂x i,j=1
(4)
(5)
Теорема 2. Если функция f (x) = f (x1 , . . . , xm ) ∈ C 2 на открытом множестве G = Df ⊂ Rm и x0 = = (x10 , . . . , xm 0 ) — стационарная точка функции f , то f имеет в точке x0 локальный экстремум тогда и 70
только тогда, когда квадратичная форма (5) — знакопостоянная. При этом x0 — точка строгого максимума, если форма (5) — положительная, и x0 — точка строгого минимума, если форма (5) — отрицательная. Объединяя формулы (1)—(5), имеем m m 2 2 i j X 1 X ∂2f khk ∂ f h h 2 m f (x0 + h) − f (x0 ) = (x0 )hi hj + o(khk ) = (x0 ) 2 + o(1) , h → 0 ∈ R . i ∂xj 2 i,j=1 ∂xi ∂xj 2 ∂x khk i,j=1 Вектор e(h) =
h1 hm khk , . . . , khk
=
h khk
(6) m — непрерывное отображение множества Rm := R r 0 на сферу S(0; 1) 0
единичного радиуса с центром в начале координат, так как ke(h)k = 1. Сфера S(0, 1) — компакт в Rm . Функция F (F (h)) =
m X
i,j=1
∂2f hi hj (x ) 0 ∂xi ∂xj khk khk
непрерывна на S(0; 1) и непрерывна на Rm 0 как сложная функция. Так как S(0, 1) — компакт, то функция F (F (h)) достигает на S своего наименьшего значения m и своего наибольшего значения M , m 6 M . Более того, числа m и M — наименьшее и наибольшее значение сложной функции F (e(h)) на множестве {h ∈ Rm | 0 < khk < r}, где r > 0 — радиус шара U(x0 , r), в котором действительна формула (6). Предположим, что форма (5) положительна. Тогда 0 < m 6 M , и из (6) следует: f (x0 + h) − f (x0 ) >
khk2 (m + O(1)), h → 0. 2
Рассмотрим такое δ1 , 0 < δ1 6 r, чтобы |o(1)| < |m| = m. Тогда f (x0 + h) − f (x0 ) >
khk2 (m − |o(1)|) > 0, h, 0 < khk < δ1 , 2
то есть x0 — точка строгого минимума функции f . Пусть квадратичная форма (5) отрицательна. Тогда m 6 M < 0 и, согласно (6), f (x0 + h) − f (x0 ) <
khk2 (M + o(1)). 2
Выберем такое число δ2 , 0 < δ2 6 r, чтобы |o(1)| < |M | для всех h, o < khk < δ2 , тогда f (x0 + h) − f (x0 ) < 0 для всех h, 0 < khk < δ2 и x0 — точка строгого максимума функции f . Пусть форма (5) знакопеременна. Тогда m < 0 < M . Рассмотрим на S(0; 1) точку em , в которой F (em ) = m и произвольное h = tem , t > 0. Тогда khk = t kem k = t. Существует δ1 , 0 < δ1 6 r, что |o(1)| < |m| для всех h, 0 < khk < δ1 . Тогда для h = tem , 0 < t < δ1 , справедливо f (x0 + tem ) − f (x0 ) < 0 для всех t, 0 < t < δ1 . Существует δ2 , 0 < δ2 6 r такое, что F (eM ) = M и для произвольного h = teM , 0 < t < δ2 имеем khk = t > 0 и f (x0 + teM ) − f (x0 ) > 0 для всех t, 0 < t < δ2 . Итак, каждая проколотая окрестность точки x0 содержит x0 +tem , 0 < t < δ1 , в которой f (x0 +tem )−f (x0 ) < 0 и точки x0 + teM , 0 < t < δ2 , в которой f (x0 + teM ) − f (x0 ) > 0, то есть x0 не есть точка локального экстремума функции f .
71
6. Дифференцируемые отображения конечномерных евклидовых пространств 6.1. Дифференцируемые отображения из Rm в Rn 6.1.1.
Предварительные определения и обозначения
Рассмотрим произвольное открытое множество G в пространстве Rm и отображение f : G → Rn . Отображение f (x), x ∈ G = Df ⊂ Rm задаётся набором (f 1 (x), . . . , f n (x)) функций f j (x) = f j (x1 , . . . , xm ), j = 1, n. Фиксируем произвольное x = (x1 , . . . , xm ) ∈ G и рассмотрим открытый шар U(x, r) ⊂ G. Пусть вектор h = (h1 , . . . , hm ) такой, что x + h = (x1 + h1 , . . . , xm + hm ) ∈ U(x, r). Отображение f (x+h)−f (x) называется приращением отображения f (x) в точке x, отвечающим приращению h аргумента x. В координатной форме f (x + h) − f (x) = (f 1 (x + h) − f 1 (x), . . . , f n (x + h) − f n (x)), где f j (x + h) − f j (x) = j 1 f (x + h1 , . . . , xm + hm ) − f (x1 , . . . , xm ), j = 1, n. Определение 1. Отображение f (x) называется дифференцируемым в точке x ∈ G = Df ⊂ Rm , если существуют линейное отображение L(x; h) : Rm → Rn (x ∈ G — фиксировано, h ∈ Rm — произвольное) и отображение α(x; h) из Rm в Rn (x ∈ G — фиксировано, h ∈ Rm — произвольное), непрерывное в точке h = (0, . . . , 0) ∈ Rm и kα(x;h)k удовлетворяющее условию lim khk n = 0 ∈ R, такие, что для любого h, x + h ∈ U(x; r) справедливо h→0
m
f (x + h) − f (x) = L(x; h) + α(x; h)
(1)
f (x + h) − f (x) = L(x; h) + o(khkm ), h → 0 ∈ Rm ,
(1’)
или где условие
kα(x;h)k lim khk n m h→0
= 0 записано в виде α(x; h) = o(khkm ), h → 0 ∈ Rm .
Линейное отображение L(x; h) задаётся матрицей 1 a1 (x) a12 (x) . . . a1m (x) a21 (x) a22 (x) . . . a2m (x) A(x) = . . . . . . . . . . . . . . . . . . . . . . . . . . , an1 (x) an2 (x) . . . anm (x)
(2)
в которой aij (x) = aij (x1 , . . . , xm ), i = 1, m, j = 1, n, x ∈ G. В матричной записи свойство (1) имеет вид 1 1 1 f (x + h) − f 1 (x) h α (x; h) .. .. .. . . = A(x) . + , . .. ... .. . f n (x + h) − f n (x) hm αn (x; h)
(3)
(x ∈ G — фиксировано, h ∈ Rm — произвольное), где o(x; h) = (α1 (x; h), . . . , αn (x; h)) и αj (x; h) = j (x,h) = αj (x1 , . . . , xm , h1 , . . . , hm ), j = 1, n — непрерывные функции в точке h = (0, . . . , 0) ∈ Rm и lim αkhk = 0, j = h→0
m
1, n.
6.1.2.
Матрица Якоби
Пусть отображение f (x), x ∈ G = Df — открытое множество в Rm дифференцируемо в x ∈ G, то есть справедливы (1) и (1 ′ ), в которых kα(x; h)kn = o(khkm ), h → 0 ∈ Rm . Так как αj (x; h) 6 kα(x; h)kn , j = 1, n, то αj (x; h) = o(khkm ), h → 0, j = 1, n, и согласно (3) и (2), f j (x + h) − f j (x) = aj1 (x)h1 + . . . + ajm (x)hm + αj (x, h), j = 1, n.
(4)
Так как α(x; h) непрерывна в h = 0, то каждая αj (x; h) непрерывна в h = 0, j = 1, n. Поэтому (4) показывает, j что каждая функция f j (x), j = 1, n, дифференцируема в точке x ∈ Df , и следовательно, aji (x) = ∂f ∂xi (x), i = 1, m, j = 1, n. Таким образом, матрица (2) принимает вид матрицы 1 ∂f 1 ∂f 1 ∂f (x) (x) . . . (x) 1 2 m ∂x2 ∂x ∂x 2 ∂f ∂f 2 ∂f A(x) = Jf (x) = ∂x1 (x) ∂x2 (x) . . . ∂xm (x) , (5) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ∂f n ∂f n ∂f n ∂x1 (x) ∂x2 (x) . . . ∂xm (x) 72
носящей название матрицы Якоби и имеющей традиционное обозначение Jf (x). Итак, линейное отображение L(x; h) из Rm в Rn , фигурирующее в выражениях (1) и (1’) свойства дифференцируемости отображения f из Rm в Rn в точке x ∈ Df ⊂ Rm , порождается матрицей Якоби Jf (x) (см. (5)); его называют производной отображения f в точке x и обозначают f ′ (x). 6.1.3. Производная вектор–функции Пусть m = 1, n > 1 и отображение f из R в Rn , называемое вектор–функцией, определено на интервале (α, β) = Df ⊂ R и имеет компонентами числовые функции f j (t), t ∈ (α, β), j = 1, n. Согласно определению 1 пункта 6.1.1, вектор–функция f (t) дифференцируема в точке t ∈ (α, β), если для любого числового приращения h аргумента t, t + h ∈ (α, β), справедливо равенство (3), в котором матрица (2) состоит только из одного первого столбца, а её множитель в формуле (3) — одноточечный столбец (h), так что равенства (4) имеют вид f j (t + h) − f j (t) = aj1 (t)h + αj1 (t; h), j = 1, n,
(4′ )
где αj1 (t; h) = o(h) при h → 0 для каждого j, 1 6 j 6 n. Представления (4’) показывают, что каждая функция f j (t), j = 1, n, дифференцируема в точке t ∈ (α, β) и f j (t + h) − f j (t) df j = (t) = (f j )′ (t), j = 1, n. h→0 h dt
aj1 (t) = lim
Матрица Якоби Jf (t) состоит из единственного первого столбца, но её принято записывать в виде строки Jf (t) = ((f 1 )′ (t), . . . , (f n )′ (t)). В такой же форме записывают и производную f ′ (t), f ′ (t) = ((f 1 )′ (t), . . . , (f n )′ (t)) вектор– функции f (t) и часто используют также запись f ′ (t) = (f1′ (t), . . . , fn′ (t)), в которой индексы j, 1 6 j 6 n, при компонентах помещены внизу. 6.1.4. Критерий дифференцируемости отображения Теорема 1. Любое отображение f : G → Rn , G = Df ⊂ Rm — открытое множество, дифференцируемое в точке x ∈ G, непрерывно в x. Если f (x) дифференцируемо в x ∈ G, то справедливо (1) или (1′ ). Так как L(x; h) непрерывно в h = 0, то lim L(x; h) = L(x; 0) = 0 ∈ Rm . Кроме того, lim α(x; h) = α(x; 0) = 0 ∈ Rm . Поэтому, из (1) следует, что h→0
h→0
lim (f (x + h) − f (x)) = 0 ∈ Rm , или lim f (x + h) = f (x), то есть отображение f непрерывно в x.
h→0
h→0
Теорема 2 (необходимое и достаточное условие дифференцируемости отображений). Отображение f (x), x ∈ G = Df ⊂ Rm — открытое множество, задаваемое функциями f j (x) = f j (x1 , . . . , xm ), j = 1, n, дифференцируемо в точке x ∈ G тогда и только тогда, когда каждая функция f j (x), j = 1, n дифференцируема в x ∈ G. Необходимость условий теоремы проверена в п. 1.2. Достаточность. По условию, каждая f j (x) = f j (x1 , . . . , xm ), j = 1, n, дифференцируема в x, то есть справедливо (4). Из (4) следует (3), в котором матрица A(x) задаётся в виде (2). Из представления (3) следует (1) или (1′ ), в котором отображение α(x; h) имеет компоненты α(x; h) = (α1 (x; h), . . . , αn (x; h)) и отображение α(x; h) непрерывно в h = 0, так как√непрерывна αj (x; h) и αj (x; h) = o(khkm ), h → 0, j = 1, n. j каждая j Поскольку kα(x; h)kn 6 n max α (x; h) и α (x; h) = o(khkm ), h → 0, j = 1, n, то α(x; h) = o(khkm ), h → 0. 16j6n
Таким образом, из (3) следует (1′ ) и отображение f (x) дифференцируемо в x.
6.1.5. Композиция дифференцируемых отображений Теорема 6.1. Если отображение g из Rk , k > 1, в Rm , m > 1, дифференцируемо в точке t = (t1 , . . . , tk ) ∈ Dg ⊂ Rk , а отображение f из Rm в Rn , n > 1, дифференцируемо в точке x = g(t) ∈ Df ⊂ Rm , x = (x1 , . . . , xm ), то их композиция h = f ◦ g образует дифференцируемое отображение из Rk в Rn в точке t ∈ Dh = Df ◦g ⊂ Rk и Jh (t) = Jf (x)Jg (t) (как произведение двух матриц). Пусть f (x) = (f 1 (x), . . . , f n (x)), f i (x) = f i (x1 , . . . , xm ), i = 1, n, и g(t) = (g 1 (t), . . . , g m (t)), g j (t) = j 1 g (t , . . . , tk ), j = 1, m, так что xj = g j (t) = g j (t1 , . . . , tk ), j = 1, m. Согласно теореме 2 предыдущего пункта, все g j (t), j = 1, m, дифференцируемы в точке t = (t1 , . . . , tk ), а все f i (x), i = 1, n, дифференцируемы в точке x = g(t), x = (x1 , . . . , xm ), так что наряду с матрицей Якоби (5) существует матрица Якоби Jg (t), ∂g1 1 . . . . . . ∂g (t) ∂t1 (t) ∂tk . . . . . . . . . . . . . . . . . . . . . . . Jg (t) = (6) . . . . . . . . . . . . . . . . . . . . . . . . ∂gm ∂t1 (t)
......
73
∂gm (t) ∂tk
Поэтому, по теореме пункта 5.2.5 (формула (*)), все сложные функции (f i ◦ g)(t) = hi (t), i = 1, n, являясь компонентами отображения h = f ◦ g, дифференцируемы в точке t = (t1 , . . . , tk ) и справедливы формулы m
X ∂f i ∂hi ∂g j (t) = (x) l (t), i = 1, n, l = 1, k. l j ∂t ∂x ∂t j=1
(7)
Кроме того, по теореме 2 предыдущего пункта, отображение h = f ◦ g дифференцируемо в точке t = (t1 , . . . , tk ), и следовательно, определена матрица Якоби Jh (t). ∂h1 ∂h1 ∂t1 (t) . . . . . . ∂tk (t) . . . . . . . . . . . . . . . . . . . . . . . Jh (t) = (8) . . . . . . . . . . . . . . . . . . . . . . . . ∂hn ∂t1 (t)
......
∂hn (t) ∂tk
i
Формулы (7) показывают, что элемент ∂h ∂tl (t), стоящий на пересечении i-й строки и l-го столбца матрицы (8) равен «скалярному произведению» i-й строки матрицы (5) на l-й столбец матрицы (6), или, по правилу произведения матриц, что матрица (8) есть произведение матрицы (5) на матрицу (6). Замечание. Если воспользоваться терминологией, введённой в конце пункта 6.1.2, то доказана формула df d (f ◦g)′ (t) = f ′ (x)g ′ (t). В случае k = m = n = 1 мы имели формулу dt (f ◦g)(t) = dx (x)· dg dt (t), которая согласуется с общей формулой, поскольку умножению чисел соответствует композиция порождаемых ими линейных функций в R; если линейную функцию, порождаемую числом k, обозначить K; то есть, K(h) = kh, h ∈ R, то (K2 ◦K1 )(h) = K2 (K1 (h)) = K2 (k1 h) = k2 k1 h = K2 K1 (h) для всех h ∈ R, то есть, K2 ◦ K1 = K2 K1 .
6.2. Неявные отображения 6.2.1. 1
Предварительные замечания
Функцию u = f (x) = f (x , . . . , x ) назовём заданной неявно на множестве E ⊂ Rm , если существует функциональное уравнение F (x1 , . . . , xm , u) = 0, (x1 , . . . , xm , u) ∈ Rm+1 , что в каждой x ∈ E функция u = f (x) есть его единственное решение. Вопросы о том, при каких условиях функциональное уравнение F (x1 , . . . , xm , u) = 0 порождает неявную функцию u = f (x1 , . . . , xm ) и при каких условиях эта функция непрерывна и дифференцируема, совсем не просты. В качестве примера рассмотрим функцию F (x, y, u) = x2 +y 2 +u2 −1. Уравнение F (x, y, u) = 0 определяет в пространстве переменных (x, y, u) сферу S радиуса 1 с центром в начале координат. Понятно, чтоpэто уравнение разрешимо только в круге D = (x, y) x2 + y 2 6 1 и решениями там будут u = f1 (x, y) = 1 − x2 − y 2 и p u = f2 (x, y) = − 1 − x2 − y 2 . Поэтому в круге D уравнение определяет бесконечно много функций — в одной точке круга D можно взять значение f1 (x, y), в другой — f2 (x, y). При каких же условиях существует единственная функция, удовлетворяющая уравнению F (x, y, u) = 0? Фиксируем на сфере S произвольную точку M0 (x0 , y0 , u0 ), не лежащую в плоскости Oxy, то есть, такую, что u0 6= 0. Геометрически ясно, что часть сферы S, расположенная в шаре U(M0 ; ε) с центром в M0 и достаточно малого радиуса ε > 0, однозначно проектируется на плоскость Oxy в виде некоторой круговой окрестности U0 точки (x0 , y0 ), целиком лежащей в D. Аналитически это означает, что если рассматривать функцию F (x, y, u) только в U(M0 ; ε), то уравнение F (x, y, u) = 0 определяет в U0 единственную функцию u = f (x, y), u0 = f (x0 , y0 ), являющуюся его решением в U0 , то есть, F (x, y, f (x, y)) = 0 для всех (x, y) ∈ U, и такой функцией будет u = f1 (x, y) при u0 > 0 и u = f2 (x, y) при u0 < 0; при этом, |u − u0 | = |f (x, y) − f (x0 , y0 )| < ε для всех (x, y) ∈ U0 . Обратим также внимание на то, что частная производная ∂F ∂u = 2u функции F (x, y, u) не обращается в нуль в точке M0 f и равна нулю в точке M0 . Ниже будет установлено, что для однозначной разрешимости в окрестности точки M0 общего функционального уравнения F (x1 , . . . , xm , u) = 0 относительно переменной u принципиальную роль играет необращение в нуль в точке M0 частной производной ∂F ∂u . Попутно мы установим условия, при которых функция, представляющая собой единственное решение этого уравнения, является непрерывной и дифференцируемой. 6.2.2.
m
Существование и дифференцируемость неявной функции
Теорема. Пусть функция F (x, u) = F (x1 , x2 , u) дифференцируема в некоторой окрестности U(M0 ), M0 (x10 , x20 , u0 ) ∈ R3 и частная производная Fu (x1 , x2 , u) непрерывна в U(M0 ). Если а)F (x10 , x20 , u0 ) = 0 и б)Fu (x10 , x20 , u0 ) 6= 0, то для любого числа ε > 0 существует такая окрестность U(x0 ) ⊂ R2 , x0 = (x10 , x20 ), в которой определена единственная функция u = ϕ(x1 , x2 ), обладающая свойствами: 1) функция u = ϕ(x1 , x2 ) есть решение уравнения F (x1 , x2 , u) = 0 в каждой точке x = (x1 , x2 ) ∈ U(x0 ), то есть F (x1 , x2 , ϕ(x1 , x2 )) = 0 для всех x = (x1 , x2 ) ∈ U(x0 ); 74
2) 3) 4) 5)
u0 = ϕ(x10 , x20 ); |u − u0 | < ε для всех x = (x1 , x2 ) ∈ U(x0 ), u = ϕ(x1 , x2 ); функция u = ϕ(x1 , x2 ) непрерывна в U(x0 ); функция u = ϕ(x1 , x2 ) дифференцируема в x0 = (x10 , x20 ) и
6)
∂ϕ 1 2 ∂x1 (x0 , x0 )
=−
Fx′ 1 (x10 ,x20 ,u0 ) Fu′ (x10 ,x20 ,u0 )
и
∂ϕ 1 2 ∂x2 (x0 , x0 )
=−
Fx′ 2 (x10 ,x20 ,u0 ) . Fu′ (x10 ,x20 ,u0 )
Замечание. Утверждение теоремы справедливо для функции F (x, u) класса C 1 в U(M0 ). Считаем, что Fu′ (x10 , x20 , u0 ) > 0. Так как Fu′ непрерывна в M0 (x10 , x20 , u0 ), то существует открытый шар U(M0 ; r), r > 0, в котором Fu′ (x1 , x2 , u) > 0 для всех M (x1 , x2 , u) ∈ U(M0 ; r). Считаем, что U(M0 ; r) = Ω ⊂ U(M0 ). Функция F (x1 , x2 , u), будучи дифференцируемой в Ω, непрерывна в Ω и f (u) = F (x10 , x20 , u) непрерывна на [u0 − r, u0 + r], дифференцируема в (u0 − r, u0 + r) и f ′ (u0 ) = Fu′ (x10 , x20 , u0 ) > 0. Рассмотрим произвольное ε > 0, 0 < ε < r. Тогда f (u) непрерывна на [u0 − ε, u0 + ε], дифференцируема в (u0 − ε, u0 + ε) и f ′ (u0 ) = Fu′ (x10 , x20 , u0 ) > 0. Следовательно, f (u) ↑↑ на [u0 − ε; u0 + ε] и по условию f (u0 ) = F (x10 , x20 , u0 ) = 0. Поэтому f (u0 − ε) < 0, f (u0 + ε) > 0 или F (x10 , x20 , u0 − ε) < 0, F (x10 , x20 , u0 + ε) > 0. Так как функция F (x1 , x2 , u) непрерывна по аргументу x = (x1 , x2 ) при любом фиксированном u ∈ [u0 − ε, u0 + ε], то по теореме о сохранении знака непрерывной функции, существует такая плоская окрестность U(x0 ), в которой F (x1 , x2 , u0 − ε) < 0, F (x1 , x2 , u0 + ε) > 0 (1) для всех x = (x1 , x2 ) ∈ U(x0 ). Выберем U(x0 ) такую, чтобы x1 − x10 < δ, x2 − x20 < δ, δ > 0 для всех (x1 , x2 ) ∈ U(x0 ) и чтобы U(x0 ) × [u0 − ε, u0 + ε] ⊂ Ω. 1◦ Существование неявной функции
По построению, параллелепипед Π : x1 − x10 < δ, x2 − x20 < δ, |u − u0 | < ε лежит в шаре Ω.
Рассмотрим и фиксируем произвольное x = (x1 , x2 ) ∈ U(x0 ). Функция F = (x1 , x2 , u) ((x1 , x2 ) — фиксировано) имеет Fu′ > 0. u ∈ (u0 − ε, u0 + ε), и справедливо (1). Следовательно, на (u0 − ε, u0 + ε) существует точка u (выбор u зависит от (x1 , x2 ); то есть u = ϕ(x1 , x2 )), в которой F (x1 , x2 , u) = 0. Другими словами, в U(x0 ) определена некоторая функция u = ϕ(x), F (x1 , x2 , ϕ(x1 , x2 )) = 0 для любой x = (x1 , x2 ) ∈ U(x0 ).
2◦ Единственность неявной функции
Предположим, что в U(x0 ) определены две различные функции u1 = ϕ1 (x1 , x2 ), u2 = ϕ2 (x1 , x2 ), что F (x1 , x2 , ϕ1 (x1 , x2 )) = F (x1 , x2 , ϕ2 (x1 , x2 )) = 0 для всех x = (x1 , x2 ) ∈ U(x0 ). Следовательно, существует x = (x1 , x2 ) ∈ U(x0 ), в которой u1 6= u2 . Так как отрезки с концевыми точками u1 и u2 лежат на [u0 − ε, u0 + ε], то по теореме Лагранжа о конечных приращениях, 0 = F (x1 , x2 , u1 ) − F (x1 , x2 , u2 ) = Fu′ (x1 , x2 , u′ )(u1 − u2 ) и (x1 , x2 , u′ ) ∈ Ω. Так как u1 − u2 6= 0, то Fu′ (x1 , x2 , u′ ) = 0, что противоречит построению шара Ω.
3◦ Непрерывность неявной функции Так как |u − u0 | = ϕ(x1 , x2 ) − ϕ(x10 , x20 ) < ε для всех x = (x1 , x2 ) ∈ U(x0 ), то есть x1 − x10 < δ, x2 − x20 < δ, то ϕ(x1 , x2 ) непрерывна в x0 = (x10 , x20 ). Рассмотрим произвольную x = (x1 , x2 ) ∈ U(x0 ). Тогда 2существует 1 2 1 1 x − x2 < δ, такая окрестность U(x) ⊂ U(x ) и для всех x ∈ U(x), x = (x , x ) справедливо x − x < δ, 0 0 0 а также x1 − x10 < δ, x2 − x20 < δ. Поэтому, ϕ(x1 , x2 ) − ϕ(x1 , x2 ) 6 ϕ(x1 , x2 ) − ϕ(x1 , x2 ) + ϕ(x1 , x2 ) − ϕ(x1 , x2 ) < ε + ε = 2ε. 0 0 0 0 Другими словами, ϕ(x1 , x2 ) непрерывна в x = (x1 , x2 ) ∈ U(x0 ) и, следовательно, для произвольного приращения (∆x1 , ∆x2 ), ∆x1 = x1 − x10 , ∆x2 = x2 − x20 и ∆u = ϕ(x10 + ∆x1 , x20 + ∆x2 ) − ϕ(x10 , x20 ).
Справедливо lim ∆u = 0, когда (∆x1 , ∆x2 ) → (0, 0) и ∆u — непрерывная функция от (∆x1 , ∆x2 ) в точке (0, 0). 4◦ Дифференцируемость неявной функции в точке (x10 , x20 ) Рассмотрим произвольное (∆x1 , ∆x2 ) с ∆x1 < δ, ∆x2 < δ и приращение ∆u, |∆u| < ε. Точки (x10 + ∆x1 , x20 + ∆x2 , u0 + ∆u) и (x10 , x20 , u0 ) лежат на графике функции u = ϕ(x1 , x2 ) и, следовательно, F (x10 + ∆x1 , x20 + ∆x2 , u0 + ∆u) = F (x10 , x20 , u0 ) = 0.
75
Так как F (x1 , x2 , u) дифференцируема в (x10 , x20 , u0 ), то, по определению, 0 = F (x10 + ∆x1 , x20 + ∆x2 , u0 + ∆u) − F (x10 , x20 , u) =
= ∆F = Fx′ 1 (x10 , x20 , u0 )∆x1 + Fx′ 2 (x10 , x20 , u0 )∆x2 + Fu′ (x10 , x20 , u0 )∆u+ + α1 (∆x1 , ∆x2 , ∆u)∆x1 + α2 (∆x1 , ∆x2 , ∆u)∆x2 + α3 (∆x1 , ∆x2 , ∆u)∆u1 ,
в котором
lim
(∆x1 ,∆x2 ,∆u)→(0,0,0)
αj (∆x1 , ∆x2 , ∆u) = 0, j = 1, 2, 3, и все αj непрерывны в (0, 0, 0).
Так как Fu′ непрерывна в (x10 , x20 , u0 ) и Fu′ (x10 , x20 , u0 ) > 0, то для всех достаточно малых (∆x1 , ∆x2 , ∆u) Fu′ (x10 , x20 , u0 ) + α3 (∆x1 , ∆x2 , ∆u) > 0. Следовательно, из (2) получим ∆u = −
Fx′ 1 (x10 , x20 , u0 )∆x1 Fx′ 2 (x10 , x20 , u0 )∆x2 α2 α1 − − ′ 1 2 ∆x1 − ′ 1 2 ∆x2 . 1 2 1 2 ′ ′ Fu (x0 , x0 , u0 ) + α3 Fu (x0 , x0 , u0 ) + α3 Fu (x0 , x0 , u0 ) + α3 Fu (x0 , x0 , u0 ) + α3
(3)
Сложные функции αj (∆x1 , ∆x2 , ∆ϕ(∆x1 , ∆x2 )) → 0 при (∆x1 , ∆x2 ) → (0, 0) и непрерывны в (0, 0) для 1 всех j = 1, 2, 3. Так как 1+ω = 1 − ω + o(ω), ω → 0, то из (3) следует ∆u = −
Fx′ 1 (x10 , x20 , u0 ) F ′ 2 (x1 , x2 , u0 ) ∆x1 − x′ 10 20 ∆x2 + α1 (∆x1 , ∆x2 )∆x1 + α2 (∆x1 , ∆x2 )∆x2 , 1 2 ′ Fu (x0 , x0 , u0 ) Fu (x0 , x0 , u0 )
(4)
где αi (∆x1 , ∆x2 ) → 0 при (∆x1 , ∆x2 ) → (0, 0) и αi непрерывны в (0, 0), i = 1, 2, то есть u = ϕ(x1 , x2 ) — дифференцируема в (x10 , x20 ) и F ′ 1 (x1 , x2 , u0 ) ∂ϕ 1 2 F ′ 2 (x1 , x2 , u0 ) ∂ϕ 1 2 (x0 , x0 ) = − x′ 10 20 , (x0 , x0 ) = − x′ 10 20 . 1 2 ∂x Fu (x0 , x0 , u0 ) ∂x Fu (x0 , x0 , u0 ) Замечание. Из доказательства следует, что производная Fu′ (x1 , x2 , u) 6= 0 для всех (x1 , x2 , u) ∈ Ω, так что единственная неявная функция u = ϕ(x1 , x2 ) дифференцируема всюду в U(x0 ) и ϕ′x1 (x1 , x2 ) = −
Fx′ 2 (x1 , x2 , u) Fx′ 1 (x1 , x2 , u) ′ 1 2 , ϕ . 2 (x , x ) = − x Fu′ (x1 , x2 , u) Fu′ (x1 , x2 , u)
Теорема 1. Пусть функция F (u, x) = F (u, x1 , . . . , xm ) дифференцируема в некоторой окрестности точки m+1 (u0 , x0 ) = (u0 , x10 , . . . , xm и частная производная Fu′ непрерывна в точке (u0 , x0 ). Если F (u0 , x0 ) = 0 и 0 ) ∈ R m Fu′ (u0 , x0 ) 6= 0, то для любого числа ε > 0 существует такая окрестность U(x0 ) точки x0 = (x10 , . . . , xm 0 )∈ R , в которой определена единственная неявная функция u = ϕ(x) = ϕ(x1 , . . . , xm ), обладающая свойствами: 1) u = ϕ(x) есть решение уравнения F (u, x) = 0 в U(x0 ), то есть F (ϕ(x), x) = 0 для всех x ∈ U(x0 ); 2) u0 = ϕ(x0 ) = ϕ(x10 , . . . , xm 0 ); 3) |u − u0 | < ε для всех x = (x1 , . . . , xm ) ∈ U(x0 ); 4) функция u = ϕ(x) = ϕ(x1 , . . . , xm ) дифференцируема (а значит и непрерывна) в U(x0 ); 5) Fx′ i (x1 , . . . , xm , u) ∂ϕ 1 m (x , . . . , x ) = − , i = 1, m. ∂xi Fu′ (x1 , . . . , xm , u) Замечание. В частности, утверждение теоремы 1 справедливо, если F (u, x) принадлежит классу C 1 (G), G — открытое множество в Rm+1 и (u0 , x0 ) ∈ G — произвольная. 6.2.3.
Отображения, заданные неявно
Рассмотрим систему из n, n ∈ N, функциональных уравнений F1 (u, x) = F1 (u1 , . . . , un , x1 , . . . , xm ) = 0, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ., Fn (u, x) = Fn (u1 , . . . , un , x1 , . . . , xm ) = 0
(1)
где каждая функция Fj (u, x) = Fj (u1 , . . . , un , x1 , . . . , xm ), j = 1, n, дифференцируема на некотором открытом множестве E ⊂ Rm+n . 76
Определение 1. Функции
u1 = ϕ1 (x1 , . . . , xm ) .................... un = ϕn (x1 , . . . , xm )
(2)
называются решением системы (1) на некотором непустом открытом множестве G ⊂ Rm , если при подстановке их в уравнения системы все уравнения системы переходят в тождества на множестве G. Функции (2) образуют некоторое отображение u = ϕ(x) множества G на некоторое множество G∗ = ϕ(G) ⊂ n R , u = (u1 , . . . , un ), x = (x1 , . . . , xm ). Это отображение и называют неявным отображением. Определение 2. Определитель
∂F 11 . . . ∂Fn1 ∂u ∂u . . . . . . . . . . . . . . . ∂F n1 . . . ∂Fnn ∂u ∂u
(3)
называется определителем Якоби (или якобианом) системы функций Fj (u, x), j = 1, n (или системы уравне1 ,...,Fn ) ний (1)) по переменным u1 , . . . , un и обозначается D(F D(u1 ,...,un ) . Понятно, что якобиан (3) есть функция от m + n переменных (u1 , . . . , un , x1 , . . . , xm ), определённая на множестве E. Теорема 2. Пусть функции
F1 (u1 , . . . , un , x1 , . . . , xm ) ......................... Fn (u1 , . . . , un , x1 , . . . , xm )
дифференцируемы в некоторой окрестности U(u0 , x0 ) точки (u0 , x0 ) = (u10 , . . . , un0 , x10 , . . . , xm 0 ) из пространства Rm+n и пусть первые производные этих функций по аргументам u1 , . . . , un непрерывны в (u0 , x0 ). Если 1 ,...,Fn ) а) Fj (u0 , x0 ) = 0, j = 1, n; б) якобиан D(F D(u1 ,...,un ) 6= 0 в точке (u0 , x0 ), то для произвольного набора чисел ε1 > 0, . . . , εn > 0 существует такая окрестность U(x0 ) точки x0 в Rm , в которой определено единственное неявное отображение u = ϕ(x), порождаемое системой уравнений (1) в смысле определения 1 и обладающее свойствами: 1 m 1) uj0 = ϕj (x 0 , . . . , x0 ); j j 1 m 2) u − u0 < εj , j = 1, n, где uj = ϕj (x1 , . . . , xm ), uj0 = ϕj (x10 , . . . , xm 0 ) для всех x = (x , . . . , x ) ∈ U(x0 ); 3) отображение u = ϕ(x) дифференцируемо (а значит и непрерывно) в окрестности U(x0 ).
Замечание. В случае n = 2 теорема 2 переходит в теорему 1 из предыдущего пункта 6.2.1, поскольку система уравнений (1) сводится к одному уравнению F1 (u1 , x1 , . . . , xm ) = 0, а якобиан (3) — к единственному 1 элементу ∂F ∂u1 . (Доказательство не обязательно для экзамена). Основываясь на приведённом выше замечании, доказательство теоремы проведём методом математической индукции. Согласно замечанию, утверждение теоремы 2 справедливо в случае n = 1. Предположим теперь, что оно справедливо для любой системы из (n − 1) функциональных уравнений вида (1). Обозначим через ∆ якобиан (3) и через ∆1 , . . . , ∆n алгебраические дополнения элементов последнего столбца определителя (3). Тогда, по известной теореме о вычислении определителя ∆ разложением по его последнему ∂F1 ∂Fn столбцу ∆ = ∆1 ∂u n + . . . + ∆n ∂un . Так как ∆ 6= 0 в точке M0 , то по крайней мере один из определителей ∆j , 1 6 j 6 n, отличен от нуля в точке M0 ; пусть им будет ∆n ; то есть, ∆n 6= 0 в точке M0 . Запишем определитель ∆ в (3) в виде (3’) — проведём пунктирные линии перед последним столбцом и перед последней строкой; пунктирными прямыми выделен определитель, значение которого отличается от значения 1 ,...,Fn−1 ) ∆n только знаком и который служит якобианом D(F D(u1 ,...,un−1 ) системы из (n − 1) функциональных уравнений F1 (u1 , . . . , un−1 , un , x1 , . . . , xm ) = 0 ...................................... Fn−1 (u1 , . . . , un−1 , un , x1 , . . . , xm ) = 0,
(4)
определённых в окрестности точки M0 пространства Rn+m . Так как якобиан системы (4) по переменным u1 , . . . , un−1 не равен нулю в точке M0 ∈ Rn+m , то согласно пред1+m положению индукции, в некоторой окрестности U(P0 ) точки P0 (un0 , x10 , . . . , xm определено 0 ) пространства R единственное неявное отображение, порожденное системой (4), с компонентами u1 = Φ1 (un , x1 , . . . , xm ) u2 = Φ2 (un , x1 , . . . , xm ) ............................. un−1 = Φn−1 (un , x1 , . . . , xm ), 77
(4)
которое обладает свойствами: 1) уравнения (4) обращаются в тождества в окрестности U(P0 ) после подстановки j j в них вместо переменных u1 , . . . , un−1 функций (5) и uj0 = Φj (un0 , x10 , . . . , xm 0 ), 1 6 j 6 n − 1; 2) u − u0 = n 1 m Φj (un , x1 , . . . , xm ) − Φj (un0 , x10 , . . . , xm 0 ) < εj , 1 6 j 6 n − 1, и 3) функции Φj (u , x , . . . , x ), 1 6 j 6 n − 1, непрерывны и дифференцируемы в окрестности U(P0 ) точки P0 . Последнее уравнение в системе (1) после замены переменных u1 , . . . , un−1 функциями (5) примет вид уравнения Fn (u1 , . . . , un−1 , un , x1 , . . . , xm ) = Fn (Φ1 (un , x1 , . . . , xm ), . . . , Φn−1 (un , x1 , . . . , xm ), un , x1 , . . . , xm ) = = Ψ(un , x1 , . . . , xm ) = 0, (6) в котором функция Ψ(un , x1 , . . . , xm ) непрерывна и дифференцируема в окрестности U(P0 ) точки P0 как композиция непрерывной и дифференцируемой функции и дифференцируемого отображения. Кроме того, n−1 1 Ψ(un0 , x10 , . . . , xm , un0 , x10 , . . . , xm 0 ) = Fn (u0 , . . . , u0 0 ) = 0. ∂Ψ Частная производная ∂un в произвольной точке из окрестности U(P0 ) вычисляется по правилу производной сложной функции и равна ∂Ψ ∂Fn ∂Ψ1 ∂Fn ∂Φn−1 ∂Fn = + ... + + . (7) ∂un ∂u1 ∂un ∂un−1 ∂un ∂un ∂Ψ n 1 m Покажем, что ∂u n (u0 , x0 , . . . , x0 ) 6= 0. Действительно, в силу свойства 1), уравнения (4) обращаются в тождества в окрестности U(P0 ) после подстановки в них вместо переменных u1 , . . . , un−1 функций (5). Дифференцируя эти тождества по переменной un , получим равенства ∂Φn−1 ∂F1 1 + . . . + ∂u∂F n−1 ∂un + ∂un = 0 ........................................... ∂Fn−1 ∂Φ1 ∂Fn−1 ∂Φn−1 ∂Fn−1 ∂u1 ∂un + . . . + ∂un−1 ∂un + ∂un = 0. ∂F1 ∂Φ1 ∂u1 ∂un
(8)
Умножим обе части равенства (7) на алгебраическое дополнение ∆n , а равенства (8) на алгебраические дополнения ∆1 , . . . , ∆n−1 , соответственно. Сложив почленно получившиеся результаты, имеем равенство n−1 X k=1
∂Φk ∂F1 ∂F2 ∂Fn−1 ∂Fn ∂F1 ∂Fn−1 ∂Fn ∆1 + ∆2 + . . . + ∆n−1 + ∆n + ∆1 + . . . + ∆n−1 + ∆n = ∂un ∂uk ∂uk ∂uk ∂uk ∂un ∂un ∂un = ∆n
∂Ψ . (9) ∂un
В каждой квадратной скобке формулы (9) стоит сумма произведений элементов k-го столбца, 1 6 k 6 n − 1, определителя (3) (или (3’)) на алгебраические дополнения элементов его n-го столбца, которая по известной теореме алгебры равна нулю. В простых скобках формулы (9) стоит разложение определителя (3) по его n∂Ψ му столбцу, равное его значению ∆. Таким образом, (9) равносильно равенству ∆ = ∆n ∂u n . Так как в точке ∂Ψ M0 определитель ∆ 6= 0 (по условию теоремы) и ∆n 6= 0 (по своему выбору), то ∂un = ∆∆n 6= 0 в точке P0 (un0 , x10 , . . . , xm 0 ). Теперь, по теореме о существовании и дифференцируемости неявной функции (теореме 1 пункта 6.2.1), в m некоторой окрестности U(N0 ) точки N0 (x10 , . . . , xm существует единственная неявная функ0 ) пространства R ция un = ϕn (x1 , . . . , xm ), обладающая свойствами: 1) уравнение (6) становится тождеством во всех точках из U(M0 ) после подстановки в него вместо переменной un функции un = ϕn (x1 , . . . , xm ) и un0 = ϕn (x10 , . . . , xm 0 ); 2) < εn ; 3) функция un = ϕn (x1 , . . . , xm ) непрерывна и дифференци|un − un0 | = ϕn (x1 , . . . , xm ) − ϕn (x10 , . . . , xm ) 0 руема в каждой точке из U(N0 ). Подставляя un = ϕn (x1 , . . . , xm ) в каждую из функций набора (5), получим непрерывные и дифференцируемые в окрестности U(N0 ) функции uj = ϕj (x1 , . . . , xm ) = Φj (ϕn (x1 , . . . , xm ), x1 , . . . , xm ), 1 6 j 6 n − 1, которые вместе с un = ϕn (x 1 , . . . , x m ) являются решениями системы функциональных уравнений (1) в U(N0 ) и обладают свойствами: 1) uj − uj0 < εj , j = 1, n, где uj = ϕj (x1 , . . . , xm ) и uj0 = ϕj (x10 , . . . , xm 0 ), j = 1, n, для
всех точек N (x1 , . . . , xm ) из U(N0 ); 2) функции uj = ϕj (x1 , . . . , xm ), j = 1, n, непрерывна и дифференцируемы в каждой точке из U(N0 ). Так как свойство 2) равносильно свойству непрерывности и дифференцируемости в U(N0 ) отображения u = ϕ(x) с компонентами u = (u1 , . . . , un ), uj = ϕj (x) = ϕj (x1 , . . . , xm ), j = 1, n, то в совокупности со свойством 1) заключаем, что отображение u = ϕ(x) есть неявное отображение, порождаемое системой функциональных уравнений, в смысле определения 1. Теорема доказана.
78
6.3. Отображения с ненулевыми якобианами 6.3.1.
Существование локальных диффеоморфизмов
Теорема 1. Пусть отображение y = f (x), x = (x1 , . . . , xn ), y = (y 1 , . . . , y n ), y j = fj (x1 , . . . , xn ), j = 1, n или y 1 = f1 (x1 , . . . , xn ) ................... (1) y n = fn (x1 , . . . , xn ) 1
n
D(y ,...,y ) из Rn в Rn дифференцируемо на открытом множестве G ⊂ Rn и его якобиан D(x 1 ,...,xn ) отличен от нуля в x0 ∈ G. Тогда существуют окрестности U(x0 ) и U(y0 ), y0 = f (x0 ), в которых отображение y = f (x) есть дифференцируемая биекция множеств U(x0 ) и U(y0 ) и обратная биекция x = f −1 (y) множеств U(y0 ) и U(x0 ) также дифференцируема в U(x0 ). Такие отображения называют диффеоморфизмами (дифференцируемые биекции множеств). Перепишем систему (1) в виде f1 (x1 , . . . , xn ) − y 1 = 0 ....................... (2) fn (x1 , . . . , xn ) − y n = 0 или Fj (x, y) = fj (x1 , . . . , xn ) − y j , Fj (x, y) = 0, j = 1, n. (2′ )
D(F1 , . . . , Fn ) D(f1 , . . . , fn ) = 6= 0 D(x1 , . . . , xn ) D(x1 , . . . , xn ) в x0 = (x10 , . . . , xn0 ) ∈ G. Согласно теореме 2, существует окрестность U ∗ (x0 ) и U(y0 ), U ∗ (x0 ) ⊂ G, что в U(y0 ) существует отображение x = g(y) множества U(y0 ) в U ∗ (x0 ), дифференцируемое в U(y0 ), при T это для любого y ∈ U(y0 ) справедливо f (g(y)) = y, то есть g = f −1 , определённое в U(y0 ). Если f −1 (U(y0 )) U ∗ (x0 ) = U(x0 ), то x0 ∈ U(x0 ) и отображения f и g = f −1 — биекция множеств U(x0 ) и U(y0 ). Так как отображение f дифференцируемо в G, то f непрерывно в G, и согласно характеристическому свойству непрерывного отображения f −1 (U(x0 )) — открытое T ∗ n −1 множество в R . Поэтому f (U(y0 )) U (x0 ) = U(x0 ) ⊂ G — открытое множество или окрестность точки x0 . Замечание. Пусть
D(f1 ,...,fn ) D(x11 ,...,xn n)
6= 0 и
D(g1 ,...,gn ) D(y 1 ,...,y n )
D(f1 , . . . , fn ) · D(x1 , . . . , xn )
6.3.2.
=
−1 D(f1−1 ,...,fn ) D(y 1 ,...,y n )
D(f1−1 , . . . , fn−1 ) D(y 1 , . . . , y n )
6= 0. Тогда
1 = |E| = ... 0
. . . 0 . .. . .. . . . . 1
Принцип сохранения области
Теорема. Если y = f (x) — дифференцируемое отображение области D ⊂ Rn в Rn , то её образ f (D) будет также областью в Rn . Проверим сначала, что D∗ = f (D) — открытое множество. По условию, D — открытое множество. Рассмотрим произвольное y ∈ D∗ и в прообразе f −1 (y) ⊂ D точки y выберем некоторое x ∈ f −1 (y) ⊂ D, так что y = f (x). Для точек x ∈ D и y = f (x) ∈ D∗ справедлива теорема 1 пункта 3.1., согласно которой, существуют окрестности U(x) ⊂ D и U(y) ⊂ D∗ , что U(y) = f (U(x)). Но f (U(x)) ⊂ f (D) = D∗ , то есть y входит в D∗ вместе со своей окрестностью U(y), так что D∗ — открытое множество. По условию, область D — связное множество в Rn и дифференцируемое отображение f области D непрерывно в D и непрерывный образ f (D) связного множества D есть связное множество в Rn . Таким образом, D∗ = f (D) — область в Rn . 6.3.3.
Зависимость функций
Пусть на открытом множестве G пространства Rm , m > 1, заданы n дифференцируемых функций (n ∈ N). u1 = ϕ1 (x1 , . . . , xm ), . . . . . . . . . . . . . . . . . . . .. un = ϕn (x1 , . . . , xm ) 79
(3)
Определение 1. Некоторая функция из (3), скажем, функция uk = ϕk (x1 , . . . , xm ) называется зависимой от остальных функций из (3), если на некотором открытом множестве D пространства Rn−1 , n > 1, существует такая дифференцируемая функция Φ = ϕ(u1 , . . . , uk−1 , uk+1 , . . . , un ), что uk = Φ(u1 , . . . , uk−1 , uk+1 , . . . , un ) = Φ(ϕ1 (x1 , . . . , xm ), . . . , ϕk−1 (x1 , . . . , xm ), ϕk+1 (x1 , . . . , xm ), . . . , ϕn (x1 , . . . , xm )) для всех x = (x1 , . . . , xm ) ∈ G. Если ни одна из функций в системе (3) не является зависимой от остальных на G, то система (3) называется независимой системой на G. Пример 1. Функции u1 = x + y, u2 = x − y функционально независимы в R2 . Если u1 и u2 функционально зависимы в U(x0 , y0 ), то существует u1 = Φ(u2 ), дифференцируемая на (a, b) ⊂ R. Если u2 = const, то u1 = const. С другой стороны, если x − y = c, то y = x − c и u1 = 2x − c, что не является константой. Пример 2. Функции u1 = x + y, u2 = x2 + y 2 , u3 = 2xy, (x, y) ∈ R2 . Тогда u2 = u21 − u3 . Теорема. Если в системе функций
u1 = f1 (x1 , . . . , xm ) .................... un = fn (x1 , . . . , xm ),
(1)
дифференцируемых на некотором открытом множестве G ⊂ Rm , число n < m и якобиан системы (1) по каким-либо n аргументам отличен от нуля в некоторой точке x0 = (x10 , . . . , xm 0 ) ∈ G, то система (1) функционально независима в любой окрестности точки x0 . Не ограничивая общности, считаем, что u1 = f1 (x1 , . . . , xn , xn+1 , . . . , xm ) ................................. un = fn (x1 , . . . , xn , xn+1 , . . . , xm ) 1
n
,...,u ) и D(u D(x1 ,...,xn ) (x0 ) 6= 0. Допустим, что система (1) функционально зависима в некоторой окрестности U(x0 ) ⊂ G. Тогда существует Φ = Φ(u1 , . . . , uk−1 , uk+1 , . . . , un ), дифференцируемая на некотором открытом множестве D ⊂ Rn−1 и uk = Φ(u1 , . . . , uk−1 , uk+1 , . . . , un ), (u1 , . . . , uk−1 , uk+1 , . . . , un ) ∈ D. Сложная функция Φ = Φ(f1 (x1 , . . . , xm ), . . . , fk−1 (x1 , . . . , xm ), fk+1 (x1 , . . . , xm ), . . . , fn (x1 , . . . , xm )) дифференцируема на G и uk = Φ′ и ∂uk ∂x1
k−1
1
k+1
n
∂Φ ∂u ∂Φ ∂u ∂Φ ∂u ∂Φ ∂u = ∂u 1 ∂x1 + . . . + ∂uk−1 ∂x1 + ∂uk+1 ∂x1 + . . . + ∂un ∂x1 ; . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. ∂uk ∂Φ ∂u1 ∂Φ ∂uk−1 ∂Φ ∂uk+1 ∂Φ ∂un ∂xn = ∂u1 ∂xn + . . . + ∂uk−1 ∂xn + ∂uk+1 ∂xn + . . . + ∂un ∂xn
(2)
Соотношения (2) показывают, что в якобиане ∂u1 1 1 . . . ∂un ∂x ∂x . . . . . . . . . . . . . . . D(u1 , . . . , un ) ∂uk ∂uk = ∂x1 . . . ∂x n 1 n D(x , . . . , x ) . . .n. . . . . . . . . . .n. ∂u ∂u . . . ∂xn ∂x1
k-я строка есть линейная комбинация остальных, то есть, что якобиан равен нулю. Противоречие. В примере 1 D(u1 , u2 ) 1 1 = = −2 6= 0. 1 −1 D(x, y)
6.4. Относительные (или условные) экстремумы 6.4.1.
Понятие относительных экстремумов
Относительный (или условный) экстремум нескольких действительных переменных — это её максимум или минимум с учётом только тех точек области определения, координаты которых связаны одним или несколькими заданными уравнениями (так называемыми уравнениями связи).
80
Функция u = xy не имеет экстремума в (0, 0), но если y = x, то u = x2 имеет в (0, 0) минимум, а если y = −x, то u = −x2 имеет в (0, 0) максимум. Пусть функция f (x, y) дифференцируема на открытом множестве G ⊂ R2 и её аргументы x, y связаны уравнением F (x, y) = 0, в котором функция F (x, y) дифференцируема на G. Тогда функция f есть функция одного аргумента, скажем, x, если F (x, y) удовлетворяет условию теоремы о существовании и дифференцировании неявной функции y = y(x). Сложная функция f (x, y(x)) дифференцируема на некотором интервале. Полная производная функции f равна нулю в точках её экстремума, так что ∂f ∂f dy + = 0. ∂x ∂y dx Дифференцируя уравнение F (x, y) = 0, y = y(x), получим ∂F ∂F dy + = 0. ∂x ∂y dx Имеем систему
откуда, исключая
dy dx ,
получим уравнение
∂f ∂f + ∂x ∂y ∂F ∂F + ∂x ∂y
dy = 0; dx dy = 0, dx
∂f ∂F ∂f ∂F − = 0. ∂x ∂y ∂y ∂x Координаты стационарных точек находятся в виде решений системы уравнений ∂f ∂F − ∂f ∂F = 0; ∂x ∂y ∂y ∂x F (x, y) = 0. 6.4.2.
Общий случай
m+n
Пусть задана функция f из R в R и отображение F из Rm+n в Rn с компонентами F = (F1 , . . . , Fn ). 1 m 1 n Fj (x, y) = Fj (x , . . . , x , y , . . . , y ), j = 1, n, (x, y) ∈ DF ⊂ Rm+n ; f (x, y) = f (x1 , . . . , xm , y 1 , . . . , y n ), (x, y) ∈ DfT⊂ Rm+n . Точку (a, b) = (a1 , . . . , am , b1 , . . . , bn ) ∈ Df DF называют точкой относительного максимума (относительного минимума) функции f при уравнениях связи Fj (x, y) = 0, j = 1, n, если она удовлетворяетTэтим уравнениям, то есть Fj (a, b) = 0, j = 1, n (или F (a, b) = 0), и обладает такой окрестностью Q ⊂ Df DF , что f (a, b) > f (x, y) (соответственно, f (a, b) 6 f (x, y)) для всех (x, y) ∈ Q, удовлетворяющих уравнениям связи F (x, y) = 0, или Fj (x, y) = 0, j = 1, n. Считаем функцию f (x, y) дифференцируемой на некотором открытом множестве G ⊂ Df ⊂ Rm+n , а все функции, входящие в уравнения связи Fj (x, y) = Fj (x1 , . . . , xm , y 1 , . . . , y n ) = 0, j = 1, n,
(1)
дифференцируемыми на G ⊂ DF ⊂ Rm+n и их частные производные по всем аргументам y k , k = 1, n, непрерыв1 ,...,Fn ) ными в G. Предположим, что D(F D(y 1 ,...,y n ) 6= 0 на G. Тогда, по теореме о существовании и дифференцируемости неявного отображения в окрестности любой точки из G, переменные y 1 , . . . , y n являются дифференцируемыми функциями y j = y j (x1 , . . . , xm ), j = 1, n, так что f (x, y) есть локально сложная дифференцируемая функция от аргументов x1 , . . . , xm . Полный дифференциал функции f (x1 , . . . , xm , y 1 , . . . , y n ), y j = y j (x1 , . . . , xm ), j = 1, n, в её стационарных точках равен нулю, то есть ∂f ∂f ∂f ∂f ∂f dx1 + 2 dx2 + . . . + m dxm + 1 dy 1 + . . . + n dy n = 0, ∂x1 ∂x ∂x ∂y ∂y
(2)
где dx1 , . . . , dxm — дифференциалы независимых переменных, а dy 1 , . . . , dy n — дифференциалы функций от аргументов x1 , . . . , xm . С другой стороны, уравнения (1) можно продифференцировать полным образом и получить уравнения ∂Fj 1 ∂Fj ∂Fj 1 ∂Fj dx + . . . + m dxm + dy + . . . + n dy n , j = 1, n. (3) ∂x1 ∂x ∂y 1 ∂y 81
Имеем n + 1 уравнений (2) и (3) для нахождения стационарных точек. Так как якобиан 6= 0, то dy 1 , . . . , dy n выражаются из (3) через dx1 , . . . , dxm . Подставляя эти выражения в (2), получим M1 dx1 + M2 dx2 + . . . + Mm dxm = 0,
(4)
где Mi , i = 1, m, явно выражаются через частные производный функций f и Fj , j = 1, n. Так как dx1 , . . . , dxm можно выбирать произвольно, то из (4) следует, что Mi = 0, i = 1, m. Присоединяя этим уравнения к уравнениям (1), получим систему (m + n) уравнений с (m + n) неизвестными x1 , . . . , xm , y 1 , . . . , y n . Решениями этой системы будут координаты стационарных точек условного экстремума функции f (x, y). Остаётся исследовать знак d2 f в этих точках. 6.4.3.
Метод множителей Лагранжа
Исключение дифференциалов из системы (3) предыдущего пункта удобнее всего производить по предложенному Лагранжем способу множителей, при котором вычисления становятся более симметричными. Умножим уравнения (3) на постоянные неизвестные множители λ1 , . . . , λn , соответственно, и почленно сложим с (2). Результат имеет вид A1 dx1 + Am dxm + B1 dy 1 + Bn dy n = 0,
(5)
где Ai , i = 1, m и Bj , j = 1, m — функции, явно выражающиеся через частные производные. Допустим, что λ1 , . . . , λn можно выбрать так, чтобы B1 = . . . = Bn = 0. Тогда (5) примет вид A1 dx1 + . . . + Am dxm = 0 и все A1 = . . . = Am = 0 в силу произвольности дифференциалов dx1 , . . . , dxm . Вместе с (1) получаем 2n + m уравнений для нахождения x1 , . . . , xm , y 1 , . . . , y n и λ1 , . . . , λn . ∂f ∂F1 ∂F1 + λ1 1 + . . . + λn 1 = 0; 1 ∂x ∂x ∂x ... ∂F1 ∂Fn ∂f m + λ1 m + . . . + λn m = 0; ∂x ∂x ∂x ∂f ∂F1 ∂F1 + λ1 1 + . . . + λn 1 = 0; ∂y 1 ∂y ∂y ... ∂f + λ1 ∂F1 + . . . + λn ∂Fn = 0; Fj (x, y) = 0, j = 1, n. ∂y n ∂y n ∂y n Рассмотрим функцию Φ = f = λ1 F1 + . . . λn Fn от 2n + m аргументов,
(6)
Φ(x, y, λ) = Φ(x1 , . . . , xm , y 1 , . . . , y n , λ1 , . . . , λn ). Если считать x1 , . . . , xm , y 1 , . . . , y n , λ1 , . . . , λn независимыми переменными, то (6) равносильны выражениям ∂Φ ∂Φ = 0, i = 1, m, = 0, j = 1, n. Fj (x, y) = 0, j = 1, n. i ∂x ∂y j
(7)
Уравнениям (7), как известно, удовлетворяются координаты стационарных точек функции Φ(x, y, λ), в которых она может иметь обычные (а не условные) экстремумы. Замечание. Рассмотрение функции Φ удобно также и при исследовании знака d2 f , если теперь аргументы 1 x , . . . , xm , y 1 , . . . , y n рассматривать как независимые переменные, а λ1 , . . . , λn , как постоянные. Тогда уравнение Φ = f есть следствие уравнений связи (1), а потому, в силу этих уравнений, d2 f = d2 Φ. С другой стороны, при сделанном предположении, d2 Φ = d2 f + λ1 d2 F1 + . . . + λn d2 Fn . Заменяя в правой части вторые дифференциалы их общими выражениями вида 2 ∂ ∂ ∂ ∂ ∂Fj 2 1 ∂Fj 2 1 m 1 n d Fj = dx + . . . + m dx + 1 dy + . . . + n dy Fj + d y + . . . + n d2 y n , j = 1, n, ∂x1 ∂x ∂y ∂y ∂y 1 ∂y и помня, что (по нашей договорённости) d2 y j = 0, j = 1, n, в силу уравнений (6), находим 2 ∂ ∂ ∂ ∂ 1 m 1 n d2 f = d2 Φ = dx + . . . + dx + dy + . . . + dy Φ. ∂x1 ∂xm ∂y 1 ∂y n 82
Таким образом, можно заменить d2 f на d2 Φ, причём последний дифференциал вычисляется в предположении, что переменные x1 , . . . , xm y 1 , . . . , y n независимы, а постоянные числа λ1 , . . . , λn найдены посредством уравнений (7).
6.5. Дополнительные результаты 6.5.1.
Теорема Эйлера о дифференцируемости однородных функций
1
Функция f (x , . . . , xm ) называется однородной, если формула f (tx1 , tx2 , . . . , txn ) = tn f (x1 , . . . , xm )
(1)
выполняется для всех t. Число n ∈ N называется степенью однородности функции f . Рассмотрим функцию f (x, y, z). Тогда (1) имеет вид f (tx, ty, tz) = tn f (x, y, z). Положим t =
1 x
(1′ )
в (1’). Тогда
y z f (x, y, z) = xn f 1, , , x x или y z f (x, y, z) = xn ϕ , . (2) x x Таким образом, если разделить однородную функцию n–ой степени на n–ую степень одной из переменных, то частное будет зависеть только от отношения переменных между собой. Обратно, если справедлива формула (2), то f (tx, ty, tz) = tn xn ϕ xy , xz = tn f (x, y, z), то есть справедливо (1’). Дифференцируя (1’) по t, получим xfx′ (tx, ty, tz) + yfy′ (tx, ty, tz) + zfz′ (tx, ty, tz) = ntn−1 f (x, y, z),
(3)
и полагая в (3) t = 1, имеем xfx′ (x, y, z) + yfy′ (x, y, z) + zfz′ (x, y, z) = nf (x, y, z).
(4)
В формуле (4) и заключается теорема Эйлера. Теорема Эйлера. Сумма произведений частных производных однородной функции на соответствующие переменные равна произведению самой функции на её степень однородности. Дифференцируя (3) по t, получим ′′ ′′ ′′ ′′ ′′ ′′ (tx, ty, tz)+ (tx, ty, tz) + yzfyz (tx, ty, tz) + xzfxz (tx, ty, tz) + yxfyx (tx, ty, tz) + y 2 fyy (tx, ty, tz) + xyfxy x2 fxx ′′ ′′ ′′ (tx, ty, tz) + z 2 fzz (tx, ty, tz) = n(n − 1)tn−2 f (x, y, z), (tx, ty, tz) + zyfzy + zxfzx
откуда при t = 1 получим
2 ∂ ∂ ∂ x +y +z f (x, y, z) = n(n − 1)f (x, y, z). ∂x ∂y ∂z
Для любого k ∈ N
k ∂ ∂ x1 1 + . . . + xm m f (x1 , . . . , xm ) = n(n − 1) · . . . · (n − k + 1)f (x1 , . . . , xm ). ∂x ∂x 6.5.2.
Теорема о пределе частных производных
Теорема. Если fx′ (x + h, y, z) имеет предел при h → 0, то lim fx′ (x + h, y, z) = fx′ (x, y, z). h→0
По формуле конечных приращений, f (x + h, y, z) − f (x, y, z) = fx′ (x + θh, y, z), 0 < θ < 1 h
и
f (x + h, y, z) − f (x, y, z) = fx′ (x, y, z). h→0 h
lim fx′ (x + h, y, z) = lim fx′ (x + θh, y, z) = lim
h→0
h→0
83
6.5.3.
Преобразование Лежандра
∂z ∂z Пусть функция z = f (x, y). Положим p = ∂x , q = ∂y и считаем, что функции p и q функционально независимы. p и q — независимые переменные. Рассмотрим новую функцию
(6)
u = px + qy − z. Так как dz = p dx + q dy, то du = p dx + x dp + q dy + y dq − dz = x dp + y dq + (p dx + q dy) − (p dx + q dy) = x dp + y dq. Следовательно,
∂u ∂u = x; = y. ∂p ∂q
Дифференцируя последние две формулы, получим dx =
∂2u ∂2u ∂2u ∂2u dp + dq, dy = dp + 2 dq. 2 ∂p ∂p∂q ∂q∂p ∂q
(8)
Так как в уравнениях (8) dx и dy — произвольные, то определитель системы обязан быть отличен от 0. H=
∂2u ∂2u − ∂p2 ∂q 2
∂2u ∂p∂q
2
6= 0.
(9)
Разрешая систему (8) относительно dp и dq, получим ∂2u 1 ∂2u ∂2u 1 ∂2u dp = dx − dy , dq = dy − dx . H ∂q 2 ∂p∂q H ∂p2 ∂p∂q Подставляя эти формулы в выражение для второго дифференциала d2 z = d(dz) = d(p dx + q dy) = dx dp + dy dq, где x, y рассматриваются как независимые переменные, а dx и dy, как постоянные, получаем ∂2u ∂2u 2 1 ∂2u 2 , dx − 2 dx dy + dy d2 z = H ∂q 2 ∂p∂q ∂p2 откуда
∂2z 1 ∂2u = , ∂x2 H ∂q 2 6.5.4.
∂2z 1 ∂2u =− ; ∂x∂y H ∂p∂y
∂2z 1 ∂ 2u = . ∂y 2 H ∂p2
Теорема С. Банаха о неподвижной точке
Пусть X = (X; p) — полное метрическое пространство. Отображение f : X → X, Df = X, называется сжимающим отображением, если существует q, 0 < q < 1, что ρ(f (x′ ), f (x′′ )) 6 qρ(x′ , x′′ ). Из определения следует, что сжимающее отображение f равномерно непрерывно на X (δ = ε) и, следовательно, непрерывно на X. Теорема (принцип сжимающего отображения). Если f : X → X сжимающее, то существует единственная x0 ∈ X, для которой f (x0 ) = x0 . Точка x0 ∈ X называется неподвижной точкой отображения f. Рассмотрим произвольное x1 ∈ X и образуем точки x2 = f (x1 ), x3 = f (x2 ), . . . , xn+1 = f (xn ), n ∈ N. Покажем, что последовательность (xn ) — фундаментальная. Обозначим ρn = ρ(xn , xn+1 ), ρ1 = ρ(x1 , x2 ). Тогда ρn = ρ(xn , xn+1 ) = ρ(f (xn−1 ), f (xn )) 6 qρ(xn−1 , xn ) = qρn−1 , n ∈ N, n > 2. Таким образом, ρn 6 q n−1 ρ1 , n > 2. Используя неравенство треугольника для метрики ρ, получим для всех n, m ∈ N оценки ρ(xn , xn+m ) 6 ρ(xn , xn+1 ) + ρ(xn+1 , xn+2 ) + . . . + ρ(xn+m−1 , xn+m ) = ρn + ρn+1 + . . . + ρn+m−1 6 1 6 q n−1 + q n−2 + . . . + q n+m−2 ρ1 = q n−1 (1 + q + . . . + q m−1 )ρ1 < q n−1 ρ1 , n > 2. 1−q
1 Так как lim q n−1 = 0, то для любого ε > 0 существует N ∈ N, N = N (ε), что q n−1 1−q ρ1 < ε для всех n→∞
n > N = N (ε) и, следовательно, ρ(xn , xn+m ) < ε для всех n > N = N (ε) и всех m ∈ N, то есть (xn ) — 84
фундаментальная в X. Так как X — полное пространство, то последовательность (xn ) имеет предел (существует lim xn = x0 и x0 ∈ X).
n→∞
Так как f непрерывна в x0 ∈ X, то lim f (xn ) = f (x0 ). n→∞
Так как lim xn+1 = lim xn = x0 , то переходя в xn+1 = f (xn ), n ∈ N к пределу по n → ∞, получим n→∞
n→∞
x0 = f (x0 ), то есть x0 — неподвижная точка отображения f . Если y = f (y) для некоторого y ∈ X, y 6= x0 , то ρ(y, x0 ) = ρ(f (y), f (x0 )) 6 qρ(y, x0 ) и ρ(y, x0 ) > 0, что невозможно, так как 0 < q < 1. 6.5.5.
Усиленная форма теоремы Банаха
Теорема. Если отображение f : X → X полного метрического пространства X для некоторого n ∈ N порождает отображение f n = f ◦ f ◦ . . . ◦ f , сжимающее в X, то f имеет в X единственную неподвижную {z } | n раз точку. Согласно теореме Банаха, существует единственная точка x0 ∈ X, в которой f n (x0 ) = f (f n (x0 )) = x0 . Тогда f n (f (x0 )) = f (x0 ), то есть точка f (x0 ) — неподвижная точка отображения f n . Но f n имеет единственную неподвижную точку x0 и, следовательно, f (x0 ) = x0 , то есть x0 — неподвижная точка отображения f . Если y = f (y) для некоторого y ∈ X, то f n (y) = f n−1 (f (y)) = f n−1 (y) = f n−2 (f (y)) = f n−2 (y) = . . . = f (y) = y, то есть y — неподвижная точка отображения f n . Но f n имеет единственную неподвижную точку x0 , то есть y = x0 .
85