This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
(в) Если В равномощно А, то существует биективное отображение f:A B. Тогда обратное отображение f -1:В А (см. 1.22) осуществляет биективное отображение множества В на А, откуда следует, что А равномощно В. (с) Пусть А равномощно В, а В равномощно С. Это значит, что существуют биективные отображения f:В А и g:C B. Тогда суперпозиция g f осуществляет биективное отображение множества С на А (теор. 1.25). Но это и означает, что А равномощно С. 1.76. Замечание Мы видим, что отношение равномощности множеств обладает теми же свойствами рефлексивности, симметричности и транзитивности, что и ранее изученное отношение эквивалентности в том или ином множестве. По этой причине равномощные множества называются также эквивалентными. При этом вместо «А равномощно В» пишут просто А В. 1.77. Определение (а) Множество А называется конечным, если оно либо пустое, либо эквивалентно некоторому отрезку Nk натурального ряда. (в) Множество А называется бесконечным, если оно не является конечным, т.е. А – не пусто и неэквивалентно никакому отрезку натурального ряда. (с) Множество А называется счетным, если А N. (d) Множество А называется несчетным, если А не конечно и не счетно. (e) Множество А называется не более, чем счетным, если А либо конечно, либо счетно. 1.78. Замечание Определение 1.77 (а) не предполагает, что непустое конечное множество эквивалентно только одному отрезку натурального ряда. Доказательству этого факта мы предпошлем лемму и следующую за нею теорему. 1.79. Лемма Пусть В – непустое собственное подмножество множества А и А В. Пусть также а - произвольный элемент множества А. Утверждается: (а) Если а В, то существует такое биективное отображение g:A B, что g(a)=a. (в) Если а В, то найдутся непустое собственное подмножество В1 множества А и биективное отображение g:A B1 (так что А B1) такие, что а B1 и g(a)=a. Доказательство (а) Рассмотрим какое-либо биективное отображение f:A B (такое отображение существует, т.к. А В). Если f(a)=a, то полагаем g=f. Если же b=f(a) a (a,b B), то найдем элемент с А, для которого f(c)=a. Отображение f переводит элементы с и а множества А соответственно в элементы а и b множества В (см. рис.) c a
a b Определим отображение g:A B, отличающееся от f только своими значениями на элементах с и а: g(c)=b, g(a)=a, g(x)=f(x) при х с и х а (х А) 20
c а ][ a b Ясно, что g:A B биективно и т.к. g(a)=a, то g – именно то отображение, существование которого требовалось доказать. (в) Пусть f – какое-либо биективное отображение множества А на В и b=f(a) (b B). Рассмотрим следующее подмножество В1 множества А: В1= ={х А: x=a или х B, х b} (В1 содержит элемент а и все элементы множества В, кроме элемента b). Ясно, что В1 – непустое собственное подмножество множества А, ибо а B, b B1. Определим отображение g:A B1, полагая: f ( x), если х а, х А g(x)= а, если х а Очевидно, что g:A B1 – биективно и g(a)=a, поэтому множество B1 и отображение g суть именно те объекты, существование которых требовалось доказать. 1.80. Теорема Конечное множество не может быть эквивалентным своему собственному подмножеству. Доказательство Теорема верна для пустого конечного множества, т.к. оно не имеет собственных подмножеств. Непустое конечное множество эквивалентно по крайней мере одному отрезку натурального ряда. Докажем индукцией по числу k, что любое конечное множество, эквивалентное отрезку Nk натурального ряда, не эквивалентно никакому своему собственному подмножеству. При k=1 это утверждение верно, т.к. множество, эквивалентное отрезку N1 натурального ряда, имеет вид {a} и у него нет собственных подмножеств, кроме пустого множества. Пусть наше утверждение верно для любого конечного множества, эквивалентного отрезку Nk натурального ряда. Докажем, что оно справедливо и для любого конечного множества, эквивалентного отрезку Nk+1 натурального ряда. Допустим противное. Тогда найдется множество А, эквивалентное отрезку Nk+1 натурального ряда, а также эквивалентное некоторому своему собственному подмножеству В (очевидно, непустому). Пусть - биективное отображение множества Nk+1 на А и а= (k+1) (а А). Не ограничивая общности рассуждений, можно считать (см. лемму 1.79), что а B и существует биективное отображение g:A B, для которого g(a)=a. Заметим, что множество А содержит элемент, не принадлежащий В (ведь В – собственное подмножество А), а потому – отличный от а (а B). Этот элемент и элемент а переводятся отображением g в различные элементы множества В. Так как g(a)=a, то заключаем, что множество В содержит элемент, отличный от а. Рассмотрим множества A ={x А: x a}, ={x В: x a}. Образно выражаясь, можем сказать, что множества А и В B «получаются из множеств А и В соответственно удалением из них элемента не пусты, В А и А соа». Согласно вышесказанному, множества А и В 21
(это элемент множества А, не принаддержит элемент, не принадлежащий В - непустое собственное подмножество лежащий множеству В). Значит, В , т.е. А В . Так как (Nk)= множества А . При этом очевидно, что g( А )= В А , то А Nk. Но это противоречит предположению индукции. Значит, сделанное выше допущение неверно, т.е. любое конечное множество, эквивалентное отрезку Nk+1 натурального ряда, не эквивалентно никакому своему собственному подмножеству. Методом математической индукции теорема доказана. Следствие Любое непустое конечное множество эквивалентно только одному отрезку натурального ряда. Доказательство Допуская противное, найдем непустое конечное множество А, эквивалентное различным отрезкам Nk и Nр натурального ряда: А Nk , А Nр , k p. Используя симметричность и транзитивность отношения равномощности, можем заключить, что Nk Nр. По теореме 1.44. одно из чисел k, p меньше другого. Пусть для определенности k
бражения f: Nk+1 А, для которого f(k+1)=a. Пусть - какое-нибудь биективное отображение множества Nk+1 на А (таковое существует, ибо А является k+1 – элементным множеством). Если (k+1)=a, то полагаем f= . Если же (k+1)= a а, то найдем число n (n Nk)такое, что (n)=а. Рассмотрим отображение f: Nk+1 А, которое отличается от только значениями в «точках» n и k+1: f(n)= a , f(k+1)=a, f(x)= (x) при х n, k+1. Ясно, что f – биективно вместе с и f(k+1)=a. Теорема доказана. 1.84. Теорема Число элементов любого непустого конечного множества больше числа элементов любого его непустого собственного подмножества. Доказательство Пусть А – произвольное непустое конечное множество и В – любое непустое собственное подмножество множества А. По теореме 1.83. множество В конечно. Обозначим через n и m числа элементов множеств А и В соответственно. Требуется доказать, что n>m. Рассмотрим какое-либо биективное отображение f множества А на отрезок Nn натурального ряда. Так как В – собственное подмножество множества А, то при отображении f В биективно отображается на собственное подмножество отрезка Nn, т.е. В f(B) Nn и f(B) Nn. С другой стороны, В Nm, а потому и Nm f(B) (симметричность и транзитивность отношения равномощности). Если допустить, что m n, то окажется, что Nm f(B) Nn Nm и f(B) Nm, т.е. окажется, что Nm эквивалентно своему собственному подмножеству. Но это противоречит утверждению теоремы 1.80. Следовательно, mm an=am an-m, an m n откуда следует, что а является делителем числа а и что =an-m m a (а,m,n N, n>m ) Индуктивно определяется также произведение первых n натуральных чисел, обозначаемое n! (произносится «эн-факториал»): 1!=1, (n+1)!=n! (n+1) где n 1. Имеем: 2!=1! 2=1 2; 3!=2! 3=1 2 3; 4!=3! 4=(1 2 3) 4 и т.д.
23
(с) Пусть Х – конечное n-элементное множество. Выясним, сколько элементов содержит класс B ( X ) всех подмножеств множества Х , т.е. найдем число всех подмножеств множества Х, включая пустое подмножество. При n=1, когда Х имеет вид X={a}, имеется всего два подмножества множества Х: само Х и . При n=2, когда Х имеет вид X={a, b}, имеется всего четыре подмножества множества Х: , {a}, {b}, Х. В обоих рассмотренных случаях число всех подмножеств множества Х можно записать в виде 2n. Докажем индукцией по числу n, что число всех подмножеств n-элементного множества действительно равно 2n. Это утверждение верно, как мы видели выше, при n=1. Предположим, что оно верно для некоторого n и докажем, что оно остается справедливым и для числа n+1, т.е. убедимся, что число всех подмножеств n+1-элементного множества равно 2n+1. Пусть А – любое n+1элементное множество и а – любой элемент этого множества. Рассмотрим сперва все те подмножества множества А, которые не содержат элемента а. Это будут все подмножества n-элементного множества {х А: х а}. Согласно предположению индукции, таких подмножеств будет 2n. «Добавляя» к каждому из этих подмножеств элемент а, получим все подмножества множества А, содержащие элемент а. Таких подмножеств также будет 2n. Число всех подмножеств множества А будет равно 2n + 2n=2n 2=2n+1, что и доказывает наше утверждение. Индукцией по числу n легко доказать неравенство 2n>n для любого n N. Следовательно, можно утверждать, что число элементов класса B (Х) больше числа элементов конечного множества Х. Впрочем, это последнее утверждение легко доказать следующим образом. Пусть Х={a,b,…,l} есть n-элементное множество. Ясно, что Х эквивалентно классу {{a}, {b}, …,{l}} всех одноэлементных подмножеств множества Х. Значит, этот класс содержит n элементов (см. 1.82). С другой стороны, этот класс является собственным подмножеством класса B (Х) и потому (1.84) число элементов класса B (Х) больше n. (d) Сочетаниями из n элементов по m (n, m N, n m) называются различные m-элементные подмножества n-элементного множества. Число таких подмножеств, т.е. число сочетаний из n элементов по m будем обозначать символом Cnm . Очевидно, что Cn1 =n, Cnn =1. Считая n>2, найдем выражение для Cn2 . Пусть дано n-элементное множество {a,b,c,…,k,l}. Двухэлементные множества, содержащие элемент а, таковы: {a,b}, {a,с},…, {a,k}, {a,l}. Число таких множеств равно n-1. Множества, содержащие элемент b (двухэлементные), не считая уже рассмотренного множества {a,b}, таковы: {b,с},…, {b,k}, {b,l}. Число таких множеств равно n-2. Продолжая эти рассуждения, убедимся, что число двухэлементных подмножеств n-элементного множества равно n(n 1) n! (n-1)+( n-2)+…+1, т.е. Cn2 = = 2 2!(n 2)! n! Докажем индукцией по числу n, что Cnm = . Предварительно усm!(n m)! тановим формулу Cnm1 = Cnm + Cnm1 , в которой предполагается, что 2 m n. 24
Пусть А – любое n+1-элементное множество, а – какой-либо элемент множества А и A ={x A: x a}. Рассмотрим всевозможные m-элементные подмножества множества А, не содержащие элемента а. Это будут всевозможные m-элементные подмножества n-элементного множества A . Следовательно, их число равно Cnm . Чтобы получить всевозможные m-элементные подмножества множества А, содержащие элемент а, следует «добавить» этот элемент ко всевозможным m-1элементным подмножествам множества A . Т.к. число этих последних равно Cnm1 , то действительно Cnm1 = Cnm + Cnm1 . Эта формула сохранит свою силу и при m=1, если принять, что для любого n N Cn0 =1. Это определение естественно, т.к. всякое множество содержит единственное пустое подмножество. Примем также, что 0!=1, после чего перейдем к доказательству формулы n! при любом n N и любом целом m, удовлетворяющем нераCnm = m!(n m)! венствам 0 m n. При n=1 0 m 1 (m-целое) наша формула, очевидно, верна. Пусть она верна для некоторого натурального числа n и всех целых m, удовлетворяющих неравенствам 0 m n (другими словами, мы предполагаем, это число m!(n-m)! при указанных m является делителем числа n! и что n! частное равно Cnm . В этом предположении установим, что докаm!(n m)! зываемая формула остается справедливой для числа n+1 и всех целых m, удовлетворяющих неравенствам 0 m n+1. Иными словами, мы должны доказать, что число m!(n+1-m)! является делителем числа (n+1)! и что (n 1)! Cnm1 = . Справедливость этих утверждений очевидна при m=0 и m!(n 1 m)! n! n! m=n+1. Если же 1 m n, то Cnm1 = Cnm + Cnm1 = + = m!(n m)! (m 1)!(n 1 m)! n!(n 1 m) n!m (n 1)! = + = , ч.т.д. m!(n 1 m)! m!(n 1 m)! m!(n 1 m)! При этом мы воспользовались предположением индукции (выписывая выражения для Cnm и Cnm1 ), а также следующими легко доказуемыми предложениями: 1) Пусть a, b, c – натуральные числа. Тогда ac является делителем bc в том и только в том случае, если а является делителем b. При этом bc b = . ac a 2) Если а является делителем b и с (a, b, c N), то а является делителем b c bc b+c и + = . a a a
25
Доказанной формуле при m>1 можно придать следующий вид: n(n 1)...(n (m 1)) . Отсюда следует, что произведение любых m поCnm = m! следовательных натуральных чисел делится на m! (ведь Cnm есть натуральное число). (е) Нетрудно доказать (это предоставляется читателю), что всякое совершенно упорядоченное конечное множество является вполне упорядоченным. Для упрощения записи пар, принадлежащих отношению порядка в таком множестве, используется следующий прием. Сначала выписывается первый элемент множества, т.е. элемент, предшествующий всем остальным элементам. Затем на каждом шагу выписывается элемент, первый из невыписанных до этого элементов. Так продолжается до тех пор, пока не придем к последнему элементу, которому предшествуют все остальные элементы. Пусть, например, дано множество {a, b, c}, в котором c a, c b и a b. Вместо того, чтобы выписывать все эти «неравенства», пишут просто cab, подразумевая при этом, что элемент с предшествует элементам a и b, и что элемент а предшествует b. Вполне упорядоченное n-элементное множество называется перестановкой n элементов (этого множества). Если дано (неупорядоченное) n-элементное множество, то возникает вопрос: сколькими способами можно вполне упорядочить данное множество или, другими словами, сколько перестановок можно составить из элементов данного множества? Подчеркнем, что различные перестановки n элементов данного n-элементного множества отличаются друг от друга только порядком элементов. Чтобы ответить на поставленный вопрос, рассмотрим сначала двухэлементное множество, например, {a, b}. Число перестановок, которые можно составить из элементов этого множества, равно 2 (перестановки ab и ba). Пусть теперь дано трехэлементное множество { a, b, с}. Чтобы получить все различные перестановки трех элементов a, b, с, следует к каждой из перестановок ab и ba двух элементов a и b приписать третий элемент с. Сделать это можно тремя способами, так что перестановка ab двух элементов «порождает» три перестановки трех элементов: cab, acb, abc. Точно так же перестановка ba двух элементов «порождает» три перестановки трех элементов: cba, bca, bac. Всего получаем 2 3=3! перестановок трех элементов. Теперь уже индукцией по числу n N легко доказать, на чем мы не останавливаемся, что число всех попарно различных перестановок n элементов (того или иного n-элементного множества) равно n!. (f) Возвращаясь к примеру 1.31 (с), можем заключить (на основании доказанного в 1.85 (е)), что группа k подстановок k цифр 1, 2, 3, …, k содержит ровно k! элементов (подстановок). Чтобы в этом убедиться, сопоставим каж1 2 k дой перестановке i1 i2 …ik k цифр 1, 2, 3, …, k подстановку . i i i k 1 2 Ясно, что это сопоставление является биективным отображением множества всех перестановок k цифр 1, 2, 3, …, k на множество k всех подстановок указанных k цифр. Следовательно, k содержит столько различных под26
становок, сколько различных перестановок можно составить из k цифр 1, 2, 3, …, k, т.е. k!. (g) Выясним, сколько существует различных отображений m-элементного множества Х в n-элементное множество Y. Если n=1, то при любом m N существует ровно одно отображение Х в Y. Пусть n 2 и - какое-либо биективное отображение отрезка Nn натурального ряда на множество Y. Обозначив (1)=у1, (2)=у2, …, (n)=уn, можем написать: Y={у1, у2, …, уn}. Будем решать поставленную задачу при различных значениях m N, начиная с m=1. При m=1, когда Х={a}, существует n различных отображений f1, f2, …,fn множества Х в Y: f1(а)= у1, f2(а)= у2,…, fn(а)= уn. Пусть m=2, т.е. Х имеет вид {a, b}. Существует n отображений Х в Y, которые обозначим f11, f12, …,f1n, каждое из которых переводит элемент а в у1: f11(b)= у1, f12(b)= у2,…, f1n(b)= уn. Точно так же, существует n отображений f21, f22, …, f2n Х в Y, каждое из которых переводит элемент а в у2: f21(b)= у1, f22(b)= у2,…, f2n(b)= уn. Продолжая эти рассуждения, убедимся, что существует ровно n2 различных отображений fik множества {a, b} в Y, где индексы i и k независимо друг от друга «пробегают» отрезок Nn натурального ряда. Все эти отображения могут быть сведены в таблицу: f 11 f 12 f 1n f 21 f 22 f 2 n fn1 fn 2 fnn При этом каждое отображение fik определяется равенствами: fik(а)= уi, fik(b)= уk. Обратим внимание на то, что каждое из отображений fi множества {a} в Y «порождает» n отображений fi1, fi2, …, fin множества {a, b} в Y . Мы видим, что в обоих рассмотренных случаях (m=1 и m=2) число всевозможных попарно различных отображений множества X в Y можно записать в виде nm. Докажем индукцией по числу m при любом фиксированном n (m, n N), что число различных отображений m-элементного множества в nэлементное множество действительно равно nm. При m=1 это утверждение, как доказано выше, справедливо. Предположим, что подлежащее доказательству утверждение верно для некоторого m N и установим, что оно остается таковым при замене m на m+1. Итак, пусть Х - произвольное m+1-элементное множество, Y={у1, у2, …, уn} – любое n-элементное множество и требуется доказать, что число различных отображений X в Y равно nm+1. Рассмотрим какой-нибудь элемент a X и обозначим X ={x X: x a}. Согласно предположению индукции существует ровно р= nm различных отображений f1, f2, …,fр множества X в Y (ведь X - m-элементное множество). Каждое из этих отображений «порождает» n отображений множества X в Y . Например, f1 «порождает» отображения f11, f12, …,f1n , которые определяются следующим образом: при любом k Nn 27
f1k(х) = f1(x), если x X yk, если x=a Аналогично, любое отображение fi (i Np) множества X в Y «порождает» n отображений fi1, fi2, …, fin множества Х в Y. При этом для любого i Np и любого k Nn отображение fik : X Y определяется равенством fik(х) = fi(x), если x X yk, если x=a. Все «порожденные» отображения можно свести в таблицу:
f 11 f 12 f 1n f 21 f 22 f 2 n fp1 fp 2 fpn
(*)
Число этих отображений равно p n= nm n= nm+1. Остается доказать, что среди отображений fik нет двух одинаковых отображений и что любое отображение f : X Y заключено в указанной таблице. Рассмотрим любые два отображения fik и fjs из таблицы (*). Если k s, то fik fjs, ибо fik(а)=уk уs= =fjs(а). Пусть k=s, но i j (i, j Np). Если бы при этом оказалось, что fik= fjk, то отсюда следовало бы, что fik(x)= fjk(x) для любого x X , т.е. fi= fj. Но это противоречит предположению индукции о том, что f1, f2, …, fр суть всевозможные попарно различные отображения множества X в Y. Значит, fik fjk при i j , чем и доказано, что в таблице (*) нет двух одинаковых отображений. Пусть теперь f – любое отображение множества Х в Y и f(a)=yk (k Nn). Определим отображение f : X Y, полагая f (х)= f (х) для любого x X (заметим, что отображение f называется сужением отображения f на множество X ). Так как среди отображений f1, f2, …, fр содержатся все отображения X в Y, то f =fi при некотором i Np. Следовательно, f (х) = fi(x), если x X yk, если x=a. т.е. f= fik. Итак, функции fik таблицы (*) попарно различны и среди них содержится любое отображение f : X Y. Т.к. число этих отображений fik равно nm+1, то наше утверждение (о количестве различных отображений m-элементного множества в n-элементное) доказано методом математической индукции. 1.86. Обозначение Для любых непустых множеств Х и Y (не обязательно конечных) через YX принято обозначать множество всех различных отображений f : X Y. При конечных Х и Y это обозначение напоминает нам, сколько элементов содержится в указанном множестве. 1.87. Замечание Если Х – n-элементное множество, а Y – двухэлементное множество, то, согласно доказанному в 1.85 (g), множество YX всех отображений Х в Y содержит 2n элементов. Так как множество B (Х) всех подмно-
28
жеств множества Х также содержит 2n элементов (см. 1.85 (с)), то B (Х) YX. Как показывает следующая теорема, этот результат справедлив для любого (не обязательно конечного) непустого множества Х. 1.88. Теорема Для любого непустого множества Х класс B (Х) всех подмножеств множества Х эквивалентен множеству YX всех отображений множества Х в Y, где Y – любое двухэлементное множество. Доказательство. Пусть Y={a,b}. Каждому элементу множества YX, т.е. каждому отображению f : X Y поставим в соответствие множество f -1(a) B (Х) (если f(х)=b при всех х Х, то f -1(a)= ). Убедимся, что указанное соответствие инъективно. В самом деле, пусть f, YX и f . Найдется элемент x Х такой, что f( x ) ( x ). Будем считать, для определенности, что f( x )=а, ( x )=b. Ясно, что x f -1(a), но x -1(a). Следовательно, f -1(a) -1(a). Остается доказать сюръективность указанного выше соответствия. Рассмотрим любой элемент А B (Х) (т.е. А – любое подмножество множества Х). Мы должны доказать существование такого отображения f : X Y , что f -1(a)=А. Но этому условию удовлетворяет отображение f, определяемое следующим образом: a, еслих А f ( x) b, еслих Х , х А Теорема доказана. 1.89. Теорема Непустое множество Х не эквивалентно классу B (Х) всех подмножеств множества Х, хотя и эквивалентно подмножеству класса B (Х), а именно – классу всех одноэлементных подмножеств множества Х. Доказательство Справедливость утверждения теоремы для непустого конечного множества установлена ранее (1.85 (с)). Пусть Х – бесконечное множество. Эквивалентность множества Х классу всех одноэлементных подмножеств множества Х – очевидна. Установим, что Х B (Х). Т.к. B (Х) YX, где Y-двухэлементное множество {a, b}, то достаточно доказать, что Х YX. Допустим, что существует биективное отображение F множества Х на YX. Образ любого элемента х Х при этом отображении обозначим fx (fx YX). Рассмотрим отображение : X Y, для которого значение (х) при любом х Х определяется следующим образом. Находим fx, затем значение fx на взятом элементе х, т.е. fx (х). Если при взятом х окажется, что fx (х)=а, то (х)=b; если же fx(х)=b, то (х)=а. Так определенное отображение принадлежит множеству YX и при любом х Х (х) fx (х). C другой стороны (т.к. F – сюръективно), должно быть образом при отображении F некоторого элемента х0 Х: =F(х0)= fxo. Следовательно, (х0)=fxo(х0), что противоречит определению отображения . Полученное противоречие доказывает, что допущение об эквивалентности множеств Х и YX неверно. Теорема доказана. 1.90. Замечание Если А – бесконечное множество и А В, то В - бесконечное множество. В самом деле, если допустить противное, то найдется биективное отображение f множества В на некоторый отрезок Nk натурального 29
ряда. Сужение отображения f на множество А (см. 1.85 (g)) есть биективное отображение множества А на множество f(А) Nk. Но f(А), как подмножество конечного множества Nk, само конечно (1.83). Выходит, что А эквивалентно конечному множеству f(А), т.е. А – конечно, что противоречит предположенной бесконечности этого множества. Следовательно, допущение о конечности множества В неверно. 1.91. Пример несчетного множества Рассмотрим класс B (N) всех подмножеств множества N всех натуральных чисел. Множество N бесконечно (1.85 (а)) и эквивалентно классу всех одноэлементных подмножеств множества N. Следовательно, этот класс есть бесконечное множество. А т.к. B (N) содержит указанный класс в качестве собственного подмножества, то и B (N) есть бесконечное множество (1.90). При этом B (N) N (1.89)., т.е. B (N) не конечно и не счетно. Множество a, b N, т.е. множество всех отображений множества N в двухэлементное множество, также несчетно, ибо оно эквивалентно множеству B (N) (1.88). 1.92. Определение (а) Пусть Х – произвольное множество. Всякую функцию f:N X будем называть последовательностью элементов множества Х. Последовательность f принято обозначать символом (хn), где хn= f(n) при любом n N. Значения функции f, т.е. элементы хn X (n N), называются членами последовательности (хn) (члены последовательности с различными «номерами» не обязательно обозначают различные элементы множества Х). Вместо (хn) иногда пишут просто х1, х2, …, хn, … (b) Конечной, а именно k-членной последовательностью элементов множества Х будем называть всякую функцию f:Nk X. Такую последовательность будем записывать в виде х1, х2, …, хk (хi=f(i), i Nk) 1.93. Замечания (а) Пусть А – счетное множество, т.е. А N. Существует биективное отображение f: N A. Полагая (для любого n N) f(n)= хn, мы видим, что А является множеством значений последовательности f=(хn), причем хi хj при i j (i, j N). Именно это имеют в виду, когда говорят (допуская некоторую вольность речи), что элементы любого счетного множества можно «расположить в последовательность». (b) Возвращаясь к примеру 1.91, заметим, что если в качестве двухэлементного множества a, b взять множество 0,1 , то полученный там результат можно сформулировать следующим образом: множество всех последовательностей, элементами которых служат цифры 0 и 1, - несчетно. 1.94. Теорема Всякое бесконечное подмножество счетного множества Х счетно. Доказательство Пусть А Х и А бесконечно. Расположим все элементы множества Х в последовательность (хn), в которой члены с разными номерами обозначают различные элементы множества Х. Определим индуктивно последовательность (nk) натуральных чисел следующим образом. Пусть n1 – наименьшее натуральное число, для которого xn А. Так как А бесконечно и 1
30
все элементы множества А являются членами последовательности (хn), то среди хn с n>n1 есть элементы множества А. Пусть n2 – наименьшее натуральное число, большее n1 и такое, что xn А. Вообще, если n1,…, nk (k=2, 3, 4, …) уже выбраны, то пусть nk+1 – наименьшее натуральное число, большее nk и такое, что xn А. Легко видеть, что n1 < n2<…< nk< nk+1<…Полагая f(k)= хnk (k=1, 2, 3, 4, …), получим биективное отображение f множества N на А (инъективность его очевидна, а строгое доказательство сюръективности предоставляется читателю). Теорема доказана. 1.95. Определение Пусть Х – множество и f – отображение какого-либо непустого множества А в класс B (Х) всех подмножеств множества Х (для любого А f( ) B (Х), т.е. f( ) Х). Всякое такое отображение f: А B (Х) будем называть семейством подмножеств множества Х или коротко - семейством множеств. При этом множество А будем называть множеством индексов, а само семейство обозначать символом ( E ), где любой «индекс» (элемент) из А, а E = f( ). В случае, когда А=N, будем говорить о последовательности (Еn) подмножеств множества Х (или о счетном семействе множеств). При А=Nk (k=1, 2, 3, 4, …) говорят, что задана конечная последовательность Е1, Е2,… Еk подмножеств множества Х. 1.96. Замечание Вполне может оказаться, что различным значениям индекса (т.е. различным элементам , А) «отвечает» одно и то же подмножество множества Х (т.е. может оказаться, что E = E ) 1.97. Определение Объединением семейства множеств ( E ), обозначаемым символом E , называется множество всех тех элементов х Х, каж2
k 1
A
дый из которых принадлежит E хотя бы при одном А. Если А=N, то бу
дем пользоваться символом
E
n
. В случае А=Nk объединение семейства
n 1
k
множеств будем обозначать символом
E
i
или Е1 Е2 … Еk.
i 1
1.98. Определение Пересечением семейства множеств ( E ), обозначаемым символом E , называется множество всех тех элементов х Х, каж A
дый из которых принадлежит E при всех А. При А=N будем пользовать
ся символом
E
n
. При А=Nk пересечение семейства множеств будем обо-
n 1
k
значать символом
E
n
или Е1 Е2 … Еk. Если Е1 Е2= , то говорят, что
n 1
множества Е1 и Е2 не пересекаются; если же Е1 Е2 , то говорят, что множества Е1 и Е2 пересекаются. 1.99. Замечания Объединения и пересечения множеств подчиняются законам коммутативности, ассоциативности и дистрибутивности: А В=В А; А В=В А (коммутативность) 31
А (В С)=(А В) С; А (В С)=(А В) С (ассоциативность) А (В С)=( А В) ( А С) (дистрибутивность) Проверка выполнения этих свойств предоставляется читателю. Заметим, что закон ассоциативности оправдывает отсутствие скобок в обозначениях Е1 Е2 … Еk и Е1 Е2 … Еk. Легко проверяются также следующие соотношения. Если ( E ) – семейство множеств ( А), то при любом А E E , E E . A
A
Кроме того, если Е F, то Е F=F, Е F=E. 1.100. Определение Пусть А, В B (Х). Разностью множеств А и В, обозначаемой А\В, называется следующее множество: А\В={x X: x A и x B}. Можно также написать: А\В={ x A: x B}. 1.101. Пример Пусть А= a, b, c, d , В= a, b, c, k , l , m, p . Тогда А\В= d , В\А= k , l , m, p . 1.102. Замечание Предыдущий пример показывает, что для установления «близости» двух множеств А и В по составу элементов недостаточно отдельно рассмотреть разность А\В или разность В\А . Следует установить «близость» к пустому множеству множества (А\В) (В\А). Разумеется, понятие «близости» двух множеств требует уточнения, но мы здесь не собираемся приводить какие-либо определения, а только апеллируем к интуиции читателя. 1.103. Определение Симметрической разностью множеств А и В называется следующее множество, обозначаемое S(A,B): S(A,B): (А\В) (В\А). 1.104. Замечания Легко проверяются (что предоставляется читателю) следующие свойства разности и симметрической разности двух множеств (а) А\В=А\(А В); (А\В) С=(А С)\(В С) (b) S(A,B) S(A,С) S(С,В) (с) S(A1 A2,В1 В2 ) S(A1 A2,В1 В2 ) S(A1,B1) S(A2,B2) S(A1-A2,В1-В2 )
Докажем для примера свойство (b). Пусть х S(A,B)=(А\В) (В\А). Тогда либо х (А\В), либо х (В\А). Рассмотрим случай х (А\В), т.е. х А, но х В. Если при этом х С, то х (С\В) и потому х S(С,B)=(С\В) (В\С). Подавно х S(А,С) S(С,B). Если же х С, то х (А\С) и потому х S(А,С)=(А\С) (С\А). Подавно х S(А,С) S(С,B). Рассмотрим теперь случай х (В\А), т.е. х В, но х А. Если при этом х С, то х S(А,С)=(А\С) (С\А) и подавно х S(А,С) S(С,B).
32
Если же х С, то х S(С,B)=(С\В) (В\С) и подавно х S(А,С) S(С,B). Итак, принадлежность х S(А,В) влечет за собой принадлежность х S(А,С) S(С,B), а это и означает справедливость свойства (b). 1.105. Определение Пусть Х – множество и Е B (Х), т.е. Е Х. Разность Х\Е будем называть дополнением множества Е до Х и обозначать Е c . 1.106. Теорема Имеют место следующие формулы Де Моргана: А) Х\( E )= ( X \ E ) A
A
В) Х\( E )= ( X \ E ) , где ( E ) – любое семейство подмножеств мно A
A
жества Х. Доказательство А) Пусть х Х\( E ), т.е. х Х, но х E . Тогда х E при любом A
A
А, откуда х Х\ E при любом А. Следовательно, х ( X \ E ) . Этим A
доказано, что Х\( E )
( X \ E ) . Пусть теперь х ( X \ E ) , т.е. при любом А х E и потому х E . Следовательно, х Х\( E ). Этим доказано, что ( X \ E ) Х\( E ). Оба доказанных включения убеждают A
A
A
A
A
A
A
в справедливости формулы А). В) Пусть х Х\( E ), т.е. х Х, но х E . Найдется «индекс» А A
A
такой, что х E , откуда х Х\ E и подавно х ( X \ E ) . Этим доказано, A
что Х\( E )
( X \ E ) . Пусть теперь х ( X \ E ) . Найдется А, для которого х Х\ E , т.е. х Х, но х E . Следовательно, х E , откуда х Х\( E ). Этим доказа но, что ( X \ E ) Х\( E ). Оба доказанных включения убеждают в спра A
A
A
A
A
A
A
ведливости формулы В). 1.107. Замечание Формулы Де Моргана коротко читаются так: дополнение к объединению равно пересечению дополнений «слагаемых»; дополнение к пересечению равно объединению дополнений «множителей». 1.108. Теорема Объединение счетного семейства счетных множеств – счетно. Доказательство Пусть (Еn), n=1,2,3,… -последовательность счетных
множеств и Е= En . Установим счетность множества Е. С этой целью расn 1
положим каждое множество Еn в последовательность (xnk), k=1,2,3,…, и рас33
x11 x12 x13 x14 x 21 x 22 x 23 x 24 смотрим бесконечную таблицу x 31 x 32 x 33 x 34 , в которой элементы x 41 x 42 x 43 x 44 множества Еn образуют n-ю строку. Эта таблица содержит все элементы множества Е. Все элементы хij указанной таблицы можно расположить в последовательность f: N E так, как указывают стрелки. Обозначив эту последовательность через (ym), m=1, 2, 3,…, будем иметь: у1=х11, у2=х21, у3=х12, у4=х31, у5=х22, у6=х13, … Последовательность (ym) содержит все элементы множества Е, т.е. отображение f: N E сюръективно. Если множества последовательности (Еn) попарно не пересекаются, то уi уj при любых неравных i,j N, т.е. в этом случае отображение f: N E будет и инъективным. Следовательно, для указанного случая теорема доказана. Рассмотрим теперь случай, когда некоторые (или все) множества последовательности (Еn) имеют общие элементы. Определим множество А N следующим образом: А={k N: yk= yi , хотя бы при одном i
ясним сначала, каково необходимое и достаточное условие того, чтобы множество Е было конечным. Если Е – конечно, то все множества E оказываются подмножествами одного и того же конечного множества. И обратно, если все множества E являются подмножествами одного и того же конеч , то и Е E , т.е. Е – конечно (это верно при любом множеного множества E стве индексов, даже несчетном). Если же не существует такого конечного , что E E при всех А, то Е бесконечно (даже если все E множества E конечны). Покажем, что при вышеуказанных условиях (наложенных на А и 34
E ) множество Е будет счетным, если оно не является конечным. С этой целью расположим элементы множества А (индексы) в конечную (если А - конечно) или бесконечную последовательность 1, 2, ... Затем элементы каждого из множеств E , E ,…расположим в конечную или бесконечную последовательность. Эти последовательности составят некоторую таблицу, наподобие той, что рассматривалась в 1.108 (эта таблица может оказаться «неполной» по тем или иным строкам или столбцам, но это не играет никакой роли). Все элементы этой таблицы можно (как и в 1.108) расположить в бесконечную последовательность (ym) (мы считаем, что Е бесконечно). Повторяя дословно все рассуждения теоремы 1.108, мы убедимся в счетности множества Е. 1.110 Теорема Декартово произведение Е=АхВ двух счетных множеств А и В само счетно. Доказательство Расположим элементы множества А в последовательность: а1, а2,…, аn, …и для любого n N обозначим Еn={an}xB . Ясно, что Еn В, т.е. Еn – счетное множество (n=1,2,3,…).
Так как Е= En , то (1.108) Е счетно , ч.т.д. n 1
1.111. Замечание Выше мы определили понятие декартова произведения двух множеств. Пусть теперь k>2 и Е1, Е2,…, Еk – конечная последовательность множеств. Имея целью определить декартово произведение Е1хЕ2х…хЕk, заметим, что Е1хЕ2 можно отождествить с множеством всех таких двучленных последовательностей х1, х2, что х1 Е1, х2 Е2 (т.е. с множеством всех таких функций f, определенных на N2, что х1=f(1) Е1, и х2=f(2) Е2). Это замечание делает естественным принятие нижеследующих определений. 1.112. Определения (а) Декартовым произведением непустых множеств конечной последовательности Е1, Е2,…, Еk (k>2) называется множество всех таких k-членных последовательностей х1, х2,… хk, что х1 Е1, х2 Е2,…, хk Еk. Это множество k
обозначается символом Е1хЕ2х…хЕk или
E . Элементы декартова произi
i 1
ведения будем в дальнейшем записывать в виде (х1, х2,… хk) (по аналогии с записью упорядоченных пар – элементов декартова произведения двух множеств) (b) Декартовым произведением непустых множеств (бесконечной) последовательности Е1, Е2,…, Еn, … называется множество всех таких последовательностей х1, х2,…, хn, …, что хi Еi, i=1,2,3,… Это множество обозначается
символом
E . Элементы декартова произведения E i
i 1
i
будем в дальней-
i 1
шем записывать в виде (х1, х2,…, хn,…) (с) Пусть А – непустое множество индексов и ( E ), A - семейство непустых множеств. Декартовым произведением множеств семейства ( E )
35
называется множество всех таких функций f, определенных на множестве А, что при любом A f( ) E . Это множество обозначается
E . A
1.113. Замечания (а) Декартово произведение Е1хЕ2х…хЕk в случае, когда Е1=Е2=…=Еk=Е, представляет собой множество всех k-членных последовательностей элементов из Е, т.е. множество всех отображений Nk в Е. Допуская некоторую непоследовательность, это множество обозначают символом Еk (вместо ЕNk)
(b) Декартово произведение
E
i
в случае, когда Еi=Е при всех i N,
i 1
представляет собой множество всех последовательностей элементов из Е, т.е. множество ЕN всех отображений N в Е. (с) Декартово произведение
E
в случае, когда E =Е при всех A ,
A
представляет собой множество ЕА всех отображений А в Е. 1.114. Теорема Для любого k 2 (k N) и любой конечной последовательk
ности Е1, Е2,…, Еk счетных множеств декартово произведение
E – счетно. i
i 1
Доказательство При k=2 теорема верна (1.110), причем (см. 1.111) Е1хЕ2 можно отождествить с множеством всех двучленных последовательностей х1, х2 таких, что х1 Е1, х2 Е2. Пусть теорема верна для некоторого k 2, т.е. мы предполагаем, что декартово произведение любой k-членной последовательности счетных множеств – счетно. Установим, что утверждение теоремы остается справедливым и для числа k+1, т.е. докажем, что если Е1, Е2,…, Еk, Еk+1 – любые счетные множества, то Е1хЕ2х…хЕkхЕk+1 также счетно. Согласно предположению индукции декартово произведение Е1хЕ2х…хЕk счетно, т.е. счетно множество всех таких функций f, определенных на Nk, что f(1) E1, f(2) E2, …, f(k) Ek. Расположим все эти функции в последовательность f1, f2, …fn,…, в которой fi fj, если i j (i, j N). Расположим также в последовательность х1, х2,…, хm, …,( хp хq при p q) все элементы счетного множества Еk+1. Рассмотрим теперь следующие функции gij (где индексы i и j независимо друг от друга «пробегают» множество N), определенные на N k+1: fi ( s), если s Nk gij(s)= xj, если s k 1
Ясно, что все функции gij являются элементами декартова произведения Е1хЕ2х…хЕkхЕk+1. Если gij= grl, то j=l (т.к. gij(k+1)=xj , а grl(k+1)=xl и xj xl при j l). Кроме того, при любом s Nk gij(s)=grl(s), т.е. fi(s)=fr(s) или fi=fr, что возможно только при i=r. Убедимся еще, что любой элемент g декартова произведения Е1хЕ2х…хЕkхЕk+1 содержится среди функций gij. Т.к.
36
g(k+1) Еk+1, то при некотором j N g(k+1)= xj. Рассмотрим сужение f функции g на множество Nk: f(s)=g(s) для любого s Nk. Т.к. f Е1хЕ2х…хЕk, то при некотором i N f= fi . Выходит, что fi ( s), если s Nk g(s)= xj , если s k 1
т.е. g=gij . Итак, таблица g 11 g 12 g 1n g 21 g 22 g 2 n gm1 gm 2 gmn состоит из попарно различных элементов декартова произведения Е1хЕ2х…хЕkхЕk+1 и содержит все элементы этого произведения. Но все эти элементы можно расположить в последовательность (см. 1.108), откуда и следует счетность декартова произведения Е1хЕ2х…хЕkхЕk+1. Методом математической индукции теорема доказана. Следствие 1 Если Е – счетное множество, то при любом n N множество n Е всех n-членных последовательностей (х1, х2,…, хn) элементов множества Е – счетно. Для доказательства следует применить теорему 1.114 к случаю Е1=Е2=…=Еn=Е Следствие 2 Если Е – счетное множество, то множество всех конечных последовательностей элементов множества Е – счетно.
В самом деле, указанное множество представляет собой
E
n
n 1
1.115. Замечания (а) Однако, множество всех бесконечных последовательностей, составленных из элементов даже конечного множества Е с числом элементом n 2 – несчетно (см. 1.91 и 1.93 (b)) (b) При доказательстве многих теорем (и, в частности, при доказательстве теоремы 1.116), относящихся как к теории множеств, так и к другим разделам математики, оказывается необходимым применение так называемой аксиомы выбора или одного из эквивалентные ей предложений. Здесь мы сформулируем лишь три эквивалентных между собой аксиомы. Доказательство эквивалентности этих и ряда других предложений (которые будем называть различными формами аксиомы выбора) интересующийся этим вопросом читатель найдет в книге Дж. Л. Келли «Общая топология». Аксиома Цермело Для любого класса K непустых попарно непересекающихся множеств существует такое множество С, что для любого множества А K пересечение А С состоит ровно из одного элемента.
37
Аксиома Цермело постулирует существование множества С, состоящего из элементов, «выбранных по одному» из каждого множества класса K . Аксиома выбора пусть ( X ) , A - семейство непустых подмножеств некоторого множества Х. Тогда существует функция : А Х такая, что для любого A ( ) X . Функция , существование которой постулируется аксиомой выбора, называется функцией выбора. Заметим, что в аксиоме выбора множества X при различных A не предполагаются непересекающимися. Аксиома максимальной цепи Пусть K - какой-либо непустой класс - любая цепь мномножеств (подмножеств некоторого множества Х) и K , жеств из K . Это означает, что, каковы бы ни были два множества из K одно из них содержится в другом (класс множеств содержащий лишь одно множество, даже пустое, также считается цепью). Утверждается, что сущест : вует максимальная цепь М множеств из K , содержащая K М K K Поясним, что максимальность цепи М (в K ) означает следующее: каков бы ни был класс K , такой, что М K K и М K - этот класс K уже не является цепью. -максимальная цепь в Заметим также, что вполне может случиться, что K . K и тогда М= K 1.116. Теорема Всякое бесконечное множество содержит счетное подмножество. Доказательство Пусть множество А бесконечно и требуется доказать существование счетного подмножества множества А. Т.к. А , то класс K 1 всех одноэлементных подмножеств множества А непуст. Индукцией по числу n легко доказать (это предоставляется читателю), что при любом n N класс K n всех n-элементных подмножеств множества А непуст. Рассмотрим клас n= K n! для любого n N. Они составляют семейство ( K n), n N несы K пустых подмножеств множества B (А). Согласно аксиоме выбора существует n. Обозначая функция : N B (А) такая, что при любом n N (n) K Мn= (n), получаем последовательность множеств М1, М2,…, Мn,…, причем для любого n N Мn состоит из n! элементов множества А. Определим новую n 1
n), полагая M 1= М1, M n= Мn\ Mi (n 2). последовательность множеств ( M i 1
n не пусто, так как множество При любом n N множество M
n 1
M
i
содержит
i 1
не более, чем (n-1) (n-1)! элементов, тогда как число элементов множества Мn равно n!= n (n-1)!>(n-1) (n-1)! Легко доказать также, что множества по n) попарно не пересекаются. Применяя еще раз аксиому следовательности ( M выбора, получим последовательность (хn) элементов множества А такую, что n для любого n N . Так как члены последовательности (хn) оказываютхn M 38
ся попарно различными, то множество всех этих членов и есть искомое счетное подмножество множества А. 1.117. Теорема (Шрёдер-Бернштейн) Если каждое из двух данных множеств эквивалентно собственному подмножеству другого, то данные множества эквивалентны. В( B В), Доказательство Пусть А и В – данные множества и А B В A А( A А). Требуется установить эквивалентность множеств А и В. С и какоеэтой целью рассмотрим какое-либо биективное отображение f:А B либо биективное отображение g:В A , после чего определим последовательность (Еn) подмножеств множества А, полагая: Е1=А\ A , Еn= g(f(Еn-1)) при n 2. Согласно условию теоремы, Е1 – непустое множество. Индукцией по числу n легко доказать (это предоставляется читателю), что при любом n N множество Еn непусто. Определим, далее, последовательность непустых подмножеств (Bn) множества В, полагая Bn= f(Еn), n N . Тогда при n 2
при всех n N . Рассмотрим множества Е= En Еn=g(Bn-1) и Еn A , а Bn B n 1
(Е А) и
B
n
n 1
и убедимся, что множества В\ Bn и А\Е непусты. Непустота n 1
n 1
n 1
В\ Bn и немножества В\ Bn следует из очевидного соотношения В\ B . Для доказательства непустоты множества А\Е возьпустоты множества В\ B
мем любой элемент у В\ Bn и найдем х=g(у) A . Ясно, что х Е1= А\ A . n 1
Если бы х принадлежал Еn при некотором n 2, то нашелся бы элемент y
n 1
n 1
Bn-1, для которого g( y )=х. При этом y у, ибо y Bn , а у Bn . Таким образом, получилось бы, что g( y )=g(у) при y у, что противоречит инъективности отображения g. Полученное противоречие доказывает, что
х En =Е и, следовательно, х А\Е. Итак, множество А разбивается на два n 1
непустых подмножества: Е= En и А\Е. Аналогично, множество В разбиваn 1
ется на два непустых подмножества:
B
n
n 1
и В\ Bn (см. нижеследующий n 1
рисунок).
Е2 Е1=А\ A
Е3
А\Е
В1
В2 В3
В\ Bn n 1
39
Перейдем теперь непосредственно к доказательству эквивалентности множеств А и В. Заметив, что А\Е А\Е1= A =g(B), определим отображение h:A B следующим образом: f ( x), прих Е h(x)= 1 g ( x), прих А \ Е Установим сначала сюръективность отображения h:A B. Пусть у – любой элемент множества В. Если при этом у Вn при некотором n N, то найдется элемент х Еn, такой, что f(x)=y. Для этого х (т.к. х Е) h(x)=f(x)=y, т.е.
у h(А). Если же у В \ Bn , то, как уже доказано выше, элемент х= g(у) приn 1
надлежит множеству А\Е. Поэтому h(x)=g-1(x)=y, т.е. и в этом случае у h(А), чем и доказана сюръективность отображения h. Убедимся в его инъективности. Пусть х1 и х2 – любые различные элементы множества А. Если оба они принадлежат Е, то h(х1)= f(х1), h(х2)= f(х2), и h(х1) h(х2), ввиду инъективности отображения f. Если х1 и х2 оба принадлежат А\Е, то h(х1)=g-1(x1), h(х2)=g-1(x2) и h(х1) h(х2), ввиду инъективности отображения g-1. Если, наконец, х1 Е, а х2 А\Е, то х1 Еn при некотором n N и h(х1)= f(х1) f(Еn)=Вn. Допустим, что h(х1)=h(х2). Тогда g-1(x2) Вn, откуда х2 g(Вn)=Еn+1, т.е. х2 Е, что противоречит предположению о том, что х2 А\Е. Значит, и в этом случае (х1 Е, х2 А\Е) h(х1) h(х2) и инъективность отображения h доказана. Следовательно, h биективно и А В, ч.т.д. 1.118. Замечания и обозначения Как уже отмечалось выше (1.74), про эквивалентные (равномощные) множества говорят, что они имеют одно и то же кардинальное число (или, что то же – одну и ту же мощность). Но что такое кардинальное число множества? Если речь идет о конечных множествах, то (1.82) конечные множества эквивалентны между собой тогда и только тогда, когда они имеют одно и то же число элементов (за число элементов пустого множества принимается число 0). Поэтому естественно определить кардинальное число конечного множества как число его элементов. Пусть теперь K - четко определенный класс множеств, в который могут входить как конечные, так и бесконечные множества. Отношением равномощности « » K разбивается на классы эквивалентности, про каждый из которых мы будем говорить, что он определяет кардинальное число любого множества этого класса эквивалентности. При этом различные классы эквивалентности определяют различные кардинальные числа. Если класс эквивалентности состоит из конечных множеств, то будем говорить, что он определяет конечное кардинальное число, равное числу элементов каждого множества этого класса эквивалентности. Если же класс эквивалентности состоит из бесконечных множеств, то будем говорить, что он определяет бесконечное кардинальное число. Некоторые бесконечные кардинальные числа (т.е. некоторые классы эквивалентных между собой бесконечных множеств), как наиболее важные и 40
часто встречающиеся, получили специальные обозначения. Так, кардинальное число счетных множеств принято обозначать символом 0 (читается «алеф-нуль»; - есть первая буква древнееврейского алфавита). Кардинальное число несчетного множества всех последовательностей, составленных из цифр 0 и 1 (см. 1.93 (b)), а также всех эквивалентных ему множеств (в частности B (N)), - обозначается символом «с» и называется мощностью континуума (латинское слово «continuum» означает «непрерывное»). Причину этого названия мы выясним после изучения действительных чисел. Заметим еще, что, например, фраза «множество А имеет своим кардинальным числом 0» означает то же самое, что и фраза «А есть счетное множество». По мере изучения тех или иных бесконечных множеств может возникнуть одна из следующих ситуаций: 1) изучаемое множество эквивалентно тем или иным ранее изученным множествам и тогда ему приписывается то же кардинальное число, которое имеют ранее изученные эквивалентные ему множества; 2) изучаемое множество не эквивалентно ни одному из ранее изученных множеств и тогда ему приписывается в качестве кардинального числа новый символ, отличный от ранее введенных в рассмотрение. Перейдем к вопросу о сравнении кардинальных чисел. С использованием аксиомы выбора можно доказать, на чем мы не останавливаемся, что из двух множеств А и В (каковы бы ни были эти множества) по крайней мере одно из них эквивалентно подмножеству другого. Поэтому, если даны два множества А и В, то либо А В, либо А В, но одно (и только одно, как следует из теоремы 1.117) из этих множеств эквивалентно собственному подмножеству другого. Учитывая сказанное, примем следующее определение. 1.119. Определение Пусть и - различные кардинальные числа, т.е. множество А, имеющее своим кардинальным числом, не эквивалентно множеству В, имеющему своим кардинальным числом. Если при этом множество А эквивалентно собственному подмножеству В (тогда В не эквивалентно никакому подмножеству А), то будем считать, что кардинальное число меньше кардинального числа и писать: < (или > ). 1.120. Замечание (а) Из вышесказанного (1.118) следует, что любые различные кардинальные числа и сравнимы, т.е. одно (и только одно) из них меньше другого. (b) Как следует из 1.89, для любого кардинального числа найдется большее кардинальное число , т.е. такое, что < . 1.121. Примеры (а) Пусть k – любое натуральное число. Так как Nk N и Nk N, то k< 0 . (b) Если - бесконечное кардинальное число, отличное от 0 , то из 1.94 следует, что 0 , а из 1.116 непосредственно следует, что 0< . (с) Так как множество N не эквивалентно B (N), но эквивалентно подмножеству класса B (N) (1.89), то 0<с. Впрочем, это следует и из (b), если в качестве взять с. И, вообще, из (b) следует, что 0 – наименьшее бесконечное кардинальное число. 41
1.122. Теорема Если , , - кардинальные числа и < , а < , то < (транзитивность отношения «<» для кардинальных чисел). Доказательство Пусть А, В, С – множества, имеющие своими кардинальными числами , , соответственно. Тогда из условия теоремы следует, что А В, В С и найдутся множества В1, С1 такие, что В1 В, С1 С и А В1, В С1. Рассмотрим какое-либо биективное отображение f:В С1. Обозначая f(В1)=С2 (С2 С1), видим, что В1 С2. При этом, как легко видеть, В1 - собственное подмножество В, С1 - собственное подмножество С, С2 - собственное подмножество С1. Из А В1 и В1 С2 следует, что А С2 С и остается доказать, что А С. Допустим противное, т.е. что А С. Тогда С2 С и (поскольку С2 С1 С) из теоремы 1.117 следует, что С1 С. Выходит, что В С, т.е. = , что противоречит условию теоремы. Полученное противоречие доказывает, что А С и, следовательно (т.к. А С2 С), < , ч.т.д. 1.123. Замечание Чтобы разумно определить операции сложения и умножения кардинальных чисел, заметим, что для конечных множеств А и В, состоящих соответственно из m и n элементов, - декартово произведение АхВ состоит из m n элементов; если при этом множества А и В не пересекаются, то объединение А В состоит из m+n элементов. Поэтому естественно принять следующие определения. 1.124. Определения Пусть ( m ), А – семейство кардинальных чисел и ( X ), А – семейство множеств, такое, что при каждом А множество X имеет своим кардинальным числом m . (а) Произведением кардинальных чисел семейства ( m ), А, обозначаемым m , называется кардинальное число множества X - декартова A
A
произведения множеств семейства ( X ), А. (b) Суммой кардинальных чисел семейства ( m ), А, обозначаемой m , называется кардинальное число множества X при том дополни A
A
тельном условии , что множества семейства ( X ), А попарно не пересекаются. 1.125. Определение Пусть m и а – кардинальные числа. Степенью ma называется произведение m , где А – любое множество, имеющее а своим A
кардинальным числом, а m = m при всех А. 1.126. Замечание Взяв любое множество Х, имеющее m своим кардинальным числом, и положив X =Х при любом А, мы видим, что ma представляют собой кардинальное число множества ХА всех отображений множества А в Х. 1.127. Теорема Если в сумме m все слагаемые равны одному и тому A
же кардинальному числу m, то
m = mа, где а – кардинальное число мно A
жества индексов А. 42
Доказательство рассмотрим семейство ( X ), А попарно непересекающихся множеств, каждое из которых имеет одно и то же кардинальное число m ( m =m при любом А). Пусть Х – одно из этих множеств. Тогда X Х при любом А и для каждого такого найдется (аксиома выбора) биективное отображение f : X Х. Определим теперь отображение f: X ХхА, полагая A
f(х)=( f (х), ), где х – любой элемент множества
X , а
- то единствен-
A
ное «значение» индекса, для которого имеет место принадлежность х X . Если докажем, что f – биективно, то этим и будет установлено равенство m = mа. Докажем сперва инъективность f. Пусть х, x X и х x . Ес A
A
ли при этом х и x принадлежат одному и тому же множеству X , то f(х)=( f (х), ), f( x )=( f ( x ), ) и f(х) f( x ), ибо (ввиду биективности f ) f (х) f ( x ). Если же х X , x X и , то f(х)=( f (х), ) ( f ( x ), )=f( x ), что и доказывает инъективность отображения f. Убедимся в его сюръективности. Пусть (у, ) – любая пара из ХхА. Так как для этого отображение f : X Х биективно, то в X найдется единственный элемент х, для которого f (х)=у. Следовательно, f(х)=( f (х), )=(у, ), что и доказывает сюръективность отображения f. Итак, f – биективно, X ХхА и, следовательно, m = mа, ч.т.д. A
A
1.128. Теорема Для любого семейства ( b ), А кардинальных чисел и произвольного кардинального числа m имеет место формула
b
mA
mb . A
Доказательство Рассмотрим множество Х, имеющее m своим кардинальным числом, и семейство ( В ) А попарно непересекающихся множеств, такое, что каждое множество В имеет своим кардинальным числом b .
m
Пусть В= В . Тогда А
множества ХВ, а
ХВ
A
mb
b
A
представляет собой кардинальное число
A
представляет собой кардинальное число множества
. Если установим, что ХВ
ХВ
A
В Х Определим отображение Ф: Х
, то теорема будет доказана.
В
A
следующим образом. Зафикси43
руем любое отображение f:В Х (f ХВ) и для каждого А найдем сужеВ
ние f отображения f на множество В ( f Х ), после чего положим В Х Ф(f)=F , где F( )= f для любого А. Докажем инъектив-
A
ством, что f( ) g( ). Тогда f
ХВ
и f g, т.е. найдется В с тем свой g , где - единственный элемент из А,
ность отображения Ф. Пусть f, g
для которого В . Обозначив Ф(f)=F, Ф(g)=G, видим, что F G, ибо F( )= f , а G( )= g . Этим доказана инъективность отображения Ф. УсВ Х тановим его сюръективность. Пусть Н – любая функция из , т.е.
A
В
при любом А Н( ) Х . Определим отображение f:В Х следующим образом. Для каждого В найдем тот единственный элемент А, для которого В , и положим f( )=Н( )( ). Убедимся, что для так определенного отображения f:В Х имеет место равенство f = Н( ) при лю-
В ). Зафиксируем элемент из В . Тогда
бом А, ( f - сужение отображения f на множество
любое А и пусть - любой f ( )=f( )=Н( )( ), откуда и следует, что f =Н( ). Так как при любом А Ф(f)( )= f и Н( )= f , то Ф(f)=Н, чем и доказана сюръективность В В Х отображения Ф. Итак, Ф – биективно и Х , что и доказывает
A
справедливость утверждения теоремы. 1.129. Следствие из теорем 1.127 и 1.128 Для любых кардинальных чисел m, b, a имеет место формула (mb)a= mbа. Доказательство Пусть А – любое множество, имеющее а своим кардинальным числом. Рассмотрим семейство ( b ), А кардинальных чисел, в котором b =b для всех А. Пользуясь определением 1.125 и теоремами 1.128 и 1.127, находим: b a
(m ) =
m A
b
=m
b
A
= mbа, ч.т.д.
1.130. Примеры (а) Пусть k –любое натуральное число.
0k
есть кардинальное число мно-
жества NNk, которое счетно (1.114) Следовательно, 0 = 0 (b) Пусть ( m ), А – семейство кардинальных чисел и а – кардинальное число множества А. k
44
Если а 0 и m 0 при всех А, то и
m 0
(1.109)
A
(с) 2 0 - есть кардинальное число множества 0,1 N всех последовательностей, составленных из цифр 0 и 1. Это множество несчетно (1.93 (b)), его кардинальное число обозначается символом «с» и называется мощностью контиуума (1.118). Таким образом, с=2 (d)
Так
как
с=2
0
0 0 c0 =(2 0 )0 =20 0 =20 =с, 0
то
0 0 = c
0
=с. И подавно, при любом n N сn=с. (е) Из теорем 1.88 и 1.89 следует, что для любого кардинального числа m имеет место неравенство m<2m. В частности, с<2с. 1.131. Замечание Более подробные сведения о кардинальных числах интересующийся этим вопросом читатель найдет в книге П. С. Александрова «Введение в общую теорию множеств и функций». Упражнения к Главе 1 1. Пусть (G, ) – конечная группа, т.е. множество G – конечно (число элементов множества G называется порядком конечной группы). Степень an любого элемента а G при любом n N определяется индуктивно: а1=а, аn+1=аn а (n 1) (а) Доказать, что для любого а G и любых m, n N имеют место равенства m n а а =аn+m, (аm)n=аmn. (b) Рассматривая различные степени любого элемента а G, доказать, что существуют показатели n N такие, что аn=е (единица группы). Наименьший из таких показателей называется порядком элемента а. Доказать, что если а е и k – порядок элемента а (k 2), то среди элементов е, а, …, аk-1 нет одинаковых и пара ( H , ), где H ={е, а, …, аk-1}, представляет собой группу (порядка k). (с) Если Н G и пара (Н, ) представляет собой группу, то эта группа называется подгруппой или делителем группы (G, ). Для того, чтобы пара (Н, ) была подгруппой группы (G, ), конечно, необходимо выполнение условия: для любых a, b Н (не обязательно различных) a b Н. Доказать, что выполнение этого условия является и достаточным для того, чтобы (Н, ) была подгруппой группы (G, ) (конечной). (d) Если А G и В G, то под А В будем понимать следующее множество: А В={x G: x=a b при некотором а А и b В}. Если В={b}, то вместо А {b} будем писать просто А b. В случае, когда (Н, ) – подгруппа группы (G, ), то множества типа Н а, а G называются смежными классами. Доказать, что если m – порядок группы (Н, ), то при любом а G смежный класс Н а состоит из m элементов. Доказать также, что при a, b G и a b-1 Н (то45
гда и b а-1 Н) смежные классы Н а и Н b совпадают; если же a b-1 Н (тогда и b а-1 Н), то смежные классы Н а и Н b не пересекаются. (е) Доказать, что если (Н, ) – подгруппа группы (G, ), то найдутся натуральное число s и конечная последовательность а1, …, аs элементов группы G, в которой а1=е, такие, что смежные классы Н а1, …, Н аs попарно не переs
секаются и G=
H a
i
(это равенство носит название разложения группы по
i 1
подгруппе). Вывести отсюда равенство n=m s, s N, где n – порядок группы (G, ), а m – порядок подгруппы (Н, ). Из последнего равенства следует (теорема Лагранжа), что порядок подгруппы есть делитель порядка группы (в частности, порядок любого элемента группы есть делитель порядка группы). n Число s называется индексом подгруппы (Н, ) относительно группы m (G, ) и часто обозначается символом (G:Н). (f) Пусть a, b – произвольные элементы группы G. Элемент b-1ab называется элементом, преобразованным из а при помощи b. Будем говорить также, что элемент b-1ab является b – сопряженным с а. Если элемент b фиксирован, то для любого элемента a G элемент b-1ab будем просто называть сопряженным с а. Если все элементы какого-либо множества А G, А={а1, а2, …, аk} подвергнуть преобразованию при помощи элемента b, то получим преобразованное множество b-1 А b ={b-1 а1 b, b-1 а2 b, …, b-1 аk b, }. Доказать, что порядок элемента, b – сопряженного с а, равен порядку элемента а (предварительно индукцией по числу n N установить формулу (b-1 а b)n= b-1 а n b). Доказать, что если (Н, ) – подгруппа группы (G, ) и H =b-1 Н b (b – любой элемент G), то ( H , ) также является подгруппой группы (G, ) и имеет тот же порядок, что и подгруппа (Н, ). Подгруппу ( H , ) будем называть b – сопряженной с подгруппой (Н, ). (g) Подгруппа (Н, ) называется нормальным делителем (или инвариантной подгруппой) группы (G, ), если при любом b G b-1 Н b=Н. Ясно, что всякая подгруппа абелевой (коммутативной) группы является ее нормальным делителем, так как для такой группы b-1ab=а при любых a, b G. Если (Н, ) не является нормальным делителем группы (G, ), то все же равенство b-1 Н b=Н может выполняться при некоторых b G\Н (при всех b Н указанное равенство очевидным образом выполняется). Множество всех тех элементов b G, для которых b-1 Н b=Н, называется нормализатором подгруп (очевидно, H Н). пы (Н, ). Будем обозначать это множество символом H , ) представляет собой подгруппу группы (G, ). Доказать, что ( H , ). Если (Н, ) Ясно, что (Н, ) является нормальным делителем группы ( H является нормальным делителем группы (G, ), то существует только одна сопряженная с (Н, ) подгруппа группы (G, ), а именно сама подгруппа (Н, ). =G, т.е. индекс нормализатора (G: H )=1. Если (Н, ) не являВ этом случае H G, т.е. индекс нормализается нормальным делителем группы (G, ), то H 46
)>1. В этом случае возникает вопрос о числе различных подгрупп тора (G: H группы (G, ), сопряженных с (Н, ). Доказать, что это число равно индексу ) нормализатора подгруппы (Н, ) (предварительно установить, что при (G: H умножении множеств действует ассоциативный закон). Указание Представить G в виде объединения попарно непересекающихся а1, H а2,…, H аs (а1=е, s=(G: H )) и доказать, что подсмежных классов H группы Н, a21 Н а2, …, as1 Н аs (мы допускаем вольность в обозначениях) попарно различны и что при любом b G подгруппа b-1 Н b совпадает с одной из указанных подгрупп, сопряженных с Н. (h) Пусть (Н, ) – нормальный делитель группы (G, ). Согласно 1(е), имеет s
место равенство G=
H a , где а1=е, s=(G:Н) и смежные классы Н ai поi
i 1
парно не пересекаются. Заметив, что для любого b G b H=H b, доказать, что класс множеств {Н, На2, …, Наs} рассматриваемый вместе с операцией умножения множеств, представляет собой группу (называемую дополнительной группой к нормальному делителю (Н, ) и обозначаемую символом (G/H, ). Указание Воспользоваться тем, что если b Н а (a, b – любые элементы из G, (Н, ) – любая подгруппа группы (G, )), то a b-1 Н и потому (см. 1(d)) Н а=H b. Убедиться, что единицей группы (G/H, ) служит Н, а обратным элементом к Н аi служит смежный класс Н аj, которому принадлежит элемент ai1 (этот смежный класс можно записать в виде Н ai1 ). (i) Доказать, что если (Н1, ) и (Н2, ) суть подгруппы группы (G, ) и Н=Н1 Н2, то и (Н, ) есть подгруппа группы (G, ). Доказать, что если (Н1, ) и (Н2, ) суть нормальные делители группы (G, ), то и (Н, ) является нормальным делителем группы (G, ). (k) Пусть (Н, ) – произвольная подгруппа группы (G, ) и Н1=Н, Н2, …, Нk суть все попарно различные подгруппы, сопряженные с Н (для краткости мы k
допускаем вольность в обозначениях). Доказать, что если Н0= Hi , то (Н0, ) i 1
есть нормальный делитель группы (G, ). k
Указание Установить, что для любого b G b-1 Н0 b= b-1 Нi b. i1
Кроме того, показать, что множества b Н1 b, b Н2 b,…, b-1 Нk b попарно различны и представляют собой множества Н1, Н2, …, Нk, записанные, быть может, в другом порядке. (l) Две группы (G, ) и (Г,*) называются изоморфными, если существует такое биективное отображение :G Г , что для любых а, a G имеет место равенство (а a )= (а)* ( a ) (при этом для любых b, b Г имеет место равенство -1(b* b )= -1(b)* -1( b ). -1
-1
47
Доказать, что если е – единица группы (G, ), то (е) – единица группы (Г,*). Доказать также, что, если элементу а G соответствует элемент b Г (т.е. (а)=b), то (а-1)=b-1. Изоморфные группы не считаются существенно различными (они могут отличаться только природой своих элементов). Конечные изоморфные группы имеют равные порядки; если одна из них коммутативна, то коммутативна и другая и т.д. Доказать, что каждая конечная группа (G, ) изоморфна некоторой группе подстановок. Указание Пусть G={а1, а2, …, аn}, где а1=е. Сопоставим каждому элементу а G подстановку n цифр следующим образом. Элементы а а1, а а2, …, а аn попарно различны и потому представляют собой те же элементы а1, а2, …, аn только расположенные, быть может, в другом порядке: а а1= a 1 , а а2= a 2 ,…, а аn= a n , где 1 , 2 , …, n есть не1 2 n которая перестановка цифр 1, 2,…, n. Полагая (a) = , дока 1 2 n зать, что отображение :G n инъективно. Далее, пусть a, b – любые эле1 2 n 1 2 n менты из G, (a) = , = и ( b ) 1 2 n 1 2 n - любая цифра из {1, 2, …, n}. Подстановка (b) переводит в цифру , которую обозначим через : = . Подстановка (a) переводит цифру в цифру , которую обозначим через : = . Тогда подстановка (a) (b) переводит в . Учитывая, что b a = a и что а a = a , доказать, что подстановка (a b) переводит в , как и подстановка (a) (b) . Обозначив Г= (G) n , убедиться, что (Г, ) – группа (подгруппа группы n ), изоморфная группе (G, ). (m) Группа называется простой, если она не имеет нормальных делителей, кроме самой себя и единичной группы. Нормальный делитель (Н, ) группы (G, ) называется максимальным, если не существует нормального де , ) группы (G, ) такого, что Н H G и H Н, H G. лителя ( H Доказать, что нормальный делитель (Н, ) конечной группы (G, ) является максимальным тогда и только тогда, когда дополнительная группа (G/H, ) – простая. Указание Пусть группа (G/H, ) – простая, но (Н, ) не является максимальным нормальным делителем группы (G, ). Тогда существует нормальный де , ) такой, что Н H G и H Н, H G. Доказать, что ( H /Н, ) литель ( H есть нормальный делитель группы (G/H, ), отличный от (G/H, ) и единичной группы (в противоречие с предположением о простоте группы (G/H, )). Обратно, пусть (Н, ) – максимальный нормальный делитель группы (G, ), но дополнительная группа (G/H, ) не является простой. Выпишем элементы группы (G/H, ): G/H={H а1, H а2, …, H аk, H аk+1,…, H аp} (а1=e, смежные
48
p
классы H аi попарно не пересекаются и G= H ai ). Не ограничивая общноi 1
сти, можно считать, что смежные классы H, H а2, …, H аk (1
= H ai , доказать, ют нормальный делитель группы (G/H, ). Обозначив H i 1
, ) – нормальный делитель группы (G, ), причем Н H G и H Н, что ( H G (в противоречие с предположением о максимальности нормального H делителя (Н, )). (n) Пусть (Н1, ) и (Н2, ) суть взаимно-простые (т.е. Н1 Н2={е}) нормальные делители группы (G, ). Доказать, что каждый элемент а Н1 перестановочен с каждым элементом b Н2, т.е. что ab=ba. Указание Установить, что элемент aba-1b-1, называемый коммутатором элементов a и b, принадлежит и Н1 и Н2. (о) Пусть (Н1, ) и (Н2, ) - взаимно-простые нормальные делители группы (G, ) и Н= Н1 Н2. Доказать, что (Н, ) представляет собой группу (подгруппу группы (G, )). Установить, что равенство ab= a b (где а, a Н1, b, b Н2) имеет место лишь в том случае, когда а= a и b= b . Вывести отсюда, что порядок группы (Н, ) равен произведению порядков групп (Н1, ) и (Н2, ). Доказать, что (Н, ) является нормальным делителем группы (G, ). Так как Н1 Н и Н2 Н, то группы (Н1, ) и (Н2, ) является нормальными делителями группы (Н, ) и можно рассматривать дополнительные группы (Н/Н1, ) и (Н/Н2, ). Доказать, что (Н/Н1, ) (Н2, ) и (Н/Н2, ) (Н1, ), где символ « » означает, что группы, записанные слева и справа от него, - изоморфны. (р) Пусть (Н1, ) и (Н2, ) – два максимальных нормальных делителя группы (G, ) и D=Н1 Н2 Тогда (D, ) является нормальным делителем группы (G, ) (см. упражнение (i)). Доказать, что (G/H1, ) (Н2/D, ), (G/H2, ) (Н1/D, ) и что (D, ) является максимальным нормальным делителем групп (Н1, ) и (Н2, ). k
Указание Написав разложение Н2 по D: Н2= D bi (k 2, b1=e, смежные i 1
классы D bi попарно не пересекаются), доказать, что смежные классы H1, H1 b2, …, H1 bk попарно различны и (рассматриваемые вместе с операцией умножения множеств) составляют делитель и, притом, нормальный делитель группы (G/H1, ). Но группа (G/H1, ) – простая и потому G/H1={H1, H1 b2, …, H1 bk}. Так как Н2/D={D, D b2, …, D bk}, то изоморфность групп (G/H1, ) и (Н2/D, ) очевидна. Аналогично доказывается, что (G/H2, ) (Н1/D, ), откуда следует простота групп (Н1/D, ) и (Н2/D, ). Остается применить результат упражнения (m). (r) У конечной группы G (для краткости мы допускаем вольность в обозначениях) всегда существует по крайней мере один отличный от G максимальный нормальный делитель G1 (если G – простая группа, то G1=I, где I – единичная группа; сама группа G предполагается отличной от I). Если G1 I, то можно найти максимальный нормальный делитель G2 G1 группы G1. 49
Продолжая эти рассуждения, придем к так называемому композиционному ряду G, G1, G2,…, Gk-1, I, в котором каждая группа, начиная со второй, является максимальным нормальным делителем предыдущей (отличным от этой предыдущей). Композиционный ряд группы G должен оканчиваться единичной группой, так как порядки членов композиционного ряда последовательно убывают. Конечная группа может иметь либо единственный композиционный ряд, либо несколько различных композиционных рядов. Каждому композиционному ряду G, G1, G2,…, Gk-1, I группы G сопоставим ряд дополнительных групп G/G1, G1/G2, …, Gk-2/Gk-1, Gk-1/I Gk-1. Доказать, что все композиционные ряды конечной группы G имеют один и тот же ряд дополнительных групп, если отвлечься от порядка расположения этих дополнительных групп и не считать различными изоморфные группы (другими словами, ряды дополнительных групп любых двух композиционных рядов конечной группы G могут отличаться друг от друга только порядком расположения групп, если не считать различными изоморфные группы – теорема ЖорданаГѐльдера). Указание Утверждение верно для любой конечной группы порядка 2, ибо всякая такая группа – простая и имеет единственный композиционный ряд. Пусть подлежащее доказательству утверждение верно для всех конечных групп, порядок которых m удовлетворяет неравенствам: 2 m n. Доказать, что утверждение сохраняет свою справедливость и для любой конечной группы G порядка n+1. С этой целью рассмотреть любые два композиционных ряда группы G: G, G1, G2,…, Gk-1, I (1) и G, G1 , G2 ,…, Gs 1 , I (2) Пусть D= G1 G1 (согласно упражнению (р), D – максимальный нормальный делитель групп G1 и G1 ) и D, D1,…, D , I – какой-либо композиционный ряд, составленный для группы D. Рассмотреть еще два композиционных ряда группы G: G, G1, D, D1, …, D , I (3) и G, G1 , D, D1, …, D , I (4) Убедиться (на основании предположения индукции), что ряды дополнительных групп для композиционных рядов (1) и (3) отличаются только порядком. Далее, установить, что ряды дополнительных групп для композиционных рядов (3) и (4) отличаются только порядком (ибо, согласно результатам упражнения (р), G/G1 G1 /D, а G1/D G/ G1 ). И, наконец, убедиться (на основании предположения индукции), что ряды дополнительных групп для композиционных рядов (4) и (2) отличаются только порядком. Вывести следствие из теоремы Жордана-Гѐльдера: ряды индексов (G:G1), (G1:G2), …, (Gk-1:I) для различных композиционных рядов одной и той же конечной группы G могут отличаться лишь порядком. (s) Группа, образованная степенями какого-нибудь элемента а е, называется циклической группой. Ясно, что всякая циклическая группа – абелева, 50
т.е. подчиняется коммутативному закону. Доказать, что всякая циклическая группа простого порядка – циклическая. Конечная группа G I называется разрешимой, если для ее композиционного ряда (любого) G, G1, G2,…, Gm, I ряд индексов (G:G1), (G1:G2), …, (Gm:I) состоит исключительно из простых чисел (другими словами, порядки всех дополнительных групп G/G1, G1/G2, …, Gm/I суть простые числа). Доказать, что всякая циклическая группа разрешима. Указание Если G – циклическая группа простого порядка, то ее композиционный ряд имеет вид G, I и разрешимость группы G очевидна. Пусть G имеет порядок n, где n – составное число и пусть группа G образована степенями элемента а е: G={ e, a, а2, …, аn-1}. Если р – один из простых делителей числа n, так, что n=pq, то рассмотреть элементы e, ap, (ap)2, …, (ap)q-1. Установить, что эти элементы попарно различны и составляют циклический нормальный делитель группы G. Убедиться, что G1={e, ap, a2p, …, a(q-1)p} есть максимальный нормальный делитель группы G (ибо G/G1 – простая группа, т.к. имеет порядок (G:G1)=n:q=p). Если q – простое число, то композиционный ряд группы G имеет вид G, G1, I и индексы (G:G1), (G1:I) суть простые числа. Если же q – составное число, то в отношении циклической группы G1, можно провести те же рассуждения, что и для группы G. Замечание Доказательство разрешимости всякой абелевой группы G I (а не только циклической) читатель может найти, например, в книге Н. Чеботарева «Основы теории Галуа». (t) Пусть (G, ) – заданная группа. Элементы группы, представимые в виде aba-1b-1 при каких-либо а, b G, называются коммутаторами (см. упражнение 1(n)). Абелева группа имеет лишь единственный коммутатор (единица группы). Множество Н всех тех элементов из G, каждый из которых либо является коммутатором, либо является произведением двух или нескольких коммутаторов, - очевидно, замкнуто относительно групповой операции. Следовательно, (Н, ) – подгруппа группы (G, ), называемая коммутантом или производной группой заданной группы. Доказать, что производная группа (Н, ) группы (G, ) является нормальным делителем заданной группы и, вообще, любой группы (U, ), содержащей группу (G, ) в качестве нормального делителя. Указание Достаточно показать, что для любого с U с-1Нс Н. Пусть h – любой элемент Н. Если h –коммутатор, т.е. h= aba-1b-1 (а, b G), то и с-1hс= =с-1 aba-1b-1 с=(с-1aс)( с-1bс)( с-1a-1 с)( с-1b-1 с)= (с-1aс)( с-1bс)(с-1aс) -1( с-1bс) -1 является коммутатором группы G, ибо с-1aс G с-1bс G (ведь G - нормальный делитель группы U). Если h есть произведение двух или нескольких коммутаторов из G, то аналогично предыдущему доказать, что с-1hс есть произведение такого же числа коммутаторов из G. (u) Доказать, что если (Н, ) – производная группа группы (G, ), то дополнительная группа (G/H, ) – абелева. Указание Для любых а, b G (На) (Нb)= (На) (bН)=Н(aba-1b-1) (bаН)
51
(v) Доказать, что если (Н, ) – нормальный делитель группы (G, ) и дополнительная группа (G/H, ) – абелева, то Н заключает в себя все элементы производной группы. Указания Достаточно установить, что для любых а, b G aba-1b-1 Н. Так как (На) (Нb)=(Нb) (На)=, то Н ab=Н ba (Н – нормальный делитель!), откуда ab=h ba при некотором h Н. (w) Пусть Н- производная группа группы G и Н G (для краткости мы допускаем вольность в обозначениях). Считая известным факт разрешимости любой абелевой группы, отличной от единичной группы (см. замечание к упражнению 1(s)), доказать следующее: либо Н – максимальный нормальный делитель простого индекса группы G, либо при некотором k N существуют группы G1, G2,…, Gk такие, что в ряду G, G1, G2,…, Gk, Н каждая группа, начиная со второй, является максимальным нормальным делителем предыдущей и все индексы (G:G1), (G1:G2), …, (Gk:Н) являются простыми числами. Указание Так как группа G/H – абелева (см. упражнение 1(u)), то она разрешима. Убедиться, что если ее композиционный ряд имеет вид G/H, I* (где I*={H}), причем обязательно (G/H : I*) – простое число, то Н - максимальный нормальный делитель простого индекса группы G. В общем случае композиционный ряд группы G/H имеет вид (при некотором k N ) G/H, U1, U2,…Uk, I*, где индексы (G/H:U1), (U1:U2), …, (Uk:I*) суть простые числа. Пусть Gi есть объединение смежных классов, принадлежащих Ui (i=1, 2, … k). Тогда G G1 G2 … Gk Н. Доказать, что при любом i Gi есть делитель и, притом, нормальный делитель группы G (при доказательстве нормальности делителя Gi воспользоваться тем свойством, вытекающим из коммутативности группы G/H, что для любых а, b G ab=h ba при некотором h Н). Пусть далее, (А) означает число элементов любого конечного множества А. Тогда (G)= (G/H) (Н), (G1)= (U1) (Н), (G2)= (U2) (Н), …, (Gk)= = (Uk) (Н), откуда (G:G1)=(G/H:U1), (G1:G2)= =(U1:U2), …, (Gk:Н)= (Uk:I*) (х) Пусть G I – конечная группа и ряд G, Н, Н1, Н2,… - состоит из групп, каждая из которых, начиная со второй, является производной группой предыдущей. Доказать, что группа G разрешима тогда и только тогда, когда упомянутый ряд оканчивается единичной группой. Указание Если ряд последовательных производных групп имеет вид G, Н, Н1, Н2,…, Нk, I (где Н, Н1, Н2,…, Нk отличны от I), то H G, Н1 Н, …, Нk Нk-1. Применяя результаты упражнения 1(w) достаточное число раз, установить разрешимость группы G. Пусть теперь группа G – разрешима и требуется установить, что ряд G, Н, Н1, Н2,… оканчивается единичной группой. Доказать, что группа Н отлична от G (и потому имеет порядок, меньший, чем у G) и либо Н=I, либо группа Н разрешима. С этой целью рассмотреть какой-либо максимальный нормальный делитель G1 группы G (G1 G). В силу разрешимости группы G, индекс (G:G1) есть простое число. Следовательно, дополнительная группа G/G1 – простого порядка, а потому является циклической и абелевой. Согласно 1(v), Н G1 и потому H G. Используя результаты упражнения 1(w), убедиться, 52
что Н является членом композиционного ряда разрешимой группы G, а потому либо Н=I, либо H I , но является разрешимой группой. В последнем случае, рассуждая аналогично вышеизложенному, убедиться, что группа Н1 – меньшего порядка, чем Н и либо Н1=I, либо группа Н1 I, но является разрешимой группой и т.д. (у) Доказать, что всякая разрешимая группа G либо сама абелева, либо содержит отличный от единичной группы (и от G) абелев нормальный делитель. Указание Если G не является абелевой группой, то ряд ее последовательных производных групп имеет вид Н1, Н2,…, Нk, I, где k 1 и группы Н1, Н2,…, Нk отличны от I (и от G). Так как I – коммутант группы Нk, то Нk - абелева группа. Чтобы убедиться в нормальности Нk (и, вообще, - всех производных групп) по отношению к G, достаточно несколько раз применить доказанное в упражнении 1(t). I разрешимой группы G сама раз(z) Доказать, что всякая подгруппа G решима. ряды последовательных производных Указание Составить для G и G групп: G, Н, Н1, Н2,…, Нk, I; , H k, H k 1 . 1, H , H 2 , …, H G есть подгруппа Н и при любом Убедиться (последовательно) в том, что H i есть подгруппа Нi . Вывести отсюда, что H k 1 =I (вполне моi=1, 2, …, k H 1 =I и т.д.) =I или H жет случиться, что уже H 2. Рассмотрим множество k (k N) всех подстановок k цифр, т.е. множество всех биективных отображений множества Nk на себя. Это множество, рассматриваемое вместе с операцией суперпозиции отображений, является группой (см. 1.26 (b) и 1.31 (с)). Согласно 1.85 (f) порядок этой группы (которую часто называют симметрической группой подстановок k-ой степени) равен k! (а) Пусть р N и 1 р k. Подстановка f k называется р-членным циклом, если выполняются следующие условия: 1) среди цифр 1, 2, … k имеются р цифр i1, i2, …ip таких, что множество {i1, i2, …ip} переводится подстановкой f в самое себя, но никакое непустое собственное подмножество множества {i1, i2, …ip} не переводится подстановкой f в самое себя; 2) при р
остальные цифры на своих местах. Двучленный цикл называется также транспозицией, а k-членный цикл f k называется еще круговой подстановкой. Доказать, что если подстановка f k является р-членным циклом (1 р k) и множество {i1, i2, …ip} {1, 2, …k} удовлетворяет выше указанным условиям 1) и 2), то числа j1=i1, j2=f( j1), …, jp=f( jp-1) попарно различны и представляют собой те же числа i1, i2, …ip, только расположенные, быть может, в другом порядке. Доказать также, что f( jp)=j1. Замечание р-членный цикл f будем записывать в виде [j1 j2 …jp]. При этом предполагается, что f( j1)=j2, f( j2)=j3, …, f( jp-1)= jp, f( jp)=j1 (цикл замкнулся). Предполагается также, что цифры, не записанные внутри квадратных скобок, являются неподвижными точками отображения f (для записи циклов часто применяют круглые скобки, но мы используем круглые скобки для записи 1 2 3 4 5 перестановок). Например, в предположении, что k=5, [14]= , 4 2 3 1 5 1 2 3 4 5 1 2 3 4 5 [235]= , [15342]= 5 1 4 2 3. 1 3 5 4 2 (b) Доказать, что всякая подстановка f k либо является циклом, либо может быть представлена в виде произведения двух или нескольких циклов (под произведением двух подстановок и 1 мы понимаем суперпозицию 1 ). Эти циклы можно считать не имеющими общих цифр. Указание Будем говорить, что подстановка f перемещает цифру i Nk, если f(i) i. Если она не перемещает ни одной цифры, то f представляет собой тождественную подстановку, т.е. одночленный цикл. Пусть - количество цифр, перемещаемых подстановкой f, и N (2 k ). Если А множество цифр, перемещаемых подстановкой f, то f(А)=А.. Если при этом никакое собственное подмножество множества А (непустое) не переводится подстановкой f в само себя, то f есть -членный цикл. В противном случае найдется непустое собственное подмножество В множества А такое, что f(В)=В, то никакое непустое собственное подмножество множества В не переводится подстановкой f в само себя. Пусть р – количество цифр множества В (2 k ). Взяв любую цифру i1 B, найдем i2=f(i1), …, iр=f(iр-1). Доказать, что f=[i1 i2 …ip] , где имеет своими неподвижными точками i1, i2, …ip и все неподвижные точки подстановки f, а на множестве А\В совпадает с f: (j)=f(j) для любого j А\В. Заметить, что количество цифр, перемещаемых подстановкой , равно -р< . Применяя к рассуждения, аналогичные вышеприведенным, убедиться в том, что f представимо в виде произведения двух или нескольких циклов без общих цифр. (с) Пусть i1, i2, …ip суть р попарно различных цифр множества {1, 2, … k} и f=[i1 i2 …ip] есть р-членный цикл. Рассматривая различные степени этого цикла: [i1 i2 …ip]2=f f, [i1 i2 …ip]3= f (f f) и т.д., доказать (методом математической индукции), что при любом n N подстановка [i1 i2 …ip]n переводит 54
цифру is (s=1, 2, …, p) в цифру ir, где r определяется следующим образом. Если s+n не кратно р, то r есть остаток от деления s+n на р; если же s+n кратно р, то r=р. Вывести из доказанного, что порядок р-членного цикла, как элемента группы k, равен р. (d) Записать все подстановки группы 3 (кроме тождественной подста1 2 3 новки е= ) в виде циклов и доказать, что группа 3 имеет одну под1 2 3 группу порядка 3 и три подгруппы порядка 2. Убедиться, что все эти подгруппы – циклические. Легко видеть, что подстановки е , [12], [34] группы 4 не меняют выражения х1 х2+х3 х4 (где под х1, х2, х3, х4 понимаются некоторые числа). Найти все подстановки группы 4, не меняющие указанное выражение, и убедиться, что они составляют подгруппу порядка 8. Показать, что группа (так называемая Vierergruppe), е, [12] [34], [13] [24], [14] [23], сама являющаяся подгруппой предыдущей группы порядка 8 – абелева, но не циклическая. (е) Пусть (i1 i2 …ik) – какая-либо перестановка цифр 1, 2, …, k. Если s Nk, s>1, но is
цифрами it-2 , it-3, …, получая перестановки P 2, P 3, … . Через t-s таких операций получим перестановку P t-s=(i1 i2 …is-1 is+1 … it-1 it+1…ik). Будем теперь последовательно менять местами цифру с цифрами is+1 , is+2 … it-1, получая перестановки P t-s+1, P t-s+2, …. Через t-s-1 таких операций получим перестановку P 2(t-s)-1=Ff( P ). Таким образом, перестановка Ff( P ) получается из перестановки P с помощью нечетного числа операций, каждая из которых меняет четность перестановки. Следовательно, перестановки P и Ff( P ) – разной четности. (f) Легко видеть, что любой цикл может быть разложен в произведение транспозиций: [ ]=[ ] [ ]; [ ]=[ ] [ ] [ ] и т.д. Пользуясь результатами упражнений 2 (b) и 2 (е), доказать, что всякая подстановка может быть разложена в произведение транспозиций, причем при различных способах разложения четность числа транспозиций – «множителей» не меняется (т.е. это число либо четное при всех способах разложения подстановки, либо всегда нечетное). Убедиться, что если подстановка может быть представлена в виде произведения m циклов и порядки этих циклов равны соответственно n1, n2, …, nm , то подстановка может быть разложена в произведение n1+ n2+ …+nm – m транспозиций. Подстановка называется четной (нечетной), если она разлагается в произведение четного (нечетного) числа транспозиций. Например, подстановка (принадлежащая 9) 1 2 3 4 5 6 7 8 9 4 6 5 1 8 7 2 9 3 =[14] [267] [3589] может быть представлена в виде произведения 2+3+4-3=6 транспозиций и потому является четной подстановкой. Доказать, что подстановки f и f -1 всегда либо обе четные, либо обе 1 2 k нечетные. Доказать, что подстановка является четной тогда и i1 i 2 ik только тогда, когда перестановка (i1 i2 …ik) – четная. Доказать, что подста i1 i 2 ik новка является четной тогда и только тогда, когда либо обе j 1 j 2 j k перестановки (i1 i2 …ik), (j1 j2 …jk) – четные, либо обе они – нечетные. Докаk! зать, что группа k содержит четных и столько же нечетных подстано2 вок. Ясно, что четные подстановки группы k составляют группу, которая называется знакопеременной группой подстановок k-ой степени. Мы будем обозначать эту группу символом Uk. Доказать, что каждую четную подстановку при k 3 можно разложить в произведение трехчленных циклов. Указание Достаточно установить, что произведение двух несовпадающих транспозиций можно представить либо в виде одного трехчленного цикла, либо в виде произведения двух трехчленных циклов. Если транспозиции [ ] и [ ] не содержат общей цифры, то [ ] [ ]= =([ ] [ ]) ([ ] [ ])=[ ] [ ]. Тождественную подстановку е
56
можно представить в виде произведения двух трехчленных циклов следующим образом: е=[ ] [ ] (g) Группа G подстановок k цифр 1, 2, …, k (т.е. группа k или одна из ее подгрупп) называется транзитивной, если для любой пары цифр (i, j) NkxNk в рассматриваемой группе найдется подстановка, переводящая цифру i в цифру j. Если это условие не выполняется, то группа G называется интранзитивной. Так, например, Vierergruppe (см. упр. (d)) является транзитивной группой, а группа {е, [12], [34], [12] [34]} – интранзитивна (в обоих случаях k=4). Доказать, что если группа G подстановок k цифр – интранзитивна, то отрезок натурального ряда Nk={1, 2, …k} можно разбить на попарно непересекающиеся подмножества, называемые системами интранзитивности группы G, характеризующиеся следующими свойствами: 1) группа G содержит подстановки, переводящие друг в друга любые цифры одной и той же системы интранзитивности; 2) группа G не содержит подстановок, переводящих друг в друга цифры разных систем интранзитивности. Указание Пусть R – отношение в множестве {1, 2, …k} определяемое следующим образом: iRj тогда и только тогда, когда в группе G есть хотя бы одна подстановка, переводящая i в j. Установить, что R – отношение эквивалентности и рассмотреть разбиение множества {1, 2, …k} на классы эквивалентности по отношению R. (h) Группа подстановок k цифр 1, 2, …k называется m раз транзитивной (1 m k), если для любых двух наборов m цифр i1, i2, …im и j1, j2, … jm (каждый набор состоит из различных чисел отрезка Nk натурального ряда, но некоторые числа могут быть общими для обоих наборов) в группе G найдется подстановка, переводящая i1 в j1, i2 в j2, …, im в jm. Очевидно, что симметрическая группа k k раз транзитивна. Доказать, что знакопеременная группа Uk (состоящая из четных подстановок k цифр 1, 2, … k) k-2 раза транзитивна, но не является k-1 раз транзитивной. Указание Пусть i1, i2, …ik-2 и j1, j2, … jk-2 два набора различных чисел, принадлежащих отрезку Nk натурального ряда. Пусть также {ik-1, ik}= =Nk\{i1, i2, …ik-2}, {jk-1, jk}=Nk\{j1, ji2, …jk-2}. Рассмотреть подстановки i1 i 2 ik 2 ik 1 ik i1 i 2 ik 2 ik 1 ik j1 j 2 jk 2 jk 1 jk и j1 j 2 jk 2 jk и доказать, j k 1 что одна из них – четная. Убедиться также, что ни одна подстановка из Uk не может перевести цифры 1, 2, 3, 4, …, k-1 соответственно в цифры 2, 1, 3, 4, … k-1. (i) Про транзитивную группу подстановок k цифр будем говорить, что она имеет одну систему интранзитивности {1, 2, …k}. Пусть G – группа подстановок k цифр (транзитивная или нет) и {i1, i2, …im} – одна из ее систем интранзитивности (1 m k). Зафиксируем любую цифру is (1 s m) рассматриваемой системы интранзитивности и пусть Нs – множество всех подстановок группы G, оставляющих цифру is на месте. Доказать, что Нs – подгруппа 57
группы G (очевидно, наибольшая из подгрупп, оставляющих цифру is на месте) и что (G:Нs)=m. Указание Для любого р Nm найти подстановку fp G, переводящую iр в is (fs Нs), и рассмотреть смежные классы Нs f1, Нs f2,…, Нs fm . Доказать, что они попарно не пересекаются (если, например, смежные классы Нs f1 и Нs f2 имеют общий элемент, то найдутся подстановки , Нs такие, что f1= f2 , откуда f11 1 = f 21 1 . Убедиться в невозможности этого равенства. m
Установить, далее, равенство G= Hsfp (если G и переводит в is цифp 1
ру j, то цифра j должна принадлежать той же системе интранзитивности, что и цифра is, т.е. j=ip при некотором p Nm. Следовательно, f p1 Нs и Нs fр). Проиллюстрировать доказанное на примере интранзитивной группы {е, [12], [34], [12] [34]}. Вывести из доказанного следствие, относящееся к транзитивной группе подстановок k цифр. (j) Рассмотрим подстановки двух абелевых групп (k=4), одна из которых (Vierergruppe) транзитивна, а вторая – интранзитивна: {е, [12] [34], [13] [24], [14] [23]} и {е, [12], [34], [12] [34]}. Каждая подстановка первой группы разлагается в произведение циклов (без общих цифр), порядки которых одинаковы (е=[1] [2] [3] [4]). Не так обстоит дело с подстановками второй группы. Например, подробная запись разложения подстановки [12] в произведение циклов без общих цифр (и содержащая явно все цифры 1, 2, 3, 4) имеет вид [12]= [12] [3] [4] и это разложение содержит циклы разных порядков. Доказать, что подобная ситуация не может иметь места для транзитивных абелевых групп. А именно, доказать, что каждая подстановка, кроме круговой, транзитивной абелевой группы G разлагается в произведение циклов (без общих цифр), порядки которых равны между собой. Указание Допустив противное, найти подстановку f G, разложение которой в произведение циклов (без общих цифр) содержит циклы разных порядков. Обозначив через m наименьший из порядков циклов, входящих в разложение подстановки f, рассмотреть подстановку =fm. Эта подстановка должна перемещать некоторые из цифр 1, 2, 3, … k, но не все. Пусть переводит цифру i1 в цифру i2 i1 , а цифру i3 оставляет на месте. В силу транзитивности группы G в ней найдется подстановка , переводящая i3 в цифру i1. А так как группа G – абелева, то . Убедиться, однако, что подобное равенство не может иметь места. Замечание Транзитивная абелева группа может содержать круговые подстановки, которые не разлагаются в произведение двух или нескольких циклов без общих цифр. Таковы, например, следующие подгруппы групп 3 и 4 : {е, [123], [132]} и {е, [1234], [13] [24], [1432]}. 58
(к) Доказать, что порядок транзитивной абелевой группы подстановок k цифр равен k. Указание Если какая-нибудь подстановка f e транзитивной абелевой группы оставляет одну из цифр, например, is на месте, то f разлагается в произведение циклов разных порядков. Так как это противоречит доказанному в 2(j), то для транзитивной абелевой группы подгруппа Нs всех подстановок, оставляющих цифру is на месте, совпадает с единичной группой. Применить результат упражнения 2(i). (l) Пусть G – группа подстановок k цифр и f, G. Доказать, что если f является р-членным циклом (1 р k), т.е. f=[ 1 2... p ], то и подстановка 1 f , преобразованная из f при помощи , является р-членным циклом: 1 f =[ 1 2... p ], где i = 1 ( i ), i=1, 2, …, р. Указание Записать подстановку 1 в виде 1 2 p p 1 k 1 2 p p 1 k и определить, в какую цифру переводится каждая из цифр 1, 2, ..., p, p 1, ..., k суперпозицией 1 f . Сформулировать общее правило преобразования подстановки f при помощи , заметив, что если f=f1 f2 … fm , то 1 f =( 1 f1 ) ( 1 f2 ) … ( 1 fm ) Убедиться, что Vierergruppe {е, [12] [34], [13] [24], [14] [23]} является нормальным делителем симметрической группы 4 , а группа {е, [1324], [1423], [12] [34], [13] [24], [14] [24], [12], [34] } подстановок, не меняющих выражения х1х2+х3х4, не является нормальным делителем группы 4 . Чтобы обосновать последнее утверждение, достаточно преобразовать подстановку [12] или [34] с помощью подстановки [23] 4 . Доказать, что знакопеременная группа Uk является нормальным делителем симметрической группы k при любом k 2 (максимальным). Найти композиционный ряд симметрической группы 4 и убедиться в ее разрешимости. (m) Доказать, что при k 5 знакопеременная группа Uk проста, , т.е. не имеет нормальных делителей, отличных от Uk и единичной группы. Указание Пусть Н – нормальный делитель группы Uk, отличный от единичной группы, и требуется доказать, что Н= Uk. Достаточно установить, что Н содержит хотя бы один трехчленный цикл [i1i2i3]. Тогда, если [j1j2j3] – любой трехчленный цикл, то в группе Uk найдется подстановка i1 i 2 i 3 f= (ибо Uk k-2 раза транзитивна), причем f [i1i2i3] f -1 H. j1 j 2 j 3 Так как f [i1i2i3] f -1=[j1j2j3] (убедиться в этом), то из принадлежности группе Н хотя бы одного трехчленного цикла следует принадлежность этой группе и любого трехчленного цикла. Отсюда, в свою очередь, следует принадлежность группе Н любой четной подстановки (см. 2(f)), что и доказывает равенство Н=Uk в случае, когда Н 59
содержит хотя бы один трехчленный цикл. Чтобы доказать такую принадлежность, рассмотреть подстановку Н, отличную от тождественной и перемещающую наименьшее количество цифр (по сравнению с другими нетождественными подстановками группы Н). Убедиться, что разложение подстановки в произведение циклов без общих цифр (одночленные циклы опускаются) должно содержать либо один цикл, либо несколько циклов равных порядков. Рассмотреть следующие возможные случаи. 1) представляет собой цикл порядка m 4: =[i1 i2 i3 i4…im]. Взяв подстановку f=[i1i2i3] Uk , убедиться в том, что [i1imi3]=(f 1 f -1) Н 2) разлагается в произведение циклов (без общих цифр) порядка m 4: =[i1 i2 i3 i4…im] [im+1 im+2… i2m] … . Как и в случае 1) убедиться, что [i1imi3] Н. 3) разлагается в произведение двух или нескольких трехчленных циклов (случай, когда представляет собой трехчленный цикл, не нуждается в особом рассмотрении): =[i1 i2 i3] [i4 i5 i6] … Взяв подстановку f=[i1 i2 i4] Uk, убедиться в том, что [i1 i3 i6 i2 i4]= (f 1 f -1) Н. Но тогда, согласно 1), Н содержит и трехчленный цикл. 4) разлагается в произведение двух или нескольких двучленных циклов: =[i1 i2] [i3i4] … Так как k 5, то найдется цифра j Nk, отличная от i1, i2, i3, i4. Пусть s= (j) (ясно, что s, как и j, отлично от i1, i2, i3, i4). Убедиться, что при s=j [i1 j i2]= 1 ( f -1 f) Н, где f=[i1 i2 j] Uk. При s j в разложение входит цикл [js]. Убедиться, что в этом случае [i1s] [ i2j]= 1 ( f -1 f) Н. Взяв подстановку =[i1 s i3] Uk, установить, что [i1 i3 s]=[i1s] [ i2j] ( 1 [i1s] [ i2j] ) Н. (n) Доказать, что симметрическая группа k при k 5 не содержит нормальных делителей, кроме знакопеременной группы (отличных от k и I). Указание Если Н – нормальный делитель группы k , отличный от k , Uk и I, то Н Uk=I (ибо Н Uk – нормальный делитель групп k и Uk, а группа Uk – простая и Uk Н). Следовательно, все подстановки группы Н, кроме тождественной, - нечетные. Не ограничивая общности, можно считать Н максимальным нормальным делителем группы k . В силу 2(l) и 2(m), один из композиционных рядов группы k имеет вид k , Uk, I с рядом индексов 2, k! k! . На основании 1(r) можем утверждать, что либо (G:H)=2, либо (G:H)= . 2 2 Убедиться в невозможности обоих этих случаев. При доказательстве обраk! тить внимание на следующее. Если (G:H)= , то Н должна содержать (кроме 2 тождественной подстановки) только одну (нечетную) подстановку f, которая (так как f2=e) может быть только транспозицией или произведением нечетного числа транспозиций без общих цифр. При этом для любой подстановки k должно выполняться равенство 1 f =f. Проверить, что это ра60
венство нарушается и при f=[i1 i2] и при f=[i1 i2] [i3 i4] [i5 i6] …, если взять =[i1 i2 i3]. 3. Индукцией по числу n N доказать следующую формулу Ньютона для n-ой степени бинома (двучлена) х+1 (где под х пока понимается натуральное число): (x+1)n= Cn0 x n + Cn1 x n1 +…+ Cnk x nk +…+ Cnn1 x + Cnn n
Или, коротко, (x+1)n= Cnk x nk (под х0 понимается 1). Вывести формулу для (x+а) (х, а N)
k 0
n
Указание Воспользоваться результатами 1.85(d) 4. Обозначим Sn( k ) =1k+2k+…+nk (n, k N). Написать формулу Ньютона для (x+1)k+1 и положив в ней последовательно х=1, 2, …, n, вывести, пользуясь полученными равенствами, формулу (n 1)k 1 (n 1) 1 k 1 i 1 ( k i ) (k ) Sn = Ck 1 Sn (k 2). k 1 k 1 i 1 Эта формула позволяет вычислить Sn( k ) , зная Sn(1) , Sn(2) , …, Sn( k 1) . Учиты(n 1)n вая, что , доказать, что Sn(1) =1+2+3+…+n= 2 n(n 1)(2n 1) 12+22+…+n2= и 13+23+…+n3=(1+2+3+…+n)2. Найти выражение 6 (4) для Sn . 5. Доказать, что при n 5 2n>n2, а при n 10 2n>n3. Выяснить, при каких значениях n 2n>n4. 6. Доказать, что 2n n!<(n+1)n при n>1. Указание Применить индукцию по числу n. Использовать неравенство (n+2)n+1>2(n+1)n+1, которое выводится из формулы Ньютона n+1 n+1 n (х+1) =x +(n+1)x +…, если положить x=n+1. 7. Доказать (индукцией по числу n), что при n 3 выполняется неравенство (n+1)n
61
10. Написаны n 2 писем n различным адресатам и заготовлены n конвертов с их адресами. Сколькими способами можно вложить письма в конверты, чтобы ни одно письмо не попало тому лицу, которому оно адресовано? (задача Бернулли-Эйлера о перепутанных письмах). Указание Пронумеровав письма и соответствующие им конверты цифрами 1, 2, 3, …, n, легко заметить, что задача сводится к нахождению числа an круговых подстановок (т.е. подстановок, перемещающих все цифры 1, 2, 3, …, n), содержащихся среди n! подстановок n цифр. Доказать, что число подстановок, оставляющих на месте ровно k цифр (1 k n-2, n 3), равняется Cnk an k . Вывести из этого (учитывая, что число подстановок, оставляющих на месте ровно n-1 цифр, равняется 0), что an следующим образом выражается через a2, a3, …, an-1: an=n!-[ Cn1an 1 + Cn2 an 2 +…+ Cnn2 a 2 +1]. Эта формула позволяет (с учетом очевидного равенства a2=1) последовательно находить a3, a4, …. Замечание Соотношения, выражающие n-ый член последовательности через предыдущие ее члены называются возвратными или рекуррентными соотношениями. Можно выразить an непосредственно через n, но мы на этом не останавливаемся, так как пока считаем изученными только натуральные числа. Интересующийся этим вопросом читатель может найти вывод форму(1) n 1 1 1 лы an=n! [ - + -…+ ], например, в книге С. Сташевича и Е. Бров2! 3! 4! n! кина «Польские математические олимпиады», 1978. 11. Доказать, что если натуральные числа x, y, z, n удовлетворяют уравнению xn+yn=zn, то min(x; y) n (под min(x; y) понимается наименьшее из чисел x, y). Указание Пусть min(x; y)= х . Так как zn> yn, то z> y, откуда z y+1 и zn yn+nyn-1. 12. Рассмотрим всевозможные перестановки натуральных чисел 1, 2, 3, …, 99, 100. Пусть А – множество всех таких натуральных чисел а, что в любой перестановке чисел 1, 2, 3, …, 99, 100 найдется десятка последовательных чисел, сумма которых больше или равна а. Найти наибольшее число множества А. Указание Рассмотреть перестановку =(100 99 98 97 96 1 2 3 4 5 95 94 93 92 91 6 7 8 9 10..55 54 53 52 51 46 47 48 49 50). Она получается из основной перестановки (1 2 3 4 5 … 94 95 96 97 98 99 100) следующим образом. Выписываются в убывающем порядке пять последних чисел основной перестановки, а затем – в порядке возрастания – пять первых чисел основной перестановки. С оставшейся частью основной перестановки поступаем таким же образом и т.д. до исчерпания основной перестановки. Убедиться, что максимальная сумма десяти последовательных чисел перестановки равна 505. Следовательно, 506 А. Остается доказать, что 505 А. С этой целью в любой перестановке ( 1, 2, …, 100) чисел 1, 2, 3, …100 рассмотреть следующие десятки последовательных чисел: 1) 1, 2, …, 10; 2) 11, 12, …, 20; …, 10) 91, 92, …, 100. Если допустить, что в каждой из этих десяток сумма 62
чисел <505, то сумма всех чисел 1, 2, 3, …100 должна быть <5050. Но эта 1 100 сумма равна 100=5050. 2 13. Сколькими способами множество, содержащее четное число n элементов, можно разбить на непересекающиеся множества, каждое из которых содержит по два элемента? Указание Обозначив искомое число способов через аn , доказать справедливость рекуррентного соотношения аn=(n-1) аn-2 (n 4). Вывести отсюда (учитывая, что а2 =1), что аn =1 3 … (n-1). В правой части здесь фигурирует произведение последовательных нечетных чисел от 1 до n-1, которое обозначается (n-1)!! Символ «!!» читается «факториал дважды». Вообще, через k!! обозначается произведение всех натуральных чисел, не превосходящих k и одной четности с k. 14. Доказать, что n человек (n 5), сидящих за круглым столом, можно пересадить так, чтобы у каждого из сидящих оказались по два новых соседа. Указание Занумеровав сидящих за круглым столом цифрами 1, 2, …, n (переходя от одного сидящего к другому, скажем, по часовой стрелке), рассмотреть отдельно случай четного n и случай нечетного n. Если n нечетно и n=2k+1 (k 2), то сидевших первоначально в порядке 1, 2, 3, 4, …2k-1, 2k, 2k+1 можно расположить в порядке 1, 3, 5, …, 2k-1, 2k+1, 2, 4, …, 2k. Убедиться, что при этом каждый из сидящих получит два новых соседа. Найти новое расположение сидящих за круглым столом (удовлетворяющее условиям задачи) при четном n. 15. Пусть А – n-элементное множество, состоящее из натуральных чисел и S(A) – множество сумм двух различных чисел из А: S(A)={x N: x=a+ a , a A, a A, a a }. Пусть ms – число элементов множества S(A). Считая, что n 3, доказать, n(n 1) что каково бы ни было n-элементное множество A N 2n-3 ms . 2 Найти какое-либо множество А, для которого ms=2n-3 и какое-либо множестn(n 1) во A , для которого ms= . 2 Указание Расположив числа, составляющее множество А, в порядке возрастания: а1
16. Из n человек (n 4), среди которых есть знакомые и незнакомые между собой лица (отношение знакомства симметрично), выбираются по произволу m человек (3 m
1 2
3
А1,2,3
А1,2 А1
Тогда k1 k+1, k1+m1+1=n. Убедиться, что k1,2+1+ m1 k2, где k2 – число тех из присутствующих, кто знаком со вторым из выбранных лиц (k2 k+1). Оценить величину k1,2 и выбрать из множества А1,2 по произволу третьего из искомой четверки лиц. Пусть k1,2,3 – численность множества А1,2,3 тех из присутствующих, кто знаком со всеми тремя выбранными лицами. Доказать, что k1,2,3+k1 - k1,2+1+ m1 k3, где k3 - число тех из присутствующих, кто знаком с третьим из выбранных лиц (k3 k+1). Убедиться, что k1,2,3 3-r 1 и выбрать из множества А1,2,3 четвертого недостающего. 18. Доказать (индукцией по числу n), что если а1
ва. Под а1, a2, a3, …, an и b1, b2, b3, …, bn пока понимаются натуральные числа). Указание Предварительно установить, что аibk+akbi< аibi+akbk при любых i, k Nnтаких, что i k. С этой целью, считая, например, что ia+b, то c>a и c-a>b. И обратно: из c>a и c-a>b следует, что с>a+b. При этом c-(a+b)=(c-a)-b (b) Если b>a и c>b-a, то c+a>b. И обратно: из c+a>b и b>a следует, что c>b-a. При этом c-(b-a)=(c+a)-b (c) Если b>a, то c+(b-a)=(c+b)-a. Если и c>a, то (c+b)-a=(c-a)+b. (d) Если b>a, то (b-a)2=(b2+a2)-2ab. Вывести отсюда, что для любых a, b N 2ab a2+b2, причем равенство имеет место тогда и только тогда, когда a=b. 20. Доказать индукцией по числу n N (n 2), что для любых натуральных чисел а1, a2, a3, …, an (а1+a2+a3+…+an )2= a12 + a22 +…+ an2 +2а1(а2+a3+ +a3+…+an)+ 2а2(а3+a4+…+an)+…+ 2аn-2(аn-1+an)+ 2аn-1аn. Эта формула читается следующим образом: «Квадрат суммы нескольких чисел равен сумме квадратов этих чисел, сложенной с удвоенными произведениями каждого из этих чисел на каждое из последующих. 21. Доказать, что каковы бы ни были натуральное число n и числа (которые пока будем считать натуральными) а1, a2, a3, …, an и b1, b2, b3, …, bn – имеет место неравенство: (а1b1+a2b2+ +a3 b3+ …+an bn)2 ( a12 + a22 +…+ an2 ) ( b12 + b22 +…+ bn2 ) Указание Применить метод математической индукции. Воспользоваться следующей оценкой: (а1b1+a2b2+a3 b3+ …+an bn+an+1 bn+1)2=(а1b1+a2b2+a3b3+ …+anbn)2+2(а1b1+a2b2+a3 b3+ …+an bn) an+1 bn+1+ an21 bn21 =(а1b1+a2b2+a3b3+… …+an bn)2+2 a1bn+1 b1an+1+…+2 anbn+1 bnan+1+ an21 bn21 (а1b1+ …+anbn)2+( a12 + + a22 +…+ an2 ) bn21 +( b12 + b22 +…+ bn2 ) an21 + an21 bn21 (несколько раз использовано неравенство 2ab a2+b2). Далее использовать предположение индукции. Замечание Доказываемое неравенство есть частный случай (поскольку мы имеем дело пока только с натуральными числами) так называемого неравенства Коши-Буняковского (иногда его называют также неравенством Шварца). Следует обратить внимание на то, что если числа а1, a2, a3, …, an kкратны (при некотором k N) соответственно числам b1, b2, b3, …, bn (т.е. а1=kb1, а2=kb2,…, аn=kbn), то неравенство Коши-Буняковского превращается в равенство (то же - когда числа b1, b2, b3, …, bn k-кратны числам а1, a2, a3, … …, an). 22. Доказать индукцией по числу n N (n 2), что при x>1(x N) имеет место равенство xn-1=(x-1)(xn-1+xn-2+…+x+1) 65
Указание Убедиться, что при любом n N xn+1>xn>1и xn+1-1=(xn+1-xn)+ +(xn-1)=xn(x-1)+(xn-1). Далее воспользоваться предположением индукции. Конец Главы I
66
67
ГЛАВА 2. Целые, рациональные, действительные и комплексные числа. Целые числа. Множество N всех натуральных чисел, рассматриваемое вместе с операцией сложения в нем, не является группой: отсутствует нулевой элемент и ни одно натуральное число не обладает в N противоположным элементом. Вместе с тем, операция сложения в N подчинена ассоциативному закону и возникает вопрос: нельзя ли пополнить множество N нулевым элементом и противоположными элементами для n є N и так определить операцию сложения в полученном множестве, которое обозначим символом Z, чтобы (Z, +) оказалось абелевой группой и на множестве N вновь определенная операция сложения совпала с ранее определенной? Убедимся в том, что ответ на этот вопрос положительный. Определим отношение R в декартовом произведении NxN, полагая (a,b) R (c,d) в том и только в том случае, когда a+d=b+c (a,b,c,d є N). Легко проверить (это предоставляется читателю) рефлексивность, симметричность и транзитивность этого отношения. Следовательно R-отношение эквивалентности в NxN и в дальнейшем вместо (a,b) R (c,d) будем писать (a,b)~(c,d). Этим отношением множество NxN разбивается на классы эквивалентности, которые мы будем называть целыми числами. Каждую пару (a,b), принадлежащую целому числу, будем называть представлением этого числа. 2.1 Теорема. Пусть a,b,c,d-натуральные числа и (a,b) ~ (c,d). Утверждается, что если a>b, то и c>d, причем a-b=c-d; если же ab, т.е. a=b+K (К є N), то (b+K)+d=b+c. Отсюда b+(d+K)=b+c и c=d+K, т.е. c>d, причем a-b=K=c-d. Аналогично рассматриваются и случаи, когда а< b или a=b. 2.2 Определения. (а) Целое число будем называть положительным, если для любого представления (а,b) этого числа выполняется неравенство а>b (в силу теоремы 2.1, выполнение этого условия достаточно проверить для какого-либо одного представления данного целого числа). (b) Целое число будем называть отрицательным, если для любого представления (a,b) этого числа выполняется неравенство a
68
2.5 Теорема. Если (a1,b1)~(a,b) и (c1,d1)~(c,d) (компоненты всех пар суть натуральные числа), то сумма пар (a1,b1) и (c1,d1) эквивалентна сумме пар (a,b) и (c,d): (a1+c1, b1+d1) ~(a+c, b+d). Доказательство. Согласно условию теоремы, имеют место равенства: а1+b=b1+a и c1+d=d1+c. Следовательно, (a1+b)+(c1+d)=(b1+a)+(d1+c) или(мы пользуемся коммутативностью и асоциативностью сложения натуральных чисел) (a1+c1)+(b+d)=(b1+d1)+(a+c), ч.т.д. 2.6 Определение Пусть α и β-два целых числа и (a,b)-какое-либо представление числа α, а (c,d)-какое-либо представление числа β. Суммой αβ чисел α и β будем называть целое число, представимое парой (a+c, b+d) (как показывает теорема 2.5, понятие суммы αβ не зависит от выбора представлений чисел α и β). 2.7 Теорема Сложение целых чисел подчинено законам коммутативности и ассоциативности. Доказательство Пусть α, β, γ-любые целые числа и (а,b)-какое-либо представление числа α, (c,d)-какое-либо представление числа β, и (p,q)какое-либо представление числа γ. Установим сперва, что αβ= βα. В самом деле, целое число αβ представимо парой (a+c, b+d), а целое число βα. представимо парой (c+a, d+b), которая совпадает с парой (a+c, b+d) (ввиду коммутативности сложения натуральных чисел). Следовательно, αβ= βα. Теперь убедимся, что (αβ) γ=α (βγ). В самом деле, целое число (αβ) γ представимо парой ((a+c)+p, (b+d)+q), а целое число α (βγ) представимо парой (a+(c+p), b+(d+q)). Но эти пары совпадают, ввиду ассоциативности сложения натуральных чисел. Следовательно, (αβ) γ=α(βγ), ч. т.д. 2.8 Теорема Для любого целого числа α α0=0α= α. Доказательство. Ввиду 2.7, достаточно доказать, что α0=α. Пусть (a,b)-любое представление числа α. Так как целое число 0 представимо, например парой (1,1), то α0 представимо парой (а+1, b+1), которая, очевидно, эквивалентна паре (a,b). Следовательно, α0=α, ч. т.д. 2.9 Теорема. Для любого целого числа α в множестве Z имеется противоположный элемент, т.е. такое целое число β, что αβ= βα=0. Доказательство. Пусть (а,b)-любое представление целого числа α. Рассмотрим целое число β, представимое парой (b,a). Так как число αβ представимо парой (а+ b, b+a), а эта пара является представлением числа 0, то αβ=0. Ввиду 2.7, и βα=0, ч. т.д. 2.10 Замечания и обозначения. Как видим, пара (Z, ) является абелевой группой. Единственность нулевого элемента группы и единственность противоположного элемента для каждого элемента группы доказаны в 1.28 и 1.29. В согласии с 1.30, противоположное целое число для каждого целого числа α будем обозначать символом-α. Если β=-α, то α=-β, откуда –(-α)=α для любого αєZ. Кроме того, для любых α,β єZ(αβ)=(-α)(-β). Если α≠0 и α представимо парой (a,b), то-α представимо
69
парой (b,a), так что из двух чисел α и –α одно положительно, а другое отрицательно. Противоположным к нулю является само число 0, так что 0=0. Поставим в соответствие каждому целому положительному числу α отрицательное целое число –α. Легко проверить (это предоставляется читателю), что при этом мы получим биективное отображение множества всех целых положительных чисел на множество всех целых отрицательных чисел. Далее, поставим в соответствие каждому натуральному числу n целое положительное число, представимое парами (a,b), для которых a>b и a-b=n (все такие пары, как легко проверить, эквивалентны между собой). Получим, как легко видеть, биективное отображение множества N на множество всех целых положительных чисел. Обозначив через n* целое положительное число-образ числа nєN при указанном отображении,-мы можем расположить все целые положительные числа в последовательность 1*, 2*, 3*, …, n*, … Все целые отрицательные числа также можно расположить в последовательность -1*,- 2*, -3*, …,-n*, … Например, 2*это целое положительно число, определяемое эквивалентными между собой парами (3,1), (4,2), (5,3), …, а -2*-это целое отрицательное число, определяемое эквивалентными между собой парами (1,3), (2,4), (3,5),… 2.11 Теорема. Пусть α и β-целые числа (α≠-β), отличные от 0. Утверждается следующее: (а) если числа α и β оба положительны, т.е. α=n*, β=m* (n,mєN), то αβ= (n+m)*; (b) если числа α и β оба отрицательны, т.е. α=-n*, β=-m* (n,mєN), то αβ=-(n+m)*; (с) если α=n*, β=-m* и n>m, то αβ =(n-m)*; (d) если α=n*, β=-m* и m>n, то αβ=-(m-n)*. Доказательство (а) Пусть (a,b)-любое представление числа α, (c,d)любое представление числа β. Тогда число αβ представимо парой (a+c, b+d), причем a-b=n, c-d=m (a,b,c,dєN, a>b, c>d). Так как a+c>b+d и a+c=(b+n)+(d+m)=(b+d)+(n+m), откуда (a+c)-(b+d)=n+m, то αβ =(n+m)*, ч. т.д. (b) Пусть (a,b)-любое представление числа α, (c,d)-любое представление числа β. Тогда число αβ представимо парой (a+c, b+d), причем на этот раз b-a=n, d-c=m (a,b,c,dєN, ab, cm, то a+c>b+d и (a+c)-(b+d)=n-m, так что αβ =(n-m)* (d) Пусть (a,b)-любое представление числа α, (c,d)-любое представление числа β. Тогда число αβ представимо парой (a+c, b+d), причем a-b=n, d-c=m (a>b, c n,
70
то а+cα) в том и только в том случае, когда β- α является целым положительным числом. 2.17 Теорема. Отношение «<» является частичным упорядочением в Z. Доказательство. Установим сперва антисимметричность отношения «<». Пусть α<β (α,βєZ) и требуется доказать, что β<⁄α. Допустим противное. Тогда α-β=α(-β) есть целое положительное число, как и β- α= β(- α ). Согласно 2.11 (а), сумма чисел α-β и β- α должна быть целым положительным числом, тогда как она, очевидно, равна 0. Полученное противоречие доказывает антисимметричность отношения «<». Докажем теперь транзитивность этого отношения. Пусть α,β,γ-целые числа и α<β, β<γ. Тогда β(-α) и γ(-β) суть целые положительные числа и таково же (2.11 (а)) число [γ(-β)][β(-α)]=γ(-α)=γ-α.. следовательно α<γ, ч. т.д. 2.18 Теорема. Отношение «<» является совершенным упорядочением в Z. Доказательство. Пусть α и β-различные целые числа. Требуется доказать, что либо α<β, либо β<α. Расмотрим целое число β-α. Так как оно не равно 0, то (согласно 2.3) оно либо положительно, либо отрицательно. Если β-α есть целое положительное число, то α<β. Если же β-α=β(-α) есть целое отрицательное число, то целым положительным будет число –(β-α)=[β(-α)]=(-β)[-(-α)]=(-β)α=α-β, а это и означает, что β<α. Теорема доказана. 2.19 Замечание. Очевидно, неравенство α>0 выполняется тогда и только тогда, когда α есть целое положительное число. Точно так же, неравенство β<0 выполняется тогда и только тогда, когда 0-β=-β есть целое
71
положительное число, т.е. β является целым отрицательным числом. Из транзитивности отношения «<» следует, что любое отрицательное целое число меньше не только нуля, но и любого положительного целого числа. 2.20 Теорема. Пусть α и β-целые числа. Если они оба положительны: α=n*, β=m* (m,nєN), то α<β тогда и только тогда, когда n<m. Если же числа α и β оба отрицательны: α=-p*, β=-q* (p,qєN), то α< β тогда и только тогда, когда p>q. Доказательство. Пусть (a,b)-любое представление числа α, а (c,d)любое представление числа β. Применяя для обозначения равносильности утверждений символ «», будем иметь: α<ββ(-α)>0c+b>d+a. Если теперь α=n*, β=m*, т.е. a=b+n, c=d+m, то c+b>d+a (b+d)+m>(b+d)+nm>nn<m. Если же α=-p*, β=-q*, то есть b=a+p, d=c+q, то с+b>d+a(a+c)+p>(a+c)+qp>q, ч.т.д. 2.21 Теорема. Для целых чисел α и β неравенства α>β и -α<-β равносильны. Доказательство.α-β=α(-β)=(-β)[-(-α)]=(-β)-(-α). 2.22 Теорема. Если α,β,γ- целые числа и α<β, то αγ<βγ. Доказательство. (βγ)-(αγ)=(βγ)[-(αγ)]=(βγ)[(-α)(γ)]=(βγ)[(-γ)(-α)]=[(βγ)+(-γ)](-α)=(β0)(-α)=β-α. Поэтому из α<β следует, что β-α>0, откуда (βγ)-(αγ)>0 и αγ<βγ, ч.т.д. 2.23 Теорема. Если α,β,γ,δ-целые числа, причем α<β и γ<δ, то αγ<βδ. Доказательство.Из α<β следует (см. 2.22), что αγ<βγ, а из γ<δ следует, что βγ<βδ. Пользуясь транзитивностью отношения «<»,можем заключить, что αγ<βδ. 2.24 Определение. Произведением пар (a,b) и (c,d) (в указанном их порядке), где a,b,c,d-натуральные числа, будем называть пару (которую будем обозначать (a,b)x(c,d)) (ac+bd, ad+bc). 2.25 Замечание. Определение 2.24 «навеяно» рассмотрением результата умножения числа a-b на c-d (a,b,c,d-натуральные числа, a>b, c>d). 2.26 Теорема. Если (a1, b1)(a,b) и (c1, d1)(c,d), то (a1, b1)x(c1, d1) (a,b)x(c,d). Доказательство. Согласно условию теоремы, имеют место равенства: а1+b=b1+a и c1+d=d1+c (*). Требуется доказать, что (a1c1+b1d1, a1d1+b1c1) (ac+bd, ad+bc), т.е. требуется установить справедливость равенства a1c1+b1d1+ad+bc=a1d1+b1c1+ac+bd. Это равенство равносильно следующему: аc+bd+ a1d1+b1c1+bd1=ad+bc+a1c1+b1d1+bd1.. Преобразуем левую часть этого равенства, используя равенства (*): ac+bd+ a1d1+b1c1+bd1=ac+bd+(b+a1)d1+ b1c1= =ac+bd+(a+b1) d1+ b1c1=a(c+d1)+bd+ b1d1+b1c1= =a(d+c1)+bd+b1d1+b1c1=ad+bd+b1d1+(a+b1)c1=
72
=ad+bd+ b1d1+(b+a1)c1=ad+ b1d1 +a1c1+bd+bc1= =ad+ b1d1+ a1c1+b(c1+d)= ad+ b1d1 +a1c1+b(c+d1)= =ad+bc+ a1c1+ b1d1+ bd1. Итак, ac+bd + a1d1+b1c1+bd1=ad+bc+ a1c1+ b1d1+ bd1, откуда ac+bd+ a1d1+b1c1=ad+bc+a1c1+ b1d1, ч.т.д. 2.27 Определение. Пусть α и β-целые числа и (a,b)-любое представление числа α, а (c,d)-любое представление числа β. Произведением αхβ числа α на число β будем называть целое число, представимое парой (a,b)х(c,d)=(ac+bd, ad+bc) (как показывает теорема 2.26, понятие произведения αхβ не зависит от выбора представлений чисел α и β). 2.28 Теорема. Умножение целых чисел подчинено законам коммутативности и ассоциативности. Доказательство. Коммутативность умножения целых чисел легко проверяется (и эта проверка предоставляется читателю) с учетом коммутативности сложения и умножения натуральных чисел. Остановимся подробнее на доказательстве ассоциативности умножения целых чисел. Пусть α,β,γ- любые целые числа, представляемые парами (a,b), (c,d) и (p,q) соответственно. Тогда αхβ представимо парой (ac+bd, ad+bc), a βxγ представимо парой (сp+dq, cq+dp). Далее, (αхβ)хγ представимо парой ((ac+bd)xP+(ad+bc)xq,(ac+bd)xq+(ad+bc)xP)= =(acp+bdp+adq+bcq, acq+bdq+adp+bcp). Число αх(βхγ) представимо парой (a(cp+dq)+b(cq+dp), a(cq+dp)+b(cp+dq))=(acp+adq+bcq+bdp, acq+adp+bcp+bdq). При этом мы воспользовались коммутативностью и ассоциативностью сложения и умножения натуральных чисел и законом дистрибутивности, связывающим сложение и умножение натуральных чисел. Как видим, целые числа (αхβ)хγ и αх(βхγ) представимы одной и той же парой натуральных чисел. Следовательно (αхβ)хγ=αх(βхγ) ч.т.д. 2.29 Теорема. Сложение и умножение целых чисел связаны законом дистрибутивности, т.е. для любых целых чисел α,β,γ имеет место равенство (αβ)хγ=(αхγ)(βхγ) Доказательство. Пусть (a,b), (c,d) и (p,q)-суть какие-либо представления чисел α,β и γ соответственно. Число αβ представимо парой (a+c, b+d), а число (αβ)хγ представимо парой ((a+c)xp+(b+d)xq, (a+c)xq+(b+d)xp)=(ap+cp+bq+dq, aq+cq+bp+dp). Далее, число αхγ представимо парой (ap+bq, aq+bp), а число βхγ представимо парой (cp+dq, cq+dp), так что число (αхγ)(βхγ) представимо парой (ap+bq+cp+dq, aq+bp+cq+dp). Как видно (с учетом законов коммутативности и ассоциативности сложения и умножения натуральных чисел, а также с учетом закона дистрибутивности, связывающего операции сложения и
73
умножения натуральных чисел), числа (αβ)хγ и (αхγ)(βхγ) представимы одной и той же парой натуральных чисел. Следствие 1. Для любых целых чисел α,β, γ имеет место равенство (α-β)хγ=(αхγ)-(βхγ). Доказательство. С учетом 2.29 можем написать: αхγ=[(αβ)β]хγ=((α-β)хγ(βхγ), откуда (α-β)хγ=(αхγ)-(βхγ) ч.т.д. Следствие 2. Для любого целого числа α αх0=0хα=0 Доказательство. Так как 0=00, то 0хα=(00)хα=(0хα)( 0хα), откуда 0хα= (0хα)-(0хα)=0. Ввиду коммутативности умножения целых чисел, и αх0=0. Следствие 3. Для любых целых чисел α,β имеют место равенства: (-α)хβ=-(αхβ); αх(-β)=-(αхβ); (-α)х(-β)=αхβ. Доказательство. (αхβ)[(-α)хβ]=[α(-α)]хβ=0хβ=0, откуда (-α)хβ= -(αхβ); Аналогично, (αхβ)[αх(-β)]=(βхα)[(-β)хα]=[β(-β)]хα=0хα=0, откуда αх(-β)=-(αхβ). Наконец, (-α)х(-β)=-[αх(-β)]=-[-(αхβ)]=αхβ, ч.т.д. 2.30 Теорема. (а) Для любого целого числа α имеет место равенство αх1*=1*хα=α. (b) Если α, β-целые числа и αхβ=0, то по крайней мере одно из чисел α,β равно 0. Доказательство. (а) Пусть (a,b)-любое представление числа α. Так как число 1* представимо, например, парой (2,1), то αх1* представимо парой (2а+b, a+2b), которая эквивалентна паре (a,b). Следовательно, αх1*= α. Ввиду коммутативности умножения целых чисел, и 1*хα= α. (b) Пусть по-прежнему (a,b)-любое представление числа α, а (c,d)любое представление числа β. Тогда αхβ представимо парой (ac+bd, ad+bc). Так как αхβ=0, то ac+bd=ad+bc. Допустим, что α≠0 и докажем, что тогда β=0. Из α0 следует, что аb, откуда либо а>b, либо b>a. Пусть a>b, т.е. a=b+k, kєN. Тогда равенство ac+bd=ad+bc примет вид (b+k)xc+bd=(b+k)xd+bc, откуда kc=kd и c=d. Следовательно β=0. Если же b>a, т.е. b=a+m, mєN, то будем иметь: ac+(a+m)d=ad+(a+m)хc, откуда md=mc и d=c. Таким образом, и в этом случае β=0. Теорема доказана. 2.31 Теорема. Если целые числа α и β оба положительны, причем α=n*, β=m*, то и αxβ положительно, причем αxβ =(nхm)*. Доказательство. Пусть (a,b)-любое представление числа α, а (c,d)любое представление числа β. Согласно условию теоремы a=b+n, c=d+m, откуда ac+bd=(b+n)(d+m)+bd=2bd+bm+nd+nm и ad+bc=(b+n)d+b(d+m)=2bd+bm+nd. Как видно, (ac+bd)-(ad+bc)= nm, так что число αхβ, которое представимо парой (ac+bd, ad+bc), действительно равно (nхm)* ч.т.д. 2.32 Теорема. Пусть α,β,γ-целые числа и α>β. Тогда при γ>0 имеет место неравенство αхγ>βхγ. Если же γ<0, то имеет место неравенство αхγ<βхγ.
74
Доказательство. Пусть γ>0. Так как α-β>0, то (согласно 2.31) (αβ)хγ>0, откуда (согласно следствию 1 из теоремы 2.29) (αхγ)-(βхγ)>0, т.е. αхγ>βхγ. Пусть теперь γ<0. Тогда -γ>0 и (согласно доказанному) αх(-γ)>βх(-γ), откуда (следствие 3 из теоремы 2.29) –(αхγ)>-(βхγ). Прибавляя к обеим частям этого неравенства число βхγ (теорема 2.22), получим: (βхγ)[-(αхγ)]>0 или (βхγ)-(αхγ)>0, т.е. αхγ< βхγ, ч.т.д. Следствие. Если α,β,γ,δ-целые положительные числа, причем α>β и γ>δ, то αхγ>βхδ. Доказательство. Умножая обе части неравенства α>β на γ и обе части неравенства γ> δ-на β, получим: αхγ>βхγ и βхγ>βхδ, откуда (транзитивность отношения «>») αхγ>βхδ, ч.т.д. 2.33 Замечание. До сих пор мы считали целые числа, с одной стороны, и натуральные числа-с другой объектами различной природы и в соответствии с этим обозначали операции сложения и умножения во множествах Z и N различными символами. Однако, теоремы 2.7, 2.11, 2.20, 2.28, 2.29, 2.31 показывают, что при описанном в 2.10 биективном отображении множества N на множество всех целых положительных чисел сохраняется не только порядок элементов, но и сумма и произведение любых натуральных чисел переходят в сумму и произведение соответствующих целых положительных чисел. Другими словами, арифметика и порядок элементов в указанных множествах одинаковы. Это позволяет отождествить целые положительные числа 1*, 2*, …, n*, … с соответствующими натуральными числами 1,2,.., n,…, так что множество N оказывается подмножеством множества Z. Целые отрицательные числа -1*, -2*, …, - n*, … после указанного отождествления будут обозначаться просто -1, -2, …,- n,…Отпадает необходимость в различных обозначениях операций сложения, вычитания, умножения и отношения порядка. Так что теперь эти операции и отношение порядка в множестве Z будут обозначаться обычными символами +, -, х, < (>). Правила сложения двух целых чисел, из которых хотя бы одно отрицательно, а второе отлично от нуля, запишутся следующим образом (теорема 2.11): (-n)+(-m)=-(n+m); n m ïðè n m n+(-m)= (m n) ïðè n m 0 ïðè n m Здесь n и m –целые положительные (натуральные) числа. Так как вычитание сводится к прибавлению противоположного числа, то нет необходимости в отдельном рассмотрени правил вычитания. Правила умножения двух целых чисел, из которых хотя бы одно отрицательно, а второе отлично от нуля, запишутся следующим образом (следствие 3 из теоремы 2.29) (-n)х(-m)=nхm; nх(-m)=-(nхm), (n,mєN).
75
2.34 Заключение. В заключение этого раздела перечислим основные свойства целых чисел, относящиеся к арифметическим действиям над ними и к сочетанию их с помощью знаков равенства и неравенства. Попутно мы убедимся, что остальные свойства, установленные при изложении этого раздела, вытекают из основных как формальнологические следствия. I Множество Z, рассматриваемое вместе с операцией сложения в нем, является абелевой группой: I, 1 α+β=β+α для любых αβєZ; I, 2 (α+β)+γ=α+(β+γ) для любых α, β, γєZ ; I, 3 существует элемент 0єZ, для которого α+0=α при любом αєZ ; I, 4 для каждого целого числа α существует противоположное ему целое число, обозначаемое –α, такое, что α+(- α)=0. Прежде чем переходить к другим основным свойствам целых чисел, заметим, что из I вытекает единственность нулевого элемента, а также единственность числа, противоположного данному (см. 1.28, 1.29). Далее, любое целое число α оказывается противоположным числу –α, так что α=(-α). Кроме того, имеет место равенство: -(α+β)=(-α)+(-β) для любых α, βєZ Это равенство равносильно такому: (α+β)+[(-α)+(-β)]=0 Доказательство этого последнего равенства очевидно и требует привлечения всех свойств I, 1- I, 4. На основе этих же свойств исчерпывается вопрос о вычитании, как действии, обратном сложению. А именно, доказывается (теорема 2.12) существование и единственность разности α-β для любых целых α и β, т.е. такого целого числа γ, что β+γ=α(γ=α+(-β)). После этого из I, 3 и I, 4 вытекает, что α-α=0 и 0-α=-α для любого αєZ. Перейдем теперь к тем из основных свойств целых чисел, которые относятся к сочетанию их с помощью знаков равенства и неравенства (см. теоремы 2.17 и 2.18). II, 1 Для каждой пары целых чисел α и β имеет место одно, и только одно из соотношений α=β, α<β, β<α. II, 2 Из α<β и β<γ следует α<γ (α, β, γєZ). К этим свойстам присовокупим еще одно свойство, связывающее знак «<» со знаком суммы: II, 3 Из α<β следует α+γ<β+γ для любого целого числа γ и любых целых чисел α, β таких, что α<β (теорема 2.22). Выведем некоторые следствия из свойств I и II. Пусть α<β. Прибавляя к обеим частям этого неравенства число –β, получим неравенство α-β<0. Обратно, если верно неравенство α-β<0, то прибавляя к обеим его частям число β, получим верное неравенство α<β. Следовательно, неравенства α<β и α-β<0 равносильны. В частности, (при α=0), равносильны неравенства 0<β (β>0) и -β<0.
76
Так как противоположным к числу α-β=α+(-β) является число (-α)+β=β+(-α)=β-α, то неравенство α-β<0 равносильно неравенству β-α>0. Следовательно, и неравенство α<β равносильно неравенству β-α>0. Далее, прибавляя к обеим частям неравенства α<β число (-α)+(-β), заключаем, что из α<β следует -α>-β. Если прибавить к обеим частям неравенства -α>-β число α+β, то придем к неравенству α<β. Итак, неравенства α<β и -α>-β равносильны. Неравенства одинакового смясла можно складывать (теорема 2.23): из α<β и γ<δ следует, что α+γ<β+δ. В частности из α>0 и β>0 следует, что α+β>0. Аналогично, из α<0 и β<0 следует, что α+β<0. Определим понятие абсолютной величины или модуля целого числа. Если α0, то из двух чисел α и –α одно и только одно будет больше 0 (т.е. будет положительным числом). Именно это число называется абсолютной величиной или модулем целого числа α и обозначается символом |α|. По определению принимается также, что |0|=0. Итак:
, åñëè 0 |α| = , åñëè 0 Ясно, что для любого αєZ |α|=|-α|. Расмотрим сумму α+β двух целых чисел в том случае, когда хотя бы одно из слагаемых-отрицательно (<0). Если α<0 и β<0, то α=-|α|, β=-|β| и α+β=-(|α|+|β|)<0. Если α<0, β=0, то α+β=α=-|α|<0. Если α<0, β>0, то α+β= β+(-|α|)=
=
0, если β=|α|=-α β-|α|>0, если β>|α| -(|α|-β)<0, если β<|α|
Перечислим теперь основные свойства целых чисел, относящиеся к их умножению (см. теорема 2.28, 2.30). Они вполне аналогичны свойствам I, 1, I, 2, I, 3, относящимся к сложению целых чисел. III, 1 αхβ=βхα, для любых α, βєZ. III, 2 (αхβ)хγ=αх(βхγ) для любых α,β,γєZ III, 3 В множестве Z имеется «нейтральный» элемент относительно умножения, роль которого играет 1: α х1= α для любого αєZ Наконец, выделим два свойства, одно из которых связывает умножение и сложение, а второе связывает знак умножения со знаком «<» (см. теоремы 2.29 и 2.32):
77
IV, 1 (α+β)хγ=αхγ+βхγ для любых α, β, γєZ IV, 2 Из α<β и γ>0 следует αхγ<βхγ Из основных свойств выводится распределительное свойство умножения относительно разности (следствие 1 из теоремы 2.29): (α-β)хγ=αхγ-βхγ, для любых α, β, γєZ Кроме того, доказывается справедливость равенств (см. следствия 2 и 3 из теоремы 2.29) αх0=0, (-α)хβ=-(αхβ), (-α)х(-β)=αхβ. Из IV, 2 (полагая α=0) выводим, что из β>0 и γ>0 следует βхγ>0. Также из IV, 2 (с учетом ранее доказанного) можно вывести, что если α<β и γ<0, то αхγ>βхγ. В самом деле, из α<β следует αх|γ|<βх|γ| или αх(γ)<βх(-γ), откуда –(αхγ)<-(βхγ) и -[-(αхγ)]>-[-(βхγ)], т.е αхγ>βхγ. Из IV, 2 и II, 2 следует возможность перемножения (почленного) неравенств одинакового смысла с положительными членами (см. следствие из теоремы 2.32). Рассмотрим произведение αхβ двух целых чисел в том случае, когда один из множителей отрицателен, а другой отличен от 0. Пусть α<0, β>0. Тогда αхβ=(-|α|)хβ=-(|α|хβ)<0. Аналогично, при α>0, β<0 получим: αхβ= -(αх|β|)<0. Если, наконец, α<0 и β<0, то αхβ=(-|α|)х(-|β|)=|α|х|β|. Поэтому, если α0 и β0, можем написать:
| | x | |, åñëè 0, 0 èëè 0, 0 αхβ = (| | x | |), åñëè 0, 0 èëè 0, 0 Отсюда следует, что если α0 и β0, то и αхβ0. Если же αхβ=0, то по крайней мере один из сомножителей равен 0. Теперь легко доказать, что 1-единственный элемент в Z, обладающий свойством III, 3 при α0. В самом деле, пусть α0 и существует число βєZ, для которого αхβ=α. Тогда αхβ=αх1, αхβ-αх1=0, αх(β-1)=0, откуда β-1=0 и β=1. Заметим еще следующее. В множестве N всех натуральных чисел операции вычитания и деления, как обратные соответственно к сложению и умноженияю,-выполнимы не в полном объеме. Так, например, в множестве N разность a-b имеет смысл только при a>b (a=b+k, a,b,kє N). Точно также, например, частное 6/2 имеет смысл в N (6/2=3, так как 6=2х3), а частное 2/3 не имеет смысла. Дополнив множество N до множества Z и распространив операции сложения и умножения на все множество Z, мы добились того, что пара (Z,+) оказалась абелевой группой. Благодаря этому (в силу наличия противоположного элемента –α для каждого элемента αєZ), разность β-α имеет смысл для любой пары α, βєZ. Однако, частное α/β (т.е. такое число γєZ, что α=βхγ) имеет смысл далеко не для каждой пары чисел α, βєZ. Это связано с тем, что ни один элемент βєZ (кроме 1) не обладает в Z обратным элементом β-1=1/ β. Поэтому возникает задача расширения множества Z и распространения операций сложения и умножения на все
78
вновь полученное множество с тем, чтобы в этом множестве без ограничений выполнялась операция деления (кроме деления на 0) и, кроме того, сохранялись все основные свойства I-IV, справедливые для множества Z. В следующем разделе мы покажем, что поставленная задача разрешима. Рациональные числа. В этом разделе целые числа (элементы множества Z) будем обозначать латинскими буквами a,b,c,d… При необходимости подчеркнуть, что рассматриваемые целые числаположительны, мы будем употреблять символы m,n,p,q, r,s… Определим отношение R в декартовом произведении ZxN, полагая (a,m)R(b,n) в том и только в том случае, когда axn=bxm. Ясно, что (a,m)R(a,m) для любой пары (a,m)єZxN. Далее, если (a,m)R(b,n), т.е. axn=bxm, то и (b,n)R(a,m), ибо bxm=axn. Следовательно, отношение R рефлексивно и симметрично. Установим его транзитивность. Пусть (a,m)R(b,n) и (b,n)R(c,p), т.е. имеют место равенства axn=bxm и bxp=cxn. Умножив обе части равенста axn=bxm на число р и воспользовавшись ассоциативностью и коммутативностью умножения целых чисел, будем иметь: (axp)xn=(bxp)xm. Но (bxp)xm=(cxn)xm=cx(nxm)=cx(mxn)=(cxm)xn. Следовательно, (axp)xn=(cxm)xn, откуда axp=cxm (это следует из II, 1 и IV, 2). А это означает, что (a,m)R(c,p), что и доказывает транзитивность отношения R. Итак, R-отношение эквивалентности в ZxN и вдальнейшем вместо (a,m)R(b,n) будем писать (a,m)~(b,n). Этим отношением множество ZxN разбивается на классы эквивалентности, которые будем называть рациональными числами и обозначать (в этом разделе) греческими буквами α,β,γ,...Элементы множества ZxN, т.е. пары (a,m), где aєZ, mєNбудем называть дробями. Каждую дробь (a,m), принадлежащую рациональному числу α, будем называть представлением числа α. 2.35 Теорема. Если дроби (a,m) и (b,n) эквивалентны, то из а>0 следует b>0, из a<0 следует b<0; из a=0 следует b=0. Доказательство. Согласно условию теоремы аxn=bxm. Если a>0, то axn>0, а потому и bxm>0. Так как m>0 (mєN), то целое число b не может быть ни отрицательным, ни нулем. Следовательно, b>0 (II,1). Аналогично рассматриваются случаи а<0 и a=0. 2.36 Определение. (а) Дробь (a,m) будем называть положительной или отрицательной или нулевой в зависимости от того, является ли целое число а положительным или отрицательным или нулем. (b) Рациональное число α будем называть положительным рациональным числом или отрицательным рациональным числом или рациональным числом нуль в зависимости от того, являются ли все представления числа α положительными дробями или отрицательными дробями или нулевыми дробями. 2.37 Теорема. Если (a,m)~(b,n) и целое число а делится на m, то есть существует cєZ такое, что a=mc, то и целое число b делится на n, причем b=nc.
79
Доказательство. Согласно условию теоремы, аxn=bxm и a=mxc. Следовательно, (mxc)xn=bxm, откуда (nxc)xm=bxm и nxc=b (см. 2.34, свойства I, 1, IV,2). 2.38 Замечание. Если целое число а делится на целое число b0, т.е. существует целое число с такое, что а=bхс, то оно единственно. В самом деле, если а=bхс и а=bхс′ (с′єZ), то bxc=bxс′ , откуда следует (2.34), что с= с′. Если а делится b, то число с, для которого а=bхс, называется частным от деления а на b и обозначается а/ b. Число b называется делителем числа а. 2.39 Определение и обозначение. Рациональное число α будем называть целым рациональным числом, если для любого представления (a,m) числа α целое число а делится на m. Если при этом a/m=с, то число α будем также обозначать символом с* (в частности, рациональное число нуль будем обозначать 0*). 2.40 Замечание. Если α и β-различные целые рациональные числа, причем α=с*, β=d* (c,d єZ), то cd. В самом деле, пусть число α представимо дробью (a,m), а число β представимо дробью (b,n). Тогда a=mс, b=nd. Если бы имело место равенство c=d, то (a,m)~(b,n), ибо (mxc)xn=(nxd)xm. Итак, из с=d следует равенство α=β, что противоречит предположению о несовпадени этих чисел. Ясно, что для любого cєZ найдется (единственное) целое рациональное число α, которое можно записать в виде c*. Это число представимо, например, дробью (с,1) и всеми эквивалентными ей дробями. Следовательно, поставив в соответствие каждому целому рациональному числу α целое число c=a/m, где (a,m)любое представление числа α, мы получим биективное отображение множества всех целых рациональных чисел на множество Z всех целых чисел. Все целые положительные рациональные числа можно расположить в последовательность: 1*, 2*, 3*, …,n*,…Все целые отрицательные рациональные числа также можно расположить в последовательность: (1*), (-2*), …,(-n*),…Множество всех рациональных чисел будем обозначать символом Q. Рациональные числа, не являющиеся целыми, будем называть дробными рациональными числами. Например, рациональное число, представимое дробью (3,2), является дробным рациональным числом. 2.41 Определение. Суммой двух дробей (a,m) и (b,n) (в указанном их порядке) называется дробь (axn+bxm, mxn): (a,m)+(b,n)=(axn+bxm, mxn). 2.42 Замечание. Легко видеть, чтосложение дробей коммутативно, ввиду коммутативности сложения и умножения целых чисел. 2.43 Теорема. Если (а1, m1)~(a,m) и (b1,n1)~(b,n), то (a1,m1)+(b1,n1)~(a,m)+b,n. Доказательство. Согласно условию теоремы, имеют место равенства: а1хm=ахm1 и b1хn= bхn1. Требуется доказать, что (a1n1+b1m1)xmn=(an+bm)xm1n1. В самом деле (a1n1+b1m1)xmn= a1n1mn+ b1m1mn=(a1m)x(nn1)+(b1n)хmm1=(am1)x(nn1)+(bn1)(mm1)= (an)х(m1n1)+ (bm)x(m1n1)= (an+bm)х m1n1 ч.т.д.
80
При доказательстве мы воспользовались уже известными свойствами целых чисел. 2.44 Определение. Суммой α+β рационального числа α и рационального числа β называется рациональное число γ, представимое дробью (a,m)+(b,n)=(an+bm, mn), где (a,m)-любое представление числа α, а (b,n)- любое представление числа β (теорема 2.43 показывает, что понятие суммы α+β не зависит от выбора представлений чисел α и β. 2.45 Теорема. Сложение рациональных чисел подчинено законам коммутативности и ассоциативности. Доказательство. Коммутативность сложения рациональных чисел очевидна и опирается на коммутативность сложения дробей. Остановимся подробнее на доказательстве ассоциативности сложения рациональных чисел. Пусть α, β, γ- любые рациональные числа и (a,m), (b,n) и (c,p) суть соответственно какие-либо представления чисел α, β и γ. Тогда α + β представимо дробью (an+bm, mn), a β+γ представимо дробью (bp+cn, np). Далее, рациональное число (α+β)+ γ представимо дробью ((an+bm)p+cmn, mnp), а рациональное число (α+β)+ γ представимо дробью (anp+(bp+cn)m, mnp). Эти дроби, как легко видеть, совпадают (в силу уже известных свойств целых чисел). Следовательно, (α+β)+ γ=α+(β+ γ). 2.46 Теорема. Для любого рационального числа α имеет место равенство α+0*=α. Доказательство. Пусть α представимо дробью (a,m). Так как 0* представимо, например, дробью (0,1), то α+0* представимо дробью (ах1+0хm, mх1). Так как эта дробь совпадает с дробью (a,m), то α+0*= α, и т.д. 2.47 Теорема. Для любого рационального числа α в множестве Q имеется противоположный элемент, т.е. такое рациональное число β, что α+β=0*. Доказательство. Пусть α представимо дробью (a,m). Расмотрим рациональное число β, представимое дробью (-a,m). Сумма α+β представима дробью (am+(-a)xm, m2)=(0, m2), которая является представлением числа 0*. Следовательно, α+β=0*, и т.д. 2.48 Замечание. Итак, пара (Q, +) является абелевой группой, т.е. для рациональных чисел выполняются все свойства I,1-I,4 пункта 2.34. Вместе с ними выполняются и все свойства, являющиеся формально-логическими следствиями основных свойств. Единственность нулевого элемента и единственность противоположного элемента для любого элемента группы доказаны в 1.28 и 1.29. Далее (см. 2.34), обозначив через –α противоположный элемент для любого αєQ, будем иметь: α=-(-α) и –(α +β)= (-α)+(-β). Доказывается существование и единственость разности α- β для любых α,βєQ, т.е. такого числа γєQ, что α=β+γ (γ=α+(-β)). Доказывается также справедливость равенств α-α=0 и 0-α=-α для любого αєQ. 2.49 Определение. Пусть α и β-различные рациональные числа. Будем говорить, что α меньше β (или β больше α) и писать α<β (или β>α) в
81
том и только в том случае, когда β-α является положительным рациональным числом. 2.50 Теорема. Для каждой пары рациональных чисел α и β имеет место одно и только одно из сотношений α=β, α<β, β<α. Доказательство. Рациональное число β-α представимо дробью (b,n)+(-a,m)=(bm-an, nm), где (a,m) и (b,n) суть представления чисел α и β сответственно. Число α-β представимо дробью (an-bm, nm). Согласно 2.34 (II,1), имеет место одно и только одно из соотношений: an=bm, an0an 0bm 0 и α<β. При этом соотношения α=β, β<α не имеют места, ибо α=ββ-α=0 bm-an=0 bm=an, и β<αan-bm>0 bm 0. 2.52 Замечание. Из 2.50 и 2.51 следует, что отношение «<» («>») есть совершенное упорядочение в множестве Q всех рациональных чисел. 2.53 Теорема. Если α, β, γ- рациональные числа и α<β, то α+γ<β+γ. Доказательство. (β+γ)-(α+γ)=(β+γ)+[-(α+γ)]=(β+γ)+[(-α)+(γ)]=(β+γ)+[(-γ)+(-α)]=[(β+γ)+(-γ)]+(-α)=[β+(γ+(-γ)]+(-α)=(β+0*)+(-α)=β-α. Так как α<β, то β-α есть положительное рациональное число. Следовательно, и (β+γ)-(α+γ) есть положительное рациональное число, т.е. α+γ<β+γ. 2.54 Замечание. Итак, для рациональных чисел выполняются не только свойства I,1-I,4 пункта 2.34, но и свойства II,1, II,2, II, 3. Вместе с ними выполняются и все свойства, вытекающие из указанных как формально-логические следствия. Как и в 2.34, доказывая, что неравенство α<β равносильно каждому из неравенств β-α>0, α-β<0, -α>-β. Запись α>0 (α<0) равносильно утверждению, что α есть положительное (отрицательное) рациональное число. Доказывается также, что неравенства одинакового смысла можно почленно складывать. Как и в 2.34 вводится понятие абсолютной величины (модуля) рационального числа:
82
, åñëè 0 |α| = , åñëè 0 Ясно, что при α<0 α=-|α|. С использованием понятия абсолютной величины числа можно ( как и в 2.34) следующим образом выразить сумму α+β двух рациональных чисел в случае, когда хотя бы одно из них отрицательно: (| | | |) ïðè 0, 0 α+β = (| | ) ïðè 0, 0 | | | | ïðè 0, | | Отсюда следует (так как при α0, β0 будет |α+β|=α+β=|α|+|β|, что для любых рациональных чисел α и β |α+β|≤|α|+|β|. Заметим еще, что целое отрицательное рациональное число (-p)* (pєN) можно записать в виде (-p*). В самом деле, число α=(-p)* представимо дробью (a,m), для которой a/m=-p. Отсюда a=(-p)xm=-(pm), -a=pm. Число –α представимо дробью (-a,m)=(pm, m) и потому –α= p* и α= -p* ч.т.д. Итак, целые отрицательные рациональные числа можно расположить в последовательность -1*, -2*, …,-n*,… 2.55 Определение. Произведением дробей (a,m) и (b,n) ( в указанном их порядке) будем называть дробь (ab, mn). 2.56 Теорема. Если (a1m1)~(a,m) и (b1,n1) ~ (b,n) , то и произведение дробей (a1m1) и (b1,n1) эквивалентно произведению дробей (a,m) и (b,n): (a1b1 , m1n1) )~(ab, mn) Доказательство. Согласно условию теоремы, имеют место равенства a1m=am1 и b1n= bn1, откуда (a1m)х( b1n)= (am1)х(bn1) или (используя коммутативность и асоциативность умножения целых чисел) (a1b1)х (mn)= (ab)х (m1n1) ч.т.д. 2.57 Определение. Пусть α и β- рациональные числа, представимые дробями (a,m) и (b,n) соответственно. Произведением α х β числа α на число β будем называть рациональное число, представимое дробью (ab,mn)-произведением дробей (a,m) и (b,n) (согласно теореме 2.56, произведение α х β не зависит от выбора представлений чисел α и β). 2.58. Теорема. Умножение рациональных чисел подчинено коммутативному и ассоциативному законам. Доказательство. Пусть α, β, γ- любые рациональные числа, представимые дробями (a,m), (b,n) и (c,p) соответственно. Тогда α х β представимо дробью (ab,mn), а число βхα представимо дробью (ba,nm). Так как эти дроби совпадают, то α х β=βхα, что и доказывает коммутативность умножения рациональных чисел. Далее, рациональное число (αхβ)хγ представимо дробью ((ab)xc, (mn)xp), а число αх(βхγ) представимо дробью (ax(bc), mx(np)). Так как эти дроби совпадают, то (αхβ)хγ= αх(βхγ), что и доказывает ассоциативность умножения рациональных чисел.
83
2.59 Теорема. Для любого рационального числа α имеет место равенство: αх1*= α. Доказательство. Пусть α представимо дробью (a,m). Так как 1* представимо, например, дробью (1,1), то αх1* представимо дробью (ах1, mх1)=(а,m). Следовательно, αх1*= α, что и требовалось доказать. 2.60 Теорема. Для любого рационального числа α0* в множестве Q имеется обратный элемент , т.е. такое рациональное число β, что αхβ=1*. Доказательство. Пусть α представимо дробью (a,m). Так как α0*,то а0, т.е. либо а>0, либо а<0. Рассмотрим сперва случай, когда а>0, т.е. ає N. В этом случае в качестве β возьмем рациональное число, представимое дробью (m,а). Тогда αхβ представимо дробью (am, ma), т.е. αхβ=1*. Пусть теперь а<0, т.е. а=-|а|. В этом случае в качестве β возьмем рациональное число, представимое дробью (-m,|а|). Тогда αхβ представимо дробью (ах(-m), m|a|)=((-a)xm, mx|а)=(|а|xm, mx|а|), т.е. αхβ=1*. 2.61 Замечание. Как следует из доказанного, для рациональных чисел выполняются все свойства I, II, III пункта 2.34. Более того (так как из α0* и β0* следует, очевидно, что и αхβ0*), множество всех рациональных чисел, отличных от 0*, составляет группу относительно операции умножения рациональных чисел. Роль нейтрального относительно умножения элемента в этой группе играет 1*. Единственность неутрального элемента группы и единственность обратного элемента для каждого элемента группы доказаны в 1.28 и 1.29. В согласии с 1.30, обратный элемент для рационального числа α0* будем обозначать символом α-1. Как следует из доказательства теоремы 2.60, если α представимо дробью (a,m) и а>0, то α-1 представимо дробью (ma); если же а<0, то α-1 представимо дробью (-m, |a|)=(-m, -a). Как показывает следующая теорема, в множестве Q без ограничений выполнима операция деления (кроме деления на 0*). 2.62 Теорема. Любое рациональное число α можно разделить на любое, отличное от 0*, рациональное число β, т.е. существует и единственно такое рациональное число γ, называемое частным от деления α на β, что α=βхγ Доказательство. Беря в качестве γ рациональное число β х α, будем иметь: βхγ=βх(β-1хα)=(βх β-1)α=1*хα=αх1*=α. Этим доказано существование частного от деления α на β. Для доказательства его единственности предположим, что α=βхγ и α=βхγ′. Тогда βхγ= βхγ′ и β-1х (βхγ)= β-1х (βхγ′), откуда γ =γ′. Теорема доказана. 2.63 Замечание и обозначение. Частное от деления α на β (α, β єQ, β0*) будем обозначать α/β. Так как βхβ-1=1*, то β-1=1*/ β и β=1*/ β-1. Как следует из доказательства теоремы 2.62, α/β=αх β-1. -1
84
2.64 Теорема. Всякое рациональное число можно представить в виде частного от деления целого рационального числа на целое положительное рациональное число. Доказательство. Пусть α-любое рациональное число, представимое, например, дробью (a,m). Убедимся, что α=а*/m*. В самом деле, так как m* представимо дробью (m,1), то α хm* прдеставимо дробью (am,m)~(a,1). Но дробь (a,1) является представлением числа a*. Следовательно a*= αxm*, откуда α =a*/m* ч.т.д. 2.65 Теорема. Если dєN и d является общим делителем целых чисел а и b0 (т.е d является делителем как числа а, так и числа b), то а*/b*=a1*/b1*, где a1=a/d, b1=b/d Доказательство. Целое рациональное число а* представимо дробью (а,1), а число b*-дробью (b,1). Если b>0, то (b*)-1 представимо дробью (1,b) и частное a*/b* представимо дробью (a,b). При этом b1>0 и частное а1*/ b*1 представимо дробью (а1, b1). Но (a,b)~( а1b1), ибо axb1=(a1xd)xb1= (a1b1)xd и а1b=a1х(b1xd)= (a1хb1 )xd. Следовательно, в рассматриваемом случае (b>0) а*/b*=a1*/b1*. Случай b<0 представляется рассмотреть читателю. 2.66 Замечание. Из существования и единственности частного, а также из ранее доказанных свойств умножения рациональных чисел, вытекает ряд формально-логических следствий, которые сформулированы в следующей теореме. При доказательстве мы пользуемся очевидным равенством (αхβ)-1=β-1хα-1 (α0*, β0*). Кроме того, в целях удобства мы иногда пользуемся знаком «:» для обозначения частного от деления одного рационального числа на другое. 2.67 Теорема. Пусть α, β, γ, δ-рациональные числа. Тогда: (а) если β0* и δ0*, то равенства α/β=γ/δ и αхδ=βхγ равносильны; (b) если β0* и δ0*, то (α/β)х(γ/δ)=(αхγ)/(βхδ) (в частности (α/β)хγ=(αхγ)/β; (с) если β, γ, δ отличны от 0*, то (α/β): (γ/δ)=(αхδ)/(βхγ) (в частности (α/β):γ=α/(βхγ). Доказательство. (а) α/β=γ/δαхβ-1=γхδ-1(αхβ-1)х(βхδ)=(γхδ-1)х (βхδ)αхδ=βхγ; (b) (α/β)х(γ/δ)=(αхβ-1)х(γхδ-1)=(αхγ)х(β-1хδ-1)=(αхγ)х(βхδ)-1= =(αхγ)/(βхδ); в частности (α/β)хγ=(α/β)х(γ/1*)=(αхγ)/(βх1*)=(αхγ)/β; (с) из (b) следует, что (γ/δ)-1=δ/γ, ибо (γ/δ)х(δ/γ)= (γхδ)/(δхγ)=1*. Поэтому (α/β):(γ/δ)= (α/β)х(γ/δ)-1=(α/β)х(δ/γ)=(αхδ)/(βхγ). В частности, (α/β):γ=(α/β): (γ/1*)=( αх1*)/(βхγ)= α/(βхγ). 2.68 Теорема. Сложение и умножение рациональных чисел связаны законом дистрибутивности, т.е. для любых α, β, γєQ (α+β)хγ=αхγ+βхγ. Доказательство. Пусть α, β, γ представимы дробями (a,m), (b,n) и (c,p) соответственно. Тогда число α+β представимо дробью (an+bm, mn), а число (α+β)хγ представимо дробью ((an+bm)хс, (mn)хр)=(anc+bmc, mnp) ( мы пользуемся известными свойствами арифметических операций над целыми числами). Далее, числа αхγ и βхγ представимы дробями (ас, mp) и
85
(bc, np) сответственно, а число αхγ+βхγ представимо дробью (acnp+bcmp, mnp2)=((anc+bmc)p, mnp2). Но (anc+bmc, mnp)~((anc+bmc)p, mnp2), ибо (anc+bmc)х mnp2= (anc+bmc)хpх mnp. Следовательно, (α+β)хγ и αхγ+βхγ представимы эквивалентными дробями, а потому (α+β)хγ= αхγ. 2.69 Теорема Если α, β, γ- рациональные числа, причем α<β и γ>0, то αхγ<βхγ. Доказательство. Произведение двух положительных рациональных чисел, очевидно, положительно. Так как β-α>0 и γ>0, то и (β-α)хγ>0, откуда αхγ+(β-α)хγ>αхγ, [α+(β-α)]хγ>αхγ, βхγ>αхγ, ч.т.д. 2.70 Замечание. Как видим, для рациональных чисел выполняются свойства I-IV пункта 2.34. К основным свойствам рациональных чисел следует отнести также свойство, выражаемое теоремой 2.60 (позволяющее доказать существование и единственность частного α/β при β0*). Следующее свойство является формально-логическим следствием основных: α/β+γ/δ=(αхδ+βхγ)/(βхδ) (β0*, δ0*). В самом деле, α/β+γ/δ=αхβ-1+γхδ-1=(αхδ)х (δ-1хβ-1)+ (βхγ)х(β-1δ-1)= (αхδ+βхγ)х(βхδ)-1==(αхδ+ βхγ)/ (βхδ), ч.т.д. Отсюда следует, что при β0 α/β+γ=α/β+γ/1*=(αх1*+βхγ)/(βх1*)=(α+βхγ)/β. Завершая этот раздел, убедимся в том, что целые рациональные числа можно отождествить с целыми числами-элементами множества Z. В самом деле, пусть с* и d*-любые целые рациональные числа (c,dєZ). Они представимы соответственно дробями (c,1) и (d,1). Поэтому c*+d* представимо дробью (cx1+dx1, 1x1)=(c+d,1) и, следовательно, c*+d*=(c+d)*. Далее с*xd* представимо дробью (cxd, 1x1)=(cxd,1), так что c*xd*=(cxd)*. Итак, при замене любых целых чисел c и d соответствующими целыми рациональными числами c*и d*-сумма и произведение чисел сохраняются. Покажем, что при этом и порядок чисел сохраняется. Действительно, c*-d*=c*+(-d*). Это число представимо дробью (c,1)+(-d,1)=(cx1-dx1, 1x1)=(c-d,1). Отсюда следует, что с*
86
I, 2 (α+β)+γ=α+(β+γ) для любых α, β, γєQ; I , 3 существует число 0єQ такое, что α+0=α для любого αєQ; I, 4 для любого αєQ существует (в множестве Q) число, обозначаемое –α и называемое противоположным к α, такое, что α +(-α)=0 Эти свойства означают, что пара (Q,+) является абелевой группой. Основные свойства рациональных чисел, относящиеся к сочетанию их с помощью знаков равенства и неравенства, таковы: II, 1 для каждой пары рациональных чисел α и β имеет место одно и только одно из соотношений α=β, α<β, β<α; II, 2 из α<β и β<γ следует α<γ (α, β, γєQ); II, 3 из α<β следует α+γ<β+γ (α, β, γєQ). Перечислим теперь основные свойства рациональных чисел, относящиеся к их умножению: III, 1 αхβ=βхα для любых α,βєQ; III, 2 (αхβ)хγ=αх(βхγ) для любых α, β, γєQ; III, 3 существует число 1єQ такое, что 0<1 (1>0) и αх1= α для любого αєQ; III, 4 для любого α0 существует (в множестве Q) число, обозначаемое α-1 и называемое обратным к α, такое, что αхα-1=1 Одно из следующих двух основных свойств связывает умножение со сложением, а второе связывает знак “<” со знаком произведения: IV, 1 (α+β)хγ= αхγ+βхγ для любых α, β, γєQ; IV, 2 из α<β и γ>0 следует αхγ< βхγ. Все основные свойства I-IV доказаны выше. При их доказательстве мы опирались на определение понятий «рациональное число», «положительное рациональное число», «отрицательное рациональное число», «рациональное число нуль», а также на определения понятий «сумма двух рациональных чисел», «рациональное число α меньше рационального числа β», «произведение двух рациональных чисел.» Выведем теперь ряд формально-логических следствий из основных свойств (см. также 2.34, 2.67 и начало пункта 2.70). При этом мы можем вовсе не знать, что такое рациональное число, что означает α+β или αхβ или α<β-мы будем опираться только на основные свойства I-IV. 1) Число 0 со свойством I,3 единственно. В самом деле, если α+0= α и α+θ= α для любого αєQ, то θ +0= θ и 0+ θ =0, откуда, (в силу I,1) θ =0, ч.т.д. 2) Для любого αєQ число -α со свойством I,4- единственно. В самом деле, если α+β=0 и α+γ=0, то γ+(α+β)=γ+0, (γ+α)+β=γ, (α+γ)+β=γ, 0+β=γ, β+0=γ, β=γ ч.т.д. 3) Для любого αєQ α=-(-α). Действительно, так как α+(-α)=0, то ( в силу I,1) (-α)+α=0, откуда (ввиду единственности противоположного числа) α=-(-α), ч.т.д.
87
4) Для любых α, βєQ –(α+β)=(-α)+(-β). Это доказывается следующим образом: (α+β)+[(-α)+(-β)]=[(α+β)+(-α)]+(-β)=[(-α)+(α+β)]+(-β)= =[(-α)+α]+β+(-β)=(0+β)+(-β)=β+(-β)=0. 5) Для любых α, βєQ существует единственное число γ=α+(-β), такое, что β+γ=α (это число обозначается α-β и называется разностью чисел α и β). Доказательство существования: β+[α+(-β)]=β+[(-β)+α]=[β+(-β)]+ α=0+ α= α+0= α. Доказательство единственности: если β+γ=α, то (-β)+(β+γ)=(-β)+α, [(β)+β]+γ=α+(-β), 0+γ=α+(-β), γ=α+(-β). Следствие: для любого αєQ α-α=0 и 0-α=-α. Свойства 1)-5) вытекают из основных свойств I,1-I,4. 6) Неравенство α<β равносильно каждому из неравенств β-α>0, α-β<0, α>-β. В самом деле, если α<β, то α+[(-α)+(-β)]<β+[(-α)+(-β)] (свойство II, 3), откуда [α+(-α)]+(-β)<β+[(-β)+(-α)], 0+(-β)<[β+(-β)]+(-α), -β<0+(α) и -β<-α или -α>-β. Итак, из α<β следует -α>-β. Если же имеет место неравенство -α>-β, то прибавляя к обеим частям α+β, придем к неравенству β>α или α<β. Следовательно неравенство α<β равносильно неравенству -α>-β. Подобным же образом доказывается равносильность неравенства α<β каждому из неравенств β-α>0, αβ<0. Следствие: из α>0 следует -α<0 и из α<0 следует -α>0. 7) Если α<β и γ<δ, то α+γ<β+δ. Действительно, в силу II, 3 из α<β следует α+γ<β+ γ, а из γ<δ следует γ+β<δ+β. Поэтому, используя I,1 и II,2, получаем: α+γ<β+δ, ч.т.д. Следствие: если α<0 и γ<0, то α+γ<0; аналогично из α>0 и γ>0 следует α+γ>0. 8) Определеим понятие абсолютной величины (или модуля) рационального числа формулой: , åñëè 0 |α| = , åñëè 0 Утверждается, что для любого αєQ |-α|=|α|, α≤|α| и -α≤|α|. Кроме того, для любых α, βєQ |α+β|≤|α|+|β|. В самом деле, если α≥0, то |α|=-(-α)=α=|α| и -α≤0≤α=|α|, так что -α≤|α|. Если же α<0, то |-α|=-α=|α| и α<0<|α|, так что α<|α|. Таким образом, во всех случаях |-α|=α, α≤|α|, -α≤|α|. Установим теперь, что для любых α, βєQ |α+β|≤|α|+|β|. Действительно, если α+β≥0, то |α+β|=α+β≤|α|+|β|. Если же α+β<0, то |α+β|=-(α+β)=(-α)+(-β)≤|α|+|β|. Итак, во всех случаях |α+β|≤|α|+|β|, ч.т.д. Следствие: для любых α, βєQ |α-β|≥||α|-|β||. В самом деле, |α|=|(αβ)+β|≤|α-β|+|β|, откуда |α-β|≥|α|-|β|. Аналогично |β-α|≥|β|-|α|. Так как
88
|β-α|=|α-β| и одно из чисел |α|-|β|, |β|-|α| равно ||α|-|β||, то |α-β|≥||α||β||, ч.т.д. Свойства 6)-8) вытекают из основных свойств I,1-I,4 и II,1-II,3. 9) Кроме 1, в множестве Q нет другого элемента, нейтрального относительно умножения на любое число αєQ. В самом деле, пусть наряду с равенством αх1=α выполняется и равенство αхе=α при любом αєQ. Тогда ех1=е и 1хе=1, откуда ( в силу III, 1) е=1. Другое доказательство: если равенство αхе=α выполняется хотя бы при одном α0, то α-1х(αхе)= α-1хα, откуда (α-1хα)хе= α-1хα и е=1. 10) Для любого α0 (αєQ) в множестве Q есть только один обратный элемент, т.е. если αхβ=1, то β=α-1. Действительно, если αхβ=1, то α-1х(αхβ)= α-1х1 или (α-1хα)х β= α-1, откуда 1хβ= α-1 и β= α-1 ч.т.д. 11) Любое число αєQ можно разделить на любое, отличное от 0, число βєQ, т.е. сущестсвует и единственно такое число γєQ (называемое частным от деления α на β), что α=βхγ. Это число γ обозначается символом α/β и выражается следующим образом: α/β= αхβ-1. Доказательство этого утверждения приведено в 2.62. Свойства 9)-11) вытекают из основных свойств III,1-III,4. 12) Имеет место распределительное свойство умножения относительно разности: (α-β)хγ=αхγ-βхγ (α, β, γєQ) В самом деле, так как α=(α-β)+β, то αхγ=[(α-β)+β]хγ или (в силу IV, 1) αхγ=(α-β)хγ+βхγ. Отсюда (α-β)хγ=αхγ-βхγ ч.т.д. 13) для любого αєQ αх0=0. Действительно, так как 1+0=1, то (1+0)хα=1хα или 1хα+0хα=1хα. Следовательно, 0хα=α-α=0. Ввиду коммутативности умножения, и αх0=0. 14) Если αхβ=0 (α, βєQ), то по крайней мере одно из чисел α, β равно 0. В самом деле, если, скажем, α0, то α-1х(αхβ)=α-1х0, откуда (α-1хα)хβ=0, 1хβ=0, т.е. β=0, ч.т.д. 15) Если α0 и β0 (α, βєQ), то и αхβ0, причем (αхβ)-1=β-1хα-1 (=α-1хβ-1). Действительно, неравенство αхβ0 следует из 14), а равенство (αхβ)-1= =β-1хα-1 следует из единственности обратного элемента и очевидного равенства (αхβ)х(β-1хα-1)=1 Заметим, что из 15) и III,1-III,4 следует, что множество всех отличных от 0 элементов из Q образует абелеву группу относительно операции умножения. 16) Если α, β, γєQ, причем β0, γ0, то (αхγ)/(βхγ)=α/β В самом деле, (αхγ)/(βхγ)=(αхγ)х(βхγ)-1= (αхγ)х(γ-1хβ-1)= αхβ-1= α/β. 17) Если α, β, γ, δєQ, причем β0 и δ0, то (а) равенства α/β=γ/δ и αхδ=βхγ равносильны.
89
(b) (α/β)х(γ/δ)=(αхγ)/(βхδ) (в частности, при δ=1, (α/β)хγ=(αхγ)/β. (с) α/β: γ/δ=(αхδ)/(βхγ) при дополнительном условии γ0 (в частности, при δ=1, α/β:γ=α/(βхγ). (d) α/β+γ/δ=(αхδ+βхγ)/(βхδ). Доказательство этих утвеждений приведено в 2.67 и в начале пункта 2.70. Из (d) следует (если взять δ=1), что α/β+γ= (α+βхγ)/ β; кроме того, при δ=β получаем: α/β+ γ/β=(αхβ+γхβ)/(βхβ)=((α+γ)хβ)/(βхβ)=(α+γ)/β. 18). Если α> 0 и β>0 (α, βєQ), то и αхβ>0. В самом деле, из IV, 2 следует, что 0хβ<αхβ, т.е. 0<αхβ или αхβ>0 ч.т.д. 19). Если α<0 и β>0, то αхβ<0. Доказательство аналогично приведенному в 18. 20). Если α>0, то и α-1>0; если α<0, то и α-1 <0. В самом деле, αхα-1=1 >0. В силу 13), α-1 0. Если α>0, то не может быть α-1 <0 (в силу 19)). Следовательно (см. II, 1), при α>0 обязательно и α-1 >0. Аналогично доказывается, что при α<0 и α-1<0. 21). Для любых α, βєQ (-α)хβ=-(αхβ) и (-α)х(-β)=αхβ. Действительно, αхβ+(-α)хβ=[α+(-α)]хβ=0хβ=0, откуда (-α)хβ=-(αхβ). Далее, (-α)х(-β)=[αх(-β)]=-[-(αхβ)]=αхβ, ч.т.д. 22) Если α<0 и β<0, то αхβ>0. Действительно, -β>0 и поэтому (IV, 2) αх(-β)<0, откуда –(αхβ)<0 и αхβ>0, ч.т.д. 23) Если α0, то α2= αхα>0. Это непосредственно следует из 18) и 22). 24) Если α0 и β0, то частное α/β «имеет тот же знак», что и произведение αхβ. В самом деле, α/β=(αхβ)/β2= (αхβ)х(β2)-1. Так как β2>0, то и (β2)-1>0 (см.20)). Поэтому если αхβ>0, то α/β>0; если же αхβ<0, то и α/β<0. 25) Если α0 и β0, то αхβ = |α|х|β|, если α>0, β>0 или α<0, β<0 -(|α|х|β|), если α>0, β<0 или α<0, β>0 Действительно, если α>0 и β>0, то α=|α|, β=|β| и αхβ=|α|х|β|. Если α<0 и β<0, то α=-|α|, β=-|β| и по-прежнему αхβ=(-|α|)х(-|β|)=|α|х|β| (см. 21)). Пусть теперь α>0, β<0. Тогда α=|α|, β=-|β|, αхβ=|α|х(-|β|)=-(|α|х|β|). Аналогично рассматривается случай α<0, β>0. 26) Если α<β (α, βєQ), то найдется такое γєQ, что α<γ<β. Этому условию (свойство плотности множества рациональных чисел) удовлетворяет, например, число γ=(α+β)/2 (2=1+1, 2єQ). В самом деле, (α+β)/2-α=(α+β)/2+(-α)=((α+β)+2х(α))/2=((α+β)+(1+1)х(-α))/2=((α+β)+(-α)+(-α))/2=(β-α)/2. Так как β-α>0 и 2>1>0, то (α+β)/2-α>0 или α<(α+β)/2. Аналогично доказывается, что (α+β)/2 <β. На этом мы закончим перечисление формально-логических следствий основных свойств I-IV. В заключение установим еще одно основное свойство рациональных чисел, не являющееся следствием
90
свойств I-IV. А именно, докажем справедливость так называемой «аксиомы Архимеда»: каковы бы ни были рациональные числе α>0 и β>0, найдется натуральное число m такое, что mхα>β. Справедливость этого утверждения при α≥β очевидна. Пусть 0<α<β и пусть число β/α представимо дробью (a,n), где a,nєN (ибо β/α>0). Согласно 2.64, имеет место равенство β/α=a/n. По теореме 1.66 найдется натуральное число m такое, что mxn>a, откуда m>a/n или m>β/α, что равносильно неравенству mхα>β. Действительные (вещественные) числа. Расширение множества N сперва до множества Z, а затем и до множества Q всех рациональных чисел, позволяет без ограничений производить четыре арифметических операции (исключается только деление на нуль). Следует заметить, что в практических вычислениях используются исключительно рациональные числа, так что для потребностей практики рациональных чисел вполне достаточно. Однако, потребности самой математики приводят к необходимости расширения области рациональных чисел. Попытаемся, например, оставаясь в области рациональных чисел, решить важнейшую задачу измерения отрезков. Это означает, что, выбрав некоторый отрезок ℓ0-единицу измерения длин, мы попытаемся каждому прямолинейному отрезку ℓ поставить в сответствие некоторое положительное рациональное число d (ℓ) так, чтобы : 1)наперед выбранный отрезок имел длину 1, т.е. d (ℓ0)=1; 2)конгруэнтные отрезки имели одну и ту же длину; 3)длина суммы двух любых отрезков ℓ1 и ℓ2 всегда равнялась сумме длин складываемых отрезков, т.е. d(ℓ1+ℓ2)= d(ℓ1)+ d(ℓ2) Допустим, что поставленная задача имеет решение и каждому отрезку ℓ действительно поставлено в соответствие положительное рациональное число d (ℓ), удовлетворяющее условиям 1), 2), 3). Выберем произвольный отрезок ℓ=АВ и представим его длину d(ℓ) в виде частного р/q (p,qє N): d(ℓ)= р/q (см. 2.64). Разделим отрезок ℓ0 на q конгруэнтных между собой частей и пусть ℓq-один из полученных конгруэнтных между собой отрезков. Используя 1), 2) и 3), заключаем, что d(ℓq)=1/q. Отложим теперь на прямой, содержащей отрезок ℓ=АВ, от точки А в направлении точки В р отрезков, конгруэнтных отрезку ℓq, так, чтобы начало каждого следующего отрезка совпадало с концом предыдущего (и чтобы эта точка была единственной общей точкой указанных отрезков). Пусть В1-конец рго отрезка. Тогда А В1 представляет собой сумму указанных р отрезков и потому (на основании 2) и 3)) d(А В1)=рхd(ℓq)= р/q. Исходя из этого, легко заключить (рассуждая «от противного»), что точка В1 совпадает с В. Следовательно, отрезок ℓq укладывается целое число раз в отрезке ℓ0 ( а
91
именно-q раз) и целое число раз- в отрезке ℓ (р раз), т.е. ℓq является, как говорят, общей мерой отрезков ℓ0 и ℓ.. Два отрезка, имеющие общую меру, называются соизмеримыми. Согласно доказанному, если задача измерения отрезков разрешима с помощью одних только рациональных чисел, то при надлежащем выборе отрезка ℓ0 (единицы измерения длин) любой отрезок ℓ окажется соизмеримым с ℓ0. Но из геометрии известно, что при любом выборе эталона длины ℓ0 найдутся отрезки, несоизмеримые с ℓ0, т.е. не имеющие с ℓ0 общей меры. Следовательно, оставаясь в области рациональных чисел, решить задачу измерения отрезков невозможно. Приведем краткое доказательство существования отрезка, несоизмеримого с любым данным отрезком. Примем данный отрезок АВ за катет равнобедренного прямоугольного треугольника и докажем, что гипотенуза АС этого треугольника несоизмерима с АВ (см. рис).
Допустим противное. Тогда существует отрезок ε, который целое число раз укладывается в АВ и некоторое другое целое число раз укладывается в АС. Отложим на гипотенузе АС отрезок АД, конгруэнтный АВ, и проведем ДЕАС. Легко убедиться (это предоставляется читателю), что отрезки ДС, ДЕ и ВЕ конгруэнтны между собой и что на каждом из них отрезок ε укладывается целое число раз. Поэтому и на отрезке ЕС отрезок ε укладывается целое число раз. При этом ДС<EC<ВС. Итак, если отрезок ε является общей мерой катета и гипотенузы равнобедренного прямоугольного треугольника АВС, то он является также общей мерой катета и гипотенузы меньшего (т.е. с меньшим катетом) равнобедренного прямоугольного треугольника СДЕ. Применяя к треугольнику СДЕ вышеуказанные рассуждения и построения, мы придем к новому равнобедренному прямоугольному треугольнику, меньшему, чем СДЕ и такому, что его катет и гипотенуза имеют отрезок ε своей общей мерой. Продолжая так и далее, мы построим бесконечную последовательность равнобедренных прямоугольных треугольников, каждый из которых, (начиная со второго) меньше предыдущего. При этом катет и гипотенуза каждого из этих треугольников имеют отрезок ε своей общей мерой. Пусть ℓ1, ℓ2,…, ℓn, …-последовательность катетов указанных треугольников (l1=АВ, l2=СД, …): ℓ1> ℓ2>…> ℓn, … При любом nєN отрезок ε
92
укладывается в отрезке ℓn целое число Рn раз. Так как любое множество, состоящее из натуральных чисел, содержит наименьшее число, то последовательность натуральных чисел Р1, Р2, …, Рn, …содержит наименьшее число. Пусть, например, Рк≤ Рn при любом nєN. Но это невозможно, ибо ℓk> ℓk+1 и потому Рк>Рк+1. Полученное противоречие доказывает, что гипотенуза равнобедренного прямоугольного треугольника действительно несоизмерима с его катетом. Итак, задача измерения отрезков неразрешима, если пытаться каждому отрезку приписать длину, выражаемую рациональным числом. Следовательно, оперируя только рациональными числами, невозможно определить тригонометрические функции многих углов ( в тех случаях, когда для определения этих функций требуется взять отношение «длин» несоизмеримых отрезков). Далее, среди рациональных чисел нет корней (тех или иных степеней) даже из многих целых положительных чисел. Этот факт неприятный и сам по себе, не позволяет разумно определить понятие степени аr , где a,rє Q, а>0. Если мы хотим, чтобы выполнялось свойство ar1xar2=ar1+r2, то, например, «число» 21/2 должно удовлетворять равенству (21/2)2=2, т.е. 21/2 должно быть квадратным корнем из числа 2. Но, как доказывается еще в школьном курсе, такого «числа» среди рациональных чисел не существует. Все приведенные выше соображения (и многие другие, о которых мы еще будем иметь возможность поговорить в процессе изучения действительных чисел) показывают необходимость расширения области рациональных чисел. В настоящем разделе мы ставим себе целью присоединить к рациональным числам объекты новой природы, называемые иррациональными числами, что позволит заполнить пробелы, имеющиеся в системе рациональных чисел. Построение теории иррациональных чисел возможно несколькими способами. Ниже, при построени теории иррациональных чисел, мы излагаем процесс, предложенный Дедекиндом (R-Dedekind). 2.71 Опеределение. Непустое собственное подмножество α множества Q называется сечением в области рациональных чисел (в дальнейшем для краткости будем употреблять просто термин «сечение»), если: 1) из рєα и qq, то и q1- верхнее число сечения α. 2.74 Теорема. Пусть α-сечение, среди верхних чисел которого имеется наименьшее. Утверждается, что если r-наименьшее верхнее число
93
сечения α, то α={рєQ: рр и (p+r)/2єα. Далее ясно, что r- верхнее число сечения α. Если при этом q-другое верхнее число сечения α, то q α и потому q<⁄ r, т.е. q≥ r. Это и доказывает, что r- наименьшее верхнее число сечения α.. На основании теоремы 2.74 можем утверждать, что сечениями вида α={рєQ: р 0 и тогда p>0 и p2<2. При этом из 0 0. Пользуясь «аксиомой Архимеда» для рациональных чисел, найдем натуральное число n так, чтобы выполнялось неравенство n(2p2)>2p+1. докажем, что (p+1/n)2<2. Действительно, 2 2 2 2 2 2 2 (p+1/n) =p +2p/n+1/n ≤p +2p/n+1/n=p +(2p+1)/n< p +(2- p ), т.е. (p+1/n)2<2.
94
Следовательно, p+1/n єα и p+1/n>p, что и доказывает отсутствие в α наибольшего числа. Итак α-действительное число. Чтобы показать, что α-действительное иррациональное число, следует убедиться в отсутствии среди верхних чисел сечения α наименьшего числа. Пусть q-любое верхнее число сечения α, т.е. qєQ и q α. Тогда q>0 и q2>2 (ибо не существует такого рационального q, что q2=2). Пользуясь «аксиомой Архимеда» для рациональных чисел, найдем натуральное число n так, чтобы выполнялось неравенство nx(q2-2)>2q+1↔q2-(2q+1)/n>2. Так как q>1,4, то q-1/n>0. Кроме того, (q-1/n)2=q2-2q/n+1/n2>q2-2q/n-1/n=q2-(2q+1)/n>2. Следовательно q-1/n есть верхнее число сечения α, меньшее, чем q. Это и доказывает отсутствие наименьшего числа среди верхних чисел сечения α. Итак, сечение α доставляет нам пример действительного иррационального числа. 2.78 Теорема. Для любых двух различных сечений α и β либо α является собственным подмножеством β, либо β является собственным подмножеством α. Доказательство. Расмотрим сперва случай, когда αβ. Так как αβ, то в β найдется рациональное число q, не принадлежащее α. Это и означает, что α является собственным подмножеством β. Пусть теперь α β, т.е. найдется рациональное число рєα такое, что р β. Согласно теореме 2.72, все числа сечения β меньше р. Так как α-сечение, то (свойство 1) определения 2.71) все числа сечения β принадлежат α. Но и это означает (учитывая, что рєα, р β), что β является собственным подмножеством α. 2.79 Определение. Пусть α и β-действительные числа (т.е. α и βсечения). Будем говорить, что α меньше β и писать α<β в том и только в том случае, когда α является собственным подмножеством β (для чего необходимо и, как установлено в 2.78, достаточно, чтобы β содержало рациональное число, не принадлежащее α). Если α<β, то будем писать также, что β>α (и говорить: β больше α). Если α>0* (т.е. сечение α содержит некоторые положительные рациональные числа), то действительное число α будем называть положительным , если α<0* (т.е. α содержит только отрицательные, но не все отрицательные рациональные числа), то действительное число α будем называть отрицательным. 2.80 Теорема. Пусть α и β-действительные числа. Тогда либо α=β, либо α<β, либо β<α, причем любое из этих свойств несовместимо с двумя остальными. Это утверждение непосредственно вытекает из теоремы 2.78 и определения 2.79. 2.81 Теорема. Если α, β, γ-действительные числа, причем α<β и β<γ, то α<γ. Доказательство этого утверждения очевидно.
95
2.82 Замечание. Из теорем 2.80 и 2.81 следует, что отношение «<» является совершенным упорядочением в множестве всех действительных чисел. 2.83 Теорема . Пусть α и β-действительные числа. Пусть также γмножество всех рациональных чисел r таких, что r=p+q, где рєα, qєβ. Утверждается, что γ является действительным числом, т.е. сечением в области рациональных чисел. Доказательство. Непустота множества γ очевидна. Так как α и β (будучи сечениями) являются собственными подмножествами множества Q, то найдутся числа p´, qєQ такие,что p´ α, q β. Тогда (2.72) для любого рєα и любого qєβ р<р, q< q, откуда р+ q< р+q. Следовательно р+q не принадлежит множеству γ, т.е. γ-собственное подмножество множества Q. Пусть, далее, r-любое рациональное число, принадлежащее γ, и r1- любое рациональное число, меньшее r (r1< r). Докажем, что r1 єγ. Обозначим r- r1= ε (ε>0), откуда r1=r-ε=(p+q)-ε=p+(q- ε ) при некоторых рєα, qєβ. Так как q-εр. Тогда р +qєγ и р +q> r, что и доказывает отсутствие наибольшего числа в множестве γ. 2.84 Определение. Действительно число γ, фигурирующее в теореме 2.83, называется суммой действительных чисел α и β и обозначается α+β. 2.85 Замечание. Мы используем один и тот же символ «<» для сравнения как рациональных чисел, так и действительных чисел (сечений). Это же замечаение относится и к использованию символа «+», а также к использованию (в дальнейшем) символа «.». Так как при изложении мы всегда указываем к каким именно числам относится тот или иной символ, то противоречий возникнуть не может. 2.86 Теорема. Сложение действительных чисел подчинено законам коммутативности и ассоциативности. Доказательство этого утверждения почти очевидно и предоставляется читателю (оно основывается на справедливости законов коммутативности и ассоциативности сложения рациональных чисел). 2.87 Теорема. Для любого действительного числа α имеет место равенство α+0*=α. Доказательство. Пусть rєα+0*, т.е. r=p+q, где рєα, q<0 (qєQ). Так как α-сечение и r<рєα, то rєα. Следовательно, α+0* α . Пусть теперь pєα. Так как в α нет наибольшего числа, то найдется рєα такое, что р>р. Обозначим ε=р-р (ε>0). Отрицательное рациональное число –ε принадлежит сечению 0*. Поэтому р= р -ε= р+(-ε)єα+0*. Этим доказано, что αα+0*, т.е. (с учетом ранее доказанного включения), что α+0*=α.
96
2.88 Теорема. Для любого действительного числа α и любого рационального числа ε>0 существуют такие рациональные числа р и q, что рєα, q α, q-р=ε и q не является наименьшим из верхних чисел сечения α. Доказательство. Выберем рациональные числа s и t так, чтобы было: sєα, t α. Тогда t-s>0 и по «аксиоме Архимеда» для рациональных чисел найдется натуральное число n такое, что nxε>t-s, откуда s+nxε>t и потому s+nxε α. Пусть m0-наименьшее из тех натуральных чисел m, для которых s+mxε α. При этом возможны два случая. 1) m0=1. Тогда sєα, s+ε α. Если s+ε не является наименьшим верхним числом сечения α, то полагаем р=s, q=s+ε. Если же s+ε является наименьшим из верхних чисел сечения α, то полагаем р=s+ε/2, q=s+3/2хε. 2) m0>1. Тогда s+(m0-1)εєα, s+m0xε α. Если s+m0xε не является наименьшим из верхних чисел сечения α, то полагаем р= s+(m0-1) ε, q= s+m0ε. Если же s+m0ε является наименьшим из верхних чисел сечения α, то полагаем р= s+(m0-1) ε+ ε/2, q=s+m0ε+ ε/2. 2.89 Теорема. Для любого действительного числа α существует такое действительное число β, что α+β=0*. Доказательство. Обозначим через β множество всех таких рациональных чисел р, что –р является верхним числом сечения α, но не наименьшим из верхних чисел. Ясно, что β непусто и является собственным подмножеством Q. Чтобы доказать, что β есть сечение, т.е. действительное число, проверим выполнение условий 1) и 2) определения 2.71. Пусть рєβ и q-p, а так как –р является верхним числом сечения α , то и –q является верхним числом этого сечения (причем не наименьшим верхним числом). Следовательно, qєβ и условие 1) выполняется. Остается доказать, что β не содержит наибольшего числа. Пусть р-любое рациональное число из β. Тогда –р является верхним числом сечения α, но не наименьшим верхним числом. Поэтому найдется меньшее, чем –р, верхнее число сечения α, которое обозначим –q: -q<-p, -q α. Если – q не является наименьшим верхним числом сечения α , то qєβ и q>р. Если же –q является наименьшим верхним числом сечения α, то число ((–q)+(-р))/2, которое обозначим -r, удовлетворяет неравенствам: –q<-r<-p. Следовательно, rєβ и r>р. Итак, для любого рєβ всегда в множестве β имеется число, большее, чем р, что и доказывает выполнение условия 2) определения 2.71. Следовательно β-действительное число. Убедимся в том, что α+β=0*. Пусть rєα+β, т.е. r =р+q, где рєα qєβ. Тогда -q есть верхнее число сечения α и потому р<-q и p+q<0. Следовательно, rє0*, т.е. имеет место включение α+β0*. Обратно, пусть rє0*. Тогда r<0 и ε=-r>0. По теореме 2.88, найдутся такие рациональные числа р и q, что рєα,
97
q α, q-р=ε и q не является наименьшим из верхних чисел сечения α . Следовательно, -qєβ и р+(-q)=-ε=r, откуда rєα+β и 0* α+β. Это и доказывает (с учетом ранее установленного включения α+β0*), что α+β=0*. 2.90 Замечание. Обозначив множество всех действительных чисел символом R, можем заключить (см. теоремы 2.86, 2.87, 2.89), что пара (R, +) представляет собой абелеву группу. Единственность нулевого элемента группы (существование которого доказано в 2.87) и единственность противоположного элемента для любого αєR (существование этого противоположного элемента, который будем обозначать –α, доказано в 2.89) доказаны в 1.28 и 1.29 (см. также 2.70). Легко видеть, что при любом rєQ r*+(-r)*=0* , так что -r*= (r)*. 2.91 Теорема . Для любых α, β, γєR таких, что α<β, имеет место неравенство α+γ<β+γ. Доказательство. Так как α<β, то найдется такое рациональное число q, что qєβ, но q α. Пользуясь тем, что в β нет наибольшего числа, найдем рациональное число q такое, что q> q и qєβ. Пусть ε= q- q (ε>0). По теореме 2.88 найдутся такие рациональные числа r0 и r0, что r0єγ и r0 γ и r0-r0=ε. Убедимся, что рациональное число q+r0, принадлежащее β+γ, не принадлежит сечению α+γ. В самом деле, для любых рациональных р и r таких, что рєα, rєγ, имеем: p+r0*, β>0*. Расмотрим множество γ, состоящее из всех отрицательных рациональных чисел, нуля и всех таких положительных рациональных чисел r, что r=pxq, где рєα, qєβ, р>0, q>0. Утверждается, что γ представляет собой положительное действительное число. Доказательство. Непустота множества γ следует из его определения. Убедимся, что γ является собственным подмножеством множества Q. Пусть r-любое число из γ, р-какое-нибудь верхнее число сечения α и q- какое-нибудь верхнее число сечения β. Так как α и β содержат положительные числа, то р>0, q>0 и рq>0. Поэтому, если r≤0, то r< рq. Если же r>0, то r=pq, где рєα, q єβ, р>0, q>0. При этом р<р, q
98
рq γ и γ действительно является собственным подмножеством множества Q. Проверим выполнение условий 1) и 2) определения 2.71. Пусть rєγ и s0, а s≤0, то принадлежность sєγ следует из определения множества γ. Расмотрим случай r>0 и 0<s 0, q>0. Из 0<s 0 и потому r=pq, где рєα, qєβ, p>0, q>0. Поскольку ни одно из сечений α, β не содержит наибольшего числа, найдутся рациональные числа р 1, q1, такие, что р1єα, q1єβ, p1>р, q1>q. Обозначив r1= p1q1, имеем: r1єγ и r1>рq= r. Полученное противоречие с допущением о том, что r-наибольшее число множества γ, доказывает, что γ не содержит наибольшего числа. Следовательно, γ-сечение, и так как оно содержит положительные рациональные числа, то γ –положительное действительное число. 2.94 Определение. Положительное действительное число γ, фигурирующее в теореме 2.93, называется произведением положительного действительного числа α на положительное действительное число β и обозначается αхβ или αβ. 2.95 Теорема. Умножение положительных действительных чисел подчинено законам коммутативности и ассоциативности, т.е. 1) если α, βєR и α>0*, β>0*, то αхβ=βхα ; 2) если α, β, γєR и α>0*, β>0*, γ>0*, то (αхβ)х γ = αх(βх γ). Доказательство. Коротко остановимся только на доказательстве свойства 2), предоставляя читателю доказательство свойства 1). Пусть sєQ и sє(αхβ)хγ. Если s≤0, то sєαх(βхγ), ибо αх(βхγ)>0*. Рассмотрим случай s >0. В этом случае s=txr, где tєαхβ, rєγ и t>0, r>0. При этом t=pxq, pєα, qєβ, р>0, q>0. Следовательно, s=(pxq)xr. Так как умножение рациональных чисел подчинено закону ассоциативности, то s=px(qxr). Но qxrєβхγ и потому s=px(qxr)є єαх(βхγ). Мы видим, что во всех случаях из sє(αхβ)хγ следует, что sєαх(βхγ). Значит, (αхβ)хγαх(βхγ). Обратное включение αх(βхγ)(αхβ)хγ доказывается аналогично вышеизложенному, так, что (αхβ)хγ=αх(βхγ), ч.т.д. 2.96 Теорема. Для любого положительного действительного числа α имеет место равенство: αх1*=α. Доказательство. Пусть rєαх1*. Если r≤0, то r єα, ибо α>0*. Если же r >0, то r=pxq, где рєα, qє1*, р>0, q>0. Из qє1* следует, что q<1, откуда рхq<р, т.е. r
99
любое рациональное число из α. Если р≤0, то рєαх1*, ибо αх1* есть положительное действительное число. Рассмотрим случай, когда р>0. Пользуясь тем, что α не содержит наибольшего числа, найдем такое число рєα, что р>р. Так как р/р<1, то р/рє1*. Следовательно, р= рх (р/р) єα х1*. Итак, во всех случаях из рєα следует, что рєαх1*. Это доказывает, что ααх1*. Учитывая ранее доказанное включение αх1*α, заключаем, что αх1*=α, ч.т.д. 2.97 Теорема. Для любого положительного действительного числа α существует такое положительное действительное число β, что αхβ=1*. Доказательство. Обозначим через β множество, содержащее все отрицательные рациональные числа, нуль, а также все такие положительные рациональные числа r, что 1/r является верхним числом сечения α, но не наименьшим из верхних чисел этого сечения. Убедимся, что β является собственным подмножеством множества Q. В самом деле, пусть рєα и р>0. Тогда ясно, что (1/р) β, хотя (1/р) єQ. Проверим выполнение условий 1) и 2) определения 2.71. Пусть qєβ, s0, но s≤0,то принадлежность sєβ очевидна. Рассмотрим случай, когда q>s>0. Так как qєβ и q>0, то 1/q является верхним числом сечения α. Но 1/s>1/q (ибо 1/s-1/q=(q-s)/(sxq)>0), так что 1/s также является верхним числом сечения α, но не наименьшим из верхних чисел. Следовательно, sєβ и выполнение условия 1) определения 2.71 доказано. Убедимся, что β не содержит наибольшего числа. Допустив противное, найдем наибольшее число r множества β. Ясно, что r>0, так, что 1/r является верхним числом сечения α, но не наименьшим из верхних чисел этого сечения. Поэтому найдется верхнее число q сечения α такое, что q<1/r и q не является наименьшим верхним числом сечения α (если среди верхних чисел сечения α есть наименьшее число, то для нахождения числа q следует воспользоваться свойством плотности рациональных чисел). Так как α>0*, то q>0 и 1/q єβ. При этом 1/q>r, что противоречит допущению о том, что r является наибольшим числом множества β. Полученное противоречие доказывает выполнение условия 2) определения 2.71. Итак, β-сечение, т.е. действительное число, а так как β содержит положительные рациональные числа, то β-положительное действительное число. Остается доказать справедливость равенства αхβ=1*. Сперва установим включение αхβ1*. Пусть r єαхβ. Если r≤0, то r є1*, так как 1* содержит все рациональные числа, меньшие 1.
100
Если же r>0, то r=pq, где p>0, q>0, pєα, qєβ. Из qєβ следует, что 1/q является верхним числом сечения α. Следовательно, p<1/q и r=pq <1, т.е. rє1*. Итак, во всех случаях из rєαβ следует, что rє1*, откуда αβ1*. Установим теперь обратное включение. Пусть rє1*, т.е. r<1. Если r≤0, то rєαβ, ибо αβ есть положительное действительное число. Если 0r. В самом деле, если p≤r, то вместо p и q можно взять числа p и q такие, что pєα и p>r (ведь α не содержит наибольшего числа), а q=q+(p-p). Итак, будем считать, что выполняются условия: pєα, p>r, q α, q-p=ε и q не является наименьшим из верхних чисел сечения α. Из определения сечения β следует, что 1/qєβ. Тогда p(1/q)єαβ, т.е. p/(p+ε) єαβ. Так как p/(p+ε)-r=((p-r)ε)/( p+ε), то r 1), так что 1/r является верхним числом сечения α, но не наименьшим верхним числом этого сечения. Отсюда и следует (согласно определению множества β), что rєβ. Теперь найдем (аналогично тому, как это сделано в случае 1)) рациональные числа s и t так, чтобы выполнялись условия: sєβ, s>r, t β, t-s=ε (где ε=1-r) и t не является наименьшим верхним числом сечения β. Так как t β, то либо 1/tєα, либо 1/t является наименьшим верхним числом сечения α. Если 1/tєα, то (1/t)sєαβ, т.е. s/(s+ε)єαβ. А так как r< s/(s+ε), то rєαβ. Если же 1/t есть наименьшее верхнее число сечения α, то найдем sєβ так, чтобы s>s и возьмем t=t+( s-s). Тогда t β, t-s= t-s=ε и 1/ t<1/t, т.е. 1/ tєα и s/(s+ε)єαβ. А так как r< s/(s+ε) (s/(s+ε)r=((s-r)ε)/ (s+ε)>0), то и rєαβ. Итак, во всех случаях из rє1* следует, что rєαβ. Следовательно, 1*αβ. Учитывая ранее доказанное включение αβ1*, заключаем, что αβ=1*, ч.т.д. 2.98 Замечание . Из 2.87-2.91 следует, что если αдействительное число и α>0*, то -α<0*. Если же α<0*, то -α>0*. 2.99 Определение. Модулем или абсолютной величиной любого действительного числа α называется действительное число, обозначаемое |α| и определяемое следующим образом:
, åñëè 0 * , åñëè 0 *
| α|=
101
2.100 Определение. Для любого действительного числа α полагаем: α0*=0* и 0*α=0*. Если α и β-любые действительные числа, отличные от 0*, среди которых хоть одно отрицательно, то полагаем: (| || |), åñëè 0*, 0 * èëè 0*, 0 * αβ= | || |, åñëè 0*, 0 * . Заметим, что произведение |α|х|β| определено в 2.94. Из определений 2.100 и 2.94 следует, что равенство αβ=0* (α, βєR) имеет место тогда и только тогда, когда α=0* или β=0*. 2.101 Теорема. Умножение действительных чисел подчинено законам коммутативности и ассоциативности, т.е. для любых α, β, γєR имеют место равенства: αβ=βα и (αβ)γ=α(βγ). Доказательство. Коммутативность умножения действительных чисел почти очевидна и опирается на теорему 2.95 и определение 2.100. Разбор различных случаев предоставляется читателю. Коротко остановимся на доказательстве ассоциативности умножения. Если все числа α, β, γ-положительны, то справедливость равенства (αβ)γ=α(βγ) доказана в 2.95. Если среди чисел α, β, γ хоть одно равно 0*, то из определения 2.100 следует, что (αβ)γ=0* и α(βγ)=0*, т.е. и в этом случае (αβ)γ=α(βγ). Если все числа α, β, γ-отрицательны, то (см. 2.100) (αβ)γ=(|α|х|β|)γ=-[(|α|·|β|)·|γ|] и α(βγ)=α(|β|·|γ|)=-[|α|·(|β|·|γ|)], откуда (см. 2.95) (αβ)γ=α(βγ). Разбор случаев, когда среди чисел α, β, γ имеются два положительных и одно отрицательное или одно положительное и два отрицательных-предоставляется читателю. 2.102 Теорема. Для любого αєR α·1*=α. Доказательство. Если α>0*, то справедливость равенства α·1*=α доказана в 2.96. Если α=0*, то справедливость указанного равенства следует из определения 2.100. Если α<0*, то (см. 2.100) α·1*= -(|α|·1*)=-(-α)=α, т.е. α·1*=α, ч.т.д. 2.103 Теорема. Для любого α≠0 (αєR) существует действительное число, обозначаемое α-1 и называемое обратным к α, такое, что α α-1=1*. Доказательство. Если α>0*, то за α-1 примем число β, определенное при доказательстве теоремы 2.97. Если α<0*, то положим α-1= -|α|-1 и докажем, что α α-1=1*. В самом деле, так как |α|-1>0* (2.97), то -|α|-1<0* и (см. 2.100) α(-|α|-1)= |α|х|α|-1=1*, ч.т.д. 2.104 Замечание. Так как αβ≠0* при α≠0* и β≠0*, то из теорем 2.101-2.103 следует, что множество всех отличных от 0* действительных чисел, рассматриваемое вместе с операцией умножения, представляет собой абелеву группу. Отсюда, в свою очередь, вытекает (см. 1.28 и 1.29) единственность элемента, нейтрального относительно умножения, и единственность обратного элемента α-1 для любого α≠0*.
102
2.105. Лемма. Если α, β, γєR и α>0*, β>0*, γ>0*, то (α+β)γ=αγ+βγ. Доказательство. Докажем сперва, что (α+β)γαγ+βγ. Пусть rє(α+β)γ. Если r≤0, то rєαγ+βγ, ибо αγ+βγ есть положительное действительное число. Если r>0, то (см. 2.93 и 2.94) r=рq, где рєα+β, qєγ, р>0, q>0. При этом p=s+t, sєα, tєβ (см. 2.83 и 2.84). Следовательно, r=(s+t)q. Так как операции сложения и умножения рациональных чисел подчинены закону дистрибутивности, то r=sq+tq, причем sqєαγ, tqєβγ. Поэтому rєαγ+βγ, откуда и следует (ибо r-любое число из (α+β)γ), что (α+β)γαγ+βγ. Теперь установим обратное включение. Пусть rєαγ+βγ. Если r≤0, то rє(α+β)γ, ибо (α+β)γ есть положительное действительноe число. Расмотрим случай, когда r>0. из rєαγ+βγ следует, что r=р+q, где рєαγ, qєβγ. Если одно из чисел р, q окажется ≤0, то либо r≤q и тогда rєβγ(α+β)γ, либо r≤р и тогда rєαγ(α+β)γ. Если же р>0 и q>0, то p=st1 q=ut2, где sєα, uєβ, t1, t2єγ, s>0, u>0, t1>0, t2>0. Обозначим t=max (t1, t2). Тогда tєγ и r=p+q=st1+ut2≤ st+ut. Так как операции сложения и умножения рациональных чисел подчинены закону дистрибутивности, то st+ut=(s+u)tє(α+β)γ. Следовательно, и rє(α+β)γ, ибо r≤ st+ut. Итак, во всех случаях из rєαγ+βγ следует, что rє(α+β)γ. А это и означает, что αγ+βγ(α+β)γ. Учитывая ранее доказанное включение (α+β)γ αγ+βγ, заключаем, что (α+β)γ=αγ+βγ, ч.т.д. 2.106. Теорема. Операции сложения и умножения действительных чисел связаны законом дистрибутивности, т.е. для любых α, β, γєR имеет место равенство (α+β)γ=αγ+βγ. Доказательство. Если хотя бы одно из чисел α, β, γ равно 0*, то равенство (α+β)γ=αγ+βγ становится очевидным (см. 2.87 и 2.100). Будем считать, что все числа α, β, γ отличны от 0*. Расмотрим несколько возможных случаев. 1) α>0*, β>0*. Если при этом γ>0*, то справедливость равенства (α+β)γ=αγ+βγ доказана в 2.105. Если же γ<0*, то (см. 2.100) (α+β)γ=-(|α+β|х|γ|). Пользуясь определением 2.99 и леммой 2.105, находим: |α+β|х|γ|=(α+β)х|γ|= α|γ|+β|γ|. Следовательно, (α+β)γ= -(α|γ|+β|γ|)=[-α|γ|]+[-(β|γ|)]=[-(|α|·|γ|)]+[-(|β|·|γ|)]=αγ+βγ, т.е. (α+β)γ=αγ+βγ. α<0*, β<0*. Если при этом γ>0*, то (так как α+β<0*) (α+β)γ=-(|α+β|х|γ|)=-{[-(α+β)]γ}=-{[(-α)+(-β)]γ}= -[(|α|+|β|)γ]. Применяя лемму 2.105, будем иметь: (α+β)γ=-(|α|γ+|β|γ)= =[-(|α|х|γ|)]+[-(|β|х|γ|)]=αγ+βγ. Если же γ<0*, то (α+β)γ=|α+β|·|γ|= =[-(α+β)]·|γ|=[(-α)+(-β)]·|γ|=(|α|+|β|)·|γ|=|α|·|γ|+|β|·|γ|= αγ+βγ. 2)
103
α>0*, β<0*, α+β>0*. Если при этом γ>0*, то, обозначив α+β=δ, будем иметь: α=δ+(-β), α=δ+|β|, αγ=δγ+|β|γ и αγ+βγ=δγ+(|β|γ+βγ). Но |β|γ+βγ=0*, так как (см. 2.100) βγ= -(|β|х|γ|)=-(|β|γ). Следовательно, αγ+βγ=δγ или (α+β)γ=αγ+βγ. Если же γ<0*, то (α+β)γ=-(|α+β|х|γ|)=-[(α+β)х|γ|], откуда (согласно только что доказанному) (α+β)γ=-(α|γ|+β|γ|)= =[-(α|γ|)]+[-(β|γ|)]. Так как –(α|γ|)=-(|α|х|γ|)=αγ и β|γ|= =-(|β|х|γ|), то (α+β)γ=αγ+{-[-(|β|х|γ|)]}=αγ+|β|х|γ|= αγ+βγ. Аналогично доказывается справедливость утверждения теоремы в случае α<0*, β>0*, α+β>0*. 4) α>0*, β<0*, α+β=0*. В этом случае β=-α, |β|=|-α|=α, (α+β)γ=0*. Если γ>0*, то βγ=-(|β|х|γ|)=-(αγ), откуда αγ+βγ=0*=(α+β)γ. Если γ<0*, то βγ=|β|х|γ|=α|γ|, αγ= =-(|α|х|γ|)=-(α|γ|), откуда αγ+βγ=0*=(α+β)γ. Аналогично доказывается справедливость утверждения теоремы в случае α<0*, β>0*, α+β=0*. 5) α>0*, β<0*, α+β<0*. Если при этом γ>0*, то (α+β)γ= -(|α+β|γ). Так как |α+β|=-(α+β)=(-α)+(-β)=(-α)+|β|, то, согласно вышедоказанному (случай 3), |α+β|γ= =(-α)γ+|β|γ=[(-αγ)]+|β|γ. Следовательно, (α+β)γ=αγ+ +[-(|β|х|γ|)]= αγ+βγ. Если же γ<0*, то (α+β)γ=|α+β|х|γ|=[-(α)+|β|]х|γ|=(-α)|γ|+|β|х|γ|= =(-α)|γ|+βγ=[-(|-α|х|γ|)]+βγ=[-|α|х|γ|]+βγ=αγ+βγ. К этому же результату (ввиду коммутативности сложения) придем и в случае α<0*, β>0*, α+β<0*. Итак, во всех случаях (α+β)γ=αγ+βγ, ч.т.д. 3)
2.107 Теорема. Если α, β, γєR, причем α<β и γ>0*, то αγ<βγ. Доказательство. Из α<β следует (см. 2.91), что β+(-α)>α+(-α) или (2.89, 2.90) β+(-α)>0*. Так как произведение положительных действительных чисел положительно (см. 2.93, 2.94), то [β+(-α)]γ>0*, откуда (2.106) βγ+ +(-α)γ>0*. Прибавляя к обеим частям этого неравенства число αγ (2.91), будем иметь (в силу 2.87 и 2.86): βγ+[(-α)γ+αγ]>αγ. Но (2.106) (-α)γ+αγ=[(-α)+α]γ=0*γ=0* (2.89, 2.90 и 2.100). Следовательно, βγ+0*>αγ, откуда (2.87) αγ<βγ, ч.т.д. 2.108 Замечание. Теоремы 2.86, 2.87, 2.89, 2.80, 2.81, 2.91, 2.101, 2.102, 2.103, 2.106, 2.107 показывают, что для действительных чисел выполняются все основные свойства I,1-I,4, II,1-II,3, III,1-III,4, IV,1, IV,2, справедливые для рациональных чисел (см. 2.70), Следовательно, для действительных чисел справедливы и все
104
свойства 1)-26) пункта 2.70, являющиеся формально-логическими следствиями основных. 2.109. Теорема. Если α и β-действительные числа, причем α<β, то существует действительное рациональное число r* такое, что α< r*<β. Доказательство. Так как α<β, то найдется рациональное число р такое , что рєβ, р α. Пользуясь тем, что в β нет наибольшего числа, найдем такое рациональное число r, что r>p и rєβ. Тогда рє r*, но р α, откуда следует (2.78), что α< r*. А так как rєβ, но r r*, то r*<β. Итак α< r*<β, ч.т.д. 2.110. Замечание. Доказав, что между любыми двумя действительными числами содержится не просто действительное, но действительное рациональное число, мы установили более сильное свойство множества действительных чисел, чем плотность (см. свойство 26) пункта 2.70). Это свойство будем называть усиленной плотностью множества действительных чисел. 2.111 Теорема. Пусть α-любое действительное число. Если rєα, то r*<α; если же r α, то α≤r*. Доказательство. Если rєα, то r*α. При этом r r*, откуда следует, что r*<α. Пусть теперь r α. Если при этом r является наименьшим верхним числом сечения α, то α=r* (2.74). В противном случае найдется такое рациональное число р, что р0). Так как р-ε/2єp*, q-ε/2єq*, то (р-ε/2)+(q-ε/2)єр*+q*, т.е. rє p*+q*. Следовательно, (p+q)* p*+q*. Обратно, пусть rє p*+q*, т.е. r=s+t, где sєр*, tєq*. Тогда s 0 и q>0. Убедимся, что (pq)* p*q*. Если rє (pq)* и r≤0, то rєp*q* (см. 2.93 и 2.94). Если же 0
0) и выберем положительное рациональное число δ так, чтобы выполнялись неравенства: δ
105
Обратно, пусть rєp*q* и требуется установить, что rє(pq)*. Если r≤0, то (так как 0< pq), r0, то r=st, где 0<s 0, q<0. Тогда pq<0 и (pq)*= =-(|pq|)*=-(-(pq))*=-[p(-q)]*=-(p|q|)*. Далее, q*=-(|q|)* и p*q*= =-[p*(|q|)*]. В силу вышедоказанного, можно утверждать, что (p|q|)*=p*(|q|)*. Но тогда и –(p|q|)*=-[p*(|q|)*], т.е. (pq)*= p*q*. Случай, когда p<0 и q>0 сводится к только что разобранному случаю, ввиду коммутативности умножения рациональных и действительных чисел. 2.114 Теорема. Для любых двух рациональных чисел p и q неравенство p*
0 существуют такие рациональные числа p и q, что p<α< q и q-р=ε. Теорему 2.111 можно сформулировать следующим образом: если α иррациональное число и rєα, то r<α; если же r α (rєQ), то α< r. Теорема 2.109 об усиленной плотности множества R теперь формулируется так: если α и β-действительные числа, причем α<β, то существует такое рациональное число r, что α
106
что между двумя различными действительными числами можно «вставить» сколько угодно рациональных чисел. Заметим, что при построении теории действительных чисел возможен несколько иной подход. При этом подходе определения 2.71 и теоремы и замечания 2.72-2.75 остаются в силе. Затем определяются иррациональные числа, как сечения, среди верхних чисел которых нет наименьшего числа. Множество R всех действительных чисел определяется как объединение множества Q всех рациональных чисел и множества всех иррациональных чисел. Отношение порядка в множестве R определяется следующим образом. Если r-рациональное число, а α-иррациональное число, то, по определению, r<α тогда и только тогда, когда rєα ; α< r тогда и только тогда, когда r α . Если α и β-иррациональные числа, то, по определению, α<β тогда и только тогда, когда αβ и α≠β. После этого вводятся определения положительного иррационального числа (α>0, т.е. 0<α или 0єα) и отрицательного иррационального числа (α<0, т.е. 0 является верхним числом сечения α). Так как иррациональное число α не имееет наибольшего нижнего числа и не имеет наименьшего верхнего числа, то положительное иррациональное число содержит некоторые положительные рациональные числа, а отрицательное иррациональное число имеет некоторые отрицательные верхние числа. Далее, доказываются теоремы 2.80 и 2.81, а также теоремы 2.109 и 2.88 ( в новой редакции, указанной в настоящем замечании). Чтобы определить операцию сложения в множестве R, вводятся понятия рационального сечения и суммы двух сечений. А именно, для любого rєQ сечение {рєQ: p
107
сложения действительных чисел требует рассмотрения нескольких случаев, в зависимости от того, каким числом (рациональным или иррациональным) является то или иное слагаемое. Затем доказываются теоремы 2.87 и 2.89, в формулировках которых сечение 0* заменяется числом 0. При доказательстве этих теорем следует ограничиться случаем иррационального α (при αєQ справедливость утверждений этих теорем доказана в разделе «Рациональные числа»). Действительное число β, определенное для каждого αєR при доказательстве теоремы 2.89, обозначается –α и называется противоположным к α действительным числом. Теоремы 2.86, 2.87, 2.89 показывают, что пара (R, +) представляет собой абелеву группу. Отсюда следует (см. 1.28, 1.29, а также 2.70) единственность нулевого элемента и единственность противоположного элемента для любого αєR. Далее, доказывается, что неравенство α<β (α, βєR) равносильно неравенству β-α>0, где β-α= β+(-α). Доказательство этого утверждения требует рассмотрения нескольких случаев. Разберем один из возможных случаев, оставляя читателю разбор остальных. Пусть α-иррациональное число, а β-рациональное: β=rєQ. Докажем, что неравенство α0, т.е. r*(-α)>0. Если α< r, то (пользуясь усиленной плотностью множества R) можем найти такие рациональные числа r' и r'', что α< r'< r''< r. Тогда r''є r*, r' α и - r'є-α, ибо –α={рєQ: -р α} (см. 2.89). Следовательно, r''+(-r')є r*(-α), т.е. иррациональное число r*(-α) содержит положительные рациональные числа. Но это и означает, что r*(-α)>0, т.е. r-α>0. Итак, из α< r следует, что r-α>0. Пусть теперь дано, что r-α>0, т.е. сечение r*(-α) содержит некоторые положительные числа. Это значит, что найдутся такие рациональные числа r' и р, что r'< r, рє-α и r' +р>0. Следовательно, r>r'>-p и r α, ибо –р α. Итак, из r-α>0 следует, что r α, т.е. α 0. После установления равносильности неравенαβств α<β и β-α>0, легко доказать теорему 2.91. Для доказательства достаточно рассмотреть разность (β+γ)-(α+γ)=(β+γ)+ +[-(α+γ)]=(β+γ)+[(-α)+(-γ)]=β+(-α)= β-α. Далее определяется понятие положительного сечения и произведения двух положительных сечений. Сечение α в области рациональных чисел будем называть положительным, если оно содержит некоторые положительные рациональные числа. Положительное сечение является либо положительным иррациональным числом, либо рациональным сечением r* при некотором r>0. Произведением α•β двух положительных сечений α и β будем называть следующее множество: α•β = { rєQ: r≤0 или( r>0 и r=pq, pєα, qєβ, p>0, q>0)}.
108
Доказывается, что α•β представляет собой положительное сечение и что (rs)*=r*•s*, если r, s єQ, r>0, s>0 (см. 2.113). После этого определяется произведение двух положительных действительных чисел, из которых хотя бы одно-иррационально. Предварительно доказывается, что если αположительное иррациональное число, а rєQ и r>0, то сечения α• r* и r*•α представляют собой положительные иррациональные числа. По определению принимается, что αr= α• r* и rα=r*•α. Если α и βположительные иррациональные числа, то, по определению:
, åñëè åñòü èððàöèîíàë üíîå ÷èñëî αβ= r , åñëè r * Таким образом, произведение положительных действительных чисел всегда является положительным действительным числом. Далее, устанавливается коммутативность и ассоциативность умножения положительных сечений (см. теорему 2.95), после чего доказывается теорема о коммутативности и ассоциативности умножения положительных действительных чисел. При этом доказательство коммутативности достаточно очевидно, а доказательство ассоциативности требует рассмотрения нескольких случаев. Разберем один из возможных случаев, оставляя читателю разбор остальных. Пусть все числа α, β, γиррациональны и требуется доказать, что (αβ)γ=α(βγ), (α>0, β>0, γ>0). Могут представиться следующие возможности: 1) αβ=r, βγ=s, где rєQ, r>0 и sєQ, s>0. Тогда (αβ)γ=rγ=r*•γ=(α•β)•γ и α(βγ)=αs=α•s*=α•(β•γ). Так как умножение положительных сечений ассоциативно, то (α•β)•γ= α•(β•γ), откуда (αβ)γ=α(βγ). 2) αβ=r (rєQ, r>0), а βγ-положительное иррациональное число. При этом (αβ)γ= rγ= r*•γ=(α•β)•γ и α(βγ)= α(β•γ). Так как α•(β•γ)= (α•β)•γ=r*•γ, то α•(β•γ) есть иррациональное число и потому α(βγ)= α(β•γ)= α•(β•γ)= (α•β)•γ=(αβ)γ. 3) αβ-положительное иррациональное число, а βγ=s, где sєQ, s>0. Доказательство справедливости равенства (αβ)γ=α(βγ) проводится также, как и в 2). 4) αβ и βγ суть положительные иррациональные числа. Тогда
( ) , åñëè ( ) èððàöèîíàë üíî (αβ)γ=(α•β)γ= = r , åñëè ( ) r * ( ), åñëè ( ) èððàöèîíàë üíî = = r , åñëè ( ) r * = α(β•γ)= α(βγ).
109
Итак, в расматриваемом случае (α, β, γ-иррациональны) при всех возможностях 1)-4) имеет место равенство (αβ)γ=α(βγ). Доказательство этого равенства в остальных случаях аналогично приведенному. После этого доказывается справедливость равенства αх1=α или, что то же, α•1*=α для любого положительного иррационального числа α (см. теорему 2.96). Заметим, что справедливость равенства αх1=α при рациональном α доказана в разделе «Рациональные числа». Существование обратного элемента для любого положительного иррационального числа α (при αєQ, α≠0 см. 2.60) доказывается так же, как в теореме 2.97. А именно, доказывается, что множество β={rєQ: r≤0 или (r>0 и 1/r α)} представляет собой положительное сечение. Легко убедиться, что β представляет собой иррациональное число, т.е. среди верхних чисел сечения β нет наименьшего числа. В самом деле, пусть q β. Тогда q >0 и 1/qєα. Так как α не содержит наибольшего числа, то найдется рациональное число, которое можно записать в виде 1/р, рєQ и такое, что 1/q<1/рєα. Отсюда следует, что 00, обозначается (как и при рациональном α) символом α-1. Далее, обычным образом определяется понятие модуля иррационального числа (модуль рационального числа определен в 2.54). Это позволяет распространить определение произведения двух действительных чисел на те пары этих чисел, для которых это понятие еще не определено. А именно, для любого иррационального числа α по определению принимается, что α0=0α=0. Если α и βлюбые, отличные от 0 действительные числа, среди которых хотя бы одно отрицательно и хотя бы одно иррационально, то по определению: (| | | |), åñëè 0, 0 èëè 0, 0 αβ = | | | |, åñëè 0, 0
Это равенство сохраняет свою силу и в том случае, когда оба числа α и β рациональны (см. 2.70, пункт 25)). Отсюда (и из определения произведения положительных действительных чисел) следует, что αβ=0 тогда и только тогда, когда либо α=0, либо β=0 (α, βєR). После этого доказываются теоремы 2.101, 2.103 (с небольшими и очевидными изменениями). Замечание 2.104 сохраняет свою силу (только 0* заменяется на 0).
110
Лемма 2.105 формулируется следующим образом: если α, β, γположительные сечения, то (αβ)•γ=(α•γ)(β•γ). Доказательство этого утверждения не отличается от доказательства леммы 2.105 (следует только изменить некоторые обозначения). Затем доказывается следующая лемма: если α, β, γположительные действительные числа, то (α+β)γ=αγ+βγ. Имея в виду 2.68, при доказательстве леммы следует ограничиться случаями, когда хотя бы одно из чисел α, β, γ-иррационально. Приведем подробное доказательство леммы в случае, когда все числа α, β, γиррациональны (разбор остальных случаев предоставляется читателю). Могут представиться следующие возможности. 1) αγ=r, βγ=s, где r,sєQ (r>0, s>0). При этом α•γ=r*, β•γ=s* и (α•γ)(β•γ)= =r*s*=(r+s)*. Применяя лемму 2.105 (в новой формулировке), получим: (αβ)•γ=(r+s)*. Отсюда следует, что αβ представляет собой иррациональное число, т.е. αβ= α+β. Поэтому (α+β)•γ=(r+s)* и (α+β)γ= =r+s=αγ+βγ. 2) αγ=rєQ (r>0), βγ- иррациональное число. При этом αγ+βγ=r+βγ=r*(βγ)=(α•γ)(β•γ)=(αβ)•γ. Если αβ=s*, где sєQ, s>0, то α+β=s и αγ+βγ=(αβ)•γ=s*•γ=sγ=(α+β)•γ. Если же αβ есть иррациональное число, то αγ+βγ=r+ +βγ=(αβ)•γ=(α+β)•γ=(α+β)γ. При этом мы воспользовались тем, что (α+β)•γ есть иррациональное число (равное r + βγ). 3) αγ- иррациональное число, βγ=rєQ (r>0). Доказательство справедливости равенства (α+β)γ=αγ+βγ проводится также, как в 2). 4) αγ и βγ суть положительные иррациональные числа. Если при этом αγ+βγ= rєQ (r>0), то (αγ)(βγ)=r*, откуда (α•γ)(β•γ)=r* и (αβ)•γ= r*. Следовательно, αβ есть иррациональное число, т.е. αβ= α+β. Поэтому (α+β)•γ= r* и (α+β)γ=r= αγ+βγ. Если же αγ+βγ есть иррациональное число, то αγ+βγ= =(αγ)(βγ)=(α•γ)(β•γ)=(αβ)•γ. Сечение αβ есть либо положительное иррациональное число, либо положительное рациональное сечение s* (sєQ, s>0). Пусть αβ=s*. Тогда α+β=s и αγ+βγ=(αβ)•γ= s*•γ=sγ=(α+β)γ. Пусть теперь αβположительное иррациональное число. Тогда αβ= α+β и αγ+βγ=(αβ)•γ=(α+β)•γ=(α+β)γ. При этом мы воспользовались тем, что (α+β)•γ есть иррациональное число (ибо оно равно иррациональному числу αγ+βγ. Итак, в рассмотренном случае (все числа α, β, γиррациональны) при всех возможностях 1)-4) имеет место равенство (α+β)γ= αγ+βγ.
111
Оставляя разбор остальных случаев читателю, будем считать лемму доказанной. После этого доказывается теорема 2.106, в формулировке и доказательстве которой 0* заменяется на 0. Кроме того, ссылки на лемму 2.105 заменяются ссылками на только что доказанную лемму. Доказательством теоремы 2.107 (всюду 0* заменяется на 0) завершается (с учетом замечания 2.108) изучение арифметических операций и отношения порядка ( по отдельности и в их связи между собой) в множестве R всех действительных чисел. В следующих двух теоремах высказаны те свойства суммы и произведения двух действительных чисел, которые могли бы быть положены в основу определения этих понятий. 2.116 Теорема. Пусть α и β-действительные числа и а, а', b, b'-любые рациональные числа такие, что а<α< а' и b<β< b'. Утверждается, что действительное число γ=α+β является единственным действительным числом, которое, с одной стороны, больше всех рациональных чисел вида а+b, а с другой-меньше всех рациональных чисел вида а'+ b': а+b<γ< а'+ b'. Доказательство. Из 2.91 и 2.81 следует, что неравенства одинакового смысла можно почленно складывать. Складывая почленно неравенства а<α< а' и b<β< b', убедимся, что число γ=α+β удовлетворяет неравенствам а+b<γ<а'+b'. Предположим, что этим же неравенствам удовлетворяет ( при любых а, а', b, b' таких, что а<α< а' и b<β< b') действительное число γ1≠γ. Пусть для определенности γ<γ1. Тогда а+b<γ<γ1< а'+ b', откуда (а'+ +b')-( а+ b)= [(а'+ b')- γ1]+( γ1-γ)+[γ-( а+ b)] и (а'-а)+( b'- b)> γ1-γ>0. Выбрав рациональное число ε>0 так, чтобы γ1-γ>ε, будем иметь: (а'-а)+( b'- b)>ε>0 для любых а, а', b, b' таких, что а<α< а' и b<β< b'. Но, согласно теореме 2.88, существуют такие рациональные числа а, а', b, b' , что а<α< а' и b<β< b' и а'-а=ε/2, b'- b=ε/2. Для этих чисел (а'-а)+( b'- b)=ε, что противоречит ранее полученному неравенству (а'-а)+(b'-b)>ε. Следовательно, допущение о том, что неравенствам а+b<γ< а'+ +b' может удовлетворять ( при любых рациональных а, а', b, b', таких, что а<α< а' и b<β< b') еще и число γ1≠γ-неверно и теорема доказана. 2.117 Теорема. Пусть α и β-положительные действительные числа и а, а', b, b'-любые положительные рациональные числа такие, что а<α<а' и b<β< b'. Утверждается, что действительное число γ=αβ является единственным действительным числом, которое, с одной стороны, больше всех рациональных чисел вида аb, а с другой- меньше всех рациональных чисел вида а'b':
112
аb<γ< а'b' Доказательство. Из 2.107 и 2.81 следует, что неравенства одинакового смысла с положительными членами можно перемножать почленно. Перемножив почленно неравенства а<α< <а' и b<β< b', убедимся, что число γ=αβ удовлетворяет неравенствам аb<γ< а'b'. Допустим, что этим же неравенствам удовлетворяет (при любых рациональных а, а', b, b' таких, что а<α< а' и b<β< b') действительное число γ1≠γ. Пуусть для определенности γ<γ1. Тогда аb<γ<γ1< а'b', откуда а'b'- аb=( а'b'γ1)+( γ1-γ)+(γ- аb) и а'b'- аb> γ1-γ>0. Выбрав рациональное число ε>0 так, чтобы γ1-γ>ε>0, будем иметь: а'b'- аb>ε>0 для любых а, а', b, b' таких, что а<α< а', b<β< b'. Зафиксируем рациональные числа а'0 и b'0 так, чтобы было: а'0 >α, b'0>β. Обозначив δ= =min(ε/2а'0, ε/2b'0), найдем, (пользуясь теоремой 2.88) рациональные числа а, а', b, b' такие, что а<α<а', b<β< b' и а'а=δ, b'-b=δ. При этом , не ограничивая общности, можно считать, что b'≤ b'0: при b'> b'0 вместо чисел b и b' можно взять соответственно числа b1=b-(b'- b'0) и b'1= b'0, для которых (как и для чисел b, b') выполняются условия b1<β< b1' и b1'- b1=δ. Итак, будем считать, что а<α<а', b<β< b', а'-а=δ, b'-b=δ, b'≤ b'0. Тогда а' b'- а b=(а'–а)b'+а(b'-b)= δb'+δа<δ b'0+δ а'0≤ (ε/2b'0) b'0+ + (ε/2а'0) а'0=ε/2+ε/2=ε. Итак, с одной стороны, а'b'- аb>ε, а с другой- а'b'- аb<ε. Полученное противоречение доказывает, что никакое число γ1≠αβ не может удовлетворять неравенствам аb< γ1< а'b' при любых а, а', b, b' таких, что а<α<а', b<β< b'. Теорема доказана. 2.118 Теорема («аксиома Архимеда»). Если α и β-два положительных действительных числа, причем α<β, то найдется такое натуральное число n, что nα>β. Доказательство. Взяв рациональные числа r и r' так, чтобы выполнялись неравенства 0r', откуда nα>nr>r'>β. Следовательно, nα>β, ч.т.д. 2.119 Определение. Непустое собственное подмножество А множества R будем называть сечением в области действительных чисел, если: 1) из αєА, βє R, β<α следует, что βєА; 2) в А нет наибольшего числа. 2.120 Теорема. Если А-сечение в области действительных чисел, то среди верхних чисел сечения (т.е. действительных чисел, не принадлежащих А) имеется наименьшее число. Если β-указанное наименьшее верхнее число, то А={αєR: α<β}.
113
Доказательство. Обозначим через В множество всех тех рациональных чисел, которые принадлежат множеству А. Так как А непусто, то и В непусто. Поскольку А содержит не все действительные числа, то найдутся рациональные числа, не принадлежащие А, а потому-не принадлежащие В. Значит, Внепустое собственное подмножество множества Q. Если rєB, pєQ, p
114
2) либо среди верхних чисел сечения α нет наименьшего рационального числа ( пример такого сечения приведен в 2.77 и подобных примеров можно привести сколько угодно). В случае 1) число r будем называть пограничным числом между всеми остальными верхними числами сечения α и всеми нижними числами этого сечения. Будем также говорить, что число r порождает или производит сечение α= r*. В случае 2) такого пограничного рационального числа нет и именно эта неполнота системы рациональных чисел обусловила необходимость введения новых, иррациональных, чисел. Теорема 2.120 показывает, что после их введения полученная система действительных чисел обрела полноту, т.е. всякое сечение в области действительных чисел производится некоторым действительным числом (которое является наименьшим верхним числом этого сечения). 2.122 Определения. Пусть Е-некоторое непустое множество действительных чисел, т.е. ЕR, Е≠. Будем говорить, что множество Е ограничено сверху, если существует такое действительное число α, что для всех хєЕ имеет место наравенство х≤α. При этом число α называется верхней границей ограниченного сверху множества Е. Множество Е называется ограниченным снизу, если существует такое число βєR, что для всех хєЕ имеет место наравенство хβ. При этом число β называется нижней границей ограниченного снизу множества Е. Если множество Е ограничено и сверху и снизу, то оно называется ограниченным. 2.123. Теорема. Если множество ЕR (Е≠) ограничено сверху, то среди верхних границ этого множества имеется наименьшая. Если Е ограничено снизу, то среди нижних границ этого множества имеется наибольшая. Доказательство. Пусть непустое множество ЕR ограничено сверху. Расмотрим случай, когда среди чисел множества Е имеется наибольшее число х*. Тогда для всех хєЕ выполняется неравенство х≤х*, т.е. х* есть верхняя граница множества Е. С другой стороны, если α-любая верхняя граница множества Е, то (так как х*єЕ) х*≤α. Следовательно х*наименьшая из верхних границ множества Е. Расмотрим теперь случай, когда среди чисел множества Е нет наибольшего. Пусть А-множество, состоящее из действительных чисел и определенное следующим образом: А={хєR: найдется х'єЕ такое, что х'>х}. Так как среди чисел множества Е нет наибольшего, то ЕА, так что А непусто. Если α- верхняя граница множества Е (а таковые существуют,
115
ввиду ограниченности сверху множества Е), то α А. Следовательно, А-непустое собственное подмножество множества R. Легко видеть, что А-сечение в области действительных чисел (проверка этого утверждения предоставляется читателю). Согласно теореме 2.120, среди верхних чисел сечения А имеется наименьшее число, которое обозначим α0. Так как α0 А, то для любого хєА выполняется неравенство х< α0. Это же неравенство выполняется, в частности, и для любого хєЕ. Значит, α0 является верхней границей множества Е. Так как α0-наименьшее из верхних чисел сечения А, то всякое число βєR, меньшее α0, принадлежит множеству А, т.е. для него найдется такое х'єЕ, что х'>β. Следовательно, β уже не является верхней границей множества Е. Итак, α0-наименьшая из верхних границ множества Е, ч.т.д. Пусть теперь непустое множество ЕR ограничено снизу, т.е. существует такое действительное число β, что хβ при любом хєЕ. Расмотрим множество, которое обозначим –Е, определенное следующим образом: -Е={yєR: -yєE}. Для любого yє –E -yβ, откуда y≤-β. Следовательно, множество –Е непусто (для любого хєЕ -хє-Е) и ограничено сверху. Согласно вышедоказанному, среди верхних границ множества –Е имеется наименьшая, которую обозначим –β0. Для любого хєЕ имеем: -хє-Е и потому -х≤-β0, откуда хβ0. Следовательно, β0-нижняя граница множества Е. Если же β1> β0, то -β1<-β0, потому число -β1 не является верхней границей множества –Е. Значит, найдется такое число yє –E, что y>-β1. Тогда х=-y< β1 и хєЕ. Следовательно, β1 не является нижней границей множества Е. Итак, β0 является нижней границей множества Е, а всякое число β1> β0 уже не является нижней границей множества Е. Значит, β0-наибольшая из нижних границ множества Е, ч.т.д. 2.124. Замечание. Если исключить из рассмотрения иррациональные числа и рассматривать, например, ограниченные сверху множества рациональных чисел, то утверждение о существовании наименьшей верхней границы (среди всех рациональных верхних границ) становится неверным. Так, множество αQ, расмотренное в примере 2.77, ограничено сверху и представляет собой сечение в области рациональных чисел. Поэтому оно не содержит наибольшего числа и множество всех его верхних границ (рациональных) совпадает со множеством верхних чисел сечения α. Согласно доказанному в 2.77, множество верхних чисел сечения α не
116
содержит наименьшего числа, а это означает, что среди рациональных верхних границ множества α нет наименьшей. 2.125. Определения и обозначения. Если множество ЕR ограничено сверху, то наименьшая из его верхних границ называется точной верхней границей или верхней гранью множества Е и обозначается sup Е; если множество ЕR ограничено снизу, то наибольшая из его нижних границ называется точной нижней границей или нижней гранью множества Е и обозначается inf Е ( по латыни supremum означает «наивысшее», а infimum означает «наинизшее»). 2.126 Определение. Арифметическим значением корня nой степени (nєN) из положительного действительного числа α называется такое положительное действительное число ξ, что ξn=α (степень любого действительного числа ξ с натуральным 1 m показателем определяется индуктивно: ξ = ξ, а при m>1 ξ =
=ξm-1ξ). 2.127 Теорема. При любом nєN арифметическое значение корня n-ой степени из любого положительного действительного числа α, обозначаемое , существует и единственно. Доказательство. Единственность арифметического значения корня следует из того, что разым положительным числам n n сооветствуют и разные степени их: если 0< ξ1< ξ2, то ξ 1< ξ 2. n
Установим существование . Пусть Е-множество, состоящее из всех таких положительных действительных чисел, t, что tn<α. Если взять t0=α/(1+α), то 0< t0<1, откуда tn0< t0. С другой стороны, t0<α, так что tn0<α и t0єЕ. Следовательно, множество Е непусто. Далее, для любого действительного числа р>1 и любого натурального числа m имеет место неравенство рmр (доказательство индукцией по числу m предоставляется читателю). Поэтому (1+α)n1+α>α, так что для любого tєЕ имеем: t<1+α. Следовательно, множество Е n ограничено сверху. Пусть ξ=sup Е. Убедимся, что ξ =α, доказав ( от n n противного), что неравенства ξ <α и ξ >α не могут иметь места. Для доказательства воспользуемся формулой Ньютона для степени бинома: (х+а)n=хn+С1nxn-1a+ С2nxn-2a2+…+Сn-1nxan-1+an, справедливой для любых действительных чисел х и а и любого натурального n (справедливость формулы устанавливается индукцией по числу n; n см. упражнение 3 к главе 1). Итак, допустим, что ξ <α. Выбрав h n n n так, чтобы 0
117 n
абсурдно, то неравенство ξ <α не может иметь места. Допустим n теперь, что ξ >α. Выбрав h так, чтобы 0ξn-(ξn-α)=α. Следовательно, ξ-h есть верхняя граница множества Е, тогда как ξ есть наименьшая из верхних границ множества Е. Полученное n противоречение доказывает, что неравенство ξ >α не может иметь n места. Итак, ξ =α и теорема доказана. 2.128 Теорема. Если α и β-любые действительные числа и m,n-любые натуральные числа, то: αmαn=αm+n, (αm)n=αmn, (αβ)n=αnβn. Доказательство теоремы предоставляется читателю (во всех случаях оно проводится индукцией по числу n). Следствия: если α≠0 (αєR) и m>n, то αm:αn=αm-n; если α, n n n βєR, nєN и β≠0, то (α/β) =α /β . 2.129 Определение. Для любого α≠0 (αєR) и любого натурального числа n nринимается: α0=1, α-n=1/αn (это определение согласуется с определением символа α-1, приведенного ранее). 2.130 Теорема. Если α≠0 (αєR), то при любых целых m, n имеют место равенства: αmαn=αm+n, (αm)n=αmn. Если α≠0 и β≠0, то прилюбом целом n имеет место равенство: (αβ)n=αnβn. Доказательство. Если одно из чисел m, n равно 0, то справедливость подлежащих доказательству равенств становится очевидной. Пусть m≠0 и n≠0. Ввиду 2.128, достаточно рассмотреть следующие случаи. 1) m>0, n<0. В этом случае (αm)n=(αm)-/n/=1/(αm)/n/=1/αm/n/ и αmn=α-(m/n/)=1/αm/n/, так что (αm)n= αmn. Далее, (αβ)n=1/(αβ)|n|=1/(α|n| β|n|) и αnβn=(1/α|n|)(1/β|n|)=1/(α|n|β|n|), так что (αβ)n=αnβn. Перейдем к доказательству равенства αmαn=αm+n. Если m+n=0, то αm+n=1. При этом n=-m и αmαn= αm / αm=1, так что αmαn= αm+n. Если m+n>0, т.е. m-/n/>0, то αmαn=αm/α|n|= αm-/n/= αm+n. Если, наконец, m+n<0, т.е. m+n=-(/n/- m) и /n/> m, то αmαn= =αm /α|n|=1/α|n|-m= α-(|n|-m)= αm+n. 2) m<0, n>0. В этом случае докзательство справедливости равенства αmαn=αm+n проводится также, как и в 1). Далее, (αm)n=(1/α/m/)n=1/(α/m/)n=1/ α/m/n= α –(/m/n)= α (-/m/n)= αmn. 3) m<0, n<0. В этом случае αmαn=(1/α/m/)(1/α|n|)=1/(α/m/α|n|)= =1/ α/m/+|n/=α –(/m/+|n/)= αm+n; (αm) n=1/(αm)|n|=1/αm|n/=1: (1/ α/m/|n/)= =α/m/|n/= αmn. 2.131 Следствие из теоремы 2.130. Если α≠0 (αєR), то при любых целых m и n αm : αn= αm-n; если α, βєR и α≠0, β≠0, то при любом целом n (α/β)n=αn/βn.
118
2.132 Теорема. Если α>0 (αєR) и n-целое число, представленное в виде частного от деления целого числа р на натуральное число q (n=p/q), то αn= . Доказательство. (αn)q= αnq=αp. 2.133 Теорема. Пусть r-дробное рациональное число, двумя способами представленное в виде частного от деления целого числа на натуральное число: r=p/q=m/n. Утверждается, что для любого положительного действительного числа α имеет место q
равенство:
q
ð
ð =n m
Доказательство. Пусть =β (см. 2.127). Тогда αр=βq, откуда (αр)n=(βq)n и αрn=βqn. Так как pn=mq, то αmq=βqn или (αm)q=(βn)q. Отсюда следует, что αm=βn (если, например, αm<βn, то q
p
(αm)q<(βn)q), т.е. β= . Итак, =β= , ч.т.д. 2.134 Определение. Для любого положительного действительного числа α и любого рационального числа r, представленного в виде частного от деления целого числа р на n
q
m
p
m
n
натуральное число q (r=p/q), принимается: αr= (αr>0). 2.135 Теорема. Если α- положительное действительное число, а q
m, n-натуральные числа, то
n
=
mn
m .
=ξ. Тогда mn m =ξ= n , ч.т.д.
Доказательство. Пусть
p
n
ξ>0 и ξn=α. Так как
ξmn=(ξn)m=αm, то 2.136 Теорема. Если α и β- положительные действительные числа, то при любом nєN n
Доказательство. Пусть
n
=
n
=ξ,
n n
=. Так как (ξ )n=ξn
n=αβ, то = ξ = , ч.т.д. 2.137. Теорема. Если α - положительное действительное число, а r, r-любые рациональные числа, то αrαr=αr+r. Доказательство. Пусть r=p/q, r=m/n, где p, mєZ, a q, nєN (см. n
n
n
ð m n 2.64). Тогда (см. 2.132, 2.133, 2.134) αr= , αr= . Кроме q
того, r+r=(pn+mq)/nq (2.70) и αr+r= теоремами2.135 и 2.136, nq
p αrαr= q
n
m = nq ( p ) n
pn mq = = αr+r, ч.т.д. nq
nq
( m ) q = pn nq
pn mq
nq
. Пользуясь находим:
mq = pn mq nq
119
2.138. Теорема. Если α - положительное действительное число, а m, n-натуральные числа, то имеют место равенства: m n
= mn
,(
n
m n )m= .
Доказательство. Обозначим откуда (m)n=α и mn
n
==
m
=
m n
n
=ξ, =. Тогда ξn=α, m=ξ , mn=α. Следовательно, m
. Далее, (ξm)n= ξmn=(ξn)m=αm, откуда
m = ξm=( n )m, ч.т.д.
2.139. Теорема. Если α - положительное действительное число, а r, r-любые рациональные числа, то (αr )r=αrr. Доказательство. Пусть r=p/q, r=m/n, где pєZ, mєZ, a q, nєN. p m r m n (αr)r= n ( ) = ( )
p α r= и
q
q
Тогда
=
n q
pm
= =αpm/nq= αrr, ч.т.д. 2.140. Теорема. Если α, β-положительные действительные числа, а r-любое рациональное число, то (αβ)r=αrβr. Доказательство. Пусть r=p/q, где pєZ, qєN. Имеем: (αβ)r= nq
q
pm
( ) p = q p p = p q
q
p =αp/qβp/q=αrβr.
Следствие из теорем 2.137 и 2.140. Если α - положительное действительное число, а r, r-любые рациональные числа, то αr :α r=αr-r; если α, β- положительные действительные числа, а r-любое рациональное число, то (α/β)r= αr /βr. Полагая r=0 в равенстве αr :α r=αr-r, будем иметь: α -r=1/ α r. 2.141. Теорема. Если r-положительное рациональное число, то при α>1 (αєR) имеет место неравенство αr >1; если же 0<α<1, то и 0< αr <1. Доказательство. Пусть r=p/q, где pєN, qєN. Если α>1, то αр>1 и αr= >1 (число ξ= положительно, в силу самого определения арифметического значения корня; если при этом ξ≤1, то и ξq=αp≤1, что противоречит вышеустановленному q
p
q
p
p неравенству). Если же 0<α<1, то 0< αp<1 и αr= также заключено в пределах между 0 и 1: 0< αr<1. q
2.142 Определение. Функция f:АR, где АR, называется строго возрастающей (неубывающей), если для любых х1,х2є А
120
таких, что х1< х2 выполняется неравенство: f (х1)< f (х2) (f (х1)≤ f (х2)). Если для любых х1, х2є А таких, что х1< х2 выполняется неравенство: f (х1)> f (х2) (f (х1) f (х2)), то функция f называется строго убывающей (невозрастающей). 2.143 Теорема. Пусть α-положительное действительное число, отличное от 1 (0<α≠1). Определим функцию fα:QR, полагая fα(r) =αr для любого rєQ. Утверждается, что при α>1 функция fα-строго возрастающая (т.е. при rαr'). Доказательство. αr'/ αr= αr'-r. поэтому (см. 2.141) если r 1, то αr'/ αr>1, откуда αr'>αr (так как αr>0). Если же 0<α<1, то (при r αr', ч.т.д. 2.144 Определение. Если α-любое действительное число, большeе 1 (α>1), а β-любое иррациональное число, то под αβ будем понимать верхнюю грань множества Е={ξєR: ξ=αr, где rєQ и r<β}, ограниченного любым числом вида αr', где r΄>β, r΄єQ. Эту верхнюю грань будем обозначать следующим образом: αβ=sup {αr}. r< β 2.145 Замечание. Ясно, что для любых рациональных чисел r, r΄таких, что r<β β нет наименьшего, то на самом деле имеют место неравенства αr< αβ< αr'. 2.146 Лемма. Если α>1 (αєR), то для любого nєN 1/n α -1≤(α-1)/n. Доказательство. При любом λ>0 (λєR) по формуле Ньютона находим: (1+λ)n=1+nλ+…, откуда (1+λ)n1+nλ. Полагая λ=α1/n-1 (это число положительно в силу 2.141), будем иметь α1+n(α1/n-1), откуда α1/n-1≤( α-1)/n, ч.т.д. 2.147. Теорема. Пусть α>1 (αєR), а β-любое действительное число. Утверждается, что если r и r΄-любые рациональные числа, такие, что r<β
121
действительное число γ≠ αβ, удовлетворяющее неравенствам αr<γ< αr' при любых r, r΄ єQ, для которых r<β< r΄. Обозначив |γ-αβ|=ε, будем иметь: 0<ε<αr'-αr при любых r, r΄ єQ, для которых r<β< r΄. Зафиксируем рациональное число q>β и (пользуясь «аксиомой Архимеда») найдем такое натуральное число n, что n>(αq(α-1))/ε. Далее, на основани теоремы 2.88 найдем такие рациональные числа r и r΄, что r<β< r΄и r΄-r=1/n. Для найденных чисел будем иметь: αr'-αr=αr(αr'-r-1)< <αq(α1/n-1)≤(αq(α-1))/n<ε, что противоречит ранее полученному неравенству αr΄-αr>ε. Полученное противоречие доказывает, что αβ-единственное число, удовлетворяющее неравенствам αr<αβ< αr΄ при любых рациональных r и r΄ таких, что r<β< r΄. Теорема доказана. 2.148. Теорема. Пусть α, β, γ-любые действительные числа, причем α>1. Тогда αβαγ= αβ+γ. Доказательство. Пусть p,q и r,s-любые такие рациональные числа, что p<β1 и β>1, то (αβ)γ=αγβγ. Доказательство. Так как α>1 и β>1, то αβ>1, так что степени αγ, βγ , (αβ)γ определены при любом действительном γ. Чтобы доказать справедливость равенства (αβ)γ=αγβγ, расмотрим любые рациональные числа r и r΄, удовлетворяющие неравенствам r<γ< r΄. Для этих чисел будем иметь: αr<αγ<αr΄, βr<βγ<βr΄, (αβ)r<(αβ)γ<(αβ)r΄. Перемножив почленно первые два двойных неравенства и r γ γ r΄ воспользовавшись теоремой 2.140 получим: (αβ) < α β <(αβ) . Мы видим,что действительные числа (αβ)γ и αγβγ заключены между одними и теми же числами (αβ)r и (αβ)r΄. Следовательно, |(αβ)γ-αγβγ|< (αβ)r΄-(αβ)r. Рассуждая как в 2.147, легко подобрать рациональные числа r и r΄ (с соблюдением условия r<γ< r΄) так, чтобы разность (αβ)r΄-(αβ)r оказалась меньше любого наперед заданного положительного числа ε. Отсюда следует, что (αβ)γ=αγβγ, ч.т.д.
122
Определение. Если αєR и 0<α<1, а β-любое иррациональное число, то под αβ понимается число: αβ=1/(α-1)β. Принимается также, что 1β=1. 2.151 Теорема. Пусть α, β, γ-любые действительные числа, причем α>0. Тогда αβαγ= αβ+γ. Доказательство. При α=1 справедливость утверждения теоремы очевидна. При α>1 справедливость утверждения теоремы доказана в 2.148. При 0<α<1 имеем: αβαγ= =(1/(α-1)β)(1/(α-1)γ)=1/(α-1)β+γ=αβ+γ. Заметим, что доказательство сохраняет свою силу и в том случае, когда некоторые из чисел β, γ, β+γ (или даже все) рациональны. 2.152 Теорема. Если α, β, γ-любые действительные числа, причем α>0 и β>0, то (αβ)γ=αγβγ. Доказательство. Если хотя бы одно из чисел α, β равно 1, то справедливость утверждения теоремы очевидна. Если α>1 и β>1, то справедливость утвеждения теоремы доказана в 2.149. Если 0<α<1 и 0<β<1, то (αβ)γ= =1/[(αβ)-1]γ=1/(α-1β-1)γ=1/((α-1)γ (β-1)γ)= αγβγ. Рассмотрим теперь случай, когда одно из чисел α, β больше единицы, а другое-меньше единицы. Пусть, например, α>1, 0<β<1. При этом могут представиться три возможности: 1) если αβ =1, то αγβγ= αγ (1/(β-1)γ)=αγ/αγ=1=1γ=(αβ)γ. 2) если δ=αβ>1, то α=δβ-1 и αγ=δγ(β-1)γ= δγ/βγ, откуда δγ= =αγβγ, то есть (αβ)γ=αγβγ. 3) Если δ=αβ<1, то β-1=αδ-1 и (β-1)γ= αγ(δ-1)γ, откуда 1/βγ= =αγ (1/δγ). Следовательно, δγ= αγβγ, т.е. (αβ)γ=αγβγ. Итак, во всех случаях (αβ)γ=αγβγ, ч.т.д. 2.153 Следствия из теорем 2.151 и 2.152. 1. Если α, β, γ-любые действительные числа, причем α>0, то αβ/αγ=αβ-γ. В самом деле, αγαβ-γ= αβ. 2. Если α, β, γ-любые действительные числа, причем α>0 и β>0, то (α/β)γ=αγ/βγ. В самом деле, пусть α/β=δ. Тогда α=βδ и αγ=(βδ)γ= βγδγ, откуда δγ= αγ/βγ. 2.154 Замечание. Полагая β=0 в равенстве αβ/αγ= αβ-γ, будем иметь: α-γ= =1/αγ при любом α>0 (αєR) и любом действительном γ. 2.155 Лемма. Если α, β, γ- действительные числа, причем α>1, β>0, γ>0, то (αβ)γ=αβγ. Доказательство. Пусть p, q, r, s-любые рациональные числа, удовлетворяющие неравенствам 0<р<β1, то (αβ)r< <(αβ)γ<(αβ)s. Кроме того, 0<αр<αβ<αq, откуда (так как r>0, s>0) (αр)r< (αβ)r и 2.150
123
(αβ)s<(αq)s. Следовательно, (αр)r<(αβ)γ<(αq)s или (учитывая 2.139) αрr<(αβ)γ< <αqs. Далее, рr<βγ1) αрr< αβγ< αqs. Мы видим, что числа (αβ)γ и αβγ заключены между одними и теми же числами αрr и αqs, откуда следует, что |(αβ)γ-αβγ|< αqs- αрr. Допустим, что (αβ)γ-αβγ≠0, т.е. число ε=|(αβ)γ-αβγ| положительно (ε>0). Тогда αqs-αрr>ε при любых рациональных p, q, r, s, удовлетворяющих неравенствам 0<р<β β и s'>γ и найдем (пользуясь «аксиомой Архимеда») такое натуральное число n, что n>(αq's'(αq'+s'-1))/ε и n>1/γ, n>1/β. Далее, на основании теоремы 2.88 найдем такие рациональные числа p, q, r, s, что р<ββ-1/n>0 и аналогично r>0. Для найденных чисел p, q, r, s будем иметь: αqs-αрr= =αрr(αqs-рr-1)=αрr[αs(q-p)+p(s-r)-1]=αрr(α(s+p)/n-1)<αq's'[(αs'+q')1/n-1]≤αq's'((αs'+q'-1)/n)<ε. Получили противоречие с ранее установленным неравенством αqs- αрr>ε. Полученное противоречие доказывает, что число ε=|(αβ)γ-αβγ| равно 0, т.е. (αβ)γ=αβγ, ч.т.д. 2.156. Теорема. Если α>0 (αєR), то при любых действительных β и γ имеет место равенство: (αβ)γ=αβγ. Доказательство. Если α=1, то утверждение теоремы становится очевидным. Рассмотрим случаи α>1 и 0<α<1. I. α>1. Если при этом β=0, то утверждение теоремы становится очевидным. Поэтому следует рассмотреть возможности β>0 и β<0. I, 1 α>1, β>0. Если при этом γ>0, то утверждение теоремы справедливо в силу леммы 2.155. При γ=0 утверждение теоремы очевидно. При γ<0 имеем (в силу 2.154 и 2.155): (αβ)γ=(αβ)-|γ|=1/(αβ) |γ|=1/αβ|γ|=α-β |γ|=αβγ. I, 2. α>1, β<0. Используя последовательно 2.154, 2.153 и доказанное в I, 1, имеем: (αβ)γ= (α-|β|)γ=(1/α|β|)γ=1γ/(α|β\)γ=1/α|β|γ=α-|β|γ=αβγ. II 0<α<1. Используя последовательно 2.150, 2.153 и доказанное в I, имеем: : (αβ)γ=[1/(α-1)β]γ=1γ/[(α-1)β]γ=1/(α-1)βγ=αβγ. 2.157Определение. Если а-положительное действительное число, отличное от 1 (0<а≠1), то функцию f: R→R, определяемую равенством f(x)=ax, будем называть показательной функцией с основанием «а» и обозначать символом ехра: ехра(х)=ах для любого хєR. 2.158 Теорема. Показательная функция ехра принимает только положительные значения. При а>1 функция ехра является строго возрастающей, а при 0<α<1 функция ехра –строго убывающая. Доказательство. Пусть a>1. Если х=0, то ах=а0=1>0. Если х>0 и х является рациональным числом, то ах>1 в силу 2.141. Если х>0 и х является иррациональным числом, то ах>аr>1, где r-любое рациональное
124
число, удовлетворяющее неравенствам 0< r<х (см. определение 2.144). Если х<0, то ах =а-/х/=1/ а/х/>0, ибо, по доказанному, а/х/>1. Пусть х1<х2. Тогда ах2/ ах1= ах2-х1>1, так как х2-х1 есть положительное рациональное или иррациональное число. Следовательно, ах1<ах2, а это и означает, что функция ехра -строго возрастающая при a>1. Пусть теперь 0<α<1. Если хиррациональное число, то ах =1/(а-1)х (см. 2.150). Это же равенство справедливо и при рациональном х, так как (а-1)х=(1/а)х=1х/ах=1/ах (см. следствие из теорем 2.137 и 2.140). Итак, при любом хєR ах =1/(а-1)х. Так как а-1>1, то (согласно вышедоказанному) (а-1)х>0, а потому и ах>0. Далее, если х1<х2, то по доказанному (а-1)х1<(а-1)х2, откуда 1/(а-1)х1>1/(а-1)х2, т.е. ах1>ах2, а это и означает, что функция ехра –строго убывающая при 01. Взяв любое число γє R+, убедимся в существовании такого действительного числа β, что аβ=γ. С этой целью расмотрим множество Е={хє R: ах<γ}. Покажем, что это множество непусто и ограничено сверху. Для любого nєN имеем: аn=[1+(a-1)]n=1+n(a1)+…>n(a-1), откуда а-n=1/аn<1/(n(a-1)). Если n'>max(γ/(a-1), 1/(γ(a-1)), то аn'>γ и а-n' <γ. Следовательно –n'єЕ и для любого хєЕ выполняется неравенство х< n0 (ибо аn'>γ и ехра-возрастающая функция). Обозначим β=sup Е (см. теорему 2.123 и определение 2.125). Убедимся, что неравенство аβ<γ не может иметь места. Допуская противное и беря n>((а-1)аβ)/(γ- аβ), будем иметь: аβ+1/n= аβa1/n≤ аβ(1+(a-1)/n)< аβ(1+(γ- аβ)/аβ)=γ (мы использовали лемму 2.146). Следовательно, β+1/n єЕ и потому β+1/n≤supЕ=β. Полученное противоречие доказывает, что неравенство аβ<γ не может иметь места. Теперь убедимся, что и неравенство а β>γ не может иметь места. Допуская противное и беря n>(γ(а-1))/(аβ-γ), будем иметь: аβ-1/n= аβ/a1/n≥ аβ/(1+(а-1)/n)> аβ/(1+( аβ-γ)/γ))=γ. Следовательно, число β-1/n является верхней границей множества Е (ибо если х> β-1/ n, то ах> аβ-1/n>γ и х Е), Но это противоречит определению числа β как наименьшей верхней границы множества Е. Полученное противоречие доказывает, что и неравенство аβ>γ не может иметь места. Следовательно, аβ=γ, ч.т.д. Рассмотрим теперь случай, когда 0<а<1. Так как а-1>1, то, согласно доказанному, существует число βєR такое, что (а-1)β=1/γ. Тогда аβ=1/(а-1)β=1: (1/γ)=γ. Теорема доказана. 2.161. Замечание. Теоремы 2.158 и 2.160 показывают, что показательная функция ехра осуществляет (как при а>1, так и при 0<а<1) биективное отображение множества R всех действительных чисел на множество R+ всех положительных действительных чисел. Следовательно показательная функция ехра допускает обращение.
125
2.162 Определение. Функция, обратная к функции ехра, определенная на множестве R+ всех положительных действительных чисел и имеющая своим множеством значений множество R всех действительных чисел, -называется логарифмической функцией с основанием «а» и обозначается loga. Принято писать logaх (хє R+) вместо loga(х). 2.163 Замечание. Из 1.23 (с) следует, что а
logaх
=х для любого хє R+ и logaах=х для любого хє R.
В частности, loga1=0 и logaа=1 (0<а≠1). 2.164 Теорема. Логарифмическая функция loga: R+→ R, как и показательная функция ехра: R→R+, является строго возрастающей функцией при а>1 и строго убывающей-при 0<а<1. logaх
logaх
1 2 Доказательство. Пусть х1, х2є R+ и х1<х2, т.е. а < а . Если а>1, то неравенство logaх1≥ logaх2 не может иметь места, в силу теоремы 2.158. Значит, при а>1 из х1<х2 следует logaх1< logaх2, а это означает, что при а>1 функция loga является возрастающей. Если же 0<а<1, то (по той же теореме 2.158) не может иметь места неравенство logaх1≤ logaх2. Следовательно, при 0<а<1 неравенство х1<х2 влечет за собой неравенство logaх1> logaх2, т.е. при 0<а<1 функция loga является убывающей. 2.165 Теорема. При любых х, yє R+ и любом μє R имеют место равенства (0<а≠1): loga (хy)= logaх+ logay, logaхμ=μ logaх.
Доказательство. а
logaх+logay
= а
μlogaх
logaх
а
logay
logaх μ
=xy, откуда следует, что
μ
loga (xy)=logaх+ logay. Далее, а =( а ) =х , откуда loga(хμ) =μ logaх. 2.166 Заключение. Завершая изложение теории действительных чисел, убедимся, что задача измерения отрезков (которую, как мы помним, невозможно решить, оставаясь в области рациональных чисел) однозначно решается после расширения множества Q всех рациональных чисел до множества R всех действительных чисел. В самом деле, пусть в качестве «эталона длины» выбран произвольный отрезок ℓ0 и требуется каждому отрезку ℓ поставить в соответствие некоторое положительное действительное число d(ℓ) так, чтобы: 1) d(ℓ 0)=1; 2) d(ℓ 1)= d(ℓ2) для любых двух конгруэнтных между собой отрезков ℓ 1 и ℓ 2 (иногда вместо термина «конгруэнтные отрезки» используется термин «равные отрезки»); 3) d(ℓ + ℓ´)= d(ℓ)+d(ℓ´) для любых двух отрезков ℓ и ℓ´ (мы считаем, что читателю известно понятие суммы двух отрезков). Расмотрим случай, когда отрезок ℓ соизмерим с эталоном длины ℓ0, и пусть отрезок ℓ1-какая-нибудь общая мера отрезков ℓ0 и ℓ, т.е. ℓ1 некоторое целое число
126
q раз укладывается в ℓ0 и некоторое целое число р раз укладывается в ℓ. В этом случае полагаем d(ℓ)=р/q. Следует, однако, убедиться, что d(ℓ) не зависит от выбора общей меры отрезков ℓ и ℓ0. Пусть ℓ2-другая общая мера отрезков ℓ и ℓ0, причем ℓ2 n раз укладывается в ℓ0 и m раз укладывается в отрезке ℓ. Чтобы доказать, что p/q=m/n, разделим отрезок ℓ0 на nq конгруэнтных частей и пусть ℓ3-один из полученных отрезков. Рассмотрим отрезок, который обозначим nℓ3, получаемый сложением n отрезков, конгруэнтных ℓ3. Этот отрезок должен q раз укладываться в ℓ0 и потому этот отрезок конгруэнтен отрезку ℓ1. Следовательно, отрезок ℓ3 n раз укладывается в ℓ1. Так как отрезок ℓ1 р раз укладывается в ℓ, то ℓ3 рn раз укладывается в ℓ. Рассмотрим теперь отрезок, который обозначим qℓ3, получаемый сложением q отрезков, конгруэнтных ℓ3. Этот отрезок должен n раз укладываться в ℓ0 и потому этот отрезок конгруэнтен отрезку ℓ2. Следовательно, отрезок ℓ3 q раз укладывается в ℓ2. Так как отрезок ℓ2 m раз укладывается в ℓ, то отрезок ℓ3 mq раз укладывается в ℓ. Сравнивая этот результат с ранее полученным, заключаем, что pn=mq, откуда p/q=m/n. Итак, каждому отрезку ℓ, соизмеримому с эталоном длины ℓ0, мы сопоставили (в качестве «длины» отрезка ℓ) вполне определенное положительное рациональное число d(ℓ), находимое с помощью какойлибо общей меры отрезков ℓ0 и ℓ, но не зависящее от выбора той или иной их общей меры. Ясно, что при указанном сопоставлении свойства 1) и 2) функции d выполняются (для отрезков, соизмеримых с ℓ0). Убедимся, что выполоняется и свойство 3). Пусть отрезок ℓ соизмерим с отрезком ℓ0 и отрезок ℓ´ соизмерим с ℓ0 и пусть отрезок ℓ1-общая мера отрезков ℓ0 и ℓ, а отрезок ℓ2-общая мера отрезков ℓ0 и ℓ´. Если ℓ1 укладывается в ℓ0 q раз, а в отрезке ℓ- p раз, а отрезок ℓ2 укладывается в ℓ0 n раз и в отрезке ℓ´ m раз, то d(ℓ)=p/q и d(ℓ´)=m/n. Мы должны показать, что отрезок ℓ + ℓ´ соизмерим с ℓ0 и что d(ℓ + ℓ´)= p/q +m/n. С этой целью разделим отрезок ℓ0 на nq конгруэнтных частей и пусть ℓ3-один из полученных отрезков. Как и выше, доказывается, что отрезок ℓ3 n раз укладывается в ℓ1 и рn раз укладывается в отрезке ℓ. Точно также доказывается, что отрезок ℓ3 q раз укладывается в ℓ2 и mq раз укладывается в отрезке ℓ´. Следовательно, отрезок ℓ3 (pn+mq) раз укладывается в отрезке ℓ+ℓ´. Это означает, что отрезок ℓ3 является общей мерой отрезков ℓ0 и ℓ+ ℓ´ и что d(ℓ + ℓ´)=(pn+mq)/nq=p/q+m/n=d(ℓ)+d(ℓ´).
127
Таким образом, мы определили «длины» всех отрезков, соизмеримых с эталоном длины, и убедились, что они удовлетворяют вышеуказанным условиям 1), 2), 3). Заметим, что тот способ, которым мы определили длины всех отрезков, соизмеримых с эталоном длины,является единственно возможным. Действительно, пусть ℓ-отрезок, соизмеримый с ℓ0 и пусть ℓ1-общая мера отрезков ℓ и ℓ0, укладывающаяся q раз в ℓ0 и р раз в отрезке ℓ. Если функция d удовлетворяет условиям 1), 2), 3), то необходимо должны выполняться равенства: q d(ℓ1)= d(ℓ0)=1 и рd(ℓ1)= d(ℓ), откуда d(ℓ)=р/q. Заметим еще, что каждое положительное рациональное число r является «длиной» некоторого отрезка, соизмеримого с эталоном длины ℓ0. Чтобы убедиться в этом, достаточно представить r в виде частного m/n двух целых положительных чисел и сложить m отрезков, каждый из которых конгруэнтен 1/n-ой части отрезка ℓ0. Пусть далее, отрезки ℓ и ℓ´ соизмеримы с ℓ0 и ℓ<ℓ´, т.е. ℓ´=ℓ´1+ ℓ´2, где отрезок ℓ´1 конгруэнтен отрезку ℓ. Легко доказать (как и при доказательстве соизмеримости отрезка ℓ + ℓ´ с отрезком ℓ0), что отрезок ℓ´2 соизмерим с ℓ0 и потому (согласно вышедоказанному) d(ℓ´)=d(ℓ´1)+ +d(ℓ´2)= d(ℓ)+ d(ℓ´2)>d(ℓ). Итак, большему из двух отрезков, соизмеримых с эталоном длины, соответствует большая «длина». Обратно, пусть r и r´-любые рациональные числа такие, что 0S. При этом ℓ0<S< ℓ´. Если же S< <ℓ0, то найдется такое натуральное число m, что mS>ℓ0. Отсюда легко вывести (рассуждением от противного), что отрезок ℓ, конгруэнтный 1/mой части отрезка ℓ0, меньше отрезка S: ℓ<S<ℓ0. Заметим еще следующее. Если S<ℓ´ (отрезок ℓ´ соизмерим с ℓ0), то всегда найдется соизмеримый с отрезок такой, что S< <ℓ´. В самом деле, пусть ℓ1-общая мера отрезков ℓ0 и ℓ´. Так как S< ℓ´, то можно считать, что ℓ´= S+δ, где δнекоторый отрезок, несоизмеримый с ℓ0. Найдется такое натуральное число n, что отрезок ℓ2, конгруэнтный 1/n-ой части отрезка ℓ1,
ℓ0
128
удовлетворяет неравенству ℓ2<δ (если ℓ1<δ, то n=1; при δ< ℓ1 число n определяется из неравенства nδ> ℓ1). Пусть отрезок ℓ2 m раз укладывается
ℓ´. Ясно, что m≥2 и mℓ2<S+ℓ2<S+δ=ℓ´, что в
что =(m-1)
ℓ2>S,
ибо если
(m-1)
ℓ2<S,
то
абсурдно. Итак, S< <ℓ´, ч.т.д. Аналогично доказывается (это предоставляется читателю), что если ℓ<S (отрезок ℓ соизмерим с ℓ0), то всегда найдется такой соизмеримый с ℓ0 отрезок ℓ*, что ℓ<ℓ*<S. Перейдем к определению числа d(S). Пусть αQ есть множество, состоящее из всех отрицательных рациональных чисел, нуля и всех тех положительных рациональных чисел r, для которых r=d(ℓ) при некотором ℓ<S (отрезок ℓ, конечно, предполагается соизмеримым с ℓ0). Из вышедоказанного следует, что α представляет собой сечение в области рациональных чисел, среди верхних чисел которого нет наименьшего. Следовательно, α-положительное иррациональное число, которое и принимается за «длину» отрезка S, т.е. мы полагаем d(S)=α. Из этого определения и теоремы 2.88 следует, что d(S) есть единственное действительное число, удовлетворяющее неравенствам d(ℓ)
129
Следовательно, |(α+β)-γ|=0, т.е. γ= α+β, ч.т.д. С этого момента, говоря о длине отрезка, мы больше не будем употреблять «кавычки». Решив задачу измерения отрезков, мы можем следующим образом изображать действительные числа точками прямой. Выберем на какой-либо прямой начальную точку О. Этой точкой прямая разбивается на два луча, один из которых будем называть положительной полуосью, а другойотрицательной полуосью. Если точка А, отличная от О, принадлежит положительной полуоси, то будем говорить, что А лежит (на рассматриваемой прямой) в положительном направлении от точки О. Если же А принадлежит отрицательной полуоси, то будем говорить, что А лежит в отрицательном направлении от О. Выбрав эталон длины, каждой точке А≠О, лежащей на положительной полуоси, поставим в соответствие положительное действительное число α, равное длине отрезка ОА. аналогично, каждой точке В≠О, лежащей на отрицательной полуоси, поставим в соответствие отрицательное действительное число β, равное длине отрезка ОВ со знаком минус. Самой точке О поставим в соответствие число 0. Как следует из вышедоказанного каждое рациональное число при указанном соответствии отвечает некоторой точке прямой. Опираясь на геометрическую аксиому линейной полноты, можно доказать, на чем мы не останавливаемся, что и каждое иррациональное число при указанном соответствии отвечает некоторой точке прямой. Следовательно, можно говорить как о биективном отображении множества всех точек прямой на множество R всех действительных чисел, так и о биективном отображении множества R на множество всех точек прямой. Это биективное отображение обладает следующими свойствами: 1) числу 0 соответствует точка О, выбранная в качестве начальной точки; 2) каждому положительному действительному числу α соответствует такая точка А на положительной полуоси, что d(ОА)=α; 3) каждому отрицательному действительному числу β соответствует такая точка В на отрицательной полуоси, что d(ОВ)=|β|. Прямая (после выбора на ней начальной точки и положительного направления, а также выбора эталона длины), рассматриваемая вместе с указанным биективным отображением множества R на множество всех точек прямой,-называется числовой осью. Обосновав возможность изображения действительных чисел точками прямой (вышеуказанным способом), легко обосновать обычный способ изображения всевозможных пар (x,y) действительных чисел точками плоскости, отнесенной к той или иной прямоугольной или косоугольной системе координат (паре (x,y) соответствует точка с абсциссой х и ординатой y). То же-в отношении изображения всевозможных троек (х, y, z) действительных чисел точками трехмерного пространства,
130
отнесенного к той или иной прямоугольной или косоугольной системе координат. Заметим еще, что решение задачи измерения отрезков позволяет обычным способом (исходя из геометрических соображений) определить тригонометрические функции положительных и отрицательных углов (и нулевого угла), а также определить понятия длины окружности и длины дуги окружности (длину дуги окружности можно определить как верхнюю грань периметров ломаных линий, вписанных в эту дугу и имеющих с ней одни и те же концы), Затем определяются тригонометрические функции числового аргумента (в дальнейшем будем расматривать только такие тригонометрические функции). А именно, если х-любое положительное дейcтвительное число, то, например, sinx определяется как синус угла, содержащего х радиан. При этом угол в один радиан определяется как центральный угол в окружности произвольного радиуса, опирающийся на дугу, равную по длине радиусу (1 рад=180о/π57о,3). В дальнейшем мы приведем чисто аналитические определения тригонометрических функций числового аргумента (не опирающиеся на понятие угла), а до тех пор будем пользоваться обычными определениями и следствиями из них. Чтобы определить обратные тригонометрические функции, несколько слов скажем о числовых промежутках. Если а,bєR и ab} соответственно запишутся следующим образом: (-;+), (;а), (-;а], [b; +), (b; +) (здесь а, bєR). Если множество ЕR не ограничено сверху, то будем писать sup E=+. Если же множество Е не ограничено снизу, то будем писать inf E=-. Сделав это отступление, перейдем к определению обратных тригонометрических функций. Рассмотрим сужение функции sin на
131
отрезок [-π/2, π/2]. Эта функция является возрастающей и имеет множеством своих значений отрезок [-1,1]. Следовательно, существует обратная к ней функция (также возрастающая), определенная на отрезке [-1,1] и имеющая множеством значений отрезок [-π/2, π/2]. Эта функция обозначается символом arcsin. Как следует из 1.23 (с), имеют место равенства: arcsin (sinх)=х для любого хє[-π/2, π/2], sin (arcsin х)=х для любого хє[-1,1]. Далее, сужение функции cos на отрезок [0, π] является убывающей функцией и имеет множеством своих значений отрезок [-1,1]. Следовательно, существует обратная к ней функция (также убывающая), определенная на отрезке [-1,1] и имеющая множеством значений отрезок [0, π] . Для этой функции, обозначаемой символом arccоs, имеют место равенства: arccоs (cоs x)=х для любого хє[0, π], cоs (arccоs х)=х для любого хє[-1,1]. Рассмотрим, наконец, сужение функции tg на интервал (-π/2, π/2). Эта функция является возрастающей и имеет множеством своих значений бесконечный интервал R=(-, ). Следовательно, существует обратная к ней функция (также возрастающая), определенная на множестве R и имеющая множеством значений интервал (-π/2, π/2). Для этой функции, обозначаемой символом arctg, имеют место равенства: arctg(tg x)=x для любого хє(-π/2, π/2) и tg(arctgx)=x для любого хєR. Комплексные числа. Введение иррациональных чисел устранило ряд существенных пробелов, имевшихся в системе рациональных чисел (о чем подробно рассказано в предыдущем разделе). Вместе с тем и система действительных чисел обладает существенным недостатком: она не является алгебраически замкнутой. Это означает, что далеко не каждый, отличный от постоянной, многочлен с действительными коэффициентами имеет действительный корень (такой многочлен представляет собой функцию f: R→R, для которой существуют натрульное число n≥1 и действительные числа ао≠0, а1, а2, …, an такие, что при любом xєR f(x)=аохn+а1xn-1+…+an-1х+an). В частности, не имеют решений в действительных числах уравнения вида х2к+а=0, где кєN, аєR, a>0. Другими словами, среди действительных чисел отсутствуют корни четных степеней из отрицательных чисел. Это не позволяет разумно определить понятие степени отрицательного числа с любым рациональным (а тем более-с иррациональным) показателем степени. Указанные обстоятельства (а
132
их список можно продолжить) приводят к необходимости расширения области действительных чисел. При этом от расширенной числовой области требуется, чтобы основные математические операции над числами области не выводили за пределы этой области. В настоящем разделе мы приведем определение понятия комплексного числа и убедимся (после определения операций сложения и умножения комплексных чисел), что всякое действительное число можно рассматривать как частный случай комплексного числа. В дальнейшем (после изучения степенных рядов) мы приведем определения элементарных функций комлексного аргумента и убедимся в алгебраической замкнутости системы комплексных чисел. 2.167 Определение. Комплексным числом называется пара (a,b) двух действительных чисел a и b. В этом разделе комплексные числа будем обозначать (за редким исключением) буквой z с различными индексами. Комплексные числа (0,0), (1,0), (0,1) будем обозначать соответственно буквами θ, е, i (это и есть указанные выше исключения; при этом обозначения θ и е-временные). Заметим, что равенство двух комплексных чисел мы понимаем как их совпадение, т.е. комплексные числа z1=(a1, b1) и z2=(a2, b2) равны тогда и только тогда, когда a1=a2 и b1=b2. 2.168 Определение. Суммой комплексного числа z1=(a1, b1) и комплексного числа z2=(a2, b2) называется комплексное число z=(a1+ +a2, b1+b2). При этом пишут z= z1+ z2. 2.169 Теорема. Сложение комплексных чисел подчинено законам коммутативности и ассоциативности, т.е. для любых комплексных чисел z1, z2, z3 имеют место равенства: z1+ z2= z2+z1 и (z1+ z2)+z3= z1+(z2+z3). Доказательство. Пусть z1=(a1, b1), z2=(a2, b2), z3=(a3, b3) (компоненты всех пар суть действительные числа). Тогда z1+ z2=(a1+ +a2, b1+b2). Так как сложение действительных чисел коммутативно, то z1+ z2= z2+z1. Далее, (z1+ z2)+z3=(a1+a2, b1+b2)+(a3, b3)=((a1+a2)+a3, (b1+b2)+b3). Учитывая свойство ассоциативности сложения действительных чисел, имеем: (z1+ z2)+z3=(a1+(a2+a3), b1+(b2+b3))= =z1+ (z2+z3). Теорема доказана. 2.170. Теорема. Для любого комплексного числа z=(a, b) имеют место равенства: z+θ=z, z+(-а, -b)=θ. Доказательство, ввиду его очевидности, опускаем. Теоремы 2.169 и 2.170 показывают, что множество всех комплексных чисел, расматриваемое вместе с операцией сложения в нем, является абелевой группой. Роль нулевого элемента группы играет число θ, а роль противоположного элемента-z для любого комплексного числа z=(а,в) играет число (-а, - b) (единственность нулевого элемента и
133
единственность противоположного элемента доказаны в 1.28 и 1.29). Множество всех комплексных чисел будем обозначать через С. 2.171 Определение. Произведением комплексного числа z1= =(a1, b1) на комплексное число z2=(a2, b2) называется комплексное число z=(a1a2-b1b2, a1b2+ b1a2). При этом пишут z1z2=z. 2.172 Замечание. Чтобы выяснить смысл определения 2.171, коснемся вопроса о геометрической интерпретации комплексных чисел. Расмотрим плоскость, отнесенную к прямоугольной системе координат ОХY, и каждому комплексному числу z=(a,b) поставим в соответствие радиус-вектор ÎÀ точки А, имеющей число а своей абсциссой, а число b своей ординатой ( при этом будем говорить, что числу θ соотвествует нуль-вектор, т.е. «радиус-вектор» ÎÎ начала координат О). Ясно, что при указанном соответствии радиус-вектор любой точки плоскости соответствует некоторому вполне определенному комплексному числу. Длина радиуса-вектора ÎÀ , соответствующего комплексному числу z=(a,b), т.е. неотрицательное действительное число à 2 b 2 , называется модулем комплексного числа z и обозначается |z|: |z|= à 2 b 2 . Из этого определения следует, что |θ|=0, кроме того, из |z|=0 следует, что z=θ. Если комплексное число z=(a,b)≠θ, то всякое число φєR, удовлетворяющее равенствам: cos a / | z | , sin b / | z | называется значением аргумента числа z. Существование такого числа φ следует из таких соображений. Если построить точку В на плоскости ОХY с абсциссой a/|z| и ординатой b/|z|, то эта точка окажется лежащей на окружности радиуса 1 с центром в начале координат. Рассмотрим угол,
ÎÂ составленный радиусом-вектором с положительным направлением от ОХ и отсчитываемый в положительном направлении (против часовой стрелки) от указанной оси. Радианная мера φ этого угла (т.е. указанный угол содержит φ радиан) и является тем числом, для которого cos φ=a/|z|, sin φ=b/|z|. При этом 0≤φ<2π. Итак, у каждого комплексного числа z≠θ имеется значение аргумента, принадлежащее промежутку [0, 2π). Это значение аргумента будем обозначать argum z (для числа θ значение аргумента не определено). Все значения аргумента числа z≠0 заключены в формуле: φ=argum z+2πк, где к может принимать всевозможные целочисленные значения. Определим еще значение аргумента
134
произвольного комплексного числа z=(a,b)≠0 (это значение аргумента будем обозначать arg z) следующим образом: arg umz, åñëè b 0 arg z = arg um z 2 , åñëè b 0 Это значение аргумента называется главным значением аргумента числа z≠θ и принадлежит промежутку (-π, π]. Если z≠θ и φ=argz≠π, то φ/2 є(-π/2, π/2) и tg φ/2=sin φ/(1+ +cosφ)=(b/|z|)/(1+а/|z|)=b/(|z|+а) (мы считаем, что z=(a,b)). Следовательно, φ/2=arctgb/(|z|+a) и φ=2arctg b/(|z|+a), т.е. argz= =2arctg (b/(|z|+a)). Подчеркнем еще раз, что в этой формуле z=(a,b)≠θ и точка плоскости A (a,b) не лежит на отрицательной полуоси от х-ов. Перейдем к определению сложения и умножения радиусоввекторов любых двух точек плоскости. Пусть A1(a1,b1) и A2 (a2,b2)любые две точки плоскости, отличные от начала координат. Суммой радиусов-векторов ÎÀ 1 и ÎÀ 2 назовем радиус-вектор ÎÀ такой точки А, что отрезок ОА совпадает с диагональю параллелограмма, построенного на отрезках ОА1 и ОА2. Легко видеть, что точка А имеет своей абсциссой число а1+а2, а своей ординатой-число b1+b2. Таким образом, сложение комплексных чисел (см. определение 2.168) определено нами так, чтобы сумме двух радиусов-векторов соответствовала сумма комплексных чисел, отвечающих слагаемым векторам. Обозначим теперь длины векторов ÎÀ 1 и ÎÀ 2 через r1 и r2 соответственно и пусть углы, составляемые этими векторами с положительным направлением оси х-ов (отсчитываемые от этой оси в положительном направлении), равны соответственно φ1 рад. и φ2 рад. Это значит, что для комплексных чисел z1=(a1,b1) и z2=(a2,b2) имеют место равенства: |z1|=r1, |z2|=r2, argum z1=φ1, argum z2=φ2. Произведением радиусов-векторов вектор
ÎÂ
ÎÀ 1 и ÎÀ 2 назовем радиус-
такой точки В, что длина вектора
ÎÂ
равна r1r2, а угол,
составляемый вектором ÎÂ с положительным направлением оси хов (отсчитываемый от этой оси в положительном направлении), равен φ рад., где 1 2 , åñëè1 2 2 φ = 1 2 2 , åñëè1 2 2 Выясним, чему должна быть равна абсцисса а и ордината b точки В. Имеем:
135
a=r1r2cosφ=r1r2cos (φ1+φ2)=r1r2 (cosφ1 cosφ2-sin φ1sin φ2)=а1а2-b1b2 и b=r1r2sinφ=r1r2sin(φ1+φ2)=r1r2(sinφ1cosφ2+cosφ1sinφ2)=b1a2+a1b2. Таким образом, умножение комплексных чисел (см. определение 2.171) определено нами так, чтобы произведению двух радиусоввекторов соответствовало произведение комплексных чисел, отвечающих векторам-множителям. 2.173 Теорема. Умножение комплексных чисел подчинено законам коммутативности и ассоциативности. Доказательство. Пусть z1=(a1,b1), z2=(a2,b2), z3=(a3,b3). Тогда z1z2=(а1а2-b1b2, a1b2+b1a2) и z2z1=(а2а1-b2b1, a2b1+b2a1), так что z1z2=z2z1. Далее, (z1z2)z3=(а1а2-b1b2,a1b2+b1a2)(a3,b3)=(а1а2a3-b1b2a3а1b2b3- -b1a2b3, а1а2b3- b1b2b3+ a1b2a3+ b1a2a3) и z1(z2z3)=(а1,b1)( а2a3-b2b3, a2b3+ b2a3)=(а1а2a3-а1b2b3-b1a2b3- b1b2a3, а1а2b3+ a1b2a3+ b1a2a3- b1b2b3), так что (z1z2 )z3=z1(z2z3). Теорема доказана. 2.174 Теорема. Для любого комплексного числа z имеют место равенства: zе=z, zθ=θ. Если z=(a, b)≠θ, то комплексное число (а/(а2+ +b2), -b/(а2+ b2)), обозначаемое z-1, обладает тем свойством, что zz-1=е. Доказательство. zе=(a, b)(1,0)=(а1-b0, а0+b1)= (a, b)=z, т.е. zе=z. Точно также проверяется, что zθ=θ. Далее, при z≠θ имеем: zz-1=(a, b)(а/(а2+b2), -b/(а2+ b2))=(а2/(а2+b2)-b(-b/(а2+b2)), а(-b/(а2+b2))+ + b(а/(а2+b2))=(1,0)=е, т.е. zz-1=е. Теорема доказана. Следствие. Множество всех комплексных чисел, отличных от θ, замкнуто относительно операции умножения, т.е. если z1≠θ и z2≠θ, то z1z2≠θ. В самом деле, если бы оказалось, что z1z2=θ, то (z1z2)z2-1 =θ z2-1, откуда z1(z2z2-1)=θ или z1е=θ, т.е. z1=θ, что противоречит допущению о числах z1 и z2. Теоремы 2.173 и 2.174 (а также следствие из теоремы 2.174) показывают, что множество всех отличных от θ комплексных чисел, рассматриваемое вместе с операцией умножения, представляет собой абелеву группу. Единичным элементом этой группы служит число е=(1,0), а обратным элементом к любому z=(a, b)≠θ служит число z-1= =(а/(а2+b2), -b/(а2+ b2)). Используя понятия противоположного элемента и обратного элемента, легко доказать существование и единственность разности любых двух комплексных чисел и частного их в случае, когда делитель отличен от θ (понятия разности и частного двух комплексных чисел определяются обычным образом). 2.175 Теорема. Операции сложения и умножения комплексных чисел связаны законом дистрибутивности, т.е. для любых комплексных чисел z1=(а1,b1), z2=(а2,b2) и z3=(а3,b3) имеет место равенство: (z1+z2)z3=z1z3+z2z3. Доказательство. Так как z1+z2=(а1+а2,b1+b2), то (z1+z2)z3=(а1a3+а2a3-b1b3-b2b3,а1b3+a2b3+b1a3+b2a3). С другой стороны,
136
z1z3+z2z3=(а1a3-b1b3,а1b3+b1a3)+(а2a3-b2b3,a2b3+b2a3)=(а1a3+а2a3-b1b3-b2b3, а1b3+a2b3+b1a3+b2a3). Следовательно, (z1+z2)z3=z1z3+z2z3, ч.т.д. 2.176 Теорема. Для любых действительных чисел а и b имеют место равенства: (а,0)+(b, 0)=(а+b, 0); (а,0)(b, 0)=(аb, 0); |(а,0)|=|а| (символ |а| понимается в смысле определения 2.99). Доказательство, ввиду его очевидности, опускаем. Следствие. Для любых действительных чисел а и b имеют место также следующие равенства: (а,0)-(b, 0)=(а-b, 0); (а,0)/(b, 0)=(а/b, 0) при b≠0. 2.177 Замечание. Теорема 2.176 и следствие из нее показывают, что комплексные числа вида (а,0) и действительные числа а обладают одними и теми же арифметическими свойствами. Это позволяет отождествить комплексное число (а,0) с действительным числом а (при любом аєR), после чего множество R всех действительных чисел оказывается подмножеством множества С всех комплексных чисел. В частности, вместо θ и е будем теперь писать соответственно 0 и 1. 2.178. Теорема. Любое комплексное число z=(а, b), может быть записано в виде z=а+bi (каноническая форма записи комплексного числа) или (при z≠0) в виде z=r(cosφ+isinφ) (тригонометрическая форма записи комплексного числа), где r=|z|, а φ-какое-либо (любое) значение аргумента числа z. Доказательство. Так как bi=(b,0)(0,1)=(b·0-0·1, b·1+0·0)=(0,b), то z=(a,b)=(a,0)+(0,b)=a+bi. Далее, пусть z≠0 и φ-какое-либо (любое) значение аргумента числа z. Тогда a=rcosφ, b=rsinφ и z=a+bi=rcosφ+(rsinφ)i. Пользуясь теоремами 2.173 и 2.175, можем написать z=rcosφ+r(sinφi)= r(cosφ+isinφ), ч.т.д. 2.179 Теорема. Комплексные числа i=(0,1) и –i=(0,-1) являются значениями квадратного корня из -1, т.е. i2=-1 и (-i2)=-1. Доказательство. i2=(0,1)(0,1)=(0·0-1·1, 0·1+1·0)=(-1,0)=-1; (-i)2= =[(-1)i] [(-1)i]=(-1)2i2=i2=-1 (мы воспользовались ассоциативностью и коммутативностью умножения комплексных чисел). 2.180 Теорема. Для любых двух комплексных чисел z1 и z2 имеют место соотношения: |z1z2|=|z1|·|z2|; |z1+z2|≤|z1|+|z2|. Доказательство. Пусть z1= (a1, b1), z2 = ( a2, b2 ). Тогда z1z2= (а1а2-b1b2,a1b2+b1a2) и |z1z2|= 2 2 2 2 2 2 2 2 = (à1à2 b1b2 ) 2 (a1b2 b1a2 ) 2 = a1 a2 b1 b2 a1 b2 b1 a2 =
(a1 b1 )(a2 b2 ) = (a1 b1 ) 2
2
2
2
2
2
(a2 b2 ) =|z1|·|z2|. 2
2
Далее
137
(а1а2+b1b2)2=а21а22+2 а1а2b1b2+b21b22=а21а22+b21b22+2(а1b2)( b1а2)≤ а21а22+ +b21b22+а21b22+b21а22=(а21+b21)(а22+b22), откуда |а1а2+b1b2|≤|z1|·|z2|. Следовательно, |z1+z2|= (à1 à2 ) 2 (b1 b2 ) 2 = | z1 |2 | z 2 |2 2(à1a2 b1b2 ) ≤ | z1 |2 | z 2 |2 2 | z1 || z 2 | = (| z1 | | z 2 |) 2 =|z1|+|z2|, ч.т.д. 2.181 Замечание. Соотношения, доказанные в 2.180 становятся очевидными, если учесть геометрический смысл сложения и умножения комплексных чисел (2.172). Равенство |z1z2|=|z1|·|z2| можно доказать и так. Пусть z1=r1(cosφ1+isinφ1), z2=r2(cosφ2+isinφ2), где r1=|z1|≥0, r2=|z2|≥0. Тогда z1z2=r1r2[cosφ1cosφ2-sinφ1sinφ2+ +i(sinφ1cosφ2+cosφ1sinφ2)]=r1r2[cos(φ1+φ2)+isin(φ1+φ2)], откуда
2 2 |z1z2|= r1 r2 cos 2 (1 2 ) sin 2 (1 2 ) = r1r2=|z1|·|z2|. Кроме того, мы видим, что при умножении комплексных чисел сумма значений аргумента сомножителей есть значение аргумента произведения. Индукцией по числу nєN легко доказать, что если z1= =r1(cosφ1+isinφ1), z2=r2(cosφ2+isinφ2), …, zn=rn(cosφn+isinφn), то z1z2…zn=r1 r2 …rn[cos(φ1 +φ2+…+φn)+ isin(φ1+φ2+…+φn)]. В частности, если z=r(cosφ+isinφ), то zn=rn(cosnφ+isinnφ). При r=1 получим так называемую формулу Муавра: (cosφ+isinφ)n=cosnφ+isinnφ (степень комплексного числа z с натуральным показателем, а затем, при z≠0, и с любым целым показателем-определяется обычным образом, как и для действительных чисел). Заметим еще, что для любых двух комплексных чисел z1 и z2 справедливо неравенство |z1-z2|≥ ||z1|-|z2||. В самом деле, из равенства z1=z2+(z1-z2) следует, что |z1|= |z2+(z1-z2)|≤ |z2|+|z1-z2|, откуда |z1-z2|≥|z1|-|z2|. Аналогично доказывается, что |z2-z1|≥|z2|-|z1|. Так как |z2-z1|=|z1-z2| и одно из чисел |z1|-|z2|, |z2|-|z1| равно ||z1|-|z2||, то |z1-z2|≥ ||z1|-|z2||, ч.т.д. 2.182 Определение. Пусть z=(a,b)=a+bi есть произвольное комплексное число. Комплексное число (a, -b)=a-bi называется сопряженным с z и обозначается z . Так как очевидно, z является споряженным с z , то можно говорить о взаимно сопряженных комплексных числах. Ясно, что z =z тогда и только тогда, когда z-действительное число. Кроме того, для любого z=(a,b) z+ z есть действительное число (равное 2а) и z z есть действительное число: z z = (a+bi)(a-bi)=a2-(bi)2=а2+b2=|z|2. 2.183 Теорема. Для любых двух комплексных чисел z1 и z2 имеют место равенства:
z1 z2 = z1 z2 и z1 z2 = z1 z2 .
138
Доказательство. Пусть z1=a1+b1i, z2=a2+b2i . Тогда
z1 z2 =
z1 =а1-b1i, z 2 = а2-b2i, так что z1 z2 =(а1+а2)(b1+b2)i= z1 z2 . Далее, z1 z2 =(а1а2-b1b2)-(а1b2+ b1а2)i, z1 z2 = =(а1-b1i)(а2-b2i)=(а1а2-b1b2)-(а1b2+ b1а2)i= z1 z2 , ч.т.д. =(а1+а2)-(b1+b2)i,
Следствие. Если а0, а1, …, аn-1, an-действительные числа (nєN, n≥1) и z-такое комплексное число, что а0zn+a1zn-1+…+an-1z+an=0, то и а0( z )n+ a1( z )n-1+…+ an-1 z + an=0. 2.184. Теорема (неравенство Шварца). Если z1, z2,…, zn и w1, w2, …,wn-комплексные числа, то 2
n
z w i
i 1
n
n
| z | | w | ≤ 2
i
i
i 1
2
i 1
i
. n
n
Доказательство.
Обозначим
|z А= i 1
i
|
2
|w | В=
2
,
i 1
i
,
n
С=
z i 1
i
wi . Если В=0, то при всех i wi =0 и подлежащее
доказательству неравенство очевидным образом выполняется. Пусть В≠0, т.е. В>0. Расcмотрим сумму неотрицательных действительных n
| Âz
чисел
i 1
n
| Âz i 1
n
i 1
Cwi |2 , которую преобразуем следующим образом:
Cwi |2 =
i
Bz
i
i
Cwi Bzi C wi B 2 A BC C BCC CC B В(АВ-|С|2). n
Итак, В(АВ-|С|2)=
| Âz i 1
i
Cwi |2 , откуда АВ-|С|2≥0 и |С|2≤АВ,
ч.т.д. 2.185 Замечание. Легко видеть, что в неравенстве Шварца равенство имеет место в том и только в том случае, когда найдутся два таких комплексных числа к и m, из которых хотя бы одно отлично от нуля, что при всех i =1,2,…,n kzi mwi 0 .В самом деле, пусть указанное условие выполняется и, например, m≠0. Тогда при всех i wi zi (μ=-k/m) и обе части неравенства Шварца окажутся n
2 равными числу |μ| ( | z i | )2. Обратно,пусть в неравенстве Шварца
2
i 1
139 n
имеет
место
равенство,
т.е.
2
АВ=|С| .
Тогда
| Âz i 1
i
Cwi |2 =
=В(АВ-|С| )=0, откуда Bz i Cwi 0 при всех i =1, 2, …, n. Если при 2
этом В=0, то wi 0 при всех i , так что при всех i =1, 2, …, n выполняются равенства: 0 zi 1 wi 0 (к=0, m=1). Если же В≠0, то в качестве чисел к и m можно взять соответственно числа В и –С. 2.186 Определение. Если z-любое заданное комплексное число и n-любое заданное натуральное число, то любое комплексное число w, удовлетворяющее равенству wn=z, будем называть значением корня n-ой степени из числа z. Ясно, что при z=0 и любом nєN имеется единственное значение корня n-ой степени из числа z, равное 0. 2.187 Теорема. Если zєС и z≠0, то при любом nєN существует ровно n различных значений корня n-ой степени из z. Доказательство. Если n=1, то ясно, что единственным значением корня 1-ой степени из числа z является само число z. Пусть n≥2. Обозначим |z|=r. Если φ-любое значение аргумента числа z, то для комплексного числа w= n r (cos φ/n+isin φ/n) имеем: n r мы понимаем, как всегда, wn=r(cosφ+isinφ)=z (под арифметическое, т.е. действительное и положительное значение корня n-ой степени из положительного числа r). Следовательно, число w указанного вида является значением корня n-ой степени из числа z. Убедимся, что всякое значение корня n-ой степени из z
n
r (cosφ/n+isin φ/n), где φ-некоторое значение аргумента имеет вид числа z. В самом деле, пусть w-какое-нибудь значение корня n-ой степени из z, т.е. wn=z . Обозначим |w|=ρ, argz=φ0, argw=ψ (ясно, что w≠0, так что argw существует). Тогда w=ρ(cos ψ+isin ψ), откуда r(cosφ0+isinφ0)=z=wn=ρn (cosnψ+ isinnψ). Следовательно, ρn=r, cosnψ= =cosφ0, sin n ψ=sinφ0. Из равенства ρn= r следует (так как r>0 и ρ>0), n что ρ= r , а из системы равенств cosφ0-cosnψ=0, sinφ0-sinnψ=0 следует, что sin ((φ0-n·ψ)/2)=0. Значит, (φ0-n·ψ)/2=кπ при некотором
целом к, откуда ψ=
0 2ê n
. Обозначив φ0-2кπ=φ, можем заключить,
что φ-есть некоторое значение аргумента числа z. Так как при этом ψ=φ/n, то w=
n
r(
cosφ/n+isin φ/n), в чем мы и хотели убедиться. 2ê n 2ê Введем обозначение wк= r (cos 0 +isin 0 ) и покажем, n
n
что числа w0, w1, …, wn-1, являющиеся значениями корня n-ой степени из z,-попарно различны. Допуская противное, будем иметь: wi =wj при некоторых целых i , j, таких, что 0≤ i <j≤n-1. Следовательно, будут иметь место равенства:
140
cos
0 2i n
-cos
0 2 j n
откуда (как и выше) 1/2(
и
=0
sin
0 2i n
0 2 j 0 2i
-sin
0 2 j n
=0,
)=кπ или (j- i )/n=к при n n некотором целом положительном к. Но последнее равенство невозможно, ибо 0<j- i ≤n-1. Полученное противоречие доказывает, что числа w0, w1, …, wn-1, (являющиеся значениями корня n-ой степени из z) попарно различны. Остается доказать, что любое число w, являющееся значением корня n-ой степени из z, совпадает с одним из чисел w0, w1, …, wn-1. В самом деле, согласно вышедоказанному w=
n
r (cos
+isin ), где φ-некоторое значение n n
аргумента числа z. Так как и φ0 является значением аргумента числа z, то φ=φ0+2πm, где m-некоторое целое число. Представляя число m в виде m=nq+r, где qєZ, rєZ и 0≤r≤n-1, мы убеждаемся в том, что w действительно совпадает с одним из чисел w0, w1, …, wn-1. Возможность указанного представления числа m очевидна при m=0. При mєN она вытекает из теоремы 1.73. При mєZ и m<0 имеем: –m=nq+r, где qєN, rєZ и 0≤ r≤ n-1. Если r=0, то полагаем q=-q, r=0. Если же r≥1, то m=n(-q)-r=n(-q-1)+n-r и мы полагаем q= =-(q+1), r=n-r. Теорема доказана. 2.188 Обозначения. В некоторых случаях (которые будут оговорены) мы будем обозначать то или иное значение корня n-ой n
z . В этих случаях степени из комплексного числа z символом арифметическое значение корня n-ой степени из положительного действительного числа будем обозначаться символом Например, мы будем писать
n
z
n
| z | (cos +isin ),
n
... .
указывая n n при этом, какое именно значение аргумента числа z представляет собой φ. 2.189 Теорема. Последовательность положительных 1 рациональных чисел (xn), где xn=(1+ )n (n=1, 2, 3,…),-является n строго возрастающей и ограниченной сверху. Доказательство. Предварительно заметим, что возрастающая последовательность действительных чисел-это частный случай возрастающей функции f:A→R (при А=N), определенной в 2.142. Ограниченность сверху последовательности (xn) означает ограниченность сверху множества действительных чисел, являющихся членами этой последовательности. Переходя к доказательству теоремы, преобразуем выражение для xn по формуле Ньютона: =
141
1 1 1 1 1 xn=1+С1n· +С2n· 2 +…+ Скn· ê +…+Сnn· n =2+1/2!(1- )+ n n n n n 1 2 1 1 ê 1 1 1 2 +1/3!(1- )(1- )+…+ (1- )…(1)+…+ (1- )(1- )…х n n n n n n ê! n! n 1 х(1). n Если увеличить n на единицу, т.е. перейти от xn к xn+1, то будем иметь: n 1
xn+1=2+ ê 2
n
ê 1 ê 1 1 1 1 1 (1)…(1)>2+ ê (1)…(1)>2+ 2 ê! n 1 n 1 n 1 n 1 ê!
n
1 1 ê 1 (1- )…(1)=xn, т.е. xn<xn+1 (при любом n=1, 2, 3,…). n n ê! Отсюда легко вывести, что из n<m следует xn<xm, а это и означает, что последовательность (xn)-возрастающая. Далее, при любом n≥2 1 1 1 1 xn<2+ +…+ ≤2+ 1 +…+ n 1 . Из легко проверяемого тождества 2! n! 2 2 (справедливого при любом комплексном числе z) zn-1=(z-1)(1+z+…+ 1 zn n-1 n-1 +z ) следует, что при z≠1 1+z+…+ z = . Поэтому (беря 1 z 1 z 1 z= ) для xn получаем такую оценку: 2 + ê 2
n 1
1 1 1 xn<1+(1+ +…+ n 1 )=3- <3. Так как x1=2, то при всех nєN xn<3, 2 2 2 ч.т.д. 2.190. Замечание. Утверждение о том, что последовательность (xn) является строго возрастающей, можно доказать также следующим образом. Так как n 2 n1 n ( ) n 2 2n n 2 1 n2 n 1 xn+1/xn= n 1 = 2 =(1- 2 )n ≥ n 2n 1 n 1 ( ) n n 2n 1 n 1 n n n 2 (n 2 n 1)(n 2) n 3 3n 2 3n 2 ≥(1- 2 ) = = 3 >1,то (n 1) 3 n 3n 2 3n 1 n 2n 1 n 1 xn< xn+1. При этом мы воспользовались неравенством (1+х)n≥1+nx, справедливость которого при x>-1 и любом nєN легко доказывается индукцией по числу n. Аналогично предыдущему легко доказать, что n+1 последовательность (yn), где yn=(1+1/n) (n=1,2,3,…), -является убывающей:
142
n 1 n1 n 1 ) (n 1) 2 n 1 yn 1 n 1 n = n 2 n 2 = 2 =(1+ 2 )n+1 ≥ n 2 n y n 1 ( n 2 n 2 n 2 n ) n 1 n 1 n 1 (n 2 3n 1)(n 1) n 3 4n 2 4n 1) (1+ 2 ) = = >1. (n 2 2n)(n 2) n 3 4n 2 4n n 2n n 2 Исходя из этого, можно иначе, чем это сделано выше, доказать ограниченность сверху последовательности (xn): xnm, то xn< yn 0). 2.192 Теорема. При любом nєN xn=(1+1/n)n<е и е- xn<3/n Доказательство. В силу самого определения числа е xn ≤е при любом nєN. Если бы при некотором nєN было xn=е, то оказалось бы, что xn+1> xn=е, т.е. xn+1>е. Так как это противоречит определению числа е, то действительно при всех nєN xn<е. Далее, в силу доказанного в 2.190, величина ym=(1+1/m)m+1 при любом mєN является верхней границей множества Е, состоящего из чисел вида (1+1/n)n, nєN. Следовательно, при любом mєN e≤ ym. Ясно, что на самом деле равенство здесь не может иметь места, т.е. e< ym при всех mєN. Поэтому при любом nєN xn<e< yn, откуда 0<e-xn< yn- xn или 0<e-xn<xn/n. Учитывая, что xn<e≤3 (см. 2.189), окончательно получаем: 0<e-xn<3/n, ч.т.д. 2.193 Определение. Степенью числа е с комплексным показателем z=x+iy (x, yєR) называется комплексное число, обозначаемое ez и равное ex(cos y+isin y), где символ ex понимается в смысле определения 2.134 (при рациональном х) или в смысле определения 2.144 (при иррациональном х). (
143
2.194 Замечание. Ясно, что если z-действительное число, т.е. y=0, то и ez есть действительное число, определенное в 2.134 (при рациональном z) или в 2.144 (при иррациональном z). Следовательно, определение 2.193 не вступает в противоречие с определениями 2.134 и 2.144. Далее, введя обозначения x=Rez (реальная часть числа z), y=Imz (мнимая часть числа z), можем сделать следующий вывод: ez является действительным числом тогда и только тогда, когда Imz=кπ (к=0, 1, 2, …); кроме того, |ez|=eRez. При Rez=0 получаем следующий результат (формула Эйлера): eyi=cos y+isin y (yєR). 2.195 Теорема. Для любых z, wєC ez+w= ezew. Доказательство. Пусть z=x+iy, w=u+iv, где x, y, u, vдействительные числа. Тогда ezew=ех(cosy+isiny) еu(cosv+isin v)= =ех+ucosy·cosv-siny·sinv+i(siny·cosv+cosy·sinv)=ех+ucos(y+v)+ +isin(y+v)=ez+w, ч.т.д. 2.196 Замечание. При доказательстве мы использовали теорему 2.148. 2.197 Теорема. Если z≠w , то равенство ez=ew имеет место тогда и только тогда, когда w- z=2кπi, к=1, 2, … Доказательство. Если w- z=2кπi, то ew=ez+2кπi= eze2кπi=ezx x(cos2кπ+ isin2кπ)=ez. Обратно, если ew=ez, то из равенства ew=ew-zez следует, что ew-z=1. Пусть z=х+iy, w=u+iv где x, y, u, vдействительные числа. Тогда 1=еw-z=eu-x·cos(v-y)+isin(v-y)=1, откуда sin(v-y)=0, eu-x·cos(v-y)=1, т.е. u-x=0, cos(v-y)=1, sin(v-y)=0. Из этих равенств и следует, что w-z=2кπi, где к может быть любым целым числом, кроме 0 (ибо z≠w). Теорема доказана. 2.198 Замечания. Из доказанного следует, что функция f:C→C, для которой f(z)=ez при любом zєC,-периодическая. Это означает, что существует такое комплексное число Т≠0, называемое периодом функции, что f(z+T)=f(z) при любом zєC. Рассматриваемую функцию будем называть экспоненциальной и обозначать символом exp. Как показано нами в 2.197, все периоды экспоненциальной функции заключены в формуле: Т=2кπi, где к-любое целое число, отличное от нуля. Заметим еще, что если z-действительное число, то степень ez= =exp (z) есть действительное число, которое раньше мы обозначали бы expе (z). Пусть теперь а- любое положительное действительное число (a≠1). При любом xєR степень ах (определенная в 2.134, 2.144 и 2.150) может быть записана следующим образом: ах=(elna)x=eхlna. Определим степень az с любым комплексным показателем z, полагая az=ezlna. Если z=x+iy, то az= ах cos (ylna)+ isin (ylna). При а>0 и а≠1 можем распространить функцию expа:R→R+ на множество всех комплексных чисел, т.е. расcматривать функцию expа:С→С, для которой expа(z)=az при любом zєС.
144
Заметим еще, что из формулы Эйлера (которая сама является следствием определения 2.193) следует справедливость следующих равенств: cosy=(eyi+e-yi)/2, siny=(eyi-e-yi)/2i, где y-любое действительное число. 2.199. Определения и обозначения. Тригонометрические функции cos:С→С и sin:С→С определим равенствами: cosz= =(ezi+e-zi)/2, sin z=(ezi-e-zi)/2i, где z- любое комплексное число. Тригонометрическую функцию tg определим равенством tgz=sinz/cosz (при cosz≠0). Гиперболическим косинусом будем называть функцию (определенную на множестве С и со значениями в С), обозначаемую символом ch, для которой chz=(ez+e-z)/2 при любом zєC. Гиперболическим синусом будем называть функцию, обозначаемую символом sh (sh:C→C), для которой shz=(ez-e-z)/2 при любом zєC. Гиперболическим тангенсом будем называть функцию, обозначаемую символом th, для которой thz=shz/chz (при chz≠0). 2.200 Замечание. Опираясь на теорему 2.197, легко доказать, что предоставляется читателю, что sinz обращается в 0 только при действительных значениях z, а именно при z=кπ, к=0, 1, 2, …Точно так же доказывается, что cosz обращается в 0 только при действительных значениях z, а именно при z=(2к+1)(π/2), к=0, 1, 2, … Так как, очевидно, сhz=cos(iz), shz=-isin(iz), то можно сделать следующий вывод: shz обращается в 0 только при значениях z вида z=кπi, к=0, 1, 2, …; chz обращается в 0 только при значениях z вида z=(2к+1)(π/2)i, к=0, 1, 2, …. Далее, из определения функций cos и sin следует, что формула Эйлера ezi=cosz+isinz оказывается справедливой при любом zєC. Кроме того, из формул cos(iz)=chz, sin(iz)=ishz следует, что при достаточно больших по абсолютной величине действительных значениях z величины cos(iz), sin(iz) могут принимать сколь угодно большие по модулю значения. Легко проверить, что формулы сложения для тригонометрических функций, справедливые при действительных значениях аргумента, остаются справедливыми и для комплексных значений аргумента. Пусть, например, z и w-любые комплексные числа. Тогда sinz·cosw=
åzi e zi åwi e wi å( z w)i e( z w)i e( w z )i e ( z w)i = · = и 4i 2i 2 å( z w)i å( w z )i e( z w)i e ( z w)i cosz ·sinw= , откуда 4i
145
å( z w)i e ( z w)i sinz·cosw+cosz·sinw= =sin(z+w). 2i
Аналогично
доказывается формула сложения для функции cos. Из справедливости формул сложения следует справедливость формул приведения для тригонометрических функций комплексного аргумента. Легко проверяется также справедливость формулы sin2z+ cos2z=1 для любого zєC. В самом деле,
å2 zi 2 e 2 zi å2 zi 2 e 2 zi sin z+ cos z= + =4/4=1. 4i 2 4 2
2
2.201. Определение. Пусть z-любое комплексное число, отличное от 0. Значением логарифма числа z будем называть любое комплексное число w, для которого ew=z. 2.202 Теорема. Если zєC и z≠0, то всякое комплексное число вида w=ln|z|+iφ, где φ-любое значение аргумента числа z, является значением логарифма числа z. Обратно, всякое число w, являющееся значением логарифма числа z, представимо в виде w=ln|z|+iφ, где φнекоторое значение аргумента числа z. Доказательство. Если φ-любое значение аргумента числа z, то z=|z|(cosφ+isinφ). Беря комплексное число w=ln|z|+iφ, будем иметь: ew=eln|z|(cosφ+isinφ)=|z|(cosφ+isinφ)=z. Это и означает, что число w=ln|z|+iφ является значением логарифма числа z. Обратно, пусть число w=u+iv (где u, vєR) является значением логарифма числа z, т.е. ew= z . Тогда eu (cosv+isinv)=z, откуда |z|=eu и u=ln|z|. Кроме того, z=|z|(cosv+isinv), откуда следует, что v является некоторым значением аргумента числа z. Итак, w=ln|z|+iv, где v-некоторое значение аргумента числа z, чем и завершается доказательство теоремы. 2.203 Определение. Главным значением логарифма любого комплексного числа z≠0 будем называть число ln|z|+iargz, которое будем обозначать символом Lnz:Lnz= ln|z|+iargz. 2.204 Замечание . Если z-действительное положительное число, то argz=0 и Lnz=lnz, так что функция ln является сужением функции Ln на множество R+. Далее, так как любое значение аргумента числа z≠0 отличается от argz на величину 2кπ при некотором целом к, то любое значение логарифма числа z отличается от Lnz на величину 2кπi (при некотором целом к). Заметим еще, что равенство Ln(z1z2)=Lnz1+Lnz2 (z1≠0, z2≠0) выполняется в том и только в том случае, когда имеет место система неравенств: -π< argz1+argz2≤π. Например, если argz1>π/2 и argz2>π/2, то равенство Ln(z1z2)= =Lnz1+Lnz2 не выполняется. Однако, при любых z1 и z2, отличных от 0, сумма Lnz1+Lnz2 является значением логарифма числа z1z2..
146
2.205. Определение. Любое комплексное число w, удовлетворяющее равенству tgw=z, будем называть значением арктангенса числа z. 2.206 Теорема. Для комплексных чисел z=i значений арктангенса не существует. Для любого числа z≠ i существует бесконечное множество значений арктангенса. Если при этом wзначение арктангенса числа z (т.е. tgw=z), то 2iw является значением логарифма числа (1+iz)/(1-iz). И обратно, всякое значение логарифма числа (1+iz)/(1-iz), поделенное на 2i, является значением арктангенса числа z≠ i. Доказательство. Пусть w-значение арктангенса комплексного числа z, т.е. tgw=z. Это равенство, как легко видеть, равносильно равенству (e2iw-1)/(e2iw+1)=iz, откуда e2iw-1=iz (e2iw+1). Но последнее равенство, очевидно, не может иметь места при z=-i; при z= i оно также не может иметь местa, ибо никакая степень числа e не может равняться 0. Следовательно, для чисел z=i значений арктангенса не существует. Пусть z≠ i. Тогда из равенства tgw=z следует (как вышедоказано) равенство e2iw-1=iz (e2iw+1), откуда e2iw=(1+iz)/(1-iz). Так как (1+iz)/(1-iz) ≠0, то 2iw является значением логарифма числа =(1+iz)/(1-iz). Обратно, пусть z≠ i и w есть поделенное на 2i значение логарифма числа (1+iz)/(1-iz). Тогда e2iw=(1+iz)/(1-iz), откуда e2iw-1=iz·(e2iw+1). Так как (1+iz)/(1-iz)≠-1, то e2iw+1≠0. Следовательно, должны иметь место равенства (e2iw-1)/(e2iw+1)=iz, (eiw-e-iw)/(eiw+e-iw)=iz, sinw/cosw=z, tgw=z, ч.т.д. 2.207Определение. При z≠i число 1 iz 1 iz 1 1 iz 1 Ln = (ln +iarg ) будем называть главным 1 iz 2i 1 iz 2i 1 iz значением арктангенса числа z и обозначать символом Arctgz: 1 iz 1 Arctgz= Ln 2i 1 iz 2.208 Замечание. Пусть z-действительное число. Тогда число 1 iz не может равняться отрицательному действительному числу, 1 iz 1 iz так что выполняются неравенства: -π<arg <π. Кроме того, 1 iz 1 iz 1 iz =1 и потому число Arctgz=1/2i(ln1+iarg )= 1 iz 1 iz 1 iz 1 = arg оказывается принадлежащим интервалу (-π/2,π/2). 2 1 iz Следовательно, при действительных значениях z Arctgz=аrctgz, т.е. функция аrctg является сужением функции Arctg на множество R. Легко убедиться в том, что функция Arctg принимает действительные значения только при действительных значениях z. В
147
1 iz 1 1 iz 1 самом деле, Arctgz= arg - ln i, так что Arctgz является 2 1 iz 2 1 iz 1 iz действительным числом только при условии, что =1. 1 iz 1 iz (1 y ) ix Обозначив z=x+iy (x, yєR), убеждаемся, что = . 1 iz (1 y ) ix 1 iz Поэтому условие =1 равносильно условию (1-y)2+x2=(1+y)2+x2, 1 iz откуда y=0, т.е. z является действительным числом. Выясним еще, 1 iz при каких значениях z≠i дробь будет действительным 1 iz отрицательным числом. Полагая z=x+iy (x, yєR), имеем: 1 iz 1 y ix (1 ix ) 2 y 2 1 x 2 y 2 2 xi = = = . Это число будет (1 y ) 2 x 2 1 iz 1 y ix (1 y ) 2 x 2 действительным тогда и только тогда, когда х=0, т.е. z=yi. При этом 1 iz 1 y = . Эта дробь становится отрицательной при y>1, а также 1 iz 1 y при y<-1. Обозначим через Е следующее множество чисто мнимых чисел: Е={zєC: z=yi, где y≥1 или y≤-1}. Через R─ будем обозначать множество, состоящее из 0 и всех отрицательных действительных чисел. Пусть также f: C\E→C есть функция, для которой f(z)= 1 iz при любом zєC\Е. Согласно доказанному, значения функции f 1 iz принадлежат множеству C\R─ и, кроме того, 1/2i(Ln◦f)(z)=Arctgz для любого zєC\Е. Этим результатом мы позже воспользуемся. 2.209. Определение. Любое комплексное число w, удовлетворяющее равенству sinw=z, будем называть значением арксинуса числа z (zєC). 2.210 Теорема. Для любого комплексного числа z существует бесконечное множество значений арксинуса. Если w-значение арксинуса числа z, то число iw является некоторым значением
логарифма числа iz+ 1 z , где под 1 z понимается одно из двух значений квадратного корня из 1-z2. И обратно, если w есть 2
2
2 поделенное на i любое значение логарифма числа iz+ 1 z , где
1 z 2 есть любое значение квадратного корня из 1-z2,-то w есть значение арксинуса числа z. Доказательство. Пусть w- значение арксинуса числа z, т.е. sinw=z. Тогда (eiw-e-iw)/2i=z, откуда e2iw-2izeiw-1=0 и (eiw-iz)2=1-z2. Следовательно, число eiw-iz есть одно из двух значений квадратного
148
1 z 2 . С учетом этого можем
корня из 1-z2, которое обозначим
2 написать: eiw =iz+ 1 z , т.е. iw является некоторым значением 2 логарифма числа iz+ 1 z . Обратно, пусть w есть поделенное на i
любое
значение
логарифма
числа
2 iz+ 1 z ,
где
под
1 z 2 понимается любое значение квадратного корня из 1-z2. Тогда eiw =iz+ 1 z и (eiw-iz)2=1-z2, откуда e2iw-2izeiw-1=0 и (eiw-e-iw)/2i=z, т.е. sinw=z. Так как при любом выборе значения корня квадратного из 1-z2 существует бесконечное множество значений 2
логарифма числа iz+ 1 z (заметим, что iz+ 1 z ≠0 при любом zєC), то существует и бесконечное множество значений арксинуса числа z при любом zєC. 2.211. Определение. При любом zєC кроме действительных z с 2
2
1 2 Ln(iz+ 1 z ), где (при i arg(1 z 2 ) arg(1 z 2 ) 2 2 1 z = 1 z [cos +isin ],2 2
|z|>1
число
z≠1) будем
называть главным значением арксинуса числа z и обозначать символом Arcsinz:
1 2 Arcsinz= Ln(iz+ 1 z ). i 2.212
Замечание.
Пусть
z-действительное
число,
2 удовлетворяющее условию |z|≤1 (т.е. -1≤ z≤1). Тогда | iz+ 1 z |=1
и
2 Re(iz+ 1 z )≥0,
так
что
2 arg(iz+ 1 z )є[-π/2,
π/2].
Следовательно, Arcsinz=1/i[ln1+iarg(iz+ 1 z )]= arg(iz+ 1 z ) представляет собой действительное число, заключенное в промежутке [-π/2, π/2] (и такое, что sin(Arcsinz)=z). Поэтому при zєR и |z|≤1 Arcsinz=аrcsinz, т.е. функция аrcsin является сужением функции Arcsin на множество [-1;1]. Выясним, при каких значениях zєС выражение 1-z2 представляет собой действительное отрицательное число или 0. Обозначив z=x+iy (x, yєR) будем иметь: 1-z2=1+y2-x2-2xyi. Это выражение будет принадлежать R─ тогда и только тогда, когда x и y удовлетворяют системе: xy 0 y 0 ↔ . 2 2 1 y x 0 | x | 1 Итак, принадлежность 1-z2 є R─ имеет место тогда и только тогда, когда zє R и |z|≥1. Обозначим через F следующее множество действительных чисел: 2
2
149
F={ zє R: |z|≥1} Если zєC\F, то, согласно доказанному, 1-z2 єС\R─. Убедимся, 2 что и выражение iz+ 1 z при любом zєС не может равняться
действительному отрицательному числу (здесь 1 z понимается в смысле определения 2.211). Допуская противное, будем иметь: 2
2 iz+ 1 z =-а, где z-некоторое комплексное число, ає R и а>0. à2 1 2 2 2 Тогда 1-z =а +2аiz-z , откуда z= i. Но при таком z 2à
(à 2 1) 2 1 à 2 à 2 1 1 à2 1 iz+ 1 z = + = + =1/а. получается, 4à 2 2à 2à 2à что –а=1/а, откуда а2=-1, что противоречит допущению о числе а. Полученное противоречие доказывает, что при любом zєС 2
iz+ 1 z єС \ R─. Полученные результаты будут использованы в дальнейшем, при изучении непрерывности и дифференцируемости функций комплексной переменной. (Заметим, что на определении Arcsinz при действительных z с |z|>1 мы не останавливаемся.) 2
Упражнения к главе 2. 1. Доказать, что если n-любое натуральное число, не меньшее 2 (n≥2) и х1, х2, …, xn –любые неотрицательные действительные числа, то x1 x2 ... xn n x x ... x 1 2 n ≤ n Указание. Сперва доказать неравенство для чисел n вида 2к (к=1, 2, …, m, …) при любых неотрицательных х1, х2, …, xn. Доказательство провести индукцией по числу к. Затем доказать, что если неравенство верно для какого-либо натурального n≥3 и любых неотрицательных х1, х2, …, xn, то оно останется верным и для числа n-1 и любых неотрицатльных х1, х2, …, xn-1. С этой целью, задавшись любыми неотрицательными x1 x2 ... xn действительными числами х1, х2, …, xn-1 и взяв хn= , n 1 рассмотреть верное неравенство x x ... xn1 x1 x2 ... xn1 1 2 õ õ ... õ 1 2 n1 n 1 n x x ... x 1 2 n1 ≤ и n 1 n получить нужное следствие из него. Затем, опираясь на все доказанное, установить справедливость неравенства для любого натурального числа n≥2 и любых неотрицательных действительных чисел х 1, х2, …, xn (доказательство вести «от противного»).
150
Заметим, что n x1 x2 ... xn называется средним геометрическим чисел х1, х2, …, xn, а число
x1 x2 ... xn называется средним n
арифметическим чисел х1, х2, …, xn. 2.Найти наименьшее значение суммы х1+х2+…+xn, в которой действительные положительные слагаемые х1, х2, …, xn подчинены единственному условию: х1х2 …xn=1. 3. Доказать, что если х1, х2, …, xn-действительные положительные числа и 1 1 1 х1+х2+…+xn=1, то + +…+ ≥n2 (nєN, n≥1). x1 x2 xn 1 1 1 Указание. Рассмотреть произведение (х1+х2+…+xn)( + +…+ ) или x1 x2 xn 1 1 1 применить упр. 1 к числам , ,..., . x1 x2 xn 4. Пусть n-любое натуральное число и а1, а2, …, аn и b1, b2, …, bn-любые два набора действительных чисел. Доказать неравенство Коши-Буняковского
b1 ... bn , |а1b1+а2b2+…+ +аnbn|≤ à1 ... à n исходя из расмотрения функции f: R→R, определяемой равенством: f(x)=(a1x+b1)2+( a2x+b2)2+…+ (anx+bn)2 для любого xєR. 5. Пусть n-натуральное число, n≥2 и а1, а2, …, аn и b1, b2, …, bn такие два набора действительных чисел, что а1≤ а2≤ …≤ аn и b1≤ b2≤ …≤ bn. Доказать, что при этих условиях справедливо неравенство Чебышева: (а1+ а2+ …+ аn)(b1+b2+ …+bn) ≤n( а1b1+ а2b2+…+аnbn), причем равенство достигается тогда и только тогда, когда либо а1=а2= …= аn, либо b1=b2= …=bn. Указание. Введя обозначения εкi=bk-bi, δki=ak-ai, где к принимает значения 2, …, n, а при каждом значении к индекс i принимает значения 1, 2, …, к-1, доказать индукцией по числу n равенство: (а1+а2+ …+ аn)(b1+b2+ 2
2
n
…+bn)=n( а1b1+ а2b2+…+аnbn)-
k 1
· k 2
2
i 1
ki
2
ki . Предварительно заметить,
что при i
151
откуда следует, что b1=b2= …=bn. Если же δn1=0, то аn =а1, откуда а1= а2= …= аn. 6. Доказать, что для каждого натурального числа n найдется такое натуральное число m, что ( 2 -1)n= m - m 1 . Указание. Рассмотреть отдельно случай четного n и случай нечетного n. Доказать индукцией по числу к (кєN), что( 2 -1)2к=хк-yк 2 , где хк и yкнатуральные числа, причем х2к-2y2к=1. Доказать также индукцией по числу к, что ( 2 -1)2к-1=Рк 2 -qк, где Рк и qкнатуральные числа, причем 2Р2к- q2к=1. 7. Доказать, что если n≥2, где n-любое натуральное число (отличное от 1), и х1, х2, …, хn-любые действительные числа, принадлежащие промежутку (0,π), то |sin (х1+х2+ …+хn)|< sinх1+sinх2+ …+sinхn Указание. Доказательство провести индукцией по числу n. 8. Доказать, что если zєC и z≠2kπ при к=0, 1, 2,…, то при любом nєN имеют место равенства: nz (n 1) z sin cos 2 2 cosz+cos2z+…+cosnz= , z sin 2 nz (n 1) z sin sin 2 2 sinz+sin2z+…+sinnz= z sin 2 Указание. Обозначив S=cosz+cos2z+…+cosnz, ∑= =sinz+sin2z+…+sinnz, z z 3z 5z 3z убедиться, что S2sin =(sin -sin )+(sin -sin )+…+ 2 2 2 2 2 z (2n 1) z (2n 1) z (2n 1) z +(sin -sin )=sin -sin ; 2 2 2 2 z z 3z (2n 1) z (2n 1) z ∑2sin =(cos -cos )+…+(cos -cos )= 2 2 2 2 2 z (2n 1) z =cos -cos . 2 2 9. Пусть n-любое натуральное число, a-любое действительное число, удовлетворяющее неравенствам 0
152
х1, х2,…, хn, хn+1, удовлетворяющих условию х1+х2+…+ хn+ хn+1≤а, выполняется неравенство (1-х1)(1-х2)…(1- хn)(1- хn+1)≥1-а. Обозначив хn+ хn+1=yn, применить предположение индукции к числам х1, х2,…, хn-1, yn. Будем иметь: (1-х1)(1-х2)…(1- хn-1)(1- yn )≥1-а, откуда (1 x n )(1 x n 1 ) (1-х1)(1-х2)…(1- хn)(1- хn+1) ≥ (1-а) ≥1-а. 1 x n x n 1 10.Пусть а, b, c –действительные положительные числа и, например, снаибольшее из них: а≤с, b≤с. Доказать, что неравенство с
а2b2+b2c2+c2a2> (a4+b4+c4). На геометрическом языке это утверждение означает следующее: из отрезков длиной a, b, c можно построить треугольник в том и только в том случае, если 1 2
а2b2+b2c2+c2a2> (a4+b4+c4). Указание. Расмотрим разность a4+b4+c4-2(а2b2+b2c2+c2a2)= c4-2(а2 +b2) c2+(а-b)2(а+b)2. Применяя к квадратному трехчлену х2-2(а2 +b2)х+(а-b)2(а+b)2 теорему, обратную к теореме Виета, убедиться, что числа (а-b)2 ,(а+b)2 являются корнями указанного квадратного трехчлена. Поэтому 2 х -2(а2 +b2)х+(а-b)2(а+b)2=х-(а-b)2х-(а+b)2. Следовательно, c4-2(а2+b2)c2+(а-b)2(а+b)2= c2-(а-b)2c2-(а+b)2=( c-а+b)( c+а-b)(c-а-b)(c+а+b), откуда и вытекает подлежащее доказательству утверждение. 11.Доказать, что если числа a, b, c (которые могут быть как действительными, так и комплексными) удовлетворяют условию 1 1 1 1 + + = , то выполняется по крайней мере одно из à b c àbc равенств: a+b=0, a+c=0, b+c=0. 12.Доказать, что если к-натуральное число, то при любом zєC имеет место 2k
равенство (1+z)(1+z2)(1+z4)…(1+ z )=1+z+z2+…+zm, где m-натуральное число, зависящее от к. Найти величину m. Указание. Рассматривая произведения (1+z)(1+z2), (1+z)(1+z2)(1+z4) и т.д., можно предположить, что m=2к+1-1. Оправдать это предположение методом математической индукции. 13. Доказать, что для любых действительных чисел а и b выполняется неравенство: a b a 2 b 2 a 3 b3 a 6 b6 ∙ ∙ ≤ 2 2 2 2
153
Указание. Заметив, что a6+b6=(a2+b2)(a4-a2b2+b4), убедиться в том, что подлежащее доказательству неравенство равносильно такому: 3 3 4 2 2 4 (a+b)(a +b )≤4(a -a b +b ). Это неравенство очевидным образом выполняется, если хотя бы одно из чисел а, b равно 0. Считая а и b отличными от 0 и обозначив b/а=к, свести дело к доказательству неравенства (к+1)(к3+1)≤4(к4-к2+1) при любых действительных к≠0. Это последнее неравенство равносильно (на множестве всех отличных от 0 1 1 действительных чисел) неравенству к23(к+ )2-(к+ )-10≥0 или ê ê 1 1 1 1 3(к+ )2-( к+ )-10≥0 или, наконец, 3(к+ +5/3)( к+ -2)≥0. Но это ê ê ê ê неравенство действительно выполняется при всех действительных к≠0, ибо 1 1 при к>0 к+ ≥2, а при к<0 к+ ≤-2. ê ê 14.Доказать, что если действительные числа a, b, c положительны, то
a 4 b 4 ñ4 а+b+c≤ . abc Указание. Подлежащее доказательству неравенство равносильно такому: b c xy(x+y+1) ≤1+x4+y4, где x= , y= . При этом можно считать (не a a ограничивая общности), что а≤b≤c, т.е. 1≤х≤ y. Полагая х=1+t, y=1+u (0≤t≤u), будем иметь: хy(x+y+1)=(1+t+u+tu)(3+t+u)=3+4t+4u+ 2 2 2 2 +t +5tu+u +t u+tu . С другой стороны, 1+x4+y4=1+(1+t)4+(1+ +u)4=3+4t+6t2+4t3+t4+4u+6u2+4u3+u4. Так как 5tu+u2≤6u2 и t2u+tu2≤2u3, то действительно хy(x+y+1) ≤1+x4+y4. 15. Пусть (аn)-последовательность действительных чисел, в которой а1≤а2 и при любом к>1 ак≤
aê 1 àê 1 . Доказать, что последовательность (аn)2
неубывающая, т.е. при любом nєN аn≤ аn+1. Указание. Применить индукцию по числу n. 16.Пусть n≥3 (n-натуральное число) и а1, а2,.., аn-конечная последовательность действительных чисел, в которой а1≤0, аn≤0 и
aê 1 àê 1 ак≤ при к=2, …, n-1. Доказать, что среди чисел а1, а2,.., аn нет 2 положительных чисел. Указание. Допуская противное, можем найти такой номер m, что 2≤m≤n-1 и am>0, тогда как am-1≤0. Определим числа an+1, an+2, …, полагая при k≥n ak+1=2ak-ak-1. Рассматривая теперь последовательность (bk), в которой b1= =am-1, b2=am и, вообще, bk=am+k-2, применить доказанное в 15. 17. Пусть f:C→C есть функция, для которой существуют неотрицательное целое число n и комплексные числа а0≠0, а1, а2, …, an такие, что f(z)=a0zn+a1zn-1+…+an-1z+an при любом zєC. Такую функцию будем
154
называть ненулевым многочленом. Ясно, что функция f:C→C, принимающая при всех значениях z одно и то же значение а≠0, является ненулевым многочленом (n=0, а0=а). Функцию f:C→C, тождественно равную 0, также будем считать многочленом и называть нульмногочленом (или нулевым многочленом). Доказать, что если f- ненулевой многочлен, причем при всех zєC f(z)=a0zn+a1zn-1+…+an-1z+an и f(z)=b0zm+b1zm-1+…+bm-1z+bm , где n и m – неторицательные целые числа и a0, a1,…, an и b0, b1,…, bm-два набора комплексных чисел, то m= n и b0=a0, b1=a1,…, bn=an (a0≠0, b0≠0). Указание. Если n≠m, то либо n>m, либо m>n. Пусть, например, n>m. Тогда при всех zєС a0zn+с1zn-1+…+сn-1z+сn=0, где с1,…, сn-некоторые комплексные числа. Следовательно, при всех z≠0
ñ1 / à 0 ñn1 / à0 ñn / à0 +…+ + =0, z n1 zn z ñn / à0 ñ1 / à0 ñ1 / à 0 ñn / à0 oткуда 0≥1-| +…+ |≥1-( z +…+ z n ). zn z 1+
ñn ñ1 Обозначим | |+…+| |=М. Тогда при всех zєС, для которых |z|>1, будем a0 a0 иметь: 1-М/|z|≤0. Но это невозможно при |z|>M (и |z|>1). Полученное противоречие доказывает, что n=m. Свести к уже расмотренному случай, когда нарушается хотя бы одно из равенств: a0=b0, a1=b1,…, an-1=bn-1, an=bn. 18. Пусть f:C→C есть ненулевой многочлен и при всех zєС f(z)=a0zn+…+an, где nєZ, n≥0 и а0≠0, а1,…, аn-некоторые комплексные числа. Число n будем называть степенью многочлена f, а числа a0, a1,…, anкоэффициентами многочлена (a0-старший коэффициент). Пусть даны непустое множество А и две функции f:A→C и g:A→C. Произведением fg функций f и g называется отображение множества А в С, определяемое равенством (fg)(х)=f(х)g(х) для любого хєА. В частности, можно говорить о произведени двух многочленов. Легко видеть, что если ненулевой многочлен f имеет степень n и старший коэффициент а0, а многочлен g имеет степень m и старший коэффициент b0, то fg есть многочлен степени n+m со старшим коэффициентом а0b0. Комплексное число ξ называется корнем (или нулем) многочлена f, если f(z0)=0. Доказать, что если число ξ является корнем многочлена f степени n≥1, то при всех zєC f(z)=(z-ξ)g(z), где g-многочлен степени n-1. Указание. Пусть f(z)=a0zn+a1zn-1+…+an при всех zєC (а0≠0, n-целое неотрицательное число). Так как ξ-корень многочлена f, то n≥1 (многочлен нулевой степени не имеет корней). Из равенства f(ξ)=0 следует, что an=-(a0ξn+a1ξn-1an-1ξ), так что при всех zєC
155
f(z)=a0(zn-ξn)+…+an-1(z-ξ). При n=1 f(z)=a0(z-ξ)=(z-ξ)g(z), где g-многочлен нулевой степени, принимающий при всех zєC значение g(z)=a0. При n>1 воспользоваться легко проверяемым тождеством: zk-ak=(z-a)(zk-1+zk-2a+…+ak-1), справедливым при любых комплексных z и a и любом kєN, k≥2. С помощью указанного тождества убедиться, что при всех zєC f(z)=(z-z0)(a0zn-1+b1zn-2+…+bn-1), где b1, …, bn-1-некоторые комплексные числа. Опираясь на доказанное в упражнении 17., установить единственность многочлена g, удовлетворяющего при всех zєC равенству f(z)=(z-ξ)g(z), где ξ-корень многочлена f. 19. Пусть z0-корень многочлена f степени n≥1. Согласно доказанному в 18., f(z)=(z-z0)g(z) при любом zєC, где g-многочлен степени n-1, старший коэффициент которого равен а0-старшему коэффициенту многочлена f. Если при этом g(z0)≠0, то число z0 называется простым корнем (или однократным корнем) многочлена f. Если же g(z0)=0, то привсех zєC g(z)= (z-z0)g1(z), где g1-многочлен степени n-2, старший коэффициент которого равен а0. При этом f(z)=(z-z0)2g1(z) для любого zєC. Если g1(z0)≠0, то число z0 называется двукратным корнем многочлена f. Продолжая рассуждения, аналогичные вышеприведенным, придем к следующему выводу, оправдать который предлагается читателю индукцией по числу n: если z0 корень многочлена степени n≥1, то существует единственное натуральное число к такое, что 1≤к≤n и при всех zєC f(z)=(z-z0)кg(z), где g-многочлен степени nк со старшим коэффициентом, равным старшему коэффициенту многочлена f, причем g(z0)≠0. При этом говорят, что z0 является ккратным корнем многочлена f. 20. Доказать индукцией по числу n, что всякий многочлен степени n имеет не более n различных корней. 21. Доказать, что отображение f:C→C, где f есть многочлен первой степени (f(z)=a0z+a1, а0≠0)-биективно. 22. Пусть f есть многочлен второй степени (который будем называть квадратным трехчленом), т.е. для любого zєC f(z)=a0z2+ a1z+a2, где а0≠0, а1, а2-некоторые комплексные числа. Доказать, что при D≠0, где D=а21-4а0а2, квадратный трехчлен имеет два различных корня: a1 D z1,2= 2a 0 Здесь под D можно понимать любое из двух значений квадратного корня из числа D. Для определенности условимся о следующем. Если Dдействительное отрицательное число, то под D будем понимать i
|D|.
Если же D не есть действительное отрицательное число, то под D будем понимать то значение корня, которое имеет положительную реальную часть. Убедиться в справедливости равенств (теорема Виета):
156
z1+z2=-
a1 a , z1 z2 = 2 a0 a0
Убедиться также в справедливости равенства (при всех zєC) a0z +a1z+a2=a0(z-z1)(z-z2). Доказать, что при D=0 квадратный трехчлен имеет один двукратный корень z0=-a1/2a0 т.е. при всех zєC f(z)=a0(z-z0)2 Указание. Представить f(z) (при любом zєC) в виде: 2
a0z2+a1z+a2=a0(z+
a1 2 D ) - 2 . 2a 0 4a 0
22. Убедиться, что отображение f:C→C, где f-квадратный трехчлен,сюр′ективно, но не биективно. 23. Пусть f-многочлен степени n≥2 и z0-любое комплексное число. Доказать, что при всех zєC f(z)=a0zn+a1zn-1+…+an можно разложить по степеням z-z0, т.е. представить f(z) в виде f(z)=a0(z-z0)n+(a0nz0+a1)(z-z0)n-1+b2(z-z0)n-2+…+bn, где b2,..,bn суть некоторые комплексные числа, не зависящие от z. Указание. Применяя формулу Ньютона, представить zn в виде: zn=(z-z0)+ z0n=(z-z0) n+n(z-z0)n-1 z0+… Аналогично поступить с zn-1, zn-2, …, z . 24. Показать, что решение уравнения a0zn+ a1zn-1+…+аn=0 (где a0≠0) можно свести к решению уравнения wn+b2wn-2+…+bn=0, в котором отсутствует член с wn-1. à1 Указание. Взяв z0=, разложить f(z)=a0zn+a1zn-1+…+аn по na 0 степеням z-z0. Разделив обе части полученного уравнения на а0, придем к уравнению вида (z-z0)n+b2(z-z0)n-2+…+bn=0, которое равносильно уравнению a0zn+a1zn-1+…+аn=0. Если число z′ является корнем этого уравнения, то число w′=z′-z0 является корнем уравнения n n-2 w +b2w +…+bn=0. И наоборот, если число w′ является корнем уравнения wn+b2wn-2+…+bn=0, то число z′=w′+z0 является корнем уравнения (z-z0)n+b2(z-z0)n-2+…+bn=0, а следовательно,-и корнем первоначального уравнения. 25. Доказать тождество (упростив его правую часть) a3+b3+c33abc=1/2(a+b+c)(a-b)2+(b-c)2+(c-a)2 (a, b, cєC). Пользуясь указанным тождеством, разложить на множители кубический трехчлен z3+pz+q (p, qєC) и решить кубическое уравнение z3+pz+q=0 (к которому, согласно упражнению 24., может быть сведено любое кубическое уравнение a0z3+a1z2+a2z+a3=0). Указание. Чтобы разложить на множители кубический трехчлен z3+pz+q, достаточно (имея в виду предварительно доказанное тождество) найти хотя бы одну пару чисел a, b, удовлетворяющих системе:
157
3 3 p3 3ab p a b 27 . В качестве а3 и b3 можно взять корни 3 → 3 a b q a 3 b 3 q
квадратного уравнения t2-qt-p3/27=0. Пусть, например, а3=q/2+
q2 p3 и 4 27
q q2 p3 а= , где выбрано определенное значение квадратного 2 4 27 корня, а затем-определенное значение кубического корня. Убедиться, что 3
p (мы считаем, что р≠0 и тогда а≠0) 3a 3ab p удовлетворяют системе 3 . Вывести из этого, что 3 a b q z3+pz+q=z3+a3+b3-3abz=1/2(z+a+b)(z-a)2+(z-b)2+(a-b)2=(z+a+b)х хz2-(a+b)z+a2-ab+b2. Таким образом, число z1=-(a+b) является одним из корней кубического уравнения z3+pz+q=0. Остальные корни кубического уравнения находятся решением квадратного уравнения z2-(a+b)z+ a b ( a b) 3 i +a2-ab+b2=0: z2,3= . Введя в рассмотрение кубические 2 3 3 2 2 1 1 корни из 1, а именно, ω=cos +isin =- +i и ω2=- -i , 3 3 2 2 2 2 убедиться, что корни z2 и z3 могут быть записаны в виде: a b (a b)i 3 a b (a b)i 3 z2 = =-(aω+bω2), z3= -(aω2+bω). Так как z22 2 (a+b)z+a2-ab+b2= =(z-z2)(z-z3), то при всех zєC z3+pz+q=(z-z1)(z-z2)х х(z-z3)=(z+a+b)(z+aω+bω2)(z+aω2+bω). В случае, когда p=0, но q≠0 q q2 p3 числа а= 2 4 27 3
и b=
проходят те же расуждения, если взять
q2 p3 q = и a= 3 4 27 2
q (любое
определенное значение), b=0. В этом случае кубическое уравнение принимает вид z3+q=0 и имеет корни: z1=- 3 q , z2=-ω 3 q , z3=-ω2 3 q . В случае, когда p=0 и q=0 кубическое уравнение принимает вид z3=0 и имеет единственный трехкратный корень z=0. 26. Доказать, что если
q2 p3 =0, то кубическое уравнение z3+pz+q=0 4 27
имеет двукратный или трехкратный корень. q2 p3 Указания. Если =0 и q=0, то и p=0. В этом случае, как показано в 4 27
упражнении 25, кубическое уравнение z3+pz+q=0 имеет трехкратный
158
корень z=0. Пусть
q2 p3 =0, но q≠0. Тогда a= 3 4 27
q (любое определенное 2
3 p
значение), b=
p 3 27 , a =q/2, b3= q =q/2=a3. Следовательно a3-b3=0, т.е. 3a
2 (a-b)(a +ab+b )=0, откуда либо a=b, либо a2+ab+b2=0. Если a=b, то a-b= =(a-b)ω, a+bω=aω+b и aw+bw2= aw2+bw, т.е. z2=z3. Если же a≠b, но 1 i 3 a2+ab+b2=0, то a/b= . Следовательно, либо a=bω, либо a=bω2. Если 2 a=bω, то a+b=b(ω+1) и aω2+bω=b+bω=b(ω+1), т.е. z1=z3. Если же a=bω2, то a+b=b(ω2+1) и aω+bω2=b+bω2=b(ω2+1), т.е. z1=z2. Во всех случаях при 2
2
q2 p3 =0 и q≠0 кубическое уравнение z3+pz+q=0 имеет кратный корень. 4 27
При q≠0 кратный корень может быть только двукратным. В самом деле, если число z0 является трехкратным корнем кубического трехчлена z3+pz+q, то при всех zєC z3+pz+q=(z-z0)3, т.е. pz+q=-3z0z2+3z20z-z30. Но это возможно только при p=q=0 и z0=0. 27. Доказать, что если кубическое уравнение z3+pz+q=0 имеет кратный корень, то
q2 p3 =0. 4 27
Указание. Все корни кубического уравнения, согласно доказанному в упражнении 25, таковы: z1=-(a+b), z2=-( aw+bw2), z3=-(aw2+bw), где числа a, 3ab p b удовлетворяют системе 3 . Если, например, z1=z2, то 3 a b q a+b=aw+bw2, откуда a=-b(1+w) и a3=-b3(1+w)3. Но 1+w=-w2, так что q2 p3 p3 q2 p3 (1+w) =-1 и a =b =q/2. Так как a =a b = , то = , откуда =0. 4 27 27 4 27 3
3
3
6
3 3
Рассмотреть случаи, когда z1=z3 или z2=z3. Справедливость равенства 2
q p3 =0 при наличии у кубического трехчлена z3+pz+q кратного корня 4 27
можно доказать и не пользуясь формулами корней. Пусть z0- кратный корень кубического трехчлена z3+pz+q. Тогда, согласно доказанному в упражнении 19, z3+pz+q=(z-z0)2(z-ℓ), где ℓ-корень трехчлена, который может быть равен или неравен z0. Сравнивая коэффициенты при одинаковых степенях z в левой и правой частях указанного тождества, будем иметь: ℓ+2z0=0, 2ℓz0+z20=p, -ℓz20=q. Отсюда получаем следующие p3 равенства: р=-3z 0, Тогда, с одной стороны, z 0= , а с другой 27 2 2 2 3 3 q q q p p z60= . Следовательно, = и + =0. Заметим, что из доказанного 4 4 4 27 27 2
q=2z03.
6
159
q2 p3 + ≠0 кубическое уравнение z3+pz+q=0 имеет три 4 27
следует, что при различных корня.
28. Пусть р и q-действительные числа. Доказать, что при
q2 p3 + >0 4 27
кубическое уравнение имеет один действительный и два комплексных взаимносопряженных корня. При этом действительный корень уравнения z3+pz+q=0 может быть представлен так называемой формулой Кардано: q q 2 p3 3 q q 2 p3 q2 p3 z1 = + , где под понимается 2 4 27 2 4 27 4 27 арифметическое значение корня и берутся действительные значения кубических корней. Указание. Согласно доказанному в упражнении 25, один из корней кубического уравнения z3+pz+q=0 имеет вид: 3
p
q2 p3 + 4 27
q p z1=-(а+ )=- 3 2 3à
. В этом упражнении 2 3 q q p 33 2 4 27 всюду берутся действительные значения кубических корней и арифметическое значение квадратного корня. Преобразуя второе слагаемое, находим: z1 = 3
z1 =
3
2
3
q q p + 2 4 27
p3
q q2 p3 2 4 27 p3 33 27
или
q q 2 p3 3 q q 2 p3 + . Далее, так как 2 4 27 2 4 27
q q2 p3 p а= и b= суть действительные числа, то 2 4 27 3a 3
z 2 (aw bw 2 ) =-(aw2+bw)=z3≠z2. 29.Пусть по-прежнему p и q-действительные числа и q2 p3 + <0. Доказать, что все три корня кубического уравнения 4 27 q2 p3 3 z +pz+q=0 (которые попарно различны, ибо + ≠0)4 27
действительны. Указание.
Обозначив
следующее значение а:
|
q2 p3 + |=R, 4 27
выбрать,
например,
160
q q2 p3 q а= == 3 i 2 4 27 2 3
q r=| +i 2
q2 R= R |= 4
R = 3 r (cos φ/3+isin φ/3), где
q2 q2 p3 ( ) = 4 27 4
p3 = 27
p
3
27
,
2 R ïðè q 0 arctg q φ=arg (q/2+ i R )= . 2 R arctg q ïðè q 0
Тогда а=
p
(cos φ/3+isin φ/3), 3 p p p 3 b= = 3 = (cos φ/3-isin φ/3)= a и a a 3
z1=-(a+b)=-2
p
3
∙cosφ/3.
Убедиться
в
том,
что
z2=-2
p
3
x
p
cos(φ+π)/3. Заметим, что при q=0 (и р<0) φ=π/2. 3 Обратим внимание читателя на то, что в рассматриваемом случае (когда все корни кубического уравнения действительны и различны) радикальные выражения корней содержат комплексные величины и никакими преобразованиями не удается выразить корни уравнения через действительные радикалы. Этот случай получил название casus irreducibilis, т.е. неприводимого случая. Причины этого явления вскрываются в теории Галуа (см., например, книгу Н. Чеботарева «Основы теории Галуа»). 30. Как доказано в упражнении 24, решение всякого уравнения 4-ой степени может быть сведено к решению уравнения вида x4+ax4+bx+c=0. Доказать, что уравнение 4-ой степени имеет ровно 4 корня (комплексных, хотя некоторые из них или даже все могут оказаться действительными числами), если считать каждый корень столько раз, какова его кратность. Указание. Разложить многочлен x4+ax2+bx+c в произведение двух квадратных трехчленов. Это легко сделать, если b2-4аc=0. В этом случае xcos(φ+2π)/3, z3=2
x4+ax2+bx+c= +i
a (x+
x4+a(x+
b 2 4 b 2 ) =х -i a (x+ ) = 2a 2a
b ). Здесь под 2a
x2-i
a (x+
b )x2+ 2a
a понимается любое определенное значение
квадратного корня. В общем случае можно поступить следующим образом. При любом μєС x4+ax2+bx+c=(x2+μ)2-2μх2-μ2+ax2+bx+c=(x2+μ)2(2μ-а)х2-bx+μ2-с.
161
Подобрать μ так, чтобы b2-4(2μ-а)(μ2-с)=0 (для этого потребуется найти хотя бы один корень кубического уравнения), после чего многочлен x4+ax2+bx+c разлагается на множители аналогично вышеизложенному. Читателю предоставляется также возможность непосредственного отыскания коэффициентов p, q, m, n разложения 4 2 2 2 x +ax +bx+c=(х +рх+q)(x +mx+n). Для нахождения неизвестных чисел p, q, m, n получается система четырех уравнений с четырьмя неизвестными. Убедиться, что решение этой системы также связано с нахождением хотя бы одного корня кубического уравнения. 31. Пусть f:C→C и g:C→C суть два многочлена. Суммой f+g функций f и g назовем функцию из С в С, определяемую равенством: (f+g)(z)=f(z)+g(z) для любого zєC. Ясно, что каковы бы ни были многочлены f и g сумма f+g также представляет собой многочлен (который может оказаться и нуль-многочленом, даже если многочлены f и g ненулевые). Так как сложение комплексных чисел коммутативно и ассоциативно, то этими же свойствами обладает и сложение многочленов. Если θ есть нуль-многочлен (т.е. θ(z)=0 при любом zєC), то для любого многочлена f f+θ=f. Далее, пусть f-многочлен степени n≥0: f(z)=a0zn+…+an (a0≠0). Положим bi=-ai при i=0, …, n. Тогда многочлен g n-ой степени, такой, что при всех zєC g(z)=b0zn+…+bn, обладает тем свойством, что f+g=θ. Такой многочлен g будем обозначать –f и называть многочленом, противоположным к f . Так как θ+θ=θ, то нуль-многочлен противоположен сам себе: -θ=θ. Мы видим, что множество всех многочленов, рассматриваемое вместе с операцией сложения в нем, представляет собой абелеву группу. Определим теперь произведение α∙f любого комплексного числа α на многочлен f как такую функцию из С в С, что (α∙f)(z)= α∙f(z) для любого zєC. Ясно, что α∙f также представляет собой многочлен. При этом α∙f=θ если α=0 или f=θ; если же α≠0 и f есть многочлен степени n, то и α∙f есть многочлен степени n. В записи α·f знак умножения часто опускают и пишут просто αf. Очевидно выполнение следующих свойств (для любых комплексных чисел α, β и любых многочленов f, g): 1) (αβ)f= α(βf) 2) (α+β)f=αf+βf 3) α(f+g)=αf+αg 4) 1·f=f. Всякое непустое подмножество множества С всех комплексных чисел будем называть числовым множеством. Числовое множество Ф будем называть числовым полем, если Ф содержит числа, отличные от нуля, и замкнуто относительно четырех арифметических операций. Это значит, что из αєФ и βєФ (α и β не обязательно различны) следует, что α+βєФ, αβєФ, αβєФ и (при β≠0) α/βєФ. Ясно, что само множество С, а также множество R всех действительных чисел и множество Q всех рациональных чисел представляют собой числовые поля. Легко видеть также, что всякое числовое поле Ф содержит в качестве подмножества
162
множество Q всех рациональных чисел (доказательство этого утверждения предоставляется читателю). Пусть Е-множество (не обязательно числовое), в котором определена алгебраическая операция, называемая сложением и обозначаемая символом «+», и такая, что пара (Е,+) является абелевой группой. Пусть также Ф-числовое поле и определена операция умножения чисел из Ф на элементы множества Е такая, что при любом αєЕ и любом хєФ α∙хєЕ (знак умножения часто опускают и пишут просто αх). Множество Е, расматриваемое вместе с указанными операциями сложения элементов и умножения их на числа из Ф, называется векторным (или линейным) пространством над полем Ф, если (Е, +)-абелева группа и выполняются условия (для любых α, βєФ и любых элементов x, yєE): 1) (αβ)х=α(βх); 2) (α+β)х=αх+βх; 3) α(х+y)=αх+αy; 4) 1·х=х. Таким образом, множество всех многочленов, расматриваемое вместе с операциями сложения многочленов и умножения их на комплексные числа,- является векторным пространством над полем С. Множество всех многочленов с действительными коэффициентами, рассматриваемое вместе с операциями сложения многочленов и умножения их на действительные числа,-является векторным пространством над полем R. Множество всех многочленов с рациональными коэффициентами, рассматриваемое вместе с операциями сложения многочленов и умножения их на рациональные числа,-является векторным пространством над полем Q. Элементы векторного пространства называются векторами (или точками пространства). Доказать, что множество всех чисел вида a+b 2 , где a и b-любые рациональные числа, -является числовым полем. Доказать, что если θнулевой элемент векторного пространства Е (т.е. нейтральный элемент группы (Е, +), тодля любого хєЕ и любого αєФ имеют место равенства: 0·х=θ, (-1)·х=-х, α·θ=θ. 32. Пусть Е-векторное пространство над полем Ф. Пусть также х1, х2, …, хn-конечная последовательность векторов пространства. Вектор хєЕ называется линейной комбинацией векторов xi, если существуют такие α1, α2, …, αnєФ, что х=α1х1+α2х2+…+αnхn. Пусть АЕ-непустое конечное множество, содержащее n элементов, и х1, х2, …, хn-конечная последовательность попарно различных векторов множества А. Множество А называется линейно независимым, если равенство α1х1+α2х2+…+αnхn=θ имеет место только при α1=…=αn=0. Бесконечное множество АЕ называется линейно независимым, если любое непустое конечное подмножество множества А является линейно независимым.
163
Доказать, что всякое непустое подмножество линейно независимого множества само линейно независимо. Непустое множество ВЕ называется линейно зависимым, если оно не является линейно независимым. Доказать, что непустое множество В линейно зависимо тогда и только тогда, когда найдется вектор хєВ, являющийся линейной комбинацией конечной последовательности векторов из В, отличных от х. Говорят, что множество АЕ порождает пространство Е, если каждый вектор хєЕ является линейной комбинацией конечной последовательности векторов из А. Линейно независимое множество, порождающее пространство Е, называется базисом векторного пространства. Ясно, что всякое максимальное линейно независимое множество (т.е. линейно независимое множество, к которому нельзя присоединить ни одного нового элемента без нарушения линейной независимости) является базисом векторного пространства. Доказать, что если множество АЕ является линейно независимым, то его можно «дополнить» до базиса пространства Е, т.е. существует базис В пространства такой, что АВ. Указание. Рассмотреть класс К всех линейно независимых множеств пространства Е. Обозначив
К
К=А, будем иметь К К,
причем класс
является цепью (см. 1.115). Согласно аксиоме максимальной цепи,
существует максимальная цепь М такая, что К М К или Ає М К. Напомним, что так как М-цепь множеств, то среди любого конечного числа множеств из М всегда имеется «наибольшее», т.е. такое, которое содержит остальные (из указанного конечного числа множеств) в качестве своих подмножеств. Пусть В-объединение всех множеств класса М (любой элемент из Е принадлежит В тогда и только тогда, когда он принадлежит хотя бы одному множеству класса М). Тогда АВ и Влинейно независимо. В самом деле, если В конечно и х1, х2, …, хn суть все попарно различные элементы множества В, то х1єА1, х2єА2, …, хnєАn, где А1, А2, …,Аn-линейно независимые множества (не обязательно различные) из М. Так как одно из множеств Аi содержит все остальные, то В оказывается подмножеством линейно независимого множества, а потому В само линейно независимо. Если В бесконечно, то аналогично изложенному доказывается, что любое непустое конечное подмножество множества В линейно независимо. А это и означает, согласно определению, что Влинейно независимо. Если допустить, что В не является базисом пространства Е, то найдется вектор хєЕ, не являющийся линейной комбинацией конечной последовательности векторов из В. Следовательно, множество Вх окажется линейно независимым (т.е. Вхє К), при этом Вх М, ибо х В, откуда следует, что х не принадлежит ни
164
одному множеству из М. Обозначим через К'класс множеств, состоящий
М М,
из всех множеств класса
М≠К',
и множества Вх. Тогда
М К' К,
но К'как и является цепью множеств, ибо каждое множество из М, являясь подмножеством В, оказывается также подмножеством Вх. Полученное противоречие с максимальностью цепи М доказывает, что В-базис векторного пространства Е. 33. Если векторное пространство Е содержит только элемент θ, то Е не имеет базиса или, как иногда говорят, базисом такого пространства Е является пустое множество. Если же Е содержит ненулевые элементы, то (так как множество А=х при х≠θ является линейно независимым), согласно доказанному в 32, пространство Е обладает базисом, т.е. линейно независимым множеством, порождающим пространство. Так, векторное пространство всех многочленов над полем С имеет следующий базис: f0, f1, …, fn, …, где при любом n≥0 (n-целое) и любом zєC fn(z)=zn. Тот факт, что указанное множество многочленов является порождающим пространствоочевиден. Его линейная независимость фактически доказана в упражнении 17. Этот же базис имеет векторное пространство всех многочленов с действительными (рациональными) коэффициентами над полем R(Q)всех действительных (рациональных) чисел. Всякое векторное пространство над полем С всех комплексных чисел можно рассматривать также как векторное пространство над полем действительных чисел. Указать базис множества всех многочленов с комплексными коэффициентами, рассматриваемого как векторное пространство над полем R всех действительных чисел. Векторное пространство может иметь бесчисленное множество базисов. Так, всякое числовое поле Ф может расматриваться как векторное пространство над самим собой. При этом всякое число хєФ, отличное от нуля, образует базис указанного пространства. Можно доказать, на чем мы не останавливаемся (см., например, книгу М.М. Дэй «Нормированные линейные пространства»), что любые два базиса векторного пространства равномощны, т.е. имеют одно и то же кардинальное число, называемое размерностью векторного пространства. Размерность векторного пространства, содержащего только один элемент θ, принимается равной 0. Размерность векторного пространства всех многочленов над полем С равна 0. Векторное пространство называется конечномерным если оно обладает базисом, состоящим из конечного числа векторов. Доказательство вышеупомянутого утверждения о равномощности любых двух базисов векторного пространства в общем случае требует привлечения одной из форм аксиомы выбора. В случае конечномерного векторного пространства дело обстоит иначе. Доказать, что если векторное пространство Е обладает базисом, состоящим из n векторов, то любое линейно независимое множество пространства Е, состоящее из n векторов, образует базис пространства
165
(отсюда с очевидностью вытекает утверждение о равномощности любых двух базисов конечномерного векторного пространства). Указание. Пусть векторы х1, х2, х3, …, хn образуют базис конечномерного векторного пространства Е, а векторы y1, y2, …, yn образуют линейно независимое множество векторов. Разложив вектор y1 по векторам базиса х1, х2, …, хn, будем иметь: y1=α1х1+ α2х2+ α3х3+….+ αnхn (1) Среди чисел αi хотя бы одно отлично от 0 (иначе y1=θ, что противоречит линейной независимости векторов y1, y2, …, yn). Не ограничивая общности, можно считать, что α1≠0 (если α1=0, а αк≠0, то вектор, который раньше был обозначен через хк, будем теперь обозначать х1, а вектор, который раньше был обозначен через х1, будем теперь обозначать хк). Тогда из (1) следует, что вектор х1 является линейной комбинацией векторов y1, х2, х3, …, хn. Убедиться, что и каждый вектор пространства Е является линейной комбинацией векторов y1, х2, х3, …, хn. Легко видеть, что эти векторы образуют линейно независимое множество. В самом деле, если допустить противное, то y1=μ2х2+ μ3х3+ …+ μnхn при некоторых μ2, μ3, …, μn, а тогда из (1) следует, что α1х1+(α2- μ2)х2+…+(αnμn) хn=θ. Но это равенство невозможно, ибо α1≠0. Итак, векторы y1, х2, х3, …, хn образуют базис пространства Е. Разложив вектор y2 по векторам этого базиса, будем иметь: y2=β1y1+β2х2+β3х3+…+βnxn (2) Среди чисел β2, β3,…, βn хотя бы одно отлично от 0 (в противном случае y2=β1y1, а это противоречит линейной независимости векторов y1, y2, …, yn). Не ограничивая общности, можно считать, что β2≠0. Тогда из (2) следует, что вектор х2 является линейной комбинацией векторов y1, y2, х3, …, хn. Учитывая (1), можно заключить, что и вектор х1 является линейной комбинацией векторов y1, y2, х3, …, хn, откуда следует, что и любой вектор пространства является линейной комбинацией указанных векторов . Кроме того, векторы y1, y2, х3, …, хn образуют линейно независимое множество, ибо в противном случае y2=μ1y1+ μ3y3+…+ μnyn (при некоторых μ1, μ3,…, μn) и (β1-μ1)y1+β2х2+(β3-μ3)х3+…+( βn-μn)хn=θ. Но это равенство не может иметь место, так как β2≠0 и векторы y1, х2, х3, …, хn образуют линейно независимое множество. Таким образом, векторы y1, y2, х3, …, хn составляют базис пространства Е. Продолжить процесс замены векторов «старого» базиса векторами yi и убедиться, что векторы y1, y2, …, yn также образуют базис пространства Е. 34. Конечномерное векторное пространство, базис которого (любой) состоит из n векторов, называется n-мерным векторным пространством. После R всех действительных чисел, расматриваемое как векторное пространство над самим собой, является одномерным векторным пространством. Множество С всех комплексных чисел, рассматриваемое вместе с операцией сложения комплексных чисел и операцией умножения
166
их на действительные числа (т.е. расматриваемое как векторное пространство над полем действительных чисел),-является двумерным векторным пространством, одним из базисов которого является множество 1, i. Расмотрим множество Rn всех n-членных последовательностей (х1, х2, …, хn) действительных чисел (R1=R). Каждую такую последовательность будем обозначать одной буквой: х=(х1, х2, …, хn), y=(y1, y2,…, yn) и т.д. Определим операции сложения элементов множества Rn и умножения их на действительные числа, полагая (для любых х, yє Rn и любого ає R): x+y=(x1+y1, x2+y2,…, xn+yn), ax=(ax1, ax2,…, axn). Легко проверить (что предоставляется читателю), что множество Rn, рассматриваемое вместе с указанными операциями, является векторным пространством над полем R. Нулевой элемент этого пространства имеет вид: θ=(0, 0, …, 0). Противоположным к любому элементу х=(х 1, х2, …, хn) является элемент -х=(-х1, -х2, …, -хn). Векторное пространство Rn (мы допускаем некоторую вольность речи) является n-мерным векторным пространством: одним из его базисов является множество е1, е2,…, еn, где е1=(1, 0,…, 0), е2=(0, 1, 0,…, 0), … еn=(0, 0, …, 0, 1). Этот базис называется стандартным базисом пространства Rn. Каждый вектор х=(х1, х2, …, хn) выражается через векторы стандартного базиса следующим образом: х=х1е1+…+ хnеn. Число xi (i=1, 2,…, n) называется i-ой координатой (или i-ой проекцией) вектора х. Функцию из Rn в R, которая каждому вектору хє R сопоставляет его i-ю проекцию (i=1, 2, …, n), будем обозначать символом Рri: Рriх= xi. Для любых двух векторов х=(х1, х2, …, хn) и y=(y1, y2,…, yn) выражение n
x y i
i 1
i
называется
внутренним
произведением
(или
скалярным
произведением) векторов х и y, которое будем обозначать х, y. Очевидны селудющие свойства внутреннего произведения: (1) х, y=y, х (симметричность) (2) ах, y=х, аy=ах, y; х1+х2, y=х1, y+х2, y; х, y1+ y2=х, y1+х, y2. (билинейность) (3) х, х≥0, причем х, х=0 тогда и только тогда, когда х=θ (положительная определенность). Неотрицательное число
õ, õ называется длиной (или нормой)
вектора х, которую будем обозначать ||х||. Ясно, что длина вектора θ равна n
0, а при х≠0 ||х||=
(x )
i 2
i 1
>0. Очевидно также, что для любого хєRn и
167
любого аєR ||ах||=
(àx )
i 2
2 i 2 = à ( x ) =|а|·||х||. Векторное пространство i
i
n
R с так определенными длинами векторов называется евплидовым nмерным пространством. Доказать, что для любых векторов х, y єRn имеет место неравенство |х, y|≤||х||·||y||, причем равенство достигается в том и только в том случае, когда х и y линейно зависимы. Указания. Фактически мы имеем дело с ранее изученным неравенством Щварца (Коши-Буняковского). Если векторы х и y линейно зависимы, то, например, y=λх при некотором λєR. Тогда |х, y|= =|х, λх|=|λх, х|=|λ|·||х||2 и ||х||·||y||=||х||·||λх||=|λ|·||х||2, так что |х, y|=||х||·||y||. Если же х и y линейно независимы, то при всех λєR λ y-х≠θ, так что при любом λєR ||λy-х||2= λy-х, λy-х=||y||2·λ2-2х, yλ+||х||2>0. Следовательно, квадратный трехчлен (относительно λ) ||y||2·λ2-2х, yλ+||х||2 не имеет действительных корней, т.е. его дискриминант отрицателен, откуда и следует неравенство: |х, y|<||х||·||y||. Доказать, что для любых векторов х, y єRn: (а) ||х+ y|| ≤ ||х||+||y||; || õ y || 2 || x y || 2 (б) х, y= (поляризационное тождество). 4
35. Векторное уравнение прямой (на плоскости или в трехмерном пространстве), проходящей через две точки, заданные своими радиусамивекторами r1 è r2 имеет вид (см. рис.): r r1 = λ( r2 r1 ) или r =(1- λ) r1 + +λ r2
r
r1
r2 0
Когда λ «пробегает» множество (-; +) всех действительных чисел, конец вектора r «пробегает» всю рассматриваемую прямую. Если же λ «пробегает» отрезок 0, 1, то конец вектора r пробегает отрезок прямой с концами, совпадающими с концами векторов r1 è r2 . Учитывая сказанное, читатель не станет отвергать следующие определения (здесь и в дальнейшем Ф-это R или С). Пусть Е-векторное пространство над полем Ф и х, yєЕ, причем х≠y. Прямой, проходящей через х и y, называется множество всех векторов из Е вида (1-λ)х+λ y, где λ-любое число из Ф. Непустое множество АЕ называется плоским, если вместе с любой парой своих точек х≠y оно содержит проходящую через них
168
прямую. Одноточечное множество также считается плоским. Очевидно, что пересечение любого семейства плоских множеств пространства есть либо пустое, либо плоское множество. Пусть А-непустое множество (не обязательно плоское). Существуют плоские множества пространства, содержащие А в качестве подмножества (например, само Е). Пересечение всех таких множеств является наименьшим плоским множеством, содержащим А. Оно называется плоской оболочкой множества А. Отрезком прямой с концами х и y (х и y-не обязательно различные элементы из Е) называется множество всех векторов из Е вида (1-λ)х+λy, где λ- любое число из Ф, удовлетворяющее неравенствам 0≤λ≤1. Непустое множество АЕ называется выпуклым, если оно вместе с любыми двумя своими точками (т.е. векторами) х и y содержит (в качестве подмножества) и весь отрезок с концами х и y. Одноточечное множество также считается выпуклым. Всякое плоское множество выпукло. Пересечение любого семейства выпуклых множеств пространства либо пусто, либо выпукло. Пересечение всех выпуклых множеств пространства, содержащих (в качестве подмножества) заданное непустое множество А, есть наименьшее выпуклое множество пространства, содержащее А. Это множество называется выпуклой оболочкой множества А. Доказать, что выпуклая оболочка непустого множества АЕ представляет собой множество всех конечных линейных комбинаций
x , где х i i
i
выбраны по произволу (и в любом конечном
i
числе) из множества А, а λi-произвольные числа из Ф, удовлетворяющие условиям λi≥0,
=1. i
i
Указание. Обозначив через U множество всех конечных линейных комбинаций векторов из А указанного вида, доказать, что U-выпуклое множество (очевидно, содержащее А). После этого убедиться в том, что UV, где V- любое выпуклое множество, содержащее А. Если хєU, то n
х=
x при некотором nєN, некоторых х єA и некоторых λ єФ таких, что i 1
i i
i
i
n
λi≥0 и
i 1
i
=1. Так как V содержит А (т.е. АV), то векторы х1, х2, …, хn n
принадлежат V. Остается доказать, что и
x єV. Применить индукцию i 1
i i
по числу n, учитывая, что при n=2 действительно λ1х1+ λ2х2 єV при любых х1, х2 єV и любых λ1, λ2 єФ таких, что λ1+ λ2=1, λ1≥0, λ2≥0. 36. Непустое множество АЕ называется уравновешенным, если каковы бы ни были хєА и число λєФ такое, что |λ|≤1-обязательно λхєА.
169
Выпуклое уравновешенное множество называется абсолютно выпуклым множеством. Доказать, что непустое множество АЕ абсолютно выпукло тогда и только тогда, когда для любых х, yєА и любых λ, μєФ таких, что |λ|+|μ|≤1обязательно λх+μyєА. Указание. Тот факт, что непустое множество А, обладающее указанным свойством, является абсолютно выпуклым-очевиден. Обратно, пусть А-абсолютно выпукло и требуется доказать, что оно обладает указанным свойством. Пусть х, y-любые векторы из А и λ, μ-любые числа из Ф такие, что |λ|+|μ|≤1. Если λ=0 или μ=0, то принадлежность λх+μyєА следует из уравновешенности А. хєА, yєА (уравновешенность А) и || || || || õ + · · (выпуклость множества А). y єА | | | | | | | | | | | | 1 Следовательно, (λх+μy) єА, а потому (в силу уравновешенности ||||
Если же λ≠0 и μ≠0, то
А) и (λх+μy) єА. 37. Всякое уравновешенное множество содержит нулевой элемент θ и, как легко видеть, пересечение любого семейства уравновешенных множеств есть уравновешенное множество. Отсюда следует, что пересечение любого семейства абсолютно выпуклых множеств-абсолютно выпукло. Пусть А-произвольное подмножество Е. Существуют абсолютно выпуклые множества, содержащие А в качестве подмножества (например, Е). Пересечение всех таких множеств является наименьшим абсолютно выпуклым множеством, содержащим А. Это множество называется абсолютно выпуклой оболочкой множества А. Доказать, что абсолютно выпуклая оболочка непустого множества А представляет собой множество всех конечных линейных комбинаций
x , в которых | | ≤1, а х выбраны по произволу из А. i i
i
i
i
i
Указание. Обозначив через U множество всех конечных линейных комбинаций указанного вида, убедиться, что U-абсолютно выпуклое множество и АU. Пусть х и y-любые векторы из U и λ, μ-любые числа из Ф такие, что |λ|+|μ|≤1. Тогда х=
x , y= i i
j
i
такие, что
| | ≤1 и | i
j
i
этом λх+μy=
x i i
i
j
j
j
y j , где λi и μj-некоторые числа из Ф
| ≤1 , а хi, yj-некоторые векторы из А. При
j y j , т.е. вектор λх+μy является конечной
170
линейной комбинацией векторов из А. Так как сумма модулей коэффициентов равна
| i
i
| | j | =|λ| | i | +|μ| | j | ≤|λ|+|μ|≤1, то λх+μyєU. Это и j
j
i
доказывает абсолютную выпуклость множества U. Далее, для любого хєА линейная комбинация 1·хєU, откуда АU. Остается доказать, что UV, где V-любое абсолютно выпуклое множество, содержащее А. Пусть хєU, т.е. х=∑λixi при некоторых xiєА и некоторых λiєФ таких, что ∑|λi|≤1. Так как АV, то и все xiє V. Чтобы убедиться в принадлежности xєV, индукцией по числу nєN доказать, что n
при любом n≥2
x є V каковы бы ни были векторы х , х , …, х i 1
i i
1
2
n
из V и
n
числа λ1, λ2,…, λn из Ф такие, что
| | i 1
i
≤1.
38. Линейные операции над элементами векторного пространства Е можно распространить на его подмножества, полагая (для любого xєЕ, любых множеств А, ВЕ и любого λєФ): х+А={х+y; yєА}; А+В={х+y; хєА, yєВ}; λА={λх; хєА}. Доказать, что если множество АЕ является абсолютно выпуклым, то λАμА при любых λ, μєФ таких, что |λ|≤|μ|. Указания. Если μ=0 и |λ|≤|μ|, то и λ=0. В этом случае λА=μА={θ}. Пусть μ≠0 и |λ|≤|μ|. Любой элемент из λА имеет вид λх при некотором хєА. Так как А уравновешенно и ≤1, то хєА, откуда λхєμА, ч.т.д. В этом упражнении от множества А достаточно потребовать лишь уравновешенности. 39. Доказать, что если множество АЕ абсолютно выпукло, то для любого nєN и любых чисел λ1, λ2,…, λn из Ф имеет место равенство: n
n
À = μА, где μ= | | i 1
i
i 1
i
Указание. Пусть n=2. Если μ=|λ1|+|λ2|=0, то λ1=λ2=0 и подлежащее доказательству равенство становится очевидным. Если же μ≠0, то для любого элемента λ1х1+ λ2х2 из λ1А+ λ2А имеем (х1, х2єА):
171
λ1х1+λ2х2=(|λ1|+|λ2|)·
1
| 1 | | 2 |
õ1
2
õ2 =μ 1 õ1 2 õ2 . | 1 | | 2 |
Согласно доказанному в упражнении 36,
1 õ1 2 õ2 єА, ибо 1 2 =1.
Следовательно, λ1х1+ λ2х2єμА. Этим доказано, что λ1А+ λ2А μА. Обратно, любой элемент из μА имеет вид μх при некотором хєА. Можно считать, что λ1≠0 и λ2≠0, ибо, например, при λ1=0 μА=|λ2|А λ2А на основании доказанного в 38. Считая λ1≠0 и λ2≠0, будем иметь:
| 1 |
1
х єА,
| 2 |
2
х єА,
откуда |λ1|хє λ1А, |λ2|хє λ2А и μхє λ1А+ λ2А. Этим доказано, что μА λ1А+ +λ2А, т.е. доказана справедливость утверждения задачи при n=2. Далее применить индукцию по числу n. 40. Доказать, что если множество А Е выпукло, то и множество х+ +λА выпукло при любых хєЕ и λєФ. Доказать, что если множества А и В абсолютно выпуклы, то абсолютно выпуклы также множества А+В и λА при любом λєФ. 41. Пусть Е-векторное пространство над полем Ф и А Е. Множество А называется поглощающим, если для любого yєЕ существует такое λ>0, что yєμА для всех μєФ, удовлетворяющих неравенству |μ|≥λ. Ясно, что всякое поглощающее множество содержит нулевой вектор θ (взять y=θ). Доказать, что множество А Е является поглощающим тогда и ó
только тогда, когда для любого yєЕ найдется такое λ>0, что вектор х= єА и при этом множеству А принадлежат все векторы νх с |ν|≤1. Указание. Пусть А-поглощающее и y-любой вектор из Е. Найдем λ>0 такое, что yєμА для всех μєФ с |μ|≥λ. Взяв μ=λ, найдем хєА такой, что y=λх. Убедимся, что νхєА при любом ν, для которого |ν|≤1. Это очевидно,
если ν=0. Если же ν≠0 и |ν|≤1, то, взяв μ= , будем иметь: |μ|≥λ, yєμА,
y= х1, где х1єА. Отсюда νх=х1, т.е. νх єА. Обратно, пусть А обладает вышеуказанным свойством и требуется доказать, что А-поглощающее множество. Взяв по произволу yєЕ, найдем такое λ>0, что вектор х=
y єА и множеству А принадлежат все векторы νх
с |ν|≤1. Убедимся, что yєμА, если |μ|≥λ . Взяв ν =
, будем иметь: |ν|= ≤1,
νх=х1єА, откуда y=λх=μх1, т.е. yєμА. Заметим, что поглощающее множество А вовсе не обязано быть уравновешенным. Можно лишь õ
утверждать, что для любого хєА найдется такое λ>0, что вектор х1= єА и множеству А принадлежат все векторы νх1 с |ν|≤1.
172
42. Доказать, что абсолютно выпуклое множество АЕ является поглощающим тогда и только тогда, когда оно порождает пространство Е. Указание. Поглощающее множество, очевидно, порождает Е. Остается доказать, что абсолютно выпуклое множество А, порождающее Е, является поглощающим. Пусть y≠θ-любой вектор из Е. Так как А порождает Е, то найдутся натуральное число n, векторы х1, х2, …, хn из А и числа λ1, λ2, …, λn из Ф такие, что y= λ1х1+λ2х2+…+λnхn. Следовательно, n
yєλ1А+λ2А+…+λnА=λА, где, согласно упражнению 39, λ=
| i 1
i
| >0.
Согласно упражнению 38, λАμА при всех μ таких, что |μ|≥λ. Следовательно, yєμА для всех μєФ таких, что |μ|≥λ. Если y=θ, то (так как θєА) при любом λ>0 и любом μ с |μ|≥λ yєμА. 43. Пусть Е-векторное пространство над полем Ф. Множество LЕ называется векторным подпространством пространства Е, если х+yєL и λхєL для всех х, yєL и λєФ. Всякое векторное подпространство L содержит нулевой вектор θ и множество {θ} является наименьшим из всех возможных подпространств. Легко видеть, что пересечение любого семейства подпространств само является подпространством пространства Е. Если А-любое подмножество множества Е, то пересечение всех подпространств, содержащих А (такие имеются, например, Е), является наименьшим подпространством, содержащим А. Оно называется линейной оболочкой множества А или векторным подпространством, натянутым на А. Доказать, что линейная оболочка непустого множества АЕ представляет собой множество всех конечных линейных комбинаций ∑λ ixi, где λiєФ, а xiєА. 44. Пусть Е-векторное пространство над полем Ф, х0єЕ и АЕ. Множество х0+А будем называть сдвигом множества А на вектор х0. Убедимся, что если А-плоское множество и х0, y0-любые векторы из А, то -х0+А=-y0+А. Любой вектор множества -х0+А имеет вид u- х0, где uєА. Расмотрим вектор y0+u-х0 и докажем его принадлежность к множеству А. При любых μ, ξ, η из Ф имеем: μu+(1-μ)х0єА, ξ y0+(1-ξ) х0єА и η[μu+(1μ)х0]+(1-η)[ξ y0+(1-ξ)х0]єА. Если подберем числа μ, ξ, η так, чтобы 1 удовлетворить системе , то убедимся, что y0+u-х0 єА. (1 ) 1 Достаточно взять μ=2, η=1/2, ξ=2. Итак, y0+u-х0єА, откуда следует, что uх0є-y0+А. Этим доказано включение -х0+А-y0+А. Обратное включение доказывается аналогично изложенному, так, что действительно -х0+А= =-y0+А. Обозначив через L сдвиг -х0+А, не зависящий от выбора вектора х0єА, доказать, что L векторное подпространство пространства Е (Аплоское множество!). Указания. Если x и y-любые два вектора из L, то принадлежность x+yєL доказывается аналогично вышеизложенному. Далее, пусть x=u-x0,
173
uєА и λ-любое число из Ф. Тогда λх+х0=(λu-λх0)+х0=λu+(1-λ)х0єА, откуда следует, что λхєL. 45. Доказать, что если L- подпространство векторного пространства Е и x0 -любой вектор из Е, то x0+L-плоское множество. 46. Пусть Е- векторное пространство над полем Ф. Плоское множество НЕ, не совпадающее с Е, называется гиперплоскостью, если не существует отличного от Е плоского множества, содержащего Н в качестве собственного подмножества. Другими словами, гиперплоскостьэто максимальное плоское собственное подмножество множества Е. Если Н-гиперплоскость в Е и Н'Н, где Н'-плоское множество, то либо Н'=Н, либо Н'=Е. Векторное подпространство L пространства Е называется гиперподпространством, если LЕ и не существует отличного от Е подпространства, содержащего L в качестве собственного подмножества. Другими словами, гиперподпространство-это максимальное собственное векторное подпространство пространства Е. Если L-гиперподпространство, L'-подпространство пространства Е и LL', то либо L'=L, либо L'=Е. Доказать, что Н есть гиперплоскость в Е тогда и только тогда, когда Н является сдвигом x0+L гиперподпространства L пространства Е (х0любой вектор из Н). Указание. Пусть Н-гиперплоскость в Е и х0-любой вектор из Н. Согласно доказанному в 44, множество L=-х0+Н является подпространством пространства Е. При этом Н=x0+L. Чтобы доказать, что L-гиперподпространство, допустим противное. Тогда найдутся подпространство L' пространства Е и векторы y0, z0 из Е такие, что LL'Е, y0єL', y0 L, z0 L'. Согласно доказанному в 45, множество Н'= =x0+L' является плоским множеством. При этом Н'Н и x0+y0єН', но x0+y0 Н. Так как Н-гиперплоскость в Е и Н'Н, то Н'=Е. Значит, x0+z0є Н', т.е. z0є L', что противоречит выбору z0. Полученное противоречие доказывает, что L-гиперподпространство. Аналогичными рассуждениями доказать, что если L-гиперподпространство пространства Е и Н=x0+L, то Н является гиперплоскостью в Е. 47. Пусть Е и F-векторные пространства над одним и тем же полем Ф. Функцию f:EF (именуемую иногда оператором) будем называть линейной (линейным оператором или линейным отображением), если для всех хєЕ, yєЕ, λєФ выполняются равенства: f(x+y)=f(x)+f(y), f(λx)=λf(x). Если θ и θ'-нулевые элементы пространств Е и F соответственно, то ясно, что для линейной функции f:EF будет: f(θ)=θ'. Если f 1 (θ') содержит ненулевой элемент хєЕ, то f(θ)=f(x)=θ' и, значит, отображение f не является ин'ективным. Если же f 1 (θ')={θ}, то f-ин'ективное отображение: при хy и f(x)f(y) ( в противном случае f(x-y)=θ' и окажется, что ненулевой элемент х-уєЕ принадлежит f-1(θ'). Если отображение f:EF линейно, то множество f 1 (θ') является векторным подпространством пространства Е.
174
В самом деле, пусть х, y-любые векторы из f 1 (θ') и λ-любое число из Ф. Тогда f(x)=θ', f(y)=θ', откуда f(x+y)=f(x)+f(y)=θ', т.е. x+yє f 1 (θ'). Далее f(λx)=λf(x)=λθ'=θ', т.е. λxє f 1 (θ'). Если линейное отображение f:EF биективно, то f называется изоморфизмом Е на F, а сами векторные пространства Е и F называют при этом изоморфными. Множество всех линейных отображений пространства Е в F будем обозначать L(E; F). Это множество становится векторным пространством над полем Ф, если для любых f, g из L(E; F) и любого λєФ положить (f+g)(х)=f(x)+g(x), (λf)(x)=λf(x) (для всех хєЕ). Нулевым элементом пространства L(E; F) является функция из Е в F, тождественно равная θ'. Линейные отображения из Е в Ф называются линейными функционалами на Е. Векторное пространство L(E; Ф), т.е. векторное пространство всех линейных функционалов на Е, называется алгебраическим сопряженным к Е. Это пространство будем обозначать Е*. Пусть В-базис векторного пространства Е. Доказать, что всякую функцию f0:BF можно, и притом единственным образом, продолжить до линейной функции f:EF (E и Fвекторные пространства над одним и тем же полем Ф). Указание. Пусть f:EF есть линейное продолжение функции f0. Выясним, каково значение функции f на любом элементе хєЕ. Если х=θ, то f(x)=θ'. Если хθ, то существуют и единственны натуральное число n, попарно различные векторы х1, х2, …, хn из В и отличные от нуля числа λ1, n
λ2, …, λn из Ф такие, что х=
x (читателю предлагается убедиться в i 1
i i
справедливости этого утверждения). Так как функция f линейна и является n
продолжением функции f0, то f(x)=∑λif(xi)=
f (x ). Таким образом, i
i 1
0
i
значение функции f на любом элементе хєЕ вполне определяется самим элементом х и значениями функции f0 на векторах базиса В. Этим доказана единственность линейного продолжения f функции f0. Чтобы доказать существование искомого линейного продолжения, определим функцию n
f:EF, полагая f(θ)=θ', а при хθ f(x)=
f (x ), где натуральное число i
i 1
0
i
n, векторы (попарно различные) х1, х2, …, хn из В и отличные от нуля числа n
λ1, λ2, …, λn определяются разложением х=
x . i 1
i i
Читателю предоставляется доказать, что функция f –линейная и является продолжением функции f0. 48. Пусть Е и F - векторные пространства над одним и тем же полем Ф. Доказать, что пространства Е и F изоморфны тогда и только тогда, когда размерности этих пространств совпадают.
175
Указание. Пусть пространства Е и F изоморфны, т.е. существует биективное линейное отображение f:EF. Рассмотрим какой-либо базис В пространства Е и убедимся, что f(B)-базис пространства F. Если y1, y2, …, yn –любые попарно различные векторы из f(B), то существуют и единственны попарно различные векторы x1, x2, …, xn из В такие, что y1=f(x1), y2=f(x2),…, yn=f(xn). Из линейности f следует, что для любых чисел λ1, λ2, …, λn из Ф λ1y1+ λ2y2+…+ λnyn=f(λ1x1+…+ λnxn). Поэтому равенство λ1y1+ λ2y2+…+ λnyn=θ' влечет за собой равенство λ1x1+ λ2x2+…+ λnxn=θ (это следует из инъективности отображения f и того, что f(θ)=θ'). Из линейной независимости векторов x1, x2, …, xn (ведь это-попарно различные векторы базиса В пространства Е) и равенства λ1x1+ λ2x2+…+ λnxn=θ следует, что λ1=λ2=, …=λn=0. Этим доказана линейная независимость множества f(B) в пространстве F. Пусть, далее, y-любой вектор из F. Пользуясь биективностью отображения f, найдем единственный вектор хєЕ такой, что y=f(x). Так как В-базис пространства Е, то при некотором mєN, некоторых векторах õ1 ,...., õm из В и некоторых μ1, ..,μm из Ф выполняется равенство
x= i xi , i 1
y f ( x ) i i = i i, m
m
откуда
y=
i 1
где
векторы
yi f ( xi ) принадлежат f(B). Следовательно, f(B)- базис пространства F. Таким образом, сужение отображения f на множество В есть биективное отображение базиса пространства Е на базис пространства F. Но это и означает, что размерности пространств Е и F совпадают. Обратно, пусть размерности пространств Е и F совпадают, т.е. существует биективное отображение f0 базиса В пространства Е на базис
 пространства F. Пусть f:EF-есть линейное продолжение функции f0
(см. упражнение 47). Убедимся в сюръективности отображения f. Беря n
любой вектор yєF, будем иметь: y= i yi , где y1, y2, …, yn –некоторые
i 1 векторы из Â , а λi-некоторые числа из Ф. Для каждого вектора yi найдется
единственный вектор xiєВ такой, что f0(xi)=yi (i=1, 2, …, n). Рассмотрим n
вектор хєЕ, определяемый равенством: х= i yi . Так как f-линейно и i 1
n
n
n
i 1
i 1
i 1
является продолжением f0, то f(x)= f(λixi)= λi f0(xi)= i yi =y, чем и доказана сюръективность отображения f. Имея целью доказать инъективность отображения f, предположим противное. Тогда найдется вектор хєЕ, хθ такой, что f(x)=θ'. Представим вектор х линейной комбинацией попарно различных векторов базиса В с отличными от нуля m коэффициентами: х= j x j . Тогда θ'=f(x)= j 1
176 m
m m = j f (x j ) = j f0 (x j ) = j y j , j 1
j 1
j 1
где
векторы
y1 f 0 ( x1 ) ,
…, ym f 0 ( xm ) принадлежат базису Â и попарно различны (ибо f0 m
инъективное отображение). Но из равенства
j 1
j
y j =θ' следует, что
μ1=μ2=…=μm=0, откуда х=θ, что противоречит выбору вектора х. Полученное противоречие доказывает инъективность, а, следовательно, и биективность линейного отображения f:EF. 49. Пусть Е и F-конечномерные векторные пространства над полем Ф одинаковой размерности, что мы будем записывать так: dimE=dimF. Доказать, что линейное отображение f:EF инъективно тогда и только тогда, когда оно сюръективно. Указание. Пусть пространства Е и F имеют размерность n. Если fлинейно и инъективно, то всякий базис x1, x2, …, xn пространства Е f переводит в базис y1, y2, …, yn пространства F (yi=f(xi), i=1, 2, …, n). В самом деле, если y1, y2, …, yn линейно зависимы, то при некоторых λ1, λ2, …, λn из Ф, хотя бы одно из которых отлично от 0, верно равенство θ'=λ1y1+λ2y2 +…+ λn yn= λ1f(x1)+ λ2f(x2)+…+ λnf(xn)=f(λ1x1+λ2x2+…+ λnxn)=θ. Следовательно, ввиду инъективности f, λ1x1+…+λnxn=θ, что абсурдно. Значит, векторы y1, y2, …, yn линейно независимы, а потому составляют базис n-мерного пространства F. Взяв любой вектор yєF, будем иметь (при некоторых μ1, μ2, …, μn из Ф): y=μ1y1+μ2y2+…+ μnyn=μ1f(x1)+ +μ2f(x2)+…+μnf(xn)=f(μ1x1+μ2x2+…+μnxn), что и доказывает сюръективность f. Обратно, пусть линейное отображение f:EF сюръективно. Расмотрим какой-либо базис y1, y2, …, yn пространства F. Так как fсюръективно, найдутся векторы x1, x2, …, xn из Е такие, что f(xi)=yi , f(x2)=y2, …, f(xn)=yn. Убедимся в линейной независимости векторов x1, x2, …, xn. В самом деле, равенство λ1x1+λ2x2+…+ λnxn=θ влечет за собой (ввиду линейности f) равенство λ1f(x1)+ λ2f(x2)+…+ λnf(xn)=θ' или λ1y1+λ2y2 +…+ +λn yn=θ', откуда λ1=λ2 =…=λn=0. Итак, векторы x1, x2, …, xn линейно независимы и потому составляют базис пространства Е. Если допустить, что отображение f-не инъективно, то найдется вектор хєЕ, хθ такой, что f(x)=θ'. При этом х=μ1x1+μ2x2+…+μnxn и в этом равенстве хотя бы одно из μi отлично от нуля. С другой стороны, f(x)=μ1f(x1)+ +μ2f(x2)+…+μnf(xn), т.е. μ1y1+μ2y2+…+ μnyn=θ', откуда следует, что μ1=μ2= …=μn=0. Полученное противоречие доказывает инъективность отображения f. 50. Пусть E и F-векторные пространства над полем Ф, АЕ и задана функция f0:АF (А не обязательно является базисом пространства Е и даже не обязательно является линейно независимым множеством).
177
Доказать, что функцию f0 можно продолжить до линейной функции f:EF тогда и только тогда, когда при любом nєN и любых x1, x2, …, xn из n
А равенство
n
õ =θ влечет за собой равенство f i 1
i i
i 1
i
0
( õi ) =θ'.
Указание. Если функцию f0 можно продолжить до линейной функции f:EF, то равенство ∑λixi=θ (xiєА) очевидным образом влечет за собой равенство
f i
0
( õi ) =θ'. Пусть теперь выполнение первого из
указанных равенств всегда влечет за собой выполнение второго. Если А={θ}, то обязательно f0(θ)=θ'. Взяв любой базис В пространства Е, можно по произволу задать функцию f из В в F, а затем продолжить полученную функцию до линейной функции f:EF (см. упражнение 47). Если А{θ}, то рассмотрим линейную оболочку L множества А. Определим функцию g:LF, полагая для любого х= i õi єL (xiєА) g(х)=
f i
0
( õi ) . Это
определение корректно, так как при всяком другом представлении х= j õj (х'jєА), будем иметь i õi - j õj =θ, откуда
j
f 0 ( õj ) =θ' и
f i
i
0
f i
0
( õi ) -
( õi ) = j f 0 ( õj ) . Легко убедиться в том, что j
функция g-линейна и является продолжением функции f0 (это предоставляется читателю). Пусть ВL-какой-либо базис векторного пространства L. Дополнив ВL до базиса В пространства Е и воспользовавшись доказанным в упражнении 47, построить линейное отображение f:EF, совпадающее с g на векторах базиса ВL: для любого yєВL f(y)=g(y). Убедиться, что f совпадает с g на всем L, а потому f является продолжением f0. 51. Пусть Е-векторное пространство над полем Ф, отличное от {θ}. Доказать, что для каждого х0θ (х0єЕ) существует линейный функционал fєE* такой, что f(x0)0 (линейный функционал f, не обращающийся тождественно в 0, будем называть ненулевым линейным функционалом, при этом будем писать f0 ). Указание. Дополнить линейно независимое множество {х0} до базиса В пространства Е и определить функцию f0:ВФ, полагая f0(х)=1 для любого хєВ. Затем продолжить f0 до линейной функции f:EФ. 52. Пусть Е-векторное пространство над полем Ф и fєE*, причем f0. Доказать, что множество L= f 1 (0) является гиперподпространством векторного пространства Е. Указание. Согласно доказанному в упражнении 47, множество 1 L= f (0) является подпространством векторного пространства Е. Так как
178
f0, то L-собственное подпространство Е, т.е. LЕ. Остается убедиться, что L-максимальное собственное подпространство пространства Е. Пусть LL', где L'-подпространство Е и LL'. Найдется вектор х0єL', не принадлежащий L, так что f(х0)=λ00. Взяв любой вектор хєЕ, найдем f(х)=μ. Если μ=0, то хєL и тем самым хєL'. В общем случае расмотрим вектор х- х0. Так как f(x- х0)=0, то х- х0 єLL', откуда хєL'. Значит, 0 0 0 L'=Е и L действительно является гиперподпространством пространства Е. 53. Доказать, что для любого гиперподпространства L векторного пространства Е найдется ненулевой линенйный функционал f такой, что L= f 1 (0). Указание. Найдя вектор х0 L, рассмотреть линейную оболочку L' множества L{х0}. Так как L-гиперподпространство, то L'=Е, так что каждый вектор хєЕ может быть представлен в виде х=х L+λxx0 при некотором хLєL и некотором λxєФ. Убедиться в единственности такого представления, после чего определить линейный функционал f:EФ, полагая f(x)=λx (или, более общим образом, f(x)=λxα, α=const, α0). Проверить выполнение равенства L= f 1 (0). Заметим, что ненулевой линейный функционал fєЕ* вполне определяется указанием 1 гиперподпространства L= f (0) и значением f(x0)=α0 в какой-нибудь точке х0 L. Тогда для любого х= хL+λxx0 будем иметь f(x)=f(xL)+ λxf(x0)= =λxα. 54. Пусть, как и в упражнении 52, fєЕ* и f0 (Е-векторное пространство над полем Ф). Доказать, что для любого λєФ и любого вектора x0є f 1 (λ)={хєЕ: f(x)=λ} имеет место равенство f 1 (λ)= x0 + f 1 (0). Вывести из этого и из доказанного в упражнениях 46 и 52 следующее утверждение: при любом ненулевом fєЕ* и любом λєФ множество f 1 (λ) представляет собой гиперплоскость в Е. Используя доказанное в упражнениях 46 и 53, доказать, что для всякой гиперплоскости Н в Е найдутся fєЕ*, f0 и число λєФ такие, что Н= = f 1 (λ). Заметим, что f и λ определяются по Н не единственным образом: если Н= f 1 (λ), то при любом μ0 Н=(μf)-1(μλ). Доказать, что если Н= f 1 (λ) и Н= f1-1(λ1) (fєЕ*, f1єЕ*, λєФ, λ1єФ, λ10, λ0), то f1=μf1, где μ=λ1/λ. Указание. Взяв любой вектор х0єН, будем иметь Н=х0+L, где L= =-х0+Н, L не зависит от выбора х0 из Н и L-гиперподпространство (упражнения 44 и 46). Так как f(x0)=λ0, а для любого xєL f(x)=0 (x=-x0+y, yєН), то х0 L. Любой вектор zєЕ единственным образом представляется в виде z=zL+αzx0, где zLєL, αzєФ. Поэтому f(z)=f(zL)+αzf(x0)=αzλ и (μf)(z)=αz(μλ)=αzλ1. Так как f1(zL)=0, то f1(z)=αzf1(x0)=αzλ1, т.е. f1(z)=(μf)(z) при любом zєE. Следовательно, f1=μf.
179
55. Пусть Е-векторное пространство над полем Ф, отличное от {θ}. Множество ГЕ* называется тотальным на Е, если для любого хєЕ хθ в множестве Г найдется такой линенйый функционал f, что f(x)0. Согласно упражнению 51, само Е* тотально на Е. Доказать, что если ГЕ* тотально на Е и является векторным подпространством пространства Е*, то для любых линейно независимых векторов х1, х2 из Е найдутся такие линейные функционалы f1, f2 из Г, что f1(x1)=1, f1(x2)=0, f2(x1)=0, f2(x2)=1 (коротко: fi(xj)=δij, i, j=1, 2. Здесь δij-функция (называемая дельта Кронекера), определенная на NxN и такая, что δii=1, а δij=0 при ij). Указание. Так как х1θ, то найдется (ввиду тотальности Г) линейный функционал f1'єГ такой, что f1'(х1)0. Если при этом f1'(х2)=0, то полагаем 1 f1 . После этого аналогично предыдущему найдем f2'єГ такой, что f1 = f1( x1 ) f2'(х2)=1. Если f2'(х1)=λ, то полагаем f2=f2'-λf1. Итак, при f1'(х2)=0 действительно найдутся такие линейные функционалы f1, f2 из Г, что fi(xj)=δij, i, j=1, 2. Рассмотрим случай, когда f1'(х2)=α0. При этом можем считать, не ограничивая общности, что f1'(х1)=1. Так как αх1-х2θ, то найдется функционал fєГ такой, что f(αх1-х2)0, т.е. αf(х1)-f (х2)0. Функционал f= =f-f(х1)f1' также принадлежит Г и при этом f(х1)=0, f(х2)0. Полагая 1 f , f1=f1'-αf2, будем иметь: f1єГ, f2єГ, fi(xj)=δij, i, j=1, 2. f2 = f ( x2 ) 56. Доказать более общее, чем в упражнении 55, утверждение: если ГЕ* тотально на Е и является векторным подпространством пространства Е*, то при любом nєN, не превосходящем размерности Е, и при любых линейно независимых векторах x1, x2, …, xn-1, xn из Е найдутся такие линейные функционалы f1, f2, …, fn-1, fn из Г, что fi(xj)=δij, i, j=1, 2…, n. Указание. Применить индукцию по числу n. При n=1 и n=2 утверждение верно. Пусть n>2 и пусть утверждение верно для n-1. Тогда найдутся линейные функционалы f1', f2', …, fn-1 из Г такие, что fi(xj)=δij, i, j=1, 2…, n-1. Найдем числа α1=f1'(xn), α2=f2'(xn),…, αn-1=fn-1(xn) и рассмотрим ненулевой вектор α1x1+ α2x2+…+αn-1xn-1- xn. Так как Г тотально на Е, то найдется линейный функционал f из Г такой, что α1f(х1)+α2f(х2)+…+αn-1f(хn-1)-f(xn)0. Линейный функционал f'= =f-f(х1)f1'- f(х2)f2'-…-f(хn-1)fn-1 также принадлежит Г и обращается в нуль на векторах x1, x2, …, xn-1. Но f(xn)=f(xn)- α1f(х1)-α2f(х2)-…-αn-1f(хn-1)0. 1 f , f1=f1'-α1fn, f2=f2'-α2fn, …, fn-1=fn-1'-αn-1fn, убедиться, Положив fn= f ( xn ) что fi(xj)=δij, i, j=1, 2…, n. Заметим, что из доказанного вытекает следующее: если x1, x2, …, xn линейно независимые векторы пространства Е, а Г-тотально на Е и
180
является векторным подпространством пространства Е*, то при любых λ1, λ2, …, λn из Ф найдется такой линейный функционал gєГ, что g(xi)=λi, i=1, 2, …, n. В самом деле, достаточно положить g=λ1f1+…+λnfn, где fi обладают свойством fi(xj)=δij, i, j=1, 2…, n и все принадлежа т Г. Заметим еще, что в сформулированном утверждении важно именно то, что функционал g с указанным свойством (g(xi)=λi, i=1, 2, …, n) принадлежит множеству Г: чтобы отыскать такой функционал в Е*, достаточно дополнить векторы x1, x2, …, xn до базиса В пространства Е, определить g0:ВФ так, чтобы g0(xi)=λi и продолжить функцию g0 до линейной функции g:ЕФ. 57. Пусть Е-векторное пространство над полем Ф, f1, f2, …, fnлинейно независимые функционалы из Е* и λ1, λ2, …, λn –любые числа из Ф. Доказать, что существуют такие векторы x1, x2, …, xn, х из Е, что 1) fi(xj)=δij, i, j=1, 2…, n; 2) fi(x)=λi, i=1, 2…, n. Указание. Каждому хєЕ поставим в соответствие функцию Fx:E*Ф, полагая Fx(f)=f(x) для любого функционала fєЕ*. Легко видеть, что функция Fx линейна: Fx(f+g)=(f+g)(x)=f(x)+g(x)=Fx(f)+Fx(g) и Fx(λf)=(λf)(x)=λf(x)=λFx(f). Следовательно, Fxє(Е*)*. Нетрудно убедиться в том, что различным векторам х, y из Е соответствуют различные же функции Fx и Fy из (Е*)*: если Fx=Fy , то для любого функционала fєЕ* Fx(f)=Fy(f), т.е. f(x)=f(y), или f(x-y)=0, хотя x-yθ. Но это невозможно, согласно доказанному в упражнении 51. Обозначим через Г множество функций Fx для всех хєЕ. Тогда Г(Е*)* и Г тотально на Е*: если f0, то найдется хєЕ, для которого f(x)0 и для этого вектора х Fx(f)= f(x)0. Кроме того, Г является векторным подпространством пространства (Е*)*: Fx+Fy= Fx+y и λFx= Fλx для любых х, yєЕ и любого λєФ. В самом деле, для любого fєЕ* (Fx+Fy)(f)= Fx(f)+Fy(f)=f(x)+f(y)=f(x+y)= Fx+y(f), так что Fx+Fy= Fx+y. Далее, Fλx(f)=f(λх)= =λf(x)=λFx(f)=(λFx)f, откуда Fλx=λFx. Согласно доказанному в упражнении 56 (только роль Е теперь играет Е*), найдутся такие функционалы Fx1, Fx2, …, Fxn из Г, что Fxi(fj)=δij, i, j=1, 2, …, n. Другими словами, найдутся такие векторы x1, x2, …, xn, из Е, что fi(xj)=δij, i, j=1, 2…, n. Обозначив х=λ1х1+ λ2х2+…+ λnхn, будем иметь: fi(x)=λ1fi(х1)+ λ2fi(х2)+…+ λnfi(хn)=λifi(хi)=λi при любом i=1, 2, …, n. 58. Пусть Е-n-мерное векторное пространство над полем Ф (Ф-это R или С) и x1, x2, …, xn-какой-либо базис пространства Е, который обозначим через В. Для каждого i=1, 2, …, n определим функцию fi:ВФ, полагая fi(xi)=1, fi(xj)=0 при ji. Продолжая затем каждую из полученных функций до линейной функции fi:ЕФ, получим n линейных функционалов f1, f2, …, fn на Е с тем свойством, что fi(xj)=δij, i, j=1, 2…, n. Так как линейная функция вполне определяется своими значениями на
181
векторах базиса, то каждая из функций fi (i=1, 2…, n) свойством fi(xj)=δij, (j=1, 2…, n) определена однозначно. Доказать, что функционалы f1, f2, …, fn составляют базис пространства Е* (называемый дуальным базисом сопряженного пространства по отношению к базису x1, x2, …, xn). Указание. Допустим, что при некоторых λ1, λ2, …, λn (λiєФ) λ1f1+ +λ2f2+…+ λnfn=0. Тогда функционал f=∑λifi должен обращаться в 0 и на векторе х= 1 õ1 2 õ2 ... n xn . Но f(x)=|λ1|2+|λ2\2+…+|λn|2, так что равенство ∑λifi=0 влечет за собой равенство λ1=λ2= …= λn=0. Это и доказывает линейную независимость функционалов f1, f2, …, fn в пространстве Е*. Убедиться, что для любого функционала fєЕ* имеет место представление: f=α1f1+α2f2+…+αnfn, где αi=f(xi), i=1, 2…, n. Замечание. Из доказанного следует, что пространство Е* для nмерного пространства Е само n-мерно, а потому n-мерно и пространство (Е*)*. Далее, если множество ГЕ* тотально на Е и является подпространством пространства Е*, то Г=Е*. В самом деле, согласно доказанному в упражнении 56, функционалы f1, f2, …, fn должны принадлежать Г. Но так как эти функционалы составляют базис пространства Е*, то и любой функционал fєЕ* принадлежит Г. Таким образом, можно утверждать, что для n-мерного пространства Е пространство (Е*)* совпадает с множеством всех функционалов Fx (xєE), таких, что Fx(f)=f(x) для любого fєЕ*. 59. Пусть Е=Rn, рассматриваемое как векторное пространство над полем R (см. упражнение 34), и е1, е2, …, еn-стандартный базис в Rn. Взяв любой вектор а=(а1, а2, …, аn)єRn, рассмотрим функцию f:RnR, для которой f(x)=а, х=а1х1+а2х2+..+аnxn при любом х=(х1, х2,…, xn)єRn. Согласно доказанному в упражнении 34, эта функция-линейна, т.е. fє(Rn)*. Обратно, пусть f любой линейный функционал на Rn. Найдя а1=f(е1), а2=f(е2),…, аn= f(еn), для любого вектора х=(х1, х2,…, xn)єRn будем иметь f(x)= f(x1е1+ x2е2+…+ xnеn)= а1х1+а2х2+..+аnxn=а, х, где а=(а1, а2, …, аn). Легко доказать единственность такого вектора а, что предоставляется читателю. Учитывая сказанное и результаты упражнения 56, доказать, что система n линейных уравнений с n неизвестными (в которой все коэффициенты аji , свободные члены bj и неизвестные хj предполагаются числами из R)
a11 x1 a1 2 x 2 ... a1 n x n b1 1 1 2 2 n n 2 a 2 x a 2 x ... a 2 x b ............................................... a 1 x1 a 2 x 2 ... a n x n b n n n n
(1)
182
имеет и, притом, единственное решение, если векторы пространства R а1=(а11, а12, …, а1n), а2=(а21, а22, …, а2n), …, аn=(аn1, аn2, …, аnn)-линейно независимы. Указание. Согласно доказанному в упражнении 56, найдется такой функционал fє(Rn)*, что f(a1)=b1, f(a2)=b2, …, f(an)=bn. Для этого функционала f найдется вектор х=(х1, х2,…, xn) єRn (х1=f(е1), х2=f(е2),…, хn=f(еn)) такой, что f(y)=x, y при любом yєRn. Найденный вектор х удовлетворяет равенствам х, а1=b1, х, а2=b2, …, х, аn=bn, т.е. удовлетворяет системе (1). Чтобы доказать единственность решения системы (1), следует заметить, что векторы а1, а2,…, аn составляют базис пространства Rn. Разложив векторы стандартного базиса е1, е2, …, еn по векторам а1, а2,…, аn: ei=μ1ia1+ μ2ia2+…+ μnian, i=1, 2…, n, n
убедиться в том, что при всех i=1, 2…, n xi=μ1ib1+ μ2ib2+…+ μnibn 60. Пусть Е-векторное пространство над полем Ф и Lподпространство Е. Рассмотрим всевозможные сдвиги подпространства L, т.е. множества вида х+L, хєЕ. Легко проверить (это предоставляется читателю), что равенство х+L=y+L имеет место тогда и только тогда, когда x-yєL. Если же x-y L, то (x+L)(y+L)=. Согласно доказанному в упражнении 45, любой сдвиг x+L представляет собой плоское множество. Класс всевозможных сдвигов подпространства L будем обозначать символом E/L. Операция сложения элементов класса E/L определяется как обычно (см. упражнение 38). Читателю предоставляется доказать, что если X=x+L и Y=y+L суть два множества класса E/L, то X+Y=(x+y)+L, т.е. X+Yє E/L. Произведения λХ при λ0 (λєФ, Хє E/L) также определяется обычным образом. Если X=x+L, то, как легко видеть, λХ=λх+Lє E/L. Произведение 0Х по определению принимается равным L. Читателю предоставляется проверить, что класс E/L, рассматриваемый вместе с так определенными операциями сложения его элементов и умножения их на числа из Ф, становится векторным пространством над полем Ф. Это пространство называется фактор-пространством пространства Е по подпространству L. Нейтральным относительно сложения элементом пространства E/L является L. Вышесказанное означает, что функция f:E E/L, для которой при любом хєЕ f(x)=x+L,-является линейной функцией. Доказать, что если Е- n-мерное пространство, а L-r-мерное подпространство Е (rn), то размерность фактор-пространства E/L (называемая дефектом подпространства L) равна n-r. Указания. Если r=n, то L=E и E/L =L, так что размерность факторпространства равна 0=n-r. Пусть r
183
L линейную оболочку векторов xr+1, xr+2, …, xn, убедиться в том, что LL=θ и что E/L =x+L: xєL. Доказать, что элементы фактор-пространства xr+1+L, xr+2+L, …, xn+Lлинейно независимы и составляют базис пространства Е/L. 61. Пусть Е и F-конечномерные векторные пространства над одним и тем же полем Ф размерностей соответственно n и m: dimE=n, dimF=m. Пусть также A:EF-линейный оператор (линейная функция), т.е. AєL (E, F). Если хєЕ, то вместо А(х) будем писать просто Ах. Множество значений оператора А, т.е. множество yєF: y=Ax, xєE, как легко видеть, представляет собой векторное подпространство пространства F. Размерность r этого подпространства называется рангом линейного оператора А. Ясно, что rm. Легко видеть, что выполняется также и неравенство rn. В самом деле, пусть х1, х2,…, xn-базис пространства Е и y1=Аx1, y2=Аx2, …, yn=Axn. Тогда всякий вектор y=Ax из множества значений оператора А представим в виде: y=Ax=A(λ1х1+ λ2х2+…+ λnхn)= =λ1y1+ λ2y2+…+ λnyn. Если векторы y1, y2, …, yn-линейно независимы (а это будет тогда и только тогда, когда оператор А инъективен), то r=n. В противном случае r
184
Одновременно доказана инъективность сужения оператора А на множество Е1 (см. упражнение 47). Выше также фактически установлено, что любой вектор yєF1 является образом некоторого вектора хєЕ1 при отображении А. Следовательно, сужение оператора А на Е1 является биективным отображением пространства Е1 на F1. Наконец, каждый вектор yєF представим в виде y=ξ1y1+…+ξryr+ξr+1yr+1+…+ ξmym=y+y, где y=ξ1y1+ +…+ξryrє F1, yєF2. Учесть, что F1F2=θ. 62. Пусть Е-векторное пространство над полем Ф и АЕ. Множество функционалов fєE*: f(x)=0 для всех хєА=fєE*: f 1 (0)А будем называть ортогональным к (непустому) множеству А и обозначать А. Если А=θ, то А=Е*. Если А=Е, то А=0 (здесь О-функционал, тождественно равный нулю на Е). Ясно, что при любом непустом АЕ множество А является подпространством векторного пространства Е*. Легко убедиться в том (предоставляем это читателю), что если L-линейная оболочка множества А, то L=А. Пусть Е–n-мерное векторное пространство и АЕ-конечное линейно независимое множество, состоящее из r векторов (1 r n): А=x1, x2,…,xr. Дополним множество А до базиса В пространства Е: В= x1,…, xr, xr+1, …, xn. Рассмотрим линейные функционалы f1, …, fr, fr+1, …, fn такие, что fi(xj)=ij, i, j=1, 2, …, n. Согласно доказанному в упражении 58, такие функционалы существуют, определены однозначно и составляют базис пространства Е*. Если fє А, то в разложении f=λ1f1+λ2f2+…+λrfr+λr+1fr+1+…+ λnfn коэффициенты λ1, λ2,…, λr должны равняться 0. И обратно, всякая линейная комбинация функционалов fr+1, …, fn принадлежит А. Итак, А есть подпространство пространства Е*, натянутое на элементы fr+1, …, fn, и имеет размерность nr. Поэтому дефект подпространства А в Е*, т.е. размерность факторпространства Е*/ А, равна n-(n-r)=r (см. упражнение 60). Если А-любое конечное множество в Е (не обязательно линейной независимое) и А1максимальное линейно независимое подмножество множества А, то А1=А. поэтому в рассматриваемом случае дефект подпространства А в Е* равен числу элементов максимального линейно независимого подмножества множества А. Пусть теперь Е-векторное пространство, не являющееся конечномерным и пусть по-прежнему А-конечное подмножество множества Е. Рассмотрим максимальное линейно независимое подмножество А1=x1, x2,…,xr множества А. Как указано выше, А1=А. Мы хотим доказать, что и в случае бесконечномерного пространства Е дефект подпространства А в Е* равен r. Пусть f1, f2, …, fr-линейные функционалы из Е* такие, что fi(xj)=ij, i, j=1, 2, …, r. Эти функционалы составляют линейно независимое множество в Е*: если λ1f1+λ2f2+…+λrfr=0, то при любом i=1, 2, …, r λ1f1(xi)+λ2f2(xi)+…+λrfr(xi)=0, откуда λi=0. Обозначим Х1=f1+А, Х2=f2+А, …, Хr=fr+А. Эти множества являются, как легко видеть, линейно независимыми элементами фактор-пространства
185
Е*/А. В то же время любой элемент f+А (fєЕ*) пространства Е*/А является линейной комбинацией элементов Х1, Х2,…,Хr. В самом деле, пусть f(x1)=λ1, f(x2)=λ2, …, f(xr)=λr. Тогда линейный функционал f- λ1f1-λ2f2… λrfr принадлежит А, откуда f+А=(λ1f1+λ2f2+…+λrfr)+А= λ1Х1+ +λ2Х2+…+λrХr. Следовательно, фактор-пространство имеет размерность r, т.е. дефект подпространства А в Е* равен числу элементов максимального линейно независимого подмножества множества А. Пользуясь результатом упражнения 56, доказать, что если Аконечное подмножество Е и ГЕ* тотально на Е и является векторным подпространством Е*, то дефект подпространства АГ в Г равен числу элементов максимального линейно независимого подмножества множества А. 63. Пусть Е-векторное пространство над полем Ф и -некоторое множество функционалов из Е* (т.е. Е*). Множество хєЕ: f(x)=0 для всех fє будем называть ортогональным к множеству и обозначать . Ясно, что является подпространством пространства Е. Если содержит лишь один функционал f, то= f 1 (0). В частности, если = f, где f=0, то =Е. Доказать, что если -конечное множество функционалов из Е*, то дефект подпространства в Е, т.е. размерность фактор-пространства Е/ совпадает с числом элементов максимального линейно независимого подмножества множества . ~ Указание. Пусть =f1, f2,…,fr есть максимальное линейно
~
независимое подмножество множества . Убедиться, что =. Пользуясь результатом упражнения 57, найти векторы x1, x2,…,xr из Е такие, что fi(xj)=ij, i, j=1, 2, …, r. Доказать, что элементы х1+, х2+, …, хr+ фактор пространства Е/ линейно независимы (от противного) и составляют базис этого пространства (с этой целью установить для любого хєЕ принадлежность х- λ1х1-λ2х2-…- λrхrє, где λi=fi(x), i=1, 2, …, r ). Замечание. Нетрудно убедиться, что для конечного множества Е* имеет место равенство ()=L(), где L()-линейная оболочка множества в Е*. В самом деле, включение L()() очевидно. Чтобы доказать обратное включение, расмотрим любой функционал f, обращающийся в 0 на . Пусть f(х1)=μ1, f(х2)=μ2, …, f(хr)=μr. Тогда функционал f-μ1f1-μ2f2-…-μrfr обращается в 0 и на и на векторах x1, x2,…,xr. Так как любой вектор хєЕ представим в виде х= λ1х1+λ2х2+…+λrхr+
õ,
где
õ є,
то функционал f-μ1f1-μ2f2-…-μrfr r
обращается в 0 на любом векторе хєЕ, т.е. f-∑μ1f1=0 и f= i f i єL(). i 1
64. Пусть Е-векторное пространство над полем Ф и f, f1, f2,.., fn – линейные функционалы на Е, причем f1, f2,.., fn –линейно независимы.
186
Пусть также λ, λ1, λ2,…, λn-любые числа из Ф. Рассмотрим гиперплоскости Нi=xєE: fi(x)=λi, i=1, 2, …, n. Согласно доказанному в упражнении 57, n
множество
H
i
не пусто. Доказать, что если гиперплоскость Н=xєE:
i 1
n
f(x)=λ содержит
H i 1
i
, то найдутся такие числа μ1, μ2,…, μn из Ф, что
f=∑μifi и λ=∑μiλi . Указание. Если бы функционалы f, f1, f2, …, fn оказались линейно независимыми, то (согласно доказанному в 57) нашелся бы вектор х 0єЕ с тем свойством, что f1(х0)=λ1, f2(х0)=λ2, …, fn(х0)=λn, f(х0)=λ+1 (вместо 1 можно взять любое число, отличное от 0). Но первые n из указанных равенств влекут за собой равенство f(х0)=λ, что противоречит равенству f(х0)=λ+1. Полученное противоречие доказывает линейную зависимость функционалов f, f1, f2, …, fn, т.е. доказывает равенство f=∑μifi при некоторых μi из Ф. Подставляя в это последнее равенство любой вектор хє∩Нi, придем к равенству λ=∑μiλi. 65. Пусть Е и F-векторные пространства над одним и тем же полем Ф и А:Е→ F-линейный оператор, т.е. АєL(E, F). Оператор А*:F*→E*, определяемый равенством (А*φ)(х)=φ(Ах) при любом φє F* и любых хєЕ, будем называть двойственным к А. Если φ1, φ2є F* и λєФ, то при любом хєЕ (А*(φ1+φ2))(х)=(φ1+φ2)(Ах)=φ1(Ах)+φ2(Ах)=(А*φ1)(х)+(А*φ2)(х)= =(А*φ1+А*φ2)(х) и (А*(λφ1))(х)=(λφ1)(Ах)=λφ1(Ах)=λ(А*φ1)(х), откуда А*( φ1+φ2)=А*φ1+А*φ2 и А*(λφ1)=λА*φ1. Легко убедиться в том (это предоставляется читателю), что при любом φєF* А*φ действительно является линейным функционалом на Е. Таким образом, А*єL (F*, Е*). Рассмотрим множества А*-1(0)=φєF*: А*φ=0=φєF*:φ(Ах)=0 при любом хєЕ и F1=А(Е)-множество значений оператора А. Мы видим, что А*-1(0)=F1. Поэтому, если F1≠F, то существуют ненулевые функционалы φєF*, обращающиеся в 0 на F1, т.е. ненулевые φ, принадлежащие F1= =А*-1(0). Значит, при F1≠ F оператор А* не инъективен. Если же F1= F, то множество F1=А*-1(0) содержит только нулевой функционал и потому оператор А* инъективен. Итак, оператор А* инъективен тогда и только тогда, когда оператор А сюръективен. Пусть Е* и является множеством значений оператора А*: =А*(F*). Пусть также L0=хєЕ: Ах=θ′=А-1(θ′). Доказать, что =L0. Указание. Если fє, то f=A*φ, φєF* и для любого хєЕ f(x)=φ(Ах). Поэтому, если хєL0, то f(x)=φ(θ′)=0, так что fєL0. Этим доказано, что L0. Обратно, пусть fєL0, т.е. f обращается в 0 на L0 (fєЕ*). Определим функционал φєF* следующим образом. Для любого yєF1=A(E) положим φ(y)=f(x), где х-любой элемент множества А-1(y). Это определение корректно, так как для любых элементов х′, х′′єА-1(y) имеем: Ах′=y, Ах′′=y, А(х′′-х′)=θ′, х′′-х′єL0, f(х′′-х′)=0, откуда f(х′′)=f(х′). Легко убедиться в том
187
(это предоставляется читателю), что функционал φ линеен на F1. Продолжив φ по линейности на все пространство F, будем иметь: (А*φ)(х)=φ(Ах)=f(х) для любого хєЕ. Значит, f= А*φє. Замечание. Из доказанного следует, что оператор А* сюръективен тогда и только тогда, когда оператор А инъективен. 66. Пусть Е-векторное пространство над полем Ф (Ф-это R или С). Всякую функцию р:Е→ R будем называть преднормой, если она удовлетворяет условиям: р(х)≥0, р(λх)=|λ|р(х), р(х+y)≤p(x)+p(y) для любых х,yєЕ и любого λєФ. Чтобы привести пример преднормы, рассмотрим любое множество S и совокупность m(S) всех ограниченных функций f:S→R (ограниченность функции f означает существование такого действительного числа Mf>0, что |f(s)|≤Mf для всех sєS). В множестве m(S) обычным образом определяются операции сложения элементов и умножения их на действительные числа, после чего m(S) превращается в векторное пространство над полем R. Для любого фиксированного s0єS определим функцию P0:Е→R (Е=m(S)): P0(f)=|f(s0)| равенством. Легко видеть, что P0 удовлетворяет всем условиям, характеризующим преднорму. Обратим внимание на то, что P0(f) обращается в 0 не только при f=О, но P0(f)=0 для любой такой функции fєm(S), что f(s0)=0. Если р:Е→R является преднормой, то ясно, что р(θ)=0. Если равенство р(х)=0 возможно только при х=θ, то преднорма р называется нормой. Расматривая R как векторное пространство над самим собой, замечаем, что функция р:R→R, для которой р(х)=|х| для любого хєR, является нормой. Согласно доказанному в упражнении 34, функция р:Rn→R, для которой р(х)= õ, õ = ( õ ) ... ( õ ) для любого х=(х1, …, хn)єRn,является нормой на векторном пространстве Rn. Векторное пространство Е, рассматриваемое вместе с определенной на Е нормой р, будем называть нормированным пространством. При этом вместо р(х) будем употреблять обозначение ||х|| (если на Е определены несколько различных норм р, р1, р2, …,рк, то будем употреблять обозначения ||х||, ||х||1, …, ||х||к. Доказать, что функция р: m(S)→R, для которой р(f)=sup|f(s)|:sєS (fлюбая функция из m(S)), -является нормой на векторном пространстве m(S). Доказать также, что если р-преднорма на векторном пространстве Е, то для любых х, yєЕ имеет место неравенство: |р(х)-р(y)|≤p(x-y). B частности, | ||x||-||y|| |≤ ||x-y||. 67. Пусть р и q-преднормы на векторном пространстве Е, причем всякий раз, когда р(х)<1, выполняется неравенство q(x)≤1. Доказать, что при этих условиях для всех хєЕ выполняется неравенство q(x)≤р(х). 1 2
n 2
188
Указание. В противном случае найдутся вектор х0єЕ и число α>0 õ0 õ0 такие, что q(x0)>α>р(х0), откуда q( )>1>p( ).
68. Пусть р-преднорма на векторном пространстве Е. Доказать, что для любого α>0 множества хєЕ: р(х)<α и хєЕ: р(х)≤α являются абсолютно выпуклыми и поглощающими. Указание. Чтобы доказать абсолютную выпуклость множества А=хєЕ: р(х)<α достаточно взять любые x, yєА и любые λ, μєФ такие, что |λ|+|μ|≤1 и убедиться, что λx+μyєА. Имеем: р(λx+μy)≤р(λx)+р(μy)=|λ|р(х)+|μ|р(y). Если λ=μ=0, то ясно, что р(λx+μy)<α. Если же 0<|λ|+|μ|≤1, то р(λx+μy)<|λ|α+|μ|α≤α, т.е. и в этом случае р(λx+μy)<α и λx+μyєА. Далее, пусть y-любой вектор из Е и р(y)=μ. Найдем λ>0 такое, что ó ð ( ó) ó λ> . Тогда р( )= = <α, т.е. єA. Если |ν|≤1, то
y y | | p ( y ) | | = = ≤ <α. Значит, и єА, т.е. А является
р
поглощающим множеством. Аналогично доказывается, что и множество хєЕ: р(х)≤α при α>0 является абсолютно выпуклым и поглощающим. 69. Пусть А-абсолютно выпуклое поглощающее подмножество векторного пространства Е. Доказать, что на Е можно определить преднорму р такую, что хєЕ: р(х)<1АхєЕ: р(х)≤1 Указание. Для любого yєЕ существуют такие числа λ>0, что
ó єА
ó єA и убедиться, что функция р:Е→R является преднормой на Е. Неравенство р(y)≥0 очевидным образом выполняется. Если μ=0, то равенство р(μy)=|μ|р(y) также выполняется, ибо р(θ)=0. Пусть μєФ и μ0. Обозначим р(y)=λ0, р(μy)=λ1. ó Если λ>λ0, то єA (читателю предлагается обосновать это утверждение),
(см. упражнение 41). Положить р(y)=infλєR: λ>0 и
откуда
y єA (ведь А-уравновешенное множество). Следовательно, | |
|μ|λ≥λ1, а так как это верно при любом λ>λ0, то |μ|λ0≥λ1 (обосновать!). Далее, при любом λ>λ1
ó єA,
y y откуда єA, т.е. | | єA. Следовательно,
189
1 ≥λ0, а так как это верно при любом λ>λ1, то ≥λ0 и λ1≥|μ|λ0. Из этого и ранее полученного неравенства следует, что λ1=|μ|λ0, т.е. р(μy)=|μ|р(y). Чтобы доказать неравенство p(x+y)≤р(х)+р(y) (для любых х, yєE) обозначим р(х)=ν1, р(y)= ν2 и зададимся произвольным числом ε>0. тогда õ y À, À , хє(ν1+ε)А, yє(ν2+ε)А и x+y є (ν1+ν2+2ε)A (см. 2 1 õ y À , откуда ν1+ν2+2ε≥р(x+y). Упражнение 39). Следовательно, 1 2 2 Так как это верно при любом произвольно малом числе ε>0, то ν1+ν2≥ р(x+y), т.е. р(x+y)≤р(x)+р(y). Остается доказать (что не составляет трудностей и предоставляется читателю), что хєЕ: р(х)<1АхєЕ: р(х)≤1. Заметим, что преднорма р:Е→R, определенная равенством р(х)= =infλєR: λ>0 и х/λєA, называется калибровочной функцией или функционалом Минковского абсолютно выпуклого поглощающего множества А. 70. Пусть А-абсолютно выпуклое поглощающее множество в Е и ркалибровочная функция множества А. Пусть также α0-произвольное число из Ф. Согласно доказанному в упражнении 40, множество αА является абсолютно выпуклым. Убедиться, что множество αА является также поглощающим и доказать, что калибровочная функция q множества 1 αА связана с р равенством: q= р. | | ó Указание. Для любого yєЕ найдется такое λ>0, что єА, откуда | | y
є|α|АαА (см. упражнение 38). Следовательно,
ó
À и (так как
ó À при любом νєФ с |ν|≤1. αА-уравновешенно) Этим доказано, что αА-поглощающее множество. Далее, для любого хєЕ обозначим р(х)=λ0, q(х)=λ1. Тогда при любом ε>0 имеем:
õ | | õ õ À , 0 À, À À , 1 , (0 ) 0 0 | |
λ0+ε≥|α|λ1, откуда (ввиду произвольности числа ε>0) λ0≥|α|λ1. Точно так же
õ õ À , À À , (λ1+ε)|α|≥λ0 и λ1|α|≥λ0 Из 1 | | | | 1
выделенных неравенств следует, что q(x)=
1 р(х). | |
190
71. Пусть А и В-абсолютно выпуклые поглощающие множества в Е с калибровочными функциями р и q сответственно. Множество А∩В обсолютно выпукло и, как легко убедиться (это предоставляется читателю),-поглощающее. Доказать, что калибровочная функция r множества А∩В связана с р и q равенством r(x)=max(p(x), q(x)) для любого хєЕ. Указание. Зафиксировав любой вектор хєЕ, обозначим р(х)=λ1,
õ ~ À, = max(λ1, λ2). Тогда при любом ε>0 ~ õ õ Â , т.е. ~ À Â , откуда ~ +ε≥λ3 и (ввиду произвольности ~ õ õ õ ~ À Â , т.е. Àи Â, в числа ε>0) ≥ λ3. Далее, 3 3 3 ~ силу чего λ3+ε≥λ1 и λ3+ε≥λ2. Следовательно , λ3+ε≥ и (ввиду ~ произвольности числа ε>0) λ3≥ . Из выделенных жирным шрифтом ~ неравенств следует, что λ3= , ч.т.д. q(x)=λ2, r(x)=λ3,
Заметим, что если абсолютно выпуклое поглощающее множество А является подмножеством абсолютно выпуклого поглощающего множества В (АВE), то А∩В=А и потому при любых хєЕ р(x)=max(p(x), q(x)), т.е. при любом хєЕ q(x)≤р(х). 72. Пусть А -абсолютно выпуклое поглощающее множество в Е и ркалибровочная функция множества А. Согласно доказанному в упражнении 69, хєЕ: р(х)<1АхєЕ: р(х)≤1. Доказать, что если абсолютно выпуклое поглощающее множество ВЕ заключено в тех же пределах, что и А: хєЕ: р(х)<1ВхєЕ: р(х)≤1, то калибровочная функция q множества В совпадает с р, т.е. q=р. Указание. Так как хєЕ: q(х)<1BхєЕ: q(х)≤1, то (р(х)<1)→(хєВ)→( q(х)≤1) и (q(х)<1)→(хєВ)→(р(х)≤1) Исходя из доказанного в упражнении 67, можно заключить, что для всех хєЕ выполняется как неравенство q(х)≤р(х), так и неравенство р(х)≤q(х). Следовательно, для всех хєЕ q(х)=р(х). 73. Пусть Е-векторное пространство над полем R и х, у-какие-либо два вектора из Е, Рассмотрим множество А всех тех векторов пространства Е, которые представимы в виде х+ty, где t «пробегает» множество R всех действительных чисел. Легко проверить (это предоставляется читателю), что множество А представляет собой прямую, проходящую через точки х и z0=x+t0y, где t0-любое действительное число, отличное от 0. Множество А всех точек вида x+ty, tєR будем называть прямой, проходящей через точку х в направлении вектора y. Рассмотрим произвольное множество МЕ. Будем говорить, что М содержит непустое ядро , если найдется такая точка хєМ, что для любого yєЕ существует действительное число ε=ε(у)>0 с тем
191
свойством, что х+tуєМ при |t|<ε (tєR). Множество всех таких точек хєМ будем называть ядром множества М. Доказать, что множество МЕ является поглощающим тогда и только тогда, когда оно содержит непустое ядро, которому принадлежит нулевой элемент θ. Пусть А- абсолютно выпуклое поглощающее множество в Е и ркалибровочная функция множества А. Доказать, что множество {хєЕ: р(х)<1А является ядром множества А. Указание. Пусть х0-любая точка множества {хєЕ: р(х)<1, т.е. р(х0)=λ0<1. При любом уєЕ и любом tєR p(x0+ty)≤ р(х0)+|t|p(y). Если р(у)=0, то при любом tєR x0+ty є {хєЕ: р(х)<1А. Если же р(у)>0, то возьмем 1 0 ε= . Тогда при |t|<ε p(x0+ty)≤р(х0)+|t|p(y)<р(х0)+εр(у)=1, т.е. ð ( ó) x0+tyє{хєЕ: р(х)<1А. Значит, х0-точка ядра множества А. Обратно, пусть х0 принадлежит ядру множества А и требуется доказать, что р(х0)<1. Допустим противное. Так как А{хєЕ: р(х)≤1, то р(х0)=1. Беря в качестве у вектор х0, найдем такое ε>0, что при |t|<ε x0+tх0єА. Возьмем любое t из интервала (0, ε). Для такого t с одной стороны р(x0+tх0)≤1, а с другойр(x0+tх0)=(1+t)p(x0)=1+t>1. Полученное противоречие доказывает, что всякая точка ядра множества А принадлежит множеству {хєЕ: р(х)<1. 74. Пусть Е-векторное пространство над полем R и Нгиперплоскость в Е. Согласно доказанному в упражнении 54, найдутся fєЕ*, f0 и число λєR такие, что Н={хєЕ: f(x)=λ}. Рассмотрим какое-либо непустое множество АЕ, не лежащее целиком в гиперплоскости Н: АН (хотя множества А и Н могут иметь общие точки). Будем говорить, что множество А лежит по одну сторону от гиперплоскости Н, если либо А{хєЕ: f(x)≤λ}, либо А{хєЕ: f(x)≥λ}. Ясно, что оба указанных включения выполняться не могут, ибо это будет означать, что А целиком лежит в гиперплоскости Н. Доказать, что А лежит по одну сторону от гиперплоскости Н тогда и только тогда, когда выпуклая оболочка множества А\Н не пересекает Н. Указание. Пусть А лежит по дону сторону от Н. Любая точка выпуклой оболочки множества А\Н имеет вид (при некотором nєN) μ1х1+μ2х2+..+μnxn, где μi≥0, ∑ μi=1 и хiєА\Н, i=1, 2, …, n. При всех i f(xi)<λ, либо f(xi)>λ. В первом случае f(μ1х1+μ2х2+..+μnxn)=μ1f(х1)+…+ +μnf(хn)<λ∑μi=λ, а во втором случае f(μ1х1 +..+μnxn)>λ. В обоих случаях μ1х1+μ2х2+..+μnxn Н, а это и означает, что выпуклая оболочка множества А\Н не пересекает Н. Обратно, пусть выпуклая оболочка множества А\Н не пересекает Н и требуется доказать, что А лежит по одну сторону от Н. Зафиксируем какую-либо точку х0є А\Н и пусть для определенности f(x0)<λ. Убедиться, что и для любой точки хєА\Н будет f(x)<λ (в противном случае для некоторого х1єА\Н f(x1)<λ и найдется μ такое, что 0< μ<1 и μх0 +(1-μ)х1єН).
192
75. Пусть Е-нормированное пространство (см. упражнение 66), х 0єЕ и r-любое действительное положительное число. Множество {хєЕ: ||х-х0||≤ r} будем называть шаром с центром в точке х0 радиуса r и обозначать символом В(х0, r). Шар В (θ, 1)={хєЕ: ||х||≤ 1} будем называть единичным шаром пространства Е. Множество S={хєЕ: ||х||=1} будем называть единичной сферой нормированного пространства Е. Заметим, что в множествах R и C, каждое из которых расматривается как векторное пространство над самим собой, мы будем рассматривать только одну норму-модуль числа. В пространстве Rn (n>1) также будем расматривать только одну, эвклидову норму. ||х||=
õ, õ = ( õ1 ) 2 ... ( õn ) 2 , где х=(х1, х2, х3…, хn).
Множество АЕ называется ограниченным, если оно содержится в некотором шаре В (θ, r), т.е. АВ (θ, r) при некотором r>0. В соответствии с этим определением, множество АR ограничено тогда и только тогда, когда существует такое r>0, что для любого хєА |х|≤r или, что то же самое, А[–r, r]. Ранее (см. 2.122) мы определили ограниченное множество в R как множество, ограниченное и сверху и снизу. Читателю предлагаем убедиться в равносильности нового и старого определений. Пусть Е и F-векторные пространства над одним и тем же полем Ф (R или С), в каждом из которых определена норма (эти нормы для упрощения записей будем обозначать одним и тем же символом ||…||). Пусть также Тлинейный оператор из Е в F, т.е. ТєL (Е, F). Оператор Т будем называть ограниченным, если ограничено следующее множество неотрицательных действительных чисел: {||Тх||: хєЕ, ||х||≤1}. Легко убедиться в том, что сумма двух ограниченных линейных операторов из Е в F является ограниченным линейным оператором. Далее, если Т-ограниченный линейный оператор и λ-любое число из Ф, то λТ также является ограниченным линейным оператором. Следовательно, множество всех ограниченных линейных операторов из Е в F является подпространством векторного пространства L (Е, F). Это подпространство будем обозначать
~ ~ L (Е, F). Определим на множестве L (Е, F) функцию р со значениями в R, ~ полагая (для любого Тє L (E, F)) р(Т)=sup {||Тх||: хєЕ, ||х||≤1}. ~ Доказать, что р-норма на векторном пространстве L (Е, F). ~ Указание. Чтобы доказать равенство р (λТ)=|λ|Р(Т) при λ0 и Тє L (Е,
F), заметим, что для всех хєЕ с ||х||≤1 ||(λТ)х||=|λ|·||Тх||≤|λ|Р(Т). Задавшись любым ε>0, можно найти такой вектор хεєЕ, что ||хε||≤1 и ||Тхε||>Р(Т)-
. | |
Следовательно, ||(λТ)хε||=|λ|·||Тхε||>|λ|∙Р(Т)-ε. Полученные неравенства позволяют утверждать, что Р(λТ)=sup{||(λТ)х||: хєЕ, ||х||≤1}=|λ|Р(Т).
~
Доказательство неравенства Р(Т1+Т2)≤ Р(Т1)+Р(Т2), где Т1, Т2є L (Е, F)-не представляет затруднений.
193
Замечание. В дальнейшем вместо Р(Т) будем писать ||Т|| для любого
~ ~ Т є L (Е, F). Таким образом, L (Е, F) превращается в нормированное векторное пространство (над полем Ф). Легко видеть, что для любого
1 õ ||≤||Т||, откуда ||Тх||≤||Т||·||х||. Это неравенство верно и хθ (хєЕ) ||Т || õ || при х=θ. Легко убедиться в том (это предоставляется читателю), что ||Т||=sup {||Тх||: хєЕ, ||х||=1}, а также ||Т||=sup {||Тх||: хєЕ, ||х||<1}. Здесь
~
всюду под Т понимается элемент пространства L (Е, F). Если Е-нормированное векторное пространство над полем Ф, то
~
нормированное векторное пространство L (Е, Ф), т.е. нормированное векторное пространство всех ограниченных линейных функционалов на Е, будем обозначать через Е' (Е'Е*). Если fєЕ', то для любого хєЕ |f(х)| ≤ ||f||·||х||, где ||f||=sup{|f(x)|: хєЕ, ||х||≤1}. 76. Пусть F- нормированное векторное пространство над полем R.
~
Доказать, что L (Rn, F)=L(Rn, F), т.е. доказать, что каждый линейный оператор Т:Rn→F ограничен. Указания. Обозначив у1=Те1, у2=Те2, …, yn=Тen, где {е1, е2, …, en}стандартный базис в Rn, оценить ||Тх|| для любого х=х1е1+х2е2+…+ xnen из Rn и убедиться, что ||Т||≤ || ó1 || 2 || ó2 || 2 ... || ón || 2 . Замечание. Таким образом, можно утверждать, что (Rn)'=(Rn)*. Согласно доказанному в упражнении 59, если fє(Rn)*, то для любого xєRn f(x)=а, х, где а=(f(е1), f(е2), …, f(en)). Следовательно (см. 34), |f(x)|=
à =|а, х|≤||а||·||х||, откуда ||f||≤||а||. Беря х= (мы считаем, что f0, а тогда и || à || à, à || à || 2 аθ), получаем: f(x)=а, х= = =||а||. Так как ||х||=1, то || à || || à || неравенство ||f||<||a|| не может иметь места, т.е. ||f||=||a||. Это равенство имеет место и при f=0, ибо тогда и а=θ. Если каждому aєRn поставить в соответствие линейный функционал faє(Rn)* такой, что при любом xєRn fa(x)=а, х, то получим изоморфизм векторного пространства Rn на векторное пространство (Rn)*, сохраняющий норму. Это означает, что для любого aєRn ||fa||=||a||. 77. В упражнении 34 было определено понятие внутреннего (скалярного) произведения двух векторов пространства Rn. В случае произвольного векторного пространства Е над полем R внутренним (скалярным) произведением в Е называется любой симметричный билинейный функционал, т.е. такая функция из ЕхЕ в R (значение которой на любой паре векторов (х, у) будем обозначать х, у), что 1) х, у=у, х (симметричность) и
194
2) αх, у=х, αу=αх,у; х1+х2, у=х1, у+х2, у, х1, у1+у2=х, у1+ +х1, у2 (билинейность) для любых векторов х, х1, х2, у, у1, у2 из Е и любого αєR. Векторное пространство Е (над полем R), расматриваемое вместе с определенным на ЕхЕ симметричным билинейным функционалом (скалярным произведением) будем называть векторным пространством со скалярным произведением. Векторное пространство со скалярным произведением будем называть нормируемым, если скалярное произведение обладает положительной определенностью: для любого хєЕ х, х≥0 причем равенство х, х=0 возможно только при х=θ. В этом случае норма на Е определяется через скалярное произведение следующим образом: ||х||=
õ, õ . Как и в 34, доказывается, что для любых векторов х, уєЕ
|х, у|≤||х||·||у||. Исходя из этого, легко доказать, что ||х+у||2=х+у, х+у=||х||2+2х, у+||у||2≤(||х||+||у||)2, откуда ||х+у||≤||х||+||у||. Остальные свойства нормы выполняются очевидным образом. Нормированное векторное пространство Е (над полем R) будем называть нормированным пространством со скалярным произведением (или обобщенным эвклидовым пространством), если на Е существует такое скалярное произведение, что ||х||2=х, х для всех хєЕ. Доказать, что нормированное пространство Е тогда и только тогда является обобщенным эвклидовым пространством, когда норма на Е удовлетворяет условию: для любых х, уєЕ ||х+у||2+||х-у||2=2||х||2+||у||2) (читателю предлагается установить геометрический смысл этого равенства в случае Е=R3). Указание. Если на Е существует такое скалярное произведение, что 2 ||х|| =х, х для всех хєЕ, то справедливость равенства ||х+у||2+||ху||2=2||х||2+||у||2) для всех х, уєЕ очевидна. Обратно, пусть равенство ||х+у||2+||х-у||2=2||х||2+||у||2) выполняется для всех х, уєЕ. Для любых х, уєЕ
|| õ ó || 2 || x y || 2 положим х, у= и убедимся, что этим равенством 4 действительно определен симметричный билинейный положительно определенный функционал. Симметричность и положительная определенность указанного функционала усматривается непосредственно. Для доказательста его билинейности, возьмем любые три вектора х, у, z из Е и подставим в равенство: ||х+у||2+||х-у||2=2||х||2+||у||2) вместо х сначала х+z, а затем х-z. Будем иметь: ||х+z+у||2+||х+z-у||2=2||х+z||2+||у||2), ||х-z+у||2+||х-z-у||2=2||х-z||2+||у||2). Вычитая из первого равенства второе и деля полученное равенство на 4, получим:
195
|| ( õ ó) z || 2 || ( õ y) z || 2 || ( õ ó) z || 2 || ( õ y) z || 2 + = 4 4 || õ z || 2 || õ z || 2 2 или 4
х+у, z+x-y, z=2x,z. (*) Это равенство справедливо для любых трех векторов х,у,z из Е. Полагая в нем у=х, получаем равенство 2х, z=2х, z, справедливое для любых векторов х, zєЕ. Теперь возьмем любые векторы u, vєЕ и положим в равенстве (*) x=(u+v)/2, y=(u-v)/2. получим равенство u,z+v,z=2(u+v)/2, z или u,z+v,z=u+v,z, справедливое для любых трех векторов u, v, z из Е. Этим доказана аддитивность функционала …, … по первому переменному. В силу симметричности функционала, имеет место и аддитивность по второму переменному. Остается доказать справедливость равенства αх, у=αх, у для любого αєR и любых х, уєЕ. Используя аддитивность функционала по первому переменному, легко доказать, что для любого натурального числа n nх, у=nх, у (применить индукцию по числу n). Далее, из определения символа х, у следует, что -х, у=-х, у. Поэтому для любого отрицательного целого числа n имеем: nх,у=|n|·(-х),у |n|·-x,y=(-|n|)·x,y=nx,y. Если m-любое натуральное число, то х, у=m·(
1 1 x), y=m· x, y, откуда m m
1 1 n x, y= х, у. Наконец, для любого рационального числа r= m m m 1 1 1 (nєZ, mєN) rх, у=n·( x), y=n x, y=n· ·х, у=rх, у. m m m
Пусть теперь α-иррациональное число. Зададимся произвольно малым положительным числом ε и найдем рациональное число r так, чтобы |α-r|<ε и |r|<|α|. Будем иметь: |αх, у-αх,у|=|αх, у-rх, у+rх, у1 4
αх,у| ≤ |αх, у-rх,у|+|α-r|·|х,у|. Далее, |αх, у-rх,у|=| (||αх+у||2-||αх1 1 1 (||rх+у||2-||rх-у||2)|≤ |||αх+у||2-||rх+у||2|+ |||αх-у||2-||rх-у||2|= 4 4 4 1 1 = |(||αх+у||+||rх+у||)(||αх+у||-||rх+у||)|+ |(||αх-у||+||rх-у||)(||αх-у||-||rх-у||) |. 4 4
у||2)-
Воспользовавшись неравенством | ||u||-||v|| |≤||u-v|| (см. упражнение 66), получим: |αх,у-rх,у|≤(|α|·||х||+||у||·||αx-rх||=|α-r|·||х||·(|α|·||x||+||у||). Таким образом, |αх,у-αх,у|≤|α-r| [|х,у|+||x||(|α|·||x||+||y||)]≤ε·[|х,у|+||x||(|α|·||x|+||y||)].
196
Мы видим, что величина |αх,у-αх,у| меньше произвольно малого положительного числа, откуда следует, что αх,у=αх,у. 78. Пусть А: Rn→Rm есть линейный оператор. Определим понятие матрицы оператора А относительно стандартных базисов в Rn и Rm. С этой целью напишем разложения векторов Ае1, Ае2, …, Аеn (где{е1, е2, …, еn }стандартный базис в Rn) по векторам е'1, е'2, …, е'm (стандартный базис в Rm): Ае1=a11е'1+ a21е'2+…+am1e'm=(a11, …, am1), Ае2=a12е'1+ a22е'2+…+am2e'm=(a12, …, am2), …………………………………………… Аеn=a1nе'1+ a2nе'2+…+amne'm=(a1n, …, amn). Коэффициенты этих разложений удобно представлять себе расположенными в прямоугольную таблицу (матрицу) из m строк и n столбцов так, чтобы каждый j-ый столбец (j=1, 2, …,n) был образован коэффициентами разложения вектора Аеj (или, что то же-кординатами вектора Аеj). Эта таблица называется матрицей оператора А (относительно стандартных базисов в Rn и Rm) и обозначается [A]:
a11 a12 ...a1n a a ...a 21 22 2 n [A]= .................. a a ... a m1 m 2 mn Для краткости вместо «матрица из m строк и n столбцов» будем говорить «mxn-матрица». Ясно, что каждая mxn-матрица А может расматриваться как матрица [A] вполне определенного линейного оператора А: Rn→Rm (относительно стандартных базисов в Rn и Rm). Если В: Rn→Rm также есть линейный оператор из Rn в Rm с матрицей
b11 b12...b1n b b ...b 21 22 2 n [В]= .................. , bm1 bm 2 ...bmn То под суммой матриц [A] и [В] будем понимать матрицу оператора А+В: [A] + [В]=[A+В]=
a11 b11...a1n b1n a b ...a b 21 21 2 n 2 n = ............................. am1 bm1...amn bmn
[A+В]
197
Если λєR, то под λ[A] будем понимать матрицу [λA] оператора λА, получающуюся из [A] умножением всех элементов этой матрицы на λ. После этих определений множество всех mxn–матриц можно рассматривать как векторное пространство над полем R. Это пространство можно нормировать, полагая для любой матрицы А=[A] ||А||=||A||. Доказать справедливость следующей оценки нормы оператора А:Rn→Rm: ||A||≤
à
2
ij
, где где сумма распространена на все элементы
матрицы [А] оператора А. Указание. Убедиться, что для любого х=(х1, х2, …, хn)=х1e1+х2e2+ …+ +хnen из Rn ||Ax||= (a11x a12 x ... a1n x ) (a21x a22 x ... a2 n x ) ... . После этого m раз применить неравенство Шварца. 79. Если АєL(Rn, Rm), a BєL(Rm, Rk), то суперпозицию B·AєL(Rn, Rk) будем обозначать просто BA и называть произведением операторов В и А (в указанном их порядке). Заметим, что при к≠n произведение АВ не имеет смысла. Произведением матрицы В=[B] на матрицу А=[A] (кxm-матрица умножается на mxn-матрицу) называется кxn-матрица оператора С=ВА: [B]·[A]=[C]. Чтобы выразить любой элемент cij матрицы [C] (этот элемент стоит на пересечении i-ой строки и j-го столбца) через элементы матриц [B] и [A], заметим, что cij есть i-я координата вектора Cej=B(Aej)=B(a1je'1+a2je'2+…+ amje'm)=a1j(b11e1''+b21e2''+…+bi1ei''+…+bk1ek'')+ +a2j(b12e1''+b22e2''+…+bi2ei''+…+bk2ek'')+ …+amj(b1me1''+b2me2''+…+bimei''+…+bkmek''), где {e1'', e2'',…, ek''}-стандартный базис пространства Rk. Таким образом, сij=bi1a1j+bi2a2j+…+bimamj, т.е. сij есть «скалярное произведение i-ой строки матрицы [В] на j-ый столбец матрицы [А]». Пусть х=(х1, х2, …, хn)-любой элемент пространства Rn, у=(у1, у2, …, уm)=Ах, где АєL(Rn, Rm). Записав координаты векторов х и у в виде столбцов (nx1-матрица и mx1-матрица), доказать, что 1
ó1 2 ó ó m
2
a11 a12 ... a1n a a ... a 21 22 2 n .................. a m1 a m 2 ... a mn
n 2
1
2
n 2
x1 a11 a12 ... a1n 2 a a ... a x 21 22 2 n , где .................. =[A]. x n am1 am 2 ... amn
80. Пусть А есть nxк-матрица, а В есть кxn-матрица, причем к
198
линейно зависимы (n векторов к-мерного пространства Rк, n>к): μ1Ве1+ +μ2Ве2+…+μnВеn=θ' (θ'-нулевой элемент пространства Rк, ∑|μi|>0. Поэтому μ1А(Ве1)+μ2А(Ве2)+…+μnА(Веn)=θ (нулевой элемент пространства Rn), т.е. векторы А(Ве1), А(Ве2),…, А(Веn)-линейно зависимы. Замечание. Всякая nxn-матрица называется квадратной матрицей порядка n и является матрицей вполне определенного оператора А: Rn→Rn. 81. Пусть А: Rn→Rn есть линейный оператор, сохраняющий норму, т.е. ||Ax||=||x|| для любого xєRn . Используя поляризационное тождество (см. 34), легко доказать, что оператор, сохраняющий норму, сохраняет и внутреннее (скалярное) произведение векторов, т.е.=<x, y> для любых x, yєRn. В самом деле, = || Ax Ay || 2 || Ax Ay || 2 || A( x y) || 2 || A( x y) || 2 || x y || 2 || x y || 2 = = 4 4 4
=<x, y>. Очевидно и обратное: линейный оператор А: Rn→Rn, сохраняющий внутреннее произведение, сохраняет и норму. Такой оператор обязательно инъективен, ибо если х≠у (x, yєRn), то ||Ax-Ay||=||A(x-y)||=||x-y||≠0, т.е. Ах≠Ау. Следовательно (см. 49), опертор А также и сюръективен и потому обладает обратным оператором А-1: Rn→Rn. Оператор А-1 также сохраняет норму: для любого хєRn ||x||=||A(A-1x)||=||A-1x||. Легко проверить также (это предоставляется читателю), что оператор А-1, как и А, является линейныйм оператором, т.е. А-1єL(Rn, Rn). Углом между двумя ненулевыми векторами x, yєRn будем называть x, y число <(х, у)>=arccos . Это определение корректно в силу || x || || y || доказанного в упражнении 34. Если угол между векторами х и у равен π/2, то векторы называются ортогональными. Ясно, что векторы х и у ортогональны тогда и только тогда, когда <х, у>=0 (х≠0, у≠0). Всякое множество {х, у, …, w}, состоящее из попарно ортогональных векторов, линейно независимо: если αх+βу+…+ξw=θ, то α<х,х>+β<у,х>+…+ +ξ<w,х>=0, откуда α·||x||2=0 и α=0. Аналогично доказывается, что β=…=ξ=0. Заметим, что стандартный базис {е1, е2, …, еn } пространства Rn состоит из попарно ортогональных векторов, норма каждого из которых равна 1. Такой базис называется ортонормированным базисом пространства. Если векторы х1, х2,…, хк-линейно независимы, но хотя бы для одной пары (i, j) <xi, xj>≠0, то можно построить такую конечную последовательность попарно ортогональных векторов х'1, х'2,…, х'к, что х1'=х1 и при любом i, 1≤i≤к, вектор хi' является линейной комбинацией векторов х1, х2,…, хi. Опишем процесс построения векторов х'2,…, х'к (называемый процессом ортогонализации системы векторов х1, х2,…, хк). Полагаем х'2=αх'1+х2=αх1+х2, где число α определяется из условия x2 , õ1 <x2', x1'>=0, т.е. α= . Далее, полагаем х'3=βх'1+γх'2+х3, где числа β x1 , x1
199
и γ определяются из условий <x3', x1'>=0 и <x3', x2'>=0: β=
x3 , õ1 , x1 , x1
x3 , õ2 . Заметим, что х2'≠θ, ибо х2' является линейной комбинацией x2 , x2 векторов х1, х2, причем коэффициент при х2 (равный 1), отличен от 0. Точно так же и х3'≠0, ибо х3' является линейной комбинацией векторов х1, х2, х3 с ненулевым коэффициентом при х3. Аналогично предыдущему можно определить векторы х 4',.., хк', в результате чего и получим конечную последовательность х1', х2', х2',..., хк' попарно ортогональных векторов, для которой х1'=х1 и при любом i, 1≤i≤к вектор хi' является линейной комбинацией векторов х1, х2,…, хi. Деля каждый вектор хi' на || хi'||, получим ортонормированную систему векторов. Легко видеть, что если линейный оператор А: Rn→Rn сохраняет норму, то он сохраняет и углы, т.е. <(x, y)=<(Ax, Ay) для любых двух ненулевых векторов х и у. В частности, такой оператор любую ортонормированную систему векторов переводит в ортонормированную же систему векторов. Вектор х≠θ называется собственным вектором линейного оператора n А: R →Rn, если Ах=λх при нектором λєR. При этом число λ называется собственным значением оператора А. Про собственный вектор х говорят, что он принадлежит собственному значению λ. Если х есть собственный вектор оператора А, принадлежащий собственному значению λ, то и любой вектор μх (μ≠0) является собственным вектором оператора А, принадлежащим собственному значению λ. Множество всех собственных векторов оператора А, принадлежащих одному и тому же собственному значению, пополненное нуль-вектором θ,-представляет собой подпространство пространства Rn. Пусть линейный оператор А: Rn→Rn обратим (т.е. существует обратный оператор А-1, для чего необходимо и достаточно, чтобы оператор А был инъективен). Пусть также А имеет n попарно ортогональных собственных векторов х1, х2,…, хn: Ax1=λ1x1, Ax2=λ2x2, …, Axn=λnxn, <xi, xj>=0 при i≠j. Доказать, что оператор А сохраняет углы тогда и только тогда, когда |λ1|=|λ2|=…=|λn|. Указание. Пусть |λ1|=|λ2|=…=|λn|=λ>0 (λ≠0, ввиду инъективности оператора А). Тогда для любых ненулевых векторов х=ξ1х1+ξ2х2+…+ξnхn и y=η1x1+η2x2+…+ηnxn γ=
x, y 11 || x1 || 2 22 || x2 || 2 ... nn || xn || 2 . 2 2 2 2 2 2 2 2 || x || || y || 1 || x1 || ... n || xn || 1 || x1 || ... n || xn || Далее, Ах=ξ1λ1х1+ξ2λ2х2+…+ξnλnхn, Ay=η1λ1х1+η2λ2х2+…+ηnλnхn и
200
111 || x1 || 2 2 2 22 || x 2 || 2 ... n 2n n || xn || 2 Àõ, Ày 2 2 2 2 2 2 2 2 2 2 2 2 || Àx || || Ày || 1 1 || x1 || ... n n || xn || 1 1 || x1 || ... n n || xn || 2
=
2 (11 || x1 || 2 2 2 || x 2 || 2 ... n n || xn || 2 ) 12 || x1 || 2 ... n2 || xn || 2 12 || x1 || 2 ... n2 || xn || 2
=
x, y . = || x || || y || Следовательно, оператор А сохраняет углы. Обратно, пусть известно, что оператор А сохраняет углы и требуется доказать, что |λ1|=|λ2|=…=|λn|. 1 Убедимся, например, что |λ1|=|λ2|. Расмотрим ненулевые векторы х= х11 1 1 1 х2 и у= х1+ х , где μ1=||x1||, μ2=||x2||. Векторы х и у ортогональны, 1 2 2 2 || õ1 || 2 || õ2 || 2 так как <x, y>= 2 - 2 =0. Так как оператор А сохраняет углы, то и 1 2 векторы Ах, Ау должны быть ортогональны, т.е. <Аx, Аy>=< 1 x1- 2 x2, 1 2 1 x1+ 2 x2> =0, откуда λ12-λ22=0, или |λ1|=|λ2|. Аналогично доказывается, 1 2 что |λi|=|λ1| при любом i=3,…, n. 82. Доказать, что обратимый линейный оператор А: Rn→Rn тогда и только тогда сохраняет углы, когды векторы-столбцы его матрицы [A] попарно ортогональны, а их длины равны между собой. Указание. Если оператор А сохраняет углы, то векторы Ае1, Ае2,…, Аеn попарно ортогональны, т.е. попарно ортогональны векторы-столбцы матрицы [A]. Убедимся, что длины этих векторов равны между собой. Для Àx, Àå1 x, å1 1 2 n любого вектора х=(х , х ,…, х )≠θ имеем: = (*) || x || || å1 || || Àx || || Àå1 || Полагая Ах=u=(u1, u2,…, un), находим (aij-элементы матрицы [A]): u1=a11x1+a12x2+…+a1nxn, u2=a21x1+a22x2+…+a2nxn, …………………………. un=an1x1+an2x2+…+annxn
С учетом этого, равенство (*) принимает вид
(**)
201
a11u1 a21u 2 ... an1u n
õ1
= или 2 2 ( õ1 ) 2 ... ( õn ) 2 (u1 ) 2 ... (u n ) 2 a11 a21 ... an21 (принимая во внимание попарную ортогональность векторов Ае1, Ае2,…, Аеn): õ1 = ( õ1 ) 2 ... ( õn ) 2
(a11 a21 ... an1 ) x1 2
2 11
a
2
2
a ... an1 (a a ... a )( x ) .... 2 21
2
2 11
2 21
2 n
1 2
,
|| Ae1 || x1
õ1
= , ( õ1 ) 2 ... ( õn ) 2 || Ae1 || 2 ( x1 ) 2 || Àe2 || 2 ( x 2 ) 2 ... || Àen || 2 ( x n ) 2 откуда (считая х1≠0) || Aen || 2 || Ae2 || 2 2 2 1( x ) ... 1( x n ) 2 0 . 2 2 || Ae1 || || Ae1 || Так как это равенство верно при любых х2, х3, …, хn, то действительно ||Ае1||=||Ае2||=…=||Аеn||. Обратно, пусть известно, что векторы-столбцы матрицы a11 a12 ... a1n a21 a22 ... a2 n [A]= .................. попарно ортогональны и длины их равны между an1 an 2 ... ann собой. Убедимся, что для любых ненулевых векторов х=(х1, х2, …, хn) и у=(у1,у2,…, уn) имеет место равенство
x, y Àx, Ày . = || x || || y || || Àx || || Ày || Полагая
Ах=u=(u1,u2,…,un),Ay=v=(v1,v2,…,vn), будем иметь: 1 1 2 2 n n Àx, Ày u v u v ... u v = = || Àx || || Ày || (u1 ) 2 (u 2 ) 2 ... (u n ) 2 (v1 ) 2 (v 2 ) 2 ... (v n ) 2 =
|| Ae1 || 2 ( x1 y 1 ) || Ae 2 || 2 ( x 2 y 2 ) ... || Ae n || 2 ( x n y n ) || Ae1 || 2 ( x1 ) 2 || Ae 2 || 2 ( x 2 ) 2 ... || Ae n || 2 ( x n ) 2 || Ae1 || 2 ( y 1 ) 2 ... || Ae n || 2 ( y n ) 2
= =
|| Ae1 || 2 ( x1 y 1 x 2 y 2 ... x n y n ) || Ae1 || ( x1 ) 2 ( x 2 ) 2 ... ( x n ) 2 || Ae1 || ( y 1 ) 2 ( y 2 ) 2 ... ( y n ) 2
=
202
=
x, y . || x || || y ||
83. Пусть линейный оператор А: R2→R2 имеет матрицу
cos sin , где 0≤φ≤π. Доказать, что оператор А сохраняет cos
[A]= sin
норму (а, следовательно, и углы) и что для любого х≠θ (х, Ах)=φ. Указание. Для любого х=(х1, х2) вектор у=Ах имеет координаты: у1=cosφx1-sinφx2,y2=sinφx1+cosφx2.Поэтому ||Ax||2=(y1)2+(y2)2=(x1)2+(x2)2=||x||2 , откуда ||Ax||=||x||. Далее, cos(х, Ах)=
õ, Àx x1 ó1 õ2 y 2 = = = || x || 2 || x || || Àõ || x1 (cos x1 sin x 2 ) x 2 (sin x1 cos x 2 ) = || x || 2 cos ( x1 ) 2 sin x1 x 2 sin x1 x 2 cos ( x 2 ) 2 cos 1 || x || 2 = = = || x || 2 || x || 2 =cosφ. Так как оба угла (х, Ах) и φ лежат в промежутке 0, π, то (х, Ах)=φ. 84. Доказать, что если линейный оператор А: Rn→Rn обратим, то обратим и всякий линейный оператор В: Rn→Rn , достаточно близкий к А в том смысле, что ||B-A||<
1 . || À1 ||
Доказать также, что для всякого такого оператора В имеет место
|| A1 || неравенство ||B-1-A-1||≤
1 || B À || || A1 ||
|| B A || .
Указание. Из равенства Вх=Ах-(А-В)х выводим, учитывая доказанное в 66): ||Bx||=||Ax-(A-B)x||||Ax||-||(A-B)x||||Ax||-||A-B||∙||x|| при любом
хєRn. Так как ||x||=||A-1(Ax)||≤||A-1||||Ax||, то ||Ax||≥
1 || B A || || x || 1 || À ||
1 ||x||. || À1 ||
Следовательно, ||Bx||
(*)
Это неравенство доказывает инъективность оператора В, а потому (см. 49)-существование оператора В-1. Заменяя в неравенстве (*) вектор х вектором В-1у (при любом уєRn) будем иметь:
203
1 -1
||В у||≤
1 || B À || || A1 ||
|| ó || , откуда ||В-1||≤
1 . 1 || B À || || A1 ||
Далее обосновать справедливость неравенства ||T1, T2||≤||T1||||T2|| для любых линейных операторов Т1: Rn→Rn и Т2: Rn→Rn. Пользуясь доказанным и тождеством В-1-А-1=В-1(А-В)А-1, получить требуемую оценку нормы ||В-1-А-1||. 85. Пусть А: Rn→Rn-линейный оператор. Рассмотрим двойственный линейный оператор А*: (Rn)*→(Rn)* (см. упражнение 65). Этот оператор каждому линейному функционалу φє(Rn)* ставит в соответствие такой линейный функционал fє(Rn)* (f=A*φ), что f(z)=φ(Az) для любого zєRn. Согласно упражнению 59, каждому хєRn можно поставить в соответствие функционал φхє(Rn)* такой, что φх(u)=<x, u> для любого uєRn. Пусть f=А*φх. Согласно тому же упражнению 59, функционалу f сответствует элемент у такой, что f(z)=при любом zєRn. Легко доказать (это предоставляется читателю) единственность такого элемента уєRn. В результате каждому элементу хєRn будет поставлен в соответствие определенный элемент уєRn такой, что =f(z)=φx(Az)=<x, Az>, т.е. = при любом zєRn. Оператор, который каждому элементу хєRn ставит в соответствие (единственный) элемент уєRn, удовлетворяющий равенству = при любом zєRn,-обозначим А'. Оператор А': Rn→Rn удовлетворяет равенству = при любых х,zєRn. Легко проверить, что А'єL(Rn, Rn).
b11 b12 ... b1n b b ... b 21 22 2 n Доказать, что матрица А'= .................. оператора А' связана с bn1 bn 2 ... bnn матрицей оператора А
a11 a12 ... a1n a21 a22 ... a2 n А= .................. соотношениями: bij=aji при любых i,j=1, 2, …, n. a a ... a nn n1 n 2 Указание bij=<ei, A'ej>== aji. Замечание. Как видим, каждая строка матрицы А' совпадает с соответствующим столбцом матрицы А. Матрица А' получается из матрицы А, если матрицу А «повернуть на 180о» вокруг ее так называемой главной диагонали, состоящей из элементов а11, а22, …, аnn. Если подобному преобразованию подвергнуть любую матрицу А, то получающаяся в результате преобразования матрица называется
204
транспонированной матрицей по отношению к матрице
А
и обозначается
А.
Учитывая это определение, в согласии с вышедоказанным можем написать: А'=А'. Заметим еще следующее. Можно было определить оператор А' как линейный оператор, имеющий своей матрицей матрицу А'. После этого непосредственной проверкой нетрудно убедиться в выполнении равенства= для любых х,zєRn. Произвести эту проверку мы предоставляем читателю. Если матрица А оператора А-симметричная, т.е. аij=aji при любых i, j=1, 2, …, n, то А'=А, т.е. А'=А и потому А'=А. в этом случае оператор А называется симметричным и удовлетворяет равенству =<х,Аy> при любых х,уєRn. 86. Доказать, что собственные векторы симметричного линейного оператора А: Rn→Rn, принадлежащие различным собственным значениям, -ортогональны. Указание. Если хєRn, х≠θ и Ах=λ1х, а уєRn, у≠θ и Ау=λ2у, где λ1≠λ2, то по крайней мере, одно из чисел λ1, λ2 отлично от 0. Пусть, например, λ1≠0. Тогда <х,у>=<
1
Ах,у>=
1
<Ах, у>=
1
<х,Aу>=
1 1 1 (1- 2 )<x,y>=0 и <x, y>=0. 1
2 <x, y>, откуда 1
Замечание. Если вектор х≠θ (хєRn) является собственным вектором оператора А: Rn→Rn с матрицей
a11 a12 ... a1n a a ... a 21 22 2 n А= .................. , то при некотором λ Ах=λх, т.е. координаты х 1, an1 an 2 ... ann х2, .., хn векторах удовлетворяют системе уравнений:
a11x1 a12 x 2 ... a1n x n x1 1 2 n 2 a21x a22 x ... a2 n x x ................................................ a x1 a x 2 ... a x n x n n2 nn n1
(*)
И обратно, если системе (*) при некотором λ удовлетворяют числа х , х , .., хn, среди которых не все равны 0, то вектор х=(х 1, х2, .., хn) является собственным вектором оператора А, принадлежащим собственному значению λ. Система (*) равносильна системе 1
2
205
(a11 ) x1 a12 x 2 ... a1n x n 0 1 2 n a21x (a22 ) x ... a2 n x 0 ................................................ a x1 a x 2 ... (a ) x n 0 n2 nn n1
(**)
Эта система при любом λ имеет нулевое решение, т.е. решение х1=0, х2=0, …, хn=0. Таким образом, задача разыскания собственных векторов и собственных значений оператора А: Rn→Rn сводится к задаче отыскания всех тех значений λ, при которых система (**) имеет хотя бы одно ненулевое решение с последующим решением системы (**) для каждого из упомянутых значений λ. 87. Доказать, что линейный оператор А: Rn→Rn обратим тогда и только тогда, когда столбцы матрицы [A], рассматриваемые как векторы пространства Rn,-линейно независимы. Указание. Если оператор А обратим, то векторы Ае1, Ае2, …, Аеn (eiвекторы стандартного базиса в Rn)-линейно независимы (в противном случае оператор А окажется неинъективным). Следовательно, линейно независимы столбцы матрицы [A]. Обратно, если столбцы матрицы [A] линейно независимы, то линейно независимы векторы Ае 1, Ае2, …, Аеn. Следовательно, эти векторы образуют базис пространства Rn и для любого уєRn имеет место представление у=ξ1Ае1+ξ2Ае2+…+ξnАеn=A(ξ1е1+…+ξnеn) при некоторых ξ1, ξ2,…, ξn. Значит, оператор А сюръективен, а потому (см. 49)-обратим. 88. Пусть J: Rn→Rn есть тождественное отображение Rn на Rn, т.е. Jх=х для любого хєRn. Легко видеть, что J-линейный оператор. Пусть также А: Rn→Rn и В: Rn→Rn суть линейные операторы, удовлетворяющие равенству АВ=J. Доказать, что оба оператора А и В-обратимы и что В=А-1, А=В-1. Указание. Допустив, что В неинъективен, найти вектор х≠θ такой, что Вх=θ. Тогда, с одной стороны, (АВ)х=А(Вх)=Аθ=θ, а с другой(АВ)х=Jx=x≠θ. Полученное противоречие доказывает, что оператор В инъективен, а потому-обратим. Используя легко проверяемое свойство ассоциативности умножения операторов, находим: (АВ)В-1=JВ-1, т.е. (АВ)∙В-1=В-1. Следовательно, В-1=А∙(В∙В-1)=АJ=А и В=(В-1)-1=А. 89. Матрица линейного оператора J: Rn→Rn (Jx=x для любого хєRn) 1 0..... 0 0 1......0 имеет вид: [J]= ............. . Эту матрицу будем обозначать Е и называть 0 0......1 единичной матрицей порядка n. Пусть А-такая квадратная матрица порядка n, для которой существует матрица В порядка n с тем свойством,
206
что А∙В= Е. Матрицу В будем называть правой обратной по отношению к матрице А, а матрицу А –левой обратной по отношению к матрице В. Доказать, что матрица В является также левой обратной для А, т.е. ВА = Е и что В =[A-1], где А-оператор из Rn в Rn, для которого [A]=А. Указание. Пусть В–линейный оператор из Rn в Rn, для которого [В]=В. Тогда Е=АВ=[A]В=АВ (см. 79), т.е. АВ=J. Согласно 88, операторы А и В обратимы и В=А-1, так что В=В=А-1. Далее, ВА= =А-1А=J, откуда ВА= J, ВА=Е и ВА = Е. Замечание. Матрицу А порядка n, для которой существует nxnматрица В, являющаяся для А и правой и левой обратной, -будем называть обратимой матрицей, а матрицу В=[A-1], будем называть -1 -1 матрицей, обратной к А, и обозначать А . Таким образом А =[A-1= =[A-1] (А-матрица оператора А). Если матрица А обратима и А=[A, то, согласно доказанному, оператор А обратим. И обратно, если оператор А: Rn→Rn обратим, то обратима и матрица [A оператора А. В самом деле, из АА-1=J следует, что АА-1=Е, т.е. АА-1=Е. Учитывая 87, можем утверждать, что матрица А порядка n обратима тогда и только тогда, когда ее столбцы (рассматриваемые как векторы пространства Rn) линейно независимы. 90. Пусть квадратная матрица А порядка n
a11 a12 ... a1n a21 a22 ... a2 n А= .................. обладает следующими свойствами: a a ... a nn n1 n 2 1) 2)
столбцы матрицы А, расматриваемые как векторы пространства Rn, попарно ортогональны; длины векторов-столбцов матрицы все равны 1, т.е. 2 2 a11 a 21 ... a n21 1, 2 2 a12 a 22 ... a n22 1,
................................. 2 a12n a 22n ... a nn 1.
Квадратная матрица А, обладающая этими двумя свойствами, называется ортогональной матрицей. Пусть А: Rn→Rn есть линейный оператор, матрицей которого является ортогональная матрица А и пусть
207
е1, е2,…, еn-стандартный базис в Rn. Тогда векторы Ае1, Ае2, …, Аеn попарно ортогональны и каждый из них имеет длину 1. Для любого вектора х=(х1, х2, .., хn) из Rn имеем: ||Ax||2==<x1Аe1+ x2Аe2+…+ xnАen, x1Аe1+ x2Аe2+…+ xnАen>=(x1)2+(x2)2+…+(xn)2=||x||2. Следовательно, ||Ax||=||x||, т.е. оператор А сохраняет норму. Обратное очевидно: если линейный оператор А: Rn→Rn сохраняет норму, то его матрица [A] является ортогональной матрицей (см. 81). Линейный оператор А: Rn→Rn, сохраняющий норму, будем также называть ортогональным оператором. Доказать, что если nxn-матрица А ортогональна, то она обратима и
А-1=А,
т.е. обратная к А матрица совпадает с транспонированной. Доказать также, что строки ортогональной матрицы, рассматриваемые как векторы пространства Rn, попарно ортогональны и длины этих векторов вес равны 1. Указание. Умножая матрицу А на матрицу А по правилу, установленному в 79, получим:
a11 a21... an1 a a ... a n2 12 22 АА= .................. a1n a2 n ... ann
a11 a12 ... a1n 1 0..... 0 a a ... a 2n 21 22 0 1......0 .................. = ............. = an1 an 2 ... ann 0 0......1
Е.
Отсюда следует (см. 89), что и А
А= Е, т.е. А является обратной равенством АА= Е и правилом
матрицей для А:А=А . Пользуясь умножения матриц, установленным в 79, приходим к выводу, что векторыстроки матрицы А составляют ортонормированный базис пространства Rn. Замечание. Из доказанного следует, что для ортогональной матрицы А транспонированная матрица Атакже ортогональна. 91. Пусть А –квадратная матрица порядка n, состоящая из вещественных (действительных) чисел: -1
a11 a12 ... a1n a21 a22 ... a2 n А= .................. an1 an 2 ... ann 1 2.........n Рассмотрим всевозможные подстановки φ= j j ..... j цифр 1, 2, n 1 2 …n. Каждой такой подстановке поставим в соответствие число (-1)s(φ) a1 j1
a2 j2 ... anjn (j1=φ(1),
j2=φ(2),…, jn=φ(n)), где s(φ)=0 , если
208
подстановка φ-четная и s(φ)=1, если подстановка φ-нечетная. Можно также определить s(φ) как число транспозиций, на которые разлагается подстановка φ (см. упражнение 2(f) к главе 1) или как число инверсий в перестановке (j1, j2,…, jn). Определителем или детерминантом марицы А называется число
(1)
s ( )
a1 j1 a2 j 2 ... anjn , где сумма распространена на все n!
n
подстановок цифр 1, 2, …n. Это число обозначается символом det
А или
a11a12 ...a1n a21a22 ...a2 n символом
............... . Таким образом, detА есть сумма n! членов, an1an 2 ...ann
каждый из которых представляет собой произведение (взятое с тем или иным знаком) n элементов матрицы, взятых по одному из каждой ее строки и каждого ее столбца. Например, при n=2 все подстановки цифр 1, 2 таковы: 1 2 1 2 φ1= , φ2= . При этом, s(φ1)=0, s(φ2)=1. Поэтому 1 2 2 1
à11 à12 à 21 à22
=а11а22-а12а21. При n=3 все подстановки цифр 1, 2, 3 таковы:
1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 φ1= , φ2= 1 3 2 , φ3= 2 1 3 , φ4= 2 3 1 , φ5= 3 1 2 , 1 2 3 1 2 3 . При этом s(φ1)=0, s(φ2)=1, s(φ3)=1, s(φ4)=0, s(φ5)=0, s(φ6)=1. φ6= 3 2 1
à11 à12 à13 à21 à22 à23 = а11а22а33-а11а23а32-а12а21а33+а12а23а31+а13а21а32à31 à32 à33 а13а22а31=а11а22а33+а12а23а31+а21а32а13-а13а22а31-а23а32а11-а12а21а33. Последнее выражение нетрудно запомнить (так называемое правило Сарруса). Доказать, что опеределитель nxn-матрицы А и определитель Поэтому
транспонированной матрицы А совпадают. Указание. Так как
209
b11 b12 ... b1n b21 b22 ... b2 n А= .................. , где bij=aji при любых i, j=1,2,…,n, то bn1 bn 2 ... bnn
(1) detА=
s ( )
b1 j1 b2 j 2 ... bnjn , где сумма распространена на все
1 2.........n подстановки φ= j j ..... j єζn. Рассмотрим любой член n 1 2
(1) s ( ) b1 j1 b2 j 2 ... bnjn суммы, определяющей detА. Имеем: (1) s ( ) b1 j1 b2 j 2 ... bnjn = (1) s ( ) à j11 à j2 2 ... à jnn == 1 2.........n j1 j2 ......... jn -1 = 1 2............n =φ . Так как ê ê ..... ê n 1 2
(1) s ( ) à1ê1 à2ê2 ... ànên , где
подстановки φ и φ-1 либо обе четные, либо обе нечетные (см. упражнение 2(f) к главе 1), то s(φ)=s(φ-1)
и
1
(1) s ( ) b1 j1 b2 j 2 ... bnjn = (1) s ( ) à1ê1 à2 ê2 ... ànên . Итак, каждый член суммы, определяющей detА, совпадает с некоторым членом суммы, определяющей detА ; при этом разным членам первой суммы отвечают различные же члены второй суммы (ибо из φ=ψ, φєζn, ψєζn следует, что φ-1≠ψ-1). Так как обе суммы содержат n! членов, то detА =det А . 92. Доказать, что если поменять местами две строки матрицы, то определитель матрицы изменит лишь знак. Указание. Пусть А -следующая nxn-матрица:
a11 a12 ... a1n .................. ai1 ai 2 ... ain .......... ........ А= a a ... a , kn k1 k 2 .......... ........ a a ..... a n 1 n 2 nn а (i<к):
В–матрица, получающаяся из А переменой мест i-ой и к-ой строк
210
b11 b12 ... .......b1n .......... .......... ... bi 1,1 bi 1, 2 ... bi n ,n b b .......... b i1 i 2 in ...................... В= bk 1,1 bk 1, 2 ....bk 1,n bk 1 bk 2 ........ bkn ...................... bn1 bn 2 .........bnn Элементы матрицы В связаны с элементами матрицы А равенствами: bi1=ak1, bi2=ak2,…, bin=akn, bk1=ai1,…, bkn=ain, bpj=apj при р≠i, к. Имея целью доказать равенство det В=- det А, напишем выражение для
(1) det В: det В=
s ( )
b1 j1 ...bi 1, ji1 biji ...bk 1 j k 1 bkj k ...bnjn , где
1 2.........i 1 i....k 1 k....n и сумма распространена на φ= j j ..... j j .... j j ..... j i 1 i k 1 k n 1 2 всевозможные подстановки φєζn. Рассмотрим любой член суммы, s ( ) В: (1) b1 j1 ...bi 1, ji1 biji ...bk 1 jk 1 bkj k ...bnjn = s ( ) a1 j1 ...ai 1, ji1 akji ...ak 1 jk 1 aijk ...anjn = = (1)
определяющей det
= (1)
s ( )
= (1)
s ( ) s ( )
a1 j1 ...ai 1, ji1 aijk ...ak 1 jk 1 akji ...anjn = (1) s ( ) a1 (1) a2 ( 2 ) ....an ( n ) , где
1 2.........i 1 i....k 1 k ....n =[ji jk]◦φ. Если φ-четная подстановка, то ψ= j j j j .... j j ..... j i 1 k k 1 i n 1 2 ψ-нечетная и наоборот, так что s(φ)+s(ψ)=1 и мы видим, что каждый член суммы, определяющей det В, равен вязтому со знаком «- » члену суммы, определяющей det А. Так как обе суммы содержат n! различных членов, то det В=- det А. Замечание. С учетом доказанного в упражнении 91, можем утверждать, что если поменять местами два столбца матрицы, то определитель матрицы изменит лишь знак. В самом деле, пусть матрица В получается из матрицы А переменой мест двух столбцов. Тогда det
В=det В'=- detА=-det А .
211
Далее, из доказанного следует, что определитель, имеющий две одинаковых строки или два одинаковых столбца,-равен 0. 93. Будем рассматривать строки определителя порядка n (т.е. определителя матрицы порядка n) как n-мерные векторы (пространства Rn): a1 (a11 , a12 ,..., a1n )
a 2 (a 21 , a 22 ,..., a 2 n ) ............................... a n (a n1 , a n 2 ,..., a nn ) Определим функцию от n векторов a1, a2, …, an в указанном их порядке, полагая:
a11 a12 ... a1n a21 a22 ... a2 n Δ (a1, a2, …, an)= .................. an1 an 2 ... ann Доказать, что функция Δ является линейной функцией каждого своего аргумента при фиксированных значениях остальных. Это означает, что при любом i, 1≤i≤n Δ (a1, a2, …, ai'+ ai'', ai+1, …, an)=Δ (a1, a2, …, ai-1, ai', ai+1, …, an)+ +Δ (a1, a2, …, ai-1, ai'', ai+1, …, an) и Δ (a1, a2, …, ai-1, λai, ai+1, …, an)= =λΔ (a1, a2, …, ai-1, ai, ai+1, …, an), где λ-любое действительное число. Другими словами, доказать, что определитель является линейной функцией каждой своей строки при фиксированных остальных строках. Учитывая доказанное в упражнении 91, убедиться, что определитель также является линейной функцией каждого своего столбца при фиксированных остальных столбцах:
à11 à12 ...a1n à11 à21 à22 ...a2 n à21
à12 ... à1n à11 à 22 ... à2 n à21
à12 ...a1n à11 à22 ...a2 n à21
à11 à12 ... à1n à21 à22 ... à2 n
= ......................... = ................. + ................. и ................. àn1 àn1 àn 2 ...ann àn1 àn 2 ... à nn àn1 àn 2 ...ann àn1 àn 2 ... ànn
à11 à12 ... à1n à21 à22 ... à2 n =λ .................
àn1 àn 2 ... ànn Здесь мы проиллюстрировали, что означает утверждение, что определитель является линейной функцией своего первого столбца при
212
фиксированных остальных столбцах. Аналогичные равенства имеют место для любого другого столбца (строки) определителя. 94. Доказать (используя результаты упражнений 93 и 92), что значение определителя не изменится, если к элементам какой-либо строки (какого-нибудь столбца) прибавить соответствующие элементы другой строки (другого столбца), умноженные на одно и то же число. Вывести из этого следующий результат: если строки (столбцы) определителя, рассматриваемые как векторы пространства Rn, -линейно зависимы, то определитель равен нулю. Указание. Из определения детерминанта следует, что если все элементы какой-либо строки (столбца) определителя равны нулю, то определитель равен нулю. 95. Рассмотрим произвольную n-членную последовательность х1, х2, …, хn векторов пространства Rn: х1=(х11, х21, …, хn1), х2=(х12, х22, …, хn2),…, хn=(х1n, х2n, …, хnn). Определим функцию det: RnxRnx…xRn→R, полагая: õ11 õ12 ...õ1n
õ21 õ22 ... õ2 n det (х1, х2, …, хn)= .................
(*).
õn1 õn 2 ... õnn Любой j-столбец определителя, стоящего в правой части равенства (*) (j=1, 2, …n) состоит из координат вектора xj. Исходя из доказанного в 92 и 93, можем утверждать следующее: 1) если поменять местами какие-либо два вектора в последовательности х1, х2, …, хn, то det (х1, х2, …, хn) поменяет знак (при неизменной абсолютной величине); 2) если какие-либо два вектора в конечной последовательности х1, х2, …, хn равны между собой, то det (х1, х2, …, хn)=0; 3) det есть линейная функция любой переменной xj при фиксированных значениях остальных переменных. 1 0...........0 0 1...........0 Кроме того, легко видеть, что det (е1, е2, …, еn)= .................... =1 0 0...........1 (еi-векторы стандартного базиса) Пусть теперь А и В -любые две квадратные матрицы порядка n:
213
a11 a12 ... a1n a21 a22 ... a2 n А= .................. , an1 an 2 ... ann
b11 b12 ... b1n b21 b22 ... b2 n В= .................. . Обозначим через А и В bn1 bn 2 ... bnn
соответственно линейные операторы из Rn в Rn, для которых [A]=А, [B]= В. Тогда ясно, что det (Ae1, Ae2,…, Aen)=det[A]=det А и det(Be1, Be2,…, Ben)=det[B]=det В. Пусть, далее, b1, b2, …, bn суть векторыстолбцы матрицы В=[B]. Тогда, с одной стороны, det (Ab1, Ab2,…, Abn)=det(ABe1, ABe2,…, ABen)=det[AB]=det([A][B])=det(АВ) (мы воспользовались определением произведения двух матриц, приведенным в 79). С другой стороны, det (Ab1, Ab2,…, Abn) можно преобразовать, учитывая равенства Аbj=A(b1je1+ b2je2+…+ bnjen)= b1jAe1+ b2jAe2+…+ bnjAen, j=1, 2, …, n. (**) Опираясь на свойство 3 функции det, имеем: det (Ab1, Ab2,…, Abn)= =det(b11Ae1+b21Ae2+…+bn1Aen, Ab2,…, Abn)= n
n
bi1 det( Aei , Ab2 ,..., Abn ) = bi1b j 2 det( Aei , Ae j , Ab3 ,..., Abn ) . i , j 1
i 1
Штрих у знака суммы означает, что при суммировании можно опустить слагаемые, у которых индексы i и j равны между собой (ибо эти слагаемые равны 0). Заменяя последовательно Ab3,…, Abn их выражениями согласно равенствам (**) и учитывая свойство 3) функции det, получим: det(Ab1, Ab2,…, Abn)=
b
i1
b j 2 bk 3 ...btn det( Aei , Ab j , Aek ,..., Abt ) ,
i , j ,k ,...,t
где суммирование распространяется на всевозможные такие наборы n целых чисел (i, j, k, …, t), в которых каждый из индексов i, j, k, …, t принадлежит Nn и все индексы попарно различны. Другими словами, суммирование распространяется на всевозможные перестановки цифр 1, 2, …, n. Доказать, что det(AВ1, Ab2,…, Abn)=detАdetВ и тем самым установить равенство det(АВ)= detАdetВ Указание. Число s инверсий в перестановке (i, j, k, …, t) можно подсчитать следующим образом: s=s1+s2+…+sn, где s1-количество индексов, стоящих в перестановке (i, j, k, …, t) перед единицей; s2количество индексов, стоящих перед двойкой, не считая при этом единицу (если единица стоит перед двойкой); s3-количество индексов, стоящих перед тройкой, не считая при этом единицу и двойку и т.д.
214
Все числа s1, s2,…, sn суть целые неотрицательные числа, некоторые из которых или даже все могут равняться 0 (в частности, всегда sn=0). Учитывая сказанное, преобразуем величину det (Aеi, Abj, Aek,…, Aet) так, чтобы вектор Ае1 оказался на первом месте, а порядок следования остальных векторов не изменился. С этой целью вектор Ае1 поменяем местами с предшествующим вектором, затем повторим эту операцию достаточное количество раз до тех пор, пока вектор Ае1 не окажется на первом месте. При этом придется сделать ровно s1 перемещений двух векторов. Затем аналогичным образом переместим вектор Ае2 на второе место, сделав при этом ровно s2 перемещений двух векторов. Продолжается так и далее, не более, чем через n-1 шагов будем иметь: det (Aеi, Abj, Aek,…, Aet)= (1) =(-1)sdet[A]= (-1)sdet
(1) b
det (Aе1, Aе2,…, Aеn)=
А Следовательно, det (Ab1, Ab2,…, Abn)= det Ах
s
х
s1 s2 ... sn 1
i1
b j 2 bk 3 ...btn . Напомним, что здесь s-число инверсий
( i , j ,k ,...,t )
в перестановке (i, j, k, …, t). Если s-четное число, то и подстановка i j k ....t -четная, а при нечетном s подстановка φ-нечетная φ= 1 2 3.....n (упражнение 2(f) к главе 1). Поэтому (-1)s=(-1)s(φ) и мы получаем: det(Ab1,
Ab2,…,
Abn)=
detА∙ (1)
s ( )
bi1 b j 2 ...btn ,
где
суммирование распространено на всевозможные подстановки i j k ....t . Расуждая как в упражнении 91, заключаем, что φ= 1 2 3 ..... n
(1)
s ( )
bi1 b j 2bk 3 ...btn =det В'=det В. Следовательно, det (Ab1, Ab2,…,
Abn)=det Аdet В , ч.т.д. Замечание. Из доказанного в 95 и 94 следует, что определитель матрицы равен 0 тогда и только тогда, когда ее столбцы (строки) линейно зависимы. В самом деле, пусть det А=0 и требуется доказать, что столбцы матрицы А линейно зависимы. Допустив противное, на основании доказанного в 87 можем утверждать, что оператор А, для которого [A]=А, обратим: А-1А=J. Отсюда [A-1][A]=Е и det [A-1]det А=1, т.е. det А ≠0. Полученное противоречие доказывает неверность нашего допущения. Справедливы также следующие утверждения: 1) определитель квадратной матрицы отличен от нуля тогда и только тогда, когда ее столбцы (строки) линейно независимы;
215
квадратная матрица обратима тогда и только тогда, когда ее определитель отличен от нуля. Заметим еще, что из доказанного в 80 и 94 вытекает следующее утверждение: если nxn-матрица С является произведением nxк-матрицы А на кхn-матрицу В при к
à21 à22 ... à2 n Δ= ................. , то он обладает главными минорами 1-го, 2-го, …, (n-1)-го
àn1 àn 2 ... ànn порядков. Главные миноры 1-го порядка определителя Δ-это так называемые главные элементы (элементы главной диагонали), т.е. элементы a11, a22 ,..., ann . Эти миноры получаются вычеркиванием n-1 строк определителя Δ и стольких же столбцов, номера которых совпадают с номерами вычеркнутых строк. Количество этих миноров равно n=Cnn-1=Cn1. Главные миноры 2-го порядка определителя Δ (их количество равно Cnnà11 à1n à22 à23 à11 à12 à11 à13 n(n 1) 2 2 =Cn = ) суть следующие: , ,…., , , …, à21 à22 à31 à33 àn1 ànn à32 à33 2
àn1,n1 àn1,n àn,n1 ànn
. Они получаются вычеркиванием n-2 строк определителя Δ и
стольких же столбцов, номера которых совпадают с номерами вычеркнутых строк. Главных миноров 3-го порядка будет Cnn-3=Cn3. Читатель при желании может выписать любой из этих главных миноров, выбрав в качестве его главной диагонали любые три главные элемента определителя Δ. Вообще, главных миноров любого к-го порядка (1≤к≤n-1) будет Cnn-к=Cnк. В частности, главных миноров (n-1)-го порядка будет Cn1=n. Они получаются вычеркиванием одной строки определителя Δ и одного столбца, номер которого совпадает с номером вычеркнутой строки. Вообще, если в данном определителе вычеркнуть i-ю строку и j-ый столбец (на пересечении которых стоит элемент a ij ), то полученный минор n-1-го порядка будем обозначать Мij и называть дополнением элемента a ij . В соответствии со
216
сказанным, главные миноры n-1-го порядка будем обозначать М11, М22,…, Мnn. Например М11 (дополнение элемента а11) представляет собой минор
à22 à23... à2 n à32 à33... à3n ................. . Расмотрим функцию Δn: R→R, полагая для любого àn 2 àn 3 ... ànn хєR
à11 õ à12 ... à1n à21 à22 õ... à2 n Δn(х)= .................
. Очевидно, что Δn представляет собой
àn1 àn 2 ... ànn õ многочлен n-ой степени. Старший член этого многочлена есть х n, а à11 à12 ... à1n
à21 à22 ... à2 n свободный член D равен: D=Δn(0)= ................. . Коэффициенты при xn-1,
àn1 àn 2 ... ànn xn-2, …, x обозначим соответственно через S1, S2,…, Sn-1, так что Δn(х)=xn+ S1xn-1+ S2xn-2+ …+ Sn-1x+D (*) Доказать, что при любом кєN, удовлетворяющем неравенствам 1≤к≤n-1 (n≥2), Sк представляет собой сумму главных миноров к-го порядка в определителе Δn(0). Указание. Рассмотрим функцию Δ от n переменных x1, x2, …, xn, полагая: à11 õ1 à12 ... à1n à21 à22 õ2 ... à2 n Δ (x1, x2, …, xn)= .................
àn1 àn 2 ... ànn õn Определитель Δn(х) получается из определителя Δ(x1, x2, …, xn) при x1=x2= …=xn=х. Выясним, чему равен коэффициент b1 члена b1x1 в разложении определителя Δ(x1, x2, …, xn). Запишем указанный определитель в виде: à11 õ1 à12 ... à1n à21 0 à22 õ2 ... à2 n Δ (x1, x2, …, xn)= .................
àn1 0 àn 2 ... ànn õn Применяя результат упражнения 93, будем иметь:
.
217
à11 à12 .......... à1n
õ1
à12 ... .......à1n
à21 à22 õ2 ... à2 n
0
à22 õ2 ... à2 n
Δ (x1, x2, …, xn)= .................
+ .........................
.
(1)
àn1 àn 2 ... ànn õn 0 àn 2 ... ànn õn Первый определитель в правой части (1) не содержит члена с х1, а второй определитель содержит член b1x1 с коэффициентом
à22 à23... à2 n à32 à33... à3n b1= .................
(2)
àn 2 àn 3 ... ànn Как видим, b1 представляет собой главный минор (n-1)-го порядка определителя Δn(0), получающийся вычеркиванием в указанном определителе первой строки и первого столбца. Аналогично доказывается, что любой член bixi (2≤i≤n) входит в разложение определителя Δ (x1, …, xn) с коэффициентом bi, представляющeм собой главный минор (n-1)-го порядка определителя Δn(0), который получается вычеркиванием в указанном определителе i-ой строки и i-ого столбца. Итак, в разложение определителя Δ (x1, x2, …, xn) входит сумма членов первого порядка b1x1+b2x2+…+bnxn, где b1, b2, …, bn суть главные миноры (n-1)-го порядка определителя Δn(0). Положив x1=x2= …=xn=х, заключаем, что коэффициент Sn-1 в равенстве (*) представляет собой сумму b1+b2+ …+bn, т.е. сумму главных миноров (n-1)-го порядка в определителе Δn(0). Выясним теперь, чему равен коэффициент b12 члена b12х1х2 в разложении определителя Δ. Из (1) следует, что b12 есть коэффициент при х2 в разложении определителя
à22 õ2 à23... à2 n
à33 à34 ... à3n
à32 à33 õ3 ... à3n
à43 à44 ... à4 n
и представляет собой .......................... , т.е. b12= ................. àn 3 àn 4 ... ànn àn 2 àn 3 ... ànn õn главный минор (n-2)-го порядка определителя Δn(0), который получается вычеркиванием в указанном определителе первой и второй строки и первого и второго столбца. Аналогично доказывается, что при любых i, j (1≤i≤n, 2≤j≤n, i<j) коэффициент bij члена bijxixj в разложении определителя Δ (x1, x2, …, xn) представляет собой главный минор (n-2)-го порядка определителя Δn(0), который получается вычеркиванием в указанном определителе i-oй и j-ой строк, а также i-го и j-го столбцов. Итак, в
218
разложение определителя Δ (x1, x2, …, xn) входит сумма членов второго порядка n
b
i , j 1 i j
ij
xi x j
,
где bij суть главные миноры (n-2)-го порядка определителя Δn(0). Положив x1=x2= …=xn=х, заключаем, что коэффициент Sn-2 в равенстве (*) представляет собой сумму главных миноров (n-2)-го порядка в определителе Δn(0). Продолжая вышеуказанные рассуждения, убедимся, что при любом к (1≤к≤n-1) Sк представляет собой сумму главных миноров к-го порядка в определителе Δn(0). 97. Пусть a ij элемент определителя Δ порядка n, стоящий на пересечении i-ой строки и j-го столбца. Алгебраическим дополнением элемента a ij называется величина Аij=(-1)i+jMij (см. 96). Для упрощения записей рассмотрим любой элемент a1k (1≤к≤n) первой строки определителя. Доказать, что произведение a1k А1к представимо в виде суммы (n-1)! различных членов данного определителя, содержащих элемент a1k . Указание. a1k А1к= a1k (-1)1+кM1к, где
b11 b12 ........b1,k 1 b1k .......b1,n1
a21 a22 ....a2,k 1 a2,k 1 ...a2 n
b21 b22 ........b2,k 1 b2 k .......b2,n1
a31 a32 ....a3,k 1 a3,k 1 ...a3n
M1к= ............................................
bn1,1 bn1, 2 ....bn1,k 1 bn1,k ...bn1,n1
= .................................
.
an1 an 2 ....an ,k 1 an ,k 1 ...ann
При этом мы считаем, что 1
q (1)1k a1k (1) s b1 j1 b2 j2 ...bn1, jn1
,
219
где под
s можно понимать число инверсий в верхней строке .... 1 2........n 1 .... . Рассматриваемую = подстановки j j .... j 1 2 k 1 k .... n 1 n 1 1 2 величину q можно представить в следующем виде: q=(-1)1+k+s a1k bα1bβ2…bμ,к-1bνk…bω,n-1= =
(1)1k s a 1,1 a 1, 2 ...a 1,k 1a1k av1,k 1 ... a 1,n
1 2........n = где i1=k и i1 i2 ....in 1 1.... 1 1 1.... 1 . = 1 2 ....... k 1 k k 1 ...... n Заметим, что числа α+1, β+1, …, μ+1, ν+1,…, ω+1 представляют собой перестановку чисел 2, 3,…, n. Член определителя Δ,
(1)1k s a1i1 a2i2 ... anin ,
1 2........n (1) a1i1 a2i2 ... anin , , соответствующий подстановке i i ....i , равен 1 2 n где под δ можно понимать число инверсий в перестановке (α+1 β+1 …μ+1 1 ν+1…ω+1), т.е. δ=s+k-1. Поэтому (-1)1+k+s==(-1)δ и q представляет собой член определителя Δ. 98. Доказать, что всякий определитель равен сумме произведений элементов какой-либо строки (столбца) на их алгебраические дополнения. Указание. Сперва доказать это утверждение (опираясь на 97) для первой строки определителя. Чтобы доказать равенство Δ= ai1 Ai1+ ai 2 Ai2+…+ + ain Ain при 1
a11 a12 ..........a1n
a 21 a 22 .........a 2 n
a 21 a 22 .........a 2 n
....................... ai 1,1 ai 1, 2 ....ai 1,n
....................... Δ1= ai 1,1 ai 1, 2 ....ai 1,n =(-1)i-1 ai1 ai , 2 .........ai ,n =(-1)i-1Δ. Заметим, что ai 1,1 ai 1, 2 ...ai 1,n ai 1,1 ai 1, 2 ....ai 1,n ....................... ....................... a n1 a n 2 ....a nn a n1 a n 2 ....a nn миноры Mi1, Mi2,…, Min в определителе Δ совпадают сответственно с
220
минорами M(1)11, M(1)12,…, M(1)1n в определителе Δ1. Пользуясь уже доказанным, имеем: Δ1=b11M(1)11(-1)1+1+ b12M(1)12(-1)1+2+…+ b1nM(1)1n(-1)1+n, где b11= ai1 , b12= ai 2 ,…, b1n= ain . Следовательно, Δ=(-1)i-1Δ1= ai1 (-1)i+1Mi1+
ai 2 (-1)i+2Mi2+…+ ain (-1)i+nMin, т.е. Δ= ai1 Ai1+ ai 2 Ai2+…+ ain Ain 99. Доказать, что сумма произведений элементов какой-либо строки (столбца) на алгебраические дополнения сответствующих элементов другой строки (столбца) определителя равна 0. Указание. Чтобы доказать равенство ai1 Aк1+ ai 2 Aк2+…+ ain Aкn=0 (i≠k), заметим, что сумма ai1 Aк1+ ai 2 Aк2+…+ ain Aкn не зависит от того, какие именно элементы стоят в к-ой строке определителя. Если положить aê1 = ai1 , aê 2 = ai 2 ,…., aên = ain , то получим определитель с двумя равными строками, который равен 0 (см. 92): Δ=0. С другой стороны, Δ= aê1 Aк1+ aê 2 Aк2+…+ aên Aкn= ai1 Aк1+ ai 2 Aк2+…+ ain Aкn. Замечание. Доказанное позволяет выразить элементы обратной
a11 a12 ... a1n a21 a22 ... a2 n матрицы для любой матрицы А= .................. , определитель которой a a ... a nn n1 n 2 отличен от 0: d=det
А≠0. В самом деле, рассмотрим матрицу
A11 A21 An1 d d ... d A12 A22 ... An 2 d d d В= ...................... , в которой под Aij (i, j=1, 2,…, n) понимается A1n A2 n Ann ... d d d алгебраическое дополнение элемента ai , j в определителе матрицы А. Находя произведение АВ по правилу, установленному в 79, получим (на основании доказанного в 98 и 99): АВ=Е. Следовательно матрица В является правой обратной, а потому-и левой обратной (см. 89) для -1 матрицы А, т.е. В=А . 100. Пусть Δ и Д–два определителя:
221
à11 à12 ... a1 j ...à1n u1
à11 à12 ... a1 j ...à1n
à21 à22 ... a2 j ...à2 n u 2
à21 à22 ... a2 j ...à2 n
............................... ai1 ai 2 .....aij .....ain ui
........................ Δ= ai1 ai 2 .....aij .....ain , Д= . ............................... ....................... àn1 àn 2 ... anj ....ànn u n àn1 àn 2 ... anj ....ànn v1 v2 ......v j ......vn w
Д
Определитель окаймленным.
по отношению к определителю Δ будем называть n
Доказать,
Д=wΔ- u i v j Aij
что
i , j 1
,
где
Аij-алгебраическое
дополнение элемента ai , j в определителе Δ. Указание. Разлагая определитель столбца, будем иметь: n
Д=wΔ+ u (1) i 1
i n1
i
~ M i ,n1 ,
Д
по элементам последнего
где
~ M i ,n1 -минор
ui= ai ,n1 в определителе Д. Разлагая, далее, каждый минор элементам последней строки, получим:
элемента
~ M i ,n1 по
n
n j ~ M i ,n1 = v j (1) M ij , где j 1
Mij-минор элемента ai , j в определителе Δ. При этом мы учли, что строка v1, v2, …, vj, …, vn является n-ой строкой в определителе n
Следовательно, Д=wΔ+ u (1) i 1
n
=wΔ-
u v
i , j 1
i
j
(1)
i j
i n1
i
n
v j (1) n j M ij = j 1
n
M ij =wΔ- ui v j Aij . i , j 1
101. Доказать, что определитель ортогональной матрицы либо +1, либо -1.
А
равен
АА=Е (см. 90), то det (АА)=1, откуда (см. detА=detА (см. 91). Следовательно, (detА)2=1 и
Указание. Так как 95) detА detА=1. Но detА=1.
~ M i ,n1 .
222
Замечание. Если матрица элемент ai , j матрицы
А
ортогональна и detА=1, то каждый
А равен алгебраическому дополнению Аij: ai , j =Аij
В самом деле, 99, имеем:
А -1=А (см. 90). Поэтому, в согласии с замечанием к упр.
A11 A21 An1 d d ... d a11 a21... an1 a a ... a A A A n2 12 22 ... n 2 12 22 d d .................. d = , где ...................... ................... A1n A2 n Ann a a ... a nn ... 1n 2 n d d d d=detА=1. Следовательно, при любых i, j ai , j =Аij (i,j=1, 2, …, n). Ясно, что если матрица А ортогональна и detА=-1, то при любых i, j имеет место равенство: ai , j =-Аij 102. Пусть дана система n линейных уравнений с n неизвестными: a11x1 a12 x2 ... a1n xn b1 a x a x ... a x b 21 1 22 2 2n n 2 (*) ............................................. an1 x1 an 2 x2 ..... ann xn bn
a11 a12 ... a1n a a ... a 2n 21 22 Матрицей системы (*) назовем матрицу А= .................. , an1 an 2 ... ann
x1 x 2 nx1-матрицу х= назовем столбцом неизвестных, а nx1-матрицу xn b1 b 2 b= назовем столбцом свободных членов системы (*). С учетом этих bn
223
обозначений систему (*) можно записать в виде одного матричного уравнения: Ах=b (**) Определитель d=det А будем называть определителем системы (*). Доказать, что если d≠0, то система (*) имеет и, притом, единственное решение x1=
dj dn d1 d2 , x2= ,…., xj= ,…, xn= , где при любом j (j=1, 2,…, d d d d
n) dj- есть определитель, получаемый из определителя d заменой его j-го столбца столбцом свободных членов системы (*) (правило Крамера). Указание. Так как d=detА≠0, то матрица А имеет обратную матрицу А -1 (см. 99):
А
A11 A21 An1 d d ... d A A A 12 22 ... n 2 d d d -1 = ...................... A1n A2 n Ann ... d d d
Если уравнение (**) имеет решение х, то
А
-1
(Ах)=
А
-1
b, откуда
(А А)х=А b и х=А b,. Этим доказана единственность решения системы (*). Далее, если в левую часть уравнения (**) вместо х подставить -1 матрицу А b,, то получим: -1
-1
-1
А( А -1b)=( А -1А)b=Еb=b Этим доказано существование решения уравнения (**) и, следовательно, существование решения системы (*). Заметим, что и при доказательстве существования и при доказательстве единственности решения уравнения (**) мы пользовались ассоциативностью умножения матриц, каковая является следствием ассоциативности умножения -1 операторов. Наконец, из равенства х=А b следует, что при любом j=1, 2,…, n
x j=
A1 j b1 A2 j b2 ... Anjbn
à11 à12 ... a1, j 1
d b1 a1, j 1 ...à1n
à21 à22 ... a2, j 1
b2 a2, j 1 ...à2 n
=
dj d
, где
dj= ...........................................
àn1 àn 2 ... an, j 1
bn an, j 1 ....ànn
Замечание. Если определитель d системы (*) равен 0 и при этом хотя бы один из определителей d1, d2,…, dn отличен от нуля, то система (*) несовместна. В самом деле, пусть, например, d1≠0. Чтобы доказать
224
несовместность системы (*), допустим противное. Умножая каждое i-ое уравнение системы (i=1, 2,…, n) на Ai1 и складывая полученные уравнения, получим уравнение dx1=d1. Это уравнение является следствием системы (*) и потому должно иметь решение, что абсурдно, ибо d=0, а d1≠0. 103. Пусть А–произвольная матрица (не обязательно квадратная):
a11 a12 ... a1n a21 a22 ... a2 n А= .................. . am1 am 2 ... amn Про всякий определитель, составленный из элементов матрицы А, одновременно принадлежащих нескольким строкам и стольким же столбцам, будем говорить, что он содержится в матрице А. Строки и столбцы каждого такого определителя берутся в том порядке, какой они имели в матрице А. Если матрица А–ненулевая (т.е. не все ее элементы равны 0), то рангом ее называется наивысший порядок содержащихся в ней определителей, отличных от нуля. Ранг нулевой матрицы принимается равным нулю. Рассмотрим теперь систему m линейных уравнений с n неизвестными: a11x1 a12 x2 ... a1n xn b1 a x a x ... a x b 21 1 22 2 2n n 2 (*) ............................................. am1 x1 am 2 x2 ..... amn xn bm Матрица А, составленная из коэффициентов при неизвестных, называется матрицей системы (*). Случай, когда матрица А-нулевая, является тривиальным и мы исключаем его из рассмотрения. Будем также считать, не ограничивая общности, что число m уравнений системы (*) больше числа n неизвестных (в противном случае можем приписать к системе (*) n-m+1 уравнений с нулевыми коэффициентами при неизвестных и нулевыми свободными членами, получая при этом систему, равносильную прежней). Пусть ранг матрицы А равен r (r≥1). В ней содержится по крайней мере один определитель порядка r , отличный от нуля, а все определители более высокого порядка, содержащиеся в матрице А (если они есть),-равны нулю. Переставляя (если нужно) уравнения системы (*) и меняя (при необходимости) обозначения неизвестных, можем добиться того, чтобы определитель
225
à11 à12... à1r à21 à22... à2 r Δ= ................
ar1 ar 2 .....arr оказался отличным от нуля. Заметим, что операция переобозначения неизвестных влечет за собой переобозначение коэффициентов при неизвестных, а операция перестановки уравнений системы влечет за собой, кроме того, и переобозначение свободных членов системы (*). Отличный от нуля определитель Δ будем называть главным определителем системы, а определители Δ1, Δ2,…,Δr, Δr+1,…, Δm, где
à11 à12 ... à1r b1 à21 à22 ... à2 r b2 Δi=
...................... , i=1, 2,…, m, ar1 ar 2 .....arr br ai1 ai 2 .....air bi
будем называть характеристическими определителями системы (*). Ясно, что определители Δ1, Δ2,…,Δr равны 0. Доказать, что если среди характеристических определителей Δr+1,…, Δm хотя бы один отличен от нуля, то система (*) несовместна.
à11 à12 ... à1r b1 à21 à22 ... à2 r b2 Указание. Пусть для определенности Δm=
...................... ar1 ar 2 .....arr br
≠0
am1 am 2 .....amr bm и требуется доказать несовместность системы (*). При r=n рассмотрим систему, состоящую из первых n уравнений и последнего уравнения системы (*): a11x1 a12 x2 ... a1n xn b1 a x a x ... a x b 22 2 2n n 2 21 1 ............................................. (**) a x a x ... a x b n2 2 nn n n n1 1 am1 x1 am 2 x2 ..... amn xn bm Достаточно доказать несовместность системы (**). Если бы она оказалась совместной и имела решение (х1о, х2о,…, хnо), то система
226
a11x1 a12 x2 ... a1n xn b1 xn1 0 a x a x ... a x b x 0 22 2 2n n 2 n 1 21 1 ............................................. a x a x ... a x b x 0 n2 2 nn n n n 1 n1 1 am1 x1 am 2 x2 ..... amn xn bm xn1 0 имела бы ненулевое решение (х1о, х2о,…, хnо, -1). Но определитель этой последней системы равен Δm, т.е. отличен от нуля. Следовательно, по правилу Крамера, решение (х1о, х2о,…, хnо, -1) является единственным решением системы. Однако, очевидно, что эта система имеет еще и нулевое решение: х1=0, х2=0,…, хn=0, хn+1=0. Полученное противоречие доказывает несовместность системы (**) и, тем самым,- несовместность системы (*) в случае r=n. Пусть теперь r
a x a x ... a x b 12 2 1r r 1 11 1 a x a x ... a x b 22 2 2r r 2 21 1 ............................................ ar1 x1 ar 2 x2 ... arr xr br am1 x1 am 2 x2 ..... amr xr bm
Здесь bi'=bi-ai,r+1cr+1-…-aincn, где i=1, 2, …, r или i=m. Теперь, как и выше, замечаем, что система a x a x ... a x b x 0 12 2 1r r 1 r 1 11 1 a x a x ... a x b x 0 22 2 2r r 2 r 1 21 1 ...................................................... ar1 x1 ar 2 x2 ... arr xr br xr 1 0 am1 x1 am 2 x2 ..... amr xr bm xr 1 0
(***)
227
имеет два различных решения: ненулевое решение (с1, с2, …, сr, -1) и нулевое решение х1=0, х2=0,…, хr=0, хr+1=0. Но это абсурдно, ибо определитель последней системы равен Δm≠0. В самом деле
à11 à12 ... à1r b1 à21 à22 ... à2 r b2 ...................... ar1 ar 2 .....arr br
=
am1 am 2 .....amr bm
à11 à12 ... à1r b1
à11 à12 ... à1r a1,r 1
à21 à22 ... à2 r b2
à21 à22 ... à2 r a2,r 1
...................... ar1 ar 2 .....arr br am1 am 2 .....amr bm
-сr+1
...................... ar1 ar 2 .....arr ar ,r 1
-…-
am1 am 2 .....amr am ,r 1
à11 à12 ... à1r a1n à21 à22 ... à2 r a2 n -сn
...................... ar1 ar 2 .....arr arn
= Δm-сr+10-…-сn0= Δm (при этом мы пользуемся
am1 am 2 .....amr amn определением ранга матрицы и тем, что определитель является линейной функцией каждого своего столбца). Полученное противоречие доказывает несовместность системы (***) и, тем самым, - несовместность системы (*). 104. Рассмотрим, как и в 103, систему m линейных уравнений с n неизвестными (m>n):
a11x1 a12 x2 ... a1n xn b1 a x a x ... a x b 21 1 22 2 2n n 2 ............................................. am1 x1 am 2 x2 ..... amn xn bm
(*)
Пусть ранг матрицы системы равен r≥1 и пусть определитель
à11 à12 ... à1r à21 à22 ... à2 r Δ= ..................
отличен от нуля.
ar1 ar 2 .....arr Доказать, что если все характеристические определители системы
228
à11 à12 ... à1r b1 à21 à22 ... à2 r b2 Δi=
...................... ar1 ar 2 .....arr br ai1 ai 2 .....air bi
равны 0 (i=1, 2, …, r, r+1, …, m), то система (*) совместна. При этом она имеет единственное решение, если ранг r равен числу неизвестных (r=n) и имеет бесчисленное множество решений при r
a11x1 a12 x2 ... a1n xn b1 a x a x ... a x b 21 1 22 2 2n n 2 ............................................. an1 x1 an 2 x2 ..... ann xn bn
(**)
имеет единственное решение, ибо ее определитель равен Δ≠0. Убедиться, что это решение удовлетворяет всем уравнениям системы (*), ибо n+1-e, n+2-e,…, m-e уравнения системы (*) являются линейными комбинациями первых n уравнений этой системы. Это утверждение следует из равенства нулю определителей Δn+1, Δn+2,…, Δm. Пусть теперь r
229
множество решений. Принято писать, что в рассматриваемом случае (все Δi равны 0 и rn) совместна тогда и только тогда, когда все характеристические определители системы равны 0. Если при этом ранг r (r≥1) матрицы системы равен числу неизвестных (r=n), то система имеет единственное решение; в противном случае система имеет бесчисленное множество, а именно n-r решений. Замечание 2. Если система n линейных уравнений с n неизвестными имеет единственное решение, то можно утверждать, что определитель d системы отличен от нуля. В самом деле, согласно теореме Руше (к данной системе следует приписать одно уравнение с нулевыми коэффициентами при неизвестных и нулевым свободным членом) ранг матрицы системы должен равняться n-числу неизвестных. А это и означает, что d≠0. Замечание 3. Расмотрим однородную систему n линейных уравнений с n неизвестными, т.е. систему вида: a11x1 a12 x2 ... a1n xn 0 a x a x ... a x 0 21 1 22 2 2n n ............................................. an1 x1 an 2 x2 ... ann xn 0 Такая система совместна при любой матрице системы, так как имеет нулевое решение: x1=0, x2=0,…, xn=0. Если однородная система имеет ненулевые решения, то определитель d системы должен равняться нулю, ибо, в противном случае, система имела бы единственное (нулевое) решение. Обратно, пусть определитель d однородной системы равен 0. Приписав к системе одно однородное уравнение с нулевыми коэффициентами, применим теорему Руше. Ранг r матрицы полученной системы должен быть меньше числа неизвестных n, так как d=0. следовательно, система имеет n-r решений, т.е. бесчисленное множество решений, зависящих от выбора n-r произвольных постоянных. Итак, однородная система n линейных уравнений с n неизвестными имеет ненулевые решения тогда и только тогда, когда определитель системы равен 0. Замечание 4. Вернемся к задаче отыскания собственных векторов и собственных значений линейного оператора А:Rn→Rn (см. замечание к упражнению 86). Как мы помним, эта задача сводится к решению однородной системы
230
(a11 ) x1 a12 x 2 ... a1n x n 0 1 2 n a21x (a22 ) x ... a2 n x 0 (*) ............................................. a x1 a x 2 ... (a ) x n 0 n2 nn n1 при тех значениях λ, при которых она имеет ненулевые решения. Согласно замечанию 3, эта система имеет ненулевые решения тогда и только тогда, когда имеет меcто равенство: à11 à12 ... à1n
à21 à22 ... à2 n ........................ =0 an1 an 2 .....ann
(**)
В левой части этого равенства стоит многочлен n–ой степени относительно λ. Если указанный многочлен имеет хотя бы один действительный корень, то все такие корни и будут собственными значениями оператора А. В противном случае оператор А не имеет собственных значений (и собственных векторов). Найдя все действительные корни уравнения (**) (если они есть) и подставив каждый из них в уравнение системы (*), можем найти координаты всех собственных векторов оператора А. Заметим, что уравнение (**) называется характеристическим уравнением линейного оператора А (а также матрицы этого оператора), а многочлен относительно λ, стоящий в левой части уравнения (**),-называется характеристическим многочленом оператора А (матрицы [A]). Для примера решим задачу отыскания собственных значений и собственных векторов симметричного линейного à11 à12 2 2 оператора А:R →R с матрицей [A]= ( a21 = a12 ). à 21 à 22 Характеристическое
уравнение 2
=0↔λ2-( a11 + a22 )λ+ a11 a22 - a12 =0.
имеет
вид:
2
( a11 -λ)( a22 -λ)- a12 =
Дискриминант этого уравнения D=
2
=( a22 - a11 )2+4 a12 ≥0. Возможны два случая. 1) D=0, т.е. a22 = a11 ≠0 и a12 =0. В этом случае характеристическое уравнение имеет один двукратный 0 õ1 0 корень λ= a11 (= a22 ), а система (*) принимает вид . 0 õ2 0 Это означает, что в рассматриваемом слyчае любой вектор x=(x1, x2)≠θ из R2 является собственным вектором оператора А, принадлежащим собственному значению λ= a11 (= a22 ), т.е. Ax=λx для любого xєR2.
231
2) D>0. Если при этом a12 =0 ( a22 ≠ a11 ), то характеристическое уравнение имеет два различных корня: λ1= a11 , λ2= a22 . Система (*) при λ=λ1 принимает вид 0 õ1 0 õ2 0 0 õ1 (à22 à11) õ2 0 Все решения этой системы имеют вид (к, 0), где к-любое действительное число. Таким образом, собственные векторы оператора А, принадлежащие собственному значению λ1-это вектор е1=(1, 0) и все векторы вида μе1 , где μ≠0. Аналогично доказывается, что собственные векторы оператора А, принадлежащие собственному значению λ2-это вектор е2=(0, 1) и все векторы вида νе2, где ν≠0. Если D>0 и a12 ≠0, то характеристическое уравнение имеет два различных корня λ1 и λ2, каждый из которых, как легко видеть, не совпадает ни с a11 , ни с a22 . Система (*) при λ=λ1 имеет вид: 1 2 (a11 1 ) x a12 x 0 1 2 a21x (a22 1 ) x 0
Все решения этой системы таковы: x1=- a12 t, x2=( a11 -λ1)t, где t–любое действительное число. При t≠0 получаем собственные векторы оператора А, отвечающие собственному значению λ1. Они имеют вид t(- a12 , a11 -λ1). Аналогично доказывается, что все собственные векторы оператора А, принадлежащие собственному значению λ2, имеют вид t(- a12 , a11 -λ2), где tлюбое действительное число, отличное от нуля. Обратим внимание читателя на то, что характеристическое уравнение симметричного линейного оператора А: R2→R2 имеет ровно два действительных корня, если каждый корень считать столько раз, какова его кратность. Позднее мы докажем, что характеристическое уравнение любого симметричного линейного оператора А:Rn→Rn имеет ровно n действительных корней, если каждый корень считать столько раз, какова его кратность. 105. Расмотрим однородную систему n линейных уравнений с n неизвестными:
a11x1 a12 x2 ... a1n xn 0 a x a x ... a x 0 21 1 22 2 2n n ............................................. an1 x1 an 2 x2 ... ann xn 0
(*)
232
Доказать, что если определитель d этой системы равен 0, но хотя бы одно из алгебраических дополнений A11, A12, …, A1n отлично от нуля, то все решения системы могут быть заданы равенствами: x1=A11t, x2=A12t, …, xn=A1nt, где t-любое действительное число. Указание. Пусть, для определенности, А11≠0 (читателю предлагается расмотреть любой другой случай). Тогда система
a21x1 a22 x2 ... a2 n xn 0 a x a x ... a x 0 31 1 32 2 3n n .......................................... an1 x1 an 2 x2 ... ann xn 0
(**)
при любом фиксированном значении х1 имеет единственное решение относительно неизвестных х2, х3, …, xn:
a21 a23...a2 n x1 x2
a22 a21...a2 n
a31 a33...a3n
................. an1 an 3 ...ann x A 1 12 , x3 a22 a23...a2 n A11 a32 a33...a3n
x1
................. an 2 an1 ...ann a22 a23...a2 n a32 a33...a3n
................. an 2 an 3 ...ann
................. an 2 an 3 ...ann
a22 a23...a2;n1 a21
a21 a22 ...a2 n x1
a31 a32 ...a3n
................. an1 an 3 ...ann x A 1 13 ,..., xn a22 a23...a2 n A11 a32 a33...a3n
................. an 2 an 3 ...ann
a32 a31...a3n
x1
a32 a33...a3,n1 a31 ......................... an 2 an 3 ...an ,n1 an1
a22 a23...a2,n1 a2 n a32 a33...a3,n1 a3n ......................... an 2 an 3 ...an ,n1 ann
233
a21 a22 ...a2,n1 x1 (1) n2
a31 a32 ...a3,n1 .................... an1 an 3 ...an ,n1
a22 a23...a2 n
x1 A1n . A11
a32 a33...a3n ................. an 2 an 3 ...ann Полагая x1=A11t, где t-любое действительное число, будем иметь: x2=A12t, …, xn=A1nt. Таковы все решения системы (**). Но система (*) равносильна системе (**), ибо (в силу условий А11≠0 и d=0) первое уравнение системы (*) является линейной комбинацией остальных. Замечание 1. Найденные решения системы (*) принято записывать в виде пропорций: xn x2 x1 = =…= A1n A11 A12 В этих пропорциях некоторые знаменатели (но не все!) могут равняться 0. Подразумевается, что если общее значение всех пропорций обозначить через t (t-любое из R), то и получим: x1=A11t, x2=A12t, …, xn=A1nt. Например, если имеем однородную систему a1 x b1 y c1 z 0 a2 x b2 y c2 z 0 , a x b y c z 0 3 3 3 определитель матрицы которой равен 0, то все решения системы получаются из пропорций x y z = = b2 c3 b3 c2 a3 c2 a2 c3 a2 b3 b2 a3 в предположении, что не все знаменатели равны 0. Замечание 2. Выше мы предполагали, что в определителе d системы (*) отлично от нуля алгебраическое дополнение одного из элементов первой строки. Разумеется, это не обязательно. Если известно, что, например, Аik≠0 (но по-прежнему d=0), то легко доказать (рассуждая аналогично вышеизложенному), что все решения системы (*) даются равенствами: x1=Ai1t, x2=Ai2t, …, xk=Aikt,…, xn=Aint, где t-любое действительное число. Заметим, что эти решения легко «угадываются», если учесть доказанное в упражнениях 98 и 99.
234
Замечание 3. Применим вышеизложенное к решению однородной системы n-1 линейных уравнений с n неизвестными: a11x1 a12 x2 ... a1n xn 0 a x a x ... a x 0 21 1 22 2 2n n ............................................. an1,1 x1 an1, 2 x2 ... an1,n xn 0 в предположении, что хотя бы один из определителей n-1-го порядка, содержащихся в матрице системы, отличен от нуля. Согласно теореме Руше (для ее применения следует мысленно приписать к данной системе два «нулевых» уравнения), данная система имеет n-r, т.е. 1 решений. Чтобы записать эти решения, присоединим к данной системе в качестве первого уравнения «нулевое» уравнение. Тогда, в согласии с вышеизложенным, все решения системы запишутся в виде:
x1 a12 a13...a1n
x2 a11 a13...a1n
a22 a23...a2 n ................. an1, 2 .....an1,n
xn a11...a1,n1
...
a21 a23...a2 n
(1) n1
................. an1,1 .....an1,n
a21...a2,n1 .............. an1,1...an1,n1
Например, все решения системы
a1 x b1 y c1 z d1u 0 a2 x b2 y c2 z d 2u 0 a x b y c z d u 0 3 3 3 3 можно записать в виде:
x b1 c1 d1
y z a1 c1 d1 a1 b1 d1
u , a1 b1 c1
b2 c2 d 2
a 2 c2 d 2
a2 b2 d 2
a2 b2 c2
b3 c3 d 3
a3 c3 d 3
a3 b3 d 3
a3 b3 c3
в предположении, что не все знаменатели равны 0. 106. Рассмотрим систему m линейных уравнений с n неизвестными:
235
a11x1 ... a1n xn b1 a x ... a x b 21 1 2n n 2 . ............................... am1 x1 ... amn xn bm Пусть А -матрица системы:
a11 a12 ... a1n a a ... a 21 22 2 n А= .................. . am1 am 2 ... amn Расширенной матрицей системы назовем матрицу
a11 a12 ... a1n b1 a21 a22 ... a2 n b2 А1= ...................... . a a ... a b mn m m1 m 2 Доказать, что ранг расширенной матрицы системы равен либо числу r-рангу матрицы А, либо числу r+1. Указание. Ясно, что ранг матрицы А1 не меньше r. Убедимся, что он не может быть больше числа r+1. С этой целью расмотрим любой определитель Δ порядка r+2, содержащийся в матрице А1 (если таковые имеются). Определитель Δ либо содержится в матрице А, либо его последний столбец состоит из некоторых элементов bi и тогда Δ «разлагается» по определителям порядка r+1, содержащимся в матрице А. В обоих случаях Δ=0, ибо ранг матрицы А равен r. Точно так же равен 0 любой определитель порядка s>r+2, содержащийся в матрице А1 (если таковые имеются). Следовательно, ранг матрицы А1 не может быть больше числа r+1. 107. Доказать, что если ранг расширенной матрицы и ранг матрицы системы a11x1 a12 x2 ... a1n xn b1 a x a x ... a x b 21 1 22 2 2n n 2 (*) .......................................... am1 x1 am 2 x2 ... amn xn bm совпадают, то система (*) совместна.
236
Указание. Не ограничивая общности (см. 103), можно считать, что m>n и определитель
à11 à12 ... à1r à21 à22 ... à2 r Δ= ..................
ar1 ar 2 .....arr отличен от нуля (здесь число r представляет собой ранг матрицы и ранг расширенной матрицы системы (*)). Расмотрим характеристические определители Δi при i=r+1, …, m (определители, Δ1, Δ2, …, Δr, очевидно, равны 0):
à11 à12 ... à1r b1 à21 à22 ... à2 r b2 Δi=
...................... . ar1 ar 2 .....arr br ai1 ai 2 .....air bi
Если хотя бы один из этих определителей отличен от нуля, то ранг расширенной матрицы системы (*) равен r+1, что противоречит условию задачи. Значит, все характеристические определители системы равны 0 и потому (теорема Руше) система (*) совместна. 108. Доказать, что если ранг расширенной матрицы не совпадает с рангом r матрицы системы a11x1 a12 x2 ... a1n xn b1 a x a x ... a x b 21 1 22 2 2n n 2 (*) .......................................... am1 x1 am 2 x2 ... amn xn bm то система (*) несовместна. Указание. Не ограничивая общности, можно считать, что m>n (см. 103). Так как по условию ранг расширенной матрицы не совпадает с рангом r матрицы системы (*), то он равен r+1 (см. 106). Следовательно, найдется отличный от нуля определитель порядка r+1, содержащийся в расширенной матрице системы (*). Последний столбец этого определителя должен состоять из некоторых свободных членов bi системы (*) (ибо ранг матрицы системы равен r). Разлагая указанный определитель по элементам последнего столбца, мы убедимся, что хотя бы один из его миноров порядка r отличен от 0. Этот минор является определителем, содержащимся в матрице системы (*). Переставляя (если нужно) уравнения системы (*) и меняя (при необходимости) обозначения неизвестных (что повлечет за собой изменение обозначений
237
коэффициентов при неизвестных и, возможно, изменение обозначений свободных членов), можем добиться того, чтобы определители
à11 à12 ... à1r à21 à22 ... à2 r Δ= ..................
ar1 ar 2 .....arr
à11 à12 .......... à1r b1 à21 à22 ......... à2 r b2 ~ è ............................ ar1 ar 2 ............arr br
ar 1,1 ar 1, 2 .....ar 1,r br 1 ~ оказались отличными от нуля. Но определитель совпадает с характеристическим определителем Δr+1, который, таким образом, оказывается отличным от 0. Следовательно, система (*) несовместна. Замечание. Доказанное в упражнениях 107 и 108 позволяет утверждать следующее (теорема Кронекера-Капелли): система линейных уравнений совместна тогда и только тогда, когда ранг матрицы системы совпадает с рангом расширенной матрицы. 109. Ранее (см. 32) были приведены определения понятий «линейно независимое множество векторов», «линейно зависимое множество векторов» того или иного векторного пространства Е. В дальнейшем неоднократно употреблялись понятия линейной независимости или линейной зависимости конечной последовательности х 1, х2, …, хк векторов пространства Е (в конечной последовательности два или несколько членов могут представлять собой один и тот же вектор). При этом молчаливо подразумевалось следующее. Пусть М-множество членов конечной последовательности х1, х2, …, хк, т.е. М={xєE:x=xi при некотором iєNk}. Тогда конечная последовательность х1, х2, …, хк является (называется) линейно независимой тогда и только тогда, когда векторы последовательности попарно различны и множество М членов последовательности линейно независимо. Конечная последовательность х 1, х2, …, хк является (называется) линейно зависимой, если она не является линейно независимой. Доказать, что конечная последовательность х1, х2, …, хк линейно зависима тогда и только тогда, когда существуют числа α1, α2,…, αk, не все равные 0 и такие, что α1x1+ α2x2+…+ αkxk=θ Очевидно, верно также утверждение: конечная последовательность линейно зависима тогда и только тогда, когда хотя бы один из ее членов является линейной комбинацией остальных. Ясно, что конечная последовательность, содержащая нуль-вектор θ или два одинaковых членалинейно зависима. Определим понятие максимального числа линейно независимых векторов конечной последовательности х1, х2, …, хк. Будем рассматривать непустые линейно независимые подмножества множества М. Если таковых нет, т.е. х1=х2= …=хк=θ, то максимальное число линейно независимых
238
векторов последовательности х1, х2, …, хк принимается равным нулю. Если само множество М линейно независимо, то число его элементов и принимается за максимальное число линейно независимых векторов конечной последовательности х1, х2, …, хк. Если М линейно зависимо и среди векторов х1, х2, …, хк есть отличные от θ, то существует такое линейно независимое собственное подмножество Ì множества М, что любой вектор хєМ\ Ì является линейной комбинацией векторов множества Ì . Такое множество Ì будем называть максимальным линейно независимым подмножеством линейно зависимого множества М. ~ Пусть Ì и Ì -два максимальных линейно независимых подмножества линейно зависимого множества М. Доказать, что число элементов ~ множества Ì совпадает с числом элементов множества Ì . Указание. Пусть õ1 , õ2 ,..., õð суть все попарно различные векторы õ,~ õ ,..., ~ õ суть все попарно различные векторы множества Ì , а ~ 1
2
q
~ множества Ì . Рассмотрим векторное подпространство L пространства Е, натянутое на векторы множества М, т.е. совокупность всевозможных линейных комбинаций векторов множества М. Любой элемент хєL может быть представлен в виде: x=λ1x1+λ2x2+…+λkxk, а любой вектор xi либо принадлежит Ì , либо принадлежит М\ Ì и в любом случае õ1 , õ2 ,..., õð . представляется линейной комбинацией векторов Следовательно, линейно независимое множество Ì является базисом ~ векторного пространства L. Аналогично доказывается, что и Ì является базисом векторного пространства L. Так как любые два базиса векторного пространства равномощны (что для конечномерных пространств доказано в упражнении 33), то р=q, ч.т.д. Замечание. Если множество М членов конечной последовательности х1, х2, …, хк линейно зависимо и отлично от {θ} , то за максимальное число линейно независимых векторов последовательности х1, х2, …, хк принимается число элементов любого максимального линейно независимого подмножества множества М. Если это число равно r (r
239
Указание. Если r=0, то Aei=θ' (нуль-вектор пространства Rm) при всех i=1, 2,.., n. Следовательно, А=0 (нуль-оператор) и F={θ'}, т.е. F имеет размерность, равную 0. Другими словами, ранг линейного оператора A в рассматриваемом случае равен r=0. Пусть r>0. Тогда среди векторов Ae1, Ae2,…, Aen найдутся r попарно различных линейно независимых векторов Aek1, Aek2,…, Aekr таких, что каждый из векторов Ae1, Ae2,…, Aen является линейной комбинацией векторов Aek1, Aek2,…, Aekr. Так как каждый из векторов пространства F является линейной комбинацией векторов Ae1, Ae2,…, Aen (см. 61), то можно утверждать, что каждый вектор пространства F является линейной комбинацией векторов Aek1, Aek2,…, Aekr. Следовательно, эти векторы составляют базис пространства F и ранг оператора А равен r. Замечание. Если оператор А:Rn→Rm инъективен, то векторы Ae1, Ae2,…, Aen линейно независимы, ибо ξ1Ae1+ξ2Ae2+…+ξnAen=θ'→A(ξ1e1+ +ξ2e2+…+ ξnen)=θ'→ξ1e1+ξ2e2+…+ ξnen=θ→ξ1=ξ2=…=ξn=0. Следовательно, m≥n и ранг оператора А равен n. Обратно, если m≥n и ранг оператора А равен n, то векторы Ae1, Ae2,…, Aen линейно независимы. Поэтому, если x= ξ1e1+ξ2e2+…+ ξnen и Ах=θ', то ξ1Ae1+ξ2Ae2+…+ξnAen=θ'→ →ξ1=ξ2=…=ξn=0→x=θ, что доказывает инъективность оператора А. Итак, линейный оператор А:Rn→Rm инъективен тогда и только тогда, когда m≥n и ранг оператора А равен n. Если m=n, то инъективность линейного оператора А:Rn→Rn равносильна его сюръективности (см. 49). Если m>n, то линейный оператор А:Rn→Rm не может быть сюръективным, ибо ранг оператора А не превосходит числа n. Если m
a11 a12 ... a1n a a ... a 2n 21 22 А= .................. . am1 am 2 ... amn Матрицу А можно рассматривать как матрицу [A] вполне определенного линейного оператора А:Rn→Rm, для которого Ae1=( a11 ,
a21 ,.., am1 ), Ae2=( a12 , a22 ,.., am 2 ),.., Aen=( a1n , a2 n ,.., amn ). Возникает вопрос: не равен ли ранг r матрицы А (т.е. наивысший порядок отличных от нуля определителей, содержащихся в матрице А) рангу оператора A? Согласно доказанному в 110, ранг оператора А равен максимальному числу линейно
240
независимых векторов в конечной последовательности Ae1, Ae2,…, Aen. Поэтому поставленный вопрос можно перефразировать так: не равен ли ранг r матрицы А максимальному числу линейно независимых столбцов этой матрицы? Чтобы ответить на этот вопрос, расмотрим сперва частные случаи: а) r=n. В этом случае m≥n. При m=n матрица А квадратная и так как r=n, то det А≠0. Значит, столбцы матрицы А попарно различны и линейно независимы, т.е. максимальное число линейно независимых столбцов матрицы равно n=r. При m>n приходим к такому же выводу, ибо если бы столбцы матрицы А оказались линейно зависимыми, то линейно зависимыми были бы и столбцы отличного от нуля определителя порядка r=n, содержащегося в данной матрице. b) r=m
a11 a12 ... a1m ...a1n a a ... a ... a 2m 2n 21 22 А= ......................... . am1 am 2 ... amm ...amn Так как от перестановки столбцов матрицы не изменяются ни ранг матрицы, ни максимальное число линейно независимых столбцов матрицы, то мы можем считать, что
à11 à12 ... à1m à21 à22 ... à2 m .................. ≠0. am1 am 2 .....amm Тогда первые m столбцов матрицы А линейно независимы. Убедимся в том, что присоединение к ним любого другого столбца, например n–го, делает полученную систему столбцов линейно зависимой. Если допустить противное, то система уравнений относительно неизвестных λ1, λ2, …, λm, λn a111 a122 ... a1m m a1n n 0 a a ... a a 0 21 1 22 2 2m m 2n n ....................................................... am11 am 2 2 ... amm m amn n 0 должна иметь только нулевое решение. Но ясно, что неизвестному λn можно придать любое ненулевое значение и этим вполне определяются значения неизвестных λ1, λ2, …, λm, которые вместе с выбранным
241
значением λn удовлетворяют указанной системе. Полученное противоречие доказывает, что максимальное число линейно независимых столбцов матрицы А в рассматриваемом случае (r=m
a11 a12 ... a1r a1,r 1 ...a1n a a ... a a ... a 21 22 2 r 2 , r 1 2 n ................................. А= ar1 ar 2 ...arr ar ,r 1...arn . ................................. am1 am 2 ... amr am ,r 1 ...amn Не ограничивая общности, можно считать, что определитель
à11 à12 ... à1r à21 à22 ... à2 r Δ= ..................
отличен
от
нуля,
а
все
определители,
ar1 ar 2 .....arr содержащиеся в матрице А, порядка r+1 и выше-равны нулю. Тогда первые r столбцов матрицы А линейно независимы, так как в противном случае оказались бы линейно зависимыми столбцы определителя Δ. Установим, что присоединение к первым r столбцам матрицы А любого из оставшихся столбцов, например, n-го, делает полученную систему столбцов линейно зависимой. Если допустить противное, то система уравнений относительно неизвестных λ1, λ2, …, λr и λn a111 a122 ... a1r r a1n n 0 a a ... a a 0 22 2 2r r 2n n 21 1 ....................................................... ar11 ar 2 2 ... arr r arnn 0 ....................................................... am11 am 2 2 ... amr r amn n 0
242
должна иметь только нулевое решение. Но ранг матрицы этой системы равен r, а число неизвестных равно r+1. Согласно теореме Руше, эта система имеет бесчисленное множество решений. Полученное противоречие доказывает, что максимальное число линейно независимых столбцов матрицы А во всех случаях равно рангу r матрицы. Замечание. Итак, ранг линейного оператора А:Rn→Rm (т.е. размерность множества значений оператора А) совпадает с рангом матрицы [A] этого оператора (т.е. с наивысшим порядком отличных от нуля определителей, содержащихся в матрице [A]). Равенство этих чисел (ранга оператора и ранга его матрицы) обусловлено их совпадением с максимальным числом линейно независимых столбцов матрицы [A]. 112. Пусть А –mxn-матрица:
a11 a12 a13 ...a1n a a a ... a 21 22 23 2 n А= ....................... . am1 am 2 am 3 ...amn nxm-матрицу
B: b11 b12 ...b1m a21 a22 ...b2 m B= ................... . bn1 bn 2 ...bnm
будем называть транспонированной по отношению к матрице
B=А,
А и писать
если bij= a ji для любых натуральных i, j таких, что 1≤i≤n, 1≤j≤m.
Ясно, что B'=А. Линейные операторы А:Rn→Rm и B:Rm→Rn , имеющие своими матрицами (относительно стандартных базисов в Rn и Rm) матрицы А и B сответственно,-будем называть сопряженными друг по отношению к другу. При этом будем писать: B=A', A=B'. Доказать, что для любых векторов xєRn и yєRm имеет место равенство:=<x, A'y> 1 Указание. Если х=(x , x2, …, xn), y=(y1, y2, …, ym), то =y1( a11 x1+ a12 x2+…+ a1n xn)+y2( a21 x1+ a22 x2+…+ a2 n xn)+…+ym( am1 x1+ + am 2 x2+…+ amn xn)=x1( a11 y1+ a21 y2+…+ am1 ym)+x2( a12 y1+ a22 y2+…+ am 2 ym)+ … +xn( a1n y1+ a2 n y2+…+ amn ym)=<x,A'y>.
243
Замечание симметричный оператор A:Rn→Rn будем называть также самосопряженным. Заметим еще, что при переходе от mxn–матрицы А к
А ранг матрицы не меняется, а строки столбцами матрицы А. Поэтому ранг любой
транспонированной nxm-матрице
матрицы А становятся матрицы равен не только максимальному числу линейно независимых столбцов, но и максимальному числу линейно независимых строк этой матрицы. 113. Пусть mxn–матрица
a11 a12 ... a1r ...a1n a a ... a ... a 21 22 2 r 2 n ........................ А= ar1 ar 2 ...arr ...arn ......................... am1 am 2 ... amr ...amn такова, что содержащийся в ней определитель
à11 à12 ... à1r à21 à22 ... à2 r Δ= ..................
ar1 ar 2 .....arr отличен от нуля (Δ≠0), тогда как равны нулю все определители r+1–го порядка Δij (r+1≤i≤m, r+1≤j≤n), содержащиеся в матрице А и имеющие вид:
à11... à1r à1 j ................ Δij= àr1 ... àrr àrj ai1 ... air aij Доказать, что при этих условиях ранг матрицы А равен r. Указание. Легко видеть, что равенство Δij=0 выполняется при всех натуральных j таких, что 1≤j≤n. Разлагая определитель Δij по элементам последнего столбца, приходим к равенству: a1 j λ1+ a2 j λ2+…+ arj λr+ aij Δ=0, (*)
244
где числа λ1, λ2, …, λr зависят от выбора i (r+1≤i≤m), но не зависят от выбора j (1≤j≤n). Выражая из (*) aij и полагая последовательно j равным 1, 2, …, n, получим: ai1 1a11 2 a21 ... r ar1 a a a ... a i2 1 12 2 22 r r2 (**), ........................................... ain 1a1n 2 a2 n ... r arn
k где γk=, 1≤k≤r. Равенства (**) показывают, что каждая i–я строка матрицы А (i=r+1, r+2, …, m) является линейной комбинацией первых r строк этой матрицы. Так как первые r строк матрицы А линейно независимы, то максимальное число линейно независимых строк матрицы А равно r. Но это означает (см. замечание к упражнению 112), что ранг матрицы А равен r. 114. Пусть a1 , a2 ,..., ak (k≥2) –конечная последовательность векторов пространства Rn (n≥2). Доказать, что если векторы a1 , a2 ,..., ak линейно независимы, то определитель
a1 , a1
a1 , a 2 ... a1 , a k
a 2 , a1
a 2 , a 2 ... a 2 , a k
Δ= .....................................
a k , a1
a k , a 2 ... a k , a k
положителен: Δ>0 (предполагается, что к≤n). Указание. Применить индукцию по числу к. Если к=2, то для любых линейно независимых векторов a1 , a2 Δ=|| a1 ||2|| a2 ||2-|< a1 , a2 >|2>0 (см. 34). Пусть утверждение задачи справедливо для любых к-1 линейно независимых векторов (k≥3) и требуется доказать справедливость утверждения задачи для любых к линейно независимых векторов a1 , a2 ,..., ak , т.е. доказать, что Δ>0. Введем обозначения: μ2=
à1 , à 2 à1 , à1
, μ3 =
à1 , à3 à1 , à1
,…, μk=
à1 , àê à1 , à1
(очевидно, < a1 , a1 >=|| a1 ||2>0). Вычтем из второго столбца определителя Δ первый его столбец, умноженный на μ2. Затем из третьего столбца определителя Δ вычтем первый его столбец, умноженный на μ3. Продолжая так и далее, на
245
последнем шагу вычтем из к-го столбца определителя Δ его первый столбец, умноженный на μk. В результате получим:
a1 , a1 a1 , a2 2 à1 ... a1 , ak ê à1 a2 , a1 a2 , a2 2 à1 ... a2 , ak ê à1 Δ= ............................................................
(*)
ak , a1 ak , a2 2 à1 ... ak , ak ê à1 Теперь вычтем из второй строки определителя (*) первую его строку, умноженную на μ2. Затем из третьей строки определителя (*) вычтем его первую его строку, умноженную на μ3. Продолжая так и далее, на последнем шагу вычтем из к-ой строки определителя (*) его первую строку, умноженную на μk. Тогда
a1 , a1
a1 , a2 2 à1 ............... a1 , ak ê à1
a2 2 a1 , à1 a2 2 à1 , à2 2 à1 ... a2 2 à1 ak ê à1 Δ= ...........................................................................................
ak ê à1 , à1 ak ê à1 , a2 2 à1 ... ak ê à1 , ak ê à1 Заметим, что все элементы первой строки (и первого столбца) этого определителя, кроме элемента < a1 , a1 >, равны нулю. Разлагая определитель по элементам первой строки (или первого столбца), будем иметь:
a2 , a2
a2 , a3 ... a2 , ak
a3 , a2
a3 , a3 ... a3 , ak
Δ=|| a1 ||2 .....................................
(**),
ak , a1 ak , a3 ... ak , ak где a 2 = a 2 -μ2 a1 , a3 = a3 -μ3 a1 ,…, a k = a k -μk a1 . Обратим внимание на то, что векторы a 2 , a3 , …, a k попарно различны, ибо в противном случае векторы a1 , a 2 , …, a k окажутся линейно зависимыми. Кроме того, если λ2 a 2 +λ3 a3 +…+λk a k =θ, то λ2 a 2 +λ3 a3 +…+λk a k -(λ2μ2+λ3μ3+…+λkμk) a1 =θ,
откуда
λ2=λ3=…=λk=0
Следовательно, векторы конечной последовательности a 2 , a3 , …, a k линейно независимы. Согласно предположению индукции, определитель, стоящий в правой части равенства (**), положителен. Значит, Δ>0, ч.т.д. Замечание. Ясно, что если векторы a1 , a 2 , …, a k линейно зависимы, то Δ=0 (в частности, это равенство будет иметь место при к>n).
246
Если к=n и векторы a1 , a 2 , …, a k линейно независимы, то неравенство Δ>0 можно доказать следующим образом. Пусть
a1 (a11, a12 ,..., a1n ), a2 (a21, a22 ,..., a2 n ), ............................. . an (an1 , an 2 ,..., ann ) Рассмотрим матрицу
a11 a12 ... a1n a21 a22 ... a2 n А= .................. . a a ... a nn n1 n 2
a1 , a1 a1 , a2 ... a1 , an a2 , a1 a2 , a2 ... a2 , an Ясно, что А А= .................................... an , a1 an , a2 ... an , an
Отсюда Δ=detАdetА=d2, где d=detА. Так как строки матрицы А линейно независимы, то d≠0 и Δ>0. Итак, мы доказали, что для любых векторов a1 , a 2 , …, a k определитель рассматриваемого вида удовлетворяет неравенству Δ≥0 как при к≤n, так и при к>n. Заметим, что любой главный минор такого определителя Δ сам имеет аналогичный вид и потому неотрицателен. 115. Ненулевым действительным многочленом будем называть всякую функцию f: R→R, для которой существуют целое неотрицательное число n и действительные числа a0 , a1 , …, a n такие, что a0 ≠0 и для всех хєR f(x)= a0 хn+ a1 xn-1+…+ a n . Функцию θ: R→R, тождественно равную нулю на R, будем называть действительным нуль-многочленом. Как и в упражнении 17, доказывается, что целое неотрицательное число n и действительные числа a0 ≠0, a1 ,…, определены для каждого ненулевого действительного многочлена f однозначно. Число n называется степенью ненулевого действительного многочлена, а числа a0 , a1 , …, a n -его коэффициентами ( a0 -старший коэффициент). Для действительных многочленов (включая действительный нуль-многочлен) естественным образом определяется понятие суммы двух многочленов f и g и понятие произведения
an
247
действительного числа на многочлен. А именно φ=f+g, если для любого хєR φ(x)=f(x)+g(x). Если αєR, то под αf понимается функция из R в R, для которой при всех хєR (αf)(x)=αf(x). Ясно, что если f и g-действительные многочлены и αєR, то f+g и αf (αg) суть действительные многочлены. Множество всех действительных многочленов, рассматриваемое вместе с операциями сложения многочленов и умножения их на действительные числа,-является векторным пространством над полем R. Операция умножения действительных многочленов определяется как операция умножения функций: если f и g- действительные многочлены, то под fg понимается такая функция из R в R, для которой при всех хєR (fg)(x)=f(x)g(x). Если f(x)= a0 xn+ a1 xn-1+…+ a n , g(x)=b0xm+b1xm-1+…+bm, то f(x)g(x)= = a0 b0xn+m+( a0 b1+b0 a1 )xn+m-1+…+ a n bm. Мы видим, что если f и g действительные многочлены степеней n и m соответственно, то и fg есть действительный многочлен степени n+m. Действительное число x0 называется корнем или нулем действительного многочлена f, если f(x0)=0. Пусть при всех xєR f(x)= a0 xn+ a1 xn-1+…+ a n , где n≥1 и a0 ≠0 и х0-корень многочлена f. Тогда f(x)=f(x)-f(x0)= a0 (xn-x0n)+ a1 (xn-1-x0n-1)+…+ an1 (x-x0)= =(x-x0)[ a0 (xn-1+xn-2x0+…+x0n-1)+ a1 (xn-2+…+x0n-2)+…+ an1 ], т.е. f(x)= =(x-x0)g(x), где g–действительный многочлен степени n-1, имеющий своим старшим коэффициентом число a0 –старший коэффициент многочлена f. Единственность действительного многочлена g, удовлетворяющего при всех хєR равенству f(x)=(x-x0)g(x) видна из следующего. Многочлен g должен быть степени n-1. Пусть g(x)= =b0xn-1+b1xn-2+…+bn-1. Так как при всех хєR g(x)(x-x0)=b0xn+ +(b1-b0x0)xn-1+(b2-b1x0)xn-2+…+(bn-1-bn-2x0)x+bn-1(-x0),то должна выполняться система равенств: b0 a 0 b b x a 1 1 0 0 b2 b1 x0 a 2 (*) ..................... bn 1 bn 2 x0 a n 1 bn 1 ( x0 ) a n Из этой системы находим:
248
b0 a0 b1 a0 x0 a1 2 b2 a0 x 0 a1 x0 a2 (**) ............................... bn1 a0 x0 n1 a1 x0 n2 ... an2 x0 an1 Заметим, что последнее равенство системы (*) равносильно равенству a0 x0n+ a1 x0n-1+…+ an1 x0+ a n =0, утверждающему, что x0–корень многочлена f. Итак, коэффициенты b0, b1, …, bn-1 действительного многочлена g, удовлетворяющего при всех xєR равенству f(x)=(x-x0)g(x) определяются однозначно через корень x0 многочлена f и его коэффициенты a0 , a1 , …, an1 , ч.т.д. Если действительное число x0 не является корнем действительного многочлена f степени n≥1 с коэффициентами a0 , a1 , …, a n , то это число x0 является корнем многочлена f1 n–ой степени: f1(x)= a0 xn+ + a1 xn-1+…+ an1 x+( a n -f(x0)) при любом xєR. Поэтому, согласно доказанному, f1(x)=(x-x0)g(x), где g-многочлен степени n-1 с коэффициентами, определяемыми формулами (**). Так как f1(x)=f(x)-f(x0), то при всех xєR f(x)=(x-x0)g(x)+f(x0) (теорема Безу). Так же, как и в 19, доказывается, что если x0–корень действительного многочлена f степени n≥1, то существует единственное натуральное число к такое, что 1≤к≤n и при всех xєR f(x)=(x-x0)kg(x), где g–действительный многочлен степени n– к, g(x0)≠0 и многочлен g имеет своим старшим коэффициентом число a0старший коэффициент многочлена f. При этом говорят, что x0 является к-кратным корнем действительного многочлена f. Если x1, x2, …, xp суть все попарно различные корни действительного многочлена f степени n (n≥1), то, как легко видеть, при всех xєR
f ( x) ( x x1 ) k1 ( x x2 ) k2 ...( x x p ) p g ( x) , где k
k1, k2, …, kp-кратности корней x1, x2, …, xp соответственно, а gдействительный многочлен степени, n-(k1+k2+ …+kp), не имеющий корней. При этом старший коэффициент многочлена g равен a0–старшему коэффициенту многочлена f. Таким образом, выполняется не только неравенство p≤n, но и неравенство k1+k2+ …+kp≤n, т.е. число всех корней действительного многочлена f степени n≥1 (каждый корень считается столько раз, какова его кратность) не превосходит числа n. Действительный многочлен f может и не иметь корней, т.е. отображение f: R→R может оказаться не сюръективным. Так, например, действительный многочлен f, для которoго при всех xєR f(x)=x2+1, не принимает значений, меньших 1 (в частности, не принимает значение 0, т.е. не имеет корней).
249
Пусть М-векторное пространство (над полем R) всех действительных многочленов. Базисом этого пространства является множество многочленов f0, f1, f2, …, fn, …, где f0-функция из R в R, тождественно равная 1, а при любом nєN и любом хєR fn(x)=xn. Любой действительный многочлен f степени n (n≥0) с коэффициентами a0 , a1 , …, a n ( a0 -старший коэффициент, a0 ≠0) можно представить линейной комбинацией базисных многочленов: f= a0 fn+ a1 fn-1+…+ a n f0. Определим линейный оператор D:M→M, полагая Dfn=nfn-1 при n≥1 и Df0=θ (значение линейного оператора на любом элементе пространства вполне определяется заданием его значений на элементах базиса). Этот линейный оператор будем называть оператором взятия производной. Для любого действительного многочлена f многочлен Df будем обозначать также f
и называть производной
многочлена f. Многочлен D2f=D(Df)=D(f) будем обозначать также f и называть второй производной многочлена f. Вообще, при любом натуральном к≥2 многочлен Dkf=D(Dk-1f) будем называть к-ой производной многочлена f и обозначать f(k): f(k)=Df(k-1)=(f(k-1))'. Ввиду линейности оператора D, для любых действительных многочленов f и g и любых действительных чисел α, β имеем: (αf+βg)'=D(αf+βg)=αDf+βDg=αf+βg'. Если для любого хєR f(x)= a0 xn+ a1 xn-1+…+ an1 x+ a n , т.е. f= a0 fn+ + a1 fn-1+…+ an1 f1+ a n f0,
то
f= a0 fn+ a1 fn-1+…+ an1 f1+ a n f0= a0 fn+
+ a1 fn-1+…+ an1 f1= =n a0 fn-1+(n-1) a1 fn-2+…+ an1 f0. Следовательно, при всех хєR f(x)=n a0 xn-1+ +(n-1) a1 xn-2+…+ an1 . Если к, n-натуральные числа и 1≤к≤n, то Dkfn, как легко видеть, выражается формулой: Dkfn=n(n-1)…(n-k+1)fn-k=k!Cnkfn-k. B частности Dnfn=n!f0. Если к>n, то Dkfn=θ. Доказать, что для любого действительного многочлена f степени n≥1 имеет место так называемая формула Тейлора: f ( x0 ) f ( n ) ( x0 ) f ( x0 ) 2 ( x x0 ) n , ( x x0 ) +…+ ( x x0 ) + f(x)=f(x0)+ n! 2! 1! где х и х0 –любые числа из R. Указание. Пусть f= a0 fn+ a1 fn-1+…+ + an1 f1+ a n f0. Убедимся, что формула Тейлора справедлива для базисных многочленов f1, f2,…. При любом натуральном m и любых числах х и х0 из R имеем:
250 m
m
m
m 0
x =[x0+(x-x0)] = õ + Учитывая, что Сmkfm-k=
C k 1
k m
x0
mk
( x x0 ) k (формула
Ньютона).
1 (ê ) 1 (ê ) f m , получим: Сmkx0m-k=Сmkfm-k(x0)= f m ( x0 ) и ê! ê!
m
1 (k ) k fm(x)=fm(x0)+ + f m ( x0 ) ( x x0 ) . k 1 ê! Полагая в этой формуле m=1, 2,…, n и учитывая, что при к>m будем иметь: (n) f 0 ( x0 ) f 0 ( x0 ) f 0 ( x0 ) 2 ( x x0 ) n , ( x x0 ) + ( x x0 ) +…+ f0(x)=f0(x0)+ 1! 2! n! (n) f 1 ( x0 ) f 1 ( x0 ) f 1 ( x0 ) 2 ( x x0 ) n , ( x x0 ) + ( x x0 ) +…+ f1(x)=f1(x0)+ n! 1! 2! …………………………………………………………………………. (n) f n ( x0 ) f n ( x0 ) f n ( x0 ) 2 ( x x0 ) + ( x x0 ) +…+ ( x x0 ) n . fn(x)=fn(x0)+ 1! 2! n!
fm(k)(x0)=0,
Умножая первое из этих равенств на a n , второе-на an1 и т.д. (последнее равенство умножается на a0 ), и складывая полученные равенства, находим (так как D, D2,…Dn суть линейные операторы): (n) f ( x0 ) f ( x0 ) f ( x0 ) 2 ( x x0 ) + ( x x0 ) +…+ ( x x0 ) n . f(x)=f(x0)+ 1! 2! n! 116. Пусть G–подмножество множества R, представляющее собой конечный или бесконечный (в одну или в обе стороны) интервал. Напомним, что конечный интервал (а, b), где a, bєR и aa}. Бесконечный в обе стороны интервал (-, +) представляет собой просто все множество R. Рассмотрим функцию f:G→R. Пусть для некоторой точки х0єG можно найти такое δ>0, что (x0-δ, x0+δ)G и для всех точек x≠x0, принадлежащих интервалу (x0-δ, x0+δ) выполняется неравенство f(x)f(x0). Если в точке х0єG функция f не имеет ни собственного максимума, ни собственного минимума, но существует такое δ>0, что (х0-δ, x0+δ)G и
251
для всех xє(х0-δ, x0+δ) выполняется неравенство f(x)≤f(x0) (f(x)≥f(x0)) , то говорят, что функция f в точке x имеет несобственный максимум (несобственный минимум). Для обозначения максимума или минимума существует и объединяющий их термин-экстремум. Найти все точки экстремума функции-значит найти все такие точки из G, в которых данная функция f:G→R имеет максимум или минимум (собственный или несобственный). Доказать, что если f:R→R. есть действительный многочлен степени n≥1 и точка х0єR такова, что f(x0)≠0 то х0 не является точкой экстремума
функции f (таким образом, равенство f(x0)=0 является необходимым условием того, чтобы точка х0 являлась точкой экстремума действительного многочлена f). Указание. Так как f(x0)≠0, то, применяя формулу Тейлора, будем иметь (при n≥2) f(x)=f(x0)+f(x0)(x-x0)x 1 f ( x0 ) 1 f n ( x0 ) ( x x0 ) +…+ ( x x0 ) n1 ] x[1+ 2! f ( x0 ) n! f ( x0 ) Обозначим через p наибольшее из чисел
(*)
1 f ( x0 ) , 2! f ( x0 )
1 f ( x0 ) ,…, 3! f ( x0 )
1 f ( n ) ( x0 ) 1 и выберем положительное число δ так, чтобы 0<δ< . n! f ( x0 ) p 1 Тогда, считая, что хє(х0-δ, x0+δ), т.е. |x-x0|<δ, получаем следующую оценку: 1 f ( x0 ) 1 f n ( x0 ) ( x x0 ) n1 ≤p(δ+δ2+…+ ( x x0 ) +…+ n! f ( x0 ) 2! f ( x0 )
n ð +δ )=p ≤ <1 1 1 n-1
Следовательно, в равенстве (*) выражение, стоящее в квадратных скобках, положительно при всех хє(х0-δ, x0+δ). Если f(x0)>0, то при х0-δ<x<x0 будет выполняться неравенство f(x)f(x0). Поэтому при f(x0)>0 точка х0 не является точкой
экстремума функции f. К такому же выводу придем в случае f(x0)<0. До сих пор мы считали, что n≥2 Если же n=1, то f(x)=f(x0)+f'(x0)(xx0), откуда, как и выше, следует, что точка х0 не является точкой экстремума функции f. 117. Доказать, что если f:R→R есть действительный многочлен степени n≥2 и точка x0єR такова, что f(x0)=0, но f(x0)≠0, то х0 является точкой экстремума функции f. При этом, если f''(x0)>0, то многочлен f
252
имеет в точке х0 собственный минимум; если же f(x0)<0, то f имеет в точке х0 собственный максимум. Указание. Если n=2, то
1 2
f(x)=f(x0)+ f''(x0)(x-x0)2,
откуда с
очевидностью следует утверждение задачи. Если же n≥3, то 2 f ( n ) ( x0 ) 2 f ( x0 ) 1 2 ( x x0 ) +…+ ( x x0 ) n2 f(x)=f(x0)+ f(x0)(x-x0) 1 n! f ( x0 ) 2 3! f ( x0 )
Аналогично тому, как это сделано в 116, находится такое δ>0, что при всех х из интервала (х0-δ, x0+δ) выражение в квадратных скобках будет положительно. После этого утверждение задачи становится очевидным. Замечание. Может случиться, что точка x0єR такова, что не только f(x0)=0, но и f(x0)=0. Однако, в ряду чисел f(x0), f(x0),…, f(n)(x0) есть числа, отличные от нуля (мы предполагаем, что степень многочлена n≥2).
Например f(n)(x0)=n! a0 ≠0. Пусть f(x0)=f(x0)=…=f(k-1)(x0)=0, но f(k)(x0)≠0. Тогда, как и выше, легко доказать следующее (это предоставляется читателю): если к-нечетное число, то х0 не является точкой экстремума многочлена f; если к-четное и f(k)(x0)>0, то многочлен f имеет в точке х0 собственный минимум; если к-четное и f(k)(x0)<0, то многочлен f имеет в точке х0 собственный максимум. Пример нахождения точек экстремума. Пусть f-действительный многочлен 4-ой степени: f(x)=3x4-4x3+6x2-12x+1 (при всех xєR). Экстремум следует искать только в тех точках, где производная f обращается в нуль (такие точки называются стационарными). Имеем: f(x)=12(x3-x2+x-1)=12(x-1)(x2+1) Единственной стационарной точкой является точка х0=1. Так как
f(x)=12(3x2-2x+1), то f(x0)=f(1)=24>0 Следовательно, многочлен f имеет в точке х0=1 собственный минимум. При этом f(x0)=f(1)=-6. В этом частном случае легко доказать, что значение -6 вообще является наименьшим значением функции f: 3x4-4x3+6x2-12x+1=(2x4-4x3+2x2)+(x4-2x3+1)+(6x2-12x+6)-6=2x2(x-1)2+ +(x2-1)2+6(x-1)2-6≥-6. 118. Доказать, что производная произведения fg двух действительных многочленов f и g вычисляется (может быть вычислена) по формуле: (fg)'=fg+fg'. Указание. Легко доказать (как это сделано в упражнении 17), что если один и тот же многочлен φ двумя способами разложен по степеням х-х0 (х, х0-любые числа из R): φ(x)= a0 + a1 (x-x0)+…+ a n (x-x0)n и φ(x)=b0+b1(x-x0)+…+bm(x-x0)m ,
253
то m=n и при любом i=0, 1, 2, …, n ai =bi. Заметив это, обозначим u=fg и напишем разложения многочленов f, g и u по формуле Тейлора: f ( x0 ) f ( x0 ) f ( n ) ( x0 ) 2 ( x x0 ) + ( x x0 ) +…+ ( x x0 ) n , f(x)=f(x0)+ 1! 2! n! m g ( x0 ) g ( x0 ) g ( x0 ) ( x x ) ( x x0 ) 2 +…+ ( x x0 ) m , g(x)=g(x0)+ 0 + m! 1! 2! n m u ( x0 ) u ( x0 ) u ( x0 ) ( x x0 ) n m . ( x x ) ( x x0 ) 2 +…+ u(x)=u(x0)+ 0 + (n m)! 1! 2! При этом мы считаем, что, например, многочлен f-степени n, а многочлен g-степени m, так что многочлен u имеет степень n+m. Перемножая разложения многочленов f и g получим: u(x)=u(x0)+ ( fg f g )( x0 ) ( x x0 ) +…, где многоточием обозначены члены, + 1! содержащие (х-х0)2, (х-х0)3 и т.д.
Учитывая вышесказанное, можем написать: u'(x0)=(fg+fg')(x0),
откуда (так как х0-любая точка из R) u'=fg+fg', ч.т.д. Замечание. Из доказанного следует, что если f-действительный многочлен, то (f2)'=2ff, (f3)'=(f2f)'=(f2)'f+f2f=2fff+f2f=3f2f и т.д. Индукцией по числу nєN легко доказать, что (fn)'=nfn-1f (n≥2). Далее, пусть многочлен f делится на многочлен g, т.е. f=gφ, где φдействительный многочлен, Согласно доказанному, f=g'φ+gφ'. Если в какой-либо точке х0 g(x0)≠0, то f ( x0 ) f ( x0 ) g ( x0 ) g ( x0 ) f ( x0 ) g ( x0 ) ( x0 ) φ'(x0)= = g ( x0 ) g ( x0 ) f f ( x0 ) g ( x0 ) f ( x0 ) g ( x0 ) или, окончательно, (x0)= . g 2 ( x0 ) g
254
f Чтобы найти (x0), заметим, что f''=(g'φ)'+(gφ')'=g''φ+g'φ'+g'φ'+gφ'', g f ( x0 ) f ( x0 ) g ( x0 ) f ( x0 ) g ( x0 ) откуда f''(x0)=g''(x0) +2g'(x0) +g(x0)φ''(x0) g ( x0 ) g 2 ( x0 ) и f (x0)= g g 2 ( x0 ) f ( x0 ) g ( x0 ) f ( x0 ) g ( x0 ) 2 g ( x0 ) f ( x0 ) g ( x0 ) f ( x0 ) g ( x0 ) = = g 3 ( x0 ) g ( x0 )g ( x0 ) f ( x0 ) f ( x0 ) g ( x0 ) 2 g ( x0 )g ( x0 ) f ( x0 ) f ( x0 ) g ( x0 ) = . g 3 ( x0 ) f f ( gf fg )( x0 ) Заметим еще, что если (x0)=0, то (x0)= . g 2 ( x0 ) g g 119. Пусть f и g –два ненулевых действительных многочлена f степеней n и m соответственно, причем m≥1. Рассмотрим функцию , g f f ( x) определяемую равенством (x)= , на множестве G всех тех xєR, g ( x) g которые не являются корнями многочлена g. Так как многочлен g имеет не f более m корней, то область определения G функции представляет собой g либо бесконечный интервал (-, )=R, либо объединение двух или
255
нескольких интервалов (два из которых бесконечные, а остальныеf конечные). При расмотрении функции мы не предполагаем, что g многочлен f делится на многочлен g. Доказать, что если точка х0єG такова, что f(x0)g(x0)-f(x0)g'(x0)≠0
(т.е. (fg-fg')(x0)≠0), , то точка х0 не является точкой экстремума функции f . g f Если (f'g-fg')(x0)=0, но (f''g-fg'')(x0)≠0, то функция имеет в точке х0 g экстремум, а именно-собственный минимум при (f''g-fg'')(x0)>0 и собственный максимум при (f''g-fg'')(x0)<0. Указание. Разложим многочлены f и g по формуле Тейлоpа: f(x)= a0 + a1 (x-x0)+ a 2 (x-x0)2+…+ a n (x-x0)n, g(x)=b0+b1(x-x0)+b2(x-x0)2+…+bm(x-x0)m, 1 где a0 =f(x0), a1 =f'(x0), a 2 = f''(x0) и т.д. и 2 1 b0=g(x0), b1=g'(x0), b2= g''(x0) и т.д. 2 Ясно, что b0=g(x0)≠0. Величины f(x) и g(x) можно представить следующим образом: f(x)= a0 + a1 (x-x0)+ a 2 (x-x0)2+f1(x)(x-x0)3, b1 b2 g(x)=b0[1+ (x-x0)+ (x-x0)2+g1(x)(x-x0)3], где b0 b0 f1(x)= a3 + a 4 (x-x0)+…+ a n (x-x0)n-3, b3 b4 bm g1(x)= + (x-x0)+…+ (x-x0)m-3 (если n≤2, то считаем f1=θ; то же b0 b0 b0 самое-в отношении многочлена g1). Обозначим через р наибольшее из bj a чисел | i |, (i=0, 1, …, n; j=0, 1, ..., m). Для краткости обозначим также b0
bm b1 (x-x0)+…+ (x-x0)m. b0 b0 Переменную х будем считать изменяющейся в интервале (x0-δ, x0+δ), где положительное число δ выбрано следующим образом: δ меньше расстояния от точки х0 до ближайшего корня многочлена g и меньше числа 1 1 (так как p≥1, то δ< ). При хє(x0-δ, x0+δ) |ε(x)|≤pδ(1+δ+…+ 2 ð 1 3 ε(x)=
256
1 m 1 3 3 p 1 1 2 2 +δ )=pδ < < . Так как =1-ε+ε , то =1-ε+ε 1 2 1 1 1 1 3 b1 f ( x) 1 1 f ( x) ( x) = = f(x)[1-ε(x)+ε2(x)]= f(x)[1- (x-x0)b0 1 ( x) b0 g ( x) b0 (1 ( x)) b0 m-1
и
b2 b 21 b22 2 3 2 (x-x0) -g1(x)(x-x0) + 2 (x-x0) + 2 (x-x0)4+g21(x)(x-x0)6+ b0 b 0 b 0 2b1 2b2 2b1b2 3 ( õ) 3 4 5 + 2 (x-x0) + x xg1(x)(x-x0) + g1(x)(x-x0) (x-x0)3] , где b b 1 ( õ) b 0 0 0 bm b1 b2 φ(x)= + (x-x0)+…+ + (x-x0)m-1 b0 b0 b0 bm f ( x) 1 + (x-x0)m-1. Следовательно = [ a0 + a1 (x-x0)+ a 2 (x-x0)2+ b0 g ( x) b0 3 +f1(x)(x-x0) ]x b1 b 21 b2 b0 2b1b2 b22 2 3 x[1- (x-x0)+ (x-x0) +ψ(x)(x-x0) ], где ψ(x)= -g1(x)+[ 2 + b0 b20 b 0 b20 2b1 2b2 3 ( õ) 2 2 3 + g (x)](x-x0)+ g (x)(x-x0) +g 1(x)(x-x0) . b0 1 b0 1 1 ( õ) Так
|g1(x)|≤p(1+δ+..+δm-3)<
как
( õ) ( õ) 3 ( õ) = ≤ =2|φ(x)|3 1 ( õ) 1 ( õ) 12 3
ð <2p 1
и
3
<2(2p)3=16p3,
то
|ψ(x)|≤2p2+2p+5p2δ+4p2δ2+4p2δ3+16p3<5p2+2p+16p3≤23p3 (при всех хє(x0-δ, x0+δ)). a0 b1 f ( x) 1 Итак, = [ a0 + a1 (x-x0)+ a 2 (x-x0)2+f1(x)(x-x0)3(x-x0)b0 g ( x) b0
a1b1 a 2 b1 b1 a0 (b 21 b2b0 ) 2 3 4 (x-x0) (x-x0) - f1(x)(x-x0) + (x-x0)2+ b0 b0 b0 b20
b 21 b2b0 + (x-x0)3( a1 + a 2 (x-x0)+f1(x)(x-x0)2)+f(x)ψ(x)(x-x0)3] или 2 b 0 b0 (a2b0 b2 a0 ) b1 (a1b0 b1a0 ) f ( x) à 0 a1b0 b1à0 = + (x-x0)+ (x-x0)2+ 2 3 g ( x) b0 b 0 b0 3 +V(x)(x-x0) , где b 21 b2b0 1 a 2 b1 b1 V(x)= f1(x)- 2 - 2 f1(x)(x-x0)+ [ a1 + a 2 (x-x0)+ b0 b30 b 0 b 0 1 +f1(x)(x-x0)2]+ f(x)ψ(x), b0
257
54 ð 4 1 2 2 2 3 так что |V(x)| ≤ [2p+p +2p δ+(p +p)2p+2p23p ]≤ . | b0 | | b0 | После этого, как и в 116, доказывается,
что
если
a1 b0-b1 a0 =f(x0)g(x0)-g'(x0)f(x0)≠0, то точка х0 не является точкой f (при доказательстве в случае необходимости g придется перейти от интервала (x0-δ, x0+δ), к более узкому интервалу (x0-δ1, x0+δ1)). Затем, как и в 117, доказывается, что если a1 b0-b1 a0 =0, но b0 (a2b0 b2 a0 ) b1 (a1b0 b1a0 ) = b30 a2 b0 b2 a0 f ( x0 ) g ( x0 ) g ( x0 ) f ( x0 ) f = = ≠0, то функция имеет в точке 2 2 g ( x0 ) g b 0 х0 экстремум. f Пример. Найти точки экстремума функции , где f(x)=x2-3x+2, g 2 g(x)=x +2x+1. Так как многочлен g обращается в 0 только в точке х=-1, то функция f определена на множестве G=(-, -1)(-1, +). g Точки, подозрительные на экстремум, следует искать среди корней экстремума функции
многочлена fg-g'f. Имеем: f(x)=2x-3, g'(x)=2x+2, f(x)g(x)-g'(x)f(x)= =(2x-3)(х2+2x+1)-(2x+2)(x2-3x+2)=2x3+x2-4x-3-(2x3-4x2-2x+4)= =5x2-2x-7. Решая уравнение 5x2-2x-7=0 находим: x1=-1, x2=1,4. Так как f''(x)g(x)-g''(x)f(x)=2(x2+2x+1)-2(x2-3x+2)=10x-2,
то
f не g определена. Следовательно, эта функция имеет экстремум (а именно, собственный минимум) в единственной точке x2=1,4. 120. Пусть f–действительный многочлен степени n и в некоторой точке х0 f(x0)≠0. Доказать существование такого числа δ>0, что в интервале (x0-δ, x0+δ) многочлен сохраняет знак числа f(x0). Указание По формуле Тейлора f ( x0 ) 1 f ( n ) ( x0 ) ( x x0 ) n ] ( x x0 ) +…+ f(x)=f(x0)[1+ (*) n! f ( x0 ) f ( x0 ) Обозначим через р наибольшие из чисел (f''g-g''f)(x1)=-12<0, a (f''g-g''f)(x2)=12>0. Но в точке x1=-1 функция
258
f ( x0 ) 1 f ( x0 ) 1 f ( n ) ( x0 ) , , …, и выберем положительное число f ( x0 ) 2! f ( x0 ) n! f ( x0 ) δ так, чтобы δ<
1 Тогда при любом х из интервала (x0-δ, x0+δ) p 1
f ( x0 ) 1 f ( n ) ( x0 ) 1 n ( x x0 ) ... ( x x0 ) n ≤pδ(1+δ+…+δn-1)=pδ ≤ f ( x0 ) n! f ( x0 ) 1
p <1. 1 Поэтому выражение, стоящее внутри квадратных скобок в равенстве (*),-положительно, т.е. при любом хє(x0-δ, x0+δ) f(x) имеет знак числа f(x0). 121. Пусть f-действительный многочлен степени n≥1 и в некоторой ≤
точке x0 f(x0)≠0. Доказать существование такого числа δ>0, что в интервале (x0-δ,
x0+δ) функция f строго возрастает при f(x0)>0 и строго убывает-при f(x0)<0.
Указание Обозначим через р наибольшее из чисел
f ( x0 ) , f ( x0 )
1 f ( x0 ) 1 f ( n ) ( x0 ) , … , и выберем положительное число δ так, (n 1)! f ( x0 ) 2 f ( x0 )
1 . Пусть теперь х1 и х2-любые две точки из интервала (x0-δ, p 1 x0+δ) такие, что x2>x1. Применяя формулу Тейлора, находим: 1 1 f(x2)=f(x0)+f(x0)(x2-x0)+ f''(x0)(x2-x0)2+…+ f(n)(x0)(x2-x0)n, 2! n! 1 1 f(x1)=f(x0)+f(x0)(x1-x0)+ f''(x0)(x1-x0)2+…+ f(n)(x0)(x1-x0)n. 2! n! чтобы δ<
Вычитая второе из этих равенств из первого и пользуясь формулой a -b =(a-b)(am-1+am-2b+…+bm-1), придем к следующему равенству: m
m
f(x2)-f(x1)=f(x0)(x21 f ( x0 ) ( x2 x0 õ1 õ0 ) +…+ x1)[1+ 2 f ( x0 ) 1 f ( n ) ( x0 ) (( x2 x0 ) n1 ( x2 x0 ) n2 ( x1 x0 ) ... ( x2 x0 )( x1 x0 ) n2 ( x1 x0 ) n1 ) ]. n! f ( x0 )
259
1 f ( n ) ( x0 ) 1 f ( x0 ) (...) ≤pδ+pδ2+…+ ( x2 x0 õ1 õ0 ) +…+ При этом n! f ( x0 ) 2 f ( x0 ) 1 n1 +pδ =pδ <1. 1 Следовательно, n-1
при
f(x0)>0
будет
выполняться
неравенство
f(x2)-f(x1)>0, а при f(x0)<0 будет выполняться неравенство f(x2)-f(x1)<0. 122. Доказать, что если действительный многочлен f степени n≥1 в точках х1 и х2 (х1<х2) принимает значения разных знаков, то в интервале (х1, х2) имеется по крайней мере один корень многочлена f, т.е. такая точка ξ, что f(ξ)=0. Указание. Пусть для опеределенности f(x1)<0, a f(x2)>0. Согласно доказанному в 120, существуют такие числа x'>x1, что в промежутке [x1,x') f сохраняет отрицательный знак. Всякое такое число x' должно быть меньше х2 (предположение о том, что в промежутке [x1,x2) f сохраняет отрицательный знак, противоречит доказанному в 120, ибо f(x2)>0). Обозначим через Е множество всех действительных чисел x' с указанными свойствами. Множество Е ограничено сверху (числом х2). Следовательно, оно имеет точную верхнюю границу, которую обозначим через ξ (ξ≤x2). Для любого x'єE выполняется неравенство x'≤ξ. Допустим, что f(ξ)<0. Согласно доказанному в 120, найдется такое число δ>0, что в интервале (ξ-δ, ξ+δ) f сохраняет отрицательный знак. Так как ξ-δ не является верхней границей для Е, то найдется такое число x'єE, что ξ-δ<x'≤ξ. Функция f сохраняет отрицательный знак и в промежутке [x1,x') и в интервале (ξ-δ, ξ+δ). Следовательно f сохраняет отрицательный знак в промежутке [x1, ξ+δ), т.е. ξ+δєE. Но это абсурдно, ибо для любого x'єE x≤ξ<ξ+δ. Значит неравенство f(ξ)<0 не может иметь места. Аналогично доказывается, что и неравенство f(ξ)>0 не может иметь места. Следовательно, f(ξ)=0, ч.т.д. Замечание. Из доказанного следует, что если в каком-либо интервале (а,b) нет корней действительного многочлена f, то в этом интервале f сохраняет один и тот же знак. 123. Пусть f и g–действительные многочлены. Согласно доказанному в 118, (fg)'=fg+fg'. Пользуясь этой формулой, можем найти вторую и последующие производные многочлена fg: (fg)''=f''g+fg'+ fg'+fg''= f''g+2fg'+ fg'', (fg)'''=f'''g+f''g'+2(f''g'+fg'')+fg''+fg'''=f'''g+3f''g'+3fg''+fg''' и т.д. Доказать (методом математической индукции), что при любом nєN n
(fg)(n)=
C k 0
k
n
f ( n k ) g ( k ) , где под f(0) и g(0) понимаются сами
функции f и g соответственно.
260
Указание. Пусть для некоторого nєN утверждение задачи верно (при n=1 оно очевидным образом выполняется). Тогда
C f n
(fg)(n+1)=
k
+
C C
k
= +
(C
=
C
n
k 0 n
n
k 0 n
k 1 n1
k 0
g
(k )
f
( n k )
g
( k 1)
k 0
n
k
n
( nk 1)
( nk )
f
g
= C n
k 0
n
( k 1)
=
C
k
n
f
( n1k )
n1
g
(k )
k 0 n1
+
C
m1
n
m1
k
n
f ( n1k ) g ( k ) +
f ( n1m ) g ( m ) =
f ( n1k ) g ( k ) + C k 1n f ( n1k ) g ( k ) =Cn0f(n+1)g+Cnnfg(n+1)+ k 1
k n
k
Cn
n1
k 1
)f
( n1k )
n
g
(k )
=f
g+fg
(n+1)
(n+1)
+
C k 1
k
n1
f ( n1k ) g ( k ) =
f ( n1k ) g ( k ) .
Замечание. Доказанная формула носит название формулы Лейбница. 124. Доказать, что если число х0 является к-кратным корнем действительного многочлена f (к≥2), то это число является к-1-кратным корнем производной f. Указание. Если х0 есть к-кратный корень f, то при любом xєR f(x)= =(x-x0)kg(x), где g-действительный многочлен и g(x0)≠0. Можем написать: f=(f1-x0f0)kg, откуда (см. 118) f=k(f1-x0f0)k-1 (f1-x0f0)'g+(f1-x0f0)kg'. Следовательно, при любом хєR
f(x)=k(x-x0)k-1g(x)+ (x-x0)kg'(x)=(x-x0)k-1[kg(x)+(x-x0)g'(x)]. Так как (kg+(f1-х0f0)g')(x0)=kg(x0)≠0, то число х0 действительно
является к-1-кратным корнем многочлена f. Замечание. Точно также доказывается, что если х0 является простым
корнем многочлена f, то х0 не является корнем многочлена f. 125. Пусть f-действительный многочлен степени n≥1 и для всех точек х некоторого интервала (a,b) f(x)>0 (f(x)<0). Доказать, что в интервале (a,b) многочлен f строго возрастает (строго убывает). Указание. Пусть в интервале (a,b) f(x)>0, но в этом интервале функция f не является строго возрастающей. Тогда найдутся такие две точки х1 и х2 интервала (a,b), что x1<x2, но f(x2)≤f(x1). Cогласно доказанному в 121, существуют такие точки x', что x'>x1 и в промежутке [x1, x'] функция f строго возрастает. Ясно, что всякое такое число x' меньше числа x2. Обозначив через Е множество всех чисел x' с указанным свойством, можем заключить, что Е имеет точную верхнюю границу ξ≤x2. Для любого x'єE выполняются неравенства a<x1<x'≤ξ≤x2
261
Так как f(ξ)>0, то (согласно 121) найдется такое число δ>0, что в интервале (ξ-δ, ξ+δ) функция f строго возрастает. В промежутке (ξ-δ,ξ] найдется точка x0'єE (ибо ξ-наименьшая из верхних границ множества Е). Возьмем любую точку ~õ из интервала (ξ, ξ+δ). Функция f строго возрастает и в промежутке [x1, x0'], и в промежутке [x0, ~õ ]. Отсюда следует, как легко видеть, что f строго возрастает в промежутке [x1, ~õ ]. Выходит, что ~õ єE. Но это абсурдно, ибо ~õ >ξ. Полученное противоречие доказывает, что f строго возрастает в интервале (a,b). Пусть теперь f(x)<0 при любом xє(a,b) и требуется доказать, что многочлен f строго убывает в интервале (a,b). Для доказательства перейти к расмотрению функции- f и воспользоваться вышедоказанным. 126. Пусть f-действительный многочлен степени n, a,bєR, a0 при всех xє(a,b). Тогда (согласно 125) функция f строго возрастает в (a,b). Зафиксируем произвольные две точки x1 и x2 интервала (a,b): a<x1<x20). Обозначим через p 1 1 наибольшее из чисел |f(a)|, | f''(a)|,…, | f(n)(a)| и выберем положительное 2 n!
. Считая, что xє(a, a+δ) из формулы ð f ( n ) (a) f (a ) 2 Тейлора f(x)=f(a)+f(a)(x-a)+ (x-a) +…+ (x-a)n найдем: n! 2 ð (1 n ) ð 2 n |f(x)-f(a)|≤p(δ+δ +…δ )= ≤ <ε. Следовательно –ε
откуда f(a)0. Обозначим 1 1 через q наибольшее из чисел |f(b)|, | f''(b)|,…, | f(n)(b)| и выберем 2 n! положительное число δ1 так, чтобы δ1
1 Считая, что q 1
f ( n ) (b) xє(b-δ1,b), из формулы Тейлора f(x)=f(b)+f'(b)(x-b)+…+ (x-b)n n! найдем: |f(x)-f(b)|<ε1, –ε1f(x)-ε1>f(x2)-ε1. Таким образом, оказывается, что f(b)>f(a), а это противоречит условию задачи. Следовательно, допущение о том, что f(x) всюду в интервале (a,b) отлично от нуля, -неверно.
262
Замечание. Из доказанного следует, что между двумя корнями действительного многочлена всегда находится по крайней мере один корень его производной. Пример. Пусть f-действительный многочлен степени 2n: f(x)=(x2-1)n при всех xєR. Этот многочлен имеет два корня (-1 и 1) кратности n. Числа -1 и 1 являются корнями многочленов f, f'',…, f(n-1) и не являются корнями многочлена f(n). Согласно доказанному, многочлен f имеет по крайней мере три корня, многочлен f''-четыре и т.д. Многочлен f(n-1) имеет по крайней мере n+1 корней. Так как f(n-1)–многочлен n+1–ой степени, то он имеет ровно n+1 корней. Многочлен f(n) имеет ровно n корней. Найдем значения этого многочлена при х=±1. С этой целью представим f в виде f=φg, где φ(x)=(x+1)n, g(x)=(x-1)n (xєR). Применяя формулу Лейбница, находим: f(n)=Cn0φ(n)g+Cn1φ(n-1)g'+Cn2φ(n-2)g''+…+Cnnφg(n), откуда (n) (n) n (n) (n) n n f (1)=φ(1)g (1)=2 n!, a f (-1)=φ (-1)g(-1)=(-1) 2 n! Многочлен 1 Xn= n f(n) называется n–м полиномом Лежандра. Ясно, что Хn(1)=1, 2 n! Хn(-1)=(-1)n. Применяя нестрогую, но краткую запись, будем иметь: 1 Хn(x)= n Dn(x2-1)n. 2 n! 3x 2 1 Легко видеть, что Х1(х)=х, Х2(х)= и т.д. 2 Обычно в рассмотрение вводится также полином Х0: Х0(х)≡1. Убедимся, что любой полином Лежандра удовлетворяет уравнению (при всех хєR): (x2-1)Xn''(x)+2xXn'(x)-n(n+1)Xn(x)=0 Очевидно, что полиномы Х0 и Х1 удовлетворяют этому уравнению. Пусть n≥2. Найдем производную многочлена f: f(x)=(x2-1)n. Будем иметь: f(x)=2nx(x2-1)n-1, откуда (x2-1)f(x)=2nxf(x). Беря (n+1)-e производные от обеих частей последнего равенства, найдем:
Ñ nn11 2f(n)(x)+Cn+1n2xf(n+1)(x)+(x2-1)f(n+2)(x)=2n[Cn+1nf(n)(x)+xf(n+1)(x)]. 1 , получим: 2 n! n(n+1)Xn(x)+2(n+1)xX'n(x)+(x2-1)X''n(x)=2n(n+1)Xn(x)+2nxX'n(x) или (x2-1)X''n(x)+2xX'n(x)-n(n+1)Xn(x)=0, ч.т.д. Напомним, что n–ый полином Лежандра Хn имеет ровно n корней, лежащих между -1 и 1. 127. Доказать, что для любого действительного многочлена f и любого интервала ( a, b )R имеет место следующая формула Лагранжа: f( b )-f( a )=( b - a )f'(ξ), где ξ–некоторая точка интервала ( a, b ). Умножая это равенство почленно на
n
263
Указание. Рассмотрим действительный многочлен F, определяемый f (b) f (a) ( x a) . Ясно, что F( a )=F( b )=0. равенством F(x)=f(x)-f( a )ba Согласно доказанному в 126, найдется такая точка ξє( a, b ), что F'(ξ)=0, т.е. f (b) f (a) f(ξ)=0. Отсюда с очевидностью вытекает формула Лагранжа. ba 128. Доказать, что полиномы Лежандра Х0, Х1, …, Хn,… составляют базис векторного пространства всех действительных многочленов (над полем R). Указание. Индукцией по числу n легко убедиться в том, что каждый действительный многочлен fn, для которого при всех хєR fn(x)=xn,–является линейной комбинацией полиномов Лежандра Xn, Xn-1,…, X0. 129. Пусть х0-корень действительного многочлена f степени n≥1. Доказать существование такого положительного числа δ, что в интервале (x0, x0+δ) функции f и f имеют одинаковый знак, а в интервале (x0-δ, x0) эти функции имеют противоположные знаки. Указание. Выберем число δ>0 настолько малым, чтобы в интервале (x0-δ, x0+δ) не содержалось корней многочленов f и f кроме х0 (если х0кратный корень f, то х0 является также корнем многочлена f). Тогда в
интервалах (x0-δ, x0) и (x0, x0+δ) каждая из функций f, f сохраняет определенный знак (см. замечание к упражнению 122). Если xє(x0, x0+δ),
то по формуле Лагранжа f(x)-f(x0)=(x-x0)f(ξ), т.е. f(x)=(x-x0)f(ξ), где ξє(x0, x)(x0, x0+δ). Следовательно, в интервале (x0, x0+δ)
функции f и f имеют
одинаковые знаки. Если же xє(x0-δ, x0) , то f(x0)-f(x)=f(η)(x0-x) или f(x)= =-f(η)(x0-x), где ηє(x,x0)(x0-δ, x0). Это и доказывает, что в интервале
(x0-
δ, x0) функции f и f имеют противоположные знаки. 130. Пусть х0-к-кратный корень (к≥2) действительного многочлена f степени n≥2. Доказать существование такого положительного числа δ, что в интервале (x0, x0+δ) функции f и f(k) имеют одинаковые знаки, а в интервале (x0-δ, x0) эти функции имеют либо одинаковые знаки-при четном к, либо противоположные знаки-при нечетном к.
Указание. Число х0 является корнем многочленов f, f,.., f(k-1). Выберем число δ>0 настолько малым, чтобы в интервале (x0-δ, x0+δ) не содержалось корней многочленов f, f,.., f(k-1), f(k), кроме х0. Тогда в
интервалах (x0-δ, x0) и (x0, x0+δ) каждая из функций f, f,.., f(k-1), f(k) сохраняет определенный знак. Согласно доказанному в 129, в интервале (x0, x0+δ)
функция f имеет одинаковый знак с f, функция f'' имеет
одинаковый знак с f и т.д. Следовательно, в интервале (x0, x0+δ) функция
264
f(k) имеет одинаковый знак с f. В интервале (x0-δ, x0) функция f имеет знак, противоположный знаку f. В этом же интервале функция f'' имеет знак, противоположный знаку f. Следовательно, в интервале (x0-δ, x0) функция f'' имеет одинаковый знак с f. Продолжая указанные рассуждения, убедимся, что при четном к производная f(k) в интервале (x0-δ, x0) имеет одинаковый знак с f. При нечетном же k производная f(k) в интервале (x0-δ, x0) имеет знак, противоположный знаку f. 131. Доказать, что если на концах какого-либо интервала (a,b) действительный многочлен f принимает значения разных знаков (f(a)f(b)<0), то в этом интервале f имеет нечетное число корней; если же числа f(a) и f(b) –одного знака (f(a)f(b)>0), то в интервале (a,b) либо нет корней многочлена f, либо их-четное число. В обоих случаях каждый корень считается столько раз, какова его кратность. Указание. Если f(a)f(b)<0, то в интервале (a,b) имеется, по крайней мере один корень многочлена f (см. 122). Пусть ξ1, ξ2, …, ξv–все попарно различные корни многочлена f, расположенные в интервале (a,b) и пусть кратность этих корней равна соответственнно к1, к2, …, кν. Тогда при всех xєR f(x)= ( x 1 ) 1 ( x 2 ) 2 ...( x ) g ( x) , где g–действительный многочлен, не имеющий корней в интервале (a,b) (и потому g(a)g(b)>0) Из k
k
k
ê ê ... ê
равенства f(a)f(b)= (1) 1 2 (ξ1-a)(ξ2-a)…(ξν-a)(b-ξ1)(b-ξ2)…(b-ξν)g(a)g(b) заключаем, что к1+к2+…+кν-нечетное число, т.е. многочлен f имеет (при f(a)f(b)<0) в интервале (a,b) нечетное число корней. Если f(a)f(b)>0, то многочлен f может и не иметь корней в интервале (a,b) (может даже вовсе не иметь корней). Если же они есть в (a,b), то из вышеприведенного равенства для f(a)f(b) следует, что их количество к1+к2+…+кν–четное число. Замечание. Пусть f-действительный многочлен степени n≥1: f(x)= = a0 xn+ a1 xn-1+…+ a n ( a0 ≠0). Записав f(x) в виде
f(x)= a0 xn(1+ чисел
a a1 a 2 2 ... n n ) и обозначив наибольшее из a0 x a0 x a0 x
a a1 a2 , ,..., n через р, можем заключить (как это неоднократно a0 a0 a0
делалось
ранее),
что
при
|x|>p+1
выполняется
неравенство
a a1 a 2 2 ... n n <1. Следовательно, при |x|>p+1 f(x) имеет знак a0 x a0 x a0 x совего старшего члена a0 xn. Если n–нечетное число, то многочлен f на концах интервала (-р-2, р+2) принимает значения разных знаков и не имеет корней вне этого
265
интервала. Итак, согласно вышедоказанному, действительный многочлен нечетной степени имеет нечетное число корней и все они принадлежат интервалу (-р-2, р+2). Если числа a n и a0 одного знака, то можно утверждать, что f имеет отрицательный корень, ибо числа f(-р-2) и f(0)= a n имеют разные знаки. Если же числа a n и a0 –разных знаков, то можно утверждать, что f имеет положительный корень. Пусть теперь n–четное число и числа a n и a0 –разных знаков. В этом случае можно утверждать, что f имеет по крайней мере один положительный корень и по крайней мере один отрицательный корень, ибо f принимает значения разных знаков и на концах интервала (-р-2,0) и на концах интервала (0, р+2). 132. Доказать, что между двумя последовательными корнями действительного многочлена f заключается нечетное число корней производной f. Указание. Пусть х1 и х2 последовательные корни f (х1<х2). Тогда в интервале (х1, х2) нет корней многочлена f и потому в этом интервале f сохраняет определенный знак. Найдем число δ>0 так, чтобы в интервалах (x1, x1+δ) и (x2-δ, x2) не было корней производной f. Кроме того, õ2 õ1 потребуем, чтобы выполнялось неравенство x1+δ<x2-δ, т.е. δ< . 2 Согласно доказанному в 129, в интервале (x1, x1+δ) f имеет одинаковый
знак с f, а в интервале (x2-δ, x2) f имеет знак, противоположный знаку f. Выберем числа x1'є(x1, x1+δ) и x2'є(x2-δ, x2). Так как числа f(x1') и f(x2') – разных знаков, то (согласно 131) в интервале (x1', x2')–а потому и в
интервале (х1, х2)-заключается нечетное число корней функции f. 133. Пусть f и g–действительные многочлены степеней n и m соответственно, причем n≥m. Доказать существование таких многочленов q и r, что f=gq+r и действительный многочлен r есть либо нуль-многочлен θ, либо имеет степень, меньшую степени m многочлена g. Указание. Доказательство провести индукцией по числу n. Если n=m=0 и f(x)≡ a0 ≠0, g(x)≡b0≠0, то в качестве q следyет выбрать многочлен нулевой степени, для которого q(x)≡
a0 . Выбрав также r=θ, будем иметь: b0
f=gq+r. Если n=1 и f(x)≡ a0 x+ a1 ( a0 ≠0), то следует различать два случая 1) m=1 и g(x)≡b0x+b1 (b0≠0). В этом случае в качестве q следует
a0 выбрать многочлен нулевой степени q(x)≡ . Если при b0
266
a0 b1 =0, то в качестве r выбираем нуль-многочлен; b0 a0 b1 если же a1 ≠0, то в качестве r выбираем многочлен b0 a0 b1 нулевой степени: r(x)≡ a1 . b0 этом a1 -
2)
m=0 и g(x)≡b0≠0. В этом случае в качестве q следует выбрать многочлен первой степени q(x)=
a0 a1 x+ , а в b0 b0
качестве r–нуль-многочлен θ. Пусть утверждение задачи верно для любого действительного многочлена f степени ≤n и любого действительного многочлена g степени m, не превосходящей степени многочлена f. Убедимся, что утверждение задачи остается справедливым для любого многочлена f степени n+1 и любого многочлена g степени m≤n+1. Пусть при всех xєR f(x)= a0 xn+1+…+ an1 , g(x)=b0xm+…+bm, q1(x)≡
где a0 , b0≠0. Введем в рассмотрение многочлен q1:
a 0 n+1-m x . Ясно, что многочлен φ=f-gq1 есть либо нуль-многочлен θ, b0
либо ненулевой многочлен степени n1≤n. В первом случае f=gq1+θ и утверждение задачи верно для f и g. Рассмотрим второй случай. Если n1<m, то f=gq1+φ и утверждение задачи верно для f и g. Если же n1≥m, то согласно предположению индукции φ=gq2+r, где q2–действительный многочлен, а r–либо нуль-многочлен θ, либо ненулевой многочлен степени, меньшей, чем m. Тогда f=gq1+(gq2+r)=g(q1+q2)+r и утверждение задачи справедливо для многочленов f и g. Замечание. Легко доказать единственность представления f=gq+r, где r есть либо θ, либо имеет степень, меньшую степени m многочлена g. В самом деле, пусть gq1+r1=gq2+r2, где r1 и r2 подчиняются указанному ограничению. Тогда g(q1-q2)=r2-r1. Если r2≠r1, то и q2≠q1 и получается, что многочлен g(q1-q2) степени ≥m равен многочлену r2-r1 степени <m. Так как это абсурдно, то r2=r1, а тогда и q2=q1 Заметим еще, что если в представлении f=gq+r r=θ, то говорят, что многочлен f делится на многочлен g или что g является делителем многочлена f. Если g–делитель f, то при любом α≠0 многочлен αg является делителем многочлена f. Если многочлен φ является делителем и многочлена f, и многочлена g, то φ называется общим делителем многочленов f и g. Общий делитель φ многочленов f и g называется наибольшим общим делителем f и g, если φ делится на любой общий делитель многочленов f и g. Пусть φ и ψненулевые многочлены, каждый из которых является наибольшим общим делителем многочленов f и g. Тогда φ=ψq и ψ=φq1, где q и q1-некоторые ненулевые многочлены. Следовательно, φ=φ(qq1), откуда можем
267
заключить, что qq1–многочлен нулевой степени. Поэтому и каждый из многочленов q, q1-нулевой степени, т.е. q(х)≡α, q1(х)≡
1 при некотором
1
α≠0 (αєR). Отсюда следует, что φ=αψ, ψ= φ. Итак, мы видим, что общий наибольший делитель двух многочленов определяется с точностью до произвольного отличного отнуля множителя. Всякий многочлен нулевой степени является общим делителем любых двух многочленов f и g. Если f и g не имеют других общих делителей (степени ≥1), то говорят, что многочлены f и g–взаимно просты. Через D (f, g) будем обозначать тот из наибольших общих делителей многочленов f и g, который имеет своим старшим коэффициентом единицу. Если f и g взаимно просты, то D (f, g)=f0 (f0(x)≡1). Если f не делится на g (предполагается, что степень n многочлена f ≥ степени m многочлена g), то, согласно вышедоказанному f=gq+r, где многочлены q и r определяются единственным образом и многочлен r имеет степень, меньшую степени m многочлена g. При этом многочлен q называется неполным частным от деления f на g, а многочлен r называется остатком от деления f на g. 134. Пусть f на g–действительные многочлены степеней n и m соответственно, причем n≥m. Вопрос о нахождении общего наибольшего делителя многочленов f и g решается с помощью следующего процесса последовательных делений, называемого алгоритмом Эвклида. Делим f на g. Если g оказывается делителем f, то g и является общим наибольшим делителем многочленов f и g и алгоритм Эвклида заканчивается. В противном случае, мы получаем равенство f=gq+r, где r≠θ и r имеет степень, меньшую числа m. Легко видеть, что всякий общий делитель многочленов f и g является общим делителем многочленов g и r и наоборот. Далее, делим g на r, получая в остатке r1; затем, при необходимости, делим r на r1, получая в остатке r2 и т.д. В результате получим цепочку равенств: f gq r , g rq r , 1 1 r r1 q 2 r2 , (*) ................. rk 1 rk q k rk 1 , rk rk 1 q k 1 . Алгоритм Эвклида заканчивается, когда на некотором шагу деление осуществляется без остатка. Это обязательно должно случиться, так как степень многочлена r1 по крайней мере на единицу меньше степени многочлена r; степень многочлена r2 по крайней мере на единицу меньше степени многочлена r1 и т.д. Переходя от первого равенства цепочки (*) ко второму, третьему и т.д., заключаем, что всякий общий делитель
268
многочленов f и g является делителем многочлена rk+1. Затем, переходя последовательно от последнего равенства цепочки (*) к первому, заключаем, что многочлен rk+1 является делителем многочленов rk, rk-1, …, r2, r1, r, g, f. Следовательно, многочлен rk+1, т.е. последний, не равный θ остаток в алгоритме Эвклида, является наибольшим общим делителем многочленов g и f. Доказать, что общий наибольший делитель d многочленов f и g может быть представлен в виде: d=Xf+Yg, где X и Y-некоторые многочлены (один из которых может равняться θ). Указание. Если d=αg при нектором α≠0, то возможность указанного представления очевидна. Если g не является делителем f, то следует заметить, что каждый из остатков r, r1,…, rk+1 в цепочке равенств (*) допускает указанное представление. Например, r=f0f+(-q)g (f0(x)≡1) r1= =g+(-q1)r=g+(-q1)[f+(-q)g]=(-q1)f+(q1q+f0)g и т.д. Замечание. Если, в частности, многочлены f и g взаимно просты, то существуют такие многочлены X и Y, что Xf+Yg=f0 или X(x)f(x)+Y(x)g(x)=1 при всех xєR. 135. Доказать, что если произведение fg двух многочленов f и g делится на многочлен φ, который взаимно прост с g, то многочлен f делится на φ. Указание. Найдя такие многочлены X и Y, что Xg+Yφ=f0 , будем иметь: f=X(fg)+(fY)φ. 136. Пусть действительные многочлены f, g, h-попарно взаимно просты, причем каждый из многочленов f, g имеет степнь ≥1, а многочлен h-более низкой степени, чем многочлен fg. Доказать существование таких ненулевых многочленов f1 и g1, имеющих степени более низкие, чем f и g соответственно, что h=fg1+gf1. Указание. Найти такие многочлены X и Y, что Xf+Yg=f0 (f0(x)≡1). Тогда h=(Xh)f+(Yh)g. Для Xh на g, а Yh на f будем иметь: Xh=qg+g1, ~ Yh= q f+f1 (заметим, что ни один из многочленов Х, У не может равняться θ). Если многочлен Хh-более низкой степени, чем g, то за g1 принимаем Xh. Если Yh более низкой степени, чем f, то за f1 принимаем Yh. В любом случае g1 есть либо θ, либо имеет степень, более низкую, чем g. Аналогичное можно сказать об f1. Но ни g1, ни f1 не могут равняться θ, ибо в противном случае многочлен h либо делится на g, либо делится на f. Поэтому g1 и f1–ненулевые многочлены более низких степеней, чем g и f соответствнно. Подставляя в равенство h=(Xh)f+(Yh)g выражения для Xh и Yh, получим: ~ h=fg1+gf1+(q+ q )fg ~ Если q+ q ≠θ, то многочлен h окажется имеющим степень, не меньшую, чем многочлен fg. Так как это противоречит условию задачи, то ~ q+ q =θ и h=fg1+gf1.
269
Замечание. Если действительные многочлены f и g степени которых ≥1,-взаимно просты, то из доказанного следует существование таких ненулeвых многочленов f1 и g1 степеней более низких, чем f и g соответственно, что f0=fg1+gf1 ((f0(x)≡1) 137. Пусть d–общий наибольший делитель двух действительных многочленов f и g . Из представления d=Xf+Yg (где Х и У-многочлены) следует, что всякий общий корень многочленов f и g является корнем их общего наибольшего делителя d. Ясно, что верно и обратное: всякий корень многочлена d является общим корнем многочленов f и g. Необходимым условием существования общего корня двух действительных многочленов является следующее: их общий наибольший делитель должен иметь степень, не ниже первой. Правда, это условие не является достаточным, ибо действительный многочлен степени к≥2 может и не иметь корней. Доказать следующее: два действительных многочлена f и g, степени которых не меньше единицы, тогда и только тогда имеют общего делителя степени не ниже первой, когда существуют ненулевые многочлены f1 и g1 степеней более низких, чем f и g соответственно, для которых fg1-gf1=θ. Указание. Пусть d–общий делитель многочленов f и g и d имеет степень ≥1. Тогда f=f1d, g=g1d и (fg1-gf1)d=θ. Отсюда следует, что fg1-gf1=θ. При этом f1 и g1–ненулевые многочлены степеней более низких, чем f и g соответственно. Обратно, пусть существуют ненулевые многочлены f1 и g1 с указанными свойствами и требуется доказать, что общий наибольший делитель d многочленов f и g имеет степень ≥1. Обозначим через d1 общий наибольший делитель многочленов f1 и g1. Тогда f1=φd1, g1=ψd1, где ненулевые многочлены φ и ψ взаимно просты. При этом fg1-gf1=(fψgφ)d1=θ, откуда fψ=gφ и мы можем заключить, что f делится на φ, а g
делится на ψ:f=φ f , g=ψ g ( f и g -некоторые ненулевые многочлены).
Имеем: θ=fψ-gφ=φψ( f - g ), откуда f - g =θ и f = g . Мы видим, что
действительный многочлен f является общим делителем многочленов f и
g. Если бы многочлен f оказался нулевой степени, то многочлен φ имел бы степень, одинаковую с многочленом f. Но тогда действительный многочлен f1=φd1 имел бы степень, большую или равную степени многочлена f. Так как это противоречит допущению о многочленах f1 и g1,
то общий делитель f многочленов f и g имеет степень ≥1. Поскольку d f делится на , то и d имеет степень ≥1.
138. Доказать следующее следствие из доказанного в 137: для того, чтобы действительные многочлены a0 xn+ a1 xn-1+…+ an1 x+ a n ( a0 ≠0, n≥1) и b0xm+b1xm-1+…+bm-1x+bm (b0≠0, m≥1) не являлись взаимно простыми (т.е. имели общего делителя степени не ниже первой), необходимо и достаточно обращение в 0 определителя m+n–го порядка
270
à0 à1 ...àn m строк
0 a0 ...an1 an ...0 ............................ 0 0...................an b0 b1 ...bm
Δ= n строк
0...0
0...0
0 b0 ....bm1 bm ...0 ............................. 0 0.....................bm
Указание. Согласно доказанному в 137, необходимым и достаточным условием существования у данных многочленов общего делителя степени не ниже первой, является существование двух ненулевых многочленов f1 и g1 таких, что f1(x)=α0xn-1+α1xn-2+…+αn-1, g1(x)=β0xm-1+β1xm-2+…+βm-1 и fg1=gf1 (одно из чисел α0, β0 или оба могут оказаться нулями). Сравнивая коэффициенты при одинаковых степенях х у многочленов fg1 и gf1, получим систему уравнений:
a 0 0 b0 0 0 a a b b 0 0 1 1 0 0 1 1 0 a 2 0 a1 1 a 0 2 b2 0 b1 1 b0 2 0 .................................................................... a n 0 a n 1 1 ... a n m 1 m 1 b1 n 1 ... bm n m 0 0 0 a n 1 ... a n m 2 m 1 b2 n 1 ... bm n m 1 0 ....................................................................................... 0 0 ... a b 0 0 1 n m 1 m n 1
Это- система n+m линейных однородных уравнений с n+m неизвестными β0, β1, …, βm-1, α0, α1, …, αn-1. Эту систему можно записать так (в предположении, что n≥m):
271
a0 0 0 1 ... 0 m1 b0 ( 0 ) 0 (1 ) ... 0 ( n1 ) 0 a a ... 0 b ( ) b ( ) ... 0 ( ) 0 0 1 m 1 1 0 0 1 n 1 1 0 a2 0 a11 ... 0 m1 b2 ( 0 ) b1 (1 ) ... 0 ( n1 ) 0 ......................................................................................................... an 0 an11 ... anm1 m1 0 ( 0 ) .............. b1 ( n1 ) 0 0 a ... a 0 n 1 n m 2 m 1 0 ( 0 ) ...................b2 ( n 1 ) 0 .......................................................................................................... .......................................................................................................... 0 0 0 1 ... an m1 0 ( 0 ) ................... bm ( n1 ) 0 Для того, чтобы эта система имела ненулевое решение относительно неизвестных βi и -αj необходимо и достаточно обращение в 0 определителя системы. Но обращение в 0 этого определителя равносильно обращению в 0 определителя транспонированной матрицы системы, который совпадает с Δ. 139.Выше уже отмечалось (см. 2.166, а также упр. 115), что поле действительных чисел не является алгебраически замкнутым. Это означает, что не всякий действительный многочлен степени n≥1 имеет корень. Равносильное утверждение: не всякое отображение f:R→R, где f– действительный многочлен степени n≥1, является сюръективным. Как мы докажем позднее, поле комплексных чисел (в отличие от поля действительных чисел) алгебраически замкнуто, т.е. любой многочлен f:C→C степени n≥1 с комплексными (в частности, действительными) коэффициентами имеет в множестве С по крайней мере один корень (который множет оказаться и действительным). Отсюда сразу же следует (см. упр. 19), что всякий многочлен f:C→C степени n≥1 может быть kp k k представлен в виде (при всеx zєС): f(z)= a0 ( z z1 ) 1 ( z z 2 ) 2 ...( z z p ) , где a0 -старший коэффициент многочлена f, а z1, z2,…, zp (1≤p≤n)-попарно различные корни многочлена f, причем к1+к2+…+кр=n (к1≥1, к2≥1,…,кр≥1, кiєN). Ясно, что если р=n, то к1=к2=…=кn=1, т.е. f(z)= a0 (z-z1)(z-z2)…(z-zn) и многочлен f имеет ровно n попарно различных однократных корней. Если же p
272
кратности k≥1. Согласно следствию из 2.183, число z 0 =p-qi также является корнем многочлена f. Поэтому при всех zєC f(z)=(z-p-qi)(z-p+qi)g(z), где g– многочлен, являющийся частным от деления многочлена f на квадратный трехчлен φ, для которого при всех zєC φ(z)=(z-p)2-(qi)2, т.е. φ(z)= =z2-2pz+p2+q2. Так как коэффициенты многочленов f и φ действительны, то, как легко видеть, многочлен g также имеет действительные коэффициенты. Если кратность к корня z0 многочлена f равна 1, то и корень z 0 многочлена f имеет кратность 1. В самом деле, в противном случае число z 0 должно быть корнем многочлена g, а тогда (согласно только что доказанному), число z0= z 0 также должно быть корнем многочлена g. Следовательно z0, должно быть по меньшей мере двукратным корнем многочлена f, что противоречит равенству к=1. Итак, при к=1 f(z)=(z2-2pz+p2+q2) g(z), где многочлен g с действительными коэффициентами не обращается в о ни при z=z0, ни при z= z 0 . Если же к>1, то число z0 должно быть корнем многочлена g, а тогда и число z 0 должно быть корнем многочлена g. Рассуждая аналогично вышеизложенному, получим: f(z)=(z2-2pz+p2+q2)2 g1(z), где g1 есть многочлен с действительными коэффициентами. При к=2 многочлен g1 не обращается в 0 ни при z=z0, ни при z= z 0 . При к>2, продолжая вышеуказанные рассуждения, получим (при всех zєС): f(z)=(z2-2pz+p2+q2)kψ(z), где многочлен ψ степени n-2к имеет действительные коэффициенты и не обращается в 0 ни при z=z0, ни при z= z 0 . Ясно, что указанное представление f(z) справедливо и при к=1, и при к=2. Если многочлен f:С→С с действительными коэффициентами степени n>1 не имеет действительных корней (это возможно только при четном n), то он имеет одну или несколько пар взаимно сопряженных (комплексных корней той или иной кратности и при всех zєС имеет место тождество: k k 2 2 a0 -старший f(z)= a0 ( z 1 z 1 ) 1 .....( z m z m ) m . Здесь коэффициент многочлена f, а кратности к1,…, кm удовлетворяют равенству: 2(к1+…+кm)=n. Квадратныe трехчлены z2+α1z+β1,…, z2+αmz+βm имеют действительные коэффициенты и отрицательные дискриминанты. В общем случае многочлен f:С→С с действительными коэффициентами степени n>1 может иметь один или несколько попарно различных действительных корней той или иной кратности и одну или несколько пар взаимно сопряженных комплексных корней той или иной кратности. При этом для всех zєC имеет место тождество: f(z)= a0 ( z z1 ) 1 ...( z z ) ( z 1 z 1 ) ...( z m z m ) . В этом тождестве z1,…, zμ–действительные корни многочлена f, а все комплексные корни многочлена f являются корнями квадратных трехчленов z2+α1z+β1,…,z2+αmz+βm с действительными коэффициентами и k
k
2
k 1
2
k m
273
отрицательными дискриминантами. Крaтности кi действительных и комплексных корней многочлена f удовлетворяют равенству к1+…+кμ+ +2(кμ+1+…+кμ+m)=n Указанное тождество справедливо для любого многочлена f:С→С с действительными коэффициентами степени n≥1, если допустить, что некоторые из кратностей кi могут быть не только натуральными числами, но и нулями. Так, например, если к 1=…=кμ=0, то многочлен f не имеет действительных корней, если же кμ+1=…=кμ+m=0, то f имеет только действительные корни; при к2=…=кμ+m=0 заключаем, что к1=n и что f имеет единственный (действительный) корень z1 кратности n. Заметим, что каждый действительный многочлен может рассматриваться как сужение на множество R многочлена f:С→С той же степени и с теми же коэффициентами, что и у данного действительного многочлена. Поэтому для многочлена f:С→С с действительными коэффициентами в отношении его «поведения» при действительных значениях аргумента справедливо все то, что доказано выше для действительных многочленов. Если многочлен f:С→С имеет кратные корни, то решение уравнения f(z)=0 можно свести к решению одного или нескольких уравнений φ1(z)=0, φ2(z)=0,…, где многочлены φ1, φ2,… ( с действительными коэффициентами, как и f ) имеют только простые корни. При любом zєC через φ1(z) обозначим произведение множителей z-α, соответствующих простым корням многочлена f (если таковых нет, то полагаем φ1(z)≡1). Далее, через φ2(z) обозначим произведение таких же множителей, соответствующих двойным корням многочлена f и т.д. Тогда f=φ1φ22…φkk, где через к обозначена наивысшая кратность корней многочлена f (мы считаем для упрощения записей, что старший коэффициент а0 многочлена f равен 1). Введем следующие обозначения: D1=D(f,f), D2=D(D1, D'1) и т.д. Заметим, что все многочлены φ1, φ2,…,φk имеют действительные коэффициенты, так как каждому комлексному корню многочлена f определенной кратности соответствует сопряженный корень этого многочлена той же кратности. Доказать, что D1=φ2φ32…φkk-1, D2=φ3…φkk-2,…, Dk-1=φk, Dk=f0 (т.е. Dk(z)≡1). Вывести отсюда, что
D D f =φ1φ2…φk, 1 =φ2φ3…φk, …, k 1 =φk, Dk D1 D2
и, следовательно, φ1=
D D D D D f D1 : , φ2= 1 : 2 , …, φk-1= ê 2 : ê 1 , φk= ê 1 . Dê D1 D2 D 2 D3 Dê 1 Dê
Применив
доказанное
к
многочлену
f(z)=z6+3z5-6z3-3z2+3z+2,
убедиться, что D1=D(f,f) имеет вид: D1(z)=z3+z2-z-1. Точно также убедиться, что D2(z)=z+1, D3(z)=1 (при всех zєC). Следовательно, к=3 и φ3(z)=z+1.
274
z 2z z 2 D ( z) f ( z) Так как =z3+2z2-z-2 и 1 =z2-1, то φ1(z)= =z+2, z 2 1 D2 ( z ) D1 ( z ) 3
2
z 2 1 а φ2(z)= =z-1. Таким образом при всех zєC z 1 z6+3z5-6z3-3z2+3z+2=(z+2)(z-1)2(z+1)3. 140. Пусть f:С→С есть многочлен с действительными коэффициентами. Поставим вопрос о числе действительных корней этого многочлена в произвольном интервале (а,b). Согласно 139, мы можем ограничиться случаем, когда f не имеет кратных корней. В этом случае многочлены f и f взаимно просты. Для решения указанного вопроса образуем т.н. функции Штурма. Обозначим f=f1, разделим f на f1 и обозначим через f2 остаток от деления, взятый с обратным знаком: f=f1φ1-f2 Затем делим f1 на f2 и обозначаем через f3 отстаток от деления, взятый с обратным знаком: f1=f2φ2-f3. Продолжая этот процесс, получим ряд функций (ряд Штурма) f, f1, f2, f3, …, fk, последняя из которых представляет собой общий наибольший делитель многочленов f и f, тождественно равный постоянной, отличной от нуля. Эти функции f, f1,…, fk и называются функциями Штурма. Будем считать, что на границах интервала (a,b) ни одна из функций Штурма не обращается в нуль. Обозначим через х1, х2, х3, …,xm все попарно различные корни функций Штурма (расположенные в порядке возрастания), принадлежащие интервалу (a,b) В полуинтервале [a, x1) все функции Штурма сохраняют свой знак и это же справедливо по отношению к интервалам (х1,х2), …, (хm-1, хm), а x a
b
также по отношению к полуинтервалу (xm,b]. Пусть х-произвольная точка отрезка [a,b], отличная от корней хi функций Штурма. Через Р(х) обозначим число перемен знака в ряду чисел f(x), f1(x), f2(x),…, fk(x). Выберем по произволу точки c1, c2,…, cm-1 так, чтобы с1є(х1,х2), с2є(х2,х3),…, сm-1є(хm-1,хm). Тогда ясно, что Р(а)=Р(х) для любой точки хє[a, x1), Р(с1)=Р(у) для любой точки ує(х1,х2) и аналогичные равенства справедливы для c2,…, cm-1 . Наконец, P(b)=P(ξ) для любой точки ξє(xm,b]. Легко убедиться в том, что две рядом стоящие функции Штурма (в ряду Штурма) не могут обратиться в 0 при одном и том же значении аргумента: предположение о противном приводит к заключению о том, что
275
f и f имеют общий корень, а это невозможно, ибо f не имеет кратных корней. Далее, из равенств, определяющих функции Штурма (и из только что доказанного), следует, что если какая-либо из «промежуточных» функций Штурма fi (1≤i
276
Теперь читателю предлагается доказать, что если значение х1 является корнем многочлена f, то Р(с1)=Р(а)-1. Этот факт выражают следующим образом: при переходе аргумента через значение х1, являющееся корнем многочлена f, число перемен знака в ряду Штурма уменьшается на 1. Указание. Пусть f(x1)=0, а fi(x1)≠0 при i>1. f1(x1) также отлично от нуля, так как f не имеет кратных корней. Тогда знаки чисел fi(a) и fi(c1) одинаковы при всех i≥1. Учитывая результат упражнения 129, заключаем, что возможны 2 случая: 1) f f1 f2 … 1) f f1 f2 … - + (a) + (a) + + (c1) - (c1) Как видим, в обоих случаях Р(с1)=Р(а)-1. К такому же выводу мы придем, если в точке х1 обращаются в 0 (кроме многочлена f) одна или несколько функций Штурма. Расмотрим для примера случай, когда f(x1)=0, f4(x1)=0, а остальные функции Штурма не обращаются в 0 в точке х1. Возможны четыре варианта: 1) f f1 - + + + 2) f f1 - + + + 3) f f1 + - 4) f f1 + - -
f2 f3 + + f2 f3 f2 f3 + + f2 f3 -
f4 f5 … - (a) - (c1) f4 f5 … + (a) + (c1) f4 f5 … - (a) - (c1) f4 f5 … + (a) + (c1)
Учитывая, что знаки чисел f2(a) и f2(c1) одинаковы, мы заключаем, что каковы бы ни были знаки чисел f4(a) и f4(c1) для всех четырех вариантов справедливо равенство Р(с1)=Р(а)-1. Так как все вышедоказанное справедливо и по отношению к точкам х2, …,xm, то рассматривая последовательно пары чисел Р(с1) и Р(с2),…, Р(сm) и Р(b) мы приходим к следующей теореме Штурма: при возрастании аргумента от а до b соответствующий функции f ряд Штурма теряет ровно столько перемен знака, сколько корней функции f заключено в интервале (а, b). Другими словами, число действительных корней многочлена f:С→С с действительными коэффициентами, заключенных в интервале (а, b), равно P(a)-P(b). Замечание. При составлении ряда Штурма можно без изменения результатов умножать встречающиеся функции на любые положительные числа во избежание дробных коэффициентов.
277
Рассмотрим пример (взятый из книги Э. Чезаро «Элементарный учебник алгебраического анализа и исчисления бесконечно малых»). Пусть f:С→С есть многочлен, для которого при всех zєС f(z)=z4-2z2+z-1. Читателю предоставляется проверить, что для функции f ряд функций Штурма состоит из f, f1, f2, f3, f4, где f1(z)=4z3-4z+1, f2(z)=4z2-3z+4, f3(z)=23z+8, f4(z)=-2924. Возьмем в качестве а число 0, а в качестве b достаточно большое положительное число. При z=0 имеем следующие знаки функций Штурма: -, +, +, +, - , т.е. Р(а)=Р(0)=2. При достаточно большом положительном значении z знаки функций Штурма следующие: +, +, +, +, -, т.е. Р(b)=1. Этот результат будем иметь место уже при z= 2 . Следовательно, f имеет ровно один положительный корень, лежащий между 1 и 2 , ибоf(1)<0, f( 2 )>0. Теперь возьмем в качестве а достаточно большое по абсолютной величине отрицательное число. Тогда ряд знаков функций Штурма будет таким: +, -, +, -, -, т.е. Р(а)=3. Так как Р (0)=2, то функция f имеет ровно 1=Р(а)-Р(0) отрицательный корень. Поскольку f(-2)>0, а f(-1)<0, то этот отрицательный корень лежит между -2 и -1. Мы видим также, что f имеет пару сопряженных комплексных корней. 141. Расмотрим симметричный линейный оператор А:Rn→Rn с
a11 a12 ... a1n a21 ....... a2 n матрицей А= .................. . an1 ........ ann Элементы этой матрицы удовлетворяют равенству aij = a ji при любых i, j=1, 2, …, n. Как мы помним (см. замечание 4 к упражнению 104), все собственные значения оператора А являются действительными корнями характеристического многочлена
a11 a12 .........a1n a21
a22 ...a2 n
D(λ) = ............................. an1
(*)
an 2 ..........ann
И обратно, всякий действительный корень этого многочлена (с действительными коэффициентами) является собственным значением оператора А. Доказать, что характеристический многочлен симметричного оператора А:Rn→Rn не может иметь комплексных корней α+βi при β≠0 (α, βєR).
278
Указание. Допуская противное, найдем комплексное число α+βi (β≠0, α, βєR) такое, что D(α+βi)=0. Введем в расмотрение многочлен Δ с действительными коэффициентами, для которого при всех хєС Δ(x)= =D(α+x)D(α-x) (**) Ясно, что Δ(βi)=0, Δ(0)=(D(α))2≥0. Обозначим
a11 a12 ... ...a1n a21 à22 ... a2 n А(λ)= ............................ , an1 an 2 ...........ann где λ–любое комплексное число. Тогда определитель матрицы A(α) есть D(α). Умножая матрицу A(α) на транспонированную матрицу, будем иметь:
a1 , a1 a1 , a2 ...... a1 , an a2 , a1 a2 , a2 ...... a2 , an A(α) (A(α))'= ........................................ an , a1 an , a2 ,...., an , an
, где a1 =( a11 -α, a12 , …, a1n ), a 2 =( a21 , a22 -α, …, a2 n ),…, an =( an1 , an 2 , …, ann -α). Переходя к определителям, получаем:
a1 , a1
a1 , a 2 ...... a1 , a n
a 2 , a1
a 2 , a 2 ...... a 2 , a n
Δ(0)=(D(α))2= ........................................
a n , a1
.
a n , a 2 ,...., a n , a n
Согласно упражнению 114, все главные миноры определителя Δ(0) неотрицательны. 2
+( aii -α)2+…+ ain ,
Обозначая а
при
bij=< ai , a j >, i≠j
находим:
2
bii= ai1 +..+
bij= ai1 a j1 +...+( aii -α) a ji +…+
+ aij ( a jj -α)+…+ ain a jn (мы считаем здесь для определенности, что i<j). В этих обозначениях
b11 b12 .........b1n b21 b22 .......b2 n Δ(0)= ..................... .
bn1 bn 2 .......bnn
279
Перемножая теперь матрицу A(α+x) на матрицу матрицу, общий элемент cij которой при i≠j равен:
(A(α-x))', получим
cij= ai1 a j1 +...+( aii -α-x) a ji +…+ aij ( a jj -α+x)+…+ ain a jn =bij, так как –x a ji + aij x=0. 2
2
При j=i cii= ai1 +..+( aii -α-x)( aii -α+x)+…+ ain =bii-x2. Переходя от матриц к их определителям (см. 95), найдем:
ñ11 ñ12 .........ñ1n
b11 x 2 b12 .........b1n
ñ21 ñ22 .......ñ2 n
b21 b22 x 2 .......b2 n
Δ(x)=D(α+x)D(α-x)= ..................... = ...........................
ñn1 ñn 2 .......ñnn
bn1 bn 2 .......bnn x 2
b11 2 b12 .........b1n b21 b22 2 .......b2 n Следовательно, Δ(βi)= ...........................
или, согласно 96,
bn1 bn 2 .......bnn 2 Δ(βi)=Δ(0)+Sn-1β2+Sn-2β4+…+S1(β2)n-1+β2n, где S1, S2, …, Sn-1 суть суммы главных миноров определителя Δ(0) сответствующих порядков. Так как и Δ(0) и все его главные миноры суть неотрицательные числа, то выходит, что Δ(βi)>0 (ибо β≠0). Но это противоречит полученному ранее равенству Δ(βi)=0. Значит, действительно, характеристический многочлен n n симметричного оператора A:R →R не может иметь комлпексных корней α+βi при β≠0 (α, βєR). Замечание 1. Используя алгебраическую замкнутость поля комлексных чисел (которая будет доказана позднее) и полученные выше следствия из нее, можем утверждать, что характеристический многочлен симметричного оператора A:Rn→Rn имеет ровно n действительных корней, если каждый корень считать столько раз, какова его кратность. Если указанный многочлен не имеет кратных корней, то симметричный оперaтор A:Rn→Rn имеет ровно n попарно различных собственных значений. Замечание 2. В упражнении 141 мы расcматривали матрицы и определители, элементами которых являются комплексные числа. Определение детерминанта матрицы с комплексными элементами ничем не отличается от определения, приведенного в 91. Если A и B-две квадратные матрицы n–го порядка (n=2, 3, …) с комплексными элементами, то произведение AB этих матриц определяется с помощью «умножения строк матрицы A на столбцы матрицы B», что согласуется с определением, приведенным в 79. Можно доказать, на чем мы не останавливаемся, что определитель произведения двух квадратных матриц
280
(одного порядка) с комплексными элементами равен произведению определителей этих матриц (что доказано в упражнении 95 для квадратных матриц с действительными элементами и их определителей). 142. Рассмотрим последовательность (un) натуральных чисел, определяемую так: u1=1, u2=2, а при n>2 un=un-1+un-2. Получим ряд чисел, 1, 2, 3, 5, 8, 13, 21, …, называемый рядом Фибоначчи. Доказать, что общий вид чисел Фибоначчи следующий: n 1 n 1 1 5 1 1 5 un= 2 . 5 2 Указание. Введем в расмотрение корни α и β квадратного уравнения 1 5 1 5 x2-x-1=0: α= , β= . Тогда α2=α+1, β2=β+1 и при любом 2 2 натуральном n≥2 αn=αn-1+αn-2, βn=βn-1+βn-2. Пусть при любом натуральном n vn=pαn+qβn, где действительные числа р и q подобраны так, что v1=1, v2=2. Для нахождения чисел р, q p q 1 имеем систему уравнений 2 , 2 p q 2 откуда p=
, q=
. При этих значениях р и q v1=1, v2=2, а при
n>2 (nєN) vn=pαn+qβn=p(αn-1+αn-2)+q(βn-1+βn-2)=vn-1+vn-2. Следовательно, при n1 n1 всех nєN un=vn= что и требовалось доказать, так как α-β= 5 . Доказать, что при ν≥2 и n>ν+1 (ν, nєN) имеет место равенство un=uνun-ν+uν-1un-ν-1 (в частности u2ν=u2ν-1+u2ν, ν≥2). 143. Квадратичной формой с n действительными переменными называется всякая функция f:Rn→R, для которой существуют такие действительные числа aij (где индексы i и j, причем i≤j, «пробегают» значения от 1 до n), что для любого х=(x1, x2, …, xn)єRn f(x)= a11 x12+ a22 x22+…+ ann xn2+2 a12 x1x2+2 a13 x1x3+…+2 a1n x1xn+…+ +2 an1,n xn-1xn. Значение f(x) можно записать в виде: n
f(x)=
a
i , j 1
ij
xij x j ( a11 x1+ a12 x2+…+ a1n xn)x1+ +( a21 x1+ a22 x2+…+ a2 n xn)x2+ +………………………...+ + an1 x1+ an 2 x2+…+ ann xn)xn,
281
где индексы i и j независимо друг от друга (условие i≤j снимается) «пробегают» значения от 1 до n, но подразумевается, что при любых i, j
aij = a ji . Симметричная матрица a11 a12 ... a1n a21 à22 ... a2 n А= .................. называется матрицей квадратичной формы f, а ее an1 àn 2 ... ann определитель d называется дискриминантом формы f. Пусть А-линейный оператор в Rn с матрицей А: Ae1= a11 e1+ a21 e2+…+ an1 en, Ae2= a12 e1+ a22 e2+…+ an 2 en, …………………………., Aen= a1n e1+ a2 n e2+…+ ann en. Тогда для любого х=(x1, x2, …, xn)=x1e1+x2e2+…+xnenєR, Ax=x1Ae1+x2Ae2+…+xnAen=x1( a11 e1+ a21 e2+…+ an1 en)+x2( a12 e1+ a22 e2+…+ + a2 n en)+…+xn( a1n e1+ a2 n e2+…+ ann en)= =( a11 x1+ a12 x2+…+ a1n xn)e1+( a21 x1+ a22 x2+…+ +…+ a2 n xn)e2+…+( an1 x1+ an 2 x2+…+ ann xn)en, так что=( a11 x1+ a12 x2+…+ a1n xn)x1+( a21 x1+ a22 x2+…+ a2 n xn)x2+…+( an1 x1+ + an 2 x2+… + ann xn)xn=f(x). Итак, f(x)= (для любого xєRn). Квадратичная форма f называется приводимой, если ее можно m
представить в виде f(x)=
b
i , j 1
ij
yi y j с m переменными y1, y2, …, ym, где m
и переменные yi линейно зависят от переменных x1,…, xn: y1=k11x1+k12x2+…+k1nxn, y2=k21x1+k22x2+…+k2nxn, ………………………… ym=km1x1+km2x2+…+kmnxn. При этом, не ограничивая общности, можно считать квадратную матрицу m–го порядка
b11 b12 ... b1m b b ... b 21 22 2 m B= .................. -симметричной . bm1 bò 2 ... bmm
282
Доказать, что если квадратичная форма f приводима, то ее дискриминант равен 0. Указание. Обозначим через В: Rm→Rm линейный оператор с матрицей B и через К: Rn→Rm линейный оператор с матрицей
k11 k12 ... k1n k 21 k 22 ... k 2 n [K]= .................. . k k ... k mn m1 ò 2 Считая форму f приводимой, т.е. что f(x)=, где у=Кх, будем иметь: f(x)=при любом х=(x1, x2, …, xn)єRn. Обозначая ВК=С, найдем матрицу [C] оператора С: Rn→Rm. Имеем:
ñ11 c12 ... c1n c c ... c 21 22 2 n [C]=[B][K]= .................. , где cm1 cò 2 ... cmn cij=bi1k1j+bi2k2j+…+bimkmj (i= 1, m ; j=1, n ). Далее, находим: f(x)== =(c11x1+c12x2+…+c1nxn)(k11x1+k12x2+…+k1nxn)+ +(c21x1+c22x2+…+c2nxn)(k21x1+k22x2+…+k2nxn)+ +………………………………………………..+ +(cm1x1+cm2x2+…+cmnxn)(km1x1+km2x2+…+kmnxn)= n
=
(ñ k
i , j 1
1i 1 j
c2i k 2 j ... cmi k mj ) xij .
Следовательно,
при
всех
i,
j,
m
«пробегающих» независимо друг от друга значения от 1 до n, aij =
c s 1
k .
si sj
Из доказанного следует, что A=[С]'[К], т.е. квадратная матрица A порядка n является произведением nxm матрицы [С]' на mxn-матрицу [К], где m
283
a11 a12 ... a1n a21 à22 ... a2 n А= .................. квадратичной формы f равен r (r
a11 a12 .........a1r a21 a22 .......a2 r Δ= .....................
≠0,
ar1 ar 2 .......arr а все миноры матрицы А порядка r+1 и выше равны 0, можем применить теорему Руше. Из нее следует, что все характеристические определители системы (*) равны 0. В частности
a11 a12 .........a1r u1
0
a21 a22 .......a2 r u 2
D=
0
.......................... ar1 ar 2 .......arr u r 0
0
0
=0.
0
u1 u 2 .......u r f ( x 0 ) Определитель D по отношению к определителю Δ является «окаймленным». Согласно доказанному в упражнении 100,
284 r
0 0 D=f(x )Δ– Aij ui u j , где Aij-алгебраическое дополнение элемента aij
0
i , j 1
в
определителе Δ. Итак, мы видим, что r 1 0 0 f(x0)= Aij ui u j i , j 1
А т.к. x0–произвольный вектор пространства Rn, то для любого х=(x1, x2, …, xn)єRn
1 r f(x)= Aij ui u j , где i , j 1 u1, u2, …, ur связаны с x1, x2, …, xn вышеуказанными линейными соотношениями. Итак, форма f приведена к квадратичной форме с r (r
f(x)=
b
i , j 1
ij
yi y j ,
где n переменных y1, y2, …, yn линейно зависят от координат x1, x2, …, xn любого вектора xєRn: y1=k11x1+k12x2+…+k1nxn, y2=k21x1+k22x2+…+k2nxn, ………………………… (*) yn=kn1x1+kn2x2+…+knnxn. Введем в рассмотрение линейный оператор В: Rn→Rn с матрицей
b11 b12 ... b1n b21 b22 ... b2 n [B]= .................. b b ... b n1 n 2 nn и линейный оперaтор K:Rn→Rn с матрицей
k11 k12 ... k1n k k ... k 21 22 2 n [K]= .................. . k n1 k n 2 ... k nn
285
Матрицу [B], не ограничивая общности, будем считать симметричной. Заметим, что вектор у=(y1, y2, …, yn), связанный соотношениеми (*) с координатами x1, x2, …, xn вектора х, можно записать в виде у=Кх. Доказать, что необходимым и достаточным условием возможности представления формы f в вышеуказанном виде является следующее: det [K]≠0, т.е. чтобы оператор К был обратимым оператором. Указание. Если f(x)=, где у=Кх, то, рассуждая как в 143, найдем: [BК]'[K]=А (А-матрица квадратичной формы f), откуда А=([B][K])'[K]. Как легко проверить (это предоставляется читателю), ([B][K])'=[K]'[B]'. Следовательно, ввиду симметричности матрицы [B], А=[K]'[B][K], откуда d=detА=det [B](det[K])2. Так как d≠0, то и det[K]≠0. Обратно, пусть К-произвольный обратимый оператор, действующий в Rn. Обозначим у=Кх, где х-любой вектор из Rn. Пусть A:Rn→Rn есть линейный оператор с матрицей А, которая является матрицей квадратичной формы f. Как показано в 143, f(x)= . Пусть В=(К-1)'АК-1 (В-линейный оператор, действующий в Rn; читателю предоставляется проверить, что Всимметричный линейный оператор). Тогда = =<(K-1)'Ax, Kx>= = =f(x), ч.т.д. 146. Пусть по-прежнему f–квадратичная форма с n переменными и ненулевым дискриминантом: detА≠0, где А–матрица (симметричная) квадратичной формы f. Как и выше, обозначим через А линейный оператор, действующий в Rn, с матрицей [A]=А. Пусть также К-ортогональный оператор, действующий в Rn. Матрица [K] оператора К ортогональна и потому обратима (см. 90), причем [K]-1=[K]'. Так как [K][K]-1=E, то [K][K]'=E, откуда (det [K])2=1 и det K=±1. Согласно 145, при ортогональном преобразовании переменных у=Кх, квадратичную форму f можно представить в виде: f(x)= = , где B=(К-1)'АК-1. Переходя к матрицам (см. 79), будем иметь: B=[B]=[(K-1)'][A][K-1]. Учитывая результаты упражнений 85 и 89, можем написать: B= =[K-1]'A[K-1]=([K]-1)'A [K]-1=[K]A [K]'. Следовательно, det B= =detA (det [K])2 или det B=detA. Итак дискриминант квадратичной формы не меняется при ортогональном преобразовании переменных. Этот факт выражают также следующим образом: дискриминант квадратичной формы есть ее ортогональный инвариант. Доказать, что сумма всех главных миноров одного и того же порядка в дискриминанте квадратичной формы есть ортогональный инвариант этой формы.
286
Указание. Запишем матрицу B=[K]A[K]-1 квадратичной формы, преобразованной из f с помощью ортогонального преобразования
b11 b12 ... b1n b21 b22 ... b2 n К (у=Кх), в виде B= .................. . b b ... b n1 n 2 nn Мы должны доказать, что сумма всех главных миноров к-го порядка
a11 a12 .........a1n
b11 b12 .........b1n
a21 a22 .......a2 n
b21 b22 .......b2 n
(к=1, 2,…,n-1) одинакова в определителях .....................
an1 an 2 .......ann
и .....................
bn1 bn 2 .......bnn
(первый из них есть detA, а второй det B). С этой целью возьмем произвольное действительное число λ и наряду с симметричной матрицей A квадратичной формы f расмотрим
a11 a12 ... ...a1n a21 à22 ... a2 n симметричную матрицу Aλ=A+λE= ............................ . a a .......... . a n2 nn n1 Соответствующую матрице Aλ квадратичную форму с n переменными x1, x2, …, xn обозначим fλ. Согласно только что доказанному, при ортогональном преобразовании переменных (у=Кх) fλ(x)=
b11 b12 ... ...b1n b21 b22 ... b2 n = ............................ . bn1 bn 2 ...........bnn Кроме того, по доказанному, detAλ=det Bλ. Paзлагая detAλ и det Bλ по степеням λ, будем иметь (см. упр. 96): detA+Sn-1λ+ Sn-1λ2+…+ S1λn-1+λn=det B+δn-1λ+ δn-2λ2+…+δ1λn-1+λn, где Sk и δk суть суммы главных миноров к-го порядка (к=1, 2, .., n-1) в определителях detA и det B соответственно. Так как λ–произвольное действительное число, то S1=δ1, S2=δ2,…, Sn-1=δn-1, ч.т.д. 147. Пусть f–квадратичная форма с матрицей A (симметричная квадратная матрица порядка n) и дискриминантом
287
a11 a12 .........a1n a21 a22 .......a2 n d=detA= .....................
≠0. Если с помощью линейного преобразования
an1 an 2 .......ann переменных у=Кх или более подробно y1=k11x1+k12x2+…+k1nxn, y2=k21x1+k22x2+…+k2nxn, ………………………… yn=kn1x1+kn2x2+…+knnxn. n (линейный оператор К: R →Rn предполагается обратимым) форма f приведена к виду f(x)== =b11y12+ b22y22+…+bnnyn2, то говорят, что форма f приведена к каноническому виду или, что получено каноническое представление формы f. Здесь А и В-линейные операторы, действующие в Rn, причем [A]=A, а В=(К-1)'АК-1. Можно предположить (и это действительно так), что приведение квадратичной формы к каноническому виду возможно бесчисленным множеством линейных преобразований. В cамом деле, n2 коэффициентов kij должны удовлетворять всего b23=0,…, b2n=0, …; bn-2,n-1=0,
1 n(n-1) условиям: b12=0, b13=0,…, b1n=0; 2 n bn-2,n=0, bn-1,n=0 (n-1+n-2+…+2+1= (n-1) 2
условий). Ситуация окажется более определенной, если потребовать, чтобы преобразование К было ортогональным. В этом случае к bij=0 при i≠j добавляются
1 n(n-1) условиям 2
1 n(n+1) условий ортогональности матрицы [K] 2
оператора К (n-1+n-2+…+2+1 условий попарной ортогональности строк матрицы и условий, выражающих тот факт, что сумма квадратов элементов каждой строки матрицы должна равняться 1). Доказать, что если с помощью ортогонального преобразования К квадратичная форма f приведена к каноническому виду b11y12+b22y22+…+ +bnnyn2, то числа b11, b22, …, bnn являются собственными значениями оператора А. Указание. Пусть λ–произвольное действительное число. Рассмотрим квадратичную форму fλ с матрицей
288
Aλ=A-λE=
a11 a12 ... ...a1n a21 à22 ... a2 n ............................ . Заметим, что при любом х=(x1, an1 an 2 ......ann
x2, …, xn)єRn fλ(x)=f(x)-λ(x12+x22+…+xn2). Обозначим через Aλ линейный оператор, действующий в Rn, с матрицей Aλ:Aλ=A-λJ. С помощью преобразования К форма fλ приводится к виду: fλ(x)==, где Bλ=KAλK-1=K(A-λJ)K-1=KAK-1-λJ=B-λJ. Следовательно, fλ(x)=<(B-λJ)y, y>== -λ = =(b11-λ)y12+(b22-λ)y22+…+(bnn-λ)yn2 (y=(y1, y2, …, yn)=Kx, х=(x1, x2, …, xn)). Таким образом, при λ=b11, а также при λ=b22 и т.д. квадратичная форма fλ приводится к меньшему, чем n числу переменных. Но это означает (см.
a11 a12 .........a1n a21 a22 .......a2 n 143), что дискриминант
........................... квадратичной формы fλ an1 an 2 .......ann
обращается в 0 при λ=b11, λ=b22, …, λ=bnn. 148. Пусть f-неприводимая квадратичная форма с n переменными x1,
a11 a12 ... a1n a à ... a 2n 21 22 x2, …, xn. Пусть также A симметричная матрица .................. формы f и an1 àn 2 ... ann А-линейный оператор, действующий в Rn, имеющий своей матрицей матрицу A: [A]=A. Согласно доказанному в 141, характеристический многочлен
a11 a12 .........a1n a21 a22 .......a2 n матрицы
A D(λ)= ...........................
имеет ровно n действительных
an1 an 2 .......ann корней, если каждый корень считать столько раз, какова его кратность. Эти корни являются собственными значениями оператора А. Ограничимся случаем, когда многочлен D(λ) имеет только простые корни λ1, λ2, …, λn (λi≠λj при i≠j). Найдем собственные векторы g1, g2, …, gn оператора А, принадлежащие соответственно собственным значениям λ1, λ2, …, λn. Не ограничивая общности (см. 81 и 86), можно считать, что векторы g1, g2, …, gn составляют ортонормированный базис пространства Rn. Заметим, что
289
для нахождения координат вектора gi (i=1, 2, …, n) следует найти ненулевое решение системы (a11 i ) x1 a12 x2 ... a1n xn 0 a x (a ) x ... a x 0 21 1 22 i 2 2n n ............................................ an1 x1 an 2 x2 ... (ann i ) xn 0 и нормировать его (т.е. разделить найденный вектор на его длину). Читателю предлагается доказать единственность находимого таким образом вектора gi (i=1, 2, …, n) (с точностью до знака). Доказать также, что линейный оператор К: Rn→Rn, определенный равенствами Kg1=e1, Kg2=e2, …, Kgn=en, является ортогональным оператором, приводящим квадратичную форму f к каноническому виду: f(x)==λ1y12+ λ2y22+…+λnyn2, где y=(y1, y2, …, yn)=Kx, х=(x1, x2, …, xn)єRn. Указание. Из определения оператора К следует его сюръективность: для любого х=(x1, x2, …, xn)єRn K(x1g1+x2g2+…+xngn)=x1Kg1+x2Kg2+…+ +xnKgn=x1e1+x2e2+…+xnen=(x1, x2, …, xn). На основани доказанного в 49 можем утверждать, что оператор К инъективен, а потому-обратим. Если xєRn и Kx=y=(y1, y2, …, yn)=y1e1+y2e2+…+ynen, то Kx= =y1Kg1+y2Kg2+…+ynKgn или Kx=К(y1g1+y2g2+…+yngn), откуда x= =y1g1+…+yngn. Следовательно, ||x||2=<x,x>= =y12+y22+…+yn2=||Kx||2 и ||Kx||=||x||. Значит, оператор К сохраняет норму, т.е. является ортогональным оператором (см. 90). Далее, Ах=А(y1g1+y2g2+…+yngn), где у=Кх. Так как gi–собственные векторы оператора оператора А, то Ах=y1λ1g1+y2λ2g2+…+ynλngn, так что f(x)= = =λ1y12+λ2y22+…+ +λnyn2, ч.т.д. Замечание. Обозначим координаты вектора gi (i=1, 2, …, n) через gi1, gi2, …, gin. Так как, К-1e1=g1, К-1e2=g2,…, К-1en=gn, то
g11 g 21... g n1 g11 g12 ... g1n g12 g 22 ... g n 2 g 21 g 22 ... g 2 n [K-1]=[K]-1=[K]'= .................. и [K]= .................. . g1n g 2 n ... g nn g n1 g n 2 ... g nn Итак, при ортогональном преобразовании переменных у=Кх «старые» переменные x1, x2, …, xn выражаются через новые переменные y1, y2, …, yn следующим образом: x1=g11y1+g21y2+…+gn1yn, x2=g12y1+g22y2+…+gn2yn, ……………………….. xn=g1ny1+g2ny2+…+gnnyn
(*).
290
Переменные же y1, y2, …, yn выражаются через старые переменные x1, x2, …, xn так: y1=g11x1+g12x2+…+g1nxn, y2=g21x1+g22x2+…+g2nxn, ……………………….. (**) Yn=gn1x1+gn2x2+…+gnnxn, 149. Пример. Поставим себе целью с помощью ортогонального преобразования переменных привести к каноническому виду следующую квадратичную форму f: f(x)=2x12+2x22+3x32-2x1x2+2x1x3-2x2x3 (x=(x1, x2, x3)любой вектор из R3). Матрица квадратичной формы такова:
A=
2 1 1 1 2 1 . 1 1 3
Дискриминант квадратичной формы d=12+1+1-2-2-3=7≠0, так что форма f неприводима. Характеристический многочлен матрицы A имеет вид: 2 1 1
1 2 1 =-λ3+7λ2-13λ+7. Решая уравнение -λ3+7λ2-13λ+7=0, 1 1 3 найдем собственные значения линейного оператора А, матрицей которого является A : λ1=1, λ2=3- 2 , λ3=3+ 2 . Для нахождения собственного вектора g1 оператора А следует x1 x2 x3 0 решить систему x1 õ2 x3 0 . Нормированное решение ее (одно из x x 2x 0 3 1 2 двух) таково: g1=( Для
1 2
,
1 2
, 0 ).
нахождения
вектора
g2
решаем
систему:
( 2 1) x1 x2 x3 0 x1 ( 2 1) õ2 x3 0 . С учетом 105 (см. замечание 1), нормированное x1 x2 2 x3 0 1 1 2 2
решение этой системы (одно из двух) таково: g2=( , , 1 2
1 2
Аналогично находим g3: g3=( , ,
1 2
1 2
).
). Cледовательно,
291
[K-1]=
1 1 1 2 2 2 1 1 1 2 2 2 1 1 0 2 2
и «старые» переменные x1, x2, …, xn
выражаются через новые переменные y1, y2, …, yn (x=К-1y) следующим образом:
x1=
ó1 2
ó2 ó3 , 2 2
x2=
ó1 2
ó2 ó3 , 2 2
x3=
ó2 2
ó3 2
.
Читателю
предлагается проверить, что, подставив эти значения x1, x2, x3 в выражение f(x), мы придем к заранее известному каноническому представлению формы f в виде λ1y12+λ2y22+λ3y32= y12+(3- 2 )y22+(3+ 2 )y32. 150. В пространстве R2 (на плоскости) наряду со стандартным базисом (ортонормированным) е1=(1,0) и е2=(0, 1) расмотрим какой-либо ортонормированный базис е'1, е'2, получающийся из базиса е1, е2 «поворотом осей на угол φ против часовой стрелки» Ясно, что е'1=cosφе1+sinφе2, е'2=-sinφe1+cosφе2. Если произвольная точка М плоскости имеет в базисе е1, е2 координаты х,у, то координаты x', y' этой же точки М в базисе е'1, е'2 найдутся из уравнения xe1+ye2=x'е'1+y'е'2 или xe1+ye2=x'(cosφе1+sinφе2)+y'(-sinφe1+cosφе2). Из этого уравнения находим: x=x'cosφ-y'sinφ, y=x'sinφ+y'cosφ, откуда x'=xcosφ+ysinφ, y'= =-xsinφ+ycosφ. Расмотрим теперь общее уравнение кривой 2-го порядка на плоскости, отнесенной к стандартному базису е 1, е2 : 2 2 a x +2 b xy+cy +2dx+2ey+f=0. Выясним, на какой угол φ следует повернуть оси координат, чтобы в новом уравнении кривой исчез член с произведением переменных (при этом мы, естественно, считаем, что b≠0). В базисе е'1, е'2 уравнение кривой примет вид: a (x'cosφ-y'sinφ)2+2b(x'cosφ-y'sinφ)(x'sinφ+y'cosφ)+c(x'sinφ+y'cosφ)2+ +2d(x'cosφ-y'sinφ)+2e(x'sinφ+y'cosφ)+f=0. Легко проверить (это предоставляется читателю), что член с произведением x'y' исчезает в том и только в том случае, если (с- a )sin2φ+2bcos2φ=0, откуда ctg2φ=
àñ . 2b
Ограничимся случаем, когда дискриминант δ квадратичной формы a b 2 2 2 ax 2bxy cy отличeн от нуля: δ= = ac b ≠0.b c
x x cos y sin Замечая, что формулы перехода от системы y x sin y cos координат е1, е2 к системе координат е1, е2-можно рассматривать как ортогональное преобразование переменных, мы должны заключить (см.
292
ac ) 2b уравнение кривой 2-го порядка примет вид: λ1x2+λ2y2+2dx+2ey+f=0, где a b λ1 и λ2 находятся из уравнения =0, т.е. λ2-Sλ+δ=0 ( S a c ). b c Здесь d и е-коэффициенты, не зависящие от переменных х, у. Так как λ1≠0 и λ2≠0 (λ1λ2=δ≠0), то полученное уравнение кривой (в базисе е1, е2) можно преобразовать следующим образом: d 2 e 2 d 2 e 2 =0. λ1(x+ ) +λ2(y+ ) +f- 2 1 1 2 d1 Если перенести начало координат в точку с координатами х=- , 1 e d e у=- , т.е. произвести преобразование переменных х=х+ , у=у+ , 2 2 1 то уравнение кривой примет вид: ~ λ1x2+λ2y2+ f =0, (*) d 2 e 2 ~ ~ где f =f. Оказывается значение величины f можно вычислить 1 2 заранее, исходя из первоначального уравнения кривой. a b d ~ Доказать, что f = , где Δ= b c e (мы ограничимся случаем, d e f когда Δ≠0). x k1u k 2 Указание. Пусть –какое-либо ортогональное y 1u 2 преобразование переменных в R2. В новых переменных уравнение ax 2 2bxy cy 2 2dx 2ey f 0 примет вид: a(k1u k2 ) 2 2b(k1u k2 )(1u 2 ) c(1u 2 ) 2 147), что при повороте осей на вышенайденный угол φ (ctg2 φ=
2d (k1u k2 ) 2e(1u 2 ) f 0 или (ak12 2bk11 c12 )u 2 2ak1k 2 b(k1 2 k 2 1 ) c12 u (ak 22 2bk 2 2 c22 ) 2 2(dk1 e1 )u 2(dk 2 e 2 ) f 0
293
Мы
хотим
доказать,
что
для
кривой
второго a b d
порядка
ax 2 2bxy cy 2 2dx 2ey f 0 определитель Δ= b c e d e f ортогональным инвариантом, т.е. что определитель ak12 2bk1 1 c12 ak1k 2 c1 2 b(k1 2 k 2 1 ) dk1 e1
является
2 2 Δ= ak1k 2 c1 2 b(k1 2 k 2 1 ) ak 2 2bk 2 2 c 2 dk1 e1 dk 2 e 2
dk 2 e 2 f
равен определителю Δ. С этой целью рассмотрим следующую квадратичную форму в пространстве R3: ax 2 2bxy cy 2 2dxz 2eyz fz 2 Дискриминантом этой формы является как раз определитель Δ. При ортогональном преобразовании переменных x=k1u+k2v+0∙w, y=μ1u+μ2v+0∙w, z=0∙u+0∙v+w указанная квадратичная форма примет вид: (ak12 2bk11 c12 )u 2 (ak22 2bk2 2 c22 ) 2 fw 2 2ak1k2 b(k12 k2 1 ) c12 u 2(dk1 e1 )uw 2(dk2 e2 )w. Дискриминант этой формы Δ равен: ak12 2bk1 1 c12 ak1k 2 c1 2 b(k1 2 k 2 1 ) dk1 e1 2 2 Δ= ak1k 2 c1 2 b(k1 2 k 2 1 ) ak 2 2bk 2 2 c 2 dk1 e1 dk 2 e 2
dk 2 e 2 . f
Согласно доказанному в 146, дискриминант квадратичной формы есть ее ортогональный инвариант. Следовательно, Δ=Δ. Так как Δ совпадает с Δ, то и Δ=Δ, что мы и хотели доказать. a b d Теперь следует убедиться, что определитель Δ= b d
c e остается e f неизменным и при переносе начала координат (без изменения направленния осей), т.е. при преобразованиях вида х=х+μ, у=у+ν. При 2 2 таком преобразовании уравнение ax 2bxy cy 2dx 2ey f 0 примет вид 2 2 ax 2bxy cy 2(a vb d ) x 2(vc b e) y a 2 2bv cv 2 2d 2ev f 0 и мы должны доказать, что определитель Δ равен определителю
294
a ~ b
b c
a vb d b vc e
a vb d b vc e a 2 2bv cv 2 2d 2ev f ~ Вычитая из 3-го столбца определителя , умноженный на μ 1-ый столбец и умноженный на ν 2-ой столбец, будем иметь: a b d ~ b c e
a vb d b vc e d ev f Теперь вычтем из 3-ей строки последнего определителя умноженную на μ 1-ю строку и умноженную на ν 2-ую строку. Получим: a b d ~ b c e = Δ, что и требовалось доказать. d e f Возвращаясь к уравнению (*), мы, в силу доказанного, можем написать:
a b d
b c e
1 0 d e =Δ= 0 2 f 0 0
0 0 ~ f
~ , откуда λ1λ2 f =Δ или
~ f=
(λ1∙λ2=δ), ч.т.д. 2 Замечания. 1) Если δ= ac b 0 , а ΔS<0 (S= a c ), то уравнение ax 2 2bxy cy 2 2dx 2ey f 0 представляет собой уравнение эллипса. В самом деле, после поворота осей координат на надлежащий угол φ и (в случае необходимости) переноса начала координат в надлежащую точку уравнение кривой принимает вид λ1x2+λ2y2+ =0. Если S>0, то λ1>0,
<0, так что уравнение кривой можно записать в виде || 2 || x 2 y 2 2 1 , где m2= ,n = . 2 1 2 m n Если же S<0, то λ1<0, λ2<0, Δ>0 и уравнение кривой можно записать x 2 y 2 2 2 2 2 1 в виде: |λ1|x +|λ2|y = или 2 , где m = ,n = . | 1 | | 2 | m n2 2) Если δ>0 и ΔS>0, то, как легко проверить (это предоставляется читателю), множество точек плоскости, удовлетворяющих уравнению ax 2 2bxy cy 2 2dx 2ey f 0 ,-пусто. Говорят также, что в указанном случае уравнение выражает мнимый эллипс. λ2>0 а
295
3) Если δ<0 (заметим, что этот случай обязательно будт иметь место при S= a c =0), то числа λ1 и λ2 имют противоположные знаки и уравнение λ1x2+λ2y2+ =0 при любом знаке Δ представляет собой уравнение
гиперболы. 2 4) Если δ= ac b =0 (по-прежнему считаем b≠0), то из уравнения a2 b2 (b 2 a 2 ) (b 2 a 2 ) ac ctg2φ= или ctg2φ= легко найти, что tgφ= . 2b 2ab 2ab a2 b 2 Пусть, например tgφ= , откуда asinφ-bcosφ=0, cos φ= 2 , sin2φ= a a b2 b2 2ab = 2 , sin2φ= .Читателю предоставляется проверить, что после a b2 a2 b2 поворота осей координат на угол φ уравнение кривой 2 2 ax 2bxy cy 2dx 2ey f 0 примет вид: 2 2 2 2 2 2 (a cos b sin 2 c sin ) x (a sin b sin 2 c cos ) y (2d cos 2e sin ) x (2e cos 2d sin ) y f 0 или
a2 b2 2 x (2d cos 2e sin ) x (2e cos 2d sin ) y f 0 . a Если 2еcosφ-2dsinφ=0 (убедиться, что в этом случае и Δ=0), то уравнение выражает пару параллельных действительных или мнимых прямых. Если же δ=0, но Δ≠0, то уравнение кривой можно записать в виде x2+2mx-2py+f1=0 c очевидными выражениями для m, p и f1, причем р≠0. Выберем число n m 2 f1 следующим образом: n= . Тогда, перенеся начало координат в 2p точку с координатами х=-m, у=-n, т.е. произведя преобразование переменных х=х+m, у=у+n, мы приведем уравнение кривой к виду х2=2ру. Это есть уравнение параболы. 151. Пример. Выяснить, что представляет собой кривая 2-го порядка, определяемая в некоторой ортогональной системе координат уравнением 5х2+4ху+2у2+у-1=0
296
5 2 Матрица квадратичной формы 5х +4ху+2у имеет вид А= . 2 2 2 Дискриминант формы таков: δ= ac b =10-4=6>0. При этом 2
Δ=
5
2
2
2
0 2 1 2 =5∙ 1 2 1
1 2 1
2 -2
2
1 29 2 =- <0, 4 1
S=5+2=7>0.
0 1 2 После поворота осей координат против часовой стрелки на угол 1 3 ac 1 φ= arcctg = arcctg и перенесения начала координат в 2 4 2b 2 надлежащую точку уравнение кривой (согласно 150) примет вид: λ1x2+λ2y2+ =0. Собственные значения λ1 и λ2 матрицы А (оператора А:R2R2 с 5 2 матрицей А) находятся из уравнения =0 или λ2-7λ+6=0, 2 2 откуда либо λ1=1, λ2=6, либо λ1=6, λ2=1. Итак, уравнение кривой примет 29 29 вид х2+6у2= или 6х2+у2= , откуда следует, что данная кривая4 4 эллипс. Этот вывод можно было сделать и заранее (см. замечание 1 к упр. 150), так как δ>0, а ΔS<0. 152. Рассмотрим систему m линейных однородных уравнений с действительными коэффициентами и n действительными неизвестными:
0
a11x1 a12 x2 ... a1n xn 0 a x a x ... a x 0 21 1 22 2 2n n (*) ....................................... am1 x1 am 2 x2 ..... amn xn 0 Если х=(х1, х2, …, хn) и у=(у1, у2, …, уn) суть два решения системы (*), то ясно, что вектор х+уєRn также является решением этой системы и вектор μх+νу является решением системы при любых μ, νєR. Поэтому решения системы (*) составляют линейное подпространство пространства Rn. Поставим вопрос о размерности этого подпространства. Доказать, что размерность пространства решений системы (*) равна n-r, где r–ранг матрицы системы.
297
Указание. Пусть сперва r
à11 à12... à1r à21 à22... à2 r считать, что определитель Δr= ................
отличен от нуля. Тогда первые
ar1 ar 2 .....arr r строк матрицы системы (*) линейно независимы. Так как ранг любой матрицы равен максимальному числу линейно независимых строк этой матрицы (см. 112), то всe уравнения системы (*) после r–го являются линейными комбинациями первых r уравнений системы. Следовательно, все решения системы (*) являются решениями системы a11x1 ... a1r xr a1r 1 xr 1 ... a1n xn 0 a x ... a x a x ... a x 0 21 1 2r r 2 r 1 r 1 2n n (**) ................................................................. ar1 x1 ... arr xr arr1 xr 1 ... arn xn 0 Ясно, что и наоборот, всякое решение системы (**) является также решением системы (*). В системе (**) переменным xr+1,…, xn можно придать любые значения, после чего х1, х2, …, хr определяются однозначно по правилу Крамера:
1 à12 ... à1r 1 2 à22 ... à2 r
à11 1 ... à1r
à11 à12 ... 1
1 à21 2 ... à2 r 1 à21 à22 ... 2 х1= r ................ , х2= r ................ , …, xr= r ................ , r ar 2 .....arr ar1 ar 2 ..... r ar1 r .....arr где μ1= (a1r 1 xr 1 ... a1n xn ) , μ2= (a21r 1 xr 1 ... a2n xn ) ,…, μr= (arr1 xr 1 ... arn xn ) . Разлагая каждый из вышеуказанных определителей по элементам «μстолбца», мы найдем, что для всякого решения (x1, x2,…, xr, xr+1,…,xn) системы (*) имеют место равенства: x1=b1r+1xr+1+…+b1nxn, x2=b2r+1xr+1+…+b2nxn, ……………………. (***) хr=brr+1xr+1+…+brnxn, где коэффициенты bij зависят только от элементов матрицы системы (*) и не меняются при изменении величин xr+1,…,xn. Имея это в виду, обозначим (i ) (i ) (i ) р=n-r и подберем какие-нибудь р2 чисел xr 1 , xr 2 ,...., xn , где i
298
xr(1)1 xr(1)2 ... xn(1) xr( 21) xr( 2 )2 ... xn( 2 ) «пробегает» значения 1, 2, …, р, так, чтобы определитель ...................
xr( p1) xr( p2) .....xn( p ) был отличным от 0. Например, это может быть определитель р-го порядка 1 0......0
0 1.......0 .................. . 0 0........1 С использованием равенств (***) запишем в виде матрицы р решений системы (*):
x1(1) x2(1) ...xr(1) xr(1)1 ...xn(1) ( 2) ( 2) ( 2) ( 2) ( 2) x1 x2 ...xr xr 1 ...xn X= ................................. . ( p) ( p) ( p) ( p) ( p) x1 x2 ...xr xr 1 ...xn Матрица X имеет р строк и содержит в себе квадратную матрицу рго порядка с отличным от 0 определителем. Поэтому строки матрицы X линейно независимы и она имеет ранг р=n-r. Другими словами, решения системы (*), записанные в строках матрицы X,-линейно независимы. Припишем к матрице X в качестве р+1-ой строки любое решение x1, x2,…, xr, xr+1,…,xn системы (*):
x1(1) x2(1) ...xr(1) xr(1)1...xn(1) ( 2) ( 2) ( 2) ( 2) ( 2) x1 x2 ...xr xr 1...xn ................................. Y= ( p ) ( p ) ( p ) ( p ) ( p ) . x1 x2 ...xr xr 1 ...xn x1 x2 ......xr xr 1....xn В силу равенств (***), первые r столбцов матрицы Y являются линейными комбинациями последних р=n-r столбцов. А так как последние р столбцов матрицы Y, очевидно, линейно независимы, то максимальное число линейно независимых столбцов матрицы Y равно р. Другими словами, ранг матрицы Y равен р (см. 111). Количество строк матрицы Y
299
равно р+1. Если бы они были линейно независимыми, то ранг матрицы Y равнялся р+1 (112). Значит, строки матрицы Y линейно зависимы. А так как первые р строк матрицы Y линейно независимы, то последняя ее строка является линейной комбинацией первых р строк. Это и доказывает, что любое решение системы (*) является линейной комбинацией n-r решений (линейно независимых), записанных в строках матрицы X. Другими словами, линейно независимые решения системы (*), записанные в строках матрицы X, составляют базис линейного пространства всех решений системы (*). Так как все базисы конечномерного линейного пространства состоят из одного и того же числа элементов (см. 17), называемого размерностью пространства, то размерность пространства решений системы (*) действительно равна n-r. Разбор случая r=n тривиален и мы предоставляем его читателю. 153. Пусть f:CC–многослен и α1-один из его корней. Доказать, что кpатность корня α1 равна степени младшего члена разложения f(α1+y) по степеням у, отличного от нуля. Указание. Пусть α1, α2, …, αк-все попарно различные корни многочлена f кратностей r1, r2, …, rk соответственно (r1+ r2+ …+rk=n , где n–степень многочлена). Тогда при любом zєС f(z)= a0 ( z 1 ) 1 ( z 2 ) 2 ...( z k ) k , где a0 -старший коэффициент многочлена. Обозначим α1-α2=β2, α1-α3=β3,…, α1-αк=βк. Заметим, что все числа βi отличны от нуля. Будем иметь: r
r
r
f(α1+y)= a 0 y ( 2 y) 2 ...( k y) k a0 y ... a0 22 ... kk y 1 . Мы видим, что, действительно, степень младшего члена разложения f(α1+y) по степеням у равна r1 –кратности корня α1. Замечание. Доказанное справедливо и для действительного многочлена f: RR и любого из его действительных корней (если они есть). В самом деле, пусть по-прежнему α1, α2, …, αк-все попарно различные корни действительного многочлена f кратностей r1, r2, …, rk соответственно (r1+ r2+ …+rk≤n , где n–степень f). При любом хєR (см. 115). r1
r
r
r
n
r
r
f(x)= ( x 1 ) 1 ( x 2 ) 2 ...( x k ) k g ( x) ,где g-действительный многочлен степени n-(r1+…+rk), не имеющий корней. Пусть, как и выше, βi=α1-αi≠0 (i=2,…,k). Тогда r
r
r
f(α1+y)= y 1 ( 2 y) 2 ...( k y) k g (1 y) Ясно, что g(α1+y)=φ(y), где φ-действительный многочлен с отличным от 0 свободным членом b (в противном случае φ(0)=0, т.е. g(α1)=0, что невозможно, так как действительный многочлен g не имеет корней). Поэтому (после всех возвышений в степень, перемножений и приведения подобных членов) будет иметь место равенство: r
r
r
300
f(α1+y)= a0 y ... b 22 ... kk y 1 , ч.т.д. Пример. Рассмотрим следующий действительный многочлен f: f(x)= 5 =х +3х4+4x3+4x2+3x+1. Легко видеть, что число α1=-1 является его корнем. Найдем кратность этого корня. С этой целью найдем разложение f(-1+y) по степеням у. Имеем: f(-1+y)=(y-1)5+3(y-1)4+4(y-1)3+4(y-1)2+3(y-1)+1= =у5-5y4+10y3-10y2+5y-1+3(y4-4y3+6y2-4y+1)+4(y3-3y2+3y-1)+4(y2-2y+1)+ +3(y-1)+1=y5-2y4+2y3. Следовательно, кратность корня α1=-1 равна 3. И, действительно, легко проверить, что f(x)=(x+1)3∙(x2+1). 154. Рассмотрим определитель порядка n и ранга r
r
r
r
àk1 j1 àk1 j2 ... àk1 jr
ài1 j1 ài1 j2 ... ài1 jr
àk2 j1 àk2 j2 ... àk2 jr
ài2 j1 ài2 j2 ... ài2 jr
..................... akr j1 akr j2 .....akr jr
=λ ..................... ,
air j1 air j2 .....air jr
где число λ не зависит от того или иного выбора r столбцов данного определителя. Указание. Так как к1-я строка является линейной комбинацией строк с номерами i1, i2,…,ir, то найдутся такие числа λ11, λ12,…,λ1r, что
ai11 ai1 2 ... ai1n ai2 1 ai2 2 ... ai2n [ak 1 ak 2 ...ak n ] =[λ11, λ12,…,λ1r] .................. . air 1 air 2 ... air n 1
1
1
Pассуждая аналогично о к2-ой строке, к3-ей строке и т.д., найдем, что
301
ak11 ak1 2 ...ak1n 11 12 ... 1r ai 1 ai 2 ... ai n 1 1 1 a a ... a a a ... a k 1 k 2 k n 2 2 i2 n 2 21 22 ... 2 r i2 1 i2 2 .................. = .................. ∙ .................. akr 1 akr 2 ...akr n r1 r 2 ... rr air 1 air 2 ... air n
(*),
где числа λ11, …, λrr зависят только от элементов строк с номерами к1, к2, .., кr и i1, i2,…,ir. Заметим (и это самое главное), что если в матрице, стоящей в левой части равенства (*) , и в матрице, стоящей вторым множителем в правой части равенства (*), вычеркнуть по столбцу с одним и тем же номером, то равенство не нарушится. Поэтому, выбирая по произволу какие-либо r столбцов с номерами j1, j2,…,jr (номера идут в порядке возрастания), будем иметь:
ak1 j1 ak1 j2 ...ak1 jr 11 12... 1r ai1 j1 ai1 j2 ...ai1 jr ... a a ... a a a ... a 21 22 2 r i2 j1 i2 j2 i2 jr k2 j1 k2 j2 k2 jr ................... = .................. ∙ ................... . .................. akr j1 akr j2 ...akr jr ... air j1 air j2 ...air jr
r1
r2
rr
Применяя теорему об определителе произведения матриц, получим подлежавшее доказательству равенство со следующим числом λ:
11 12 ... 1r 21 22 ... 2 r λ= ................
.
r1 r 2 .....rr 155. В условиях упражнения 154 выберем кроме r столбцов с номерами j1, j2,…,jr еще любые r столбцов с номерами q1, q2,…,qr. Доказать, что
àk1 j1 àk1 j2 ... àk1 jr
ài1q1 ài1q2 ... ài1qr
àk2 j1 àk2 j2 ... àk2 jr ài2q1 ài2q2 ... ài2qr ..................... ∙ ..................... akr j1 akr j2 .....akr jr air q1 air q2 .....air qr
=
302
àk1q1 àk1q2 ... àk1qr àk2q1 àk2q2 ... àk2qr = .....................
ài1 j1 ài1 j2 ... ài1 jr
akr q1 akr q2 .....akr qr
ài2 j1 ài2 j2 ... ài2 jr ..................... air j1 air j2 .....air jr
(1)
Указание. Согласно доказанному в упр. 154,
àk1q1 àk1q2 ... àk1qr
ài1q1 ài1q2 ... ài1qr
àk2q1 àk2q2 ... àk2qr
ài2q1 ài2q2 ... ài2qr
..................... akr q1 akr q2 .....akr qr
=
..................... air q1 air q2 .....air qr
(2).
àk1 j1 àk1 j2 ... àk1 jr
àk1q1 àk1q2 ... àk1qr
àk2 j1 àk2 j2 ... àk2 jr
àk2q1 àk2q2 ... àk2qr
Если λ=0, то .....................
akr j1 akr j2 .....akr jr
=0 и
..................... akr q1 akr q2 .....akr qr
=0, так что в
этом случае равенство (1) выполняется. Если же λ≠0, то перемножим равенство (2) «крест на крест» на аналогичное равенство из упр. 154. Получим (после сокращения на λ) требуемое равенство (1). Замечание. Доказанное можно сформулировать cледующим образом. Пусть в определителе порядка n и ранга r
303
определителя, и пусть номера этих строк суть i1, i2,…,ir, а j1, j2,…,jr–суть номера столбцов, в пересечении которых с выбранными строками содержится отличный от нуля минор r–го порядка. Примем эти столбцы за 1-ю группу столбцов. Тогда М11≠0 (см. замечание к упр. 155). За вторую группу строк возьмем строки с номерами j1, j2,…,jr, а за вторую группу столбцов возьмем столбцы с номерами i1, i2,…,ir. Будем иметь:
ài1 j1 ài1 j2 ... ài1 jr
à j1i1 à j1i2 ... à j1ir
ài1 j1 ài2 j1 ... àir j1
ài2 j1 ài2 j2 ... ài2 jr
à j2i1 à j2i2 ... à j2ir
ài1 j2 ài2 j2 ... àir jr
М11= ..................... , M22= ..................... = ..................... .
air j1 air j2 .....air jr
a jri1 a jri2 .....a jrir
ai1 jr ai2 jr .....air jr
При этом мы использовали симметричность матрицы данного определителя. Учитывая, что определитель любой матрицы совпадает с определителем транспонированной матрицы, можем заключить, что, М22=М11. Далее,
ài1i1 ài1i2 ... ài1ir
à j1 j1 à j1 j2 ... à j1 jr
ài2i1 ài2i2 ... ài2ir
à j2 j1 à j2 j2 ... à j2 jr
М12= ..................... , M21= .....................
airi1 airi2 .....airir
.
a jr j1 a jr j2 .....a jr jr
Поскольку М12 и М21-главные миноры r–го порядка (которые могут и совпадать), и так как М12 ∙М21=М211, то утверждение задачи становится очевидным. Замечание. Фактически доказано следующее: если в определителе симметричной матрицы ранга r какие-либо r строк реализуют ранг определителя, то главный минор r–го порядка, содержащийся в этих строках, отличен от нуля. 157. Доказать, что в определителе симметричной квадратной матрицы порядка n и ранга r (r≤n) с действительными элементами все главные миноры r–го порядка, отличные от нуля, имеют одинаковый знак. Указание. При r=n имеется только один (главный) минор r–го (т.е. n– го) порядка, отличный от нуля. Пусть r
304
строки с номерами k1, k2,…,kr за вторую группу строк, а столбцы с этими же номерами за вторую группу столбцов, будем иметь: М22≠0. Согласно доказанному в упр. 155, М11∙М22=М12∙М21. Так как
ài1k1 ài1k2 ... ài1kr
àk1i1 àk1i2 ... àk1ir
ài2k1 ài2k2 ... ài2kr
àk2i1 àk2i2 ... àk2ir
М12= ..................... , M21= ..................... ,
air k1 air k2 .....air kr
akri1 akri2 .....akrir
то (в силу симметричности матрицы данного определителя и равенства определителя любой матрицы определителю транспонированной матрицы) М12=М21. Значит, М11∙М22=М212. Ясно, что М12≠0, так как М11≠0 и М22≠0. Поскольку все элементы матрицы данного определителя действительны, то М11∙М22>0, откуда и следует, что М22 имеет тот же знак, что и М11.
a11 a12 ... a1n a21 a22 ... a2 n 158. Пусть А= .................. есть симметричная квадратная матрица an1 an 2 ... ann порядка n с действительными элементами. Характеристический многочлен этой матрицы представляет собой определитель,
à11 à12 ......... à1n à21
à22 ... à2 n
D(λ)= ........................ an1
, являющийся (после раскрытия его и
an 2 .....ann
приведения подобных членов) многочленом степени n относительно λ. Согласно замечанию 1 к упражнению 141, этот многочлен имеет ровно n действительных корней, если каждый корень считать столько раз, какова его кратность. Пусть λ1-один из корней многочлена D(λ) кратности r, так что
à11 1 à12 ......... à1n à21
à22 1 ... à2 n
D (λ1)= ........................ an1
=0.
an 2 .....ann 1
Ясно, что ранг этого определителя (ранг его матрицы) меньше n. Доказать, что ранг определителя D (λ1) равен n-r.
305
Указание. Обозначив ранг определителя D (λ1) через s, заметим (в силу самого определения ранга матрицы), что величины ζs+1,…,ζn-1 все равны 0, где ζk (1≤k≤n-1)–сумма главных миноров к-го порядка в определителе D (λ1). Согласно 156, можем утверждать, что D (λ1) содержит по крайней мере один, отличный от нуля главный минор порядка s. Используя результат упражнения 157, убеждаемся, что ζs≠0. Заметив это, расcмотрим разложение D(λ1+y) по степеням у.
(à11 1 ) ó à12 ......... ..........à1n à21 Так как
(à22 1 ) ó... à2 n
D(λ1+y)= ................................................. an1
, то,
an 2 ................(ann 1 ) ó
используя результат упражнения 96, можем написать: D(λ1+y)=D(λ1)-ζn-1y+ζn-2y2-…+(-1)n-1ζ1yn-1+(-1)nyn=(-1)n-sζsyn-s+…+ +(-1)n-11ζ1yn-1+(-1)nyn. Мы видим, что младший, отличный от нуля, член разложения D(λ1+y) по степеням у, есть (-1)n-sζsyn-s. Учитывая результат упражнения 153, заключаем, что r=n-s, откуда s=n-r, ч.т.д. 159. Пусть А:RnRn есть симметричный линейный оператор с матрицей (относительно стандартного базиса в Rn )
a11 a12 ... a1n a a ... a 21 22 2 n [A]= .................. . an1 an 2 ... ann Множество всех собственных значений оператора А совпадает с множеством всех действительных корней характеристического многочлена
à11 à12 ......... à1n à21
à22 ... à2 n
, ........................ an1 an 2 .....ann являющегося многочленом n–ой степени относительно λ (см. упр. 104, замечание 4). Согласно результату упр. 141 (см. замечание 1, где использована алгебраическая замкнутость поля комплексных чисел, которая будет доказана позднее), указанный характеристический многочлен имеет только действительные корни, а именно имеет ровно n действительных корней, если каждый корень считать столько раз, какова его кратность. Пусть λ1,…,λк (1≤к≤n) суть все попарно различные корни характеристического
306
многочлена оператора А. Если кратность корня λi (i= 1, ê ) обозначить ri, то сказанное выше означает, что r1+…+rk=n. Множество всех собственных векторов оператора А, принадлежащих собственному значению λi, совпадает с множеством всех ненулевых решений системы линейных однородных уравнений (см. упр. 86, 104) (a11 i ) x1 a12 x2 ... a1n xn 0 a x (a ) x ... a x 0 21 1 22 i 2 2n n (*). ....................................... an1 x1 an 2 x2 ..... (ann i ) xn 0 Все решения системы (*) (включая нулевое) составляют линейное подпространство пространства Rn (см. 152) Нас будут интересовать линейно независимые собственные векторы оператора А (принадлежащие собственному значению λi), состаляющие базис указанного подпространства. Согласно доказанному в упр. 152, всякий такой базис состоит из n-s векторов, где s–ранг матрицы системы (*). Вспоминая результат упражнения 158, можем заключить, что s=n-ri, откуда следует, что максимальное число линейно независимых собственных векторов оператора А, принадлежащих собственному значению λi, равно ri (i= 1, ê ). Доказать, что симметричный линейный оператор А:RnRn имеет n попарно ортогональных собственных векторов. Указание. Пусть g1, g2,…, g r1 –линейно независимые собственные векторы оператора А, принадлежащие собственному значению λ1. Эти векторы не обязательно являются попарно ортогональными. Применяя процесс ортогонализации, указанный в упр. 81, получим попарно ортогональные векторы g1, g2,…, g r1 , где каждый вектор gi≠θ (2≤i≤r1) и явялется линейной комбинацией векторов g1, g2,…,gi. Следовательно, векторы g2,…, g r1 (как и вектор g1) являются собственными векторами оператора А, принадлежащими собственному значению λ1. Аналогично можно построить r2 попарно ортогональных собственных векторов оператора А, принадлежащих собственному значению λ2, и т.д. На к-м шагу мы построим rk попарно ортогональных собственных векторов оператора А, принадлежащих собственному значению λк. В результате получим конечную последовательность g1, g2,… g r1 …,gn собственных векторов оператора А, состоящую из n векторов (n=r1+r2+…+rk). При этом первые r1 из них попарно ортогональны и принадлежат собственному значению λ1. Следующие r2 из них также попарно ортогональны и принадлежат собственному значению λ2 и т.д. Наконец, последние rk из них попарно ортогональны и принадлежат собственному значению λ к. Согласно доказанному в упр. 86, собственные векторы симметричного линейного оператора, принадлежащие различным собственным значениям-ортогональны. Следовательно, конечная последовательность
307
g1, g2,…,gn состоит из попарно ортогональных собственных векторов оператора А, ч.т.д. Замечание. Разделив каждый из векторов g1, g2,…,gn на его длину, получим ортонормированную систему из собственных векторов оператора А. 160. Пусть f:RnR–квадратичная форма (неприводимая) с симметричной матрицей А:
a11 a12 ... a1n a21 a22 ... a2 n А= .................. a a ... a nn n1 n 2 Пусть также А: RnRn-линейный оператор с матрицей [A]=А. Тогда, как мы знаем (см. 143), для любого x=(x1, x2,…,xn)єRn имеет место равенство n
f(x)=
a
i , j 1
ij
xi x j =. Найдем все попарно различные корни λ1, λ2,…,λк
характеристического многочлена действительны!):
D(λ)
оператора А (все эти корни
à11 à12 ......... à1n à21
à22 ... à2 n
D(λ)= ........................ an1
an 2 .....ann
Кратности корней λ1, λ2,…,λк обозначим соответственно r1, r2,…,rк Числа λ1, λ2,…,λк являются собственными значениями оператора А (и других собственных значений он не имеет). Найдем также ортонормированную систему g1, g2,…,gn собственных векторов оператора А, существование которой доказано в упр. 159. Так как эти векторы линейно независимы (см. 81), то они составляют базис пространства Rn. Первые r1 из указанной конечной последовательности собственных векторов принадлежат собственному значению λ1, следующие r2 собственных векторов принадлежат собственному значению λ2 и т.д. Для любого x=(x1, x2,…,xn)=x1e1+x2e2+…+xnen из Rn обозначим через y1, y2,…,yn коэффициенты разложения вектора х по базису g1, g2,…,gn: x=y1g1+y2g2+…+yngn. Обозначим координаты вектора gi (i= 1, n ) через gi1, gi2,…, gin. Тогда gi=gi1e1+gi2e2+…+ginen и x1e1+x2e2+…+xnen=y1(g11e1+g12e2+…+g1nen)+ +y2(g21e1+g22e2+…+g2nen)+…+yn(gn1e1+gn2e2+…+gnnen). Cледовательно кординаты x1, x2,…,xn связаны с y1, y2,…,yn соотношениями: x1=g11y1+g21y2+…+gn1yn, x2=g12y1+g22y2+…+gn2yn,
308
……………………… xn=g1ny1+g2ny2+…+gnnyn.
(*)
Очевидно, что матрица линейного преобразования (*) ортогональна; следовательно, само линейное преобразование (*) ортогонально. Доказать, что линейное ортогональное преобразование (*) приводит квадратичную форму f к каноническому виду. Указание. Из равенств (*) следует, что x=x1e1+x2e2+…+xnen=y1g1+y2g2+…+yngn. Поэтому f(x)== = =< y11 g1 ... yr1 1 g r1 yr1 12 g r1 1 ... yr1 r2 2 g r1 r2 ... ynrk 1k g nrê 1 ... 2 2 2 2 +ynλkgn, y1g1+y2g2+…+yngn>=λ1 ( y1 ... y r1 ) 2 ( y r1 1 ... y r1 r2 ) ...
+ k ( ynrk 1 ... yn ). При этом мы учли, что система собственных векторов g1, g2,…,gn оператора А-ортонормированна. Замечание. Доказанное в упр. 160 дополняет результат, полученный в упр. 148. 161. Пусть, как и в упр. 160, f:RnR-квадратичная форма с 2
2
a11 a12 ... a1n a a ... a 21 22 2 n симметричной матрицей А= .................. и дискриминантом an1 an 2 ... ann
à11 à12 ......... à1n à21 à22 ........ à2 n d= .....................
≠0. Поставим вопрос о возможности приведения формы
an1 an 2 ........ann 2 2 2 f к каноническому виду 1 y1 2 y2 ... n yn с помощью линейного преобразования переменных вида
y1 x1 k12 x2 k13 x3 ... k1,n1 xn1 k1n xn
y2 x2 k 23 x3 ... k 2,n1 xn1 k 2 n xn ...................................................................... yn1 xn1 k n1,n xn yn xn
(*)
Определитель матрицы K преобразования (*), очевидно, равен 1. Обратное линейное преобразование, выражающее переменные x1, x2,…,xn через переменные y1, y2,…,yn–того же вида, что и (*).
309
Обозначим
à11 à12 ... ...à1 n1 d1= à11 , d2=
à11 à12 à13
à11 à12
à21 à22 ...... à2 n1
à21 à22 à23 ,…, d = n-1 ......................... à21 à22 , d3= a31 a32 a33 an1,1 an1, 2 ... an1,n1
и предположим все эти определители отличными от нуля. Обозначим также через В следующую матрицу:
1 0......0 0 ......0 2 В = .................. 0 0...... n Это-матрица
формы
f,
приведенной
к
каноническому
виду
ó ... n y . 2 1 1
2 n
Доказать, что если форма f может быть приведена к каноническому
d2 виду с помощью линейного преобразования вида (*), то α1=d1, α2= d 1 , …, d αn=
d n1 .
Указание. Согласно доказанному в упр. 145, матрицы A, K, B (при условии, что f приведена к виду, где [B]=В) связаны равенством
A=K B K, откуда d=detA=detB∙(detK)2=detB=α1α2…αn.
Рассмотрим
тождество
(относительно переменных x1,x2,…,xn-1,xn)
1 y12 2 y22 ... n1 yn21 n yn2 (a11x1 a12 x2 ... a1,n1 xn1 a1n xn ) x1 (a21x1 a22 x2 ... a2,n1 xn1 a2n xn ) x2 .......................................................... (an1,1 x1 an1, 2 x2 ... an1,n1 xn1 an1,n xn ) xn1 (an1 x1 an 2 x2 ... an,n1 xn1 ann xn ) xn , в котором под y1, y2,…,yn-1, yn
понимаются выражения (*). Если в этом тождестве положить xn=0, то получим тождество относительно переменных x1,x2,…,xn-1: 2 2 2 1 y1 2 y2 ... n1 yn1 =
(a11x1 a12 x2 ... a1,n1 xn1 ) x1
(1)
310
(a21x1 a22 x2 ... a2,n1 xn1 ) x2 +……………………………………….+
(an1,1 x1 an1, 2 x2 ... an1,n1 xn1 ) xn1 , где
y1 x1 k12 x2 k13 x3 ... k1,n1 xn1 y2 x2 k 23 x3 ... k 2,n1 xn1 .......................................................... yn1 xn1
(**)
Таким образом, квадратичная форма f1 с n-1 переменными x1,…,xn-1 и дискриминантом dn-1 оказывается приведенной к каноническому виду 1 y12 2 y22 ... n1 yn21 с помощью линейного преобразования (**) (того же вида, что и (*)) с определителем, равным 1. Рассуждая как и
d выше, найдем, что dn-1=α1, α2,…αn-1, откуда αn=
d n1 . Теперь в тождестве (1)
пологаем xn-1=0 и после рассуждений, аналогичных вышеприведенным,
d n1 найдем, что αn-1= d n2 . Продлжая так и далее, убедимся, что α1=d1, d d2 d n1 α2=
d 1 ,…, αn-1= d n2 , αn= d n1 .
Замечание. Можно доказать, на чем мы не останавливаемся (ввиду громоздкости доказательства), что при условиях d1≠0, d2≠0, …, dn-1≠0, d≠0 квадратичная форма f действительно приводится к каноническому виду
d1 y12
d d2 2 y2 ... yn2 с помощью линейного преобразования вида (*). d1 d n1
Если хотя бы при одном i= 1, n 1 di=0, то можно попытаться рассматривать переменные x1, x2,…,xn в таком порядке, чтобы условия di≠0 выполнялись. Однако это не всегда возможно (например, если квадратичная форма не содержит квадратов переменных). Для расмотрения подобных случаев мы отсылаем читателя к вышеупомянутой книге Э. Чезаро и другим подробным руководствам по линейной алгебре. Нижеследующий пример показывает, как на практике осуществляется приведение квадратичной формы к каноническому виду по способу, указанному в упр. 161. 162. Пример. Ограничиваясь случаем n=3, приведем к каноническому виду форму f
311
a11x12 a22x22 a33x32 2a12x1x2 2a13x1x3 2a23x2 x3 в предположении, что 2 d 2 a11a22 a12 0. d1 a11 0 и Имеем: f(x)= a a a11 ( x12 2 12 x1 x2 2 13 x1 x3 ) a22 x22 a33 x32 2a33 x2 x3 a11 a11 2 2 a13 a13 2a a a12 a12 2 2 a11( x1 x2 x3 ) x2 x32 12 13 x2 x3 a22 x22 a33 x32 a11 a11 a11 a11 a11
2 a a a a d 2 2 a11a33 a13 2a23 x2 x3 a y x2 x32 2 11 23 12 13 x2 x3 d1 a11 a11 2 11 1
2 a11a23 a12a13 a11a33 a13 (a11a23 a12a13 ) 2 2 d2 2 2 a y ( x2 õ3 ) õ3 x3 d1 d2 a11 a11d 2 2 11 1
2 2 )(a11a22 a12 ) (a11a23 a12a13 ) 2 2 d 2 2 (a11a33 a13 a y y2 x3 d1 a11d 2 2 11 1
2 2 2 2 2 a22a33 a11a33a12 a11a22a13 a11 a23 2a11a12a13a23 2 d 2 2 a11 d y y2 x3 d1 a11d 2 2 1 1
2 2 2 a22a13 a11a23 2a12a13a23 2 d 2 2 a11a22a33 a33a12 d y y2 x3 . d1 d2 2 1 1
Так как
à11 à12 à13 d= à21 à22 à23 =
a31 a32 a33 a11a22a33 a12a23a31 a21a32a13 a13a22a31 a23a32a11 a12a21a33 , то, в силу симметричности матрицы квадратичной формы, можем написать: 2 2 2 d= a11a22a33 2a12a13a23 a22a13 a11a23 a33a12. 2 Следовательно, f(x)= d1 y1
y1= x1 y2= y3=
d2 2 d 2 y2 y3 , где d1 d2
a a12 x2 13 x3 , a11 a11
x2
a11a23 a12a13 x3 d2
x 3. 163. Как уже отмечалось выше (см. 147), квадратичную форму можно привести к каноническому виду с помощью бесчисленного множества линейных преобразований. Если форма f:RnR неприводима (в этом упражнении мы ограничимся этим случаем), то привести ее к
312
каноническому виду можно только с помощью невырожденного линейного преобразования (см. упр. 145), т.е. такого, у которого определитель матрицы преобразования отличен от нуля. Пусть преобразования
y1 b11x1 b12 x2 ... b1n xn y2 b21x1 b22 x2 ... b2 n xn ............................................ yn bn1 x1 bn 2 x2 ... bnn xn
(*) и
z1 c11x1 c12 x2 ... c1n xn z 2 c21x1 c22 x2 ... c2 n xn ............................................ z n cn1 x1 cn 2 x2 ... cnn xn
(**)
оба невырождены и первое из них приводит форму f к каноническому 2 2 2 виду 1 y1 2 y2 ... n yn , а второе-к каноническому виду
1 z12 2 z22 ... n zn2 (числа αi и βj все отличны от нуля). Возникает вопрос: зависит ли число положительных квадратов (а, следовательно, и число отрицательных квадратов) в каноническом виде формы f от выбора того или иного невырожденного преобразования, приводящего форму f к каноническому виду? При этом выражение αiyi2 мы называем положительным квадратом, если αi>0. Если же αi<0, то указанное выражение мы называем отрицательным квадратом. Доказать следующий, указанный Сильвестром, закон инерции квадратичных форм f:RnR: во всех различных представлениях квадратичной формы в каноническом виде число положительных квадратов одно и то же (а, следовательно, одно и то же число отрицательных квадратов). Указание. Обозначим число положительных квадратов в 2 2 2 представлении 1 y1 2 y2 ... n yn формы f через р (р может быть любым неотрицательным целым числом в пределах от 0 до n), а число 2 2 2 положительных квадратов в представлении 1 z1 2 z2 ... n zn -через q. Требуется доказать, что р=q Допустим, что р≠q и пусть, например, р
313
равенство 1 y1 ... n yn = 1 z1 ... n zn может иметь место только при x1=0, x2=0,…, xn=0 (ибо преобразования (*) и (**)-невырожденные). Пусть р=0, а 0
2
2
коэффициенты j1 , j2 ,..., js линейных однородных уравнений
2
отрицательны.
c j11 x1 c j1 2 x2 ... c j1n xn 0 c j21 x1 c j2 2 x2 ... c j2n xn 0 .................................... c x c x ... c x 0 js 2 2 js n n js 1 1
Расмотрим
систему
(1)
Ранг r матрицы этой системы не превосходит s: r≤s
j , j ,..., j
(s=n-q) суть отрицательные коэффициентов βj. Расcмотрим систему 1
2
s
коэффициенты
срeди
314
bi11 x1 bi1 2 x2 ... bi1n xn 0 bi21 x1 bi2 2 x2 ... bi2n xn 0 .................................... bi p 1 x1 bi p 2 x2 ... bi p n xn 0 c j11 x1 c j1 2 x2 ... c j1n xn 0 c x c x ... c x 0 j2 2 2 j2n n j2 1 1 ........................................ c js 1 x1 c js 2 x2 ... c jsn xn 0
(2)
Ранг r матрицы этой системы не превосходит числа p+s=p+n-q= =n-(q-p)
315
из которых равны 0, она принимает положительные значения. Аналогично определяется отрицательно определенная (существенно отрицательная, определенная отрицательная) квадратичная форма. Квадратичная форма f:RnR называется неопределенной, если она может принимать значения разных знаков. Квадратичная форма называется положительно полуопределенной, если она, не будучи способна принимать отрицательные значения, все же не является определенной, так как обращается в нуль не только при нулевых значениях всех переменных. Аналогично определяется отрицательно полуопределенная квадратичная форма. Нижеследующие примеры взяты из книги Г.М. Фихтенгольца «Курс дифференциального и интегрального исчисления», т.I. 1. Расмотрим квадратичную форму 6x12+5x22+14x32+4x1x2-8x1x3-2x2x3. Легко проверить, что эту форму можно представить в следующем каноническом виде: (2x1-3x3)2+ +2(x1+x2+x3)2+3(x2-x3)2. Чтобы выяснить, является ли эта форма положительно определенной или полуопределенной, x1 x 2 x3 0 3x3 0 . Так следует решить систему уравнений: 2 x1 x 2 x3 0 как определитель этой системы d=7≠0, то все три выражения 2x1-3x3, x1+x2+x3, x2-x3 обращаются в 0 только при x1=x2=x3=0. Следовательно, данная квадратичная форма является положительно определенной. Поменяв знаки коэффициентов формы, получим отрицательно определенную форму. 2. Квадратичная форма 6x12+x22+x32+8x1x2-8x1x3-2x2x3 является неопределенной, так как при х1=1, х2=0 и х3=0 она принимает положительное значение (6), а при х 1=1, х2=-1 и х3=0 она принимает отрицательное значение (-1). 3. Квадратичная форма x12+x22+x32+2x1x2+2x1x3+2x2x3= =(x1+x2+x3)2 является положительно полуопределенной, так как она (не принимая отрицательных значений) обращается в 0 не только при нулевых значениях всех переменных (например, она обращается в нуль при х1=-2, х2=1 и х3=1). Поменяв знаки коэффициентов данной квдаратичной формы, получим отрицательно полуопределенную квадратичную форму. В приложениях часто приходится иметь дело с положительно определенными квадратичными формами. Каноническое представление такой формы не может содержать отрицательных квадратов. В самом деле, пусть каноническое представление неприводимой положительно определенной формы f:RnR имеет вид (для упрощения записи вначале выписаны все положительные квадраты числом p(1≤p
316
f(x)= 1 y1 2 y2 p y p p1 y p1 .. n yn , где переменные yj связаны с переменными xi равенствами 2
2
2
2
y1 k11x1 k12 x2 ... k1n xn y k x k x ... k x 21 1 22 2 2n n 2 ........................................... y p k p1 x1 k p 2 x2 ... k pn xn ........................................... yn k n1 x1 k n 2 x2 ... k nn xn
2
все
αi>0,
а
(*).
Преобразование (*)-невырожденное, т.е. определитель матрицы K этого преобразования отличен от 0, а это значит, что строки матрицы линейно независимы. Рассмотрим следующую систему линейных однородных уравнений:
k11x1 k12 x1 ... k1n xn 0 k x k x ... k x 0 21 1 22 1 2n n ......................................... k p1 x1 k p 2 x1 ... k pn xn 0
(**)
Ранг матрицы этой системы равен р, поэтому n-p неизвестным из числа x1, x2,…,xn можно придать произвольные ненулевые значения, после чего остальные р неизвестных определяются из системы (**) однозначно. Выбрав, таким образом значения переменных x1, x2,…,xn, мы убедимся, что при этих значениях (среди которых не все равны 0) у1=0, у2=0, …, ур=0 и квадратичная форма принимает значение ≤0. Это противоречит предположению о том, что форма f является положительно определенной. Значит, действительно, неприводимая положительно определенная квадратичная форма в любом ее каноническом представлении не может содержать отрицательных квдаратов. Доказать принадлежащий Сильвестру следующий критерий положительной определенности квадратичной формы: для того, чтобы
a11 a12 ... a1n a21 a22 ... a2 n неприводимая квадратичная форма f:RnR с матрицей А= .................. a a ... a nn n1 n 2 ( aij a ji ) была положительно определенной, необходимы и достаточны
317
следующие условия: d1>0, d2>0,…, dn-1>0, d>0, где d1= a11 , d=det
А,
а при
à11 à12 ... ...à1 à21 à22 ...... à2 2≤ν≤n-1 dν= ..................
.
a 1 a 2 ... a Указание. Если принять во внимание замечание к упр. 161, то достаточность укaзанных условий становится очевидной. Для доказательства необходимости указанных условий следует убедиться, что при их нарушении форма f не может быть положительно определенной. Нарушение указанных условий означает одно из двух. 1) Среди чисел d1, d2,…,dn-1 имеются один или несколько нулей (d≠0, так как форма f неприводима); 2) Среди чисел d1, d2,…,dn-1, d нет нулей, но имеются одно или несколько отрицательных чисел. Рассмотрим сперва случай 2). В этом случае форма f невырожденным преобразованием переменных может быть приведена к виду (см. замечание к упр. 161) 2 f(x)= d1 y1
d d2 2 d 2 y2 ... n1 yn21 yn d1 d n2 d n1
(1)
Не может быть, чтобы все коэффициенты при квадратах в правой части были положительными числами: если бы это было так, то выполнялись бы неравенства d1>0, d2>0,…, dn-1>0, d>0, а мы рассматриваем случай, когда среди чисел d1, d2,…,dn-1, d есть отрицательные. Значит, каноническое представление (1) формы f содержит отрицательные квадраты. Но тогда форма f не может быть положительно определенной, как это доказано выше в этом же упражнении. Рассмотрим теперь случай 1). Если d1= à11 =0, то f(x)=
x1 (2a12 x2 2a13 x3 ... 2a1n xn ) a22 x22 ... ann xn2 2a23 x2 x3 ... 2an1,n xn1 xn . Заметим, что среди чисел à12 , a13 ,..., a1n хотя бы одно отлично от нуля, ибо в противном случае вся первая строка в определителе d оказалась бы состоящей из нулей, что невозможно, ибо d≠0. Пусть, для определенности, à 1 , x2=x4=…=xn=0, будем иметь: f(x)=x1+ 332 , где под 4a13 2a13 1 х понимается вектор (х1, 0, , 0, …, 0). Теперь ясно, что при достаточно 2a13
à13 ≠0. Выбрав х3=
больших положительных значениях х1 f(x)>0, а при достаточно больших по абсолютной величине отрицательных значениях х1 f(x)<0. Следовательно, при à11 =0 форма f являетcя неопределенной.
318
Пусть теперь d1≠0, но хотя бы один из определителей d2,…,dn-1 имеет нулевое значение. Пусть dk–первый из равных нулю определителей в конечной последовательности d2,…,dn-1. Тогда dk=0, а dk-1≠0. Рассмотрим систему линейных однородных уравнений:
a11x1 a12 x2 ... a1k xk 0 a21x1 a22 x2 ... a2 k xk 0 ......................................... a x a x ... a x 0 k 1, 2 2 k 1,k k k 1,1 1 ak1 x1 ak 2 x2 ... akk xk 0
(2)
Так как dk=0, а dk-1≠0, то последнее уравнение системы (2) является линейной комбинацией остальных. Из первых к-1 уравнений системы (2) A Ak1 A xk , x2= k 2 xk ,…, xk-1= k ,k 1 xk , по правилу Крамера находим: x1= d k 1 d k 1 d k 1 где Aki (i=1, 2, …, k-1)–алгебраическое дополнение элемента àki в определителе dk. При любом хк и указанных значениях х1, х2, …, хк-1 все равенства системы (2) будут выполняться. Выбрав так значения х1, х2, …, хк-1 (оставляя «на потом» выбор значений хк, хк+1, …, хn), будем иметь: f(x)= = (a1,k 1 xk 1 ... a1n xn ) x1
(a2,k 1 xk 1 ... a2 n xn ) x2 +………………………….+
(ak ,k 1 xk 1 ... akn xn ) xk
(ak 1,1 x1 ak 1, 2 x2 ... ak 1,k xk ak 1,k 1 xk 1 ... ak 1,n xn ) xk 1 +………………………………………………………………………...+ + (an1 x1 an 2 x2 ... an,k xk an,k 1 xk 1 ... ann xn ) xn
2[(a1,k 1 xk 1 ... a1n xn ) x1 (a2,k 1 xk 1 ... a2n xn ) x2 ... 2 xê [(a1,k 1 xk 1 ... a1n xn ) Ak1 d k 1 (a2,k 1 xk 1 ... a2n xn ) Ak 2 ... (ak ,k 1 xk 1 ... akn xn ) Akk ]
(ak ,k 1 xk 1 ... akn xn ) xk ]
=αxk +β, где Акк=dk-1 есть алгебраическое дополнение элемента àkk в определителе dk,
2
[(a1,k 1 xk 1 ... a1n xn ) Ak1 (a2,k 1 xk 1 ... a2 n xn ) Ak 2 ... d k 1 (ak ,k 1 xk 1 ... akn xn ) Akk ],
(ak 1,k 1 xk 1 ... ak 1,n xn ) xk 1 ... (an,k 1 xk 1 ... ann xn ) xn .
319
Как видим, α и β зависят только от переменных хk+1, хk+2, …, хn. Если α не обращается в 0 тождественно, то, придав переменным хk+1, …, хn любые значения, не обращающие α в 0, всегда можно дать переменной х к такое положительное или отрицательное значение, достаточно большое по абсолютной величине, чтобы квадратическая форма f получила по желанию положительное или отрицательное значение. Итак, если α не обращается в 0 тождественно, то форма f оказывается неопределенной. Остается убедиться, что α не обращается тождественно в нуль. Учитывая симметричность матрицы A, а также тот факт, что определитель любой матрицы равен определителю транспонированной матрицы, легко убедиться в том (это предоставляется читателю), что в определителе dk Ак1=А1к, Ак2=А2к, Ак3=А3к, …, Ак,к-1=Ак-1,к. Поэтому выражение для α можно представить в виде: 2 [(a1,k 1 xk 1 ... a1n xn ) A1k (a 2,k 1 xk 1 ... a 2 n xn ) A2 k ... α= d k 1
(ak ,k 1 xk 1 ... akn xn ) Akk ]
à11 à12 .........a1,k 1 a1,k 1 xk 1 ... à1n xn 2 d k 1
à21 à22 ........a2,k 1 a2,k 1 xk 1 ... a2 n xn ............................................................... ak 1,1 ak 1, 2 ...ak 1,k 1 ak 1,k 1 xk 1 ... ak 1,n xn ak 1
ak , 2 ....ak ,k 1
ak ,k 1 xk 1 ... akn xn
Поясним: чтобы получить из последнего выражения для α предыдущее, следует разложить определитель по элементам последнего столбца. Теперь допустим, что α тождественно равен 0. Полагая хк+1=1, хк+2=0,…, хn=0, получим, что
à11 à12 .........a1,k 1 a1,k 1 à21 à22 ........a2,k 1 a2,k 1 .................................. 0 ak 1,1 ak 1, 2 ...ak 1,k 1 ak 1,k 1 ak1
ak , 2 ....ak ,k 1
ak ,k 1
Полагая затем хк+1=0, хк+2=1, хк+3=0,…,хn=0 и т.д. и учитывая, что dk=0, будем иметь:
320
à11 à12 .........a1,k 1 a1 j à21 à22 ........a2,k 1 a2 j ............................... 0 ak 1,1 ak 1, 2 ...ak 1,k 1 ak 1, j ak1
ak , 2 ....ak ,k 1
при всех j=k, k+1, …, n
akj
Из этого следует (см. упр. 113), что в матрице
a11 a12 ........ a1,k 1 a1k a1,k 1 .........a1n a21 a22 ... ....a2,k 1 a2 k a2,k 1 .........a2 n .................................................... ak 1,1 ak 1, 2 ...ak 1,k 1 ak 1,k ak 1,k 1 ...ak 1,n ak1 ak 2 ...... ak ,k 1 akk ak ,k 1 .....akn
к-я строка является линейной комбинацией первых к-1 строк этой матрицы. Но это означает, что в определителе d к-я строка является линейной комбинацией первых к-1 строк. Это обстоятельство влечет за собой равенство нулю определителя d–дискриминанта формы f (см. упр. 94), что противоречит неприводимости этой формы. Значит, допущение о том, что α≡0, -неверно и критерий Сильвестра доказан. 165. Функцию f:CnC, т.е. функцию n комплексных переменных со значениями в множестве С всех комплексных чисел, будем называть целой рациональной функцией n комплексных переменных, если при любом z=(z1, z2,…,zn)єCn величина f(z)=f(z1, z2,…,zn) представима в виде конечной k1
k2
kn
суммы членов вида Az1 z2 ,..., zn , где А-комплексная постоянная, показатели к1, к2, …, кn суть целые неотрицательные числа и предполагается, что ни число членов указанной суммы, ни коэффициенты членов, ни показатели кi не зависят от выбора z (величины А и кi могут меняться при переходе от одного члена к другому). Чтобы это предположение стало вполне определеным, следует считать члены суммы расположенными в определенном порядке. Например, можно считать их расположенными в порядке убывания суммы к1+к2+ …+кn. Если последняя сумма одинакова в нескольких членах, то первым можно считать тот из этих членов, в котором показатель к1 имеет наибольшее значение (а при равенстве показателей при z1 первым членом считать тот, у которого больше показатель при z2 и т.д.). Аналогичным образом можно определить понятие целой рациональной функции n действительных переменных (с той лишь разницей, что коэффициенты членов Aj и сами переменные будут действительными числами).
321
В этом упражнении нас будут интересовать целые рациональные симметрические функции, т.е. такие целые рациональные функции f, что для любых значений переменных z1, z2,…,zn f(z1, z2,…,zn)=f( zi1 , zi2 ,..., zin ) , где (i1, i2,…,in)–любая перестановка цифр 1, 2, …,n. Такими функциями являются, в первую очередь, так называемые элементарные симметрические функции: c1=z1+z2+…+zn, c2=z1z2+z1z3+…+zn-1zn, c3=z1z2z3+z1z2z4+…+zn-2zn-1zn, …………………………….. cn=z1z2….zn. Здесь выражения для ск (2≤k≤n) получаются следующим образом. Берутся всевозможные сочетания по к элементов из элементов множества {z1, z2,…,zn}, считая элементы zi и zj различными при i≠j даже в случае совпадения численных значений этих элементов. В каждом таком сочетании элементы перемножаются и сумма полученных таким образом произведений и представляет собой ск. Далее, важными симметрическими функциями являются функции p sp= z1 z 2p ... z np , где р-любое неотрицательное целое число. При р=0 считаем s0=n, при p=1 ясно, что s1=c1. Найти выражения s2, s3, s4 через элементарные симметрические функции. Указание. При n≥2 имеем: 2 c1 ( z1 z2 ... zn ) 2 z12 z22 ... z n2 2 z1 z2 ... 2 zn1 zn , т.е. c12 s2 2c2 , откуда s2 c12 2c2 . c12 s2 2c2 Далее, при n=3 из равенства следует, что c13 s2 c1 2c1c2 ( z12 z22 z32 )( z1 z2 z3 ) 2c1c2 s3 2c1c2 ( z12 z2 z12 z3 z 22 z1 z 22 z3 z32 z1 z32 z 2 ). Так как c1 c2 ( z1 z 2 z3 )( z1 z 2 z1 z3 z 2 z3 ) 3c3 ( z12 z 2 z12 z3 z 22 z1 z 22 z3 z32 z1 z32 z 2 ), c13 s3 2c1c2 c1c2 3c3 , то s3 c13 3c1c2 3c3 .
т.е.
c13 s3 3c1c2 3c3 ,
откуда
Чтобы доказать справедливость этой формулы при n>3, воспользуемся методом математической индукции. Пусть указанная формула справедлива для некоторого числа n≥3 переменных z1, z2,…,zn (могущих принимать любые значения). Докажем, что формула останется справедливой и для n+1 переменных z1, z2,…,zn, zn+1. Обозначения элементарных симметрических функций от переменных z1, z2,…,zn, zn+1. используем такие: с1, с2, с3, а элементарные симметрические функции от переменных z1, z2,…,zn будем обозначть по прежнему с1, с2, с3. Так как
322
с1=с1+zn+1, то (с1)3= c13 3c1 z n1 c1 z n31 s3 3c1c2 3c3 3c1 z n1 c1 z n31 s3 3c1c2 3c3 3c1 zn1 c1 s3 3(c1 zn1 )c2 3c3 3c1 (c1 z n1 ). Здесь мы обозначили s3 z13 z 23 ... z n3 z n31 s3 z n31. Замечая, что c1∙zn+1=c2-c2, будем иметь: (с1)3=
s3 3c1c2 3z n1 c2 3c3 3c1c2 3c1c2 s3 3c1c2 3(c3 z n1 c2 ) s3 3c1c2 3c3 ,
откуда s3 (c1 ) 3 3c1c2 3c3 , ч.т.д. При n=4 из равенства
c13 s3 3c1c2 3c3
следует,
что
c s3c1 3c c 3c1c3 4 1
2 1 2
( z13 z 23 z33 z 43 )( z1 z 2 z3 z 4 ) 3c12 c2 3c1c3 s4 z12 ( z1 z 2 z1 z3 z1 z 4 ) z 22 ( z1 z 2 z 2 z3 z 2 z 4 ) z32 ( z1 z3 z 2 z3 z3 z 4 ) z 42 ( z1 z 4 z 2 z 4 z3 z 4 ) 3c12 c2 3c1c3 . Но c1c3=
( z1 z 2 z3 z 4 )( z1 z 2 z3 z1 z 2 z 4 z1 z3 z 4 z 2 z3 z 4 ) 4c4 z12 ( z 2 z3 z 2 z 4 z3 z 4 ) z 22 ( z1 z3 z1 z 4 z3 z 4 ) z32 ( z1 z 2 z1 z 4 z 2 z 4 ) z 42 ( z1 z 2 z1 z3 z 2 z3 ).
Поэтому
c14 s4 3c12 c2 4c1c3 ( z12 z22 z32 z 42 )c2 4c4 s4 3c12 c2 4c1c3 s2 c2 4c4
s4 3c12 c2 4c1c3 (c12 2c2 )c2 4c4 s4 4c12 c2 4c1c3 2c22 4c4 , откуда s4 c14 4c12 c2 4c1c3 2c22 4c4 .
Доказательство справедливости этой формулы при n>4 методом математической индукции предоставляется читателю. Замечание. Анализируя доказанные формулы для sp (p=2, 3, 4) при n≥p, мы видим, что правая часть формулы, выражающей sp через элементарные симметрические функции ск, обязательно содержит член
ñ1ð (с коэффициентом 1) и член ср (с коэффициентом (-1)р-1р). Кроме того, ни один из членов правой части указанной формулы не содержит с к с к>р. Далее, все эти члены имеют своими коэффициентами целые числа. mp m m Каждый из этих членов имеет вид ñ1 1 ñ2 2 ... ñ p , где коэффициент αцелое число, а показатели m1, m2,…,mp суть целые неотрицательные числа. mp m m Число 1xm1+2xm2+…+pxmp будем называть весом члена ñ1 1 ñ2 2 ... ñ p . Легко видеть, что все члены правой части формулы для sp (при р=2,3,4) имеют своим весом число р. Если указанные наблюдения верны и для р>4 (и n≥p), то мы легко можем написать формулы, выражающие s5, s6 и т.д. через элементарные симметрические функции. Например, 5 3 2 2 s5= c1 c1 ñ2, c1 c3 ñ1 c2 ñ1c4 c2 c3 5c5 . Для нахождения коэффициентов α, β,…, μ следует придать переменным z1, z2,…,z5 (считаем n=р=5) подходящие значения. Полагая z1=z2=1, z3=z4=z5=0, будем иметь: 4α+γ=-15. Полагая затем z1=1, z2=-2, z3=z4=z5=0, найдем: α-2γ=-15.
323
Следовательно, α=-5, γ=5 и s5 принимает вид: 5 3 2 2 s5= c1 5c1 ñ2, c1 c3 5ñ1 c2 ñ1c4 c2 c3 5c5 . Полагая z1=1, z2=1, z3=-2, z4=z5=0, получим: μ=-5. Далее, при z1=z2=z3=1, z4=-2, z5=0, находим: -29=1+15-5β+45-2δ-75, откуда 5β+2δ=15. Наконец, при z1=z2=z3=z4=1, z5=0, будем иметь: 4=1024-1920+64β+720+4δ-120, откуда 16β+δ=75. Следовательно, β=5, δ=-5 и окончательно s5= c15 5c13ñ2 5c12 c3 5ñ1 c22 5ñ1c4 5c2 c3 5c5 (*) Чтобы проверить справедливость этого тождества (относительно переменных zi) воспользуемся формулой Жирара, которую докажем позднее: pcp=s1cp-1- s2cp-2+ s3cp-3-…±sp Полагая р=5, будем иметь: 5c5=s1c4- s2c3+ s3c2- s4c1+s5, откуда s5=c1(s4-c4)+ s2c3- s3c2+5c5. Подставляя доказанные выше выражения для s2, s3, s4 через элементарные симметрические функции, получим: s5 ñ1 (c14 4c12 ñ2 4c1 c3 2c22 4c4 c4 ) (c12 2c2 )ñ3 (c13 3c1 ñ2 3c3 )c2 5c5 c15 4c13ñ2 4c12 c3 2c1c22 5c1c4 c12 c3 2c2 ñ3 c13c2 3c1 ñ22 3c2 c3 5c5 c15 5c13ñ2 5c12 c3 5c1c22 5c1c4 5c2 ñ3 5c5 , что совпадает с тождеством
(*). Заметим еще, что формулы, выражающие величины sp через элементарные симметрические функции, сохраняют свою силу и при nn. Например при n=2 s4 выражается формулой s4 c14 4c12 ñ2 2c22 (c3=0 и c4=0). В самом деле, c1=z1+z2, c2=z1z2, ñ12 z12 2 z1 z2 z22 ,
ñ14 z14 4 z12 z22 z24 4 z13 z2 2 z12 z22 4 z1 z23 z14 z24
6 z12 z 22 4 z13 z 2 4 z1 z 23 . Следовательно, ñ14 4ñ12 ñ2 2ñ22 s4 6 z12 z 22 4 z13 z 2 4 z1 z 23 4 z1 z 2 ( z12 2 z1 z 2 z 22 ) 2 z12 z 22 s4 6 z12 z 22 4 z13 z 2 4 z1 z 23 4 z13 z 2 8z12 z 22 4 z1 z 23 2 z12 z 22 s4 , ч.т.д.
166. Доказать, что для всякого многочлена f:СC степени n≥2, имеющего вид (при всех zєC) f(z)= z n a1 z n1 a2 z n2 ... an1 z an (a0 1) , справедлива теорема Виета: a1 c1 , a2 c2 ,..., an (1) cn , где c1, c2, …,cn суть значения элементарных симметрических функций от корней z1, n
324
z2,…,zn многочлена f, т.е. c1=z1+z2+…+zn, c2=z1z2+z1z3+…+zn-1zn, c3=z1z2z3+z1z2z4+…+zn-2zn-1zn, …………………………….. cn=z1z2….zn. Заметим, что многочлен f может иметь кратные корни, так что в конечной последовательности z1, z2,…,zn каждый корень многочлена f фигурирует столько раз, какова его кратность. Указание. Из алгебраической замкнутости поля комплексных чисел (которая будет доказана позднее) следует (см. упр. 19 и 139), что f(z) (при любом zєC) можно представить в виде: f(z)=(z-z1)(z-z2)…(z-zn), где zi–корни многочлена f. Но легко видеть, что (z-z1)(z-z2)=z2-(z1+z2)z+z1z2, (z-z1)(z-z2)(z-z3)= z3-(z1+z2+z3)z2+(z1z2+z1z3+z2z3)z-z1z2z3 и т.д. Для строгого доказательства теоремы Виета следует применить метод математической индукции. 167. Из формулы Жирара (правда, еще не доказанной) и из формул (доказанных в упр. 165), выражающих s1, s2, s3 через элементарные симметрические функции, легко вывести (используя метод математической индукции), что целые рациональные симметрические p p p функции s p z1 z 2 ... z n при любом натуральном р могут быть представлены как целые рациональные функции от элементарных симметрических функций c1, c2, …,cn. Поставим себе целью доказать (используя метод, принадлежащий Коши), что любая целая рациональная симметрическая функция F от переменных z1, z2,…,zn может быть представлена как целая рациональная функция от элементарных симметрических функций c1, c2, …,cn. Прежде, чем перейти к общему случаю, рассмотрим (используя методику Коши) конкретный пример. Пусть (n=3) F(z1, z2, z3)= z12 z 2 z12 z3 z1 z 22 z 22 z3 z1 z32 z 2 z32 . Имея целью представить F как целую рациональную функцию от с1, с2, с3, введем в рассмотрение следующие три многочлена f, f1, f2 называемые модулями Коши: f(z)=(z-z1)(z-z2)(z-z3)=z3-c1z2+c2z-c3; f1 есть частное от деления f на двучлен z-z1, а f2 есть частное от деления f1 на двучлен z-z2. Легко проверить (это предоставляется читателю), что f1(z)=z2+ +(z1-c1)z+ ( z12 ñ1 z1 ñ2 ) , а остаток от деления f на z-z1 равен z13 ñ1 z12 ñ2 z1 c3 , т.е. равен 0 (как и должно быть), что обнаруживается после подстановки вместо с1, с2, с3 их значений: c1=z1+z2+z3, c2= =z1z2+z1z3+z2z3, c3=z1z2z3. Коэффициенты многочлена f1 явно зависят от z1 и неявно (через с1 и с2)-от z2 и z3. Если подставить вместо с1 и с2 их
325
выражения через z1, z2, z3 , то получится (как и должно быть), что f1(z)=z2-(z2+z3)z+z2z3. Корнями многочлена f1 являются z2 и z3. Далее, f2(z)=z+(z1+z2-c1) и корнем многочлена f2 является z3, а свободный член явно зависит от z1 и z2 и неявно (через с1)-от z3. Заметим еще, что коэффициенты многочленов f1 и f2 суть целые рациональные функции переменных zi. Теперь в выражении F(z1, z2, z3) заменим z3 на z и рассмотрим полученное выражение как многочлен относительно z: F(z1, z2, z)=(z1+z2)z2+ ( z12 z 22 ) z ( z12 z 2 z1 z 22 ). Деля этот многочлен на f2, получим: F(z1, z2, z)=f2(z)·Q(z)+F1(z1, z2, c1), (1), где, как легко проверить, F1(z1, z2, c1)= ñ12 ( z1 z 2 ) 2c1 z1 z 2 ñ1 ( z1 z 2 ) 2 3( z12 z 2 z1 z 22 ) или F1(z1, z2, c1)= ñ12 ( z1 z2 ) c1 ( z12 4 z1 z2 z22 ) 3( z12 z2 z1 z22 ). Полагая в (1) z=z3, будем иметь: F(z1, z2, z3)= F1(z1, z2, c1) (2). В правую часть тождества (2) z3 входит неявно, через с1. Таким образом, мы «освободились» от «явной» переменной z3. Теперь в выражении F1(z1, z2, c1) заменим z2 на z и рассмотрим полученное выражение как многочлен относительно z: F1(z1, z, с1)=(3z1-c1)z2+ (3z12 4c1 z1 ñ12 ) z (ñ12 z1 c1 z12 ). Деля этот многочлен на f1, получим: F1(z1, z, с1)= f1(z)·Q1(z)+F2(z1,c1, c2), (3), 3 2 где F2(z1, c1, c2)= 3z1 3c1 z1 3ñ2 z1 ñ1 c2 . Полагая в (3) z=z2 и учитывая (2), получим: F(z1, z2, z3)= 3z13 3c1 z12 3ñ2 z1 ñ1 c2 . (4). В правую часть тождества (4) z2 и z3 входят неявно, через с1 и с2. Таким образом, мы «освободились» от «явных» переменных z2 и z3. Теперь заменим в правой части тождества (4) z1 на z и разделим полученный многочлен относительно z на многочлен f. Будем иметь: 3z 3 3c1 z 2 3ñ2 z ñ1 c2 -3f(z)+c1c2-3c3. Полагая здесь z=z1 и учитывая (4), окончательно находим: F(z1, z2, z3)=c1c2-3c3, т.е. 2 2 z1 z 2 z1 z3 z1 z 22 z 22 z3 z1 z32 z 2 z32 c1c2 3c3 (5). Таким образом, целая рациональная симметрическая функция, фигурирующая в левой части тождества (5), представлена как целая рациональная функция от элементарных симметрических функций с1, с2, с3. Столь громоздкий прием применен лишь с целью проиллюстрировать методику Коши. На практике для представления целой рациональной симметрической функции в виде целой рациональной функции от элементарных симметрических функций частно пользуются формулами для sp, доказанными в упр. 165 и выводимыми из формулы Жирара. Например, в случае расмотреной выше функции F имеем:
326
F(z1,z2,z3)= z12 ( z 2 z3 ) z 22 ( z1 z3 ) z32 ( z1 z 2 ) z12 (c1 z1 ) z 22 (c1 z 2 ) z32 (c1 z3 )
=c1s2-s3= c1 (c12 2c2 ) (c13 3c1c2 3c3 ) c13 2c1c2 c13 3c1c2 3c3 c1c2 3c3 . Доказать, что всякая целая рациональная симметрическая функция F от переменных z1, z2,…,zn может быть представлена как целая рациональная функция от элементарных симметрических функций c1, c2, …,cn. Указание. Как и в вышерассмотренном примере, следует образовать модули Коши f, f1, f2, …,fn-1: f(z)=zn-c1zn-1+c2zn-2-…+(1)ncn, f1 есть частное от деления f на z-z1, f2 есть частное от деления f1 на z-z2 и т.д.; fn-1 есть частное от деления fn-2 на z-zn-1. Многочлен f имеет своими корнями z1, z2,…,zn. Многочлен f1 имеет своими корнями z2,…,zn, а его коэффициенты явно зависят от z1 и неявно-через величины с1, с2,…-от z2, z3,…,zn. При этом коэффициенты многочлена f1 получаются из z1 и величин ci с помощью операций сложения и умножения. Многочлен f2 имеет своими корнями z3,…,zn, а его коэффициенты явно зависят от z1 и z2 и неявно-через величины ci-от z3,…,zn. При этом коэффициенты многочлена f2 получаются из z1, z2 и величин ci с помощью операций сложения и умножения. Аналогичное можно сказать о многочленах f3, …,fn-2. Многочлен fn-1 имеет своим корнем zn, а его коэффициенты явно зависят от z1, z2,…,zn-1 и неявно-через величины ci- от zn. При этом коэффициенты многочлена fn-1 получаются из z1, z2,…,zn-1 и величин ci с помощью операций сложения и умножения. Заметим, что в конечной последовательности f, f1, f2,…, fn-1степень каждого многочлена, начиная со второго, на единицу меньше степени предыдущего. Теперь перейдем к представлению целой рациональной симметрической функции F (от переменных z1, z2,…,zn) в виде целой рациональной функции от c1, c2, …,cn. 1-ый шаг. Заменяем в выражении F(z1, z2,…, zn-1, zn) zn на z и делим полученный многочлен относительно z на многочлен fn-1: F(z1, z2,…, zn-1, z)=fn-1(z)·Q(z)+F1(c;z1, z2, …, zn-1) (*), где F1(c; z1, z2,…, zn-1) есть остаток от деления. Запись F1(c; z1, z2,…, zn-1) означает, что выражение F1(…) явно содержит величины ci, а также z1, z2,…, zn-1, но zn явно не содержит (а только через величины ci). Кроме того, F1(…) не содержит переменной z, так как многочлен fn-1-первой степени относительно z. Полагая в (*) z=zn и учитывая, что fn-1(zn)=0, будем иметь: F(z1, z2,…, zn-1, zn)= F1(c; z1, z2,…, zn-1) (**) Это-тождество относительно z1, z2,…, zn (если раскрыть выражения ci, входящие в F1(…)).
327
2-ой шаг. В выражении F1(c; z1, z2,…, zn-2, zn-1) заменяем zn-1 на z и делим полученный многочлен относительно z (F1 есть целая рациональная функция относительно величин ci и z1,…, zn-1) на fn-2: F1(c; z1, z2,…, zn-2, z)=fn-2(z)·Q1(z)+F2(c;z1, …, zn-2, z), (***) где F2 есть целая рациональная функция всех своих аргументов, а относительно z представляет собой многочлен степени не выше первой. Убедимся, что на самом деле F2 не содержит z. Подставляя в (***)zn-1 вместо z, получим: F1(c; z1, z2,…, zn-2, zn-1)= F2(c; z1,…, zn-2, zn-1) (****). Если же положить в (***) z=zn, то будем иметь: F1(c; z1, z2,…, zn-2, zn)= F2(c; z1,…, zn-2, zn). Левые части двух последних тождеств совпадают с F(z1, z2,…, zn-1, zn) в силу (**), а также в силу следующего соображения. Если в тождестве (**) переставить zn-1 и zn, то окажется (ввиду того, что F–симметрическая функция), что F1(c; z1, z2,…, zn-2, zn)= F(z1, z2,…, zn-1, zn). Выходит, что многочлен (относительно z) F2(c; z1,…, zn-2, z) при двух различных значениях z принимает одно и то же значение, а это означает, что он не может являться многочленом первой степени относительно z и на самом деле F2 не содержит z. Таким образом, правая часть (****) явно не содержит zn-1 (а только через величины ci, входящие в F2). Учитывая (**) и (****), будем иметь тождество: F(z1, z2,…, zn)=F2(c; z1, z2,…, zn-2) (*****). На этом заканчивается второй шаг. На 1-м шагу мы «освободились» в выражении F от «явной» переменной zn (см. (**)): zn фигурирует в F1 неявно, эта переменная входит в величины ci. На 2-ом шагу мы «освободились» в выражении F еще и от «явной» переменной zn-1 (см. (*****)). На третьем шагу мы заменяем в выражении F2(c; z1, z2,…, zn-2) переменную zn-2 на z и делим полученный многочлен относительно z на fn-3, получая в остатке многочлен относительно z F3(c; z1,…, zn-3, z) не выше второй степени. Подставляя в полученноe при делении равенство вместо z последовательно zn-2, zn-1, zn, мы (аналогично тому, как это сделано на 2-ом шагу) убедимся, что F3 при трех различных значениях z принимает одно и то же значение, а именно F(z1, z2,…, zn). Это означает, что F3 фактически не содержит переменной z и F(z1, z2,…, zn-3, zn-2, zn-1, zn)= F3(c; z1, z2,…, zn-3). В результате на 3-ем шагу в выражении F «исчезают» «явные» переменные zn, zn-1, zn-2. Продолжая указанный процесс, мы на n–ом шагу «освободимся» в выражении F от всех явных переменных z1, z2,…, zn и придем к тождеству F(z1, z2,…, zn)=Fn(c) или, более подробно, F(z1, z2,…, zn)=Fn(c1, c2, …, cn), ч.т.д.
328
Заметим, что переменные z1, z2,…, zn входят в правую часть этого тождества неявно: они входят в выражения c1, c2, …, cn. Заметим еще, что Fn, как и все предыдущие функции F1, F2, …, является целой рациональной функцией своих аргументов. 168. Пусть даны два многочлена f и g степеней n и m соответственно. Обозначим через α1, α2,…, αn корни первого многочлена и через β1, β2, …, βm-корни второго. Выражение R(f, g)=f(β1)f(β2)…f(βm) называется результантом многочленов f и g в данном их порядке. Ясно, что равенство нулю результанта R(f, g) есть необходимое и достаточное условие наличия общего корня у многочленов f и g. Результант R(g, f) имеет вид: R(g, f)=g(α1)g(α2)…g(αn). Считая (для упрощения записей) старшие коэффициенты многочленов f и g равными 1, доказать, что R(f, g)=(-1)mnR(g,f). Указание. При всех zєC f(z)=(z- α1)(z- α2)…(z- αn), g(z)=(z- β1)(z- β2)…(z- βm). Поэтому R(f, g)=(β1-α1)(β1-α2)…(β1-αn)x x(β2-α1)(β2-α2)…. (β2-αn)x x………………………..x x(βm-α1)(βm-α2)… (βm-αn). Меняя знак в каждой скобке и произведя затем перемножение «по столбцам», получим: R(f, g)=(-1)mn(α1-β1)(α1-β2)…·(α1-βm)x (α2-β1)(α2-β2)…·(α2-βm)x x………………………x x(αn-β1)(αn-β2)…·(αn-βm), т.е. mn R(f, g)=(-1) R(g,f), ч.т.д. Замечание. Очевидно, что R(f, g) есть целая рациональная симметрическая функция от корней β1, β2, …, βm многочлена g. Следовательно (согласно 167 и 166), R(f, g) может быть представлен как целая рациональная функция от коэффициентов многочлена Ясно, что в выражение результанта R(f, g) входят также коэффициенты многочлена f. Заметим, что если старшие коэффициенты многочленов f и g не обязательно равны 1, а равны, скажем, a 0 и b0 соответственно, то имеет место равенство (проверка справедливости которого предоставляется читателю): b0n R(f, g)=(-1)mn a0m R(g, f). 169. Пусть f:СС есть многочлен n–ой степени (n≥2), корни которого обозначим z1, z2, …, zn. Если f имеет кратный корень, то f и f имеют общий корень. И обратно, если f и f имеют общий корень, то этот корень является кратным
329
корнем многочлена f. Таким образом, равенство нулю результанта R(f,f) есть необходимое и достаточное условие того, чтобы многочлен f имел хотя бы один кратный корень. Считая, что старший коэффициент многочлена f равен 1, будем иметь (при любом zєC): f(z)=(z-z1)(z-z2)…·(z-zn), f(z)=(z-z2)…·(z-zn)+(z-z1)(z-z3)…·(z-zn)+(z-z1)(z-z2)(z-z4)…·(z-zn)+…+ +(z-z1)(z-z2)…·(z-zn-1). Поэтому f(z1)=(z1-z2)(z1-z3)…(z1-zn)=(-1)n-1(z2-z1)(z3-z1)…(zn-z1), f(z2)=(z2- z1)(z2-z3)…(z2-zn)=(-1)n-2(z2-z1)(z3-z2)...(zn-z2), f(z3)=(z3-z1)(z3- z2)(-1)n-3(z4-z3)...(zn-z3),…. f(zn-1)=(zn-1-z1)(zn-1-z2)…(zn-1-zn-2)(-1)1(zn-zn-1), f(zn)=(zn-z1)(zn-z2)…(zn-zn-1). Следовательно, R(f,f)=f(z1)· f(z2)…·f(zn)= n ( n 1) 2
= (1) ·[(z2-z1)(z3-z1)…(zn-z1)]2·[(z3-z2)(z4-z2)…(zn-z2)]2…·(zn-zn-1)2. Коротко это записывается так: R(f,f)= (1)
n ( n 1) 2
(z j i
j
zi ) 2 , i=1,2,…, n-1 (П-знак произведения).
По поводу наличия квадратов в правой части этой формулы заметим, что в развернутом произведении f(z1)·f(z2)…·f(zn)=каждая разность zj-zi (j>i) встречается ровно дважды: один раз в представлении f(zj) и один раз 2 в представлении f(zi). Выражение ( z j zi ) , i=1,2,…, n-1 носит j i
название дискриминанта многочлена f и обозначается D(f), так что R(f,f)= n ( n 1) 2
= (1) D(f). Так как диксриминант D(f) либо равен результанту R(f,f), либо отличается от него только знаком, то равенство нулю дискриминанта D(f) есть необходимое и достаточное условие того, чтобы многочлен f имел хотя бы один кратный корень. Впрочем, этот вывод следует из самого определения дискриминанта D(f). Так как дискриминант есть целая рациональная симметрическая функция от корней z1, z2, …, zn многочлена f, то D(f) может быть представлен как целая рациональная функция от коэффициентов многочлена f. Найти дискриминант кубического трехчлена f: f(z)=z3+pz+q (для любого zєC). Указание. D(f)=-R(f,f)= (3z12 p)(3z 22 p)(3z32 p) [27 z12 z 22 z32 9 pz12 z 22 9 pz12 z32 9 pz 22 z32 3 p 2 ( z12 z 22 z32 ) p 3 ] [27q 2 9 p( z12 z 22 z12 z32 z 22 z32 ) 3 p 2 s2 p 3 ].
Так как s2= ñ12 2ñ2 , причем с1=0, с2=р, то s2=-2p и
D(f)=5p3-27q2-9p ( z12 z 22 z12 z32 z 22 z32 ). Но ( z12 z 22 z32 ) 2 z14 z 24 z34 2( z12 z 22 z12 z32 z 22 z32 ), откуда 2( z12 z 22 z12 z32 z 22 z32 ) s22 s4 4p2-2p2=2p2 и z12 z 22 z12 z32 z 22 z32 p 2 . При этом
330
мы учли, что s4= c14 4c12 c2 4c1 c3 2c22 4c4 и что с1=0, с4=0 (p>n), с2=р. Следовательно,
3
2
2
3
2
D(f)=5p -27q -9p·p =-(4p +27q )=-108 (
q2 p3 ). 4 27
Итак,
кубический трехчлен z3+pz+q имеет кратные корни тогда и только тогда, q2 p3 когда =0, что и было доказано нами ранее (см. упр. 26 и 27). 4 27
Замечание. Выше (см. упр. 115 и 118) мы ввели понятие производной действительного многочлена и вывели формулу производной произведения двух действительных многочленов, которую легко распроcтранить на случай, когда перемножаются три или более (конечное число) действительных многочленов. Аналогичным образом легко определить понятие производной для любого многочлена f:СС и доказать формулу для производной произведения двух или нескольких многочленов. Из этого, как и выше (см. упр. 124 и замечание к нему), легко доказать, что многочлен f:СС имеет кратный корень тогда и только тогда, когда многочлены f и f имеют общий корень. Всем этим мы воспользовались в упр. 169. 170. Пусть z1, z2, …, zn (n≥2)–произвольные комплексные числа (которые могут быть, в частности, и действительными). Определителем Вандермонда, составленным из этих чисел и их степеней (причем показатели степеней изменяются от 0 до n-1), называется следующий определитель:
1 z1 z12 ....z1n1 1 z 2 z 22 ....z 2n1
Dn(z1, z2, …, zn)=
................. .................
.
1 z n z n2 ....z nn1 Доказать, что n 1
Dn(z1, z2, …, zn)= ( zi1 zi )( zi2 zi )...( z n zi )
(*)
i 1
Указание. Заменив zn на переменную z, рассмотрим определитель
1 z1 z12 .......z1n1 1 z 2 z 22 ......z 2n1 ................... Dn(z1, z2, …, zn-1, z)= ................... 1 z n1 z n21 ....z nn11 1z
z 2 ......z n1
331
как многочлен n-1–ой степени относительно z. Ясно, что корнями этого многочлена являются числа z1, z2, …, zn-1, а старшим коэффициентом этого многочлена является число
1 z1 z12 .......z1n2 1 z 2 z 22 ......z 2n2
Dn-1(z1, z2, …, zn-1)=
................... ................... 1 z n1 z n21 ....z nn12
Следовательно, Dn(z1, z2, …, zn-1, z)=Dn-1(z1, z2, …, zn-1)(z-z1)(z-z2)…·(z-zn-1). Полагая в этом тождестве z=zn, будем иметь: Dn(z1, z2, …, zn-1, zn)=Dn-1(z1, z2, …, zn-1)(zn-z1)(zn-z2)…·(zn-zn-1). Рассуждая, как и выше, в отношении определителя Dn-1(z1,z2, …,zn-1), а затем-в отношении определителя Dn-2(z1, z2, …, zn-2) и т.д. (пока не дойдем до определителя D2(z1, z2)=z2-z1), окончательно получим: Dn(z1, z2, …, zn-1, zn)=(zn-z1)(zn-z2)…·(zn-zn-2)(zn-zn-1)x x(zn-1-z1)(zn-1-z2)…·(zn-1-zn-2)x x……………………………x x……………………………x x(z3-z1)(z3-z2)x x(z2-z1) Теперь, чтобы получить формулу (*), следует произвести перемножение «по столбцам». a1 , a2 ,..., an –произвольные комплексные числа. 171. Пусть Циркулянтом чисел a1 , a2 ,..., an называется определитель
a1 a2 a3 .......an1 an an a1 a2 .......an2 an1 an1 an a1 .......an3 an2 Δ= .................................
a3 a4 a5 ..........a1 a2 a2 a3 a4 ..........an
a1
Для вычисления циркулянта Δ введем в рассмотрение многочлен f: 2 n1 f(z)= a1 a2 z a3 z ... an z , а также попарно различные корни α1, α2,…,αn n–ой степени из 1 (см. теорему 2. 187). Доказать, что Δ=f(α1)·f(α2)·…·f(αn). Указание. Обозначим через D определитель Вандермонда:
332
1 1 12 .......1n1 1 2 22 ...... 2n1
D=
................... ................... 1 n n2 .... nn1
Записав
D в виде 1 1............1
1 2 ......... n
D=
12 22 ........ n2 .....................
, будем иметь:
1n1 2n1 ...... nn1 b11 b12 .......b1n b21 b22 .......b2 n
Δ·D=
...................... , где величины bij вычисляются следующим ...................... bn1 bn 2 .......bnn
oбразом.
b11 a1 a21 a312 ... an1n1 f (1 ); b12 a1 a2 2 a3 22 ... an 2n1 f ( 2 ); .................................................................... b1n a1 a2 n a3 n2 ... an nn1 f ( n ); b21 an a11 a212 ... an11n1 a11 a212 ... an11n1 an1n 1 f (1 ); Аналогично,
b22 2 f ( 2 ),..., b2n n f ( n ).
Далее,
b31 an1 an1 a112 a213 ... an31n2 an21n1 a112 a213 ... an21n1 an11n an1n1 12 f (1 )
и
аналогично
b32 22 f ( 2 ),..., b3n n2 f ( n ). Продолжая вычисление элементов bij на предпоследнем шагу найдем:
bn1,1 a3 a41 a512 ... an1n3 a11n2 a21n1 a11n2 a21n1
333
a31n a41n1 a51n2 ... an12n3 1n2 f (1 )
и
bn1, 2 2n2 f ( 2 ),..., bn1,n nn2 f ( n ).
аналогично Наконец,
bn1 a2 a31 a412 ... an1n2 a11n1 a11n1 a21n a31n1 a41n2 ... an12n2 1n1 f (1 ) и
аналогично
bn 2 2n1 f ( 2 ),..., bnn nn1 f ( n ). Итак, f (1 )
f ( 2 )....... f ( n )
1 f (1 ) 2 f ( 2 )... n f ( n )
Δ·D=
12 f (1 ) 22 f ( 2 )... n2 f ( n ) ...........................................
1n1 f (1 ) 2n1 f ( 2 )... nn1 f ( n ) или Δ·D=f(α1)f(α2)…f(αn)·D, откуда (т.к. D≠0) Δ=f(α1)f(α2)…f(αn), ч.т.д. 172. Пример (взят из вышеупомянутой книги Э. Чезаро). Пусть требуется вычислить циркулянт
a1 a2 a3 a4 a4 a1 a2 a3
Δ= a3 a4 a1 a2
.
a2 a3 a4 a1 Согласно доказанному в 171,
Δ=f(α1)f(α2)f(α3)f(α4), где при всех zєC
f(z)= a1 a2 z a3 z a4 z , а α1, α2, α3, α4 суть попарно различные корни четвертой степени из 1, т.е. α1=1, α2=-1, α3=i, α4=-i. Поэтому 2
3
Δ=
(a1 a2 a3 a4 )(a1 a2 a3 a4 ) [(a1 a3 ) (a2 a4 )i] [(a1 a3 ) (a2 a4 )i] (a1 a2 a3 a4 )(a1 a2 a3 a4 ) [(a1 a3 ) 2 (a2 a4 ) 2 ]. 173. Доказать, что при любом натуральном n≥2 2 (n 1) n sin sin ... sin n 1 (*) n n n 2 Указание. Согласно теореме 2.187, все значения корня n–ой степени 2k 2k i sin из 1 могут быть записаны в виде cos (k=0, 1, 2, …, n-1). n n 2 2 i sin Обозначив cos и иcпользуя формулу Муавра (см. 2.181), n n все эти значения (попарно различные) корня n–ой степени из 1 можно
334
представить в виде: 1, ω, ω2, …, ωn-1. Все эти числа являются корнями многочлена zn-1, так что zn-1=(z-1)(z-ω)(z-ω2)…(z-ωn-1). Так как zn-1=(z-1)(zn-1+zn-2+…+z+1), то числа, ω, ω2, …, ωn-1 являются корнями многочлена zn-1+zn-2+…+z+1, так что при всех zєC zn-1+ +zn-2+…+z+1=(z-ω)(z-ω2)…(z-ωn-1). Полагая в этом тождестве z=1, получим: (1-ω)(1-ω2)…(1-ωn-1)=n и 2 n-1 |1-ω|·|1-ω |·…·|1-ω |=n. (**)
| 1 k |
Но при любом к=1,2,…,n-1
2k 2k 2k 2 2k 2k 2k i sin | (1 cos ) sin 2 2 2 cos 2(1 cos ) n n n n n n k k 4 sin 2 2 sin . n n
| 1 cos
Полагая здесь последовательно k=1, 2,…, n-1 и подставляя в (**), будем иметь: 2 n1 sin
n
2 (n 1) ... sin n, откуда и вытекает n n
sin
подлежащее доказательству равенство. Замечание. Доказанное равенство (*) позволяет следующее произведение синусов: sinα·sin2α·…·sin (n-1)α, где α= С
этой
целью
заметим,
sinkα= cos( k ) cos( 2
2
что
2n
.
при
k (n k ) ) cos cos(n k ) . 2n 2n
вычислить
k=1,2,…,n-1 Полагая в
равенстве sinkα=cos(n-k)α последовательно k=1, 2,…, n-1 и перемножая получающиеся равенства, будем иметь: sinα·sin2α·…·sin (n-1)α=cosα·cos2α·…·cos(n-1)α, откуда [sinα·sin2α·…·sin(n-1)α]2=sinαcosα·sin2αcos2α·…·sin(n-1)αcos(n-1)α
и 2n-1[sinαsin2α…·sin(n-1)α]2=sin2αsin4αsin6α…·sin2(n-1)α. Так как 2α= ,
2 (n 1) то 2n-1[sinα sin2α…·sin(n-1)α]2= sin sin ... sin n n n n [sinα sin2α…·sin(n-1)α]2= n1 2 , откуда (при n≥2) (2 )
sinαsin2α…·sin(n-1)α=
n 2
n 1
, (α=
2n
n
или (в силу (*))
).
174. Пусть F–рациональная функция от комплексного переменного z, т.е. F=
f где f и g–многочлены, которые можно считать взаимно простыми g
Тогда для любого корня α многочлена g f(α)≠0. Функция F определена для всех значений zєC, кроме корней многочлена g. Будем считать, что степень
335
многочлена f меньше степени n многочлена g. В противном случае следует представить f в виде (рассуждения, приведенные в упр. 133, справедливы для любых многочленов): f=qg+r, где q и r–многочлены, причем степень многочлена r меньше степени многочлена g. Ясно, что тогда дробь
f r =q+ и g g
r уже удовлетворяет поставленному выше условию. Указанный g
процесс называется выделением целой части рациональной дроби. Таким образом, мы считаем, что целая часть рациональной дроби заранее выделена. В этом упражнении будем также считать, что многочлен g не имеет кратных корней, так что все n его корней α1, α2,…,αn –попарно различны. Кроме того, не ограничивая общности, можно считать, что старший коэффициент многочлена g равен 1. Тогда g(z)=(z-α1)(z-α2)…(z-αn) и g(z)=(z-α2)(z-α3)…(z-αn)+(z-α1)(z-α3)…(z-αn)+…+(z-α1)(z-α2)…(z-αn-1). Ясно, что g(α1)=(α1-α2)(α1-α3)·…·(α1-αn)≠0 и точно так же g(α2)≠0, …, g(αn)≠0. Обозначим A1=
f ( n ) f ( 1 ) f ( 2 ) , A2= ,…, An= . Все числа А1, А2, g ( 1 ) g ( n ) g ( 2 )
.., Аn отличны от 0. Доказать, что при всех zєC, отличных от корней αi многочлена g, имеет место равенство: An A1 A2 f ( z) ... g ( z ) z 1 z 2 z n
(*)
~ Указание. Введем в расмотрение многочлен f , полагая (при всех zєC)
~ f (z)=A1(z-α2)(z-α3)…(z-αn)+A2(z-α1)(z-α3)…(z-αn)+…+ +An(z-α1)(z-α2)…(z-αn-1). ~ Ясно, что степень многочлена f не превосходит n-1. Вычислим значения ~ многочлена f при z=α1, z=α2,…, z=αn: ~ f ( 1 ) f (α1)=A1(α1-α2)(α1-α3)…(α1-αn)= · g(α1)=f(α1), g ( 1 ) ~ f ( 2 ) f (α2)=A2(α2-α1)(α2-α3)…(α2-αn)= · g(α2)=f(α2), g ( 2 )
……………………………………………………….., ~ f ( n ) f (αn)=An(αn-α1)(αn-α2)…(αn-αn-1)= · g(αn)=f(αn). g ( n )
~ Таким образом, многочлен f- f , степень которого не превосходит n-1, обращается в нуль при n различных значениях переменной. Это означает, ~ ~ что f- f представляет собой нуль-многочлен, т.е. f =f, Следовательно, при всех zєC
336
f(z)=A1(z-α2)(z-α3)…(z-αn)+A2(z-α1)(z-α3)…(z-αn)+…+An(z-α1)(z-α2)…(z-αn-1). Деля обе части полученного тождества на g(z)=(z-α1)(z-α2)…(z-αn) (и считая при этом z отличным от корней αi) придем к равенству (*). 175. Пусть, как и в упр. 174,
f есть «правильная» рациональная g
дробь, т.е. f и g–многочлены, причем степень многочлена f меньше степени многочлена g. По-прежнему (и не ограничивая общности) будем считать, что многочлены f и g взаимно просты и что старший коэффициент многочлена g равен 1. Однако, в этом упражнении мы откажемся от ограничения, что многочлен g имеет только простые корни и допустим, что g имеет один или несколько кратных корней. Пусть α–корень многочлена g кратности k≥2, так что при всех zєC g(z)=(z-α)kφ(z), где φненулевой многочлен и φ(α)≠0. Заметим, что и f(α)≠0. Доказать, что при всех zєC, отличных от корней многочлена g, дробь f ( z) можно представить в виде g ( z) à1 à2 à f ( z) f ( z) ... ê 1 , ê ê 1 g ( z) ( z ) z ( z) (z )
(1)
где a1 , a2 ,..., ak –некоторые комплексные числа (не зависящие от z), причем a1 ≠0 (некоторые из чисел a2 ,..., ak или даже все могут равняться нулю), а
f1
–правильная рациональная дробь или нуль-многочлен θ (если
φ-многочлен нулевой степени). В любом случае f1 и φ взаимно просты. Указание. Каково бы ни было число a , имеет место тождество: f ( z) à f ( z ) a ( z ) . ê g ( z) ( z ) ( z ) ê ( z)
Число a можно подобрать так, чтобы многочлен f- a φ делился на z–α. Для этого необходимо и достаточно, чтобы выполнялось равенство f(α)- a φ(α)=0, откуда a тождество
f ( ) f ( ) , будем иметь 0. Полагая a1 ( ) ( )
à1 ( f a1 )( z ) f ( z) ê g ( z) ( z ) ( z ) ê ( z)
(2)
Если степень многочлена φ ≥1, то многочлен f- a1 φ не может оказаться нуль-многочленом (это противоречило бы взаимной простоте f и g). Если же φ-многочлен нулевой степени (в этом случае φ(z)≡1), то многочлен f- a1 φ может оказаться нуль-многочленом и тогда для всех zєС, отличных от α,
à1 f ( z) . g ( z) ( z ) ê
Пусть φ-многочлен нулевой степени, а f- a1 φ не является нульмногочленом. Так как f- a1 φ делится на z-α, то степень m многочлена f- a1 φ
337
должна удовлетворять двойному неравенству: 1≤m≤к-1. Разлагая f- a1 φ по степеням z–α, получим тождество: (f- a1 φ)(z)= a2 ( z ) ... ak ( z )
k 1
, где некоторые (но не все) из чисел
a2 ,..., ak могут оказаться нулями. Подставляя полученное выражение для (f- a1 φ)(z) в (2), будем иметь (при всех zєС, отличных от α): à à1 à2 f ( z) ... k ê ê 1 g ( z) ( z ) z (z )
(3)
Рассмотрим теперь случай, когда степень р многочлена φ ≥1. В этом случае степень m многочлена f- a1 φ должна удовлетворять двойному неравенству: 1≤m≤к+р-1. Кроме того, многочлен f- a1 φ взаимно прост с φ и делится на z–α (мы допускаем вольность речи: точно выражаясь, следует сказать, что f- a1 φ делится на f1-αf0, где f1(z)≡z, а f0(z)≡1). Если f- a1 φ делится на (z-α)к, то, полагая f1 ( z )
( f à1 )( z ) , будем (z )ê
иметь: à1 f ( z) f ( z) 1 , ê g ( z) ( z ) ( z)
что согласуется с (1) (a2 ... ak 0) , ибо
f1
(4) –правильная рациональная
дробь и многочлены f1 и φ взаимно просты. Если же f- a1 φ не делится на (z-α)k , то обозначим через s максимальную степень двучлена z–α, на ~ ( f à1 )( z ) , которую делится f- a1 φ. Ясно, что 1≤s<к. Обозначив f (z)= (z )s ~ à1 f ( z) f ( z) , будем иметь: ê g ( z) ( z ) ( z ) k s ( z)
(5)
~ ~ где многочлены f и φ взаимно просты, f (α)≠0 и вторая дробь в (5)правильная. В знаменатель этой дроби –и это самое главное-двучлен z–α входит в степени меньшей, чем в знаменатель дроби обозначим as 1
f ( z) . Теперь g ( z)
~ f ( ) и напишем тождество: ( )
a s 1 à1 f ( z) ê g ( z) ( z ) ( z ) k s
~ ~ f ( ) f ( z) ( z) ( ) ( z ) k s ( z)
(6)
338
~ ~ f ( ) f ( z) ( z) ( ) обращается в 0 при z=α и потому ( z ) k s ( z)
Числитель дроби
делится на z–α. Следовательно, рассуждая как и выше, мы сможем еще понизить степень двучлена z–α в знаменателе дроби. Продолжая указанный процесс, через один или несколько шагов мы придем к представлению
f ( z) в виде (1). g ( z)
Замечание. Если многочлен g, кроме α, имеет еще кратные корни, скажем, корень β кратности r, корень γ кратности ℓ и т.д., а также простые корни μ1, μ2, .., то все эти корни (кроме α) являются корнями многочлена φ. Применяя к правильной рациональной дроби
f1
все вышедоказанное, а
также учитывая результат упр. 174, получим следующее разложение дроби f ( z) на простейшие дроби: g ( z) à à1 a2 b1 b2 b c1 f ( z) ... k ... r ê k 1 r r 1 g ( z) ( z ) z (z ) z (z ) (z ) (z )
c c2 A1 A2 ... ... ... z z 1 z 2 ( z ) 1
(7)
Числители простейших дробей в правой части (7) на практике находятся с помощью так называемого метода неопределенных коэффициентов. 176. Пример. Разложить на простейшие дроби правильную рациональную f , где при всех zєС f(z)=z, g(z)=(z-1)2(z2+2z+2). Многочлен g имеет g
дробь
кратный корень 1 (кратности 2) и простые корни -1+i, -1-i. Так как многочлены f и g взаимно просты, то, согласно доказанному в упр-х 174 и 175, должно иметь место равенство z ( z 1) ( z 2 z 2) 2
2
a b c d , справедливое при всех 2 z 1 z 1 i z 1 i ( z 1)
zєС, отличных от корней многочлена g. Умножая обе части указанного тождества на (z-1)2(z2+2z+2), получим: 2 2 2 z= a( z 2 z 2) b( z 1)( z 2 z 2) c( z 1) ( z 1 i)
d ( z 1) 2 ( z 1 i)
(*) Так как разность между правой и левой частью последнего равенства представляет собой многочлен, имеющий бесчисленное множество корней, то эта разность есть нуль-многочлен, т.е. последнее равенство (*) справедливо при всех zєС (включая и корни многочлена g). Полагая z=1, находим: a
1 . Полагая z=-1-i, будем иметь: -1-i=d·(-2-i)2·(-2i), откуда 5 1+i=2id(3+4i)
339
и
d=
полагая
1 1 i 1 (1 i)(3 4i) 3 4i 3i 4 1 (1 7i). 2 3 4i 2 25 50 50 z=-1+i,
находим:
-1+i=c·(-2+i)2·2i,
откуда
Далее,
1+i=2c·(3-4i)
и
1 1 i 1 (1 7i). Наконец, полагая z=0, будем иметь: 2 3 4i 50 2 1 1 2 8 (1 7i)(1 i) (1 7i)(1 i), откуда 2b 0= 2b и 5 50 50 5 25 1 b . Следовательно, 25 c=
1 8 z z 1 1 25 или 225 2 2 2 25( z 1) z 27 2 ( z 1) ( z 2 z 2) 5( z 1) z 1 1 z 8 ( z 1) 2 ( z 2 2 z 2) 5( z 1) 2 25( z 1) 25( z 2 27 2). Заметим, что числа a, b, c, d можно было бы найти и другим способом. А
именно, раскрыв скобки в правой части (*) и приведя подобные членыприравнять коэффициенты при одинаковых степенях z в левой и правой частях (*). При этом получаются четыре уравнения относительно четырех неизвестных a, b, c, d , из которых эти неизвестные и находятся. 177. Пусть, как и в упр. 174,
f есть правильная рациональная дробь, g
причем многочлены f и g взаимно просты и имеют действительные коэффициенты. Как и в 174, будем считать (не ограничивая общиности) старший коэффицент многочлена g равным 1. Рассмотрим случай, когда этот многочлен, степень которого обозначим через n (n≥2), имеет только простые корни α1, α2, …, αn. Согласно доказанному в упр. 174, при всех zєС, отличных от αi, имеет место равенство: A A A f ( z) f ( i ) = 1 2 ... n , где Ai= , i=1, 2, …, n. z n g ( z ) z 1 z 2 g ( i )
Если все корни α1, α2, …, αn окажутся действительными числами, то ясно, что и все числа А1, А2, …, Аn будут также действительными. Вообще, если при некотором i αi–действительное число, то и Аi-действительно. Пусть теперь среди корней α1, α2, …, αn есть комплексные числа, например, α1комплексное число (с ненулевой мнимой частью). Так как g(α1)=0, то и g (1 ) g (1 ) 0 . Это значит, что число 1 ≠α1, является одним из корней многочлена g (см. следствие из 2.183). Не ограничивая общности, можно считать, что 1 =α2.
340
Доказать, что сумму f ( z) g ( z)
A1 A2 , соответствующую (в разложении z 1 z 2
на простейшие дроби) паре взаимно сопряженных комплексных
корней α1 и α2 многочлена g, можно представить в виде
az b (для z pz q 2
всех zєС, отличных от α1 и α2), где числа a, b, p, q –действительные и p2-4q<0. A1 A2 ( A A ) z ( A1 2 A2 1 ) 12 2 . z 1 z 2 z ( 1 2 ) z 1 2
Указание. как A2
Так
f ( 2 ) f ( 1 ) f ( 1 ) f ( 1 ) ( ) A1 , то А1+А2=А1+ A1 представляет g ( 2 ) g (1 ) g (1 ) g ( 1 )
собой действительное число, которое обозначим через a . Далее, А2α1= A1 2 A1 2 и потому сумма А1α2+А2α1 представляет собой действительное число, которое обозначим –b. Наконец, числа –(α1+α2)=-(α1+ 1 ) и α1α2=α1 1 представляют собой действительные числа, которые обозначим соответственно через р и q. Таким образом, действительно
A1 A2 az b 2 , z 1 z 2 z pz q
где
числа
a, b, p, q –
действительные и р2-4q<0 (ибо квадратный трехчлен z2+pz+q имеет комплексные корни). Замечание. Итак, если
f -правильная рациональная дробь (числитель g
и знаменатель которой взаимно просты) и многочлены f и g имеют действительные коэффициенты, то (в случае, когда g не имеет кратных f ( z) на простейшие дроби можно ограничиться g ( z)
корней) в разложении
дробями с действительными коэффициентами в числителях и знаменателях. При этом каждой паре α, β взаимно сопряженных комплексных корней многочлена g соответствует простейшая дробь вида az b , z pz q 2
каждому
где
a, b, p, q –действительные
действительному
простейшая дробь вида 178.
Пример.
рациональную дробь дробь
корню
γ
ñ f ( ) , где ñ . z g ( )
Разложить
на
числа и z2+pz+q=(z-α)(z-β); многочлена
простейшие
g
дроби
соответствует правильную
z . Здесь f(z)≡z, g(z)≡(z+1)(z2+z+1), 2 ( z 1)( z z 1)
f -правильная, f и g взаимно просты и многочлен g имеет пару g
взаимно сопряженных комплексных корней (являющихся корнями трехчлена z2+z+1) и один действительный корень -1. Так как
341
коэффициенты многочленов f и g-действительные и g не имеет кратных корней, то (согласно доказанному в упр. 177) имеет место тождество
z c az b 2 , где a, b, c действительные числа. 2 ( z 1)( z z 1) z 1 z z 1 f (1) Число с можно вычислить по формуле ñ , но можно все числа a, b, c g (1)
найти методом, примененным в 176. Имеем тождество (при всех zєС): z=c(z2+z+1)+ (az b)( z 1) (*) Полагая в (*) z=-1, найдем: с=-1. Полагая z=0, будем иметь: 0=-1+b, откуда b=1. Полагая z=1, находим: 1=-3+ (a 1) 2 , откуда a 1 . Итак,
z z 1 1 2 . 2 ( z 1)( z z 1) z z 1 z 1
179. Рассмотрим теперь общий случай, когда знаменатель g правильной рациональной дроби
f может иметь не только простые, но и g
кратные корни, как действительные, так и комплексные. Многочлены f и g по-прежнему предполагаем взаимно простыми и имеющими действительные коэффициенты (старший коэффициент многочлена g не ограничивая общности, считаем равным 1). Пусть α-простой действительный корень многочлена g. Тогда при всех zєС g(z)=(z-α)g1(z), где g1 многочлен с действительными коэффициентами и g1(α)≠0. Заметим, что и f(α)≠0. Рассуждая, как и в упр. 175, будем иметь тождество: f ( z ) ag1 ( z ) a f ( ) f ( z) = , где a и многочлен f ag1 делится g1 ( ) g ( z ) z ( z ) g1 ( z ) на двучлен z–α. Обозначим частное от деления f ag1 на z–α через f1.
Заметим, что a –действительное число и многочлен f1 либо является нульмногочленом, либо-ненулевым многочленом с действительными f ( z) a f ( z) 1 = , гдe g ( z ) z g1 ( z ) f f дробь 1 подчинена тем же условиям, что и дробь (мы считаем, что f1 g1 g
коэффициентами, взаимно простым с g1. Итак,
не является нуль-многочленом). Если многочлен g имеет, кроме α, еще другие простые действительные корни β,…, δ, то всe они являются корнями многочлена g1. Применяя те же рассуждения, что и выше, последовательно по отношению к корням β,…, δ, мы через несколько шагов придем к тождеству f p ( z) a b d f ( z) ... = , где р-число корней α, β,…, δ, а z g p ( z) g ( z) z z
fp–либо нуль-многочлен, либо ненулевой многочлен с действительными
342
коэффициентами и дробь
fp gp
подчинена тем же условиям, что и дробь
f g
(числа b,..., d , как и a , тоже все действительные). Пусть fp не является нуль-многочленом. Если многочлен g имеет, кроме простых действительных корней α, β,…, δ, еще и кратные действительные корни (т.е. действительные корни с кратностями ≥2), то все они являются корнями многочлена gp. Пусть μ-один из таких корней кратности к≥2. Тогда при всех zєС gp(z)=(z-μ)k g~( z ) , где g~ -многочлен с действительными коэффициентами и g~ (μ)≠0 (заметим, что и fp(μ)≠0). Аналогично вышеизложенному, можем написать тождество f p ( z ) A1 g~( z ) A1 = , g p ( z) ( z ) k ( z ) k g~( z )
f p ( z)
где
f p ( ) A1 ~ ≠0 g ( )
и
является
действительным числом, а многочлен fp-A1 g~ (с действительными коэффициентами) делится на z–μ (ибо μ является корнем этого многочлена). Рассуждая как и в упр. 175, мы через один или несколько шагов придем к следующему представлению дроби ~ Ak A1 A2 f ( z) ... ~ , = k k 1 g p ( z) ( z ) z g ( z) (z )
f p ( z)
fp gp
: (2)
где А2, …, Ак-действительные числа, некоторые из которых (или ~ даже все) могут равняться нулю, а f либо является нуль-многочленом (и тогда разложение дроби
f ( z) на простейшие дроби закончено), либо g ( z)
является ненулевым многочленом с действительными коэффициентами, ~ f ~ ~ причем f и g взаимно просты и дробь ~ -правильная. Рассмотрим этот g
второй случай. Если многочлен g имеет, кроме μ, еще действительные кратные корни ν, …, ξ, то все они являются корнями многочлена g~ . Применяя вышеприведенные рассуждения последовательно к корням ν, …, ξ, мы через несколько шагов придем к тождеству ~ B B1 B2 L1 L2 L f ( z) ... s ... ... r = s s 1 r r 1 ~ z z g ( z ) ( z ) ( z ) (z ) (z ) f * ( z) , (3) g * ( z)
где s,…, r суть кратности действительных корней ν, …, ξ соответственно, a В1, В2, …, Вs, …, L1, L2, …, Lr-действительные числа. При этом многочлен f* либо является нуль-многочленом (и тогда разложение дроби
f ( z) на g ( z)
простейшие дроби закончено), либо является ненулевым многочленом с действительными коэффициентами (как и g*), взаимно простым с g* и
343
меньшей степени, чем g*. В этом последнем случае степень многочлена g* обязательно четная (в противном случае он имел бы действительный корень, являющийся корнем многочлена g, тогда как все действительные корни многочлена g, простые и кратные, уже «выделены»-см. (1), (2), (3)). Итак, многочлен g* имеет только комплексные корни (мы считаем, что f* не является нуль-многочленом), Пусть η-простой корень многочлена g*. Так как g*-многочлен с действительными коэффициентами, то он обязательно имеет своим корнем (притом-простым!) и число (см. 139). Поэтому g*(z) можно представить в виде: g*(z)=(z-η)(z- ) g~ * (z)=[z2-(η+ )z+η ] g~ * (z)=(z2+pz+q) g~ * (z), где р и q–действительные числа (p2-4q<0) а многочлен g~ * (который может оказаться нулевой степени) имеет действительные коэфифиценты (как частное от деления g* на z2+pz+q). При этом g~ * (η)≠0 и f*(η)≠0). Каковы бы ни были действительные числа m и n, имеет место тождество: f * ( z) mz n f * ( z ) (mz n) g~ * ( z ) 2 . g * ( z ) z pz q ( z 2 pz q) g~ * ( z )
(4)
Подберем действительные числа m и n так, чтобы многочлен f*-(mz+n) g~ * делился на z2+pz+q. Для этого необходимо и достаточно подобрать действительные числа m и n так, чтобы число η было корнем указанного многочлена (тогда и число будет его корнем и многочлен будет делиться на z2+pz+q). Другими словами, должно выполняться f * ( )
равенство mη+n=u, где u= ~ . g * ( ) Если подбор действительных чисел m и n, удовлетворяющих равенству mη+n=u, возможен, то числа m и n должны удовлетворять системе: m n u m n u
Из этой системы находим: m=
(5) u u ,
n=
u u .
Эти числа
удовлетворяют системе (5) и ясно, число m–действительное число. Тот факт, что и n является действительным числом, усматривается из следующего. Из 1-го уравнения системы (5), учитывая, что m– действительно, находим: m n u , так что n u m . Но из 2-го уравнения системы (5) следует, что n u m . Значит, n n , т.e. n является действительным числом (равенство n n легко доказать, исходя непосредственно из значения n=
u u ). Подобрав указанным образом
действительные числа m и n, обозначим частное от деления многочлена ~ f*-(mz+n) g~ * на z2+pz+q через f * . Так как многочлен f*-(mz+n) g~ * ~ взаимно прост с g~ * , то и f * взаимно прост с g~ * . Будем иметь:
344
~ f * ( z) mz n f * ( z) 2 ~ g * ( z ) z pz q g * ( z )
(6)
~ ~ f* и дробь ~ –правильная (если f * не является нуль-многочленом, но g* f ( z) тогда разложение дроби заканчивается). g ( z) Если многочлен g, кроме пары , , имеет еще одну или несколько
пар простых взаимно сопряженных комплексных корней, то все эти корни являются корнями многочлена g~ * . Если таких пар (кроме пары , ) всего ℓ, то, рассуждая аналогично вышеизложенному, через ℓ шагов придем к разложению: m z n m z n1 f * ( z) mz n ( z) 2 2 1 ... 2 , (7) g * ( z ) z pz q z p1 z q1 z p z q ( z ) где коэффициенты всех простейших дробей (в числителях и знаменателях) суть действительные числа, а многочлен φ либо является нульмногочленом (и тогда разложение дроби
f ( z) на простейшие дроби g ( z)
заканчивается), либо является ненулевым многочленом с действительными коэффициентами (как и многочлен ψ) и взаимнопростым с ψ, а также меньшей степени, чем ψ. В этом случае многочлен ψ имеет только пары взаимносопряженных комплексных корней, причем кратность корней каждой такой пары одинакова (для корней этой пары; см. 139). Доказать, что каждой паре , сопряженных комплексных корней многочлена g кратности t≥2 соответствует (в разложении дроби
f ) сумма g
простейших дробей вида m * z nt * m1 * z n1 * m * z n2 * 2 2 ... 2 t , 2 t t 1 ( z p1 * z q1*) ( z p2 * z q2 *) z pt * z qt * где все числа mi*, ni*, pi*, qi*–действительные. 180. Пример. Разложить на простейшие дроби правильную рациональную дробь
1 4 3 3 . Знаменатель g(z)=(z -1) можно представить ( z 1) 4
в виде g(z)=(z-1)3(z+1)3(z2+1)3. Согласно доказанному в 179, разложение данной рациональной дроби на простейшие имеет вид:
1 a b c d e f mz n ( z 4 1) 3 ( z 1) 3 ( z 1) 2 z 1 ( z 1) 3 ( z 1) 2 z 1 ( z 2 1) 3 pz q rz s 2 2 , где действительные числа a, b, c,..., r, s подлежат 2 ( z 1) z 1
определению. Имеем тождество: a( z 1) 3 ( z 2 1) 3 b( z 1)( z 1) 3 ( z 2 1) 3 c( z 1) 2 ( z 1) 3 ( z 2 1) 3 d ( z 1) 3 ( z 2 1) 3 e( z 1) 3 ( z 2 1) 3 ( z 1) f ( z 1) 3 ( z 2 1) 3 ( z 1) 2
345 (mz n)( z 1) 3 ( z 1) 3 ( pz q)( z 1) 3 ( z 1) 3 ( z 2 1) (rz s)( z 1) 3 ( z 1) 3 ( z 2 1) 2 1
1 1 . Полагая z=-1, находим: d . Полагая 64 64 1 1 z=i, будем иметь m=0, n . Перенеся член ( z 1) 3 ( z 1) 3 в правую 8 8 1 часть тождества и замечая, что многочлен ( z 2 1) 3 1 обращается в 0 при 8
Полагая z=1, находим: a
z=±i (т.е. делится на z2+1), разложем этот многочлен по степеням z2+1. Получим: 1 2 1 ( z 1) 3 1 [( z 2 1) 3 6( z 2 1) 2 12( z 2 1)] . 8 8
Деля обе части полученного тождества на z2+1, получим новое тождество: 1 1 ( z 1) 3 ( z 2 1) 2 b( z 1)( z 1) 3 ( z 2 1) 2 c( z 1) 2 ( z 1) 3 ( z 2 1) 2 ( z 1) 3 ( z 2 1) 2 64 64 3 2 2 3 2 2 2 3 e( z 1) ( z 1) ( z 1) f ( z 1) ( z 1) ( z 1) ( pz q)( z 1) ( z 1) 3 (rz s)( z 1) 3 x 1 (*). x( z 1) 3 ( z 2 1) [( z 2 1) 2 6( z 2 1) 12] 8 3 Полагая в (*) z=i, найдем, что р=0, q . Перенеся член 16 3 ( z 2 1) 3 в правую часть тождества (*) и замечая, что многочлен 16 3 2 1 ( z 1) 3 [( z 2 1) 2 6( z 2 1) 12] обращается в 0 при z=±i, представим его 16 8 3 1 3 3 в виде: [( z 2 1) 2]3 ( z 2 1) 2 ( z 2 1) 16 8 4 2 3 1 3 [( z 2 1) 3 6( z 2 1) 2 12( z 2 1)] ( z 2 1) 2 ( z 2 1) 16 8 4 3 3 ( z 2 1) 3 ( z 2 1) 2 ( z 2 1). 16 2
Деля обе части полученного тождества на z2+1, придем к новому тождеству: 1 1 ( z 1) 3 ( z 2 1) b( z 1)( z 1) 3 ( z 2 1) c( z 1) 2 ( z 1) 3 ( z 2 1) ( z 1) 3 ( z 2 1) 64 64 3 2 3 2 2 3 e( z 1) ( z 1)( z 1) f ( z 1) ( z 1) ( z 1) (rz s)( z 1) ( z 1) 3 3 3 (**) ( z 2 1) 2 ( z 2 1) 16 2
Полагая в тождестве (**) z=i, найдем, что r=0, s=
3 16
346
Перенеся член
3 2 ( z 1) 3 в правую часть (**) и замечая, что 16
3 2 3 3 обращается в 0 при z=±i, ( z 1) 3 ( z 2 1) 2 ( z 2 1) 16 16 2 3 3 3 представим его в виде: [( z 2 1) 2]3 ( z 2 1) 2 ( z 2 1) 16 16 2 3 3 [( z 2 1) 3 6( z 2 1) 2 12( z 2 1)] ( z 2 1) 2 ( z 2 1) 16 16 3 2 15 5 ( z 1) 3 ( z 2 1) 2 ( z 2 1) . 16 16 4
многочлен
Деля обе части вновь полученного тождества на z2+1, получим следующее тождество: 1 1 ( z 1) 3 b( z 1)( z 1) 3 c( z 1) 2 ( z 1) 3 ( z 1) 3 64 64 3 15 5 (***). e( z 1) 3 ( z 1) f ( z 1) 3 ( z 1) 2 ( z 2 1) 2 ( z 2 1) 16 16 4 1 Перенеся член ( z 1) 3 в правую часть тождества (***) и замечая 64 1 3 15 5 что многочлен ( z 1) 3 ( z 2 1) 2 ( z 2 1) обращается в 0 при z=1, 64 16 16 4
представим его в виде: 3 1 15 5 [( z 1) 2 2( z 1) 2]2 [( z 1) 2]3 [( z 1) 2 2( z 1) 2] 16 64 16 4 3 [( z 1) 4 4( z 1) 2 4 4( z 1) 3 4( z 1) 2 8( z 1)] 16 1 15 5 [( z 1) 3 6( z 1) 2 12( z 1) 8] [( z 1) 2 2( z 1) 2] 64 16 4 3 47 15 9 ( z 1) 4 ( z 1) 3 ( z 1) 2 ( z 1) . 16 64 32 16
Деля обе части получившегося тождества на z-1, придем к тождеству: 1 ( z 1) 2 ( z 1) 2 ( z 1) f ( z 1) 2 ( z 1) 2 64 3 47 15 9 (****) ( z 1) 3 ( z 1) 2 ( z 1) . 16 64 32 16 9 Полагая здесь z=1, получим: b . 128 9 1 Перенеся члены ( z 1) 3 и ( z 1) 2 в правую часть, запишем 128 64
b( z 1) 3 c( z 1)( z 1) 3
тождество (****) в виде: c(z-1)(z+1)3+e(z-1)2(z+1)+f(z-1)2(z+1)2=
9 3 3 ( z 1) 3 ( z 1) 3 ( z 1) 2 128 16 4
15 9 или c(z-1)(z+1)3+e(z-1)2(z+1)+f(z-1)2(z+1)2= ( z 1) 32 16 33 75 21 ( z 1) 3 ( z 1) 2 ( z 1). 128 64 16
347
Деля обе части последнего тождества на z-1, получим новое тождество: c(z+1)3+e(z-1)(z+1)+f(z-1)(z+1)2= z=1) находим: ñ
33 75 21 ( z 1) 2 ( z 1) , 128 64 16
откуда (полагая
21 . 128
Перенеся член
21 ( z 1) 3 в правую часть, запишем вновь полученное 128
тождество в виде: f(z-1)(z+1)2+e(z2-1)=
21 33 75 21 ( z 1) 3 ( z 1) 2 ( z 1) . 128 128 64 16
В левой части стоит многочлен третьей степени со старшим коэффициентом, равным f, а в правой части стоит также многочлен третьей 21 21 и е(z2. Следовательно f 128 128 21 21 33 75 21 1)= ( z 1)( z 1) 2 ( z 1) 3 ( z 1) 2 ( z 1) . Полагая здесь z=0, 128 128 128 64 16 42 33 150 168 9 окончательно находим: -е= и е . Итак, 128 128 128 128 128 1 1 9 21 1 9 21 4 3 3 2 3 2 128( z 1) 64( z 1) 128( z 1) 128( z 1) ( z 1) 64( z 1) 128( z 1)
степени со старшим коэффициентом
1 3 3 . 3 2 2 8( z 1) 16( z 1) 16( z 2 1) 2
Конец второй главы.
348 Глава 3. Топологические и метрические пространства. 3.1 Определение. Пусть Х –произвольное множество. Будем говорить, что в множестве Х определена топология, если выделен класс Д подмножеств множества Х(Дβ(Х)), удовлетворяющий следующим условиям: а) объединение любого семейства множеств класса Д является множеством этого класса; b) пересечение любого конечного числа множеств класса Д является множеством этого класса; с) пустое множество и все множество Х являются множествами класса Д. Пара (Х, Д) называется топологическим пространством. Допуская вольность речи, для краткости мы часто будем говорить просто о топологическом пространстве Х. Множества класса Д называются открытыми множествами топологического пространства, сам класс Д называется классом открытых множеств пространства. Множество FХ называется замкнутым, если его дополнения Fc=Х\F является открытым множеством (FcєД). Заметим, что здесь и в дальнейшем запись А\В будет означать разность множеств А и В, определенную в главе 1 (1.100). Запись А-В мы сохраним для случая, когда А и В являются подмножествами векторного пространства Е: АВ={zєЕ: z=х-у, хєА, уєВ}. Пусть х-точка (элемент) топологического пространства Х; множество UХ называется окрестностью точки х, если существует открытое множество G (GєД), такое, что хєGU (в этих условиях G будет открытой окрестностью точки х). Точка хєХ называется внутренней точкой множества АХ, если хєUА, где U–окрестность точки х. Множество всех внутренних точек множества А называется внутренностью множества А, которую мы будем обозначать Int A. Точка хєХ называется точкой прикосновения множества АХ, если для любой окрестности U точки х множество UА непусто. Точка хєХ называется внешней точкой множества АХ, если она является внутренней точкой дополнения Ac=Х\А. Иначе: внешняя точка множества А-это такая точка, некоторая окрестность которой не содержит точек из А. Множество всех внешних точек множества А, т.e. множество Int Aс, называется внешностью множества А. Точка хєХ называется граничной точкой множества АХ (АХ), если она является точкой прикосновения как множества А, так и множества Ас. Множество всех граничных точек множества А называется границей множества А и обозначается FrА. Топологическое пространство называется отделимым (или хаусфордовым), если любые две различные его точки имеют непересекающиеся окрестности. В дальнейшем, без дополнительного упоминания об этом, мы будем иметь дело только с отделимыми пространствами. Пусть АХ и х0єА. Если существует такая окрестность U точки х0, что UА={х0}, то точка х0 называется изолированной точкой множества А. В одном и том же множестве Х могут быть заданы различные топологии. Пусть ξ и η-две несовпадающие топологии в Х. Говорят, что топология ξ слабее топологии η (а топология η сильнее топологии ξ), если каждое множество, открытое в топологии ξ, открыто и в топологии η (ДξДη, ДξДη). Две топологии в Х могут быть несравнимыми. 3.2 Теорема. Для любого множества АХ внутренность Int A является открытым множеством. При этом А открыто тогда и только тогда, когда оно совпадает со своей внутренностью. Доказательство. Если Int A=, то Int A открыто. Если Int A, то для любой точки хєInt A найдем открытую окрестность Gx точки х такую, что хєGxА. Заметим, что любая точка множества Gx является внутренней точкой множества А, т.е. GxInt A. Поэтому
G
x
Int A.
õIntA
Так как объединение любого семейства открытых множеств топологического пространства есть открытое множество, то Int A открыто. Остается доказать, что если А-открыто, то А=Int A Пусть х-любая точка множества А. Так как А является открытой окрестностью точки х, то хєInt A. Следовательно, АInt A. С другой стороны, Int AА, т.е. А=Int A, ч.т.д. 3.3 Теорема. Пересечение любого семейства замкнутых множеств и объединение любого конечного числа замкнутых множеств являются замкнутыми множествами.
349 Доказательство.
Пусть
{Fα}-произвольное
семейство
замкнутых
топологического пространства Х. Согласно доказанному в 1.106,
c
множества F открыты, то и
F
c
множеств
c
F F . c
Так как
является открытым множеством. Значит, множество
F
является замкнутым множеством. Далее, пусть n–любое натуральное число и F1, F2,…,Fn– c
n n F Fi c . Так замкнутые множества топологического пространства Х. Согласно 1.106, i i 1 i 1 c как множества Fi открыты и пересечение конечного числа открытых множеств пространства
n
c является открытым множеством, то множество Fi –открыто. Значит, i 1
n
F есть
замкнутое
i
i 1
множество, что и завершает доказательство теоремы. 3.4 Замечание. Так как каждое из множеств , Х является дополнением другого и так как оба они открыты, то оба они являются также и замкнутыми множествами. 3.5 Определение. Пусть А-произвольное подмножество топологического пространства Х. Множество всех точек прикосновения множества А называется замыканием множества А и обозначается A . 3.6 Теорема. Замыкание A любого множества АХ есть замкнутое множество, содержащее А. А замкнуто тогда и только тогда, когда совпадает со своим замыканием.
ñ
ñ
Доказательство. Убедимся в справедливости равенства A =Int Aс. Пусть хє A , т.е. х не является точкой прикосновения множества А. Тогда найдется такая окрестность U точки х, которая не содержит точек множества А, т.е. хєUАс. Значит, х есть внутренняя точка множества
ñ
Ас, т.е. хєInt Aс. Этим доказано включение A Int Aс. Обратное включение очевидно, так что действительно
A =Int ñ
Aс. Следовательно, A -замкнутое множество. Так как любая точка
множества А является, очевидно, его точкой прикосновения, то А A . Далее, если А= A , то ясно, что А-замкнуто, так как (согласно доказанному) A –замкнутое множество. Остается убедиться в том, что при условии А≠ A множество А не является замкнутым, т.е. Ас не является открытым множеством. В самом деле, из А≠ A следует, что существует такая точка х 0є A , которая не принадлежит А, т.е. х0єАс. Если бы Ас оказалось открытым множеством, то, будучи открытой окрестностью точки прикосновения х0 множества А, множество Ас должно было бы содержать точки из А, что абсурдно. Следовательно, при А≠ A множество А не является замкнутым и теорема доказана. 3.7 Теорема. Для любого множества АХ множество A является «наименьшим» замкнутым множеством, cодержащим А в качестве подмножества. Это означает следующее: если F–замкнутое множество пространства и FА, то F A . Доказательство. Если допустить противное, то должна существовать такая точка х0, что х0є A , но х0 F, т.е. х0єFc. Так как Fc–открытое множество, а х0-точка прикосновения множества А, то множество Fc должно содержать точки из А, что абсурдно. Значит, F A и теорема доказана. Следствие. Замыкание A любого множества АХ является пересечением замкнутых множеств пространства, содержащих А в качестве подмножества.
F
всех
350 В самом деле, доказанному,
F
F A .
есть замкнутое множество, содержащее А, и потому, согласно
С другой стороны, A является одним из множеств Fα и потому
F A . Следовательно, A = F , ч.т.д. 3.8 Теорема. Каково бы ни было множество АХ, множество Int A является «наибольшим» открытым, содержащимся в А, множеством. Это означает, что если G–открыто и GА, то GInt A. Доказательство. Для любого хєG имеем: хєGА. Отсюда следует, что хєInt A, что и доказывает включение GInt A. 3.9 Теорема. Каково бы ни было множество АХ, имеет место равенство Х=Int AFrАInt Aс, причем множества в правой части равенства попарно не пересекаются. Доказательство. Сперва убедимся, что А\Int AFrА. В самом деле, если А-открытое множество, то А\Int A=FrА. Если же А не является открытым множеством, то рассмотрим любую точку хєА\Int A. Какова бы ни была окрестность U точки х, можем написать: UА. Это означает, что U содержит как точки множества Ас, так и точки множества А (например, точку х). Следовательно, точка х является точкой прикосновения как множества А, так и множества А с, то есть х является граничной точкой множества А. Это и доказывает включение А\Int AFrА. Так как у множеств А и Ас, очевидно, одна и та же граница, то (в согласии с доказанным) можем написать: Ас-Int AсFrА. Пусть теперь х-любая точка множества Х. Если хєInt A, то хєIntАFrAInt Aс. Если х Int A, но хєА, то хєА\IntAFrА, т.е. хєFrА и опять справедлива принадлежность хєInt AFrАInt Aс. Если х А, то хєAс. Если при этом хєInt Aс, то по-прежнему хєInt AFrАInt Aс. Наконец, если хєАс\Int AсFrА, то хєFrА и опять хєInt AFrАInt Aс. Этим доказано включение ХInt AFrАInt Aс. Так как обратное включение очевидно, то Х=Int AFrАInt Aс. Остается доказать, что множества в правой части этого равенства попарно не пересекаются. Очевидно, что Int AInt Aс=. Если хєIntА, то Int А является открытой окрестностью точки х, не содержащей точек множества Ас. Следовательно, х не является граничной точкой множества А. Отсюда следует, что Int AFrА=. Аналогично доказывается, что Int AсFrА=. 3.10 Теорема. Граница любого множества АХ есть замкнутое множество (которое может быть и пустым) Доказательство. Из 3.9. следует, что FrА=(Int AInt Aс)с, откуда (FrА)c= =Int AInt Aс. Так как Int AInt Aс-открытое множество, то FrА -замкнуто, ч.т.д. 3.11 Теорема. Множество АХ замкнуто тогда и только тогда, когда оно содержит свою границу в качестве подмножества. Доказательство. Если множество А-замкнуто, то Ас-открыто, т.е. Int Aс=Aс. Следовательно, имеет место равенство Х=Int AFrАAс, откуда А=Int AFrА, т.е. АFrА. Обратно, пусть АFrА. Тогда АInt AFrА. Ранее (см. 3.9.) было доказано, что АInt AFrА. Значит, в рассматриваемом случае А=Int AFrА, откуда Х= =АInt Aс. Следовательно, Ас=Int Aс, т.е. Ас-открытое множество и потому А-замкнутое множество, ч.т.д. 3.12. Теорема. Множество АХ открыто тогда и только тогда, когда оно не пересекается со своей границей. Доказательство. Если А-открыто, то А=Int A, а множество Int A не пересекается с FrА. Обратно, если АFrА =, то, переходя к дополнениям, получим: Х=Ас(FrА)с. Так как (FrА)с =Int AInt Aс, то Х=Ас(Int AInt Aс)=АсInt A, откуда Int A=A. Значит, А-открыто, ч.т.д. 3.13. Определения. Пусть А и В-подмножества топологического пространства Х. Говорят, что множество А плотно в В, если В A . Если A =Х, то говорят, что А всюду плотно в Х. Множество А в топологическом пространстве Х называется нигде не плотным, если его замыкание A не имеет внутренних точек. 3.14 Теорема. Множество Ох всех окрестностей любой точки х топологического пространства Х обладает следующими свойствами:
351 1) хєU для любого множества UєОх; 2) если UєОх, а V–любое подмножество пространства Х, содержащее U (UV), то VєОх; 3) если UєОх и VєОх, то UVєОх; 4) если UєОх , то существует VєОх такое, что UєОу для любой точки уєV. Доказательство. Свойства 1) и 2) очевидны и мы сразу переходим к доказательству свойства 3). Согласно определению понятия «окрестность точки», существуют открытые множества G1Х и G2Х такие, что хєG1U и хєG2V. Тогда ясно, что хєG1G2UV. Так как G1G2-открытое множество, то UV является окрестностью точки х, т.е. UVєОх. Переходя к доказательству свойства 4), найдем открытое множество GX, такое, что хєGU. Так как IntU является «наибольшим» открытым множеством, содержащимся в U (см. 3.8), то можем написать: хєGIntUU. Беря в качестве V множество IntU, будем иметь: VєОх и для любого уєV=IntU множество U является окрестностью точки у, т.е. UєОу, ч.т.д. Имеет место и обратное предложение, доказательство которого предоставляется читателю. 3.15 Теорема. Пусть Х-некоторое множество, для каждого элемента х которого задан непустой класс Ох подмножеств множества Х. Если при этом выполнены условия 1), 2), 3), 4) теоремы 3.14, то в Х можно определить, и притом единственную, топологию, для которой клас О х будет служить множеством всех окрестностей точки х при всех хєХ.
Î 3.16 Определение. Подкласс õ класса Ох всех окрестностей точки х называется базисом окрестностей точки х, если для любого множества UєОх существует множество Vє Î õ такое, что
VU. Выражаясь образно, можно сказать, что базис окрестностей точки х должен содержать «сколь угодно малые» окрестности этой точки. Например, открытые множества, содержащие
точку х, образуют базис окрестностей этой точки. Очевидно, что если Î õ –базис окрестностей точки х, то Ох есть клас всех таких множеств UХ, для каждого из которых найдется множество
Vє Î
такое, что VU. 3.17 Теорема. Пусть (Х, Д)-топологическое пространство и У-произвольное подмножество множества Х. Утверждается, что в множестве У можно определить топологию (называемую индуцированной топологией), взяв в качестве класса Д1 открытых множеств в У класс пересечений всех множеств класса Д с множеством У. Доказательство. Очевидно, что пустое множество принадлежит классу Д1 и само множество У также принадлежит Д1, ибо У=УХ, а ХєД. Пусть {Qα}-какое-либо семейство множеств класса Д1, т.е. при любом α Qα=УGα, где Gαє Д. Так как Q =У( G ), а G єД, õ
то
Q єД1.
Далее, пусть
Q1, Q2, …, Qn-конечная последовательность множеств класса Д1.
Найдутся множества G1, G2, …, Gn класса Д такие, что Q1=УG1, Q2=УG2, …, Qn=УGn. Так как n
Q
i
i 1
n
=Y( Gi ), а i 1
n
G i 1
n
i
єД, то
Q
i
єД1. Таким образом, все аксиомы топологического
i 1
пространства выполнены и пара (У, Д1) действительно представляет собой топологическое пространство. Замечание. Легко доказать, на чем мы не останавливаемся, что замкнутые множества в индуцированной топологии-это пересечения множества У с замкнутыми множествами из Х, а окрестности любой точки в У-это пересечения с множеством У окрестностей этой точки в Х. Заметим еще, что отделимость пространства (Х, Д) влечет за собой отделимость пространства (У, Д1) 3.18. Определения. Пусть Х и Z–топологические пространства. Функция f:X→Z называется непрерывной в точке х0єХ, если для каждой окрестности V точки z0=f(x0) в пространстве Z найдется такая окрестность U точки х0 в пространстве Х, что f(U)V (т.е. для любого хєU f(х)єV), а это равносильно включению Uf -1(V). Мы видим, что функция f:X→Z непрерывна в точке х0єХ тогда и только тогда, когда для любой окрестности V точки f(x0) множество f -1(V) является окрестностью точки х0 в пространстве Х.
352 Если функция f:Х→Z непрерывна в каждой точке хєХ, то говорят, что f непрерывна на пространстве Х. 3.19. Теорема. Функция f:Х→Z непрерывна на Х тогда и только тогда, когда для любого множества W, открытого в Z, множество f -1(W) открыто в Х. Доказательство. Пусть f непрерывна на Х. Рассмотрим любое множество W, открытое в Z, и докажем, что множество А=f-1(W) открыто в Х. Для любой точки хєА f(x)єW. Так как W открыто в Z, то W является окрестностью точки f(х) в Z. Из определения непрерывности функции в точке х следует, что в Х найдется окрестность, а, следовательно,-и открытая окрестность Gx точки х такая, что f(Gx)W, т.е. Gxf -1(W) =А. Итак, для любой точки хєА имеем: хєGxА, где
G A. С другой стороны, G содержит все точки множества А, т.е. G A. Значит, А= G , откуда следует, что А-открытое множество. множество Gx открыто в Х. Следовательно,
x
x
õÀ
x
õÀ
õÀ
x
õÀ
Обратно, пусть для любого множества W, открытого в Z, множество G=f -1(W) открыто в Х. Докажем непрерывность функции f в любой точке х0єХ. Пусть V–любая окрестность точки f(х0) в Z. Существует открытое множество WZ такое, что f(х0)єWV. Тогда х0єf -1(W) =GХ и множество G является открытой окрестностью точки х0 в Х. Так как f(G)=WV, то f непрерывна в точке х0, ч.т.д. Замечание. Аналогично доказывается, что функция f:Х→Z непрерывна на Х тогда и только тогда, когда для любого множества F, замкнутого в Z, множество f -1(F) замкнуто в Х. 3.20 Определения. Пусть попрежнему Х и Z–топологические пространства. Биективное отображение f:Х→Z называется взаимно непрерывным, если и f, и обратное ему отображение f -1 непрерывны. Биективное и взаимно непрерывное отображение f:Х→Z называется гомеоморфизмом Х на Z. Если существует гомеоморфизм Х на Z (при этом существует и гомеоморфизм Z на Х), то пространства Х и Z называются гомеоморфными. Замечание. Из вышедоказанного (3.19) с очевидностью вытекает следующее утверждение: всякий гомеоморфизм f:Х→Z переводит открытые (замкнутые) множества пространства Х в открытые же (замкнутые) множества пространства Z. 3.21 Теорема. Пусть Х, У, Z-топологические пространства, f:Х→У-непрерывно и g:У→Z также непрерывно. Тогда суперпозиция g◦f (см. 1.24 и 1.25) есть непрерывное отображение Х в Z. Если f и g–гомеоморфизмы, то g◦f также гомеоморфизм. Доказательство. Докажем, что h=g◦f непрерывно в любой точке х0єХ, если отображение f непрерывно в точке х0, а отображение g непрерывно в точке у0=f(х0). Обозначим z0=h(x0)=g(y0). Возьмем любую окрестность W точки z0 в пространстве Z. Так как g непрерывно в точке y0, то найдется такая окрестность V точки y0 в Y, что g(V)W. А так как f непрерывно в точке х0, то найдется такая окрестность U точки х0 в Х, что f(U)V. Пусть х-любая точка из U. Тогда y=f(x)єV, а g(у)=g(f(x))=h(x)єW. Следовательно, отображение h=g◦f непрерывно в точке х0 и первая часть теоремы доказана. Пусть теперь f и g–гомеоморфизмы и требуется доказать, что и h=g◦f является гомеоморфизмом. Биективность отображения h и равенство h-1=f-1◦g-1 доказаны в 1.25. Непрерывность отображения h только что доказана. Непрерывность отображения h-1 вытекает из доказанного, так как отображения f-1 и g-1 непрерывны. 3.22 Примеры. 1. Естественная топология в R (и единственная топология, которую будем рассматривать в этом множестве) определяется следующим образом. К классу Д открытых множеств отнесем пустое множество и всякое такое множество GR, для каждой точки х которого найдется интервал ( a, b ) такой, что хє( a, b )G. Другими словами: множество G называется открытым, если оно либо , либо каждую свою точку содержит вместе с некоторым интервалом, содержащим эту точку. Заметим, что концы интервала ( a, b ) могут меняться с изменением точки хєG. Можнo дать и такое, равносильное предыдущему, определение: множество G называется открытым в R, если оно либо , либо для любой точки хєG существует такое число ε>0 (зависящее от выбора точки хєG), что интервал (х-ε, х+ε)G (интервалы (х-ε, х+ε) при всех ε составляют базис окрестностей точки х). Выполнение аксиом топологического пространства легко
353 проверяется. Ясно, что любой интервал (включая «интервалы» типа (-, a ) и ( b ,+)) является открытым множеством в R. Следовательно, и объединение любого семейства интервалов представляет собой открытое множество. Промежуток А=( a, b ] не является открытым множеством в R, так как b єА, но при любом ε>0 ( b -ε, b +ε)А. Позднее мы докажем, что всякое открытое множество в R либо пусто, либо представляет собой объединение не более, чем счетного семейства попарно не пересекающихся интервалов. Отрезок [ a, b ] представляет собой замкнутое множество в R, так как его дополнение (, a )( b ,+) является открытым множеством. Для множества А=( a, b ] имеем: Int А=( a, b ),
À =[ a, b ]. Единственными граничными точками множества А являются точки a и b (FrA={ a, b }), причем первая из них не принадлежит множеству А, а вторая принадлежит А. Множество Q всех рациональных чисел всюду плотно в R, т.е. Q =R, так как любая точка из R является точкой прикосновения множества Q: в любом интервале ( a, b ) содержатся рациональные числа. 2. Естественная топология в множестве С всех комплексных чисел (и единственная топология, которую будем рассматривать в этом множестве) определяется следующим образом. Множество Nr(z0)={zєС:|z-z0|0 является открытым множеством в С: если z1єNr(z0), т.е. |z1-z0|=r1
N r r1 (z1)Nr(z0), так как из неравенства |z-z1|0) будем называть также r–окрестностью точки х0. 3.23 Определение. Открытым покрытием множества А в топологическом пространстве Х называется всякое семейство {Gα} открытых подмножеств пространства, такое, что А G .
Множество КХ называется компактным, если каждое открытое покрытие множества К содержит конечное подпокрытие. Это означает, что если К G где {Gα}-любое семейство открытых
n
множеств пространства, то найдется конечное число индексов α1, α2, …, αn, таких, что К
G i 1
i
.
Замечание. Позднее будет доказано (как это отмечено в 3.22), что всякое открытое множество в R либо пусто, либо представляет собой объединение не более, чем счетного семейства попарно не перекающихся интервалов. Но каждый конечный интервал в R можно рассматривать как пересечение с R открытого круга из класcа Д открытых множеств пространства
354 С. Следовательно, топология пространства R индуцирована топологией пространства С. Для любого интервала ( a, b ) на действительной оси можем написать: ( a, b )RС. При этом (как отмечено в 3.22, пример 2) интервал ( a, b ) является открытым множеством в R, но не является открытым множеством в С. Таким образом, свойство множества быть открытым зависит от пространства, в которое оно погружено. Не так обстоит дело с компактными множествами. Следующая теорема показывает, что компактность является, так сказать, «внутренним» свойством множества, не зависящим от объемлющего пространства. 3.24 Теорема. Пусть КУХ, где (Х, Д)-топологическое пространство и топология в У индуцирована топологией пространства Х. Утверждается, что множество К компактно относительно Х тогда и только тогда, когда оно компактно относительно Y. При этом фраза «К компактно относительно Х» означает, что из любого покрытия множества К множествами (подмножествами множества Х), открытыми в пространстве Х, можно выделить конечное подпокрытие. Аналогично понимается фраза «К компактно относительно Y». Доказательство. Пусть множество К компактно относительно Х и требуется доказать, что К компактно относительно Y. Рассмотрим любое семейство множеств {Uα} такое, что каждое Uα открыто относительно Y
и К
U .
При каждом α существует множество Gα, открытое
относительно Х и такое, что Uα=YGα. Так как
U =Y( G ), то К G . Поскольку К
компактно относительно Х, то найдется конечное число индексов α 1, α2, …, αn такое, что n
К
G i 1
n
i
, откуда КY
(G i 1
i
Y ) ,
n
т.е. К
U i 1
i
, что и доказывает компактность
множества К относительно Y. Обратно, пусть К компактно относительно Y и требуется доказать, что К компактно относительно Х. Рассмотрим любое семейство {Gα} множеств, открытых в пространстве Х (GαєД
G . Обозначим U =YG . При всех α U –открытое множество в Y. Так как К (Y G ) U , то семейство {U } представляет собой открытое покрытие при всех α), и такое, что К
α
α
α
α
множества К в пространстве Y. Найдется конечное число индексов α1, α2, …, αn такое, что n
n
i 1
i 1
Ê U i Gi
. Это и доказывает компактность множества К относительно Х, чем и
завершено доказательство теоремы. 3.25. Определение и замечание. Пусть ξ и η-две различные топологии в одном и том же пространстве Х и АХ. Пусть также Дξ и Дη-классы открытых подмножеств множества Х в топологиях ξ и η соответственно. Обозначим через Дξ(А) класс всех пересечений множеств класса Дξ с множеством А. Аналогично определяется класс Дη(А). Будем говорить, что топология ξ слабее топологии η на множестве А, если Дξ(А)Дη(А) и Дξ(А)Дη(А). Почти очевидно, при этом, что если множество А η-компактно, то А также и ξ-компактно. В самом деле, пусть {Gα}-любое семейство множеств класса Дξ, образующих открытое покрытие множества А: А верно и включение А потому-и А
G . Тогда
(G À) . Множества G А являются множествами класса Д (А), а
множествами
α
класса
Дη(А):
GαА=VαА,
ξ
где
при
всех
α
VαєДη.
Итак,
(V À) V . Так как множество А η-компактно, то найдется конечное число индексов
355 n
α1,
α2,
…,
αn
такое,
A Vi
что
n
n
n
i 1
i 1
i 1
A (Vi A) (Gi A) Gi
i 1
Следовательно,
.
, что и доказывает ξ-компактность А.
3.26. Теорема. Если F–замкнутое множество в топологическом пространстве Х и FК, где К-компактное множество в Х, то и F–компактно. Коротко: замкнутые подмножества компактных множеств компактны. Доказательство. Пусть {Gα}–открытое покрытие множества F, т.е. F
G ,
где Gα–
открытые множества пространства X. Если {Gα} не является открытым покрытием множества К, то пусть х-любая точка множества К, не принадлежащая множеству
G . Ясно, что х F, т.е.
хєFc. Так как Fc-открытое множество в Х, то, присоединив его к {Gα}, получим открытое покрытие множества К. Поскольку К-компактно, найдется конечное число индексов α1, α2, …, αn такое, что
KFc Gi ... G n , откуда F Gi G 2 ... G n , что и доказывает компактность множества F. 3.27 Теорема. Любое компактное подмножество К топологического пространства Х (отделимого)-замкнуто. Доказательство. Если множество К не является замкнутым, то К K , но К K (см. 3.6). В этом случае Ê должно содержать хотя бы одну точку прикосновения множества К, не принадлежащую К. Если мы докажем, что любая точка, не принадлежащая К, не является точкой прикосновения множества К, то это будет означать, что К-замкнутое множество. Пусть у К. Для каждой точки хєК существуют непересекающиеся открытые множества Gx и Vx такие, что хєGx, уєVx. Семейство {Gx}, где х «пробегает» все множество К, является открытым покрытием компактного множества К. Следовательно, найдется конечное число точек x1, x2, …, xn множества К таких, что K Gxi Gx2 ... Gxn . Множество V Vxi Vx2 ... Vxn является открытой окрестностью точки у, в которой не содержится ни одной точки из К. Следовательно, у не является точкой прикосновения множества К и замкнутость множества К доказана. 3.28. Теорема. Если {Кα}-семейство компактных подмножеств топологического (отделимого) пространства Х, такое, что пересечение любого конечного подсемейства семейства {Кα} непусто, то и
K непусто.
Доказательство. Допуская противное, зафиксируем множество K 0 из семейства {Кα} и c
для любого α из множества индексов положим Gα= K . Какую бы точку из множества K 0 ни взять, эта точка не принадлежит хотя бы одному множеству семейства {К α}, а потому она принадлежит
G . Следовательно, множества G
α
образуют открытое покрытие множества K 0 .
Так как множество K 0 компактно, найдется конечное число индексов α1, α2, …, αn такое, что
K0 G1 G 2 ... G n . Но отсюда следует, что
K0 K1 K2 ... Kn =.
x K0 K1 K2 ... Kn что
противоречит
включению
(*) В самом деле, если
то хє K 0 и õ G1 , õ G 2 ,..., õ G n , т.е. õ (*).
Но
равенство
n
G i 1
i
,
K0 K1 K2 ... Kn =
356 противоречит условию теоремы. Значит, наше допущение о том, что
K =,-неверно и
теорема доказана. Следствие. Если (Кn)-последовательность непустых компактных множеств в (отделимом)
топологическом пространстве, такая, что КnКn+1 (n=1, 2, 3, …), то и множество
K
n
непусто.
n 1
3.29. Теорема. Всякий отрезок [ a, b ] компактен в множестве R всех действительных чисел, наделенном естественной топологией. Доказательство. Пусть {Gα}–открытое покрытие отрезка [ a, b ]. Рассмотрим множество А={хєR: a <x b и [ a, x ] покрыт конечным числом множеств из {Gα}}. Множество А непусто. В самом деле, пусть точка a G 0 . Тогда найдется число ε>0 такое, что ( a -ε, a +ε) G 0 . Следовательно, отрезок [ a, õ ] при a <x< a +ε покрывается одним множеством G 0 . Нашей целью является показать, что b єА. Для этого достаточно рассмотреть число β=supА и доказать, что βєА и β= b . Так как для любого хєА имеет место неравенство х b , то и β=supА b , т.е.
a <β b . Пусть βє G1 . Тогда найдется число δ>0 такое, что (β-δ, β+δ) G1 и подавно (β-δ, β] G1 . Так как β≥ a +ε, то можно считать, что β-δ≥ a . Поскольку β-верхняя грань 2 множества А, в интервале (β-δ, β) найдется точка хєА. Таким образом, отрезок [ a, õ ] покрыт некоторым конечным числом множеств семейства {Gα},
а отрезок [x, β] покрыт одним
множеством G1 . Следовательно, отрезок [ a, ] покрыт конечным числом множеств семейства
{Gα} и βєА. Остается доказать, что β= b . Предположим противное, т.е. что a <β< b . Рассмотрим любую точку х′:β<х′<min( b , β+δ). Отрезок [ a, ] покрыт конечным числом множеств семейства {Gα}, а отрезок [β, х′] покрыт одним множеством G1 . Следовательно, отрезок [ a, õ ] покрыт конечным числом множеств семейства {Gα}. Это значит, что х′єА, в противоречии с тем, что βверхняя грань множества А. Теорема доказана. 3.30 Следствие из теорем 3.26 и 3.29: всякое ограниченное и замкнутое множество А в R (наделенном естественной топологией)-компактно. В самом деле, так как А-ограниченное множество в R, то найдется такой отрезок [ a, b ]R, что А[ a, b ]. Cогласно 3.29, отрезок [ a, b ]–компактное множество в R. Таким образом, А оказывается замкнутым подмножеством компактного множества, и потому (3.26) А-компактно. 3.31 Теорема. Всякое компактное множество КR (R наделено естественной топологией)замкнуто и ограничено. Доказательство. Замкнутость множества К следует из 3.27, так как множество R, наделенное естественной топологией, является, очевидно, отделимым топологическим пространством. Чтобы убедиться в ограниченности множества К, рассмотрим семейство интервалов (Gn), nєN, где Gn=(-n,n). Ясно, что
G
n
R и потому семейство (Gn) является
n N
открытым покрытием множества К. Из компактности К следует, что найдутся натуральные числа n1, n2,…,np
(конечное число!) такие, что
K Gn1 Gn2 ... Gn ð .
Не ограничивая
общности, можно считать, что n1
357 3.33. Следствие из 3.28 и 3.29: если (Jn)-последовательность «вложенных» друг в друга отрезков в топологическом пространстве R (Jn=[ an , bn ]), т.е. J1J2J3…Jn…, то множество
J
n
непусто.
n 1
3.34 Пусть F–замкнутое и ограниченное сверху множество в R. Утверждается, что
a =supFєF. Доказательство. Убедимся, что a –точка прикосновения множества F. Допуская противное, найдем такую окрестность ( a -ε, a +ε ) точки a (εєR,ε>0), в которой не содержится точек множества F. Но тогда, например, число a
2
является верхней границей множества F, что
абсурдно, ибо a –наименьшая из верхних границ этого множества. Полученное противоречие доказывает, что a является точкой прикосновения множества F, т.е. a є F =F (см. 3.6). 3.35 Определения. Пусть a1 , a2 ,..., an и b1 , b2 ,..., bn –действительные числа, причем
a1 b1 , a2 b2 ,..., an bn . Множество (a1 , b1 ) õ(a2 , b2 ) õ...õ(an , bn ) R n , т.е. множество всех таких точек х=(x1, x2,…, xn)єRn, для которых х1є (a1 , b1 ) , x2є (a2 , b2 ) ,…, хnє (an , bn ) – называется открытым параллелепипидом в Rn (при n=2 множество (a1 , b1 ) õ(a2 , b2 ) называется открытым прямоугольником в R2). Множество [a1 , b1 ]õ[a2 , b2 ]õ...õ[an , bn ] называется замкнутым параллелепипидом в Rn (при n=2 множество [a1 , b1 ]õ[a2 , b2 ] называется замкнутым прямоугольником в R2). 3.36. Теорема. Открытый параллелепипед является открытым множеством в Rn; замкнутый параллелепипед является замкнутым множеством в Rn. Доказательство. параллелепипеда
x0 ( x01 , x02 ,..., x0n ) -произвольная
Пусть
(a1 , b1 ) õ...õ(an , bn ) .
Для
координат
неравенства: a1 x b1 , a2 x b2 ,..., an x bn . 1 0
2 0
r2=min ( x02 a2 , b2 x02 ) ,…,
n 0
rn=min ( x0n an , bn x0n ) ,
x0i
точка
точки
х0
открытого выполняются
Обозначим r1=min ( x01 a1 , b1 x01 ) ,
r=min(r1,
r2,
…,
rn).
Убедимся,
что
Nr(x0) (a1 , b1 ) x(a2 , b2 ) x...x(an , bn ). Пусть x=(x1, x2, …, xn)–любая точка множества Nr(x0). Координаты точки х удовлетворяют неравенству ( x1 x01 ) 2 ( x 2 x02 ) 2 ... ( x n x0n ) 2 r 2 (*) Из неравенства (*), в частности, следует, что | x1 x01 | r или r x1 x01 r , откуда, с одной
стороны,
x1 x01 r a1 r1 r a1 ,
а
с
другой-
x1 x01 r b1 r1 r b1 .
Следовательно, a1 x1 b1 . Aналогично доказывается, что a2 x 2 b2 ,..., an x n bn , откуда x=(x1,
x 2,
…,
xn) (a1 , b1 ) x(a2 , b2 ) x...x(an , bn ).
Этим
доказано,
что
Nr(x0) (a1 , b1 ) x(a2 , b2 ) x...x(an , bn ), а это означает, что (a1 , b1 ) x...x(an , bn ) есть открытое множество в Rn. Теперь докажем, что замкнутый параллелепипед J= [a1 , b1 ]x[a2 , b2 ]x...x[an , bn ] является замкнутым множеством в Rn, т.е. что множество Jc–открыто. Пусть x0 ( x0 , x0 ,..., x0 ) -любая 1
2
n
точка множества Jc. Так как x0 J, то хотя бы одно из двойных неравенств ai x0i bi , i=1, 2, …, n нарушается. Пусть, для определенности, x01 b1 . Обозначим r= x01 b1 и докажем, что Nr(x0)Jc. Координаты любой точки x=(x1, x2, …, xn)єNr(x0) удовлетворяют неравенству (*), откуда r x1 x01 r и x1 x01 r b1 . Следовательно x0 J, т.е. xєJc. Этим и доказано включение
358 c
c
Nr(x0)J , что и означает открытость множества J . Аналогично проходит доказательство в x01 a1 случае, когда или когда нарушается одно из двойных неравенств
a2 x02 b2 ,...., an x0n bn . 3.37 Теорема. Пусть x0 ( x0 , x0 ,..., x0 ) –произвольная точка пространства Rn. Утверждается, что при всевозможных действительных ε>0 открытые параллелепипеды Jε= ( x01 , x01 ) x( x02 , x02 ) x...x( x0n , x0n ) составляют базис окрестностей точки х0. Доказательство. Пусть U-произвольная окрестность точки х0 в Rn. Найдется r–окреcтность 1
2
n
Nr(x0) точки х0 такая, что Nr(x0)U. Убедимся, что при ε<
r имеет место включение: n
JεNr(x0)U. В самом деле, пусть x ( x , x ,..., x ) єJε и требуется доказать, что хєNr(x0). 1
2
n
| x1 x01 | , | x 2 x02 | ,..., | x n x0n | ,
Имеем:
откуда
2
r =r2. Но это и означает, что хєNr(x0). n 3.38 Замечание. Если х=(x1, x2,…, xn)єRn и y=(y1, y2,…, ym)єRm, то пару (х,у) будем рассматривать как элемент пространства Rn+m: (х,у)=(x1, x2,…, xn, y1, y2,…, ym) єRn+m. В соответствии с этим, если АRn и ВRm, то декартово произведение АхВ будем рассматривать как подмножество пространства Rn+m. ( x1 x01 ) 2 ( x 2 x02 ) 2 ... ( x n x0n ) 2 n 2 n
3.39 Теорема. Если множество АRm компактно и x0 ( x0 , x0 ,..., x0 ) єRn, то и множество {х0}хА также компактно в пространстве Rn+m. Доказательство. Пусть {Gα}-открытое покрытие множества {х0}хА в Rn+m. Обозначим 1
1
2
2
n
n
Uα={у=(у1, у2,…,уm)єRm: ( x0 , x0 ,..., x0 , y1, y2,…, ym)єGα}. Убедимся, что Uα-открытое множество в Rm. Рассмотрим любую точку ó0 ( ó0 , ó0 ,..., ó0 ) , принадлежащую множеству Uα. Так как 1
2
m
точка (пространства Rn+m) z0 ( x0 , x0 ,..., x0 , y0 , y0 ,..., y0 ) принадлежит Gα, то найдется r>0 такое, что Nr(z0)={zєRn+m:||z-z0||
=
2
n
1
2
m
( y1 y01 ) 2 ( y 2 y02 ) 2 ... ( y m y0m ) 2 , то точка ( x01 , x02 ,..., x0n , y1, y2,…, ym)єNr(z0)Gα
и потому у=(у1, у2,…,уm)єUα. Итак, всякая точка у0єUα содержится в Uα вместе с некоторой r– окрестностью точки у0, а это означает, что Uα–открытое множество в Rm. Теперь докажем, что каждая точка у=(у1, у2,…,уm) множества А принаделжит хотя бы одному из множеств семейства 1
2
n
{Uα}. Так как точка ( x0 , x0 ,..., x0 , y1, y2,…, ym) принадлежит множеству {х0}хА, то эта точка 1
2
n
покрывается некоторым множеством Gα семейства {Gα}: ( x0 , x0 ,..., x0 , y1, y2,…, ym)єGα. А это и означает, что у=(у1, у2,…,уm)єUα. Таким образом, семейство {Uα} является открытым покрытием множества А в пространстве Rm. Поскольку А компактно, найдется конечное подпокрытие
U
1
, U2 ,..., Uk
множества
x0 õU ) ... (x0 õU
{х0}хА (
1
А: k
).
A U1 U2 ...U k .
Отсюда
Но при любом α, как это следует из определения
множества Uα, {х0}хUαGα. Следовательно, {х0}хА G1 G 2 ... G k , что и доказывает теорему. 3.40 Теорема. Если АRm компактно, хєRn и {Gα}-открытое покрытие множества {х}хА в пространстве Rn+m, то существует такое открытое множество URn, что хєU и множество UхА покрыто конечным числом множеств семейства {Gα}.
359 Доказательство. Так
как
{х}хА компактно в
R
n+m
, то найдутся множества
G1 , G 2 ,..., G k семейства {Gα} такие, что {х}хА G1 G2 ... G k . Пусть х=(x1, x2,…, xn). Для любого у=(у1, у2,…,уm)єА точка (x1, x2,…, xn, у1, у2,…,уm) принадлежит одному или нескольким множествам семейства { G1 , G 2 ,..., G k }. Обозначим через Gу первое из множеств
G1 , G 2 ,..., G k , которому принадлежит точка (x1, x2,…, xn, у1, у2,…,уm) . Так как Gу-открытое множество, то (согласно 3.37) найдется ε>0 такое (это число ε зависит от выбора точки уєА), что (х1-ε,х1+ε)х(х2-ε,х2+ε)х…х(хn-ε,хn+ε)x x(y1-ε,y1+ε)x(y2-ε,y2+ε)x…x(ym-ε,ym+ε)Gу или UyxVyGу , где Uy=(х1-ε,х1+ε)х x(х2-ε,х2+ε)х…х(хn-ε,хn+ε) а Vy=(y1-ε,y1+ε)x(y2-ε,y2+ε)x…x(ym-ε,ym+ε). Заметим, что при любом уєА открытый праллелепипед UyRn содержит точку х, а открытый праллелепипед VyRm содержит точку y. Множества Vy покрывают компактное множество А. Следовательно, найдутся такие точки у1,
у2,…,ур
множества
А,
что
A Vy1 Vy2 ... Vy p .
Обозначим
U U y1 U y2 ... U y p . Ясно, что U–открытое множество в Rn, содержащее точку х. При этом
UõA (UõVy1 ) (UõVy2 ) ... (UõVy p ) (U y1 õVy1 ) (U y2 õVy2 ) ... (U y p õVy p ) k
Gy1 Gy2 ... Gy p G1 G2 ... Gk , т.е. UxA G i , ч.т.д. i 1
3.41 Теорема. Если множество А компактно в пространстве Rn, а множество В компактно в m R , то и АхВ компактно в пространстве Rn+m. Доказательство. Пусть {Gα}-открытое покрытие множества АхВ в пространстве Rn+m и требуется доказать, что АхВ может быть покрыто конечным числом множеств семейства {Gα}. Для любого хєА семейство {Gα} является открытым покрытием множества {х}хВ в Rn+m. Согласно теореме 3.40, найдется такое открытое в Rn множество Ux, что хєUx и множество UxхВ покрыто конечным числом множеств семейства {Gα}. Так как А компактно в Rn, то среди множеств Ux найдется конечное число множеств U x1 , U x2 ,..., U xk , покрывающее А (ведь множества Ux при всех хєА образуют открытое покрытие множества А):
A U x1 U x2 ... U xk . Следовательно, АхВ (U x1 õB) (U x2 õB) ... (U xk õB). Но каждое из множеств
U xi õB (i=1, 2, …, k) покрыто конечным числом множеств семейства {Gα}, откуда вытекает, что и АхВ покрывается конечным числом множеств семейства {Gα}. 3.42 Следствие. Если каждое из множеств Аi (i=1,2,…,к), где к-любое натуральное число) компактно в пространстве R А1хА2х…хАк
компактно
в
ni
(n1, n2,…,nk-любые натуральные числа), то и произведение
пространстве
R n1 n2 ...nk . В частности, любой замкнутый
параллелепипед [a1 , b1 ]õ[a2 , b2 ]õ...õ[an , bn ] компактен в пространстве Rn. 3.43. Теорема. Всякое замкнутое и ограниченное множество в Rn компактно. И обратно, всякое компктное множество в Rn замкнуто и ограничено. Доказательство. Пусть множество АRn замкнуто и ограничено. Согласно определению, приведенному в упр. 75 к главе 2, ограниченность множества А означает, что А{хєRn: ( x ) ( x ) ... ( x ) r} при некoтором r>0 (xi-координаты вектора х). Но 1 2
2 2
n 2
тогда ясно, что AJ=[-r,r]x[-r,r]x…x[-r,r]. Так как множество J компактно в Rn, то компактно и его замкнутое подмножество А (3.26). Обратно, пусть АRn компактно. Тогда А замкнуто в Rn (3.27). Остается доказать, что Аограничено. Допустим противное. Тогда при любом r>0 в множестве А найдется такая точка х=(x1, x2,…,
xn),
что ( x ) ( x ) ... ( x ) >r. 1 2
2 2
n 2
Рассмотрим
множества
360 Nk(θ)={хєRn: ( x ) ( x ) ... ( x )
N ê 1
k
2 2
n 2
( ) R n , т.е. семейство {Nk(θ)}, k=1, 2, …, m,… является открытым покрытием
компактного множества А. Поэтому найдутся натуральные числа
к1, к2,…, кр такие, что
к1<к2<…<кр и A N k1 ( ) ... N k p ( ) N k p ( ), т.е. для любой точки х=(x1, x2,…, xn)єA выполняется неравенство
( x1 ) 2 ( x 2 ) 2 ... ( x n ) 2
неограниченности множества А. Это противоречие и доказывает теорему. 3.44 Теорема. Пусть f–непрерывное отображение компактного топологического пространства Х в топологическое пространство Y. Тогда множество значений отображения f, т.е. множество f(X) компактно в Y. Доказательство. Пусть {Gα}-любое открытое покрытие множества f(X) в пространстве Y. Согласно 3.19, множества Uα=f-1(Gα) являются открытыми множествами в Х. Убедимся, что семейство {Uα} является открытым покрытием множества Х. Взяв любую точку х 0єХ, найдем такое множество G 0 из семейства {Gα}, что y0=f(x0)є G 0 . Тогда ясно, что x0єf-1( G 0 )= U 0 , а это и доказывает (учитывая, что множества Uα–открыты в Х), что семейство {Uα} является открытым покрытием множества Х. Так как Х компактно, то это множество покрывается конечным числом множеств семейства {Uα}:
X U1 U2 ... Uk .
Отсюда f(X) f (U1 ) f (U 2 ) ... f (U k ) G1 G 2 ... G k , что и доказывает компактность множества f(X) в Y. Замечания. 1) Доказанная теорема применима к случаю, когда Х и Y–топологические пространства, А-компактное множество в Х и функция f (со значениями в Y) определена только на множестве А. Если функция f непрерывна на множестве А, которое рассматривается как топологическое пространство с топологией, индуцированной топологией пространства Х,-то множество f(А) компактно в пространстве Y. 2) Справедливо также следующеее утверждение, слегка измененное по сравнению с доказанным. Пусть Х и Y–топологические пространства и f–функция, определенная на Х и со значениями в Y. Если f непрерывна в точках множества А, компактного в пространстве Х, то множество f(A) компактно в пространстве Y. Доказательство этого утверждения повторяет доказательство теоремы 3.44 с той разницей, что множества Uα определяются следующим образом: Uα=Int f-1(Gα). 3.45. Следствие из теоремы 3.44. Пусть Х-топологическое пространство, А-компактное множество в Х и f- функция, определенная на всем Х или только на множестве А и со значениями в R (такая функция называется вещественной). Если f непрерывна на А (см. замечания к теореме 3.44), то она ограничена (на А) и достигает на множестве А своих нижней и верхней граней. Доказательство. Согласно 3.44, множество f(A) компактно в R, а потому-замкнуто и ограничено (см. 3.31). Из ограниченности множества f(A) в R следует существование supf(A) и inf f(A). Так как f(A)–замкнуто в R, то supf(A)єf(A) (см. 3.34), т.е. supf(A)=f(x*), для некоторого х*єА. Подобно тому, как это сделано в 3.34, легко доказать, что для замкнутого и ограниченного снизу множества FR infFєF. Поэтому и inf f(A)єf(A), т.е. inf f(A)=f(х*) для некоторого х*єА. Замечание. Если, в частности, А-компактное множество в R (т.е. А-замкнуто и ограничено в R; например, А может представлять собой любой отрезок [a, b] R) и функция f:А→R непрерывна на А, то она ограничена и достигает на множестве А своих нижней и верхней граней (т.е. имеет на множестве А наименьшее и наибольшее значения).
361 Заметим еще, что если АR (А не обязательно есть компактное множество в R), то непрерывность функции f:А→R в какой-либо точке х0єА означает слeдующее: по любому ε>0 можно найти такое δ>0, что f((х0-δ,х0+δ)∩А)(f(х0)-ε, f(х0)+ε). Другими словами: функция f:А→R (АR) непрерывна в какой-либо точке х0єА тогда и только тогда, когда по любому ε>0 можно найти такое δ>0, что для любых хєА, удовлетворяющих неравенству |xx0|<δ, выполняется неравенство |f(x)-f(x0)|<ε. 3.46 Теорема. Непрерывное биективное отображение f компактного топологического пространства Х на топологическое пространство Y есть гомеоморфизм. Доказательство. Чтобы установить непрерывность обратного к f отображения f-1 достаточно показать, что f–открытое отображение, т.е. что f переводит открытые множества пространства Х в открытые же множества пространства Y (см. 3.19). Пусть Gоткрыто в Х. Тогда F=Х\G есть замкнутое множество в Х, а так как Х-компактно, то и F компактно в Х (3.26). Следовательно, множество f(F) компактно в Y (см. замечания к теореме 3.44), а потому является замкнутым множеством пространства Y (3.27). Из очевидного равенства Y=f(G)f(F), в котором множества в правой части не пересекаются, следует, что f(G)=Y\f(F). А это и означает, что f(G)–открытое множество пространства Y. 3.47 Определения и замечания. Говорят, что последовательность (хn) элементов топологического пространства Х сходится к точке à єХ, если для любой окрестности U точки à найдется такое натуральное число к, что при всех n>к xnєU. При этом пишут
x a (или просто lim xn= à ). xn→ à или lim n n
Элемент à называется пределом последовательности (хn). Легко видеть, что в отделимом топологическом пространстве любая последовательность (хn) не может иметь более одного предела. Если Х-нормированное векторное пространство, то сходимость последовательности (хn) к элементу à єХ имеет место тогда и только тогда, когда по любому ε>0 можно найти такое натуральное число к, что при всех n>к ||xn- à ||<ε (или |xnà |<ε, если Х=R или Х=С). Если xn→ à в нормированном пространстве Х, то из неравенства (упр. 66 к гл.2) | ||xn||-|| à || |||xn- à || следует, что ||xn||→|| à || в R. Пусть xnєС и
à n =Rexn, bn =Jmxn, так что xn= à n + bn i. Если xn→x= à + b i, то по любому ε>0 можно
(an a) 2 (bn b) 2 <ε. Следовательно, при всех n>к выполняются неравенства | à n - à |<ε и | bn - b |< ε. A это и означает, что à n → à и bn → b (в пространстве R). Легко доказать и обратное (это предоставляется читателю): если à n → à и bn → b в R, то à n + bn i→ à + b i в С. найти такое натуральное число к, что при n>к |xn-x|<ε, т.е.
Пусть элементы последовательности (хn) принадлежат пространству Rm (m≥2):
x1 ( x11 , x12 ,..., x1m ), x2 ( x12 , x22 ,..., x2m ), .............................. xn ( x1n , xn2 ,..., xnm ), ............................
Таким образом, последовательность (хn) 1 n
2 n
порождает m последовательностей
m n
( x ), ( x ),..., ( x ) в R. Читателю предлагается доказать, что последовательность (хn) сходится
к
х=(x1,
элементу
x2,…,
xm)єRm
тогда
и
только
тогда,
когда
x x , x x ,..., x x (при n→). 1 n
1
2 n
2
m n
m
Многие топологические свойства нормированных и так называемых метрических пространств, о которых речь пойдет ниже, удобно описываются в терминах сходящихся последовательностей. Однако эти свойства теряют силу для общих топологических
362 пространств, если не обобщить понятие последовательности. Один из способов такого обобщения основан на использовании понятия фильтра. 3.48 Определения, примеры, замечания. Пусть Х-любое множество. Непустой класс F непустых подмножеств множества Х называется фильтром, если он удовлетворяет двум условиям: 1) если АєF и ВєF, то и А∩ВєF; 2) если АєF и ВА, то и ВєF. Например, если АХ и А, то класс всех подмножеств множества Х, содержащих А, является фильтром. Если Х-топологическое пространство, то класс всех окрестностей какой-либо точки х0єХ является фильтром. Пусть по-прежнему Х-любое множество. Непустой класс В непустых подмножеств множества Х называется базисом фильтра, если он удовлетворяет условию: для любых АєВ и ВєВ существует такое множество СєВ, что СА∩В. Убедимся, что если В–базис фильтра, то класс F всех множеств (подмножеств множества Х), каждое из которых содержит какое-либо множество из В, является фильтром. В самом деле, если АєF и ВєF, то АА1, ВВ1, где множества А1 и В1 принадлежат В. Следовательно, А∩ВА1∩В1СєВ, откуда можем сделать вывод, что А∩ВєF. Выполнение второй аксиомы фильтра очевидно. F называется фильтром, порожденным базисом В. Пусть Х и Y–два непустых множества, f-отображение Х в Y и В–базис фильтра (или фильтр) в Х. Под f(В) будем понимать класс всех множеств f(А)Y, где А-любое множество класса В. Убедимся, что f(В)-базис фильтра в Y. Рассмотрим любые два множества f(А) и f(В) из f(В), где АєВ и ВєВ. Так как В-базис фильтра, то найдется такое СєВ, что СА∩В. Следовательно, f(С)f(А∩В)f(А)∩f(В), причем f(С)єf(В). Значит, f(В)действительно является базисом фильтра в Y. Пусть Х-топологическое пространство и F –фильтр в Х. Говорят, что F сходится к точке х0єХ, если каждая окрестность точки х0 принадлежит F . В этом случае будем писать: F→х0. Если В-базис фильтра, то будем писать В→х0, если каждая окрестность точки х0 содержит некоторое множество из В. Ясно, что при этом фильтр F, порожденный базисом В, сходится к точке х0. Заметим, что если F-фильтр в топологическом пространстве Х и F→х0єХ, то х0є À для каждого множества АєF. В самом деле, пусть U–любая окрестность точки х0 в Х. Так как F→х0, то UєF . Следовательно, U∩АєF и потому U∩А. Значит, х0-точка прикосновения множества А. Заметим еще, что сходящийся к точке х0 фильтр F может содержать не только окрестности точки х0. Приведем пример. Пусть Х=R, х0єR и класс В состоит из интервалов (х0-ε, х0+ε) и (х0, х0+δ), где ε и δ-любые действительные положительные числа. Ясно, что В представляет собой базис фильтра и порожденный им фильтр F сходится к точке х0. Вместе с тем F содержит не только окрестности х0. 3.49 Теорема. В отделимом топологическом пространстве фильтр может сходится не более чем к одной точке. Доказательство. Допустим противное, т.е. что некоторый фильтр F сходится к двум различным точкам х0 и у0. Найдем непересекающиеся окрестности U и V точек х0 и у0 соответственно. Так как F→х0, то UєF. Аналогично и VєF. Но тогда и U∩VєF, что невозможно, ибо U∩V=, а фильтр состоит из непустых множеств. Полученное противоречие доказывает теорему. 3.50 Определение. Пусть в множестве Х даны два фильтра F и F* Будем говорить, что F * мажорирует фильтр F, если F F*. 3.51 Замечание. В приведенном выше примере (базис В фильтра F состоит из интервалов (х0-ε, х0+ε) и (х0, х0+δ), где ε и δ-любые положительные числа) фильтр F мажорирует фильтр окрестностей точки х0, не совпадая с этим последним. Если Х-топологическое пространство, х0єХ и F -фильтр в Х, то ясно, что F→х0 в том и только в том случае, когда F мажорирует фильтр окрестностей точки х0. Заметим, что
363 если фильтр F→х0 в некоторой топологии, определенной в множестве Х, то он остается сходящимся к х0 в любой более слабой топологии. Убедимся, что фильтры являются обобщением последовательностей. Пусть (xn)– последовательность элементов множества Х. Обозначим через Хк (к=1,2,…,n,…) следующее множество: Хк={хєХ: х=хi хотя бы при одном i≥к}. Тогда Х1Х2…Хn… и множества Х1, Х2, Х3, …, Хn,… образуют базис фильтра. Порожденный этим базисом фильтр называется элементарным фильтром, ассоциированным с последовательностью (хn). Заметим, что если все члены последовательности (xn) равны одному и тому же элементу х1, то при любом кєN Хк={х1} и элементарный фильтр F состоит из всех подмножеств множества Х, содержащих точку х1. Если Х-топологическое пространство, то ясно, что F →х1 и xn→х1. Следующая теорема показывает, что это не случайно. 3.52. Теорема. Пусть Х-топологическое пространство и (xn)-последовательность элементов множества Х. Утверждается, что последовательность (xn) сходится к элементу à єХ тогда и только тогда, когда ассоциированный с нею элементарный фильтр F сходится к à (пространство Х, как всегда, предполагается отделимым). Доказательство. Пусть xn→ à . Беря любую окрестность U точки à , заключаем, что при достаточно больших значениях n XnU. А так как множества Х1, Х2, …, Хn,… образуют базис фильтра F, то UєF. Итак, F содержит все окрестности точки à , откуда и следует, что F→ à . Обратно, если F→ à , то F содержит все окрестности точки à . Bозьмем любую окрестность U точки à . Так как UєF, а F состоит из множеств, каждое из которых содержит хотя бы одно множество из последовательности Х1, Х2, …, Хn,…, то при некотором nєN UXn. A это и означает, что xn→ à . 3.53. Определение. Пусть (xn) и (yn) –две последовательности элементов множества Х. Говорят, что последовательность (yn) является подпоследовательностью последовательности (xn), если существует такая последовательность (кn) натуральных чисел, что к1<к2<…<кn<… и y1= õê1 , y2= õê 2 ,…, yn= õê n , … 3.54 Замечание. Пусть (yn) есть подпоследовательность последовательности (xn). Базис элементарного фильтра F, ассоциированного с последовательностью (xn), составляют множества Х1, Х2, …, Хn,…, определенные в 3.51. Базис элементарного фильтра F1, ассоциированного с последовательностью (yn), составляют множества Y1, Y2, …,Yn,…, причем Y1 Õê1 , Y2 Õê2 , …, Yn Õên ,… Убедимся, что F F1. В самом деле, если
АєF, то при некотором nєN A X n Õên Yn , откуда следует, что АєF1. Итак, выражаясь коротко: элементарный фильтр, ассоциированный с подпоследовательностью данной последовательности, мажорирует элементарный фильтр, ассоциированный с самой последовательностью. 3.55 Теорема. Пусть (xn) и (yn)–две последовательности элементов множества Х. Пусть также F-элементарный фильтр, ассоциированный с последовательностью (xn), а F1элементарный фильтр, ассоциированный с последовательностью (yn). Утверждается, что если фильтр F1 мажорирует фильтр F (т.е. FF1), то существуют натуральное число к и последовательность (pn) натуральных чисел такие, что для всех n≥k yn= x pn и pn→ при n→ (т.е. для любого натурального числа s найдется такое натуральное число ms, что при всех n, удовлетворяющих неравенству n≥ms, выполняется неравенство pn≥s). Доказательство. Множество Х1={хєХ:х=хi, i≥1} принадлежит фильтру F, а так как FF1, то Х1єF1. Следовательно, множество Х1 содержит (в качестве подмножеств) некоторые множества из базиса фильтра F1. Обозначим через к наименьшее натуральное число такое, что Х1Yк. Для каждого из элементов ук, ук+1,…, уn, … можно найти совпадающий с ним член последовательности x1,x2,…,xr,… Приступим к построению последовательностей (pn) и (ms). На первом шагу положим m1=к и определим ðm1 =рк как номер первого члена последовательности x1,x2,…,xi,…, совпадающего с ук= y m1 . Будем
364 иметь: ym1 yk x pk x pm1 . Если к=1, то на этом первый шаг заканчивается. Если к>1, то определим натуральные числа р1, р2, .., рк-1, полагая р1=р2= ..=рк-1=1, после чего первый шаг заканчивается. Таким образом, после первого шага будут определены натуральные числа m1=к и р1, р2, .., pm1 такие, что Х1 Ym1 и ym1 x pm1 . На втором шагу определим натуральное число m2 как наименьшее натуральное число, удовлетворяющее условиям: Х2 Ym2 и m2≥m1+1. Такое число m2 существует, ибо Х2 содержит некоторые множества Yr и Y1Y2Y3…Определим теперь ðm2 как номер первого члена в последовательности х2, х3, …, совпадающего с óm2 . Тогда óm2 = x pm2 и
ðm2 ≥2. Если m2=m1+1, то на этом второй шаг заканчивается. Если же m2>m1+1, то для каждого натурального числа n, удовлетворяющего неравенствам m1+1nm2-1, определим натуральное число pn как номер первого числа в последовательности х 1, х2, х3, …, совпадающего с yn. На этом второй шаг заканчивается. В результате, после двух шагов будут определены натуральные числа m1 (m1=к) и m2 (m2>m1) и натуральные числа p1, p2,…, ð m1 ,…, ðm2
такие, что при n≥к (и, конечно, nm2) yn= x pn . При этом будут
выполняться условия: Х1 Ym1 , Х2 Ym2 , ðm2 ≥2 и pn≥1 при n≥m1=k (nm2). На третьем шагу определим натуральное число m3 как наименьшее натуральное число, удовлетворяющее условиям: X3 Ym3 и m3≥m2+1. Затем определим ðm3 как номер первого числа в последовательности х3, х4, …, совпадающего с óm3 . Тогда óm3 = x pm 3 и
ðm3 ≥3. Если m3=m2+1, то на этом третий шаг заканчивается. Если же m3>m2+1, то для каждого натурального числа n, удовлетворяющего неравенствам m2+1nm3-1, определим натуральное число pn как номер первого члена в последовательности х 2, х3, х4, …, совпадающего с yn. На этом третий шаг заканчивается. В результате, после трех шагов будут определены натуральные числа m1, m2, m3 (k=m1<m2<m3) и натуральные числа
p1 ,..., pm1 ,..., ðm2 ,..., pm3 такие, что при n≥к (и, конечно, nm3) yn= x pn . При этом будут выполняться неравенства pn≥1 при n≥m1, pn≥2 при n≥m2 (nm3) и ðm3 ≥3. Кроме того, будут иметь место включения Xi Ymi , i=1,2,3. Продолжая вышеописанный пошаговый процесс, мы определим две последовательности (ms) и (pn) такие, что: 1) m1<m2<m3<…<ms<…; 2) при n≥m1=к yn= x pn ; 3) pn≥1 при n≥m1, pn≥2 при n≥m2 и, вообще, pn≥s при n≥ms, где s–любое натуральное число. Теорема доказана. 3.56 Определение. Фильтр, не мажорируемый никаким отличным от него фильтром, называется ультрафильтром. 3.57 Теорема. Каждый фильтр мажорируется некоторым ультрафильтром. Доказательство. Пусть F –фильтр в Х, не являющийся ультрафильтром. Тогда в Х существует фильтр Ф, отличный от F и такой, что FФ. Рассмотрим класс К всех фильтров в Х (каждый фильтр в Х является подмножеством множества В (Х)). Имеем: FєК, ФєК, К={F, Ф}К и К является цепью множеств из К. Согласно аксиоме максимальной цепи (см. 1.115), существует максимальная цепь М множеств из К, содержащая К: КМК. Обозначим через F* объединение всех фильтров макисмальной цепи М. F* представляет собой класс всех тех множеств (подмножеств множества Х), каждое из которых принадлежит какому-либо фильтру максимальной цепи М. Легко видеть, что F* является фильтром в Х, мажорирующим фильтр F. Остается убедиться в том, что F*–ультрафильтр. В самом деле, фильтр F* мажорирует любой
365 фильтр цепи М. Если бы существовал фильтр, мажорирующий фильтр F* и отличный от него, то его можно было бы присоединить к цепи М и получить «более длинную» цепь, что противоречит максимальности цепи М. Следовательно, F*–ультрафильтр, ч.т.д. 3.58 Теорема. Если F –ультрафильтр в множестве Х и А-любое подмножество множества Х, то либо АєF, либо АсєF. Доказательство. Пусть А F. Тогда для любого ВєF В∩Ас, ибо в противном случае для некоторого В0єF было бы: В0∩Ас=, откуда В0А и АєF. Итак, В∩Ас при любом ВєF. Если В1 и В2-любые два множества из F, то из равенства (В1∩Ас)∩(В2∩Ас)=(В1∩В2)∩Ас следует (так как В1∩В2єF), что множества В∩Ас при всевозможных ВєF образуют базис фильтра. Обозначив этот фильтр через Ф, видим, что все множества В из F принадлежат фильтру Ф, т.е. FФ. Так как Fультрафильтр, то Ф=F откуда следует, что АсєF (ибо очевидно, что АсєФ). Теорема доказана. Следствие из теоремы 3.58. Если F-ультрафильтр в множестве Х, AiХ при i=1, 2, …, n (где n
n–любое натуральное число) и
A єF, то хотя бы одно из множеств А , А , …, А i
1
i 1
2
n
принадлежит
ультрафильтру F. Доказательство. Допуская противное, мы должны заключить (на основании 3.58), что
A1c єF, n
n
A ) ( A )
= (
Anc єF.
A2c єF,…, i
ñ
i
i 1
i 1
n
Но
тогда
A
c i
єF,
откуда
следует,
что
i 1
n
n
i 1
i 1
( Ai ) ( Àic ) єF. Так как это противоречит определению фильтра,
то наше допущение неверно и следствие доказано. 3.59 Лемма. Пусть Х-топологическое пространство и АХ. Утверждается, что множество А компактно тогда и только тогда, когда любое семейство непустых замкнутых множеств пространства, пересечение которых не имеет с А общих точек, содержит конечное подсемейство, обладающее тем же свойством. Доказательство. Пусть А компактно. Рассмотрим любое такое семейство {Fα} непустых ñ
F ) Fc . Мы
замкнутых множеств пространства, что ( F ) ∩А=. Ясно, что А (
является открытым покрытием множества А. Так как А-компактно, то c
видим, что семейство F
n
найдется конечное число индексов α1, α2, …, αn таких, что А
n c Fi i1
c
∩А=, т.е.
n F i ∩А=. i 1
F
c
i 1
i
. Следовательно,
А это и означает, что семейство {Fα}
содержит
конечное подсемейство, пересечение множеств которого не имеет с А общих точек. Обратно, пусть любое семейство {Fα} непустых замкнутых множеств пространства такое, что ( F ) ∩А=, содержит конечное подсемейство, обладающее тем же свойством. Докажем,
что А-компактно. Рассмотрим любое открытое покрытие {Gα} множества А: А Ясно, что если хотя бы для одного индекса α0
G .
G 0 =Х, то покрытие {Gα}
содержит c
конечное подпокрытие множества А. Если же при любом α GαХ, то множества Fα= G являются c
непустыми
замкнутыми
множествами
пространства.
При
этом
G ∩А=, т.е.
(
что
366 F ) ∩А=. Согласно условию, существует конечное число индексов α1, α2, …, αn таких,
n F i ∩А=.Следовательно i 1
c
n n n c А Fi Fi Gi . i 1 i 1 i 1
А это и означает, что
открытое покрытие {Gα} множества А содержит конечное подпокрытие. Лемма доказана. 3.60 Теорема. Пусть Х-топологическое пространство и АХ. Утверждается, что А компактно тогда и только тогда, когда каждый фильтр, содержащий А, мажорируется фильтром, сходящимся к некоторой точке из А. Доказательство. Пусть А-компактно и F–любой фильтр, содержащий А. Убедимся, что F мажорируется фильтром, сходящимся к некоторой точке из А. Для любого ВєF множество B является непустым замкнутым множеством, принадлежащим фильтру F. Рассмотрим семейство { B }, ВєF. Если бы оказалось, что
B ∩А=, то, согласно лемме, нашлось бы конечное BF
семейство множеств В1, В2, …, Вn из F, для которого
n Bi ∩А=. Но это невозможно, ибо i 1
Bi єF (1in). Следовательно, B ∩А≠, т.е. существует такая точка х0єА, что BF х0є B . Другими словами, х0є B для любого множества ВєF.. Поэтому для любой окрестности U АєF и
BF
точки х0 и любого множества ВєF множество U∩В непусто. Отсюда, в свою очередь, следует, что множества U∩В образуют базис фильтра F*, мажорирующего как фильтр F, так и фильтр окрестностей точки х0. Итак, фильтр F мажорируется фильтром F*, сходящимся к точке х0єА. Обратно, пусть для каждого фильтра, содержащего А, найдется мажорирующий фильтр, сходящийся к некоторой точке из А. Убедимся, что при этих условиях множество А компактно. Достаточно показать (на основании леммы), что всякое семейство {Fα} непустых замкнутых множеств, такое, что ( F ) ∩А=, содержит конечное подсемейство, обладающее тем же
свойством. Допустим противное. Тогда найдется семейство {Fα} непустых замкнутых множеств,
F ) ∩А=,
такое, что (
но при любом натуральном n
n F i ∩А≠. Ясно, что множества вида i 1
и любых индексах α1, α2, …, αn
n F i ∩А образуют базис фильтра, содержащего i 1
А. Для этого фильтра найдется мажорирующий фильтр F, сходящийся к некоторой точке х0єА. Фильтр F содержит все множества Fα и все окрестности точки х0. Так как любые два множества фильтра имеют непустое пересечение, то при любом α х 0є F =Fα.. Следовательно, х0є
F
и
( F ) ∩А≠. Полученное противоречие показывает, что наше допущение неверно и на самом
F ) ∩А=, содержит
деле всякое семейство {Fα} непустых замкнутых множеств такое, что (
конечное подсемейство, обладающее тем же свойством. А это означает, что множество А компактно, ч.т.д. 3.61 Следствие из теорем 3.60 и 3.57. Множество А в топологическом пространстве Х компактно тогда и только тогда, когда каждый ультрафильтр, содержащий А, сходится к некоторой точке из А.
367 Доказательство. Пусть А-компактно и F–любой ультрафильтр, содержащий А. Убедимся, что F сходится к некоторой точке из А. Согласно теореме 3.60, найдется фильтр F*, мажорирующий фильтр F и сходящийся к некоторой точке из А. Но так как F–ультрафильтр, то F*=F откуда следует, что F сходится к некоторой точке из А. Обратно, пусть каждый ультрафильтр, содержащий А, сходится к некоторой точке из А. Убедимся, что А компактно. Достаточно показать (на основании теоремы 3.60), что каждый фильтр Ф, содержащий А, мажорируется фильтром, сходящимся к некоторой точке из А. Согласно теореме 3.57, найдется ультрафильтр Ф *, мажорирующий фильтр Ф. Так как АєФФ*, то ультрафильтр Ф* сходится к некоторой точке из А, ч.т.д. 3.62. Определения и замечания. Пусть Х-произвольное непустое множество. Функция d:ХхХ→R называется метрикой в Х, если она удовлетворяет следующим трем условиям: 1) d(х,у)>0, если ху и d(х,х)=0 для любых х и у из Х; 2) d(х,у)=d(у,х) для любых х и у из Х; 3) d(x,z)d(х,у)+d(y,z) для любых х,у,z из Х. Условие 3) называется неравенством треугольника. Неотрицательное число d(х,у) называется расстоянием между точками х и у. Если множество Х наделено метрикой d, то пара (Х,d) называется метрическим пространством. Допуская вольность речи, мы часто будем говорить просто о метрическом пространстве Х. Заметим, что каждое подмножество Y метрического пространства Х является метрическим пространством с той же самой функцией растояния (точнее, метрика в Y–это сужение метрики d на множество YxY). Любое нормированное вектороное пространство Х можно естественным образом наделить метрикой, полагая (для любых х и у из Х) d(х,у)=||х-у||. Выполнение условий 1) и 2) очевидно. Неравенство треугольника также выполняется, ибо d(x,z)=||x-z||=||(x-y)+(y-z)||||x-y||+||yz||=d(x,y)+d(y,z). В частности, естественная метрика в R (или С), определяется равенством: d(x,y)=|x-y|. Если х и у-элементы пространства Rn: x=(x1, x2,…, xn), y=(y1, y2,…, yn), то d(x,y)=||xy||= ( x1 y1 ) 2 ... ( x n y n ) 2 . Естественная топология в метрическом пространстве Х с метрикой d определяется следующим образом (см. 3.22). Для любой точки х 0єХ и любого действительного числа r>0 множество Nr(x0)= ={хєХ: d(x,x0)
3.63 Определение. Пусть Х-метрическое пространство и АХ. Точка х0єХ называется предельной точкой множества А, если каждая окрестность точки х0 содержит точку хєА, отличную от х0. 3.64 Замечание. Легко доказать (это предоставляется читателю), что если х 0-предельная точка множества А в метрическом пространстве Х, то любая окрестность точки х 0 содержит бесконечно много точек множества А. 3.65. Теорема. Множество А в метрическом пространстве Х замкнуто тогда и только тогда, когда оно содержит все свои предельные точки. Доказательство. Пусть А-замкнуто и х0-любая предельная точка множества А. Убедимся, что х0єА. Так как предельная точка является точкой прикосновения множества А, то х 0є À . Но,
368 согласно теореме 3.6, замкнутое множество А совпадает со своим замыканием. Следовательно, х0єА. Обратно, пусть А содержит все свои предельные точки. Убедимся, что А-замкнутое множество. Достаточно показать, что À А. Пусть х0-любая точка множества À , т.е. х0-любая точка прикосновения множества А. Если х0-предельная точка множества А, то (так как А содержит все свои предельные точки) х0єА. Если же х0 не является предельной точкой множества А, то найдется такая окрестность U точки х0, в которой нет точек множества А, отличных от х0. Но так как U∩А≠, то х0єА. Этим и доказано, что À А, откуда следует (так как А À ), что А= À и потому А-замкнуто (теорема 3.6). 3.66 Замечание. Пусть d-метрика в множестве Х и топология в Х определена метрикой d. Пусть также Y–любое подмножество (непустое) множества Х. Как уже указывалось выше, множество Y может рассматриваться как самоcтоятельное метрическое пространство с метрикой d1, являющейся сужением метрики d на множество YxY. Метрика d1 определяет в Y топологию и возникает вопрос, является ли она топологией, индуцированной топологией пространства Х? (см. 3.17). Следующая теорема дает положительный ответ на этот вопрос. 3.67. Теорема. Класс Д1 открытых множеств в пространстве (Y,d1) является классом пересечений с множеством Y всех множеств класса Д открытых множеств пространства (X,d). Доказательство. Пусть UєД1. Если U=, то U=∩Y (єД). Если U, то для любого уєU найдется такое ry>0, что
N U= ry ( y ) yU
={zєX:
и что
d(z,y)
N ry ( y ) U, где N ry ( y ) ={zєY: d1(z,y)
N ry ( y ) N ry ( y) ∩Y, где N ry ( y ) = Имеем:
U=
(N yU
ry
( y) Y ) ( N ry ( y)) Y ) V Y , yU
где
V N ry ( y) Д. yU
Обратно, пусть G–любое открытое множество пространства (Х, d), т.е. GєД, и требуется доказать, что G∩YєД1. Рассмотрим любую точку у множества G∩Y. Так как уєG, то найдется такое ry>0, что
N ry ( y ) G,
откуда
N ry ( y ) ∩YG∩Y,
т.е.
N ry ( y ) G∩Y.
Итак, множество
G∩Y каждую свою точку у содержит вместе с некоторым открытым шаром
N ry ( y )
пространства (Y,d1). А это и означает, что G∩Y-открытое множество пространства (Y,d1), т.е. G∩YєД1. 3.68 Определение. Пусть Х-метрическое пространство и АХ. Множество А называется ограниченным, если для каждой точки х0єХ найдется такое действительное положительное число М0, что d(х0,х)<М0 при всех хєА. 3.69. Замечание. Если хотя бы для одной точки х0єХ найдется такое действительное число М0, что d(х0,х)<М0 при всех хєА, то можно утверждать, что множество А ограничено, ибо для любой другой точки у0єХ и любого хєА будет выполняться неравенство d(y0,x)
369 3.70. Определение. Диаметром ограниченного множества А в метрическом пространстве Х называется число supS, где S–множество в R, определенное в 3.69. Это число обозначается символом diam A. Если множество А не является ограниченным, то для любого действительного числа М>0 найдутся такие точки х и у из А, что d(х,у)≥М. В этом случае говорят, что diam A равен +. Замечание. Читателю предлагается проверить, что для любого множества АХ diam
À =diam A. 3.71 Определение. Метрическое пространство Х называется сепарабельным, если оно содержит счетное всюду плотное подмножество. 3.72 Замечание. Следующая лемма позволяет доказать сепарабельность пространства R (а также Rn при n>1), наделенного естественной метрикой. 3.73 Лемма. МножествоQ всех рациональных чисел-счетно. Доказательство. Множество Z всех целых чисел, очевидно, является счетным множеством. По теореме 1.110 декартово произведение ZxN также счетно. Всякое рациональное число можно представить в виде частного представление не единственно, так как при к=1,2,3… частные
m , где mєZ, а nєN. Это n
km выражают одно и то же kn
рациональное число (см. 2.64, 2.67, 2.70). Определим отображение f:Q→ZxN следующим образом. Для любого рационального числа
p =r, и из всех этих пар выберем пару q p1 (p1,q1) с наименьшей второй компонентой. Полагая f(r)=(p1,q1) (при этом =r), мы получим q1 r рассмотрим множество всех таких пар (р,q)єZxN, что
инъективное отображение f множества Q в множество ZxN. Следовательно, Q~f(Q)ZxN. Так как множество Q бесконечно (оно содержит счетное подмножество, состоящее из чисел 1,
1 1 1 , ,..., ,... ), то и f(Q)-бесконечно. Согласно теореме 1.94, всякое бесконечное подмножество 2 3 n счетного множества-счетно. Следовательно, множество f(Q) счетно, а потому счетно и эквивалентное ему множество Q. Лемма доказана. 3.74. Замечание. Все положительные рациональные числа можно расположить в последовательность следующим образом. Записав каждое рациональное число r>0 в виде частного
p двух натуральных чисел с наименьшим возможным знаменателем, назовем высотой числа r q натуральное число h=p+q. Теперь расположим все положительные рациональные числа в порядке возрастания высоты, а числа с одинаковой высотой расположим в порядке возрастания этих чисел. Получим
последовательность
1 1 2 1 3 1 2 3 4 1 5 , , , , , , , , , , ,... , 1 2 1 3 1 4 3 2 1 5 1
в
которой
каждое
положительное рациональное число находится на определенном месте, которое легко найти для любого конкретного числа. 3.75. Теорема. Пространства R и Rn при n>1 (наделенные естественной метрикой)сепарабельны. Доказательство. Пусть х0-любая точка множества R. Любая окрестность U точки х0 содержит в качестве подмножества интервал (х0-ε, х0+ε) при некотором действительном ε>0. Но любой интервал (a, b) R содержит рациональные числа (см. теорему 2.109 и замечание 2.115 об усиленной плотности множества R). Следовательно, любая окрестность точки х0 содержит точки из Q, т.е. любая точка множества R принадлежит множеству
Q . Значит, R= Q , т.е. Q
370 представляет собой счетное всюду плотное подмножество пространства R. Это и доказывает сепарабельность пространства R. Пусть теперь x0 ( x0 , x0 ,..., x0 ) –любая точка множества Rn. Любая окрестность U точки х0 содержит в качестве подмножества открытый параллелепипед 1
2
n
Jε= ( x0 , x0 ) õ( x0 , x0 ) õ...õ( x0 , x0 ) при некотором действительном ε>0 (см. 3.37). Выберем рациональные числа r1, r2, …, rn так, чтобы 1
1
2
2
n
n
r1 ( x0 , x0 ), r2 ( x0 , x0 ),..., rn ( x0 , x0 ). Ясно, что точка r=(r1, r2, …, rn)єJεU, а также rєQn. Итак, любая окрестность любой точки пространства Rn имеет непустое 1
1
2
2
n
n
n
пересечение с множеством Qn, а это означает, что Q =Rn. Но QnRn и Qn–счетно (теорема 1.114). Следовательно, метрическое пространство Rn содержит счетное всюду плотное подмножество, т.е. Rn–сепарабельно. 3.76. Определение. Семейство {Gα} открытых подмножеств топологического пространства Х называется базой пространства, если для каждого хєХ и каждого открытого множества G, содержащего х (хєG), найдется такое α, что хєGαG. Другими словами, семейство {Gα} должно содержать «сколь угодно малые» открытые окрестности любой точки пространства. 3.77 Теорема. Всякое сепарабельное метрическое пространство Х имеет счетную базу. Доказательство. Пусть Е-счетное всюду плотное подмножество пространства Х, т.е. Å =Х. Обозначим через А декартово произведение Q+хЕ, где Q+–множество всех положительных рациональных чисел. Так как Q+–счетно (как бесконечное подмножество счетного множества Q), то и множество А-счетно (теорема 1.110). Для любого αєА, т.е. для любой пары α=(r,х), где rєQ+, хєЕ, положим Gα=Nr(x)={уєХ: d(у,х)0, что Nε(у)G. Так как ує Å =Х, то в любой окрестности точки у найдется точка из Е. Пусть хєЕ
∩ N (y). Тогда 2
d(х,у)<
. Взяв любое рациональное число r, 2
удовлетворяющее неравенствам d(x,y)
, будем 2
иметь: уєNr(x)Nε(у)G. В самом деле, если zєNr(x), т.е. d(z,x)
N rx (x)
содержит не более одной точки множества А. Семейство { N rx (x) }, где х «пробегает» множество К (хєК), есть открытое покрытие компактного множества К. Следовательно, найдется конечное число точек x1, x2, …, xn множества К, таких, что АК N r1 ( x1 ) ... N rn ( xn ) , где ri= rxi ,
i=1,2,
…,n.
Но
это
абсурдно,
N r1 ( x1 ) ... N rn ( xn ) содержит противоречие доказывает теорему.
ибо
множество
А
бесконечно,
а
множество
не более конечного числа точек из А. Полученное
371 3.79. Следствие (теорема Вейерштрасса). Всякое ограниченное бесконечное множество в пространстве Rn (n≥1, R1=R) имеет предельную точку. Доказательство. Всякое ограниченное бесконечное множество АRn содержится в некотором замкнутом параллелепипеде J= [a1 , b1 ]õ...õ[an , bn ] , который является компактным множеством в Rn (см. 3.42). По теореме 3.78 множество А имеет предельную точку, принадлежащую J. 3.80. Теорема. Пусть А-бесконечное множество в метрическом пространстве Х. Если каждое бесконечное подмножество множества А имеет в Х предельную точку, то при любом действительном ε>0 в множестве А найдется конечное число точек, ε-окрестности которых покрывают множество А (эти ε-окрестности часто называют конечной ε-сетью, покрывающей множество А). Доказательство. Допустим противное. Тогда при некотором ε>0 множество А нельзя покрыть конечным числом ε-окрестностей точек из А. Выберем произвольную точку х 1єА. Так как множество Nε(х1) не покрывает А, то множество А\Nε(х1) непусто. Выбрав в этом множестве точку х2, будем иметь: d(x1,x2)≥ε. Так как множество Nε(х1)Nε(х2) не покрывает А, то множество А\(Nε(х1)Nε(х2)) непусто. Выбрав в этом множестве точку х3, будем иметь: d(x1,x3)≥ε и d(x2,x3)≥ε. Если точки х1, х2, х3, …, хк уже определены и удовлетворяют условиям d(xi, xj)≥ε при ij (1i, jк), то хк+1 определяется произвольным выбором точки из непустого множества ê
А\
N ( x ) . При этом будут выполняться неравенства d(x , x )≥ε если ij и 1i,jк+1. i
i
i 1
j
Таким образом, можно считать индуктивно определенной последовательность (х n) различных точек множества А, для любых двух членов которой выполняется неравенство d(xi, xj)≥ε при ij. Согласно условию теоремы, множество {хєА: х=хn при некотором nєN} должно иметь в Х предельную точку. Пусть х-предельная точка этого множества. Рассмотрим окрестность
N (x).
В
этой
окрестности
должно
содержаться
бесконечное
множество
точек
2
последовательности (xn). Но это абсурдно, так как если xiє N (x) и xjє N (x) при ij, то d(xi, 2
2
xj)d(xi,x)+d(x, xj)<ε, тогда как ранее мы установили, что d(xi, xj)≥ε. Полученное противоречие доказывает теорему. 3.81. Следствие. Пусть Х-метрическое пространство. Если каждое бесконечное подмножество бесконечного множества АХ имеет (в Х) предельную точку, то А содержит счетное плотное в А подмножество. В частности, если каждое бесконечное множество в (бесконечном) метрическом пространстве Х имеет предельную точку, то метрическое пространство Х-сепарабельно. Доказательство. Согласно доказанному в 3.80, для любого nєN в множестве А найдется n
n
n
конечное число кn попарно различных точек, которые обозначим x1 , x2 ,..., xkn таких, что n
открытые шары N 1 ( xi ) (i=1,2,…,kn) покрывают множество А. Обозначим множество точек n
x , x ,..., x через Bn и положим В= Bn . На основании ранее доказанного (см. 1.109) можем n 1
n 2
n kn
n 1
утверждать, что множество В либо конечно, либо счетно. Допустим, что В-конечно и состоит из р точек у1, у2, …, ур (yiyj при ij). Так как при любом nєN ВnВ, то при любом nєN открытые шары
N 1 ( y1 ), N 1 ( y2 ),..., N 1 ( y p ) покрывают множество А: n
n
n
А N 1 ( y1 ) N 1 ( y2 ) ... N 1 ( y p ) . Рассмотрим любую точку у множества А, n
n
n
отличную от точек у1, у2, …, ур (такие точки уєА существуют, ибо А-бесконечно). Пусть εнаименьшее из чисел d(у,у1), d(у,у2),…, d(у,уp), т.е. 0<εd(y,yi) при любом i, удовлетворяющем
372 неравенствам 1iр. Взяв натуральное число n> таком, что 1iр. Следовательно, d(y,yi)<
1 , будем иметь: ує N 1 ( ói ) при некотором i n
1 <ε. Так как это противоречит определению числа ε, то n
наше допущение о конечности множества В неверно, т.е. В-счетное множество. Убедимся, что множество В плотно в А, т.е. А Â . Пусть у-любая точка множества А и U–любая окрестность точки у. Найдется такое действительное число r>0, что Nr(y)U. Выбрав натуральное число n> n будем иметь: ує N 1 ( xi ) при некотором i (1ikn), т.е. d ( y, xi ) n
n
Но
1 , r
1 r . Поэтому xin Nr(y)U. n
x ВnВ. Таким образом, U∩В-непусто, отсюда следует, что ує Â . Поскольку у-любая точка n i
множества А, то А Â , ч.т.д. 3.82 Теорема. Пусть Х-метрическое пространство. Если множество АХ содержит счетное плотное в А подмножество В (ВА Â ), то из любого открытого покрытия множества А можно выделить не более, чем счетное подпокрытие. Доказательство. Пусть О-любое открытое покрытие множества А (ОД,
G А).
GO
Обозначив через Q+ счетное множество всех положительных рациональных чисел, поставим в соответствие каждой паре (r,x)єQ+xB открытый шар Nr(x). Семейство {Nr(x)}–счетно и все его множества Nr(x) можно расположить в последовательность U1,U2,…,Un,… Аналогично тому, как это сделано в 3.77, легко доказать (это предоставляется читателю), что для любого уєА найдутся множество Nr(x) (rєQ+,хєВ) и множество GєO, такие, что уєNr(x)G. Поэтому, все те множества семейства {Nr(x)} ((r,x)єQ+,хВ), каждое из которых является подмножеством хотя бы одного множества из покрытия О, образуют покрытие множества А и могут быть расположены в последовательность, являющуюся подпоследовательностью последовательности (Un). Опишем процесс построения этой подпоследовательности. Обозначим через к1 наименьшее из всех тех натуральных чисел к, для которых Uk является подмножеством хотя бы одного множества из покрытия О (если U1 является подмножеством хотя бы одного множества из О, то к1=1). Далее, обозначим через к2 наименьшее из всех тех натуральных чисел к>к1, для которых UkG хотя бы для одного G из О. Такие числа к>к1 существуют, что видно из следующего. Пусть
U k1 N r1 ( x1 )
при некоторых r1єQ+ и х1єВ. Так как
U k1 G для некоторого
GєО, то при любом rєQ+ таком, что rк1. Определенные нами числа к1 и к2 обладают следующими свойствами: 1) к1<к2 ; 2) каждое из множеств
U k1 , U k2 является
подмножеством хотя бы одного множества из О; 3) если jєN, j
отлично от чисел к1 и к2 и 1jк2, то Uj не является подмножеством какого-либо множества из О. Пусть натуральные числа к1, к2, .., кm уже определены и обладают свойствами: 1) к1<к2< ..< <кm ; 2) каждое из множеств
U k1 , U k2 ,..., U km является подмножеством хотя бы одного множества из О;
3) если jєN, j отлично от чисел к1, к2, .., кm и 1jкm, то Uj не является подмножеством какого-либо множества из О. Тогда натуральное число кm+1 определяется как наименьшее из всех тех натуральных чисел к>кm, для которых UkG хотя бы для одного G из О. Из предыдущего изложения ясно, что такие числа к>кm существуют. Кроме того, числа к1, к2, .., кm, кm+1 обладают теми же свойствами 1), 2), 3) (с естественной поправкой на наличие еще одного числа кm+1). Таким образом, можно считать индуктивно определенной последовательность (кn) натуральных чисел, обладающую следующими свойствами: 1) к1<к2<...<кm<…; 2) каждое из множеств
U ki
(где i–любое натуральное число) является подмножеством хотя бы одного
373 множества из О; 3) если jєN и j отлично от чисел последовательности (кn), то Uj не является подмножеством какого-либо множества из О. Другими словами: последовательность ( U kn ) является подпоследовательностью последовательности (Un) и состоит из всех тех и только тех множеств Nr(x) (rєQ+,хєВ), каждое из которых является подмножеством хотя бы одного множества из О. Согласно доказанному выше, A
U n 1
kn
.
Теперь для любого nєN обозначим через On подкласс класса О, состоящий из всех тех множеств класса О, которые содержат U kn в качестве подмножества. Классы O1, O2, …, On,…непусты (заметим, что об этих классах нельзя сказать, что они являются попарно не пересекающимися). Согласно аксиоме выбора (см. 1.115), существует функция выбора φ:N→О такая, что для любого nєN φ(n)єOn. Обозначив Gn=φ(n), будем иметь последовательность (Gn) окрытых множеств класа О, такую, что при любом nєN GnєOn и потому Gn U kn . Следовательно, A
G
n
.
n 1
Множества Gn не обязательно попарно различны. Возможны два случая. а) Существует натуральное число к такое, что A
ê
G
n
.
n 1
b) При любом натуральном к A
ê
G
n
.
n 1
В случае а) покрытие О множества А содержит конечное подпокрытие, состоящее из некоторых множеств Gi. В случае b) покрытие О множества А не содержит конечного подпокрытия, состоящего из некоторых множеств Gi. В этом случае из последовательности {Gn} можно выделить подпоследовательность ( Gmn ), состоящую из попарно различных множеств покрытия О, образующих счетное подпокрытие множества А. Опишем процес построения этой последовательности. Полагая m1=1 (т.е. Gm1 =G1), определим m2 как наименьшее из всех тех натуральных чисел m>m1, для которых Gm Gm1 (предлагаем читателю убедиться, что указанные числа m существуют). Натуральные числа m1 и m2 обладают следующими свойствами: 1) m1<m2; m2
G
2) Gm2 Gm1 ; 3)
n
n 1
Gm1 Gm2 . Справедливость свойства 3) следует из того, что если
1
Gmi Gm j при ij (1i, ik); 3)
m1<m2< …<mk; 2)
mk
G
n
n 1
Gm1 Gm2 ... Gmk .
Тогда натуральное число mk+1 определяется как наименьшее из всех тех натуральных чисел m>mk, для которых Gm отлично от каждого из множеств Gm1 , Gm2 ,..., Gmk . При этом для чисел m1, m2, …, mk+1 очевидно, выполняются свойства 1) и 2) (с заменой числа к на к+1). Выполняется и mk 1
свойство 3):
G
n
n 1
Gm1 Gm2 ... Gmk 1 . mk 1
В самом деле,
G
n
n 1
mk
( Gn ) ( n 1
mk 1
G ) (G n
n mk 1
m1
Gm2 ... Gmk ) Gmk 1 , ибо при
mk
374 считать индуктивно определенной последовательность (mn) натуральных чисел, обладающую следующими свойствами: 1) m1<m2< mk
G
n
n 1
…<mk<…;
2)
Gmi Gm j при
3)
ij;
при
любом
натуральном
к
Gm1 Gm2 ... Gmk . Легко видеть также, что выполняется равенство
G G i
i 1
mk
k 1
. Достаточно проверить включение
G G i
i 1
k 1
mk
. Пусть x Gi . i 1
Тогда хєGn при некотором натуральном n. Найдем натуральное число к такое, что mk>n (так
mk
будет при любом к>n). Будем иметь: x Gi Gm1 Gm2 ... Gmk Gmk , что i 1
и доказывает включение
G G i
i 1
mk
k 1
k 1
n 1
k 1
. Так как А Gn Gmk , то множества
Gmk , к=1,2,…,n,…, принадлежащие покрытию О множества А, образуют счетное подпокрытие этого множества, ч.т.д. 3.83. Замечание. Всякое конечное множество, очевидно, компактно (в любом топологическом пространстве). В следующей теореме сформулирован критерий компактности бесконечного множества в метрическом пространстве. 3.84 Теорема. Бесконечное множество А в метрическом пространстве Х компактно тогда и только тогда, когда каждое его бесконечное подмножество имеет предельную точку, принадлежащую А. Доказательство. Если множество А компактно, то всякое его бесконечное подмножество имеет (согласно 3.78) предельную точку, принадлежащую А. Обратно, пусть каждое бесконечное подмножество множества А имеет предельную точку, принадлежащую А. Чтобы доказать, что А компактно, допустим противное. Тогда найдется такое открытое покрытие О множества А, которое не содержит конечного подпокрытия этого множества. Однако, как следует из 3.81 и 3.82, О содержит счетное подпокрытие множества А, т.е. существует последовательность (Gn) попарно различных
открытых множеств из О, такая, что А
G . Так как покрытие О не содержит конечного n
n 1
подпокрытия множества А, то при любом nєN множество G1G2…Gn не покрывает n
множество А, т.е. при любом nєN множество Х\
G
i
содержит точки из А (даже бесконечное
i 1
множество точек из А, ибо в противном случае О содержало бы конечное подпокрытие множества А). Не ограничивая общности рассуждений, можем считать, что покрытие множества А множествами Gi (i=1,2,3,.., n,…) не содержит «лишних» элементов, т.е. при любом nєN n
множество Gn+1 покрывает некоторые точки множества А, не покрытые множеством
G
i
.
i 1
n
Другими
Gn+1∩А ( Gi ) À.
словами,
Для
любого
nєN
положим
i 1
n
Fn=Х\(
G
i
i 1
n
G ) . ñ
)= (
i
i 1
Будем иметь: F1F2…Fn…, причем все множества Fi-замкнуты.
375 c
n c Так как Fn Fn ( Gi ) Gn A, то множество n 1 n 1 i 1 n 1 n1
F
n
не содержит
n 1
точек множества А. Рассмотрим множества F1\F2, F2\F3,…, Fn\Fn+1,… Легко видеть, что эти множества попарно не пересекаются. В самом деле, пусть, например, m
любую точку у множества Gn+1∩А, не принадлежащую множеству ( n
n 1
i 1
i 1
G
i
)∩А. Так как
i 1
у Gi , то уєFn, а так как ує Gi , то у Fn+1. Следовательно, уєFn\ Fn+1. Итак, при любом nєN множество Фn=(Fn\ Fn+1)∩А. Применяя аксиому выбора к последовательности множеств (Фn), можем утверждать существование последовательности ( a n ) попарно различных точек множества А, таких, что при любом nєN a n єFn. Множество
A
значений последовательности
a n есть бесконечное подмножество множества А. Следовательно, множество A имеет предельную точку a єА. Так как F1F2…Fn…и при любом nєN a n єFn, то каждое из множеств F1, F2,…,Fn,…
содержит все точки множества A , кроме конечного их числа. Поэтому точка a будет предельной для всех множеств последовательности (Fn). А так как все эти множества
замкнуты, то
a єFn для любого nєN. Выходит, что
F
n
э a єА, тогда как ранее мы
n 1
установиили, что множество
F
n
не содержит точек множества А. Полученное противоречие
n 1
доказывает, что на самом деле множество А компактно, ч.т.д. 3.85 Замечание. Так как метрическое пространство-отделимо, то любое компактное подмножество метрического пространства-замкнуто (3.27). Кроме того, компактные подмножества метрических пространств-ограничены, что доказывается также, как в 3.31 (только вместо интервалов (-n, n), рассматриваются открытые шары Nк(x0), где х0-любая точка метрического пространства, а к принимает всевозможные натуральные значения). Как следует из 3.30 и 3.43, всякое замкнутое и ограниченное множество в Rn (в частности, в R)-компактно. Для произвольных метрических пространств из замкнутости и ограниченности множества не следует его компактность (пример будет приведен позднее). 3.86 Определение. Пусть Х-метрическое пространство. Множество РХ называется совершенным, если Р замкнуто и не содержит изолированных точек (т.е. каждая точка множества Р является предельной для Р). 3.87 Теорема. Всякое непустое совершенное множество РRn несчетно. Доказательство. Множество Р, как имеющее предельные точки, является бесконечным множеством. Допустим, что Р-счетно и расположим все его точки в последовательность х1, х2,…, хк,..Определим теперь последовательность (Vm) открытых шаров пространства Rn следующим образом. Пусть r1–произвольное положительное действительное число, например, r1=1. Положим V1= N r1 (x1)={хєRn: ||x-x1||
xm2 ( xò 1 x1 ) и пусть
|| xm2
x1 ||=r
376
r r1 r , ) и положим V2= N r ( xm ). Убедимся, что x1 V2 V1. В 2 2 r самом деле, если х1є V2 , то || x1 xm2 ||r2 , что противоречит определению числа r. Значит, 2 х1 V2 . Далее, если хє V2 , то || x xm2 ||r2 и потому (0
2
2
r1 r r r r 1 r1 , 2 2 т.е. хєV1. Значит, действительно, V2 V1. Итак, x1 V2 V1. Так как xm2 –предельная
|| x x1 |||| ( x xm2 ) ( xm2 x1 ) || || x xm2 || || xm2 x1 || r2+r
точка множества Р, то V2 содержит бесконечное множество точек из Р. Среди точек х3, х4,…, хк,… найдем первую, принадлежащую V2. Пусть это будет точка
xm3
(так что
|| xm3 xm2 || r2 ) и пусть || xm3 x2 || r (r′>0, ибо последовательность (xn) состоит из r r2 || xm3 xm2 || попарно различных точек). Найдем r3= =min( , ) и положим 2 2 r V3= N r3 ( xm3 ). Убедимся, что x2 V3 V2. В самом деле, если х2є V3 , то || x2 xm3 ||r3 , 2 r откуда 0
r2 || xm3 xm2 || 2
|| xm3 xm2 ||
r2 || xm3 xm2 || 2
V3 V2. Итак, x2 V3 V2.
Вообще, если открытые шары V1, V2,…,Vn (n≥3) уже определены, так что Vi= N ri ( xmi ) (где xmi -точки множества Р) и х1 V2 V1,
то открытый шар Vn+1
x2 V3 V2, …………. xn-1 Vn Vn-1, определяется следующим образом. Среди точек xn+1, xn+2,…, xk,…
находим первую, принадлежащую Vn. Пусть это будет точка
xmn 1 , так что || xmn1 xmn ||
r * rn || xmn 1 xmn || , пусть || xmn 1 xn || =r* (r*>0). Находим rn+1=min( ) и полагаем 2 2 Vn+1= N rn 1 ( xmn 1 ). Как и выше, легко проверить, что xn Vn 1 Vn. Таким образом, можно считать индуктивно определенной последовательность (Vm) открытых шаров пространства, такую, что при любом mєN шар Vm содержит бесконечное множество точек из Р и xm Vm1 Vm. Положим Кm= Vm P (m=1, 2, 3, …). Ясно,что К1К2…Кm… и все множества Кmкомпактны (как ограниченные и замкнутые множества в Rn), причем каждое из них содержит бесконечное множество точек из Р (и не содержит никаких других точек). Согласно 3.28,
377
множество
K m 1
m
непусто. При этом
K m 1
m
Р, ибо при любом mєN KmР. С другой
стороны, ни одна точка множества Р не может принадлежать множеству
K m 1
m
, так как при
любом mєN xm Km+1. Полученное противоречие доказывает, что допущение о счетности множества Р-неверно, ч.т.д. Следствие. Каждый отрезок [a, b] R представляет собой несчетное множество. Множество всех действительных чисел-несчетно. 3.88 Замечание. Заметим, что любые два отрезка [a, b] и [c, d ] в множестве R всех действительных чисел-равномощны. Это видно из того, что функция f: f(x)=
d c bc ad x ba ba
осуществляет биективное отображение отрезка [a, b] на отрезок [c, d ] . Эта же функция осуществляет биективное отображение интервала (a, b) на интервал (c, d ) . Следовательно, и любые два интервала в R–равномощны. Далее, функция φ: φ(x)=tgx осуществляет биективное отображение интервала (
, ) на множество R всех действительных чисел (строгое 2 2 доказательство этого будет приведено позднее). Следовательно, любой интервал (a, b) R и все множество R–равномощны. Наконец, так как [a, b] ~ [a, b] R, а R~ (a, b) [a, b] , то (см. 1.117) [a, b] ~R. 3.89. Пример совершенного нигде не плотного множества в пространстве R (Канторово множество). Пусть Е=[0,1]. Построим две последовательности (Gn) и (Fn) подмножеств
1 2 1 2 3 3 3 3 3k 1 3k 2 , ) , где кєZ, являющийся подмножеством G1–единственный интервал вида ( 3 3 множества Е следующим образом. Положим G1= ( , ) , F1=E\G1= [0, ] [ ,1]. Заметим, что
множества Е (при к=0). Определяя множество F1, мы «удаляем» из отрезка Е=[0,1] его среднюю треть, т.е.
1 2 1 2 3 3 3 3 1 1 1 2 2 3 2 6 7 7 8 8 9 виде: [0, ] [0, ] ( , ) [ , ], [ ,1] [ , ] ( , ) [ , ], после чего положим 3 9 9 9 9 9 3 9 9 9 9 9 9 2 1 2 3 6 7 8 9 1 2 7 8 G2= ( , ) ( , ), F2=F1\G2= [0, ] [ , ] [ , ] [ , ] E \ ( Gi ). Заметим, что 9 9 9 9 9 9 9 9 9 9 9 i 1 1 2 7 8 интервалы ( , ) è ( , ), составляющие множество G2, являются единственной парой 9 9 9 9 3k 1 3k 2 ) , где кєZ, являющихся подмножеством множества F1. В интервалов вида ( 2 , 3 32 1 2 7 8 самом деле, при к=0 получаем интервал ( , ) ; при к=2 получаем интервал ( , ) ; при 9 9 9 9 интервал G1= ( , ) . Для определения множеств G2 и F2 представим отрезки [0, ] è [ ,1] в
остальных значениях кєZ получаем интервалы, не имеющие общих точек с F1. В чем причина того, что интервалы, составляющие множество G2, имеют вид
3k 1 3k 2 , 2 ) ? Дело в том, что каждый из отрезков, составляющих множество F1, может 32 3 3k 3k 3 ] и потому средняя его треть представляет собой интервал быть записан в виде [ 2 , 3 32 (
378
3k 1 3k 2 3k 3k 3 , 2 ) . После «удаления» этого интервала из отрезка [ 2 , 2 ] получаются 2 3 3 3 3 3k 3k 1 3k 2 3k 3 ] и [ 2 , 2 ] , каждый из которых может быть записан в виде два отрезка [ 2 , 2 3 3 3 3 3m 3m 3 [ 3 , ] , mєZ. 3 33 (
Определяя последовательно (аналогично вышеизложенному) множества G3, F3, а затеммножества G4, F4 и т.д., мы построим две последовательности (Gn) и (Fn) подмножеств множества Е=[0,1], обладающих следующими свойствами. 1) Каждое из множеств Gn представляет собой объединение 2n-1 попарно
1 , так что сумма длин этих 3n 2 n 1 интервалов, которую обозначим μ(Gn), равна (под длиной интервала 3n (a, b) R, а также отрезка [a, b] , понимается положительное число b a ); непересекающихся интервалов длиной
при этом множества последовательности (Gn) попарно не пересекаются и каждый из интервалов, составляющих множество Gn, может быть представлен в виде ( Множества
2)
3k 1 3k 2 , n ) при нектором кєZ. 3n 3
последовательности
непусты,
(Fn)
компактны
и
F1F2…Fn…, так что множество Р=
F
n
n 1
-непустое и замкнутое (даже
n
компаткное). При любом nєN Fn=E\(
G
i
i 1
) и множество Fn представляет
собой объединение 2n попарно непересекающихся отрезков, длина каждого из которых равна
1 . 3n
Убедимся, что множество Р=
F
n
n 1
является совершенным множеством.
Достаточно показать, что каждая точка х 0єР является предельной для Р. Пусть (х0-ε, х0+ε)-любая ε-окрестность точки х0єР (εєR, ε>0). Выберем натуральное число n, удовлетворяющее условию n> длины
1 . Учитывая, что х0єFn, обозначим через Jn тот отрезок 3
1 , которому принадлежит точка х0: х0єJnFn. Если х0 совпадает с одним из 3n
концов отрезка Jn, то обозначим через xn тот конец отрезка Jn, который не совпадает с х0: хnх0. Если же х0 не совпадает ни с одним из концов отрезка Jn, то обозначим через xn левый конец указанного отрезка: хn<х0. В любом случае хnх0 и |хn-х0| откуда
1 1 , n 3n 3
1 1 x n x0 , –ε<хn-х0<ε и xnє(х0-ε, х0+ε). 3n 3n
Так как xnєFn, то xn принадлежит и множествам F1, F2,…,Fn-1. Но так как xn является концом одного из отрезков, образующих множество Fn, то xn принадлежит и всем множествам Fn+1, Fn+2,…,Fn+m,… (что видно из способа образования множеств Fn+1, Fn+2,…). Следовательно, xn принадлежит всем множествам Fi, т.е. xnєР. Итак, любая окрестность точки х0 содержит точку множества Р, отличную от х 0. А это и означает,
379 что точка х0 является предельной для Р. Множество Р называется множеством Кантора. Согласно доказанному, Р-совершенное множество, а потому-несчетное (3.87). Докажем еще, что Р-нигде не плотное множество, т.е. (так как Р-замкнуто) что Р не содержит никакого интервала. Допустим, что существует интервал (α, β)Р. Тогда при любом nєN (α, β)Fn. Выберем натуральное число n, удовлетворяющее условию n> 2n
Fn=
J
k
k 1
, где Jk–попарно непересекающиеся отрезки длиной
1 . 3( )
Пусть
1 , занумерованные в 3n
порядке возрастания их левых концов (левый конец отрезка J1 есть точка 0, правый конец отрезка J 2n есть точка 1; если при некотором кєN 1к<2n Jk= [a, b] , Jk+1= [c, d ] , то n
b ñ и (b, ñ) Gi ). Легко видеть (подробное доказательство этого предоставляется i 1
читателю), что интервал (α, β) целиком содержится в одном и только в одном отрезке Jk: (α, β)Jk= [a, b] , т.е. a b , откуда β-α b a
1 1 < β-α. n 3n 3
Полученное противоречие доказывает, что Канторово множество Р не содержит
никакого
интервала.
Е\Р=Е\(
Заметим
еще,
n
n 1
i 1
что
Р=Е\(
n
n
n1
n 1
n
).
В
самом
деле
как
РЕ)
F )= ( E \ F ) ( G ) G , n 1
G
i
n
n1
,
откуда
(так
Р=Е\(
G n 1
n
).
3.90 Определение. Множество А в метрическом пространстве Х называется связным, если не существует двух открытых множеств U и V пространства Х, таких, что U∩V=, но А1=А∩U, А2=А∩V и А=А1А2. В частности, метрическое пространство Х связно, если оно не является объединением двух непустых непересекающихся открытых множеств. Из определения 3.90 также следует, что всякое одноточечное множество в метрическом пространстве связно. 3.91 Теорема. Множество А в метрическом пространстве Х связно тогда и только тогда, когда А, рассматриваемое как самостоятельное метрическое пространство,связно, т.е. когда А не является объединением двух непустых непересекающихся открытых относительно А множеств. Доказательство. Пусть множество А в метрическом пространстве Х связно в смысле определения 3.90 и требуется доказать, что А не является объединением двух непустых непересекающихся открытых относительно А множеств. Допустим противное, т.е. что существуют два непустых непересекающихся множества G1А и G2А, таких, что G1G2=А и множества G1 и G2 открыты относительно А. Для каждой точки хєG1 найдется такое число δх>0, что из zєА и d(z,x)<δх следует, что zєG1. Аналогично, для каждой точки уєG2 найдется такое число ry>0, что из zєА и d(z,y)
и d(x,y)≥ry, так что d(x,y)≥
1 (δх+ry). Для каждого хєG1 2
рассмотрим следующий открытый шар в пространстве Х: Ux={zєX: d(z,x)<
1 δх} 2
380 Аналогично, для каждого уєG2 рассмотрим открытый шар Vy=
={zєX:
1 d(z,x)< ry} в пространстве Х. Каковы бы ни были хєG1 и уєG2 шары Ux и Vy не 2 1 1 d(x,y)d(x,z)+d(z,y)< õ + ry , где z2 2 предполагаемая общая точка шаров Ux и Vy. Так как полученное неравенство противоречит ранее установленному, то на самом деле шары Ux и Vy не имеют общих пересекаются, ибо в противном случае
точек. Обозначим U=
U
õG1
x
, V=
V
y
. Ясно, что U и V-непересекающиеся открытые
yG2
множества пространства Х, причем UG1, VG2 (ибо для любого хєG1, хєUx и для любого уєG2 уєVy). Далее, U∩А=U∩(G1G2)=(U∩G1)(U∩G2)=U∩G1=G1 и аналогично V∩А=G2, причем (U∩A)(V∩А)=G1G2=А. Существование множеств U и V с указанными свойствами противоречит связности множества А. Следовательно, наше допущение неверно и на самом деле множество А не является объединением двух непустых непересекающихся открытых относительно А множеств. Обратно, пусть А не является объединением двух непустых непересекающихся открытых относительно А множеств. Установим, что множество А связно в метрическом пространстве Х. Допустим противное. Тогда существуют непересекающиеся открытые множества U и V пространства Х, такие, что А1=А∩U, А2=А∩U и А1А2=А. Так как множества А∩U и А∩V открыты относительно А, то А оказывается объединением двух непустых непересекающихся открытых относительно А множеств, что противоречит предположению о множестве А. Полученное противоречие доказывает, что наше допущение о несвязности множества А-неверно, ч.т.д. 3.92. Замечание.Теорема 3.91 показывает, что связность множества в метрическом пространстве-это внутреннее свойство множества, не зависящее от объемлющего пространства. 3.93. Теорема. Множество А в метрическом пространстве Х, состоящее более чем из одной точки, связно тогда и только тогда, когда при любом разбиении его на два непустых непересекающихся подмножества А1 и А2 (А1А2=А, А1∩А2=), по крайней мере одно из них содержит предельную точку для другого. Доказательство. Пусть А связно и разбито произвольным образом на два непустых непересекающихся подмножества А1 и А2. Согласно 3.91, хотя бы одно из множеств А1, А2 не является открытым относительно А. Пусть, для определенности, это будет множество А1. Тогда существует точка х0єА1 такая, что при любом ε>0 хєА: d(х,х0)<εА1. Следовательно, при любом ε>0 найдется точка хεєА2, для которой d(хε, х0)<ε. Но это и означает, что точка х0єА1 является предельной точкой множества А2. Обратно, пусть при любом разбиении множества А на два непустых непересекающихся подмножества по крайней мере одно из них содержит предельную точку для другого. Убедимся, что при этом условии множество А связно. Допуская противное, найдем два открытых множества U и V пространства Х, для которых U∩V=, А1=А∩U, А2=А∩V и А=А1А2. Пусть х0-любая точка множества А1. Так как А1 открыто относительно А, то найдется такое число ε0>0, что хєА: d(х,х0)<ε0 А1. Но это означает, что точка х0 не является предельной точкой множества А2. Аналогично доказывается, что никакая точка множества А2 не является предельной точкой множества А1. Так как это противоречит условию, наложенному на множество А, то допущение о несвязности множества А-неверно, ч.т.д. 3.94. Теорема. Множество АR связно тогда и только тогда (А предпологается состоящим более чем из одной точки), когда оно вместе с любыми двумя свомими различными точками содержит и весь отрезок с концами в этих точках. Доказательство. Пусть А связно, но существуют две различные точки х0 и у0, принадлежащие А, и такие, что не весь отрезок с концами в точках х 0 и у0 содержится в А. Предполагая, для определенности, что х0<у0, найдем точку z0, такую, что x0z0. Ясно,
381 что U и V-непересекающиеся открытые множества в R, такие, что А1=U∩А, А2=V∩А (х0єА1, у0єА2) и А=А1А2. Существование множеств U и V с указанными свойствами противоречит предположенной связности множества А. Полученное противоречие доказывает, что если множество АR связно, то оно вместе с любыми двумя своими различными точками содержит и весь отрезок с концами в этих точках. Обратно, пусть АR и множество А вместе с любыми двумя своими различными точками содержит и весь отрезок с концами в этих точках. Убедимся, что при этом условии множество А связно. Допуская противное, найдем непересекающиеся открытые в R множества U и V, такие, что А1=U∩А, А2=V∩А и А=А1А2. Выберем точку х0єА1 и точку у0єА2. Пусть, для определенности, х0<у0 (х0 и у0-различные точки множества А). Согласно условию, наложенному на множество А, [х0,у0]А. Обозначим À1 =А1∩[х0,у0] и z=sup À1 . Так как х0єU, а у0єV, то, как легко видеть, zх0 и zу0, т.е. х00, что z+ε<у0, z-ε>х0 и (z-ε, z+ε)U∩A=А1, откуда (z-ε, z+ε) À1 , что противоречит определению числа z. Если zєА2, то zєV и существует такое δ>0, что z δ>х0, z+δ<у0 и (z-δ, z+δ)V∩А=А2, т.е. в промежутке (z-δ,z] нет точек множества À1 . Это также противоречит определению числа z. Полученное противоречие доказывает, что допущение о несвязности множества А-неверно, ч.т.д. 3.95 Следствие. Множество АR, состоящее более чем из одной точки, связно тогда и только тогда, когда А-конечный или бесконечный промежуток, т.е. когда Аодно из следующих множеств (где a и b действительные числа и a b ):
(, b), (, b], (a,),[a,), (, ) R, (a, b),[a, b), (a, b],[a, b].
3.96 Теорема. Пусть (Еα)-семейство связных подмножеств метрического пространства Х. Если все множества семейства имеют хотя бы одну общую точку (т.е.
Å ), то объединение Å
множеств семейства-связно.
Доказательство. Выберем точку х0є
Å
и обозначим Е=
Å . Разобьем Е по
произволу на два непустых непересекающихся подмножества Е1 и Е2 (Е1, Е2, Е1∩Е2=, Е1Е2=Е). Пусть, для определенности, х0єЕ1. Тогда при любом α Еα∩Е1. Если допустить, что при любом α Еα∩Е2=, то Еα=Еα∩Е=Еα∩(Е1Е2)=(Еα∩Е1)(Еα∩Е2)Е1, т.е. при любом α ЕαЕ1, откуда ЕЕ1, что абсурдно. Значит, при некотором значении α=α0 Å 0 ∩Е2 и равенство
Å 0 =( Å 0 ∩Е1)( Å 0 ∩Е2) показывает, что множество Å 0 разбито на два непустых непересекающихся подмножества
Å 0 ∩Е1 и Å 0 ∩Е2. Так как Å 0 –связно, то
(согласно 3.93) по крайней мере одно из множеств Å 0 ∩Е1, Å 0 ∩Е2 содержит предельную току для другого. Пусть, для определенности, хє Å 0 ∩Е1 и х является предельной точкой множества Е2∩ Å 0 . Но тогда хєЕ1 и х является предельной точкой для Е2, что и доказывает связность множества Е=
Å .
3.97. Следствие. Если подмножества А1, А2, ..., Аn (где nєN, n≥2) метрического пространства-связны и А1∩А2, А2∩А3,…, Аn-1∩Аn, то объединение А=А1А2…Аn-связно. 3.98 Определение. Пусть А-произвольное множество в метрическом пространстве Х и х-любая точка множества А. Компонентой связности множества А, соответствующей точке хєА, называется объединение всех связных подмножеств множества А, содержащих точку х. Другими словами, компонента связности-это максимальное связное подмножество множества А, содержащее точку х. Если само А
382 связно, то А является единственной своей компонентой связности, соответствующей любой точке хєА. Если компонента связности множества А, сответствующая точке х, представляет собой множество х, то это значит, что А не имеет связных подмножеств, содержащих точку х и состоящих более чем из одной точки. 3.99. Теорема. Две компоненты связности множества А в метрическом пространстве Х либо совпадают, либо не имеют общих точек. Доказательство. Пусть Ах и Ау-две компоненты связности множества А, соответствующие точкам х и у. Допустим, что АхАу. Установим, что Ах и Ау не имеют общих точек. В самом деле, если Ах и Ау имеют общую точку, то (3.97) множество АхАу связно, причем либо АхАхАу, либо АуАхАу. Но неравенство АхАхАу означает (с учетом связности множества АхАу), что Ах не является компонентой связности множества А, соответствующей точке х. Аналогичное можно сказать об Ау в случае АуАхАу. Полученное противоречие доказывает, что Ах и Ау не имеют общих точек, ч.т.д. 3.100 Замечание. Таким образом, каждое множество А в метрическом пространстве Х является объединением своих компонент связности, причем различные компоненты попарно не пересекаются. Это следует из 3.99 и из того, что каждой точке хєА соответствет компонента связности множества А, содержащая точку х. 3.101. Теорема. Всякое открытое множество GR либо совпадает с R, либо является пустым множеством, либо является объединением не более чем счетного множества попарно непересекающихся интервалов, среди которых могут быть и бесконечные (типа (, a) или (b,) ). Доказательство. Пусть GR и G. Согласено 3.100, множество G является объединением своих компонент связности, причем различные компоненты связности попарно не пересекаются. Компонента связности открытого множества G не может состоять из одной точки, ибо из хєG следует существование такого действительного числа ε>0, что хє(х-ε, х+ε)G, а интервал (х-ε, х+ε) является связным множеством (3.94). При этом мы учитываем, что компонента связности множества G, соответствующая точке х, является максимальным связным подмножеством множества G, содержащим точку х. Итак, любая компонента связности непустого открытого множества GR есть связное множество, состоящее более чем из одной точки. Следовательно, любая компонента связности множества G представляет собой один из промежутков, указанных в 3.95. Но так как G–открытое множество и GR, то каждая компонента связности множества G представляет собой либо бесконечный интервал (, a) , либо бесконечный интервал (b,) , либо конечный интервал (c,d), где a, b, c, d –некоторые действительные числа (c1, то при 1n
rn1 принадлежит одной и только одной компоненте
связности множества G, которую обозначим G1: rn1 єG1. Так как множество S не исчерпывается компонентой G1 и так как различные компоненты связности не пересекаются, то множество G содержит рациональные числа, не принадлежащие компоненте G1. Определим n2 как наименьшее из тех натуральных чисел m, для которых
383 rmєG, но rm G1. Рациональное число
rn2 принадлежит одной и только одной
компоненте связности множества G, которую обозначим G2:
rn2 єG2, rn2 G1. Ясно, что
n2>n1 и если n1n
rn1 єG1, rn2 єG2, …, rnê єGk; 3) если n1>1, то при 1n
4) при любом iєN таком, что 1
rnê 1 єG)
как единственная
rnê 1 . Убедимся, что nk+1>nk. В самом
деле, nk+1 не может совпадать ни с одним из чисел n1, n2,…, nk, ибо rnê 1 не принадлежит ни одному из множеств G1, G2, …, Gk. Неравенство nk+1nk и мы видим, что условия 1), 2), 3), 4) продолжают выполняться и при замене числа к на к+1. Таким образом, последовательности (nk) и (Gk) можно считать индуктивно определенными и удовлетворяющими условиям: 1) n1
rnê єGk ; 3) если n1>1, то при 1n1 (iєN) ni есть наименьшее
из тех натуральных чисел m, для которых rmєG, но rm не принадлежит ни одному из множеств G1, G2, …, Gi-1. Легко видеть, что компоненты связности множества G, принадлежащие
последовательности (Gk),–попарно различны (если, например, i
384
т.е. Х=U1U2. Но это противоречит связности метрического пространства Х. Полученное противоречие доказывает теорему. Следствие 1. Пусть Х и Y–два метрических пространства, АХ, А-связное множество и f:А→Y-непрерывно. Тогда множество В=f(А) связно в пространстве Y. Это утверждение следует из доказанной теоремы и из того, что связное множество может рассматриваться как самостоятельное связное метрическое пространство (3.91). Следствие 2. Если f: [a, b] →R есть непрерывная вещественная функция и f( a )f( b ), то для любого числа с, расположенного между f( a ) и f( b ), найдется такая точка хє (a, b) , что f(x)=с. Это утверждение вытекает из следствия 1 и теоремы 3.94. В частности, если числа f( a ) и f( b )–разных знаков (т.е. f( a )f( b )<0), то в интервале (a, b) обязательно найдется такая точка х0, что f(х0)=0. 3.103. Определение. Пусть Х и Y–метрические пространства с метриками d и ρ соответственно. Говорят, что отображение f:Х→Y равномерно непрерывно на Х, если для любого ε>0 существует такое δ>0, что каковы бы ни были точки х, х′ из Х, для которых d(х,х′)<δ-обязательно выполняется неравенство ρ(f(x), f(x′))<ε. 3.104. Теорема. Непрерывное отображение f компактного метрического пространства Х в метрическое пространствo Y–равномерно непрерывно. Доказательство. Зададимся произвольным ε>0. Поскольку f непрерывно в любой
точке из Х, то для каждого хєХ найдется такое δх>0, что f ( N õ ( x)) N ( f ( x)) . (*) 2
N ( f ( x)) =уєY: ρ(у,f(x))<ε/2. Рассмотрим
N õ (x) =х′єХ: d(х′,х)<δх;
Здесь
2
открытые шары N 1 ( x) для всех хєХ. Эти шары образуют открытое покрытие 2
x
множества Х. Так как Х-компактно, то в нем найдется конечное множество точек x1, x2, …, xn такое, что Х= N 1 2
x1
( x1 ) N 1 2
x2
( x2 ) ... N 1 ( xn ) . 2
(**)
xn
1 Обозначим δ= min ( x1 , x2 ,..., xn ) . 2 Ясно, что δ>0. Рассмотрим любые две точки х′ и х″ из Х, для которых d(х′, х″)<δ и убедимся, что ρ(f(х′), f(х″))<ε. В самом деле, из равенства (**) следует, что х′є N 1 2
( xm )
при
некотором
mєN,
для
которого
1mn.
Следовательно,
xm
d(х′,xm)<
1 x 2 m
и
Итак, x N x
m
котором
d(х″,xm)d(х″,х′)+d(х′,xm)<δ+
( xm )
вместо
х
и
1 x , 2 m
x N xm ( xm ). Поэтому,
следует
взять
xm),
будем
откуда
d(х″,xm)<
x . m
согласно включению (*) (в
иметь:
f(х′)є N ( f ( xm ))
и
2
f(х″)є N ( f ( xm )) , т.е. ρ(f(х′), f(xm))< 2
и ρ(f(х″), f(xm))< , Но тогда ρ(f(х′), 2 2
f(х″))ρ(f(х′), f(xm))+ρ(f(xm), f(х″))<ε, ч.т.д. 3.105. Замечание. Применительно к случаю, когда Х= [a, b] , Y=R, доказанная теорема утверждает следующее: если вещественная функция f, определенная на отрезке [a, b] R,-непрерывна, то она и равномерно непрерывна, т.е. для любого ε>0 найдется такое δ>0, что каковы бы ни были точки х′, х″ из [a, b] , для которых |х′-х″|<δ,обязательно выполняется неравенство |f(х′)-f(х″)|<ε.
385 3.106. Определение. Пусть Х-метрическое пространство с метрикой d и Алюбое непустое подмножество множества Х. Расстоянием от точки х до множества А (х-произвольная точка, принадлежащая Х) называется следующее неотрицательное действительное число, обозначаемое ρА(х): ρА(х)=infαєR: α=d(x,y), уєА. Для краткости часто пишут:
A ( x) inf d ( x, y) yA
.
3.107. Теорема. ρА(х) обращается в 0 тогда и только тогда, когда хє À . Доказательство. Если хє À , то при любом ε>0 открытый шар Nε(х) содержит хотя бы одну точку уєА. Для этой точки d(x,y)<ε, следовательно и ρА(х)<ε. Ввиду произвольности числа ε>0, заключаем, что ρА(х)=0. Обратно, пусть ρА(х)=0 и требуется доказать, что хє À . Допуская противное, найдем такое число ε0>0, что открытый шар
N 0 ( x) не содержит точек из А, т.е. для любого уєА d(x,y)≥ε0. Следовательно, ρА(х)≥ε0, что противоречит условию ρА(х)=0. Полученное противоречие доказывает, что хє À , ч.т.д. 3.108. Замечание. Фиксируя множество АХ, и рассматривая растояние до множества А от всевозможных точек хєХ, получим вещественную неотрицательную функцию ρА, определенную на Х. 3.109. Определение. Если f–вещественная функция, определенная на метрическом пространстве Х, то множество (может быть пустое) Z(f)=хєХ: f(x)=0 называется нуль-множеством функции f. 3.110 Замечание. Теорема 3.107 показывает, что Z(ρА)= À . 3.111 Теорема. Если Х-метрическое пространство и множество АХ-непусто, то вещественная функция ρА равномерно непрерывна на Х. Доказательство. Зафиксируем любые две точки х1 и х2 из Х. Для любого уєА имеем: ρА(х2)d(x2,y)d(x2,x1)+d(x1,y), откуда ρА(х2)-d(x2,x1)d(x1,y), при любом уєА. Следовательно, число ρА(х2)-d(x2,x1) есть одна из нижних границ множества αєR: α=d(x1,y),уєА. Так как ρА(х1)=infαєR: α=d(x1,y),уєА. есть наибольшая из нижих границ указанного множества, то ρА(х2)-d(x2,x1)ρА(х1), откуда ρА(х2)ρА(х1)d(x2,x1). Аналогично доказывается, что ρА(х1)-ρА(х2)d(x2,x1), т.е. |ρА(х2)ρА(х1)|d(x2,x1). Из полученного неравенства с очевидностью следует равномерная непрерывность функции ρА. 3.112. Теорема. Нуль-множество Z(f) любой непрерывной вещественной функции f, определенной на метрическом пространстве,-замкнуто. Доказательство. Расмотрим множество Х\Z(f)=хєХ: f(x)0. Путь х0-любая точка множества Х\Z(f). Для этой точки f(х0)0. Обозначим ε=|f(x0)| и используя непрерывность функции f в точке х0, найдем такое δ>0, что для любого хєNδ(x0) будет: f(x)є(f(x0)- , f(x0)+ ), т.е. |f(x)-f(x0)|< . Ясно, что для любого хєNδ(x0) f(x)0, ибо в 2 2 2
. Следовательно, множество Х\Z(f) каждую 2 свою точку х0 содержит вместе с некоторой δ-окрестностью этой точки, т.е. Х\Z(f) есть открытое множество, а Z(f)–замкнутое, ч.т.д. Замечание. Утверждение теоремы 3.112 является непосредственным следствием утверждения, сформулированного в замечании к теореме 3.19, так как одноточечное множество 0 замкнуто в R. 3.113. Теорема. Если К и F–непересекающиеся подмножества метрического пространства Х, причем К-компактно, а F–замкнуто, то существет такое число δ>0, что для любых хєК и уєF d(x,y)≥δ. Доказательство. Расмотрим вещественную неотрицательную функцию ρ F, определенную на Х. Согласно теореме 3.107, функция ρF обращается в 0 в точках противном случае окажется, что 0<ε<
386 множества F =F и только в точках этого множества. Поэтому в точкaх множества К, не пересекающегося с F, ρF не обращается в 0, т.е. ρF(х)>0 при всех хєК. По теореме 3.111 функция ρF непрерывна на Х (даже равномерно непрерывна). Следовательно, согласно 3.45, функция ρF ограничена на множестве К и существует такая точка х0єК, что ρF(x0)ρF(x) для любого хєК. Полагая ρF(x0)=δ, видим, что δ>0 и что для любых хєК и уєF d(x,y)≥ρF(x)≥δ, ч.т.д. 3.114. Определение. Топологическое пространство Х называется нормальным, если для любых двух непустых непересекающихся замкнутых множеств А и В (АХ, ВХ) найдутся открытые непересекающиеся множества U и V (UХ, VХ), покрывающие множества А и В соответственно: АU, ВV, UV=. 3.115 Теорема. Всякое метрическое пространство Х-нормально. Доказательство. Пусть А и В-любые непересекающиеся замкнутые множества в Х (непустые). Функция ρА:ХR обращается в нуль только в точках множества À =А (3.107). Поэтому в точках множества В она отлична от нуля и для любого уєВ число ry=ρА(у)>0. При этом для любого хєА и любого уєВ d(x,y)≥ry>0. rx =ρВ(х)>0 и что для Аналогично доказывается, что для любого хєА число ~ ~ любого хєА и любого уєВ d(x,y)≥ r >0. Введем в раcсмотрение открытые множества x
U=
N xA
~ rx 2
( x)
и V=
N yB
ry
( y ) , покрывающие множества А и В соответственно.
2
Чтобы убедиться, что множества U и V не пересекаются, допустим противное, т.е. что существует точка z, принадлежащая и U и V.
Тогда
z N ~rx ( x)
при
2
некoтором хєА и
z N ry ( y )
при некотором уєВ, т.е. d(z,x)<
2
откуда следует, что d(x,y)d(x,z)+d(z,y)<
~ rx ry
~ rx 2
и d(z,y)<
ry
,
2
. Но из ранее доказанного следует, что
2 rx +ry, т.е. d(x,y)≥ 2d(x,y)≥ ~
1 ~ (rx ry ) . Полученное противоречие доказывает, что 2
допущение о непустоте множества UV-неверно. Значит, открытые множества U и V, покрывающие множества А и В соответственно-не пересекаются, ч.т.д. 3.116. Теорема. Последовательность (хn) элементов метрического пространства Х с метрикой d сходится к элементу хєХ (см. 3.47) тогда и только тогда, когда для любого ε>0 существует такое натуральное число nε, что при всех n>nε выполняется неравенство d(xn,x)<ε. Доказательство теоремы очень просто и предоставляется читателю. 3.117. Замечание. Так как всякое метрическое пространство отделимо, то никакая последовательность элементов пространства не может иметь более одного предела. Если последoвательность (хn) имеет предел, то она называется сходящейся, в противном случае-расходящейся. Заметим, что последовательность (xn) может быть сходящейся в метрическом пространстве X, но не быть таковой в подпространстве YХ, если элемент
õ lim xn ( x X ) не принадлежит множеству Y. Последовательность (xn) называется ограниченной, если огранично множество хєХ: х=хn хотя бы при одном nєN значений последовательности (xn). Ясно, что (xn) ограничена тогда и только тогда, когда
387 существует такое число М>0, что d(x1, xn)<M при всех nєN. Доказательство следующей теоремы также предоставляется читателю. 3.118. Теорема. Пусть (xn)–последовательность в метрическом пространстве Х. (а) Если (xn)–сходится, то (xn) ограничена. (b) Если АХ и х-предельная точка множества А, то существует последовательность (xn) попарно различных элементов множества А, сходящаяся к х. 3.119. Замечание. Утверждение (а) теоремы 3.118 не допускает обращения: последовательность (xn) может быть ограниченной, но не сходящейся. Например, последовательность (xn) в пространстве R для которой xn=(-1)n при любом nєN,ограничена, но не имеет предела. Тем не менее, последовательность (xn) содержит сходящиеся подпоследовательности (см. 3.53), Так, подпоследовательность (yn), в
которой yn=x2n=1 при любом nєN,-сходится и lim ón 1; подпоследовательность (x2nn
1)
также сходится и lim x2 n1 1. n
Заметим, что в этом примере множество значений последовательности (xn) конечно (состоит из двух «точек» -1 и 1). 3.120. Теорема. Пусть Х-метрическое (и даже-любое топологическое) пространство и (xn)–последовательность в Х, множество значений которой конечно. Утверждается, что при этом условии (xn) содержит сходящуюся подпоследовательность. Доказательство. Пусть множество значений последовательности (xn) состоит из к элементов (кєN) и имеет вид: a1 , a 2 ,..., ak , где
ai a j при ij. Обозначим через Mi
(i=1,2,…,k) непустое множество всех тех натуральных чисел n, для которых xn= ai . Так k
как
M
i
i 1
=N, то по крайней мере одно из множеств М1, М2, …, Мк-бесконечно. Пусть,
для определенности, М1-бесконечно. Определим последовательность (mn) натуральных чисел следующим образом. Положим m1 равным наименьшему числу множества М1, m2–наименьшему числу множества М1\m1. Ясно, что m1<m2. Вообще, пусть числа m1, m2,…,mn, принадлежащие множеству М1, уже определены и удовлетворяют условиям: 1) m1–наименьшее число множества М1; 2) m1<m2<…<mn ; 3) при любом iєN, таком, что 1mn. Следовательно, числа m1, m2,…,mn, mn+1 удовлетворяют условиям 1), 2), 3) (с заменой числа n на n+1), так что последовательность (mn) можно считать индуктивно определенной и удовлетворяющей условиям: а) при любом nєN mnєМ1; b) m1<m2<…<mn<… Отсюда следует, что при любом nєN
xmn a1
и
lim xmn a1 , n
т.е.
подпоследовательность
( xmn )
последовательности (xn)–сходящаяся, ч.т.д. 3.121. Замечание. Если множество значений последовательности (xn) элементов метрического пространства Х-бесконечно, то утверждение о наличии у последовательности (xn) (даже ограниченной) сходящейся подпоследовательности, вообще говоря, теряет силу. Однако, в случае, когда Х=R или Х=Rn (n≥2), а последовательность (xn)-ограничена,-упомянутое утверждение справедливо. 3.122. Теорема. Всякая ограниченная последовательность в R или Rn (n≥2) содержит сходящуюся подпоследовательность.
388 Доказательство. Если множество А значений последовательности (xn) (ограниченной)-конечно, то утверждение теоремы следует из теоремы 3.120. Если множество А бесконечно, то оно имеет предельную точку (см. 3.79). Пусть х-любая предельная точка множества А. Любая окрестность точки х содержит бесконечное множество точек из А. Определим последовательность (kn) натуральных чисел следующим образом. Обозначим через к1 наименьшее из тех натуральных чисел m, для
xk1 N1(x) и если к1>1, то при всех i, 1i<к1 xi N1(x). Далее,
которых xmєN1(x). Тогда
через к2 обозначим наименьшее из тех натуральных чисел m, для которых
xm N 1 ( x) 2
N 1 ( x) N1 ( x), то к2>к1, õê2 N 1 ( x) и xk xk . Кроме 2 1
и xm xk1 . Так как
2
2
того, если к1
xi N 1 ( x) . Теперь через к3 обозначим 2
наименьшее из тех натуральных чисел m, для которых
xm N 1 ( x) и xm xk , 1 3
xm xk2 . Так как
N 1 ( x) N 1 ( x) N1 ( x) , то k3>k2, 3
2
xk3 N 1 ( x) и xk отлично 3 3
от xk1 и xk2 . Продолжая (аналогично предыдущему) процесс определения чисел ki (i=4,5,…,n,… ), мы построим последовательность (kn) натуральных чисел такую, что к1<к2<…<кn<…;
xkn N 1 ( x) при любом nєN; последовательность (yn), гдe yn= xk n n
состоит из попарно различных элемeнтов множества А. Так как последовательность (yn) является подпоследовательностью последовательности (xn) и так как при любом nєN ||yn-x||<
1 1 yn x , ч.т.д. (или |yn-x|< ), то lim n n n
3.123. Теорема. Множество А в метрическом пространстве Х компактно тогда и только тогда, когда любая последовательность его элементов содержит подпоследовательность, сходящуюся к некоторой точке из А. Доказательство. Пусть А компактно и (xn)–любая последовательность его элементов. Требуется доказать, что (xn) содержит сходящуюся подпоследовательность, предел которой принадлежит А. Если множество значений A последовательности (xn)конечно, то из доказательства теоремы 3.120 следует, что (xn) содержит подпоследовательность, сходящуюся к одному из элементов множества A А. Если множество A бесконечно, то (согласно теореме 3.84) оно имеет предельную точку х, принадлежащую множеству А. Из доказательства теоремы 3.122 следует, что и в этом случае (xn) содержит подпoследовательность, сходящуюся к элементу хєА. Обратно, пусть любая последовательность элементов множества А содержит подпоследовательность, сходящуюся к некоторой точкe из А. Убедимся, что это условие влечет за собой компактность множества А. Не ограничивая общности, можно считать, что множество А бесконечно (ибо любое конечное множество компактно). Рассмотрим любое бесконечное подмножество В множества А. Пусть B -счетное подмножество множества В (см. 1.116). Расположив все элементы множества B в последовательность (xn), в которой xixj при ij, выделим из (xn) подпоследовательность ( x k n ), сходящуюся к некоторой точке хєА. Ясно, что любая окрестность точки х содержит бесконечное множество членов последовательности (xn). А так как различные члены последовательности xn–это различные элементы множества В, то любая окрестность точки х содержит бесконечное множество точек из В. Следовательно, х-предельная точка множества В. Итак, любое бесконечное
389 подмножество В бесконечного множества А имеет предельную точку, принадлежащую множеству А. На основании теоремы 3.84 заключаем, что множество А компактно, ч.т.д. 3.124. Определение. Частичным пределом последовательности (xn) элементов метрического пространства называется предел всякой сходящейся подпоследовательности последовательности (xn). 3.125. Замечание. Если последовательность (xn) сходится в метрическом пространстве Х, то ясно, что и всякая ее подпоследовательность сходится к тому же пределу. В этом случае множество частичных пределов последовательности (xn) состоит из одной точки. Множество частичных пределов расходящейся последовательности может быть даже несчетным. Рассмотрим, например, пространство R всех действительных чисел с естественной метрикой. Если все рациональные числа счетного множества QR расположить в последовательность (rn) с попарно различными членами, то множество частичных пределов последовательности (rn), как легко видеть, совпадает с R. 3.126. Теорема. Частичные пределы последовательности (xn) в метрическом пространстве Х образуют замкнутое множество. Доказательство. Обозначим через А множество значений последовательности (xn) и через A –множество всех частичных пределов этой последовательности. Если множество (любое, в том числе и A ) не имеет предельных точек, то оно замкнуто, ибо его дополнение, как легко видеть, -открыто. Пусть A имеет предельные точки. Чтобы установить замкнутость множества A , достаточно показать (см. 3.65), что A содержит все свои предельные точки. Пусть у-предельная точка множества A . Задавшись произвольным числом ε>0, найдем точку хє A такую, что хє N ( y ) и ху, т.е. 0
. 2
2
Так как х-частичный предел последовательности (xn), то при некотором
nєN xnєNr(x), где r=d(x,y). Следовательно, d(xn,x)yn+1, будем называть строго убывающей. Последовательность действительных чисел будем называть монотонной, если она является либо монотонно возрастающей, либо монотонно убывающей. Будем говорить, что последовательность (xn) действительных чисел стремится к + (и писать хn+), если для любого действительного числа М найдется такое натуральное число к (зависящее от М), что при всех n>к (nєN) xn>М. Часто пишут
õn . Если для любого действительного числа М найдется такое также, что lim n натуральное число к, что при всех n>k (nєN)
выполняется неравенство xn<М, то
õn . говорят, что последовательность (xn) стремится к - и пишут: xn- или lim n
3.128. Замечание. Легко доказать (это предоставляется читателю), что последовательность (xn) действительных чисел, неограниченная сверху, содержит
390 подпоследовательность, стремящуюся к +. Точно так же, последовательность действительных чисел, неограниченная снизу, содержит подпоследовательность, стремящуюся к -. 3.129. Теорема. Если последовательность (xn) действительных чисел монотонно возрастает и ограничена сверху, то она сходится в пространстве R (наделенном естественной
метрикой)
и
lim õn sup E , n
где
Е-множество
значений
õn ). последовательности (xn) (вместо sup E часто пишут sup n 1 Если монотонно возрастающая последовательность не ограничена сверху, то xn+. Доказательство. Пусть последовательность (xn) монотонно возрастает и ограничена сверху. Обозначив a sup E , имеем: xn a при всех nєN. Так как a есть наименьшая из верхних границ множества Е, то при любом ε>0 найдется такое натуральное число nε, что неравенства a –ε< xn
xn > a –ε.
Тогда при всех n>nε будут выполняться
xn a a , откуда |xn- a |= a -xn<ε. Но это и означает, õn à sup E. Если монотонно сходится и lim n
что последовательность (xn)
возрастающая последовательность (xn) не ограничена сверху, то для любого действительного числа М найдется такое натуральное число к, что xk>М. Тогда при всех n>к (nєN) имеем: xn≥хк>М, а это и означает, что xn+. Теорема доказана. Доказательство следующей теоремы предоставляется читателю. 3.130. Теорема.Если последовательность (xn) действительных чисел монотонно убывает и ограничена снизу, то она сходится в пространстве R (наделенном естественной
метрикой)
и
lim õn inf E , n
где
Е-множество
значений
õn ). Если монотонно убывающая последовательности (xn) (вместо inf E часто пишут inf n 1 последовательность (xn) не ограничена снизу, то хn-. 3.131. Замечание. Следует помнить, что если xn+ или xn-, то последовательность (xn)–расходящаяся, ибо всякая сходящаяся последовательностьограничена. 3.132. Теорема. Если последовательность (xn) действительных чисел ограничена сверху, то либо xn- (и тогда любая ее подпоследовательность стремится к -), либо среди частичных пределов последовательности (xn) есть наибольший, называемый верхним пределом последовательности (xn). Доказательство. Для любого nєN обозначим через Еn множество значений последовательности xn, xn+1,…,xn+k,… Таким образом, Е1Е2…Еn… Так как множество Е1 ограничено сверху, то и все множества Е2, Е3, …, Еn, … ограничены сверху. Рассмотрим последовательность действительных чисел (yn), где при любом nєN yn=supEn. Ясно, что последовательность (yn) монотонно убывающая: у1≥у2≥…≥уn≥… Если при этом последовательность (yn) не ограничена снизу, то уn- (см. 3.130), а так как xnyn при всех nєN, то и xn-. Если же последовательность (yn) ограничена снизу, то она сходится к конечному
yn L =infуєR: y=yn хотя бы при одном пределу, который обозначим через L: lim n nєN. Взяв любое ε>0, можем утверждать, что при всех nєN yn≥L, но найдется такой
номер nε, что y nnε будет: yn 0 все члены последовательности (yn), кроме, может быть, конечного их числа принадлежат промежутку [L,L+ε). А неравенству yn≥L+ε могут удовлетворять лишь конечное число членов последовательности (yn). Так как при всех nєN xnyn, то и
391 подавно, неравенству xn≥L+ε могут удовлетворять лишь конечное число членов последовательности (xn). Отсюда следует, что никакое число, большее L, не может быть частичным пределом последовательности (xn). В самом деле, если L1>L, то взяв L L 0<ε< 1 , будем иметь: L+ε0 существует такое nεєN, что при n>nε выполняются неравенства
yn1 –ε.
Lyn
yn1 xn1 p1 .
откуда
Ån1 и
потому найдется такое целое число р1≥0, L-ε yn1
Будем иметь:
L–ε< xn1 p1
Взяв
теперь
Это число не
n2=n1+p1+1,
xn1 p1 yn1 p1 L , мы,
расуждая
аналогично
предыдущему, найдем целое число р2≥0 такое, что L–ε< xn2 p20, то 1 1 полагая ε равным последовательно 1, , ,... и рассуждая как в 3.122, мы определим 2 3 строго возрастающую последовательность (kn) натуральных чисел, такую, что
lim xkn L . n
Но
это
и
означает,
что
L
является
частичным
пределом
последовательности (xn), ч.т.д. 3.133. Теорема. Если последовательность (xn) действительных чисел ограничена снизу, то либо xn+ (и тогда любая ее подпоследовательность стремится к +), либо среди частичных пределов последовательности (xn) есть наименьший, называемый нижним пределом последовательности (xn). Доказательство этой теоремы почти повторяет доказательство теоремы 3.132. Наметим только схему доказательства, оставляя подробности читателю. На этот раз последовательность (yn) определяется так: yn=infEn, где множества Еn определяются как в 3.132. Ясно, что у1у2у3…Если последовательность (yn) неограничена сверху, то yn+ и подавно xn+ (ибо xn≥yn при любом nєN). Если же последовательность (yn) ограничена сверху, то она имеет конечный предел:
lim yn sup yn . Взяв любое ε>0 n
n 1
и учитывая, что число –ε не является верхней границей множества значений последовательности (yn), заключаем, что существует такое число nεєN, что при всех n>nε ynє( -ε, ]. Следовательно, неравенству yn -ε могут удовлетворять лишь конечное число членов последовательности (yn). И подавно, то же самое можно сказать о последовательности (xn). Поэтому никакое число, меньшее ℓ, не может являться частичным пределом последовательности (xn). Затем доказывается, что само число ℓ является частичным пределом (xn), чем и завершается доказательство теоремы. 3.134. Замечания и обозначения. Если последовательность (xn) действительных чисел ограничена, то из 3.132 и 3.133 следует, что сpeди ее частичных пределов есть наибольший и наименьший, т.е. верхний и нижний пределы последовательности.
xn или lim sup xn , а второй- lim xn Первый из них обозначается lim n n n
или
lim inf xn . n
xn L , lim xn , то числа L и ℓ обладают следующими Если обозначить lim n n свойствами:
392 I а) для любого ε>0 найдется такое nεєN, что при всех n>nε (nєN) xn0 в интервале (L-ε,L+ε) содержится бесконечное множество членов последовательности (xn) (это означает, что множество всех тех натуральных чисел n, для которых xnє(L-ε,L+ε)-бесконечно); II а) для любого ε>0 найдется такое кεєN, что при всех n>кε (nєN) xn>ℓ-ε; II b) при любом ε>0 в интервале (ℓ-ε, ℓ+ε) содержится бесконечное множество членов последовательности (xn). Если ограниченная последовательность (xn) сходится к числу à , то и любая ее подпоследовательность сходится к
à , т.е. limxn l imxn a .
Обратно, пусть для ограниченной последовательности (xn) limxn l imxn a . Взяв любое ε>0 и учитывая свойства I a) и II a), заключаем, что при всех n>max (nε, кε) a -ε<xn< a +ε, т.е. |xn- a |<ε. Но это означает, что выполняются неравенства последовательность (xn) сходится и limxn= a . Итак, ограниченная последовательность (xn) действительных чисел сходится тогда и только тогда, когда ее верхний и нижний пределы совпадают. Пусть теперь последовательность (xn) неограничена. 1. (xn) не является ограниченной сверху, но ограничена снизу. Если при этом хn+, то любая подпоследовательность последовательности (xn) стремится к +. В этом случае и верхним и нижним пределами последовательности (xn)
x , принято считать «несобственное» число +: lim n n
l imx nn
.
Если же предельное соотношение хn+ не имеет места, то (согласно 3.133) последовательность (xn) имеет конечный нижний предел l imxn =ℓ, где число ℓ обладает свойствами II a) и II b). Далее, так как (xn) не является ограниченной сверху, то (согласно 3.128) существует подпоследовательность последовательности (xn), стремящаяся к +. Поэтому в рассматриваемом случае верхним пределом последовательности (xn) принято считать +: lim xn =+. 2. Последовательность (xn) ограничена сверху, но не ограничена снизу. Если при этом хn-, то любая подпоследовательность последовательности (xn) стремится к -. В этом случае и верхним и нижним пределами последовательности (xn) принято считать «несобственное» число -:
limxn , l imxn . Если же предельное соотношение хn+ не имеет места, то (согласно 3.132) последовательность (xn) имеет конечный верхний предел lim xn L, где число L обладает свойствами I a) и I b). Далее, так как (xn) не ограничена снизу, то (согласно 3.128) существует подпоследовательность последовательности (xn), стремящаяся к -. Поэтому в рассматриваемом случае нижним пределом последовательности (xn) принято считать -: l imxn =-. 3. Последовательность (xn) не является ограниченной ни сверху, ни снизу. В этом случае у последовательности (xn) имеется подпоследовательность, стремящаяся к +, а также имеется подпоследовательность, стремящаяся к -. Поэтому в рассматриваемом случае за верхний предел последовательности (xn) принимается «несобственное» число +, а за нижний предел-«несобственное» число -:
lim xn =+, l imxn =-. Разумеется, кроме указанных, последовательность (xn) может иметь конечное или даже бесконечное множество конечных частичных пределов (см. 3.125).
393
3.136
3.135. Определение. Последовательность (xn) элементов метрического пространства Х называется фундаментальной (или последовательностью Коши), если для любого ε>0 существует такое число nεєN, что для любых n, m таких, что n>nε и m>nε (nєN и mєN), выполняется неравенство d(xn, xm)<ε. Теорема. Последовательность (xn) в метрическом пространстве Х является
фундаментальной тогда и только тогда, когда
lim d i a m En 0 , где Еn-множество n
значений последовательности xn, xn+1,…, xn+k,... (n=1,2,3,…, m, …). Доказательство. Пусть последовательность (xn)-фундаментальна и требуется
diam En 0 . Зададимся произвольным ε>0 и найдем число nεєN, доказать, что lim n фигурирующее в определении 3.135. Пусть n>nε и х,у-любые две точки множества En. Существуют целые неотрицательные числа p и q такие, что х=хn+p, у=хn+q. Так как n+p>nε и n+q>nε, то d(x,y)=d(xn+p, xn+q)<ε, откуда diam Enε. Но это и означает (поскольку diam
diam En 0 . Обратно, пусть последовательность (xn) такова, что En≥0), что lim n lim diam En 0 . Зададимся произвольным числом ε>0 и найдем такое число nεєN, что n diam En<ε при всех n>nε. Возьмем n=nε+1, так, что diam En<ε. Для любых натуральных чисел к и m, таких, что к>nε и m>nε выполняются неравенства к≥n и m≥n, так что d(хк,хm)diam En<ε. Итак, из к>nε и m>nε (кєN, mєN) следует, что d(хк,хm)<ε. Это и доказывает фундаментальность последовательности (хn). 3.136. Теорема. Пусть (хn)-последовательность действительных чисел в пространстве R, наделенном естественной метрикой. Если при всех номерах n, кроме конечного их числа, выполняется неравенство хnb (хn≥ a ) и последовательность (xn)
õ b сходится, то и lim n n
(lim õn a) . Справедливость этого утверждения очевидна и n
подробности доказательства предоставляются читателю. 3.137. Теорема. Всякая фундаментальная последовательность (xn) в пространстве R, наделенном естественной метрикой,-сходится. Доказательство. Зададимся произвольным ε>0 и найдем такое nεєN, что при всех n>nε и m>nε (nєN и mєN) выполняется неравенство |xn-xm|<ε-ε<xn-xm<εxm-ε<xn<xm+ε. Зафиксировав m, полагая, например, m=nε+1, мы видим, что последовательность (xn) ограничена и, следовательно, обладает конечными верхним и нижним пределами L и ℓ. Так как все члены подпоследовательности (последовательности (xn)), сходящейся к L, заключены (кроме конечного их числа) в интервале (xm-ε, xm+ε), то, согласно 3.136, xmεLxm+ε. Точно так же справедливы и неравенства xm-εℓxm+ε. Следовательно, xm-εℓLxm+ε, откуда 0L-ℓ2ε. Ввиду произвольности положительного числа ε, мы должны заключить, что L=ℓ, а это означает (см. 3.134), что последовательность (xn)-сходится, ч.т.д. 3.138. Замечание. Утверждение о том, что всякая сходящаяся последовательностьфундаментальна, справедливо в любом метрическом пространстве. В самом деле, пусть
lim xn x . Задавшись произвольным ε>0, найдем такое nεєN, что при всех n>nε (nєN) n
выполняется неравенство d(xn,x)< . Взяв любые два номера n и m, большие, чем nε, 2 будем иметь: d(xn,xm)d(xn,x)+d(x,xm)<ε. А это и означает фундаментальность сходящейся последовательности (xn). Обратное утверждение, т.е. утверждение о том, что всякая фундаментальная последовательность сходится, справедливо отнюдь не для любого метрического пространства. Рассмотрим, например, последовательность (xn) в пространстве R (наделенном естественной метрикой), состоящую из десятичных приближений по
394
1 , 10 n откуда следует, что в пространстве R последовательность (xn) сходится (к 2 ), а потому является фундаментальной. Элементы последовательности (xn) являются рациональными числами. Однако, в пространстве Q с метрикой d(x,y)=|x-y| (т.е. с метрикой, индуцированной метрикой пространства R) последовательность (xn) не является сходящейся (ибо противное означало бы, что в пространстве R последовательность (xn) имеет два различных предела). 139. Определение. Метрическое пространство называется полным, если всякая фундаментальная последовательность элемнтов пространства является сходящейся. Согласно теореме 3.137, пространство R является полным метрическим пространством. 3.140. Теорема. Пространство Rn (n≥2) с метрикой d(x,y)=||x-y||(если х=(x1, x2,…, недостатку к числу
2 : х1=1,4; х2=1,41; х3=1, 414;… При любом nєN 0< 2 -xn<
xn), у=(y1, y2,…, yn), то ||x-y||= ( x1 y1 ) 2 ( x 2 y 2 ) 2 ... ( x n y n ) 2 ; см. упр. 34 к главе 2)-является полным метрическим пространством. Доказательство. Пусть (хк), кєN-любая фундаментальная последовательность элементов пространства Rn:
x1 ( x11 , x12 ,..., x1n ), x 2 ( x 12 , x 22 ,..., x 2n ), ........................... x k ( x 1k , x k2 ,..., x kn ), .............................
Убедимся, что последовательность (хк)-сходится в Rn. С этой целью установим, 1
2
n
что последвательности ( xk ), ( xk ),..., ( xk ) являются фундаментальными, а, следовательно,-сходящимися в пространстве R (теорема 3.137). Зададимся произвольным ε>0 и найдем такое кεєN, что при всех к>кε и m>кε (к,mєN) выполняется неравенство ||xk-xm||= ( xk xm ) ( xk xm ) ... ( xk xm ) <ε (это можно сделать в силу фундаментальности (хк)). Из этого неравенства следует, что 1
1
2
2
2
2
n
n
2
| x1k x1m | ||xk-xm||<ε, | xk2 xm2 | <ε,…, | xkn xmn | <ε. Значит, 1 2 n действительно, последовательности ( xk ), ( xk ),..., ( xk ) являются фундаментальными, при к>кε и m>кε а
потому-сходящимися
в
пространстве
1
2 k k
2
n k k
n
Зададимся произвольным ε>0 и найдем натуральные числа i
i
к> k (i=1,2,…,n) было | x k -xi|<
n
. Обозначим
Пусть
R.
lim x x , lim x x ,..., lim x x . Установим, что хкх= 1 k k
=(x1, x2,…, xn),.
k1 , k2 ,..., kn так, чтобы при
k max( k1 , k2 ,..., kn ). Тогда при
2 n . Но это и означает, что к> k будем иметь: ||хк-х||< n
lim xk x . k
Теорема доказана. 3.141. Теорема. Пусть (Fn)-убывающая последовательность непустых замкнутых множеств в полном метрическом пространстве Х: F1F2….Fn… Если при этом
lim diam Fn 0 , то множество n
F
n
непусто и состоит ровно из одной точки.
n 1
Доказательство. Используя аксиому выбора (см. 1.115), выберем в каждом из множеств Fn по точке хn: хnєFn, n=1,2,…,к,…Убедимся, что (xn) является
395 фундаментальной последовательностью в Х. Задавшись произвольным ε>0, найдем nεєN, такое, что при всех n>nε diam Fn<ε. Пусть к>nε, m>nε (к,mєN) и, для определенности, к<m. Тогда хкєFk, хmєFmFk и d(xk,xm)diamFk<ε, что и доказывает фундаментальность последовательности (xn). Так как пространство Х-полное, то
x x . Допустим, последовательность (xn) сходится к некоторому элементу хєХ: lim n n что элемент х не принадлежит некоторому множеству Fk. Тогда х принадлежит c
открытому множеству Fk и найдется такое ε0>0, что открытый шар N 0 ( x) не содержит точек множества Fk. С другой стороны, для числа ε0 найдется такой номер n0єN, что при всех n>n0 хnє N 0 ( x) . Взяв n=max(k,n0)+1, будем иметь: хnє N 0 ( x) и хnєFnFk. Полученное противоречие доказывает, что элемент х принадлежит всем
множествам Fn, n=1,2,…,k,…, т.е. хє
F
n
. Допустим, что множество
n 1
F
содержит,
n
n 1
кроме точки х, еще и точку ух. Обозначим d(х,у)=δ>0. Так как точки х и у принадлежат Fn при любом nєN, то diam Fn≥δ>0 при любом nєN. Но это противоречит условию
lim diam Fn 0 . Следовательно, множество n
F
n
состоит ровно из одной точки
n 1
õ lim xn , ч.т.д. 3.142. Замечание. Прежде, чем приступить к доказательству следующей теоремы, заметим следующее. Если G–открытое непустое множество в метрическом пространстве Х, то для любой точки х0єG найдется такое действительное число r0>0, что
N r0 ( x0 ) G. В самом деле, найдется такое действительное число r>0, что Nr(x0)G. Если теперь r0–любое действительное число, для которого 0
N r0 ( x0 ) хєХ: d(х,х0)r0Nr(x0)G. Далее, если открытое множество G всюду плотно в Х, т.е. G =Х, то открытый шар Nr(x)с центром в любой точке хєХ и с любым радиусом r>0 содержит точки из G, т.е. Nr(x)G-непустое открытое множество. 3.143. Теорема Бэра. Если Х-полное метрическое пространство и (Gn)– последовательность открытых множеств, всюду плотных в Х, то множество
G
n
непусто.
n 1
Доказательство. Каждое из множеств Gn, будучи плотным в Х,-непусто. Выберем в G1 любую точку х1 и обозначим через n1 наименьшее из тех натуральных чисел n, для которых
N 1 ( x1 ) G1. Далее, выберем точку х2є N 1 ( x1 ) G2 и обозначим через n2 n1
n
наименьшее из тех натуральных чисел n>n1, для которых
N 1 ( x2 ) N 1 ( x1 ) G2. n
n1
Пусть точки x1, x2,…,xk (к≥2) пространства Х и натуральные числа n1, n2,…,nk уже определены и удовлетворяют условиям: 1)
N 1 ( x1 ) G1; 2) n1
iєN, таком, что 2iк имеет место включение
N 1 ( xi ) N ni
1 ni 1
( xi 1 ) Gi.
396 При выполнениии этих условий хк+1 определяется произвольным выбором точки из непустого множества
N 1 ( xk ) Gk+1, а nk+1 определяется как наименьшее из nk
тех натуральных чисел n>nk, для которых
N 1 ( xk 1 ) N 1 ( xk ) Gk+1. n
nk
Ясно, что для точек х1, х2,…,хк, хк+1 и чисел n1, n2,…,nk, nk+1 выполняются условия 1), 2), 3) (с заменой числа к на к+1). Таким образом, можно считать индуктивно определенными последовательность (хк) элементов пространства Х и строго возрастающую последовательность (nk) натуральных чисел, для которых имеют место включения:
N 1 ( x1 ) G1 и при любом n1
к>1 (кєN)
N 1 ( xê ) N nê
1
( xê 1 ) Gk.
nê 1
Следовательно,
N 1 ( x1 ) N 1 ( x2 ) ... N 1 ( xê ) ... и при любом к≥1 n1
n2
nê
2 2 N 1 ( xk ) Gk , причем lim diam N 1 ( xk ) 0 , ибо diam N 1 ( xk ) . nk n k k k nk nk
N
По теореме 3.141 множество
k 1
1 nk
( xk ) непусто, а так как оно содержится в
множестве
G
k
, то и это множество непусто, ч.т.д.
k 1
3.144. Следствие из теоремы Бэра. Если Х-полное метрическое пространство, то Х нельзя представить в виде счетного объединения нигде не плотных замкнутых множеств.
Или: если Х-полное метрическое пространство и X=
F
n
, где все множества
n 1
Fn–замкнуты в Х, то хотя бы одно из множеств Fn имеет непустую внутренность. Доказательство. Допустим, что все множества Fn имеют пустую внутренность. c
Рассмотрим открытые множества Gn= Fn , n=1,2,3,… Убедимся, что каждое из множеств Gn всюду плотно в Х, т.е. что
Gn =Х. В самом деле, каждая точка х0єХ либо
принадлежит Gn (и тогда х0є Gn ), либо х0єFn. Так как х0 не является внутренней точкой множества Fn, то в любой окрестности точки х0 есть точка, не принадлежащая множеству Fn, т.е. точка, принадлежащая множеству Gn. Значит, х0 является предельной точкой множества Gn и потому х0є Gn . Итак, каждое из множеств Gn всюду плотно в Х. Согласно теореме Бэра (3.143)
G n 1
n
G )
, откуда Х (
n
n 1
c
Fn , что противоречит условию теоремы. n 1
Полученное противоречие доказывает, что по крайней мере одно из множеств Fn имеет непустую внутренность, ч.т.д. 3.145. Определения и замечание. Пусть Х-топологическое пространство. Множество АХ называется множеством первой категории в Х, если оно представимо в виде объединения последовательности нигде не плотных множеств; в противном случае
397 множество А называется множеством второй категории в Х. Таким образом, утверждение, доказанное в 3.144, означает, что полное метрическое пространство есть множество второй категории (в себe). 3.146. Определение. Пусть Х и Y–метрические пространства, АХ, fотображение множества А в Y и х0-предельная точка множества А (х0єХ). Будем говорить, что «f(x) стремится к уєY при х стремящемся к х0» или «предел функции f при х стремящемся к х0 есть элемент уєY», если существует элемент уєY, обладающий следующим свойством: для любого ε>0 существует такое число δ>0, что при всех хєА, отличных от х0 и удовлетворяющих неравенству d(x,x0)<δ, выполняется неравенство ρ(f(x),y)<ε (d и ρ-метрики в пространствах Х и Y соответственно). При этом будем
f ( x) писать: xlim x0
y . Заметим, что если х0єА, то вполне может оказаться, что
lim f ( x) f ( x0 ) .
x x0
3.147. Теорема. При условиях, сформулированных в определении 3.146, равенство
lim f ( x) y выполняется в том и только в том случае, когда
x x0
lim f ( xn ) y для любой последовательности (xn) элементов множества А,
n
сходящейся к х0 и такой, что хnх0 при всех nєN.
f ( x) y . Рассмотрим Доказательство. Пусть имеет место равенство xlim x0 любую последовательность (xn) элементов множества А, сходящуюся к х0 и такую, что
f ( xn ) y . С этой целью зададимся хnх0 при всех nєN. Убедимся, что nlim произвольным ε>0 и найдем такое число δε>0, что при всех хєА, отличных от х0 и удовлетворяющих неравенству d(x,x0)<δε, выполняется неравенство ρ(f(x),y)<ε. Далее, по числу δε найдем такое натуральное nε, что при всех n>nε (nєN) выполняется неравенство d(xn,x0)<δε. Так как при всех натуральных n xnєА и хnх0, то при n>nε будет выполняться
f ( xn ) y . Обратно, пусть для неравенство ρ(f(xn),y)<ε. Но это и означает, что nlim любой последовательности (xn) элементов множества А, сходящейся к х0 и такой, что f ( xn ) хnх0 при всех nєN, выполняется равенство nlim
y . Требуется доказать, что
lim f ( x) y . Допустим противное. Тогда существует такое число ε>0, что для
x x0
каждого δ>0 существуют такие точки хєА, что 0
f ( xn ) y . Но х0, хnєА и хnх0 при всех nєN, то должно иметь место равенство nlim это противоречит неравенству ρ(f(xn),y)≥ε (nєN). Следовательно, сделанное выше f ( x) допущение неверно и на самом деле xlim x0
y , ч.т.д.
3.148. Следствие. Если отображение f:АY имеет предел при хх0 (х0предельная точка множества А), то этот предел-единственный. Это утверждение вытекает из 3.147 и единственности предела последовательности в метрическом пространстве (как и в любом отделимом топологическом пространстве). Впрочем, это утверждение легко доказать (что предоставляется читателю), исходя непосредственно из определения 3.146.
398 3.149. Теорема. Пусть Х-метрическое пространство, АХ и х0-предельная точка множества А. Если f и g–комплекснозначные функции, определенные на
lim f ( x), lim g ( x) , то функции f+g и fg ( x x0
множестве А и имеющие пределы
x x0
(f+g)(x)=f(x)+g(x), (fg)(x)=f(x)∙g(x)) имеют пределы при хх0, причем
lim( f g )( x) xlim f ( x) lim g ( x) и xlim( f g )( x) lim f ( x) lim g ( x) . x0 x x0 x0 x x0 x x0 g ( x) 0 , то и Если, кроме того xlim x
x x0
0
lim f ( x) x x0 f lim( )( x) g lim g ( x) . x x0
(*)
x x0
f -это функция (со значениями в g множестве С), определенная на множестве А1=хєА: g(х)0, причем для всех хєА1 f f ( x) . Убедимся, что х0 является предельной точкой множества А1. Пусть ( )( x) g g ( x) Доказательство. Предварительно заметим, что
g ( x) b и учитывая, что b0 Nr(x0)-любая r-окрестность точки х0. Обозначив xlim x0 |b| (тогда |b|>0), найдем по числу ε0= (в соответствии с определением 3.146) такое 2 число δ0>0, что для всех х, отличных от х0 и принадлежащих множеству А N 0 ( x0 ) , выполняется неравенство |g(x)-b|<ε0. Положим δ=min(r,δ0). Так как х0-предельная точка множества А, то множество А N ( x0 ) –бесконечно. При этом А N ( x0 ) А N 0 ( x0 ) и потому для всех точек х множества А N ( x0 ) , отличных от х0, выполняется неравенство |g(x)-b|<ε0. Ясно, что (А N ( x0 ) )\х0А1,
|b| . С другой стороны, А N ( x0 ) Nr(x0), так 2 что Nr(x0) содержит бесконечное множество точек из А1. Это и доказывает, что х0предельная точка множества А1. Перейдем к доказательству равенства (*). Обозначим ибо противное означало бы, что |b|<ε0=
lim f ( x) a . Считая, что a 0, для всех х из множества
x x0
(А1 N 0 ( x0 ) )\х0 будем иметь:
f ( x) a bf ( x) ag ( x) b[ f ( x) a] a[b g ( x)] | b || f ( x) a | | a || g ( x) b | g ( x) b bg ( x) b[ g ( x) b] b 2 | b 2 b[ g ( x) b] |
| b || f ( x) a | | a || g ( x) b | | b || f ( x) a | | a || g ( x) b | |b| || b | 2 | b || g ( x) b || 2 || b | | b | | 2
2 | b || f ( x) a | 2 | a || g ( x) b | . | b |2
Зададимся произвольным ε>0 и по числу при всех хє(А1 N
|b| 4
найдем такое число δ′ε>0, что
( x0 ) \х0 будет выполняться неравенство: |f(x)- à |< | b | . Затем 4
399 по числу
|b|
2
4|a|
найдем такое число δ′′ε>0, что при всех хє(А1 N ( x0 ) \х0 будет
выполняться неравенство: |g(x)- b |<
| b |2 4|a|
. Полагая δε=min(δ0, δ′ε, δ′′ε) для всех
f ( x) a <ε. Это и доказывает равенство (*) в g ( x) b случае à 0. Доказательство равенства (*) в случае à =0, а также доказательство хє(А1 N
( x0 ) \х0будем
иметь:
утверждений теоремы, касающихся функций f+g и fg–предоставляется читателю. 3.150. Теорема. Пусть Х и Y–метрические пространства, АХ, х0-предельная точка множества А, причем х0єА, и f–отображение множества А в Y. Утверждается, что f непрерывна в точке х0 тогда и только тогда, когда
lim f ( x) f ( x0 )
x x0
Доказательство этого почти очевидного утверждения предоставляется читателю. Следует сравнить определение 3.18 с определением 3.146 и учесть определение открытых множеств в метрическом пространстве, приведенное в 3.62, а также определение предельной точки, приведенное в 3.63. 3.151. Следствие из теорем 3.149 и 3.150. Если f и g–комплекснозначные непрерывные функции на метрическом f пространстве Х, то функции f+g и fg непрерывны на Х, а функция непрерывна во g всех тех точках из Х, в которых g(х)0. 3.152. Определение и замечания. Функцию πi: Rn→R (i=1,2,…, n), которая каждой точке x=(x1, x2,…,xi,…,xn)єRn сопоставляет действительное число πi(x)=xi, будем называть i–ой проекцией пространства Rn на пространство R. Легко видеть, что каждая функция πi равномерно непрерывна. В самом деле, задавшись произвольным ε>0, будем иметь: если хєRn, уєRn и ||х-у||<δε=ε, т.е.
( x1 y1 ) 2 ... ( x i y i ) 2 ... ( x n y n ) 2 <ε, то и |πi(x)-πi(y)|=|xi-yi|<ε. Если Х-метрическое пространство и f:Х→Rn непрерывно, то и функция π f:X→R непрерывна (см. 3.21) при каждом i=1,2,…,n. Обозначив π1 f=f1, π2 f=f2,…, πn f=fn, будем иметь n вещественных функций из Х в R (непрерывных); причем для любого хєХ f(x)=(f1(x), f2(x),…, fn(x)). Обратно, пусть f1, f2,…,fn–непрерывные функции из Х в R. Тогда функция f:Х→Rn, определяемая равенством f(x)=(f1(x), f2(x),…, fn(x)) для любого хєХ-непрерывна. В самом деле, пусть х0-любая точка, принадлежащая Х. Зададимся произвольным ε>0 и для каждого i=1,2,…,n (пользуясь непрерывностью i
при всех хєХ, принадлежащих n Ni ( x0 ) . Полагая δ=min(δ1, δ2,…, δn) будем иметь: |f1(x)-f1(x0)|< , |f2(x)n f2(x0)|< ,…, |fn(x)-fn(x0)|< при всех хє N ( x0 ) . Следовательно, при этих значениях n n функции fi) найдем такое число δi>0, что |fi(x)-fi(x0)|<
х ||f(x)-f(x0)||= ( f1 ( x) f1 ( x0 )) ... ( f n ( x) f n ( x0 )) <ε, что и доказывает непрерывность функции f в произвольной точке х0єХ. Функцию f:X→Rn будем иногда записывать в виде f=(f1, f2,…,fn), а функции πi f=fi (i=1,2,…,n) будем называть компонентами отображения f. 3.153. Непрерывность многочленов и рациональных функций. Так как тождественное отображение π:С→С, для которого π(z)=z при любом zєС,-непрерывно, то (согласно 3.151) непрерывно и отображение (π)2: (π)2(z)=z2. Методом математической индукци легко доказать, что при любом nєN отображение (π)n 2
2
400 n
n
непрерывно ((π) (z)=z ). Так как отображение f, для которого f(z)≡ à =const,– непрерывно, то непрерывна и всякая функция φ (называемая одночленом) вида: φ(z)= à zn, где à –любое комплексное число, а n-любое натуральное число. Отсюда следует, что и всякая сумма (конечная) одночленов, т.е. любой многочлен f: n1
f(z)= à0 z à1 z ... àn1 z an представляет собой непрерывную функцию из С в С. Аналогично, любой действительный многочлен является непрерывной функцией из R в R. Далее, из 3.151 следует., что всякая рациональная функция, т.е. отношение двух многочленов (действительных многочленов) есть непрерывная функция во всех тех точках множества С (R), в которых знаменатель отличен от нуля. Рассмотрим теперь действительные многочлены и рациональные функции от нескольких действительных переменных. Так как при любом i=1,2,…,n функция πi:Rn→R n
непрерывна, то непрерывна и функция ( ) 1 ( ) 2 ...( ) n при любых целых неотрицательных к1, к2,…,кn. Следовательно, при любом à єR непрерывна функция 1 k
2 k
n k
(одночлен) φ вида: φ(х)= a( x ) 1 ( x ) 2 ...( x ) n где х=(x1, x2,…,xn)єRn. Поэтому непрерывен и любой многочлен (действительный) от переменных x1, x2,…,xn. Отношение двух многочленов (рациональная функция) непрерывно во всех тех точках множества Rn, в которых знаменатель отличен от нуля. 154 Определения и замечания. Пусть АR, х0-предельная точка множества А и f:А→R-вещественная функция, определенная на А. Если при любом δ>0 интервал (х0, х0+δ) содержит бесконечное множество точек из А, то точку х 0 называют правой предельной точкой множества А. Число à єR называется пределом функции f в точке х0 справа, если для любого ε>0 найдется такое δ>0, что для всех хєА(х0, х0+δ) 1 k
2 k
n k
f ( x) выполняется неравенство |f(x)- à |<ε. При этом пишут: xlim x0 0
à или f(х0+0)= à .
f ( x) à или f(+0)= à . Аналогично определяется Если х0=0, то принято писать: xlim 0 понятие левой предельной точки множества А и понятие предела функции в точке х0 слева с тем отличием, что место интервала (х0, х0+δ) занимает интервал (х0-δ, х0). Предел
lim f ( x)
функции f в точке х0 слева обозначается x x 0 0 или f(x0-0). Если х0=0, то пишут
f ( x) или f(-0). просто xlim 0
lim f ( x) , определенный в 3.146, то
Ясно, что если существует предел x x 0
lim f ( x)
существуют оба предела f(х0+0) и f(х0-0), причем f(х0+0)=f(х0-0)= x x0 . Обратно, если х0 является и левой и правой предельной точкой и существуют оба предела f(х0+0)
lim f ( x)
и f(х0-0), равные между собой, то ясно, что существует предел x x 0 , равный общему значению пределов f(х0+0) и f(х0-0). Однако пределы f(х0+0) и f(х0-0) или какой-
lim f ( x)
нибудь один из них, могут существовать и без того, чтобы существовал x x 0 . Предел функции в точке х0 справа (слева) называют также правосторонним пределом функции в точке х0 или левосторонним пределом функции в точке х0. Определим понятие бесконечного предела и предела в бесконечности (т.е. при х→+∞ или при х→-∞). Пусть АR, х0-предельная точка множества А и f:А→Rвещественная функция. Говорят, что функция f имеет пределом +∞(-∞) при стремлении х к х0 (в точке х0), если для любого числа М найдется такое δ>0, что при всех хєА(х0-δ, х0+δ) и отличных от х0, имеет место неравенство f(x)>М (f(x)<М). При этом пишут:
lim f ( x) () . Если известно лишь, что для любого числа М>0 найдется такое
x x0
δ>0, что при всех хєА(х0-δ, х0+δ) (х≠х0) имеет место неравенство |f(x)|>М, то говорят,
401 что функция f имеет своим пределом ∞ при стремлении х к х0 (в точке х0). При этом
lim f ( x)
пишут: x x 0 . Для рассматриваемого случая могут быть повторены сделанные выше замечания относительно односторонних пределов справа и слева. Если множество А-область определения функции f–содержит сколь угодно большие положительные числа, то можно поставить вопрос о существовании или
f ( x) . А именно, говорят, что при х→+∞ функция f несуществовании предела xlim имеет конечный предел à , если по любому ε>0 можно найти такое действительное число М, что при всех хєА(М,+∞) выполняется неравенство |f(x)- à |<ε. Аналогично определяется понятие конечного предела функции при х→-∞ (в случае, когда множество А содержит сколь угодно большие по абсолютной величине отрицательные числа). f ( x) и lim f ( x) , то Если существуют и равны конечные пределы xlim x
f ( x) à , где à –общее значение пределов lim f ( x) и lim f ( x) . пишут: xlim x x Наконец, при х→+∞ или х→-∞ функция f может иметь (или не иметь) бесконечный предел (+∞, -∞ или ∞). Соответствующие определения предлагается сформулировать читателю. Читателю предлагается также проверить, что во всех случаях имеет место аналог теоремы 3.147, т.е. вопрос о существовании или несуществовании бесконечного предела или предела в бесконечности может быть сведен к вопросу о существовании или несуществовании конечного или бесконечного предела последовательности. А именно, lim f(x) (конечный или бесконечный) при х→х0 (х→+∞ или х→ -∞) существует тогда и только тогда, когда существует предел последовательности (f(xn)) для любой последовательности (xn), такой, что xn→х0 (хn→+∞ или хn→-∞). Разумеется, здесь предполагается, что при всех nєN xnєА-области определения функции f. Пусть указанное свойство выполняется. Возникает вопрос, не может ли случиться так, что две последовательности (хn′) и (хn″) обе стремятся к одному и тому же пределу (х0єR или +∞ или -∞), а последовательности (f(хn′)) и (f(хn″)) имеют различные пределы? Допустив, что это возможно, составим новую последовательность х′1, х″1, х′2, х″2,…., х′n, х″n…; эта последовательность стремится, очевидно, к тому же пределу, к которому стремятся последовательности (хn′) и (хn″), однако последовательность f(х′1), f(х″1),…, f(х′n), f(х″n),… вовсе не имеет предела. Это видно из того, что частичные последовательности из ее членов, стоящих на четных или нечетных местах, стремятся к различным пределам. Так как это противоречит вышеуказанному свойству, то на самом деле последовательности (f(х′n)) и (f(х″n)) имеют один и тот же предел. Определим понятие разрыва функции в той или иной точке ее области определения. Пусть Х и Y–метрические пространства, АX, точка х0єА и является предельной точкой множества А. Согласно 3.150, отображение f:А→Y непрерывно в точке х0 тогда и только тогда, когда
lim f ( x) f ( x0 ) . Если это равенство
x x0
lim f ( x)
нарушается (т.е. либо x x 0 не существует, либо указанный предел существует, но не равен f(x0)), то говорят, что функция f в точке х0 имеет (или претерпевает) разрыв. Говорят также, что f разрывна в точке х0. Сама точка х0 называется при этом точкой разрыва (непрерывности) функции f. Если f–вещественная функция (Y=R), определенная на множестве АR, то точки разрыва функции f можно классифицировать следующим образом. Пусть х0-правая предельная точка множества А, не являющаяся левой предельной точкой (например, если f определена на отрезке [à, b] и рассматривается
lim f ( x) f ( x 0)
0 точка х0= à ). Если x x 0 существует и конечен, то либо f(x0+0)=f(x0) 0 и тогда функция f непрерывна в точке х0, либо f(x0+0)≠f(x0) и тогда говорят, что функция f имеет в точке х0 обыкновенный разрыв или разрыв первого рода. Точка х0 в этом случае называется точкой устранимого разрыва, так как достаточно переопределить функцию f в
402 точке х0, полагая f(x0)=f(x0+0), чтобы функция f стала непрерывной в точке х0. Если же предел f(х0+0) не существует, либо бесконечен, то говорят, что функция f имеет в точке х0 разрыв второго рода. Аналогично рассматривается случай, когда х0-левая предельная точка множества А, не являющаяся правой предельной точкой. Пусть теперь х0 является и правой и левой предельной точкой множества Аобласти определения функции f. При этом возможны следующие случаи. 1) Оба предела f(x0+0) и f(x0-0)существуют и конечны. Если при этом f(x0+0)=f(x0-0)=f(x0), то функция f непрерывна в точке х0. Если f(x0+0)=f(x0-0)≠f(x0), то в точке х0 функция f имеет разрыв первого рода и слева и справа. Этот разрыв можно устранить, переопределив функцию f в точке х0. Если f(x0+0)=f(x0)≠f(x0-0), то говорят, что функция f непрерывна справа в точке х0 и имеет разрыв первого рода в точке х0 слева. Если f(x0-0)=f(x0)≠f(x0+0), то говорят что функция f непрерывна слева в точке х0 и имеет разрыв первого рода в точке х0 справа. Если, наконец, f(x0+0), f(x0) и f(x0-0)–три попарно различных числа, то функция f имеет разрыв первого рода в точке х0 и справа и слева. 2) Предел f(x0+0) существует и конечен, а предел f(x0-0) либо не существует, либо бесконечен. Если при этом f(x0+0)= =f(x0), то функция f непрерывна справа в точке х0 и имеет разрыв второго рода в точке х0 слева. Если же f(x0+0)≠f(x0), то функция f имеет разрыв первого рода в точке х0 справа и разрыв второго рода в точке х0 слева. 3) Предел f(x0-0) существует и конечен, а предел f(x0+0) либо не существует, либо бесконечен. В этом случае функция f имеет в точке х0 разрыв второго рода справа, а слева функция f либо непрерывна в точке х0 (при f(x0-0)=f(x0)), либо имеет разрыв первого рода. 4) Предел f(x0-0) либо не существует, либо бесконечен и предел f(x0+0) либо не существует, либо бесконечен. В этом случае функция f имеет в точке х0 разрыв второго рода и справа и слева. В заключение заметим следующее. Если предел f(x0+0) существует и конечен, но f(x0+0)≠f(x0), то говорят, что функция f в точке х0 справа имеет скачок, равный f(x0+0)f(x0). Аналогично определяется скачок функции f в точке х0 слева, равный числу f(x0)f(x0-0). Если существуют и конечны оба предела f(x0+0) и f(x0-0), причем f(x0+0)≠f(x0-0), то число f(x0+0)-f(x0-0) будем называть скачком функции f при переходе аргумента через точку х0. 3.155. Теорема (Больцано-Коши). Для того, чтобы функция f:А→R (АR) имела конечный предел при х→х0 (х0предельная точка множества А), необходимо и достаточно, чтобы для любого числа ε>0 существовало такое число δ>0, что для всех чисел х′, х″, отличных от х0 и принадлежащих множеству А(х0-δ, х0+δ) имеет место неравенство: |f(х′)-f(х″)|<ε. Доказательство.
Пусть
существует
конечный
предел
Зададимся произвольным ε>0 и найдем такое δ>0, что |f(x)- à |<
lim f ( x) à .
x x0
, если только хєА(х02
δ, х0+δ) и х≠х0. Рассмотрим любые две точки х′ и х″, отличные от х0 и принадлежащие множеству А(х0-δ, х0+δ). Будем иметь: |f(х′)- à |<
, |f(х″)- à |< , откуда |f(х′)2 2
f(х″)|=|(f(х′)- à )+( à -f(х″)|≤ ≤|f(х′)- à |+|f(х″)- à |<ε. Обратно, пусть условие, сформулированное в теореме, выполнено, и по произвольно взятому ε>0 найдено соответствующее δε>0. Рассмотрим любую
403 последовательность (xn) точек множества А, сходящуюся к х0 и такую, что хn≠х0 при всех nєN. Так как хn→х0, то по числу δε найдется такое натуральное число nε, что при всех n>nε (nєN) выполняется неравенство |хn-x0|<δε, т.е. хnєА(х0-δε, х0+δε). Пусть m и р-любые два номера, большие, чем nε. Тогда хmєА(х0-δε, х0+δε) и хрєА(х0-δε, х0+δε), так что в силу самого выбора числа δε будет: |f(xm)-f(xp)|<ε. Таким образом, последовательность (f(xn)) оказывается фундаментальной. В силу
f ( xn ) y . Согласно полноты пространства R, существует конечный предел nlim замечанию, сделанному в 3.154, число у будет являться пределом последовательности (f(х′n)) и для любой другой последовательности (х′n) точек множества А (отличных от х0), сходящейся к х0. Остается применить теорему 3.147, чтобы убедиться, что
lim f ( x) y .
õ x0
lim f ( x)
Замечание. Может случиться, что конечного предела õ x 0 не существует, но существует конечный предел f(x0+0) или конечный предел f(x0-0) (либо и тот и другой). Теорему Больцано-Коши легко перефразировать так, чтобы получить критерий существования конечного предела f(x0+0) (или f(x0-0)). А именно: для того, чтобы функция f:А→R (АR) имелa конечный предел f(x0+0) (х0-правая предельная точка множества А), необходимо и достаточно, чтобы для любого числа ε>0 существовало такое число δ>0, что для всех чисел х′ , х″, принадлежащих множеству А(х0, х0+δ), имеет место неравенство |f(х′)-f(х″)|<ε. Доказательство этого утверждения в точности повторяет доказательство теоремы 3.155 и мы его опускаем. Далее, легко перефразировать теорему Больцано-Коши для случая, когда решается вопрос о существовании конечного предела функции f при х→+∞ или х→-∞ (в первом случае область определения функции f должна содержать сколь угодно большие положительные числа, а во втором-сколь угодно большие по абсолютной величине отрицательные числа). Читателю предлагается сформулировать (и доказать) соответствующие утверждения. 3.156. Теорема. Пусть функция f:А→R (АR) монотонно возрастает на множестве А, т.е. либо является строго возрастающей, либо неубывающей функцией (см. 2.142). Тогда: 1) если sup A<+∞ (т.е. множество А ограничено сверху) и точка х0=supА не принадлежит А и является предельной точкой множества А, то существует конечный или
lim f ( x) f ( x0 0) ; этот предел будет конечным и равным
бесконечный предел õ x 0 0
sup f ( x) (хєА), если функция f ограничена сверху на множестве А, в противном же
õ x0
lim f ( x) ;
случае õ x 0 0
f ( x) ; 2) если sup A=+∞, то существует конечный или бесконечный предел õlim этот предел будет конечным, если функция f ограничена сверху на множестве А, в f ( x) противном же случае õlim Доказательство. 1) Пусть точка х0=sup A (х0єR) является предельной точкой множества А, причем х0 А. Если f ограничена сверху на множестве А, то обозначим
f ( x) . Задавшись произвольным ε>0, будем a =sup{уєR: у=f(x),хєА}. Коротко: a = õsup À иметь: f(x)≤ a при всех хєА, но найдется такая точка х εєА, что f(хε)> a -ε. Обозначим δε=х0-хε. Ясно, что δε>0 и для всех х, принадлежащих множеству А(х0-δε,х0),
404
a –ε
õ )>M. Обозначив δ=х0- õ (δ>0), для всех хєА(х0-δ, х0) будем иметь: f(х)≥f( õ )>М. lim f ( x) . А это и означает, что f(
õ x0 0
Доказательство утверждения 2) аналогично вышеизложенному и мы предоставляем его читателю. 3.157. Замечание. Если функция f:А→R (АR) монотонно возрастает на множестве А и sup A<+∞, но точка х0=sup A, являясь предельной точкой множества А,
lim f ( x)
принадлежит этому множеству, то õ x 0 0 существует и конечен, но не обязательно
f ( x) . В самом деле, рассмотрим множество А1=А\{х0}. Ясно, что равен числу a = õsup À х0=sup A1 и х0 является предельной точкой множества А1. Кроме того, функция f монотонно возрастает на множестве А1 и ограничена сверху (числом f(x0)). Поэтому,
sup f ( x) sup f ( x)
lim f ( x)
õ x0 согласно 3.156, õ x 0 0 существует, конечен и равен числу õ À 1 (применяя эту короткую запись, мы подразумеваем, что хєА). Доказательство следующей теоремы предоставляется читателю. 3.158. Теорема. Пусть функция f:А→R (АR) монотонно возрастает на множестве А. Тогда: 1) если inf A>-∞ (т.е. множество А ограничено снизу) и точка х0= =inf A не принадлежит А и является предельной точкой множества А, то существует конечный или
lim f ( x) lim f ( x0 0) ; этот предел будет конечным и
бесконечный предел õ x 0 0
inf f ( x) , если функция f ограничена снизу на множестве А, в противном же
равным õ x 0
lim f ( x) ;
случае õ x 0 0
f ( x) ; 2) если inf A=-∞, то существует конечный или бесконечный предел õlim этот предел будет конечным, если функция f ограничена снизу на множестве А, в
f ( x) . противном же случае õlim Читателю предлагается также перефразировать теоремы 3.156 и 3.158 для случая, когда функция f:А→R монотонно убывает на множестве А. 3.159. Следствие из теорем 3.156 и 3.158. Пусть АR-промежуток, который может быть как конечным, так и бесконечным, замкнутым или открытым с одного или с обоих концов (см. 3.95). Если функция f:А→R монотонно возрастает на множестве А, то в каждой внутренней точке х 0 промежутка А существуют конечные пределы f(x0-0) и f(x0+0) причем
sup f ( x) f ( x0 0) f ( x0 ) f ( x0 0) inf f ( x) õ x0
õ x0
Кроме того, если x0
f ( y0 0) sup f ( x) õ y
0
f ( x0 0) inf f ( x) и y >x , то f(x +0)≤f(y ). Далее, 1 0 0 1 õ x0
и y1<у0, то f(y1)≤f(у0-0). Следовательно f(x0+0)≤f(y0-0).
405 3.160. Теорема. Если вещественная функция f, определенная на промежутке А (см. 3.159),-монотонно убывает, то в каждой внутренней точке х 0 промежутка А существуют конечные пределы f(x0-0) и f(x0+0), причем
inf f ( x) f ( x0 0) f ( x0 ) f ( x0 0) sup f ( x) õ x0
õ x0
Кроме того, если х0<у0 (х0 и у0-внутренние точки промежутка А), то f(x0+0)≥f(y00). Доказательство этой теоремы предоставляется читателю. 3.161. Замечание. Итак, монотонно возрастающая (убывающая) функция f:А→R может иметь в промежутке А только разрывы первого рода, т.е. скачки. Если х0-точка разрыва функции f, являющаяся внутренней точкой промежутка А, то f(x0-0)≠f(x0+0), ибо в противном случае f(x0-0)=f(x0)= =f(x0+0), что означает непрерывность функции f в точке х0. Пусть, для определенности, f монотонно возрастает на множестве А. Если х 0 и у0-две различные точки разрыва функции f и, скажем, х0<у0, то (в силу вышедоказанного) интервалы (f(x0-0), f(x0+0)) и (f(y0-0), f(y0+0)) не пересекаются. Пусть Е-множество точек разрыва функции f, являющихся внутренними точками промежутка А. Каждой точке хєЕ сопоставим интервал (f(x-0), f(x+0)) и рассмотрим семейство (f(x-0), f(x+0))хєЕ попарно непересекающихся интервалов. Обозначим через Qx множество всех тех рациональных чисел, которые принадлежат интервалу (f(x-0), f(x+0)) (хєЕ). Семейство (Qx), хєЕ состоит из непустых попарно непересекающихся множеств. Применив аксиому Цермело и выбрав в каждом из множеств Qx по рациональной точке r(x), будем иметь биективное отображение множества Е на некоторое подмножество множества Q. Таким образом, доказано следующее предложение. Теорема. Пусть функция f:А→R монотонно возрастает или монотонно убывает на промежутке А. Тогда множество точек промежутка А, в которых f претерпевает разрыв, не более чем счетно. 3.162. Теорема. Пусть функция f:А→R монотонно возрастает (или убывает) в промежутке АR. Если множество значений функции f связно в R, т.е. представляет собой промежуток (конечный или бесконечный), то f непрерывна на множестве А. Доказательство. Рассмотрим, для определенности, монотонно возрастающую функцию f:А→R. Допустим, что f претерпевает разрыв в некоторой точке х0єА, например, слева. Согласно вышедоказанному, существует предел
f ( õ0 0) sup f ( x) : x x0 .Так как х0-точка разрыва функции f, то f(x0-0)
Рассмотрим
любую
точку
х1єА,
для
которой
х1<х0.
Так
как
f ( õ0 0) sup f ( x) : x x0 , то f(x1)≤f(x0-0). Для любой точки x2>x0 (x2єA)–если
х0 не является правым концом промежутка А-будем иметь f(x2)≥f(x0). Таким образом, f не принимает значений уєR, лежащих между числами f(x0-0) и f(x0). Но это противоречит связности множества f(A), которое вместе с точками f(x1) и f(x0) должно содержать и весь отрезок с концами в этих точках. Полученное противоречие доказывает, что функция f непрерывна на А, ч.т.д. 3.163. Замечания. 1) Учитывая 3.95, 3.102 (следствие 1) и доказанную теорему 3.162, можем утверждать следующее: монотонная вещественная функция, определенная на промежутке АR, непрерывна тогда и только тогда, когда множество ее значений связно в R, т.е. представляет собой промежуток (конечный или бесконечный). 2) Если вещественная функция f определена, строго возрастает (строго убывает) и непрерывна в некотором промежутке АR, то множество ее значений В=f(A)-связно, т.е. представляет собой некоторый промежуток в R. Так как отображение f:А→В биективно, то существет обратная функция : f-1:В→А. От противного легко доказать, что функция f-1, как и f, является строго возрастающей (строго убывающей). Так как f-1(В)=А, то, согласно, 3.162, функция f-1 непрерывна.
406 Упражнения к главе 3. 1.
Доказать, что если a >0 ( a єR), то
Указание: в 2.146 доказано, что при a >1 0< 1 n
1 n
1 1 2.140, будем иметь: 1 , откуда à an 2.
Доказать, что
Указание: положив αn= 0<αn<
n
n
n
lim n a 1 .
n
a 1
a n
a 1 (nєN). При 0< a <1, согласно n
1 . 1 a
lim n n 1 .
n
n 1 , будем иметь: n=(1+αn)n, откуда (при n≥2) n>
n(n 1) 2 n и 2
2 . n 1 3.
Доказать, что если α>0 (αєR), то
lim
1 0 при n→∞. n
a a Указание: согласно 2.153, где a и b –любые положительные действительные b b
a a 1 . Так как α>0, то из 2.141 и 2.147 следует, что 1 , откуда числа. Если a > b , то b b a b . Итак, из a > b >0 и α>0 следует, что a b . Заметив это, зададимся 1
1 произвольным ε>0. Тогда для всех натуральных n, удовлетворяющих неравенству n ,
1 1 1 1 будем иметь: n или, согласно 2.156, n , откуда . n
4.
Доказать, что если a и β-действительные числа и a >1, то lim
n 0 an
при n→∞. (*) Указание. При β≤0 равенство (*) очевидно. Пусть β>0. Найдя натуральное число к>β и a -1=α обозначив (α>0), при всех n>2к будем иметь:
n(n 1)...(n k 1) k . Так как nk! n k k 2n 2k 2 n ( n 2ê ) 2 n n a k . , k+1= то Поэтому 2 2 2 2 k! n n 2 k k! 2 ê k! 1 (мы воспользовались 2.153 и 2.154). Учитывая результат, an nk k k n k a n (1 ) n Cnk k
полученный в упражнении 3, легко прийти к равенству (*). 5. Доказать, что если |x|<1, то
lim x n 0 .
n
407
1 n
n
Указание: |x |=|x| =
1 | x |
n
. Применить результат упражнения 4 при β=0 (и считая, что
х≠0) или воспользоваться следующей цепочкой неравенств: |x|n<ε↔nlog|x|
log log | x |
(см. 2.163, 2.164, 2.165, 2.191). 6. Пусть a ≠0, q≠0, |q|<1 ( a ,qєR или С). Рассмотреть сумму Sn первых n членов бесконечно убывающей геометрической прогрессии с первым членом a и знаменателем q и доказать, что
Указание. Sn(1-q)= = a (1-qn), S n 7.
a при n→∞. 1 q 2 n1 2 n1 n Sn= a aq aq ... aq , S n q aq aq ... aq aq ,
lim S n
a a a a q n , | Sn || | | q |n . 1 q 1 q 1 q 1 q
Применить результат упражения 5. Пусть последовательность (xn) действительных чисел имеет конечный предел:
lim x n a . Доказать, что если a >р, то найдется такой номер np, что при всех n>np xn>p. Доказать также, что если anq xn
8.
Пусть при всех nєN xn≤yn и каждая из последовательностей (xn), (yn) имеет конечный
lim xn a, lim yn b . Доказать, что a b . n
предел: n
Указание. Допустив противное, т.е. что a b , рассмотреть какое-нибудь число р, заключенное между a и b : a p b . Согласно 7, найдется такой номер n1, что при всех n>n1 будет выполняться неравенство xn>p; найдется также такой номер n2, что при всех n>n2 ynmax(n1,n2) будет yn
x lim z a ( a єR), то и lim yn a. Доказать, что если nlim n nn n Указание. По любому ε>0 найти такой номер nε, что при всех n>nε выполняются неравенства a –ε<xn< a +ε и a –ε
lim x a, lim yn b . n
n n
lim( xn yn ) a b,
n
lim( xn yn ) ab.
n
Доказать, также, что если b ≠0, то
lim
xn a при n→∞. yn b
Указание. Учесть, что
| xn yn ab || ( xn a) yn a( yn b) || xn a | | yn | | a | | yn b | . Так как |yn|→|b| (см. 3.47), то найдется такое действительное число М>0, что при всех nєN |yn|≤М.
408 При доказательстве равенства
lim
xn a при n→∞ предварительно найти такой yn b
|b| . Для таких n 2 xn a bx ayn | bxn ayn | 2 | bxn ayn | 2 | b( xn a) a(b yn ) | n yn b yn b | yn | | b | | b |2 | b |2 2 2|a| | xn a | | yn b | . Далее, см. 3.149. |b| | b |2 log a n 0 при n→∞. 11. Доказать, что при a >1 lim n
номер n0, что при всех n>n0 (nєN) |yn|>
Указание. Задавшись произвольным числом ε>0, найти такое nεєN, что при всех n>nε n
n n 1 a . Пусть n′ε=max(nε, a ). Тогда при всех n>n′ε n a . Это возможно, так как nlim
log a n log a n log a n n log a (a ) . n n 12. Доказать следующее утверждение, известное под названием теоремы Штольца. Пусть (yn)–строго возрастающая последовательность положительных действительных чисел и yn→+∞. Утверждается, что
lim
xn x xn1 lim n при n→∞, если только предел справа yn yn yn1
существует (конечный или бесконечный, но определенного знака). Указание. Пусть существует конечный предел
lim Задавшись
a
2
произвольным
xn xn1 a yn yn1 2
или (a
ε>0,
xn xn1 a при n→∞. yn yn1 найти
такой
номер
nε,
что
)( yn yn1 ) xn xn1 (a )( yn yn1 ). 2 2
Полагая к=nε+1, для любого n>nε (т.е. n≥к) будем иметь:
(a )( y k y k 1 ) xk xk 1 (a )( y k y k 1 ), 2 2 (a )( y k 1 y k ) xk 1 xk (a )( y k 1 y k ), 2 2 ....................................................................... (a )( y n y n1 ) xn xn1 (a )( y n y n1 ). 2 2
Складывая все эти неравенства, получим:
(a )( yn yk 1 ) xn xk 1 (a )( yn yk 1 ), 2 2
при
всех
n>nε
409
xn xn Oткуда
yn yn
a
2.
(*)
xn xn yn yn xn xn ayn a a , Далее, yn yn yn yn yn y n xn ayn yn xn xn xn a (1 )( a) yn yn yn yn yn
откуда
xn ayn xn xn xn a a при n>n . Далее, учитывая, что y →+∞, следует ε n yn yn yn yn
и
xn ayn найти такой номер n′ε, что при всех n>n′ε
yn
2 . Тогда (с учетом неравенства (*))
при всех n>max(nε, n′ε) будет выполняться неравенство
xn a . Случай, когда yn
xn xn1 x xn1 или lim n при n→∞ сводится к уже разобранному. Пусть, yn yn1 yn yn1 xn xn1 x xn при n→∞. Тогда lim n1 при n→∞. например, lim yn yn1 yn yn1 z n z n1 . Найдется такой номер n0, что при n>n0 zn-znОбозначив, -xn=zn, имеем: lim yn yn1 lim
откуда следует, что последовательность (zn)-по крайней мере, начиная с некоторого места-строго возрастает. Далее, рассуждая как и выше, легко установить неравенство, справедливое при всех n>n0: zn-zn0>yn-yn0. 1>yn-yn-1,
ón ón1 0 то, применяя уже доказанную z n z n1 ón z x 0 , откуда lim n и lim n . часть теоремы Штольца, будем иметь: lim zn yn yn Следовательно zn→+∞. Так как, очевидно,
lim
13. Доказать, что если последовательность (xn) имеет предел (конечный или бесконечный, но определенного знака), то тот же предел имеет и последовательность (yn), где yn=
x1 x2 ... xn , nєN. n Указание.
Полагая
un=x1+x2+…+xn,
νn=n,
будем
иметь:
Следовательно (по теореме Штольца), при n→∞
lim yn lim
un lim xn . vn
14. Доказать, что при любом фиксированном кєN
lim
u n u n1 lim xn . vn vn1
410
1k 2 k ... n k n 1 lim при n→∞. k n k 1 2 1k 2 k ... n k n (k 1)(1k 2 k ... n k ) n k 1 . k 1 nk (k 1)n k
Указание.
Обозначив
xn=(k+1)(1k+2k+…+nk)-nk+1, yn=(k+1)nk, будем иметь (при n→∞):
xn xn1 (k 1)n k [n k 1 (n 1) k 1 ] lim lim yn yn1 (k 1)[n k (n 1) k ] (k 1)k k 1 (k 1)n k n k 1 [n k 1 (k 1)n k (1) n ...] 2 lim (k 1)[n k (n k knk 1 ...)] (k 1)k k 1 n ... 2 lim , где многоточием обозначены члены, в каждый из которых n входит в (k 1)knk 1 ... степени, меньшей, чем к-1. Деля числитель и знаменатель дроби на nk-1 и применяя результат
упражнения 10, получим:
lim
xn xn1 yn yn1
(k 1)k 1 2 . (k 1)k 2
1k 2 k ... n k n 1 , ч.т.д. lim Следовательно, nk k 1 2 1 15. Доказать, что e lim 1 n представить в виде
n
при n→∞ и что при любом nєN число е можно
1 1 e 1 ... n , где 0<θn<1. 1! n! n!n n
1 Указание. В 2.189 было доказано, что последовательность (xn), где xn= 1 (nєN),-является n строго возрастающей и ограниченной сверху. Поэтому, согласно 3.129, существует конечный n
n
1 1 предел lim 1 sup1 e (см. 2.191). n n Далее, как показано в 2.189,
1 1 1 1 2 1 1 k 1 1 1 (1 ) (1 )(1 ) ... (1 )...(1 ) ... (1 )(1 2! n 3! n n k! n n n! n 2 n 1 )...(1 ) (n≥к). Зафиксировав любое кєN и считая n>к, имеем: n n 1 1 1 1 2 1 1 2 k 1 xn 2 (1 ) (1 )(1 ) ... (1 )(1 )...(1 ). Переходя к пределу при 2! n 3! n n k! n n n xn 2
n→∞
в
обеих
частях
неравенства
(упр.
8),
будем
иметь:
e lim[ 2
1 1 1 1 k 1 (1 ) ... (1 )...(1 )] . Пользуясь доказанным в упражнении 10, и 2! n k! n n
411
1 2 k 1 lim 0 , lim 0 ,..., lim 0 , приходим к неравенству: учитывая, что n n n n n n 2
1 1 1 ... å. 2! 3! k!
Так как это верно при любом кєN, то при всех nєN xn
yn 2 Следовательно,
1 1 1 ... . 2! 3! n!
lim y e . Чтобы оценить разность e-yn, рассмотрим разность yn+m-yn при n n
любом mєN. Имеем:
1 1 1 1 1 1 ... [1 ... (n 1)! (n 2)! (n m)! (n 1)! n 2 (n 2)(n 3) 1 1 1 1 1 ] [1 ... ] 2 (n 2)(n 3)...(n m) (n 1)! n 2 (n 2) (n 2) m1 1 1 1 (см. упр. 6). (n 1)! 1 n2 1 n2 Итак, yn+m-yn< . Фиксируя в этом неравенстве число n и переходя к пределу при (n 1)! n 1 yn+m-yn=
m→∞, получим:
1 n2 при любом nєN. (n 1)! n 1 n2 1 1 , то окончательно 0<e-yn . Так как 2 n (n 1) n!n e yn n Обозначив (очевидно, что 0<θn<1), 1 n!n 1 1 1 e 1 ... n , ч.т.д. 1! 2! n! n!n 0<e-yn
получаем
равенство:
16. Доказать, что число е-иррационально. Указание.
Допустив,
что
e
m , n
где
m
и
n–натуральные
числа,
будем
иметь:
m 1 1 1 1 ... n , где 0<θn<1. Умножив обе части этого равенства на n! приходим к n 1! 2! n! n!n n заключению, что дробь равна разности двух натуральных чисел, что абсурдно. n 17. n→∞
Доказать, что если последовательность (xn) сходится и при всех nєN xn>0, то при
lim n x1 x2 ... xn lim xn .
412 Указание. Пусть lim xn a . Ясно, что a ≥0. Рассмотрим случай a >0. Задавшись произвольным ε>0, таким, что ε< a , найдем такой номер к=nε, что при всех n>nε выполняются неравенства a
2
xn a
2
. Тогда при любом n>nε будем иметь:
a a
2
xk 1 a
xk 2 a
2
2 2 .............................. a откуда a 2 приходим n
nk
к
2
xn a
xk 1 xk 2 ... xn a 2 заключению,
что
2
, ,
,
nk
. Обозначив yn
для
уn
n
x1 x2 ...xn , М=х1х2…хк,
выполняются
неравенства:
M n (a ) nk yn n M n (a ) nk или 2 2
M (a ) yn (a ) (при n>nε). n n 2 2 (a ) k (a ) k 2 2 M M 1 1 , то найдутся такие номера n′ε и Так как при n→∞ n и n k k (a ) (a ) 2 2 M 1 n″ε, что при всех n>n′ε будет n 2a , а при всех n>n″ε будет выполняться (a ) k 2 M 1 неравенство n . Тогда при n>max( n , n , n ) будем иметь: k 2 a (a ) 2 M
(1
)(a ) yn (1 )(a ) или a y n a . 2a 2 2a 2 Случай, когда a =0 рассматривается аналогично вышеизложенному. 18. Доказать, что если xn>0 при всех nєN, то при n→∞
lim n xn lim Указания.
lim
Если
xn1 xn
последовательность
(*)
x x2 x3 , ,..., n1 ,... неограничена сверху, то x1 x2 xn
xn1 и в этом случае очевидно, что неравенство (*) выполняется. Если же указанная xn
413 последовательность ограничена сверху, то (согласно 3.132 и с учетом того, что
xn1 0 при xn
xn1 L . На основании 3.134 (свойство xn xn1 L . Следовательно, Iа), по любому ε>0 найдется такой номер к=nε, что при всех n>к xn всех nєN) существует конечный верхний предел
lim
при n>k+2
0
xk 2 L , xk 1
0
xk 3 L , xk 2
........................ x 0 n L xn 1 Перемножая
xn
все
эти
неравенства,
будем
иметь:
xn ( L ) n( k 1) , откуда xk 1
xk 1 ( L ) n при всех n>к+2. Значит, при всех n>к+2 ( k 1) (L ) n
Так как
lim n
xn n
xk 1 (L ) ( L ) k 1
(**)
xn1 1 (при n→∞), то последовательность положительных чисел ( L ) k 1
x ограничена сверху и потому имеет конечный верхний предел. Из неравенства (**) n
n
lim n xn L . Так как здесь ε-произвольное положительное число, то xn1 n окончательно lim xn L lim при n→∞, ч.т.д. xn следует, что
19. Доказать, что если xn>0 при всех nєN, то
xn1 l im n xn . xn x x2 x3 , ,..., n1 ,... ограничена снизу (например, числом Указание. Последовательность x1 x2 xn xn1 , либо существует конечный нижний предел 0). Согласно 3.133, либо lim xn x l im n1 . Если ℓ=0, то ясно, что подлежащее доказательству неравенство-выполняется. xn l im
Пусть ℓ>0. Задавшись произвольным ε>0, таким, что ε<ℓ, найдем такое число к=кεєN, что при
414 всех n>к
xn1 (см. 3.134, свойство IIа). Рассуждая, как и в упражнении 18, убедимся, xn
что при всех n>к+2
n
откуда следует, что oкончательно
l im
n
xn . Так как ε может быть взято произвольно малым, то l im
Если
lim
xk 1 ( ) , ( ) k 1
xn n
n
xn l im
xn1 xn
xn1 , то, аналогично вышеизложенному, доказывается, что и xn
lim n xn . Заметим, что из результатов упражнений 18 и 19 следует:
l im
xn1 l im xn
Поэтому если существует предел
lim n xn , причем lim n xn lim 20. Доказать, что
lim
n n
n!
lim
n
xn lim
n
xn lim
xn1 xn
xn1 (конечный или +∞), то существует и предел xn
xn1 . xn
å.
n nn (n 1) n1 (n 1) n nn n Указание. n . Если обозначить xn , то xn1 и n! (n 1)! n! n! n! x xn1 1 (1 ) n , так что lim n1 e . Согласно замечанию к упр. 19, xn xn n x lim n xn lim n1 e . xn 1 1 , то последовательность 21. Доказать, что если при всех nєN xn>0 и lim xn lim xn (xn) сходится. Указание. Пусть
lim xn L (L>0). Тогда lim
1 1 . Одно из чисел L, 1 должно xn L L
1 ≤1. Зададимся произвольным ε>0 и L найдем такие натуральные числа n′ε и n″ε, что при всех n>n′ε будет выполняться неравенство быть ≥1. Будем считать, для определенности, что L≥1,
415
1 1 (см. 3.134, свойство Iа). xn L 1 1 . Но Тогда при всех n>nε=max(n′ε, n″ε) будут выполняться оба неравенства xnnε будут из неравенства xn n″ε будет выполняться неравенство
1 ≥1. L Доказать, что если последовательность (xn) неотрицательных действительных чисел
Аналогично рассматривается случай, когда L≤1, а 22.
удовлетворяет условию xm+n≤xm+xn для любых m,nєN, то существует конечный предел
lim
xn . n
Указание. Индукцией по числу к легко доказать, что для любых натуральных чисел к и m
xn xn a . Задавшись произвольным ε>0, найдем . Убедимся, что lim n 1 n n xm a +ε/2. Затем найдем такой номер nε, что при всех n>nε такой номер m=mε, что m x x1 x2 , ,..., m1 . Возьмем любой номер выполняются неравенства n 2 n 2 n 2 xn a . Если n>m, то n=km+r, где к-натуральное число, а r– n>nε. Если n≤m, то n 2 xn xkm kxm xm a . При 1≤r<m неотрицательное целое число (r<m). При r=0 имеем: n km km m 2 xn xkm xr xkm xr xkm xr xm xr a a . Итак, при получаем: n n n n km n m n 2 2 x xn a , , а это и означает, что lim n a . любом n>nε a n n xkm≤kxm. Пусть
a inf
23. Доказать, что при любом натуральном n
1 1 1 ln(1 ) . n 1 n n
(*)
Указание. Согласно доказанному в 2.192,
1 1 (1 ) n e (1 ) n1 при любом nєN. n n Переходя к логарифмам по основанию е=2,718… и учитывая, что ln–строго возрастающая функция (2.164), будем иметь (см. 2.165):
1 1 n ln(1 ) 1 (n 1) ln(1 ), n n откуда и вытекают неравенства (*). 24. Доказать, что последовательность (Hn), где Hn= 1 бесконечности при n→∞.
1 1 1 ... 2 3 n
стремится к
416
1 k 1 ; 2 2 1 1 1 1 1 1 k при к=2 Н2к=Н4=1+ 1 ( ) 1 ; 2 3 4 2 4 4 2 1 1 1 1 1 1 1 1 1 1 k при к=3 Н2к=Н8=1+ ( ) ( ) 1 1 . ; 2 3 4 5 6 7 8 2 2 2 2 Указание. При к=1 Н2к=Н2=1+
Индукцией по числу к доказать, что Н2к≥1+
k . Учесть, что (Hn)–строго возрастающая 2
последовательность. 25. Доказать, что последовательность (xn), где xn= 1
1 1 1 ... -ln n (nєN)-сходится. 2 3 n
Указание. Используя результат упражнения 23, будем иметь:
1 1 ln( n 1) ln n n 1 n
(nєN). Полагая n=1, 2., 3, …, k-1 (к≥4), получим:
1 ln 2 1, 2 1 1 ln 3 ln 2 , 3 2 1 1 ln 4 ln 3 , 4 3 ......................... 1 1 ln k ln( k 1) . k k 1 Складывая все эти неравенства, находим:
1 1 1 1 1 1 ... ln k 1 ... 2 3 ê 2 3 ê 1 Учитывая это, заключаем, что при всех nєN xn>0. Далее, xn=
xn+1-
1 ln n ln( n 1) 0 при любом nєN, т.е. последовательность (xn)–строго убывающая. n 1
Следовательно, существует конечный предел lim ( H n ln n) C 0.577216... , где постоянная С называется постоянной Эйлера. Таким образом, Hn=C+ln n+αn, где αn-бесконечно малая, т.е. lim αn=0 при n→∞
Заметим, что если для некоторой последовательности (βn) lim | n | , то говорят, что βn– бесконечно большая величина. Заметим еще, что из доказанного следует равенство H2n-Hn=ln2n-lnn+ +α2n-αn, т.е.
lim (
1 1 1 ... ) ln 2 . n 1 n 2 2n
26. Пусть дана последовательность a n комплексных (в частности, действительных) чисел. Последовательности
an
сопоставим
последовательность
(Sn),
где
при
любом
nєN
417 n
S n a1 a2 ... an ak
a
( S1 a1 ) . Символ
k 1
n 1
n
будем называть бесконечным рядом
(иногда просто рядом). Числа Sn, n=1, 2,..,k,…, называются частичными суммами ряда. Если
последовательность (Sn) сходится к числу sєС, то будем говорить, что ряд
a n 1
a
писать
n 1
n
=s. В этом случае число s называется суммой ряда:
n
сходится и
s lim (a1 a2 ... an ) .
n
Доказать, что ряд
a n 1
ряд сходится тогда и только тогда, когда для любого ε>0
n
существует такое натуральное nε, что для любых натуральных чисел m и n, для которых m≥n>nε, m
выполняется неравенство
a k n
<ε.
k
Указание. Если ряд
a ê 1
ê
сходится, т.е. сходится последовательность (Sn), то она
фундаментальна (3.183). Следовательно, по любому ε>0 найдется такое натуральное nε, что при m
любых m,nєN, для которых m≥n>nε, будет выполняться неравенство |Sm-Sn-1|<ε, т.е.
a ê n
ê
<ε.
m
Обратно, если для любого ε>0 существует nεєN такое, что неравенство
a ê 1
ê
<ε выполняется
при всех m,nєN, для которых m≥n>nε, то последовательность (Sn)–фундаментальна. Так как пространство С-полное, что фактически доказано в 3.140, то последовательность (Sn)-сходится,
т.е. сходится ряд
a ê 1
ê
, ч.т.д.
Замечание.
Если
ряд
a ê 1
ê
сходится,
т.е.
сходится
последовательность
(Sn),
то
an S n S n1 n 0.
Следовательно, условие a n →0 необходимо для сходимости ряда
не является достаточным, ибо, например, ряд
1
n
a ê 1
ê
. Однако это условие
расходится (т.е. не является сходящимся).
n 1
Это доказано в упражнении 24. Заметим еще, что если ряд состоит из действительных неотрицательных чисел, то его частичные суммы образуют монотонно возрастающую последовательность. Следовательно, такой ряд сходится тогда и только тогда, когда последовательность (Sn) его частичных сумм ограничена.
27.
Доказать, что если zєС и |z|<1, то ряд
z
n
, т.е. ряд 1+z+z2+…+zn+…-сходится и
n 0
z n 0
n
1 . 1 z
Указание.
Sn=1+z+z2+…+zn-1=
1 1 zn 1 z 1 z
1 | z |n | Sn | 0 (см. упр. 5). 1 z | 1 z | n
(см.
упр.
6).
Следовательно,
418
28. Ряд
a ê 1
ê
| a
называется абсолютно сходящимся, если сходится ряд
ê 1
| , состоящий
ê
из модулей членов данного ряда. Доказать, что абсолютно сходящийся ряд-сходится. Указание. По любому ε>0 найдется (см. упр. 26) такое nεєN, что для любых чисел m,nєN, для m
которых m≥n>nε выполняется неравенство | a ê | . Следовательно, ê n
m
m
ê n
ê n
aê | aê | при
m≥n>nε, откуда и следует сходимость ряда
a ê 1
ê
.
29.
Доказать,
что
если
сходится
ряд
b n 1
,
n
состоящий
из
действительных
неотрицательных чисел, и при всех n>n0 (n,n0єN) выполняется неравенство | a n |≤ bn , то и ряд
a n 1
n
абсолютно сходится.
Указание. Пусть частичные суммы ζn= b1 b2 ... bn ограничены числом М: ζn≤М при
всех nєN. Обозначим М0= | a1 | | a2 | ... | an0 | . Ясно, что частичные суммы Sn ряда
| a n 1
n
n
|
a
n
–
n 1
удовлетворяют неравенству Sn≤М0+М. Следовательно, ряд
| a
| -сходится, т.е. ряд
n 1
абсолютно сходящийся. Замечание. Часто бывает полезным следующее очевидное утверждение: если ( a n ) и ( bn )– две последовательности действительных неотрицательных чисел и при всех n>n0 (n,n0єN)
выполняется неравенство a n ≥ bn , то из расходимости ряда
b n 1
n
следует расходимость ряда
a n 1
n
.
30.
Доказать, что если ( a n )–монотонно убывающая последовательность действительных
неотрицательных чисел (т.е. при всех nєN a n ≥0 и a n ≥ a n 1 ), то ряд
a n 1
n
сходится в том и
только в том случае, когда сходится ряд a1 2a2 4a4 8a8 ... , т.е. ряд
Указание. Пусть сходится ряд
2 k 0
k
a2 k
2
k
k 0
a 2k
.
, т.е. частичные суммы этого ряда ограничены:
a1 2a2 4a4 ... 2 k a2k M const. Убедимся, что и частичные
при любом кєN
суммы ряда
a n 1
Найдем
n
также ограничены тем же числом М. Пусть n-любое натуральное число.
кєN
такое,
что
n<2к.
Будем
S n a1 (a2 a3 ) (a4 a5 a6 a7 ) ... (a2ê ...a2ê 1 1 ) à1 2a2
иметь:
419
4a4 ... 2 a2ê M . Итак, из сходимости ряда k
2 k 0
k
a 2k
следует сходимость
ряда
a n 1
n
.
Обратно, пусть сходится ряд
an и требуется установить сходимость ряда n 1
При любом натуральном к рассмотрим частичную сумму
2
k
k 0
a 2k
2
k
k 0
a 2k
.
a1 2a2 4a4 ... 2k a2ê ряда
имеем:
a1 a2 , a2 a3 2a4 a4 a5 a6 a7 4a8 ........................................... a2k 1 a2k 1 1 ... a2k 1 2 k 1 a2k . Îòñþäà
a2 2a4 4a8 ... 2k 1 a2ê a1 a2 a3 ... a2ê 1.
Так как ряд
a n 1
n
сходится, то все его частичные суммы ограничены сверху одним и тем же
числом L. Следовательно, при любом кєN
a2 2a4 4a8 ... 2k 1 a2ê L и
a1 2a2 4a4 8a8 ... 2k a2ê 2L a1 . Это и доказывает сходимость ряда
2 k 0
k
a 2k
.
31. Доказать, что ряд
1
n n 1
ð
сходится при р>1 и расходится при р≤1.
Указание. При р≤0 общий член ряда не стремится к 0, следовательно, при р≤0 ряд расходится. При р>0 данный ряд сходится или расходится в зависимости от сходимости или расходимости ряда 1
2 4 8 1 1 1 ... 1 ... При 0<р≤1 этот , т.е. ряда 2p 4p 8p 2 p 1 4 p 1 8 p 1
ряд расходится, ибо при таких значениях р общий член ряда не стремится к 0. Если же р>1, то ряд сходится (бесконечно убывающая геометрическая прогрессия). Следовательно, и данный ряд сходится при р>1 и расходится при р≤1.
32. Доказать, что ряд
1
n(ln n) n 2
ð
сходится при р>1 и расходится при р≤1.
Указание. Так как логарифмическая функция ln, т.е. loge, является строго возрастающей функцией (см. 2.164), то при р≥0 члены ряда монотонно убывают. Следовательно (см. упр. 30), при р≥0 данный ряд сходится или расходится в зависимости от сходимости или расходимости
2 4 2k ... ... , т.е. ряда ряда 2(ln 2) p 4(ln 4) p 2 k (ln 2 k ) p
1 1 1 ð p ð p . Этот (ln 2) k 1 k k 1 (ln 2) k
ряд сходится при р>1 и расходится при 0≤р<1 (упр. 31). Следовательно, и данный ряд сходится
420 при р>1 и расходится при 0≤р<1. Так как при р<0
1 (ln n) p n n(ln n)
| p|
1 для n≥3, то данный n
ряд расходится и при р<0. 33. Доказать, что если an 0, bn 0 и существует конечный и отличный от нуля предел,
lim
то ряды a n и n 1
an k bn
(k>0),
b
n
n 1
либо оба сходятся, либо оба расходятся.
Указание. Зададимся произвольным ε>0, таким, что ε<к. Найдется такой номер nεєN, что при n>nε k
bn
an k , откуда (k )bn an (k )bn . Если сходится ряд bn
1 an при n>nε; см. упр. 29) сходится и ряд k
то сходится и ряд
a n 1
34.
a n 1
n
, то (так как
bn . И, наоборот, если сходится ряд n 1
b
n
n 1
,
, ибо an (k )bn при n>nε.
n
Доказать, что если an 0, bn 0 и выполняется неравенство
an 1 bn1 для всех an bn
nєN или хотя бы начиная с некоторого места (т.е. при n≥n0єN), то из сходимости ряда
b
n
n 1
следует сходимость ряда
a n 1
n
.
Указание. Если указанное неравенство выполняется при всех n≥n0, то будем иметь (при всех n≥n0+2)
an0 1 an0
bn0 1 bn0
,
an0 2 an0 1
bn0 2 bn0 1
,...,
an b n , an1 bn1
откуда (после перемножения всех этих неравенств)
an an b n и an 0 bn bn0 an0 bn0
Если сходится ряд
b n 1
n
, то сходится и ряд
35. Доказать, что ряд
1
(ln n) n 2
p
a n0
b n 1
(n n0 2)
bn , а потому (упр. 29) сходится и ряд
n0
a n 1
n
.
расходится при любом р>0.
Указание. Члены ряда положительны и монотонно убывают с возрастанием n. Поэтому (упр. 30) ряд сходится или расходится вместе с рядом 2 4 2k 2k 1 2k ... ... , p p p p (ln 2) p (ln 4) p (ln(2 k )) p (ln 2 ) k (ln 2 ) k k 1 k 1
2k (упр. 4). но этот ряд расходится, ибо p k k
421
36. Доказать, что ряд
1
(ln n) n 2
ln n
сходится.
Указание. Легко видеть, что (lnn)lnn=nln(lnn) (логарифмы чисел, стоящих слева и справа от знака равенства-равны). При n>e9 lnn>9 и ln(lnn)>ln9>2. Поэтому (ln n)lnn=nln(lnn)>n2 при всех n>e9.
Следовательно, при таких n члены данного ряда меньше членов сходящегося ряда
37. Доказать, что ряд
1
(ln n) n 3
ln(ln n )
1
n n 1
2
.
расходится.
2
å[ln(ln n )] . Из
ln(lnn)
Указание. (lnn)
=
ранее доказанного следует (см. упр. 4), что
n
å åx lim 2 . Легко доказать (что будет сделано несколько позже), что и lim 2 при n x
х→+∞. Это значит, что при всех достаточно больших значениях х х 2<ех. Подставляя в это
ln(lnn)<
ln n
[ln(lnn)]2
и
ln n
ln n , заключаем, что при всех достаточно больших n lnn< å
неравенство вместо х
Следовательно,
при
всех
достаточно
, откуда
больших
n
(ln n) ln(ln n) å[ln(ln n)] åln n n и потому члены данного ряда при достаточно больших n будут 2
больше соответствующих членов расходящегося ряда
1
n. n 1
38. Доказать следующее утверждение о сходимости или расходимости ряда (признак Коши): (а) если L= lim
n
| an | 1 , то ряд
a n 1
n
абсолютно сходится;
(b) если L>1, то ряд
a n 1
n
расходится.
Указание. Если L<1, то выбрав ε>0 так, чтобы ε<1-L, будем иметь L+ε<1. Согласно свойству Iа) верхнего предела (см. 3.134), найдется такое nεєN, что при всех n>nε
n
| an |
Следовательно, при всех n>nε
n
| an | <(L+ε) . Так как q=L+ε<1 и ряд
q
n
сходится, то и ряд
n 1
a n 1
n
абсолютно сходится. Если же L>1, то существует строго возрастающая последовательность (nk) натуральных
чисел, такая, что
nk
| ank | k L 1.
| ank | 1 . Таким образом, нарушено необходимое условие сходимости и ряд Замечание. Если L= lim
Так, для рядов
1 и n 1 n
1
n n 1
2
n
nk
Значит при достаточно больших к
| an | 1 , то ряд
| ank | 1
и
a n 1
n
расходится.
a n 1
n
может как сходиться, так и расходиться.
L=1, но первый из этих рядов расходится, а второй сходится.
39. Доказать следующее утверждение о сходимости или расходимости ряда (признак Даламбера):
422 (а) если L= lim
an1 1 , то ряд an
a n 1
n
абсолютно сходится;
a n 1 (b) если ≥1 при всех достаточно больших значениях n (т.е. при n>n0єN), то ряд an расходится. В частности, так будет, если существует
lim
a n 1
n
an1 , причем этот предел >1. an
Указание. Рассуждая как в упражнении 38, мы, в случае L<1, возьмем любое ε>0, такое, что
a n 1 an
L+ε<1. Далее, найдется такое nεєN, что при всех n≥nε будет выполняться неравенство
Обозначив для упрощения записей nε=к, будем иметь:
aê 1 aê
aê 2 aê 1
…………
an an1 Перемножая
| an |
все
эти
| ak | (L )n . k (L )
неравенства,
получим
an aê
<(L+ε)n-k,
откуда
Так как q=L+ε<1 и ряд
q
n
сходится, то сходится и ряд
n 1
| ak | q n , а потому (см. упр. 29)-сходится и ряд k n 1 ( L ) то
(n≥k+2)
| a n 1
n
| . Если же
a n 1 ≥1 при всех n>n0єN, an
| an1 || an | при всех таких n, т.е. нарушается необходимое условие сходимости ряда. Замечание. Если
расходящимся.
a 2 k 1
1 2 2 k 1
lim
an1 1 , то ряд an
Рассмотрим,
, a2k
1 2 2k 2
например,
a n 1
ряд
n
может оказаться как сходящимся, так и
1 1 1 1 1 1 ..., 2 8 4 32 16
в
котором
an1 a2 k 2 2 k 1 2 , если же (k=1,2,3,…). Если n=2k-1, то an a2 k 1 2 2 k 2
a an1 a2 k 1 2 2 k 2 1 2 k 1 . Поэтому lim n1 2 . Тем не менее, при n=2к-1 n=2k, то an an a2 k 8 2
423 n
an
2 k 1
lim n an
1 2 2 k 1
1 , 2
n
а при n=2к
an
2k
1
2 2 k 2
2k
2k 4 4 1 . Итак, 2k k 2 2 2
1 и ряд сходится. 2
Мы видим, что признак Коши сильнее признака Даламбера в следующем смысле: если признак Даламбера указывает на сходимость, т.е.
сходимость, ибо
lim n | an | lim
an1 1 , то и признак Коши указывает на an
lim
an1 (см. упр. 18). Однако, как показывает только что an
приведенный пример, признак Коши может указать на сходимость ряда, тогда как применение признака Даламбера может не дать никаких результатов. 40. Доказать, что если an 0 при всех nєN и ряд
a n 1
n
сходится, то предел
lim nan либо
не существует, либо равен 0. Указание. Если
lim nan c , где с>0, то можем написать: lim
an 1
c 0 и ряд
a n 1
n
n
должен оказаться расходящимся (см. упр. 33).
Замечание.
Следующий
пример
показывает,
что
из
сходимости
ряда
a n 1
n
с
положительными членами вовсе не следует существование предела последовательности (nan ) . Раcсмотрим ряд 1
1 1 1 1 1 1 1 1 1 a ..., в котором , если n n 2 2 32 4 5 2 6 2 7 2 8 2 9 n
является квадратом натурального числа; в противном случае a n
Если обозначить сумму сходящегося ряда
1
n n 1
2
1 . n2
через S, то ясно, что любая частичная
сумма рассматриваемого ряда не превосходит числа 2S. Следовательно, этот ряд сходится. В то же время последовательность (nan ) не имеет предела, ибо для бесконечного множества номеров, являющихся полными квадратами, nan =1, тогда как для бесконечного множества остальных номеров na n
1 . n
Доказать, что если ряд
41.
a n 1
n
с положительными и монотонно убывающими
членами-сходится, то lim nan существует (и, конечно, равен 0). Указание.Задавшись произвольным ε>0, найдем и зафиксируем такой номер m=mε, что S
Sm<ε, где S–сумма ряда
a n 1
будем
, а Sm= a1 a2 ... am . Тогда при любом n
m
(S S m )
(nєN)
am1 ... an S n S m S S m . С другой стороны, так как ... an , am1 am2 ... an (n m)an . то Следовательно,
иметь:
am1 am2
n
424
m n ( S S m ) . Но из n следует, что (S S m ) nm m n(S S m ) (n m). Поэтому при n будут выполняться неравенства (S S m ) n( S S m ) (n m) nan , откуда nan . Но это и означает, что lim nan 0 . nm nm Замечание. Таким образом, условие lim nan 0 является необходимым условием
(n m)an S S m
nan
и
сходимости ряда
a n 1
n
с положительными и монотонно убывающими членами. Однако, это
условие вовсе не является достаточным, что видно на примере ряда
1
n ln n . Члены этого ряда n 2
положительны и монотонно убывают, а также выполняется условие nan
1 0. . ln n n
Однако, указанный ряд расходится (упр. 32, случай р=1).
Ряд
42.
a n 1
n
, составленный из действительных чисел, называется знакопеременным,
если его члены поочередно имеют то положительный, то отрицательный знаки. Знакопеременный ряд удобнее записывать так, чтобы знаки членов были выявлены, например,
a1 a2 a3 a4 ... (1) n1 an ... (an 0). Доказать следующее утверждение (теорема Лейбница): если члены знакопеременного ряда
a1 a2 a3 a4 ... монотонно убывают по абсолютной величине (т.е. a1 a2 ... an ... ) и стремятся к нулю (lim an 0) , то ряд сходится. Указание.
Запишем
частичную
сумму
четного
S2k
порядка
в
виде:
S 2k (a1 a2 ) (a3 a4 ) ... (a2k 1 a2k ). Из этой записи следует, что (S2k)-монотонно возрастающая
последовательность
положительных
чисел.
Записав
S2k
в
виде:
S 2k a1 (a2 a3 ) (a4 a5 ) ... (a2k 2 a2k 1 ) a2k , мы видим, что при всех кєN 0<S2k a1 . Следовательно, существует конечный предел
lim S 2 k S a1 ( S 0) . Так как k
a 0 , то и lim S 2 k 1 S . Следовательно, lim S S и данный S 2k 1 S 2k a2 k 1 и lim k 2 k 1 k n знакопеременный ряд сходится. Читателю предлагается доказать, что на самом деле S a1 . Замечание. Знакопеременные ряды, удовлетворяющие условиям теоремы Лейбница, называются рядами лейбницевского типа.
Пусть ряд
43.
a n 1
n
, составленный из комплексных чисел,-сходится:
S n a1 a2 ... an . При любом mєN рассмотрим ряд
ряда
a n 1
n
lim S n S , где
a
n m 1
n
, который называют остатком
после m–го члена. Пусть ζк-частичная сумма этого ряда: ζк= am1 am2 ... amk .
Так как ζк= S mk S m , то существует конечный предел lim k k
lim S mk S m S S m . k
425
a
Таким образом, ряд
n m 1
n
сходится и имеет своей суммой число γm=S-Sm. Ясно, что и
обратно: если при некотором mєN сходится ряд
a
n m 1
a n 1
n
n
и имеет сумму γm, то сходится и ряд
и имеет своей суммой число S=Sm+γm ( S ò a1 a2 ... aò ). Так как,
lim S ò S , то
ясно, что lim ò 0 при m→∞. Доказать, что остаток ряда лейбницевского типа имеет знак своего первого члена и меньше его по абсолютной величине (когда мы говорим об остатке ряда, как о числе, то имеем в виду сумму этого ряда-остатка). Указание. Остаток ряда после члена с четным номером 2m имеем вид:
a2m1 a2m2 a2m3 a2m4 ... и представляет собой ряд лейбницевского типа. Его сумма γ2m, как доказано в упражнении 42, удовлетворяет неравенству: 0<γ2m< a2 m1 . Остаток
ряда
после
члена
с
нечетным
номером
имеет
вид:
a2m a2m1 a2m2 a2m3 a2m4 ... Его сумма равна 2m1 a2m 2m (a2m 2m ), | 2m1 || a2m 2m | . откуда Но a2m 2m a2m a2m1 0, так что | 2m1 | a2m 2m a2m . При этом γ2m-1<0. Итак, для ряда лейбницевского типа погрешность приближенного равенства S≈Sn (т.е. разность S-Sn) имеет знак первого отброшенного члена и не превосходит его по абсолютной величине. 44.
равна ln2. Указание. S2n= 1
1
Доказать, что сумма ряда лейбницевского типа Рассмотрим
частичную
сумму
1 1 1 1 ... (1) n1 ... 2 3 4 n S2n
данного
ряда:
1 1 1 1 1 1 1 1 1 1 1 1 ... (1 ... ) H n (1 ... ) 2 3 4 2n 1 2n 3 5 2n 1 2 3 5 2n 1
1 (C ln n n ) , где С-постоянная Эйлера, а αn→0 (упражнение 25). Далее, из равенства 2 1 1 1 1 1 1 1 1 H 2 n 1 ... H 2 n H n , так что S2n=H2nследует, что 1 ... 2 3 2n 1 2n 3 5 2n 1 2 Hn=(C+ln2n+α2n)-(C+lnn+αn)= =ln2+α2n-αn, где
n n 0
limS2n=ln2. Так как данный ряд сходится, то его сумма 45. Пусть
и
2n 0. n
Следовательно,
S lim S 2n ln 2.
a1 , a2 ,..., an è b1 , b2 ,..., bn суть комплексные числа. Доказать, что сумму
n
S ai bi i 1
можно преобразовать к виду: n 1
S an Bn (ai 1 ai ) Bi , i 1
где B1 b1 , B2 b1 b2 , B3 b1 b2 b3 , ...., Bn b1 b2 ... bn (преобразование Абеля). b2 B2 B1 , b3 B3 B2 ,..., bn Bn Bn1 , Указание. Так как
S a1b1 a2b2 a3b3 ... an1bn1 an bn a1 B1 a2 ( B2 B1 ) a3 ( B3 B2 ) ...
то
426
an1 ( Bn1 Bn2 ) an ( Bn Bn1 ) (a2 a1 ) B1 (a3 a2 ) B2 ... (an an1 ) Bn1 n 1
an Bn an Bn (ai 1 ai ) Bi . i 1
Пусть в обозначениях упражнения 45 числа a i действительны и либо не убывают
46.
(т.е. a1 a2 a3 ... an ), либо не возрастают (т.е. a1 a2 ... an ), а суммы B1, B2,…,Bn ограничены по модулю числом L: |Bi|≤L (i=1,2,…,n). n
Доказать, что
| S || ai bi | L(| a1 | 2 | an |) i 1
n1
Указание. n1
| a
a1 a2 ... an ,
i 1
то
ai | (a2 a1 ) (a3 a2 ) ... (an an1 ) an a1. Если же
i 1
i 1
| S || an | L L | ai1 ai | . Если
a1 a2 a3 ... an , n1
то
| a
i 1
i 1
n 1
| a i 1
i 1
ai | (a1 a2 ) (a2 a3 ) ... (an1 an ) a1 an . В обоих случаях
ai || an | | a1 | и потому | S | L(| a1 | 2 | an |).
Замечание. Если множители
ai не возрастают, т.е. a1 a2 a3 ... an и все
n
положительны, то оценка 47.
| S || ai bi | i 1
упрощается:
| S | La1.
Пусть ( a n )-монотонно убывающая последовательность действительных чисел,
стремящаяся к 0: a1 a2 ... an ... ;
lim an 0 . Пусть также частичные суммы ряда
ограничены
существует
в
совокупности,
т.е.
такое
L>0,
что
при
любом
b n 1
n
nєN
| Bn || b1 b2 ... bn | L.
Доказать, что при этих условиях ряд
a b n 1
n n
сходится (признак Дирихле).
Указание. Задавшись произвольным ε>0, найдем такое nεєN, что при всех n>nε
an | an |
2L
m
. Тогда при любых m,nєN, таких, что m≥n>nε будем иметь: |
a b k n
k k
ибо
| bn || (b1 b2 ... bn ) (b1 b2 ... bn 1 ) | 2 L, | bn bn1 || (b1 b2 ... bn bn 1 ) (b1 b2 ... bn 1 ) | 2 L, ................................................................................ | bn bn1 ... bm || Bm Bn1 | 2 L.
| 2 L an ,
427 Остается воспользоваться замечанием к упр. 46, чтобы получить неравенство m
| ak bk | 2 L an .
На основании доказанного в упражнении 26, заключаем, что ряд
k n
a b n 1
n n
сходится.
48. Доказать, что если ( a n )–монотонно убывающая последовательность положительных
чисел, стремящаяся к 0, то ряды
a n 1
n
sin nx
и
a n 1
n
cos nx -сходятся
(х-любое
действительное число в случае первого из указанных рядов; для второго ряда х≠2кπ, кєZ).
Указание. Если х=2кπ, кєZ, то ряд
a n 1
n
sin nx сходится, ибо все его члены обращаются в
0. Если х-любое действительное число, не равное 2кπ, то из доказанного в упр. 8 к главе 2 следует, 1 1 что |sinx+sin2x+…+sinnx|≤ и |cosx+cos2x+…+cosnx|≤ при любом nєN. x x | sin | | sin | 2 2
Следовательно, ряд
a n 1
n
sin nx
сходится (при условиях, наложенных на последовательность
( a n )) при любом действительном х; ряд
a n 1
n
a n 1
при любом действительном
х≠2кπ. Впрочем, если ряд
cos nx сходится
n
сходится, то ряд
a n 1
n
cos nx абсолютно сходится при любом
хєR.
Замечание. По признаку Дириxле сходятся, например, ряды
sin nx cos nx , n n n1 n 1
(х≠2кπ),
Hn sin nx . n 1 n
последовательность
В отношении последнего ряда следует установить, во-первых, что (
Hn ) n
монотонно
убывает.
В
H n H n1 1 1 [(1 ) H n H n1 ] n n 1 n 1 n 1 1 1 1 1 1 [ H n ( H n 1) H n1 ] [ ( H n 1)] 0. n 1 n n n 1 n(n 1) n
lim
самом
Кроме
деле
того,
Hn Ñ ln n n ln n lim lim 0 (см. упр. 11). n n n
49. Доказать следующий признак сходимости (Абель): если ряд
b n 1
n
-сходится, а
последовательность ( a n )-монотонная (т.е. состоит из действительных чисел и либо монотонно
428 возрастает, либо монотонно убывает) и ограниченная: | a n |
a b n 1
n n
сходится.
Указание.
Задавшись
произвольным
ε>0
и
пользуясь
фундаментальностью
последовательности частичных сумм ряда
b
n
n 1
, найдем такое nεєN, что при всех m,nєN и таких,
что m>n>nε будет выполняться неравенство: | bn1 bn 2 ... bm | Тогда, m
|
a b
k n1
a b n 1
|
k k
n n
согласно
3Ê
доказанному
(| an1 | 2 | am |), т.е. |
в
упр.
m
a b
k n 1
k k
46,
| .
при
3Ê
. m>n>nε
будем
иметь:
Отсюда и вытекает сходимость ряда
.
50. Пусть ряд
a n 1
группы
(не
n
сходится. Объединяя члены этого ряда произвольным образом в
меняя
порядка
членов),
рассмотрим
ряд
(a1 a2 ... an1 ) (an1 1 an1 2 ... an2 ) ... (ank 1 1 ... ank ) ... Здесь n1, n2,…, nk,…– любая строго возрастающая последовательность натуральных чисел. Доказать, что полученный таким образом ряд сходится и имеет ту же сумму, что и исходный сходящийся ряд. Другими словами, требуется доказать, что сходящийся ряд обладает сочетательным свойством. Указание. Обозначая частичные суммы исходного ряда через S1, S2,…,Sm,…, а частичные
S1, S2 ,..., будем иметь: S k lim S nk S , где S–сумма S1 S n1 , S 2 S n2 ,..., S k S nk ,... Таким образом lim k k
суммы
рассматриваемого
ряда
через
исходного ряда. Замечание. Ряд, полученный группированием членов исходного ряда, может оказаться сходящимся, даже если исходный ряд был расходящимся. Например, ряд 1-1+1-1+1-1+… является расходящимся, тогда как ряд (1-1)+(1-1)+(1-1)+…, oчевидно, сходящийся. Если опустить скобки во втором из этих рядов, то ряд из сходящегося превратится в расходящийся. 51. Доказать, что сходящиеся ряды можно почленно складывать (вычитать), а также умножать на произвольную комплексную постоянную. Указание. Если
S ò –частичная сумма ряда
S ò + S ò -частичная сумма ряда
(a
a
n
,а
S ò –частичная сумма ряда bn , то
bn ) и S ò –частичная сумма ряда
a
(γєС). 52. Пусть ζ-биективное отображение множества N всех натуральных чисел на себя. Если
дан ряд a n , то про ряд n 1
n
n
a ( n) n 1
будем говорить, что он получен из ряда
a n 1
n
перестановкой членов.
Доказать, что если ряд
a n 1
a n 1
(n)
.
n
абсолютно сходится, то сходится и имеет ту же сумму ряд
429 Указание. Зададимся произвольным ε>0 и найдем такое nεєN, что при любых m,nєN, m
таких, что m≥n≥nε будет выполняться неравенство Далее,
найдем
натуральные
| a k n
k
|
2
.
k1 , k2 ,..., kn
числа
такие,
что
ζ(к1)=1,
ζ(к2)=2,…, (k n ) n . Обозначим рε=max( k1 , k 2 ,..., k n ). Ясно, что рε≥nε. Пусть n≥рε и
S n a1 a2 ... an , S n a (1) a ( 2) ... a ( n) . Заметим, что члены a1 , a2 ,..., an входят как в сумму Sn, так и в сумму S n . Поэтому в разность S n -Sn после уничтожения одинаковых членов, могут войти только члены с индексами >nε. Следовательно, m
достаточно большом m. Но при любом m≥nε+1
| a
k n 1
Найдем qεєN так, чтобы при n≥qε было: | S n S |
2
k
|
2
| S n S n |
| a
k n 1
k
|
при
. Значит, при n≥рε | S n S n |
, где S–сумма ряда
n≥max(рε,qε) будем иметь:
| S n S n || ( S n S n ) ( S n S ) |
2
2
a
n
2
.
. Тогда при
.
Но это и означает, что ряд
m
a ( n) сходится и имеет ту же сумму, что и ряд n 1
a n 1
n
.
53. Замечание. Неабсолютно сходящиеся ряды не обладают переместительным свойством,
сформулированном в упражнении 52. Имеет место следующая теорема Римана. Если ряд
a n 1
n
,
состоящий из действительных чисел, неабсолютно сходится, то надлежащей перестановкой членов этого ряда можно добиться того, чтобы он имел своей суммой либо любое наперед заданное конечное число, либо «несобственное число» +∞ или -∞. Интересующийся этим вопросом читатель найдет доказательство теоремы Римана, например, в книге Г.М. Фихтенгольца «Курс дифференциального и интегрального исчисления», т. II. Здесь же ограничимся одним примером, иллюстрирующим отсутствие переместительного свойства у неабсолютно сходящегося ряда. Рассмотрим ряд 1
1 1 1 ... , сумма которого 2 3 4
равна ln2 (упр. 44). Произведем перестановку его членов так, чтобы после одного положительного следовали два отрицательных члена:
1
1 1 1 1 1 1 1 1 1 1 1 ... ... 2 4 3 6 8 5 10 12 2n 1 4n 2 4n
Имеем:
1 1 1 1 1 1 1 1 1 S 3n 1 ... (1 ... ) H 2 n H n H 2 n ( H 2 n H n ) 3 2n 1 2 2 3 2n 2 2 2 1 1 (ln 2 2 n n ) ln 2 при n→∞ (см. упр. 44). Так 2 2
S 3n1 S 3n
1 1 1 , S 3n 2 S 2 n , 2n 1 2n 1 4 n 2
то
и
lim S 3n1 n
как
1 ln 2 и 2
430
lim S 3n2 n
1 ln 2. Заметив, что любое натуральное число m либо делится на 3 без остатка 2
(т.е. имеет вид 3n), либо при делении на 3 дает в остатке 1 (m=3n+1), либо при делении на 3 дает в остатке 2 (m=3n+2),-заключаем, что
lim S m
1 ln 2 , где Sm-любая m–я частичная сумма 2
рассматриваемого ряда. Итак, в результате вышеуказанной перестановки сумма ряда уменьшилась вдвое.
54. Пусть даны два сходящихся ряда
a n 1
n
и
b n 1
n
. Составим всевозможные произведения
членов первого ряда на члены второго ряда. Из этих произведений составится бесконечная прямоугольная матрица:
a1b1
a 2 b1
a3 b1 ....a n b1 .....
a1b2
a 2 b2
a3 b2 ....a n b2 .....
a1b3
a 2 b3
a3 b3 ....a n b3 .....
......................................... a1bk a 2 bk a3 bk ....a n bk .....
(*)
.......................................... Эти произведения можно многими способами расположить в последовательность. Например, полагая c1 a1b1 , c2 a2 b1 a1b2 , c3 a3b1 a2 b2 a1b3 ,..., cn an b1 an1b2 ... a1bn ,... (суммиров
ание элементов матрицы (*) по диагонали), мы можем рассмотреть ряд
ñ
n
n 1
называется произведением Коши двух данных рядов. Можно также суммировать элементы матрицы
(*)
«по
, который
квадратам»,
полагая
d1 a1b1 , d 2 a2b1 a2b2 a1b2 , d 3 a3b1 a3b2 a3b3 a2b3 a1b3 ,...,
d n an b1 an b2 ... an bn an1bn an2bn ... a1bn ,... и рассматривая затем ряд
d
n 1
n
.
an и bn сходятся Доказать следующее утверждение (теорема Коши): если ряды абсолютно, то ряд, составленный из произведений (*), взятых в любом порядке, также сходится и имеет своей суммой произведение сумм данных рядов. Указание. Когда мы говорим о ряде, составленном из произведений (*), взятых в любом порядке, то имеем в виду, что взято любое биективное отображение ζ множества N на множество
NxN, так что ζ(1)=(i1,k1), ζ(2)=(i2,k2),…, ζ(n)=(in,kn),…, и рассматривается ряд
ñ n 1
(n)
, где
ñ ( n ) ain bkn .
Итак, имеем ряд ai1 bk1 ai2 bk2 ... ain bkn ... , где пары (in,kn), исчерпывают все пары множества NxN и при n≠m (in,kn)≠(im,km). Чтобы доказать абсолютную сходимость этого ряда, составим n–ю частичную сумму Cn ряда, составленного из модулей членов рассматриваемого ряда:
Ñn | ai1 bk1 | | ai2 bk2 | ... | ain bkn || ai1 | | bk1 | | ai2 | | bk2 | ... | ain | | bkn | Пусть рнаибольшее из чисел i1, i2, …, in, а q-наибольшее из чисел k1, k2, …, kn. Тогда
n 1
n 1
Ñn (| a1 | | a2 | ... | a p |)(| b1 | | b2 | ... | bq |) A*B*, где А*= | a n | , В*= | bn | .
431 Следовательно, ряд ai1 bk1 ai2 bk2 ... ain bkn ... абсолютно сходится. Обозначив сумму этого ряда через S и учитывая переместительное свойство абсолютно сходящегося ряда
(упр. 52), а также сочетательное свойство сходящегося ряда, будем иметь: S=
d n 1
определены
в
начале
упр.
54.
n
, где числа di
S lim( d1 d 2 ... d n ) .
Итак,
Но
n
d1 d 2 a1b1 (a2b1 a2b2 a1b2 ) A2 B2 , A2 a1 a2 , B2 b1 b2 . где Далее, A3 B3 ( A2 a3 )( B2 b3 ) A2 B2 A2b3 a3 B2 a3b3 A2 B2 a1b3 a2b3 a3b3 a3b2 a3b1 A2 B2 d 3 d1 d 2 d 3 , т.е. d1 d 2 d 3 A3 B3 . Индукцией по числу n легко доказать, что d1 d 2 ... d n An Bn , где An–n-я частичная сумма ряда
n
, а Bn-n-я
bn . Следовательно,
частичная сумма ряда
a
S nlim( A Bn ) A B , где A= a n , n n 1
B=
b n 1
n
.
a
55. Пусть ряды
n 1
n
и
b n 1
n
a
сходятся:
n 1
n
=А,
b n 1
n
=В; пусть также один из этих
рядов, например, ряд
a n 1
n
сходится абсолютно.
Доказать, что при этих условиях ряд
ñ n 1
n
, являющийся произведением Коши двух
данных рядов,-сходится и имеет своей суммой число АВ-произведение сумм данных рядов (теорема Мертенса). Указание. Обозначив через An, Bn, Cn частичные суммы рядов соответственно,
будем
an , bn и
иметь:
ñ n 1
n
Cn=c1+c2+c3+…+cn=
a1b1 (a2b1 a1b2 ) (a3b1 a2b2 a1b3 ) ... (an b1 an1b2 ... a1bn ) a1 Bn a2 Bn1 a3 Bn2 ... an B1 . Полагая βn=Вn-B, преобразуем выражение для Сn следующим образом:
Cn a1 ( n B) a2 ( n1 B) a3 ( n2 B) ... an (1 B) An B a1 n a2 n1
0 , где n a1 n a2 n1 ... an 1. a3 n2 ... an 1. Остается доказать, что lim n n 0, найдем такой номер к=кε, что при Задавшись произвольным ε>0 и учитывая, что n n всех n≥к (nєN) будет выполняться неравенство |βn|≤ε. Считая, что n>к, будем иметь:
| n || a1 n a2 n1 ... ank 1 k ank 2 k 1 ... an 1 | A * | 1an 2 an1 ... k 1ank 2 |, т.е. | n | A * | 1an 2 an1 ... k 1ank 2 |,
где
A* | an | . Оставляя число к фиксированным и устремляя n к ∞, получим: n 1
lim | n | A * n
| Так как ε может быть взято произвольно малым, то lim n n
0. | 0 , т.е. lim n n
an и bn -сходится, но не абсолютно, то 56. Замечание. Если каждый из рядов произведение Коши этих рядов может оказаться расходящимся рядом. В качестве примера
432 рассмотрим
неабсолютно
сходящийся
ряд
лейбницевского
типа
1 1 1 1 ... (1) n1 ... и составим произведение Коши этого ряда на самого себя. 2 3 n Общий член этого произведения имеет вид: n 1 1 1 1 1 ... ... ) (1) n1 . Но при n 2 n 1 k n k 1 n k n k 1 k 1 1 1 , так что |cn|≥1 при всех 1≤к≤n кn-к2+к≤n2, следовательно, k n k 1 n и k n k 1 n
cn (1) n1 (
nєN. Таким образом, необходимое условие сходимости нарушено и рассматриваемое произведение Коши расходится. Заметим, что произведение Коши двух неабсолютно сходящихся рядов может оказаться и сходящимся рядом. Рассмотрим, например, неабсолютно сходящийся ряд
1
1 1 1 ... (1) n1 ..., сумма которого равна ln2 (упр. 44). Общий член произведения 2 3 n
Коши этого ряда на самого себя имеет вид: n 1 1 1 1 1 cn (1) n1[ ... ... ] (1) n1 1 n 2(n 1) k (n k 1) n 1 k 1 k (n k 1) n n 2H n 1 1 1 1 1 n 1 n 1 n 1 (1) ( ) (1) ( ) (1) n1 . n k 1 n 1 k 1 k k 1 n k 1 n 1 k 1 n 1 k Hn Как и в упражнении 48, доказывается, что числа монотонно убывают с возрастанием номера n 1
n и что lim
Hn 0 . Следовательно, ряд n 1
Позднее будет доказано, что если ряды
ñ n 1
n
- лейбницевского типа и потому-сходится.
a и b n
n
сходятся:
a n 1
n
=А,
b n 1
n
=В, то в случае
сходимости произведения Коши данных рядов сумма этого ряда-произведения равна А·В. 57. Пусть даны комплексные числа
a0 , a1 , a2 ,..., an ,... и комплексное число z. Ряд
a0 a1 z a2 z 2 ... an z n ..., который будем записывать в виде
a n 0
n
zn ,
называется степенным рядом. Сходимость (или расходимость) степенного ряда зависит от выбора числа z. Пусть, например, существует
lim n | an | a 0 . Тогда при |z|< n
1 a
1 степенной ряд сходится, а при |z|> ряд расходится. Это утверждение следует из признака a n n n Коши, ибо lim | an z | lim( | an | | z |) a | z | . n
n
Заметим, что при z=0 любой степенной ряд сходится, но может оказаться, что при всех остальных значениях z ряд расходится. Доказать, что если lim n | an | L |z|
и 0
a n 0
z абсолютно сходится при
n n
1 и расходится при |z|>r. Доказать также, что если L=0, то степенной ряд сходится при всех L
значениях z; если же L=+∞, то степенной ряд сходится в единственной точке z=0.
433 Указание.
Применяя
признак
Коши
(упр.
38),
будем
иметь:
lim n | an z | lim n | an | | z | L | z | , считая, что L-конечное число. Если L=0, то L·|z|=0<1 n
n
n
n
при любом значении z. Следовательно, в случае L=0 степенной ряд абсолютно сходится при всех значениях z. В случае 01 выполняется при |z|>r=
1 , а неравенство L
1 . Значит, в указанном случае (0
сходится при всех z, удовлетворяющих неравенству |z|
неравенству
|z|>r.
Если
lim n | an |
и
z≠0,
то
lim n | an z n | lim (n | an | | z |) . Значит, для бесконечного множества номеров n n n n
| an z n | 1 и | an z n | 1. Следовательно, в этом случае (lim n | an | ) нарушено
необходимое условие сходимости ряда и степенной ряд расходится при всех z≠0. Замечание. Число r=
1 называется радиусом сходимости степенного ряда L
a n 0
n
zn . В
случае, когда L=0, говорят, что радиус сходимости ряда равен +∞; в случае, когда L=+∞, говорят, что радиус сходимости ряда равен 0. Итак, с каждым степенным рядом связан так называемый круг сходимости с центром в точке z=0 и радиусом r=
1 . В каждой внутренней точке этого круга L
ряд сходится абсолютно; в каждой точке, лежащей вне указанного круга, ряд расходится. В точках, лежащих на окружности круга сходимости, может иметь место как сходимость, так и расходимость степенного ряда. 58. Доказать,
что
если
действительные числа, причем
коэффициенты
an
степенного
ряда
суть
положительные
a 0 и lim n an 1 (так a0 a1 a2 ... an ..., lim n n n
n
n
an z равен 1), то ряд an z сходится в каждой что радиус сходимости степенного ряда точке окружности |z|=1, за исключением, быть может, точки z=1. Указание. Пусть |z|=1, но z≠1. Для применения признака Дирихле (см. упр. 47), следует убедиться в ограниченности суммы 1+z+z2+…+zn при любом nєN. Имеем:
1 z n1 | 1 z n1 | 2 | . |1+z+z +…+z |= | 1 z |1 z | |1 z | 2
n
zn с радиусом сходимости r=1,-сходится во всех точках n 1 n 1 окружности |z|=1, кроме точки z=1. В этой точке он превращается в расходящийся ряд . n 1 n Замечание. Например, ряд
Далее, ряд
z
n
с радиусом сходимости r=1, расходится во всех точках окружности |z|=1, так
n 0
как нарушается необходимое условие сходимости.
434
z
n
Ряд
n 1
n 2
с радиусом сходимости r=1 сходится во всех точках окружности |z|=1, так как
zn 1 при |z|=1 | 2 | 2 , а ряд n n
1
n
2
-сходится.
59. Доказать, что если радиус сходимости r степенного ряда
a z n
n
не меньше 1 (r≥1), то при
n 0
n 0
n n всех z, для которых |z|<1 имеет место равенство an z (1 z ) s n z , , где
sn a0 a1 a2 ... an . Указание. Степеннoй ряд 1+z+z2+…+zn+…, радиус сходимости которого равен 1, при |z|<1 имеет своей суммой число
1 (упр. 27). Зафиксируем любое z с |z|<1 и пусть Q–сумма ряда 1 z
a n 0
n
zn .
Составим
произведение
1+z+z2+…+zn+…Общий
a0 z a1 z z n
n1
Коши
рядов
член
a2 z z 2
n 2
a0 a1 z a2 z 2 ... an z n ...
этого
ряда
имеет
и вид:
... an z 1 sn z . Так как оба перемножаемых ряда n
n
сходятся абсолютно, то и ряд
s n 0
Q Q n : sn z = , откуда 1 z n0 1 z 60. Пусть an 0 и ряд
Доказать, что и ряд
n
z n сходится абсолютно (при |z|<1) и имеет своей суммой число
n 0
n 0
an z n =Q=(1-z) sn z n .
a n 1
n
an
1 a n 1
расходится. расходится.
n
0, то an : Указание. Если an n an
1 a
расходится вместе с рядом
a
n
an 1 an 1. Следовательно (упр. 33), ряд 1 an
. Если же a n не стремится к 0, то найдется такое ε0>0
n
и такая строго возрастающая последовательность (nk) натуральных чисел, что при всех кєN
1 ank 0 . Но тогда 1 ank 1 0 , 1 a
ank 1 ank
0 . 1 0
nk
Следовательно, для ряда
сходимости и ряд расходится. 61. Пусть, как и в упр. 60, an 0 и ряд
Доказать, что и ряд
an
s n 1
n
a
n
расходится, где
1 , 1 0 an
1 a
1
1 1 1 , 1 ank 1 0 т.е.
нарушается необходимое условие n
расходится.
sn a1 a2 ... an .
435
1 an сходится. Взяв, например, ε= , найдем такой 2 n 1 s n
Указание. Допустим, что ряд
ak ak 1 a 1 ... n . Но sk sk 1 sn 2 ak ak 1 a a ak 1 ... an sn sk 1 s ... n k 1 k 1 . Зафиксировав число к и sn sn sn sk sk 1 sn sk 1 1 . Для этого номера , пользуясь тем, что sn найдем такой номер n>k, что n sn 2 ak ak 1 a 1 ... n . Полученное противоречие доказывает, что допущение о окажется, что sk sk 1 sn 2 номер к, что при любом n>к (nєN) будет выполняться неравенство:
сходимости ряда
an
s
-неверно.
n
62. Пусть, как и в упр. 61, an 0 , ряд
Доказать, что ряд
an
s n 1
a
n
sn a1 a2 ... an .
расходится и
сходится.
2 n
an an 1 1 1 1 ) равна: . Частичная сумма ζк ряда ( Указание. При n≥2 2 sn sn sn1 sn sn1 sn n 2 s n 1 1 1 1 1 1 1 1 1 1 k ( ) ( ) ... ( ) k . Следовательно, ряд s1 s2 s 2 s3 sk sk 1 s1 sk 1 s1 an 1 1 ( ) сходится, а вместе с ним сходится и ряд 2 . sn n 2 s n 1 n 1 s n
a
63. Доказать, что если ряд
n 1
an
n 1
расходится, а ряд
n 1
n 1
an
сходится (γi означает остаток ряда
n1
Указание. Допустим, что ряд натуральное
ak
ak 1
...
ak
ak 1
...
k 1
k 1
k
k
n 0, n
к=кε,
an
an
n1
n1
найдем
an
n 1
такое
с положительными членами сходится, то ряд
n
что
n
после i–го члена).
сходится (γ0=А=
при
k 1
n>к,
an ). Взяв, например, ε= n 1
n 1
всех
1 . 2 ak ak 1 ... an
такое
a
n>k
будет
выполняться
1 , найдем 2
неравенство Но
что
k 1 n k 1 n k 1
1
n . k 1
1 . 2
При
Учитывая, этом
значении
что
n
436
ak
k 1
ak 1
k
...
сходимости ряда
an
n1 an
1 . Полученное противоречие доказывает, 2
неверно.
n 1
Чтобы доказать сходимость ряда
n 1
2 n1 n1 n и
( n 1
что допущение о
an
2 n1
an
, заметим, что
n1 an
n1 n
n1 n )
n1 n an 0.
Поэтому
n1 n . Частичная сумма ζк ряда имеет
вид:
k ( 0 1 ) ( 1 2 ) ... ( k 1 k ) A k A. k
Следовательно, ряд ( n1 n ) сходится, а вместе с ним сходятся ряды n 1
an
n1
n 1
2 n 1
an
n1
и
.
64. Рядами Дирихле называются ряды вида
an
n n 1
x
, где (a n ) произвольная последовательность
действительных чисел и хєR. Доказать, что если ряд Дирихле сходится при некотором значении x=x0, то он сходится при любом x>x0.
an an 1 . Так как ряд n x n x0 n x x0
Указание. При x>x0
(
1
n
) монотонно убывает и ограничена, то ряд x x0 x
a 65. Доказать, что при a 1 lim x
an
n n 1
x
an
n n 1
x0
сходится, а последовательность
сходится по признаку Абеля (упр. 49).
; если же 0 a 1, то lim ax 0 . x
Указание. Задавшись произвольным числом Е>0, при х>logaE будем иметь: x
x a 2.158) или a E (см. 2.163). Этим доказано, что при a 1 lim x
a x a loga E
(см.
.
Пусть теперь 0 a 1. Задавшись произвольно малым ε>0 при х>logaε будем иметь (2.158):
0 a x a loga
или
0 ax
x
a , откуда и следует, что lim x x
a 66. Доказать, что при a 1 lim x Указание. Пусть
0a a x
loga
0 ( 0 a 1).
0 ; если же 0 a 1, то lim a x . x
a 1 . Задавшись произвольным ε>0, при х
или
будем иметь:
a 0 . Пусть теперь 0 a 1. 0 a x , откуда и следует, что lim x x
Задавшись произвольно большим числом Е>0, при х
a . a x E . Этим и доказано, что при 0 a 1 lim x x
log 67. Доказать, что при a 1 lim x a
x и lim log x . x 0 a
a x a loga E
или
437 Указание.
Задавшись
произвольным
Е>0,
xa
при
E
будем
иметь
(2.164):
log x . Если же log a x log a a E или log a x E. Это и доказывает, что lim x a 1 log x . , то log a x log a a E , т.е. log a x E. Значит, lim x 0 a E a log a x 0. 68. Доказать, что при a 1 lim x x
0 x a E
log a n 0 . Ясно, что и n log a (n 1) log a (n 1) log a (n 1) n 1 0, ибо . Заметив это, зададимся n n n n 1 n log a (n 1) (nєN). Пусть х-любое произвольным ε>0 и найдем такое nεєN, что при всех n>nε n Указание.
В
упражнении
11
было
доказано,
что
lim
действительное число, большее, чем nε+1 (x>nε+1). Обозначим через m наибольшее целое, не превосходящее х. Тогда nε+1≤m≤x<m+1
и
log a x log a (m 1) . При этом мы x m
воспользовались тем, что функция loga является строго возрастающей функцией при a 1 (см. 2.164). Итак, для любого ε>0 выполняется неравенство означает, что
lim
0
log a x при всех x>nε+1, а это и x
log a x 0 при х→+∞. x
Замечание. Из доказанного следует, что при a 1 и любом действительном положительном к (к>0)
lim
log a x 0 при х→+∞. xk
В самом деле, зададимся произвольным ε>0 и найдем такое число Δ=Δε>0, что при всех х>Δ имеет 1 log a x ê . Тогда при всех место неравенство x> ê будет хк >Δ и потому x log a x log a x log a x ê . lim 0 при х→+∞. k , откуда Но это и означает, что xk xk xk ax 69. Доказать, что при a 1 и любом к>0 (к, a єR) lim k при х→+∞. x
Указание. Задавшись произвольным Е>0, найдем сперва такое Δ>0 (ΔєR),
k log a x 1 . x 2 klogax=x( 1 ê
Тогда
при
x>max(2logaE,
log a õ 1 ) >2logaE logaE. x 2
Δ)
будем
иметь:
что при х>Δ
ax log a k =xx
Следовательно, при x>max(2logaE, Δ) имеет место
ax ax неравенство: k E. А это и означает, что lim x k . x x 70. Доказать, что при a >1 и к>1 ( a ,kєR)
lim x k log a x 0 x 0
438 Указание. Задавшись произвольным ε>0 и пользуясь результатом упр. 68, найдем такое log x 1 a . Δ>1, что при всех x>Δ будет иметь место неравенство Тогда при 0<x< будет xk log
1
и потому x
1 a x
.
1 ( )k x
, т.е.
xk(-logax)<ε или |xklogax|<ε. А это и означает, что
lim( x k log a x) 0 . x 0
71. Исходя из геометрических соображений, доказать, что при 0<x< 2 неравенства sinx<x
Указание. Пусть х-радианная мера угла АОС в прямоугольном
имеют место
треугольнике АОС
). Проведем дугу окружности АВ радиуса r=ОА и ВДОА. Тогда площадь Δ АОВ < 2 площади сектора АОВ < площади Δ АОС. При этом площадь Δ (ОАС=
1
1
1
2 2 ОА·ВД= 2 r·rsinx= 2 r sinx. Так как угол в один радиан стягивается дугой, равной радиусу, а таких дуг в окружности -2π, то площадь сектора с центральным углом в 1 рад. равна
АОВ=
r 2 2
1
1 2 1 2 r , а площадь сектора с центральным углом в х рад. равна r x . Наконец, площадь Δ 2 2 1
1
ОАС= 2 ·ОА·АС= 2 r·rtgx= 2 r2tgx.
1
1 2
1 2
Следовательно, 2 r sinx < 2 r x< 2 r2tgx, откуда sinx<x
sin x 1 (хєR). x x 0
lim 72. Доказать, что
439
Указание. Считая сперва, что 0<x<
1
1
sin x
cos x
, sin x откуда
x
sin x
1
2 и используя результат упражнения 71), имеем:
cos x
и
sin x
0 1
x
1 cos x
0 1
è
sin x
x
2 sin
x
sin x
sin x
Если
0 1
хє(-
sin x x
sin x
2
то
x
x 2
x , т.е.
(0<x< 2 ).
x
,0),
2 sin
x
.
2
Пользуясь снова результатом упражнения 71), получим: 0 1 окончательно 0 1
2 x
sin( | x |) |x|
x
sin | x |
,
где
|x|
|х|є(0,
2 )
и
потому
| x | . Поэтому для всех х≠0 и удовлетворяющих неравенству |x|< 2
написать: 0 1
sin x x
можем
sin x 1. x x 0
| x | . А это и означает, что lim
Замечание. Доказанное предельное соотношение часто называют первым замечательным пределом. 73. Доказать, что для любого φ≠0 (φєR)
lim(cos n
2
Указание.
sin 2 cos 2 2 cos 2 n cos
cos
2
2
cos
2
cos
2
cos
cos
22
sin
2
2
2
... cos
2 cos
2 cos
2
2
... cos 2
2
2n
... cos 2
3
sin
2
2
sin
) n
2 cos
8
sin
2n
2 sin
4
sin
23 cos
2 2 cos
4
2
cos
при
2n
sin n
(*)
2n
получим предельное соотношение (*).
1 x lim( 1 ) e. 74. Доказать, что x x
sin
2
2
2
cos
cos
2
3
любом
2
sin
2
sin
23
4
... nєN.
Отсюда
2n sin
2n
. Переходя к пределу при n→∞,
440
1 n lim( 1 ) e (см. 2.191 и Указание. Зададимся произвольным ε>0. Учитывая, что n n 1
упр. 15 к главе 3), можем заключить, что lim(1 n ) n
n 1
1 1 lim[(1 ) n (1 )] e и n n n
1 n1 ) 1 n n 1 lim(1 ) lim e. Поэтому найдется такой номер nε, что при всех n>nε 1 n 1 1 n 1 1 n1 1 n ) e | . Пусть x>nε+1. будут выполняться неравенства: | (1 ) e | è | (1 n n 1 (1
Обозначив через n наибольшее целое, не превосходящее х, будем иметь: nε+1≤n≤x
1 1 1 1 n 1 1 , (1 ) (1 ) x (1 ) n1 n 1 x n n 1 x n 1 n 1 1 e (1 ) (1 ) x (1 ) n1 e . Итак, при x>nε+1 будем n 1 x n 1 x 1 | (1 ) x e | , откуда и следует, что lim(1 x ) e . x x
следует,
что
и иметь:
1 x lim( 1 ) e . В самом деле, не ограничивая Замечание. Теперь легко доказать, что x x общности, можно считать, что х принимает только отрицательные значения, меньшие, чем -1. При этом
1 1 |x| | x | 1 |x| | x | |x| 1 |x| 1 |x|1 (1 ) x (1 ) ( ) ( ) (1 ) (1 ) x x | x| | x| | x | 1 | x | 1 | x | 1
1 ) e. Задавшись произвольным ε>0, найдем такое Δ>0, что при |x|>Δ | x | 1 |x| 1 |x| | (1 ) e | . | x | 1 1 x Тогда при x<-Δ (при этом |x|>Δ) | (1 ) e | , что и доказывает предельное сотношение x 1 1 lim(1 ) x e . Все доказаное позволяет утверждать, что lim(1 ) x e . Это предельное x x x x x(1
сотношение, заменяя переменную х на
1
, можно записать в виде
e lim(1 )
0
1
(*)
Предельное соотношение (*) часто называют вторым замечательным пределом. 75. Доказать непрерывность показательной функции expa:R→R (expa(x)= à , 0 a 1 ). Указание. Согласно 2.158 и 2.160, показательная функция является строго возрастающей функцией при a 1 и строго убывающей функцией при 0 a 1 , причем множеством значений показательной функции является промежуток (0, +∞). Поэтому непрерывность показательной функции следует из теоремы 3.162. x
441 Замечание. Непрерывность показательной функции expa:R→R можно доказать также следующим образом. Согласно упражнению 1 к главе 3, при
a что предоставляется читателю, что и lim x 0 à докажем, что xlim x0
x
x
1 n
a 0 lim a 1 . Легко доказать, n
1 . Заметив это, возьмем любую точку х0єR и
à x0 . Зададимся произвольным ε>0 и найдем (учитывая, что lim a x 1 ) x 0
такое δ>0, что при всех х таких, что |x|<δ будет выполняться неравенство
| a x 1 |
при всех х, удовлетворяющих неравенству |x-x0|<δ, будем иметь:
a x0
. Тогда
| a x a x0 || a x0 (a x x0 1) | a x0 | a x x0 1 | .
à Это и доказывает, что xlim x0
x
à x0 . На основании теоремы 3.150, заключаем, что
показательная функция непрерывна в точке х 0. Поскольку х0-любая точка из R, то функция expa непрерывна на R. Заметим еще, что логарифмическая функция loga:R+→R (0< a ≠1), определенная на промежутке (0,+∞) и имеющая множеством значений множество R= =(-∞,+∞), является, как и функция expa, строго монотонной (см. 2.164). Поэтому, на основании 3.162, функция loga также непрерывна на R+=(0,+∞). 76. Доказать непрерывность функции sin:R→R.
Указание. В упражнении 71 было установлено, что sinx<x при 0<x<
при всех хє(-
2
,
2
) |sinx|≤|x|. А поскольку при |x|≥
2 . Отсюда следует, что
2
|sinx|≤1<
2 ≤|x|, то неравенство |sinx|≤|x|
sin x верно при всех хєR. Заметив это, возьмем любую точку х 0єR и докажем, что xlim x0 Имеем
|sinx-sinx0|= | 2 sin
x x0 x x0 | x x0 | cos | 2 | x x0 |, т.е. 2 2 2
sin x0 . |sinx-
sinx0|≤|x-x0|, откуда и вытекает непрерывность функции sin:R→R в любой точке х0єR.
Замечание. Так как при любом хєR cosx=sin( 2 -x), то функция cos:RR непрерывна на R, как суперпозиция двух непрерывных функций. Обозначим через А множество всех тех точек хєR, в которых функция cos обращается в 0:
А={хєR: х=(2к+1) 2 , кєZ}. Тогда, на основании 3.151, можем утверждать, что функция tg:R\АR непрерывна во всех точках множества R\А (как частное двух непрерывных функций). Обозначив В={хєR: х=кπ, кєZ}, аналогично предыдущему заключаем, что функция ctg:R\ВR непрерывна во всех точках множества R\В. 77. Степенной функцией с показателем степени μ>0 (μєR) будем называть функцию fμ: [0,+∞)R, для которой fμ(x)=хμ при любом хє[0,+∞). Определение степенной функции с показателем степени μ<0 отличается от предыдущего лишь тем, что в область определения функции не включается число 0. Доказать непрерывность степенной функции при любом показателе степени μ≠0. Указание. При х>0 хμ=еμlnx ; поэтому при любом μ≠0 степенная функция непрерывна на (0,+∞) как суперпозиция двух непрерывных функций (одна функция-μln, вторая-показательная функция с
442
x 0 0. Но из упр. 67 следует, основанием е). Остается доказать, что в случае μ>0 lim x 0 что при х+0 μlnx-∞, а из упр. 66 следует, что при х-∞ ех0. Следовательно, lim x xlim e ln x 0, ч.т.д. x 0 0 e ln x1 e ln x2 , т.е. x1 x2 . При х1=0 x1 0, , тогда как x2 0, т.е. и в этом случае x1 x2 . Следовательно, при μ>0 Замечание. Если μ>0 и 0<x1<x2, то lnx1
степенная функция является строго возрастающей функцией. Аналогично доказывается, что при μ<0 степенная функция является строго убывающей функцией. Заметим еще, что множество значений степенной функции совпадает с ее областью определения. В самом деле, любое число 1
у>0 принадлежит множеству значений степенной функции, ибо x= y
принадлежит области
1
определения этой функции и хμ=(
μ
y ) =y.
78. Доказать непрерывность обратных тригонометрических функций arcsin:[-1,1]R, arccos:[1,1]R, arctg:R R.
Указание. Как отмечено в 2.166, сужение функции sin:RR на отрезок [- 2 , 2 ] является строго возрастающей функцией и имеет множеством своих значений отрезок [-1,1] (эти факты устанавливаются из геометрических сображений). Обратная к ней функция arcsin определена на отрезке [-1,1], имеет множеством своих значений
отрезок [- 2 , 2 ] и также является строго возрастающей функцией. Следовательно (3.162), функция arcsin является непрерывной функцией на отрезке [-1,1]. Аналогично доказывается непрерывность функции arccos (имеющей множеством своих значений отрезок [0,π]) и
непрерывность функции arctg (имеющей множеством своих значений интервал (- 2 , 2 )). 79. Обозначим через R- множество, содержащее число 0 и все отрицательные действительные числа (и не содержащее никаких других чисел). Доказать, что функция arg:С\{0}R, определенная в 2.172, является непрерывной в любой точке множества С\R-. Указание. Согласно доказанному в 2.172, для любого zєС\R- argz= 2arctg
y , где x=Rez, | z | x
y=Jmz (см. 2.194). Так как |Rez1-Rez2|≤ ≤|z1-z2|, |Jmz1-Jmz2|≤|z1-z2|, и ||z1|-|z2||≤|z1-z2| (см. 2.181), то функции из С в R, которые при любом zєС равны соответственно Rez, Jmz, |z|–равномерно непрерывны на С. Поэтому функция φ:С\R-R, для которой при любом zєС\R- φ(z)=
Jmz , | z | Re z
является непрерывной функцией в каждой точке открытого множества С\R- (см. 3.151), так как в каждой точке этого множества |z|+Rez≠0 (строгое доказательство того факта, что множество С\R-является открытым множеством в С, предоставляется читателю). Пусть z0єC\R-. Обозначим
u0
Jmz0 (u єR). Зададимся произвольным ε>0 и (пользуясь непрерывностью функции | z0 | Re z0 0
arctg:RR) найдем такое δε>0, что при всех uєR, удовлетворяющих неравенству будет выполняться неравенство |arctgu-arctgu0|<
|u-u0|<δε,
. Далее, найдем Δ0>0 так, чтобы при всех zєС, 2
443 удовлетворяющих неравенству |z-z0|<Δ0, было: zєC\R-. Пользуясь непрерывностью функции φ в точке z0, найдем такое Δε, что 0<Δε<Δ0 и при всех zєС, удовлетворяющих неравенству |z-z0|<Δε, выполняется неравенство |φ(z)-φ(z0)|<δε. Тогда при |z-z0|<Δε будем иметь: |argz-argz0|=|2arctg φ(z)2arctg φ(z0)|=2|arctg φ(z)-arctg φ(z0)|<ε. Это и доказывает непрерывность функции arg в любой точке множества С\R-. Замечание. Из доказанной непрерывности функции arg на множестве С\R- следует непрерывность на этом же множестве функции Ln (см. 2.203): Lnz=ln|z|+iargz. В самом деле, функция ln|…| непрерывна на указанном множестве как суперпозиция двух непрерывных функций. 80. Доказать непрерывность функции exp:СС в любой точке множества С (expz=ez=eRez(cos(Jmz)+isin(Jmz)), см. 2.193, 2.194, 2.198) . Указание. Функция eRez (мы допускаем вольность речи ради краткости) непрерывна на С как суперпозиция двух непрерывных функций. По той же причине непрерывны функции cos(Jmz) и sin(Jmz). Функции eRezcos(Jmz) и eRezisin(Jmz) непрерывны как произведения двух непрерывных функций (см. 3.151). Функция exp непрерывна как сумма двух непрерывных функций. Замечание. Из доказанной непрерывности функции exp:СС следует непрерывность тригонометрических функций cos:СС и sin:CС, ибо при любом zєС
cos z
e zi e zi e zi e zi , sin z (см. 2.199). Функция 2 2i
tg (tgz=
sin z ) определена и cos z
непрерывна (согласно 3.151) во всех точках множества С, за исключением точек вида z=(2k+1)
2
(kєZ), в которых функция cos:СС обращается в 0 (см. 2.199). Легко видеть, что при действительных значениях z тригонометрические функции комплексной переменной, определенные в 2.199, превращаются в обычные тригонометрические функции действительной переменной.
e z e z e z e z , chz , то гиперболические синус и косинус Так как (2.199) shz 2 2 являются непрерывными функциями на множестве С, а функция гиперболический тангенс
(thz
shz ) определена и непрерывна во всех точках множества С, за исключением точек вида chz
z=(2k+1)
2
i (kєZ), в которых функция ch:СС обращается в 0 (2.199).
Далее, при любом положительном a єR ( a 1 ) показательная функция expa:СС (expaz=ezlna, см. 2.198) является непрерывной функцией на С. В 2.207 для всех zєС, за исключением чисел ±i, была определена функция Arctg (главное значение арктангенса): Arctgz=
1 1 iz Ln . Пусть Е={zєС: Rez=0 и |Jmz|≥1}. 2i 1 iz
444
В 2.208 было установлено, что при zєС\Е (и только при этих значениях z) значения функции
1 iz 1 iz (мы допускаем вольность речи) принадлежат множеству С\R-. Функция непрерывна 1 iz 1 iz на множестве С\Е, а функция Ln(согласно упражнению 79) непрерывна на множестве С\R-. Следовательно, функция Arctg непрерывна на множестве С\Е. Наконец, в 2.211 былa определенa функция Arcsin (главное значение арксинуса) для всех zєС, кроме действительных z с |z|>1:
1 Ln(iz 1 z 2 ), где при z≠1 i arg(1 z 2 ) arg(1 z 2 ) 2 i sin ]. Пусть | 1 z |[cos 2 2 Arcsinz=
1 z2
F–следующее
множество, лежащее на действительной оси: F={zєС: Jmz=0 и |Rez|≥1}. В 2.212 было установлено, что при zєС\F (и только при этих значениях z) значения функции 1-z2 (мы допускаем вольность речи) принадлежат множеству С\R-. Функция 1-z2 непрерывна на множестве С\F, а функция arg непрерывна на множестве С\R-. Следовательно, функция arg(1-z2) является непрерывной функцией на множестве С\F.
1 z является Из этого легко заключить, что и вышеуказанное значение корня непрерывной функцией на множестве С\F. Так как при этом значения непрерывной функции 2
iz 1 z 2 принадлежат множеству С\R- (см. 2.212), на котором непрерывна функция Ln, то
функция Arcsinявляется непрерывной функцией на множестве С\F. 81. Доказать, что при любом хєR
x lim(1 ) n e x n n
445 n x x
x x (1 ) n [(1 ) ] (если x<0, то это равенство справедливо при n>|x|). Так n n n x x x как при n→∞ →0, то (1 ) e (см. замечание к упр. 74), и, в силу непрерывности n n n x x x x степенной функции, [(1 ) ] e , ч.т.д. n ln(1 ) lim 1. 82. Доказать, что Указание.
0
Указание.
ln(1 )
1
1
1
ln(1 ) ln(1 ) . Так как (1 ) e при α→0 (упр. 74,
Замечание), то, в силу непрерывности логарифмической функции, 1
lim ln(1 ) ln e 1 .
0
83. Доказать, что
a 1
lim
0
ln a
(a 0).
a 1 , то доказывать нечего. Если a 1 , то обозначив a 1 , будем 0 (в силу непрерывности показательной функции expa). Так как иметь: β≠0 и lim 0 Указание. Если
a 1 ln(1 ) ln a. Следовательно (упр.82), , то ln(1 ) ln a
lim
a 1
0
ln a lim
a 1
, т.е. lim ln( 1 ) 0 0
ln a,
ч.т.д.
1 n(n a 1) ln a . , при n→∞ будем иметь: lim n n (1 ) 1 . 84. Доказать, что lim Замечание. Полагая α=
0
Указание. Если μ=0, то доказывать нечего. Если μ≠0, то обозначив (1+α)μ-1=β, будем иметь: β≠0 и β→0 при α→0 (в силу непрерывности степенной функции). Так как ln(1+α)=
(1 ) 1
(1 ) 1
0
ln(1 )
0
lim
ln(1 )
ln(1 )
ln(1 )
ln(1 )
, то
следует,
что
, откуда
и
.
85. Пусть АR, х0-предельная точка множества А и f и φ-две вещественные функции, определенные на А. Пусть также f(x)>0 при всех х, достаточно близких к х0.
446
Доказать, что если существует конечный предел
lim[ ( x) ln f ( x)] c , то
x x0
lim[ f ( x)] ( x ) e c .
x x0
Указание.
[ f ( x)] ( x ) e ( x ) ln f ( x ) .
Использовать непрерывность показательной функции.
Замечание. Если при х→х0 φ(х)lnf(x)→+∞, то ясно, что и при х→х0 φ(х)lnf(x)→-∞, то конечные
пределы
lim[ f ( x)] ( x ) 0.
x x0
lim f ( x) a 0 è
x x0
[ f ( x)] ( x ) →+∞ при х→х0, если же
(упр. 66). Если при х→х0 существуют
lim ( x) b,
то
x x0
(в
силу
непрерывности
логарифмической функции)
c lim[ ( x) ln f ( x)] lim ( x) lim(ln f ( x)) b ln a.
x x0
x x0
Следовательно,
x x0
lim[ f ( x)] ( x ) eb ln a a b . x x0
Заметим, что все доказанное в упр. 85, легко перенести на случай, когда f и φ-две последовательности действительных чисел, а тaкже на случай, когда рассматривается предел ( x) lim[ f ( x)] ( x ) . Например, если lim[ f ( x )] или предел x x
lim(1 n
xn n ) ex. n
xn 0 è n n
В
(1
lim xn x n
самом
(xn,xєR), то деле,
n
n xn
xn n x ) [(1 n ) ]xn e n n
xn ln(1
xn xn ) n
e x . n
Предполагается, конечно, что хn не принимает значения 0 (по крайней мере, для достаточно больших значений номера n). Это так и будет, если х≠0. Если же х=0, то по любому ε>0 найдется такой номер nεєN, что при всех n>nε (nєN) будет выполняться неравенство –ε<xn<ε. Считая с самого начала, что ε<1, при n>nε будем иметь:
x (1 ) n (1 n ) n (1 ) n . При этом n n n
lim(1 ) n e , n n
а
lim(1 ) n e . n n
Следовательно,
xn n x ) lim (1 n ) n e . Так как это верно при всех положительных ε<1, то на n n x n xn n x x ) lim (1 n ) n 1, т.е. lim(1 n ) 1 e . При этом мы самом деле 1 lim (1 n n n n e lim e 1. учли, что lim 0 0 e lim (1
86. Доказать, что
1 x
lim(ln x) 1. x
447 Указание.
1 x
(ln x) e
1 ln(ln x ) x
ln(ln x) 0, x ln x
e
ибо
ln x ln(ln x ) x ln x
. Так как
ln x 0 x x
(упр. 68), то и
ln x . Следовательно, ввиду непрерывности x
ln x ln(ln x ) x ln x
e 0 1. x x lim(cos sin ) n e x , где λєR и хєR. 87. Доказать, что n n n
показательной функции,
Указание.
cos
e
x x x sin 1 n , где n n n
x x x x x x x xn n(cos 1 sin ) n(2 sin cos 2 sin 2 ) 2n sin ( cos n n 2n 2n 2n 2n 2n x sin x x x 2n sin ) x( cos sin ) x. Следовательно (см. замечание к упр. 85), n x 2n 2n 2n 2n
lim(cos n
x x x sin ) n lim(1 n ) n e x . n n n n
88. Пусть Х-метрическое пространство, АX, х0єА и функция f:А→R ограничена (т.е. существует такое К>0, что при всех хєА |f(x)|0 обозначим Мf(х0, δ)=sup{уєR: у=f(x), хєА∩Nδ(х0)}, mf(х0, δ)=inf{уєR: у=f(x), хєА∩Nδ(х0)}. Ясно, что функция Mf от переменной δ является возрастающей в широком смысле (неубывающей), а функция mf от переменной δ является убывающей в широком смысле (невозрастающей). Ясно также, что если х0-изолированная точка множества А, то при достаточно малых δ>0 будут иметь место равенства: Mf(х0, δ)=f(x0) и mf(х0,δ)=f(x0). Функция Mf-mf от переменной δ определена на множестве (0,+∞) и является неубывающей вещественной функцией на этом множестве. Так как эта функция ограничена (снизу числом 0, а сверху-числом 2К), то существует (см. 3.158) конечный предел
lim[ M f ( x0 , ) m f ( x0 , )]. Этот предел называется
0
колебанием функции f в точке х0. Мы будем обозначать его ωf(x0). Доказать, что ограниченная функция f:А→R непрерывна в точке х0єА тогда и только тогда, когда ωf(x0)=0. Указание. Пусть ωf(x0)=0 и требуется доказать непрерывность функции f в точке х0. Зададимся произвольным ε>0 и найдем такое δε>0, что при всех δ, таких, что 0<δ<δε, будет выполняться неравенство Mf(х0,δ)-mf(х0,δ)<ε. Такое δε существует, ибо
lim[ M f ( x0 , ) m f ( x0 , )] f ( x0 ) 0. Убедимся, что если 0
хєА∩ N (х0), то |f(x)-f(x0)|<ε. В самом деле, выберем δ>0 так, чтобы d(x,x0)<δ<δε. Для этого числа δ Mf(х0,δ)-mf(х0,δ)<ε. С другой стороны mf(х0,δ)≤f(x)≤Mf(х0,δ) и mf(х0,δ)≤f(x0)≤Mf(х0,δ). Поэтому выполняются либо неравенства mf(х0,δ)≤f(x0)≤f(x)≤Mf(х0,δ), либо неравенства mf(х0,δ)≤f(x)≤f(x0)≤Mf(х0,δ). В обоих случаях |f(x)-f(x0)|≤ ≤Mf(х0,δ)-mf(х0,δ)<ε. Обратно, пусть f непрерывна в точке х0 и требуется доказать, что ωf(x0)=0. Зададимся произвольным ε>0 и найдем такое δ>0, что при всех хєА∩Nδ(х0) будет выполняться неравенство |f(x)-f(x0)|<ε, откуда f(x0)ε
448
f ( x0 ) lim[ M f ( x0 , ) m f ( x0 , )] 2 . 0
Так как неравенство ωf(x0)≤2ε верно для любого ε>0, то ωf(x0)=0. 89. Пусть Х-метрическое пространство, А-замкнутое множество в Х и f:A→R-любая ограниченная функция. Доказать, что при любом ε>0 множество Вε={хєА: ωf(х)≥ε}замкнуто. Указание. Убедимся, что Â =Х\Вε является открытым множеством. Пусть хєХ\Вε. Если х А, то х принадлежит открытому множеству Ас и потому хєАсХ\Вε. Если хєА, то (так как х Вε) ωf(х)<ε. Найдем такое δ>0, что Mf(х,δ)-mf(х,δ)<ε и покажем, что Nδ(x)Х\Вε. Рассмотрим любую точку уєNδ(x). Если у А, то уєХ\Вε. Пусть уєА∩Nδ(x). Так ñ
как d(у,х)<δ, то число δ1=δ-d(у,х)>0. Для любого zєА∩ N 1 ( y ) имеем: d(z,x)≤d(z,y)+d(y,x)<δ1+d(y,x)=δ. Следовательно, zєА∩Nδ(x) и потому mf(х,δ)≤f(z)≤ Mf(х,δ). Так как это верно для любого zєА∩ N 1 ( y ) , то mf(х,δ)≤mf(у,δ1)≤Mf(х,δ1)≤Mf(х,δ). Отсюда следует, что Mf(у,δ1)-mf(у,δ1)<ε и ωf(y)<ε, т.е. уєХ\Вε. Итак, для любой точки уєNδ(x) мы имеем: уєХ\Вε. Следовательно, Nδ(x)Х\Вε. Таким образом, любая точка х множества Х\Вε (как принадлежащая А, так и не принадлежащая А) является внутренней точкой множества Х\Вε. Это и означает, что множество Х\Вε является открытым множеством в Х. 90. Пусть f: [a, b] →R-строго возрастающая функция. Доказать, что для любого nєN и любых n
попарно различных точек x1, x2,…,xn из
[ a, b ]
i 1
f
( xi ) f (b) f (a).
Указание. Сперва убедимся, что в любой точке х0є (a, b) ωf(x0)=
=f(x0+0)-f(x0-0). В самом
деле, пусть δ>0 выбрано настолько малым, что (х 0-δ, х0+δ) (a, b) . Для любого хє(х0-δ, х0+δ) имеет место неравенство: f(x0-δ)
f (a) f (a 0) f (a)
и
f (b) f (b) f (b 0). Пусть теперь x1, x2,…,xn–попарно различные точки интервала (a, b) (разбор случаев, когда один или оба конца отрезка [a, b] находятся среди точек x1, x2,…,xn–предоставляется читателю). Не ограничивая общности, можно считать, что a x1 x2 ... xn b. Выберем точки y1, y2,…,yn так, чтобы a y1 x1 , x1f(y1), откуда ωf(x1)
449 n
Складывая все эти неравенства, получим:
i 1
f
( xi ) f (b) f ( y1 ) f (b) f (a).
Замечание. Если функция f: [a, b] →R-неубывающая, то, как легко видеть, имеет место n
неравенство:
i 1
f
( xi ) f (b) f (a).
Согласно доказанному в 3.161, множество точек разрыва функции f не более, чем счетно (все эти точки разрыва-первого рода). Рассмотрим случай, когда множество точек разрыва функции fсчетно. Расположив все точки разрыва в последовательность (xn) попарно различных чисел, для k
любого кєN будем иметь: f ( xn ) f (b) f (a). Отсюда следует, что ряд n 1
и его сумма не превосходит числа f (b) f (a).
n 1
f
( xn ) сходится
91. Пусть Е (a, b) -произвольное счетное множество (например, это может быть множество всех рациональных чисел интервала
(a, b) ). Расположим все точки множества Е в
последовательность (xn) попарно различных чисел. Пусть также
c
n
–произвольный сходящийся
ряд, состоящий из положительных чисел. Определим функцию f: [a, b] →R, полагая f (a) 0 и
f ( x)
c
xn x
Запись
n
для любого хє (a, b] .
c
xn x
n
означает, что суммирование распространяется на все те номера n, для которых
xn<x (если таких номеров-бесконечное множество,, то f(x) представляет собой сумму ряда). Если слева от х нет членов последовательности (xn), то f(x) считается равным 0. Доказать, что: (а) функция f является неубывающей функцией на [a, b] ; (b) f разрывна в каждой точке множества Е, причем f(xn+0)-f(xn-0)=cn (n=1,2..); (с) f непрерывна во всех остальных точках интервала (a, b) . Указание. Пусть у′, у″-любые две точки отрезка [a, b] , причем у′<у″. Если ó à, то f(у′)=0.
Так как f(у″)≥0, то f(у′)≤f(у″). Если ó b, то f ( ó) cn и потому f(у′)≤f(у″). Пусть обе точки n 1
у′ и у″ принадлежат интервалу (a, b) . Если слева от у′ нет членов последовательности (xn), то f(у′)=0 и опять f(у′)≤f(у″). Если же слева от у′ есть члены последовательности (xn), то
f ( y)
c
xn y
f ( y)
n
,а
c
xn y
n
c
xn y
n
c ,
n y xn y
так что и в этом случае
f(у′)≤f(у″). Заметим, что
равенство f(у″)=f(у′) будет иметь место в том и только в том случае, если в промежутке [у′, у″) нет членов последовательности (xn). Этим доказано, что f является неубывающей функцией на [a, b] . Рассмотрим теперь любую точку хк последовательности (xn). Убедимся, что f непрерывна в точке хк слева.
f ( xk 0) f ( xk )
c
xn xk
n
, т.е. что функция
В
самом
деле,
при
любом
lim f ( x) f ( xk 0) f ( xk ). x xk 0
(х> a )
x<хк
f(x)≤f(xk)
450 потому
и
Чтобы доказать неравенство f(хк-0)≥f(хк), рассмотрим два
случая. 1. Слева от точки хк находится конечное число членов последовательности (xn). В этом случае обозначим через xm наибольший из указанных членов. Тогда ясно, что при любом х, удовлетворяющем неравенству xm<x<xk будет f(x)=f(xk) и
lim f ( x) f ( xk 0) f ( xk ). x xk 0
2. Слева от точки хк находится бесконечное множество членов последовательности (xn). В этом случае f(xk) представляет собой сумму бесконечного ряда. Задавшись произвольным ε>0, найдем частичную сумму этого ряда, отличающуюся от f(xk) меньше, чем на ε:
ñn1 ñn2 ... ñn p f ( xk ) ,
xn1 xk , xn2 xk ,..., xn p xk .
причем
xni max( xn , xn2 ,..., xn p ). Тогда при всех х, таких, что
Пусть
xni x xk будем иметь:
f ( x) ñn1 ñn2 ... ñn p f ( xk ) и потому lim f ( x) f ( xk 0) f ( xk ) . x xk 0
Так как ε-произвольно малое положительное число, то
на самом деле f(хк-0)≥f(хк). Сравнивая это неравенство с ранее доказанным неравенством f(хк-
f ( xk 0)
0)≤f(хк), заключаем, что f(хк-0)=f(хк). Убедимся теперь, что
c
xn xk
n
f ( xk ) ñê ,
так что f(хк+0)-f(хк-0)=ck. Для
любого
х>хк
f ( x)
(х
c
xn x
n
c
xn xk
n
c
xk xn x
n
f ( xk ) ñê
и
потому
lim f ( x) f ( xk 0) f ( xk ) ck . x xk 0
Чтобы доказать неравенство f(хк+0)≤f(хк)+ск, рассмотрим ряд
c
x n xk
n
и задавшись
произвольным ε>0 найдем частичную сумму этого ряда, отличающуюся от суммы ряда меньше, чем на ε:
c
xn xk
n
cn1 cn2 ... cnm cn . xn xk
Здесь номера n1, n2,…, nm попарно различны и таковы, что Пусть
xn j min( xn1 , xn2 ,..., xnm ).
хк<х< xn j будем иметь:
f ( x)
c
xn x
xn1 xk , xn2 xk ,..., xnm xk .
При любом х, удовлетворяющем неравенству n
c
xn xk
n
c c
xk xn x
n
xn xê
n
, ибо
451
c
xn xk
n
xk xn xn j
c c
n xk xn xn j
xn xk
n
cn
c
xn xn j
n
c
n
xk xn xn j
cn1 cn2 ... cnm , откуда
(cn1 cn2 ... cnm ) .
Итак, при хк<х< xn j f(x)
N 1 ( x) 2
x
точки х множества К найдется такое δх>0, что
N x ( x) G.
(для всех хєК) образуют открытое покрытие компактного множества
К. Следовательно, существует конечное число x1, x2,…,xn точек множества К таких, что открытые
N 1 ( x1 ), N 1
шары
2
x1
2
x2
( x2 ),..., N 1 2
xn
( xn )
покрывают множество К. Пусть для любого
1 N 1 ( xi ) x R n :|| x xi || xi . Множества xi 2 2
i=1,2,…,n
N 1 ( xi ) N xi ( xi ) G
ограничены. Кроме того,
2
xi
N 1 ( xi ) замкнуты и xi 2
(i=1,2,…,n). Поэтому множество
n K N 1 ( xi ) G и является замкнутым и ограниченным, т.е. компактным. При этом i 1
2
xi
n
K N1 i 1
2
( xi ) N 1 ( xi ) K . Так как множество n
xi
i 1
подмножеством множества
2
xi
K , то
n
N i 1
1 2
( xi ) открыто и является xi
N ( x ) Int K . Итак, K IntK K G, ч.т.д. 1 xi i n
i 1
2
93. Рассмотрим множество Q всех рациональных чисел, наделенное естественной метрикой: d(r, r′)=|r-r′| для любых r, r′єQ. Пусть А-множество всех таких рациональных чисел r, что 23}. Убедимся, что множество {rєQ: r2<2} является открытым множеством в пространстве (Q,d). Пусть r–любое рациональное число из указанного множества, так что r2<2. Обозначим 2-r2=h (h>0) h и выберем δ= =min(1, ). Если r′єNδ(r) и r′≠r, то число μ=r′-r удовлетворяет 2 | r | 1 неравенству 0<|μ|<δ. Будем иметь: r′2=(r+μ)2=r2+2rμ+μ2 3}
с
452
также является открытым множеством. Седовательно А открыто, а потому множество А замкнуто в пространстве (Q,d). Ограниченность множества А следует из того, что для любого rєА |r|<2. Остается убедиться в том, что А не компактно. Допустив противное, мы, в силу теоремы 3.24, должны заключить, что А компактно в пространстве R, наделенном естественной метрикой. Множество А, рассматриваемое как подмножество пространства R, можно записать в виде: А=Q∩( 2 , 3 ). 1 1 Рассмотрим следующее семество интервалов пространства R: Gn= ( 2 , 3 ) , n=10, 11,… n n При любом n≥10 Gn( 2 , 3 ) и GnGn+1. Интервалы указанного семейства покрывают множество 1 1 А. В самом деле, пусть ), будем иметь: , 2 r 3. Взяв n>max(10, r 2 3r 1 1 2 r 3 , т.е. rєGn. С другой стороны, никакое конечное число интервалов Gn не n n покрывает множество А, ибо при любом n≥10 интервал Gn не покрывает рациональные числа, 1 1 удовлетворяющие неравенствам 2 r 2 и неравенствам: 3 r 3. Следовательно, n n допущение о компактности множества А в пространстве (Q,d)–неверно. 94. Доказать, что если А-любое некомпактное множество в R, то существует: (а) неограниченная функция, непрерывная на А; (b) ограниченная функция, непрерывная на А, но не имеющая наибольшего значения на множестве А. (с) при дополнительном условии, что А-ограничено (но не замкнуто), существует непрерывная на А функция, не являющаяся равномерно непрерывной. Указание. Рассмотрим сперва случай, когда множество А ограничено, но не замкнуто, так что существует предельная точка х0 множества А, не принадлежащая А. Пусть f:А→R определена 1 равенством f(x)= . Ясно, что f–неограниченная функция на А, ибо в А имеются точки, сколь õ õ0 угодно близкие к х0. Тем не менее, f непрерывна на А (см. 3.151). Убедимся, что она не является равномерно непрерывной. Допуская противное, возьмем ε=1 и найдем такое δ>0, что из х1єА, х2єА, |x2-x1|<δ следует |f(x2) f(x1)|<1. Зафиксируем х1єА такое, что |x1-x0|< . Тогда при любом х2єА, удовлетворяющим 2
, будем иметь (так как |x2-x1|=|x2-x0+x0-x1|≤|x2-x0|+|x1-x0|<δ): 2 |f(x2)-f(x1)|<1. 1 1 1 1 1 1 | , причем выражение Но |f(x2)-f(x1)|= | õ2 õ0 õ1 õ0 | õ2 õ0 | | õ1 õ0 | | õ2 õ0 | | õ1 õ0 | становится сколь угодно большим положительным числом при значениях х 2 достаточно близких к х0. Полученное противоречие доказывает, что допущение о равномерной непрерывности функции f на множестве А-неверно. Итак, доказано (с) и доказано (а) для ограниченного некомпактного множества А. Если множество А неограничено, то тождественное отображение φ:А→R, для которого φ(х)=х при любом хєА, является неограниченной функцией, непрерывной на А. Остается доказать (b). Если А-ограниченное некомпактное множество и х 0-предельная точка множества А, не 1 , непрерывна и принадлежащая А, то функция g:А→R, заданная равенством g(x)= 1 ( õ õ0 ) 2 ограничена на множестве А. Вместе с тем, функция g не имеет наибольшего значения на неравенству |x2-x0|<
sup g ( x) 1, но при всех хєА g(x)<1.
множестве А, ибо x A
453 Если А-неограниченное множество в R, то функция ψ:А→R, заданная равенством x2 ψ(х)= , непрерывна и ограничена на множестве А. Однако, функция ψ не имеет наибольшего 1 õ2
sup ( x) 1 ( ( x)
значения на множестве А, ибо x A
1 1 1 2 x
ïðè x 0) , но при всех хєА
ψ(х)<1. Замечание. По поводу свойства (с) заметим, что нельзя снять условие ограниченности множества АR и утверждать, что для любого некомпактного множества А существует непрерывная на А функция, не являющаяся равномерно непрерывной. Другими словами, найдется такое некомпактное множество А (оно обязательно будет неограниченным), что любая непрерывная на А функция будет и равномерно непрерывной. Например, если А=Z, то любая вещественная функция, заданная на А, будет равномерно непрерывной (чтобы убедиться в этом, нужно для любого ε>0 взять δε<1 в определении равномерной непрерывности). 95. Согласно 3.46, непрерывное биективное отображение f компактного топологического пространства Х на топологическое пространство Y есть гомеоморфизм, т.е. обратное отображение f-1:Y→Х также непрерывно. Нижеследующий пример показывает ( см. У. Рудин «Основы математического анализа»), что в случае некомпактного пространства Х утверждение теоремы 3.46 может оказаться неверным. Пусть Х-полуинтервал [0,2π)R, рассматриваемый как самостоятельное метрическое пространство, а Y–единичная окружность в пространстве R2 с центром в точке θ=(0,0), также рассматриваемая как самостоятельное метрическое пространство. Расмотрим отображение f:Х→Y, задаваемое равенством f(t)=(cos t, sin t) для любого tє[0,2π). Отображение f непрерывно, так как функции cos и sin суть непрерывные функции на R. Из геометрических сображений ясно, что fбиективное отображение Х на Y. Тем не менее, обратное отображение f-1 претерпевает разрыв в точке z0=f(0)=(1,0). В самом деле, f-1(z0)=0, но в любой близости от точки z0 на окружности Y имеются точки z, для которых f-1(z) сколь угодно близко к 2π. Заметим, что если рассмотреть отображение f компактного пространства [0,2π] на окружность Y, задаваемое равенством f (t)=(cost, sint), то f окажется непрерывным и сюръективным, но не инъективным отображением, для которого обратного отображения не существует. 96. Пусть f–вещественная равномерно непрерывная функция на ограниченном множестве АR. Доказать, что f ограничена на множестве А. Указание. Допустив противное, найдем последовательность (xn) попарно различных точек множества А, такую, что |f(xn)|→+∞. Согласно 3.122, последовательность (xn) содержит подпоследовательность, сходящуюся к некоторому хєR. Для упрощения записей ( и не x. Установим, что последовательность ограничивая общности) будем считать, что xn n (f(xn)) фундаментальна. С этой целью зададимся произвольным ε>0 и (пользуясь равномерной непрерывностью f) найдем такое δε>0, что из х′єА, х″єА и |х′-х″|<δε следует |f(х′)-f(х″)|<ε. Затем по числу
1 1 найдем такое nεєN, что при всех n>nε выполняется неравенство |xn-x|< . Тогда при 2 2
любых n>nε и m>nε (n,mєN) будем иметь: |xn-xm|= =|xn-x+x-xm|≤|xn-x|+|xm-x|<δε и потому |f(xn)f(xm)|<ε. Это и доказывает фундаментaльность последовательности (f(xn)). Так как R–полное метрическое пространство, то последовательность (f(xn)) сходится к конечному пределу, что
lim | f ( x ) |
n вступает в противоречие с ранее установленным предельным соотношением n . Полученное противоречие доказывает, что на самом деле функция fограничена на множестве А. 97. Пусть множество АR-замкнуто и функция f:А→R непрерывна на А. Доказать, что существует непрерывное продолжение функции f с множества А на R, т.е. что существует такая непрерывная на R вещественная функция f , что f ( x) f ( x) для всех хєА.
454
с
Указание. Согласно 3.101, открытое множество А является объединением не более чем счетного множества попарно непрересекающихся интервалов-компонент связности множества Ас. Определим функцию f :R→R следующим образом. Если хєА, то полагаем f ( x) f ( x) . Если хєАс, то х принадлежит одному и только одному интервалу, являющемуся компонентой связности множества Ас. Если этот интервал имеет вид (b,+∞), то точка b принадлежит множеству А и мы полагаем f ( x) f (b). Таким образом, во всех точках бесконечного интервала (b,+∞) функция f принимает одно и то же значение, равное f(b). Если интервал, которому принадлежит точка х, имеет вид (-∞, a ) то a єА и мы полагаем f ( x) f (a). Если х принадлежит конечному интервалу (a, b) –компоненте связности множества Ас, то точки a è b принадлежат множеству А и мы
ka m f (a) f (a) полагаем f ( x) kx m, где k и m определяются из условий kb m f (b) f (b) .
Убедимся в непрерывности функции f в точках множества А (ее непрерывность в точках множества Ас очевидна). Пусть х0-любая точка множества А. Докажем непрерывность функции f в точке х0 справа (непрерывность слева доказывается аналогично). Зададимся произвольным ε>0 и
найдем такое δε>0, что из хєА, x>x0, x-x0<δε следует |f(x)-f(x0)|< . Выберем в интервале (x0, x0+δε) 3 точку х1єА (если таких точек нет, то х0 является левым концом интервала-компоненты связности множества Ас и непрерывность функции f в точке х0 справа следует из ее определения в точках множества Ас и в точках множества А). Обозначим х 1-х0=δ′ε. Если х удовлетворяет неравенствам х0<x<δ′ε+x0 и хєА, то |f(x)-f(x0)|< или, что то же | f ( x) f ( x0 ) | . Если же хєАс, то найдутся 3 3 такие точки a, b єА, что x0 a x b ≤х1 и (a, b) Ас. Из определния функции f на интервале
(a, b) следует (это предлагается проверить f ( x) f (a) ( x)[ f (b) f (a)], где 0≤μ(х)≤1. f ( x) f ( x0 ) f (a) f ( x0 ) ( x)[ f (b) f ( x0 ) f ( x0 ) f (a)] и | f ( x) f ( x0 ) | 2 | f (a) f ( x0 ) | | f (b) f ( x0 ) | , ч.т.д.
читателю),
что
Поэтому
98. Декартово произведение множеств Rn и Rm (n,mєN) можно отождествить с множеством Rn+m: RnxRm=Rn+m (см. 3.38). А именно, если х=(x1, x2,…,xn)єRn и y=(y1,…,ym)єRm, то пару (х,у)єRnxRm можно отождествить с элементом (x1,…,xn, y1,…,ym) множества Rn+m. Будем рассматривать Rn, Rm и Rn+m как линейные нормированные пространства (норма в которых определена в упражнении 34 к главе 2). Тогда норма элемента z=(х,у)єRnxRm выражается равенством:
|| z || ( x1 ) 2 .. ( x n ) 2 ( y1 ) 2 ... ( y m ) 2 || x || 2 || y || 2 , где
|| x || ( x1 ) 2 .. ( x n ) 2 есть норма элемента х в пространстве Rn, а || y || ( y1 ) 2 ... ( y m ) 2 есть норма элемента у в пространстве Rm. Всякое нормированное линейное пространство можно рассматривать как метрическое пространство, в котором расстояние между любыми двумя элементами u1 и u2 равно ||u1-u2|| (см. 3.62). Если x1,x2єRn, а y1,y2єRm, где x1 ( x11 , x12 ,..., x1n ), x2 ( x12 , x22 ,..., x2n ), y1 ( y11 , y12 ,..., y1m ), y2 ( y12 , y22 ,..., y2m ), то d(x1,x2)=||x1-x2||= ( x11 x12 ) 2 ... ( x1n x2n ) 2 и ρ(y1,y2)=||y1-y2||= ( y11 y12 ) 2 ... ( y1m y 2m ) 2 . Здесь через d мы обозначили расстояние в Rn, а через ρ-расстояние в Rm. При этом, если z1=(x1,y1)єRnxRm и z2=(x2,y2)єRnxRm, то расстояние μ(z1,z2) между элементами z1 и z2 (как элементами пространства Rn+m) равно: μ(z1,z2)=||z1-z2||=
( x11 x12 ) 2 ... ( x1n x2n ) 2 ( y11 y12 ) 2 ... ( y1m y2m ) 2 (d ( x1 , x2 )) 2 ( ( y1 , y2 )) 2 . Пусть теперь Х и Y-любые метрические пространства с метриками d и ρ сответственно. Образуем
455 декартово произведение Z=ХxY. Для любых двух элементов z1=(x1,y1)єZ и z2=(x2,y2)єZ (x1,x2єХ, y1,y2єY) положим: μ(z1,z2)= (d ( x1 , x2 )) 2 ( ( y1 , y2 )) 2 (*) Доказать, что μ-метрика в множестве Z=ХxY. Указание. Остановимся на выполнении неравенства треугольника (остальным условиям, налагаемым на метрику, функция μ, очевидно, удовлетворяет). Пусть z1=(x1,y1), z2=(x2,y2) и z3=(x3,y3) любые три точки декартова произведения Z=ХxY и требуется доказать, что μ(z1,z3)≤μ(z1,z2)+ +μ(z2,z3) или
(d ( x1 , x3 )) 2 ( ( y1 , y3 )) 2 (d ( x1 , x2 )) 2 ( ( y1 , y 2 )) 2 (d ( x2 , x3 )) 2 ( ( y 2 , y3 )) 2 . Так
как
d(x1,x3)≤d(x1,x2)+d(x2,x3) и ρ(y1,y3)≤ρ(y1,y2)+ρ(y2,y3), то, обозначив d(x1,x2)= a1 , d(x2,x3)= a 2 , ρ(y1,y2)= b1 ,
ρ(y2,y3)= b2 ,
достаточно
проверить
(a1 a2 ) 2 (b1 b2 ) 2 a12 b12 a22 b22 .
Это
справедливость
неравенство
неравенства
равносильно
такому
2(a1a2 b1b2 ) 2 a12 b12 a22 b22 , которое сводится к неравенству Шварца. Замечание. Если (Х,d) и (Y,ρ)-метрические пространства, то декартово произведение Z=ХxY, наделенное метрикой μ,-будем называть произведением метрических пространств (Х,d) и (Y,ρ). 99. Пусть Х и Y–метрические пространства с метриками d и ρ соответственно и множество АХ компактно. Доказать, что отображение f:А→Y непрерывно на А тогда и только тогда, когда график Gf отображения f (т.е. множество всех пар (x,f(x)), где хєА) является компактным множеством в метрическом пространстве (Z,μ) –произведении метрических пространств (Х,d) и (Y,ρ). Указание. Пусть f непрерывно на А. Чтобы доказать компактность Gf в метрическом пространстве Z, воспользуемся теоремой 3.123. Расмотрим любую последовательность (zn) элементов множества GfZ: zn=(xn, f(xn)), где хnєА. Так как А-компактно в Х, то последовательность (xn) содержит подпоследовательность ( x nk ), сходящуюся к некоторому
xn элементу хєА: lim k k (zn) сходится
x.
Убедимся, что подпоследовательность ( z nk ) последовательности
к
элементу
z=(x,f(x))єGf.
( zn , z ) (d ( xn , x)) 2 ( ( f ( xn ), f ( x))) 2 , причем k
k
lim xnk x ) k
и
k
( f ( xn ), f ( x)) 0, k
хєА. Следовательно,
k
( zn , z ) k 0, k
В
самом
деле,
d ( xnk , x) 0 k
(ибо
ввиду непрерывности отображения f в точке
zn т.е. lim k k
z.
Это и доказывает компактность
множества Gf в Z. Обратно, пусть множество Gf компактно в метрическом пространстве (Z,μ). Чтобы доказать непрерывность отображения f на А, допустим противное. Тогда существуют точка хєА (в которой f претерпевает разрыв), число ε>0 и последовательность (xn) точек из А, такие, что xn→х (то есть d(xn,х)→0), но ρ(f(xn), f(x)≥ε для любого nєN. Рассмотрим следующую последовательность (zn) точек множества Gf: zn=(xn, f(xn)). Ввиду компактности множества Gf, существует подпоследовательность элементу z Но тогда
( z nk )
последовательности
(zn),
сходящаяся
к
некоторому
( x , f ( x )) G f : ( znk , z ) (d ( xnk , x )) 2 ( ( f ( xnk ), f ( x )))2 k 0.
d ( xnk , x ) 0 и ( f ( xnk ), f ( x )) 0 , 0. Так как d ( xn , x) k n k
0. Поскольку последовательность ( xnk ) не может иметь более одного то и d ( xnk , x) k
0. Но это противоречит ранее установленному предела, то x =x и ( f ( xnk ), f ( x)) k неравенству ρ(f(xn),f(x))≥ε (при всех nєN). Полученное противоречие доказывает, что на самом деле отображение f непрерывно на А.
456 100. Пусть f:R→R непрерывно и является открытым отображением (т.е. переводит открытые множества пространства R в открытые же множества). Доказать, что f строго монотонно, т.е. является либо строго возрастающим, либо строго убывающим отображением. Указание. Установим сперва, что отображение f инъективно. Пусть a и b –любые две различные точки из R и пусть, например, a < b . Чтобы доказать, что f (a) f (b), допустим противное:
f (a) f (b) . Функция f отлична от постоянной на отрезке [a, b] , ибо в противном случае f( (a, b)) ={μ},
что противоречит условию о том, что f-открытое отображение. Будучи непрерывной, функция f достигает на [a, b] своего наименьшего m и наибольшего М значений на этом отрезке. По крайней мере одного из этих значений f достигает в некоторой точке интервала (a, b) . Пусть, например, f(x0)=m, где х0є (a, b) . Так как f( (a, b) )–открытое множество, содержащее точку m, то найдется такое δ>0, что
m
(m-δ, m+δ)f( (a, b) ). Получается, что точка
f ((a, b)), что абсурдно, так как m есть наименьшее значение функции f на отрезке 2 [a, b] . Полученное противоречие доказывает, что при a b ( a, b -любые точки из R) и f (a) f (b). Убедимся в строгой монотонности отображения f. Пусть, например, для какихлибо двух точек a, b R таких, что a b оказывается, что f (a) f (b). Докажем, что в этом случае f–строго возрастающая функция на R. Остановимся подробно на доказательстве возрастания функции f в промежутке (-∞, a ], ибо возрастание f в промежутках [a, b] и
[b,) доказывается аналогично. Итак, пусть x1 x2 a и требуется доказать, что f ( x1 ) f ( x2 ) f (a). Если бы оказалось, что f ( x2 ) f (a), то (так как и f (b) f (a) ) наименьшее значение функции f на отрезке [ x2 , b] достигалось бы внутри интервала ( x2 , b). А это, как показано выше, противоречит открытости отображения f. Значит, f ( x2 ) f (a). Точно так же мы должны заключить, что, f(x1)0 и (пользуясь непрерывностью функции f в точке х0) найдем такое δ>0, что f(Nδ(x0))Nε(y0) (*) Так как х0 является точкой прикосновения множества А, то множествo А∩Nδ(x0)≠. Пусть õ єА∩Nδ(x0). Тогда из (*) следует, что f( õ )єNε(y0), т.е. Nε(y0)∩f(A)≠. Это и доказывает, что у0 является точкой прикосновения множества f(А). 102. Пусть Х и Y–метрические пространства, множество А всюду плотно в Х и отображения f:Х→Y и g:X→Y непрервны . Доказать, что если f(x)=g(x) при всех хєА, то f=g, т.е. значения отображений f и g совпадают во всех точках множества Х. Указание. Пусть õ0 À (х0єХ) и требуется доказать, что f(x0)=g(x0). Допуская противное, обозначим ρ(f(x0), g(x0))=ε>0 (ρ-метрика в Y). Так как f непрерывно в точке х0, то найдется такое
~ ~ δε>0, что f ( N ( x0 ) N ( f ( x0 )), где через N ( f ( x0 )) мы обозначили открытый шар в 2
457
2
. Аналогично, найдется такое δ >0, что ε 2 ~ g ( N ( x0 )) N ( g ( x0 )). Пусть δε=min( , ). Так как õ0 À , то шар N ( x0 ) содержит
пространстве Y с центром в точке f(x0) и с радиусом
2
точку хєА. Тогда
~ f ( x) N ( f ( x0 )) и
~ g ( x) N ( g ( x0 )) . Поскольку f(x)=g(x)=y, то
2
ρ(y,f(x0))<
2
и ρ(y,g(x0))< , откуда ρ(f(x0), g(x0))<ε, что противоречит определению числа ε. 2 2
Полученное противоречие доказывает, что отображения f и g совпадают всюду на Х. 103. Пусть Х-метрическое пространство и множество АХ всюду плотно в Х. Пусть также отображение f:A→R равномерно непрерывно. Доказать, что f имеет непрерывное продолжение с А на Х (т.е. что существует такое непрерывное отображение g:X→R, для которого g(x)=f(x) при всех хєА). Указание. Для любого хєХ и любого nєN обозначим Vn(x)=А∩ N 1 ( x) . Множества Vn(x) не n
пусты, так как
A =Х. Рассмотрим
следующие
Fn(x)= f (Vn ( x)) , n=1,2,3,… Очевидно, что V1(x)V2(x)…Vn(x)…,
непустые замкнутые множества в R: откуда
f(V1(x))f(V2(x))…f(Vn(x))…и
0. F1(x)F2(x)…Fn(x)…Убедимся, что diam f (Vn ( x)) n Зададимся произвольным ε>0 и найдем (пользуясь равномерной непрерывностью функции f на А) такое δε>0, что из х1,х2єА и d(х1,х2)<δε следует |f(x1)-f(x2)|<ε. Подберем nεєN так, чтобы
2 . n
Взяв n>nε, рассмотрим любые две точки α1 и α2 из множества f(Vn(x)). Так как α1=f(x1), α2=f(x2), где
2 2 , то |α1-α2|=|f(x1)-f(x2)|<ε. n n 0. Так как Следовательно, при n>nε diam f(Vn(x))≤ε, а это и означает, что diam f (Vn ( x)) n х1,х2єVn(x)
и
так
как
d(x1,x2)≤d(x1,x)+d(x,x2)<
диаметр множества в метрическом пространстве совпадает с диаметром его замыкания, то и
diam Fn ( x) 0. n Учитывая, что R–полное метрическое пространство (см. 3.137), на основании теоремы 3.141
заключаем, что пересечение
F ( x) непусто n
и состоит ровно из одной точки. Положим
n 1
g ( x) Fn ( x) и установим, что так определенная функция g:X→R является непрерывным n 1
продолжением функции f с А на Х. Если хєА, то хєVn(x) f(x)єf(Vn(x))Fn(x) при любом nєN. Следовательно, f ( x)
при любом nєN, а потому
F ( x) , т.е. f(x)=g(x). n
n 1
Остается убедиться в непрерывности функции g на Х. Зададимся произвольным ε>0 и найдем такое δ>0, что из х′, х″єА и d(х′, х″)<δ следует |f(х′)-f(х″)|<
. Пусть х и y–любые две точки из Х, 3
удовлетворяющие условию d(x,y)<δ. Установим, что |g(x)-g(y)|<ε, чем и будет доказана равномерная непрерывность функции g на Х. С этой целью подберем и зафиксируем nєN такое, что
n
2 . Так как g(x)єFn(x)= f (Vn ( x)) , то в интервале d ( x, y )
найдется точка множества f(Vn(x)),
| g ( x) f ( z ) |
3
( g ( x)
458
, g ( x) ) 3 3 1 т.е. найдется точка zєА, такая, что d(z,x)< и n
.
Аналогично, найдется точка z′єА, такая, что d(z′,у)<
1 и | g ( y ) f ( z ) | . Будем иметь: n 3
2 +d(x,y)<δ, откуда | f ( z ) f ( z ) | . Следовательно, |g(x)n 3 2 g(y)|=|g(x)-f(z)+f(z)-f(z′)+ +f(z′)-g(y)|≤ +|f(z)-f(z′)|<ε, ч.т.д. 3 d(z,z′)≤d(z,x)+d(x,y)+d(y,z′)<
Замечание. На основании доказанного в упражнении 102, можем утверждать, что непрерывное продолжение равномерно непрерывной функции с плотного в Х множества А на Х-единственно. Кроме того, результат упражнения 103 не изменится, если пространство R заменить любым полным метрическим пространством или любым компактным метрическим пространством (ибо замкнутые множества в компаткном пространстве-компактны).
459 Глава 4. Дифференцирование функций одной действительной или комплексной переменной. Производная вещественной функции одной вещественной переменной. В этом разделе мы будем расматривать вещественные функции, областью определения каждой из которых является конечный или бесконечный промежуток (см. 3.95). 4.1 Определение. Пусть f-вещественная функция, определенная на промежутке АR. Фиксируя любое число хєА, рассмотрим функцию φ х, определенную на множестве А\{х} равенством:
f (t ) f ( x) . tx x (t ) , то функция f называется Если существует конечный предел lim t x φх(t)=
дифференцируемой в точке х, а указанный предел называется производной функции f в
f (t ) f ( x) . tx x
точке х и обозначается f′(x): f ( x) lim t
Замечание. Таким образом с функцией f связана функция f′, область определения которой-множество Е всех точек хєА, в которых существует конечный предел
lim (t ) f ( x) . Говорят, что f дифференцируема на множестве ЕА. Часто t x x
величину t-x называют приращением аргумента в точке х и обозначают символом Δх. Тогда t=х+Δх и определение производной принимает вид:
f ( x x) f ( x) . x x 0
f ( x) lim
При этом разность f(х+Δх)-f(x) называют приращением функции, соответствующем приращению аргумента Δх. Если область определения А функции f представляет собой промежуток вида [a, b] или [a, b) или [a, +∞) и если f дифференцируема в точке a , то
f (a) lim ta0
f (t ) f (a) , т.е. f (a) представляет собой правосторонний предел. ta
Аналогично, если А представляет собой промежуток
[a, b] или (a, b] или (-∞ , b] , то
f (b) –если она существует- представляет собой левосторонний предел: f (t ) f (b) f (b) lim t b t b0
производная
Такие пределы можно рассматривать и для внутренних точек х промежутка А, что приводит к определению правосторонней и левосторонней производной функции f в точке х. Легко доказать (это предоставляется читателю), что производная f (x) для внутренней точки х промежутка А существует тогда и только тогда, когда в этой точке существуют и равны между собой правосторонняя и левосторонняя производные. 4.2 Теорема. Если функция f:А→R дифференцируема в точке х промежутка А, то она непрерывна в этой точке. Доказательство. Так как при t≠х
460 f(t)=f(x)+
f (t ) f ( x) (t x) , то (см. 3.149) tx
lim f (t ) f ( x) f ( x) 0 f ( x). Следовательно, функция f непрерывна в t x точке х (см. 3.150). Замечание. Обратное неверно. Существуют функции, непрерывные в тех или иных точках, но не дифференцируемые в этих точках. Так, например, функция f:R→R, определяемая равенством f(x)=|x|, непрерывна на R, но не дифференцируема в точке х=0. В самом деле,
lim t0
f (t ) f (0) t f (t ) f (0) t lim 1, a lim lim 1, так что f (0) t t t t t0 t 0 t0
не существует. Позже мы приведем пример всюду непрерывной, но нигде не дифференцируемой функции. 4.3. Теорема. Если функции f:А→R и g:А→R дифференцируемы в точке х промежутка А, то и функции f+g, fg и
f дифференцируемы в точке х (для функции g
f предполагается, что g(х)≠0). При этом g (a) (f+g)′(x)=f′(x)+g′(x); (b) (fg)′(x)=f′(x)g(x)+f(x)g′(x); (c) (
f f ( x) g ( x) f ( x) g ( x) )( x) . g g 2 ( x)
Доказательство.
( f g )( x) lim t x
lim( t x
f (t ) f ( x) g (t ) g ( x) ) f ( x) g ( x). Далее, tx tx
( fg )( x) lim t x
lim( f (t ) t x
( f g )(t ) ( f g )( x) ( f (t ) f ( x)) ( g (t ) g ( x)) lim tx t x t x
f (t ) g (t ) f ( x) g ( x) f (t )[ g (t ) g ( x)] g ( x)[ f (t ) f ( x)] lim tx t x t x
g (t ) g ( x) f (t ) f ( x) ) g ( x) lim f ( x) g ( x) g ( x) f ( x). При tx tx t x
этом мы воспользовались теоремой 3.149 и непрерывностью функции f в точке х, доказанной в 4.2. Наконец,
f (t ) f ( x) f f (t ) g ( x) f ( x) g (t ) 1 1 g (t ) g ( x) ( )( x) lim( lim ) lim( x g t x g ( t ) g ( x )( t x ) g ( x ) g ( t ) t x t x t x
461
x
f (t ) g ( x) f ( x) g (t ) 1 [ f (t ) f ( x)]g ( x) f ( x)[ g (t ) g ( x)] ) 2 lim tx g ( x) tx t x
1 f (t ) f ( x) g (t ) g ( x) f ( x) g ( x) f ( x) g ( x) [ g ( x ) lim f ( x ) lim ] . 2 g 2 ( x) t x t x g x t x t x
4.4. Примеры вычисления производных. 1. Если при всех х из промежутка А-области определения функции ff(x)=c=const, то при всех хєА
f (t ) f ( x) cc lim 0. tx t x t x
f ( x) lim t x
2. Если при всех хєА f(x)=x, то
f (t ) f ( x) tx lim 1 (при всех хєА). tx t x t x
f ( x) lim t x
Пусть fn:R→R есть функция, определяемая равенством: fn(x)=xn (nєN). Индукцией по числу n легко доказать, что при всех хєR f′n(x)=nxn-1. В самом деле, это равенство верно при n=1. Если оно верно для некоторого nєN, то f′n+1(x)=(fnf1)′(x)=f′n(x)f1(x)+fn(x)f′1(x)=nxn-1x+xn1=(n+1)xn. Отсюда и из 4.3 следует, что любой действительный многочлен f:R→R, определяемый равенством
f ( x) a0 x n a1 x n1 ... an1 x an , - дифференцируем в любой точке хєR и f ( x) na0 x n1 (n 1)a1 x n2 ... an1. Отсюда и из 4.3, в свою очередь, следует, что любая рацинальная функция, определяемая отношением двух действительных многочленов, дифференцируема в любой точке хєR, отличной от корней знаменателя. 3. Если f определена при всех х≠0 равенством f(x)=xn, где n<0 (nєZ), т.е., f= где
f ( x)
f0(х)≡1,
то
(согласно
f 0( x) f |n| ( x) f 0 ( x) f |n| ( x) f
2
|n|
( x)
|n| x x 2|n|
4.3) |n|1
n
при
1 x
|n|1
f0 , f |n|
всех
х≠0
nx n1.
4. Расмотрим степенную функцию fμ, определенную на интервале (0,+∞) равенством fμ(x)=хμ, где μ-любое действительное число. Пусть х>0 и Δх (которое может быть как положительным, так и отрицательным числом) настолько мало по абсолютной величине, что и х+Δх>0. Будем иметь:
f ( x x) f ( x) x
( x x) x x
x [(1
x x ) 1] (1 ) 1 x x x 1 . x x x
462
(1 Согласно доказанному в упражнении 84 к главе 3,
lim
x ) 1 x x x
x0
f ( x) lim Поэтому
f ( x x) f ( x) x
x0
.
x 1. В частности, если μ= 1 , т.е. n
1
1 n 1 рассматривается функция f 1 ( x) x , то f 1 ( x) x , что иногда для краткости n n n n
n записывается так: ( x )
5.
Установим
(expa(x)= a
x
1
(x>0). При n=2: ( x )
n n x n1
дифференцируемость
, a 0, a 1).
Для
1 2 x
показательной
любого
хєR
. функции
составим
expa:R→R отношение
x a x 1 exp a ( x x) exp a ( x) a xx a x 1 x a ln a a . Так как lim x x x x x0
(см. упражнение 83 к главе 3), то exp′a(x)= a ln a . В частности, если a e, то exp′(x)=exp(x)=ex. Часто, ради краткости, доказанные равенства записывают в x
виде: (a ) a ln a, (e ) e . 6. Чтобы найти производную логарифмической функции loga:R+→R, для любого x>0 составим отношение x
x
x
log a ( x x) log a x x
x
x x ) log a (1 ) x 1 x . При этом мы считаем x x x x
log a (1
Δх настолько малым по абсолютной величине, что х+Δх>0. Так как при любом р>0 logap=lnplogae (чтобы получить это равенство, достаточно прологарифмировать по
основанию
ln(1 lim x0
x
a равенство elnp=p), то
x ) x 1
log a ( x x) log a x log a å x x
x ) x . Но x x
ln(1
(см. упражнение 82 к главе 3).
x Следовательно, loga ( x)
log a e 1 . В частности, при a e ln ( x) . x x
463 7. Для нахождения производной функции sin:R→R, составим отношение
sin( x x) sin x x
sin lim
x 2 1
x
x x x cos( x ) sin 2 2 cos( x x ) 2 . x x 2 2
2 sin
(упр. 72 к главе 3), а
lim cos( x x0
Так
как
x ) cos x (непрерывность 2
2
x0
функции cos), то при любом хєR sin′(x)=cosx. 8. При
cos( x x) cos x lim x x0 x0
cos( x) lim
любом
хєR
x x ) sin 2 2 lim[sin( x x ) x x 2 x0
2 sin( x
x 2 ] sin x. x При этом мы учли непрерывность функции sin и предельное x 2 x sin 2 1 lim sin
соотношение
x
x0
.
2
9. Производную функции tg в любой точке х≠(2k+1) формулу 4.3 (с): tg ( x)
(кєZ) найдем, применяя 2
sin ( x) cos x sin x cos( x) cos 2 x sin 2 x 1 . cos 2 x cos 2 x cos 2 x
4.5 Теорема. Пусть А и В-промежутки в R и отображение f:А→В биективно, так что существует обратная функция f-1:В→А. Если в некоторой точке хєА функция f имеет отличную от нуля производную f′(x) и в точке у=f(x) обратная функция f-1 непрерывна, то существует производная (f-1)′(y), выражаемая равенством: (f-1)′(y)=
1 1 . f ( x) f ( f 1 ( y ))
f 1 (t ) f 1 ( y ) Доказательство Составим отношение и докажем, что при t→у ty 1 это отношение имеет предел, равный . Так как функция f-1 непрерывна в точке у, f ( x) u (t ) x и то при t→у f-1(t)→f-1(y)=x. Обозначим f-1(t)=u(t), так что t=f(u(t)). Тогда lim t y
lim t y
f 1 (t ) f 1 ( y ) u (t ) x lim . Так как f-1–инъективное отображение, ty f ( u ( t )) f ( x ) t y
то при t≠y u(t)=f-1(t)≠f-1(y)=x. Следовательно, при t→y можем написать:
464
f 1 (t ) f 1 ( y ) 1 1 lim lim f (u (t )) f ( x) ty f ( x) , ч.т.д. u (t ) x 4.6 Вычисление производных обратных тригонометрических функций. 1. Функция arcsin:[-1,1]→ [
1,1]. Производная sin′(x)=cosx обращается в 0 в точках в точках интервала ( производную
arcsin ( y )
в
2
è
2
и не обращается в 0
, ) . Поэтому, согласно теореме 4.5, функция arcsin имеет 2 2 любой точке интервала (-1,1), равную:
1 1 . cos(arcsin y ) 1 y2
При этом мы учли, что при ує(-1,1) arcsinyє (
, ) и потому cos(arcsiny)>0. 2 2
Кроме того, мы учли непрерывность функции arcsin. 2.
0
2
Пусть
õ
è
для
cos(
любого
2
ує[-1,1]
arcsiny=x,
x) sin x y. Следовательно,
имеет место тождество arcsin y arccos y
2
где
2
tg: (
Функция
arctg:(-∞,∞)→ (
2
õ
2
. Тогда
.
, ) 2 2
arcsin y arccos y, т.е.
Отсюда заключаем, что в любой точке ує(-1,1) arcco s( y ) 3.
, ] является обратной к функции sin: [ , ] →[2 2 2 2
является
1 1 y2
обратной
к
. функции
1
, ) →R. Производная tg ( x) не обращается в ноль в точках cos 2 ( x) 2 2
интервала (
, ) . Учитывая непрерывность функции arctg, согласно теореме 4.5, 2 2
будем иметь: arctg ( y )
1 1
cos 2 (arctgy ).
cos 2 (arctgy )
Если arctgy=x, то tgx=y, 1+tg2x=1+y2, Следовательно, arctg ( y )
1 1 1 y 2 , cos 2 x 2 cos ( x) 1 y2.
1 при любом уєR. 1 y2
4.7 Теорема. Пусть функция f:А→R дифференцируема в точке х0 промежутка А, причем f(А)В, где В-промежуток, на котором определена функция g (со значениями в R), дифференцируемая в точке у0=f(x0). Тогда суперпозиция (или, как говорят, сложная функция) h=g◦f дифференцируема в точке х0, причем (g◦f)′(x0)=g′(f(x0))f′(x0).
465 Доказательство. Рассмотрим отношение
h(t ) h( x0 ) g ( f (t )) g ( y0 ) , где t x0 t x0
tєА и t≠х0. Так как g дифференцируема в точке у0, то g(s)g(y0)=[g′(y0)+α(s)](s-y0), где α(s)→0 при s→у0 (sєВ). Это равенство (которое получено из предельного соотношения, в котором предполагалось, что s≠у0) остается справедливым и при s=y0, если положить α(у0)=0. При этом сохраняет силу и предельное соотношение
lim ( s) 0 s y 0
, даже если s, в процеcсе стремления к у0, принимает значение у0.
Полагая s=f(t), где t–любая точка из А, отличная от х0, будем иметь: g(f(t))g(y0)=[g′(y0)+α(f(t))]∙[f(t)-f(x0)], откуда
h(t ) h( x0 ) f (t ) f ( x0 ) [ g ( y0 ) ( f (t ))] . t x0 t x0
Так как функция f дифференцируема в точке х0, то она и непрерывна в этой точке
(см.
4.2).
Поэтому
lim f (t ) f ( x0 ) y0
è
t x
0
Следовательно,
lim
lim ( f (t )) 0
t x
.
0
h(t ) h( x0 ) f (t ) f ( x0 ) g ( y0 ) lim или h′(x0)= =g′(f(x0))f′(x0), t x0 t x0
t x0
t x0
ч.т.д. 4.8 Пример. Пусть функции u и v (вещественные) определены на промежутке АR, причем u(x)>0 при всех xєA. Рассмотрим функцию f=uv, т.е. функцию f:A→R+, определяемую равенством f(x)=[u(x)]v(x) при всех xєA. Поставим вопрос о существовании и вычислении производной f′(x0) в некоторой точке x0єA в предположении, что производные u′(x0) и v′(x0) существуют. Так как f(x)=еv(x)lnu(x) (xєA), то функция f представляет собой суперпозицию: f=exp◦(vlnu) (мы пишем lnu вместо ln◦u). Отсюда можно заключить (на основании теоремы 4.7), что f дифференцируема в точке x0. Вычисление производной f′(x0) проще осуществить, исходя из равенства: lnf=vlnu. Применяя теорему 4.7 и теорему о производной произведения двух функций, будем иметь: (lnf)′(x0)=
1 f ( x0 ) , f ( x0 )
(vlnu)′(x0)=v′(x0)lnu(x0)+v(x0) v′(x0)lnu(x0)+
( x0 )u ( x0 ) u ( x0 )
1 u ( x0 ) .Следовательно, u ( x0 )
f′(x0)=f(x0)[
]. Если функции u и v имеют производную в любой точке
промежутка А, то можно написать коротко: f′=f(v′lnu+
u u
) (формула И. Бернулли).
4.9 Теорема Ферма. Пусть А-промежуток в R, х0-внутренняя точка промежутка А и функция f:A→R имеет точку x0 своей точкой экстремума (см. упр. 116 к главе 2). Утверждается, что если f дифференцируема в точке x0, то f′(x0)=0. Доказательство. Пусть, для определенности, функция f имеет в точке x0 несобственный максимум. Выберем δ>0 так, чтобы (x0-δ, x0+δ)A и для всех xє(x0-δ, x0+δ) выполнялось неравенство f(x)≤f(x0). Если x0-δ<x<x0, то
f ( x ) f ( x0 ) 0. x x0
466 Устремляя x к x0 слева, получим: f′(x0)0. Если же x0<x<x0+δ, то
f ( x ) f ( x0 ) 0. x x0
Устремляя x к x0 справа, будем иметь: f′(x0)≤0. Следовательно, f′(x0)=0, ч.т.д. В остальных случаях доказательство аналогично вышеизложенному. 4.10 Теорема Ролля. Пусть функция f: [a, b] →R дифференцируема в интервале (a, b) , непрерывна
a и b и принимает в этих двух точках равные значения: f (a) f (b). Тогда между a и b найдется такая точка с, что f′(c)=0. в точках
Доказательство. В силу теоремы 4.2, функция f непрерывна на всем отрезке [a, b] . Так как [a, b] -компактное множество в R, то f принимает на отрезке [a, b] свое наибольшее значение М и свое наименьшее значение m (см. 3.45). Если M=m, то при всех xє [a, b] f(x)=M и в качестве с можно взять любую точку из (a, b) . Если же
f (a) f (b) ) по крайней мере одно из значений m,М достигается функцией f в некоторой точке с между a и b . Так как f дифференцируема M>m, то (в силу равенства
в точке с и эта точка оказывается точкой экстремума функции f, то f′(c)=0 (теорема 4.9), ч.т.д. 4.11. Теорема. Если f и g-непрерывные вещественные функции на отрезке [a, b] , дифференцируемые в интервале (a, b) , то существует точка сє (a, b) , в которой [ f (b) f (a)]g (c) [ g (b) g (a)] f (c) Доказательство.
Определим
функцию
(*).
φ: [a, b] →R
равенством:
φ(х)=
[ f (b) f (a)]g ( x) [ g (b) g (a)] f ( x) . Эта функция удовлетворяет условиям теоремы Ролля, так как (a) f (b) g (a) g (b) f (a) (b) . Следовательно, найдется точка сє (a, b) , в которой φ′(с)=0, ч.т.д. Следствие. Если f-вещественная функция, непрерывная на отрезке
[ a, b ] и
дифференцируемая в интервале (a, b) , то существует точка сє (a, b) , в которой
f (b) f (a) (b a) f (c)
(**) Эта формула получается из формулы (*), если в качестве g взять функцию, для которой g(x)=х при всех хє [a, b] . Замечание. Теорему 4.11 часто называют обобщенной теоремой о среднем значении, а следствие из нее называют теоремой о среднем значении (в дифференциальном исчислении) или теоремой Лагранжа. Формула (**) называется формулой Лагранжа или формулой конечных приращений. Причина такого названия состоит в следующем. Пусть х0-любая точка отрезка [a, b] . Придадим значению х0 приращение Δх, не выводящее его за пределы отрезка [a, b] (т.е. х0+Δхє [a, b] ). Сответствующее приращение функции f равно f(х0+Δх)-f(x0). Применим формулу Лагранжа к отрезку [х0, x0+Δх] при Δх>0 или к отрезку [x0+Δх, х0] при Δх<0. Будем иметь: f(х0+Δх)-f(x0)=f′(c)Δх, где x0
ñ x0 x
удовлетворяет неравенствам 0<θ<1 и мы получаем формулу f(х0+Δх)-
f(x0)=f′(х0+θΔх)Δх, выражающую приращение функции через приращение аргумента. К сожалению, в этой формуле фигурирует неизвестное нам число θ.
467
f (b) f (a) f (c) , g (b) g (a) g (c) вводя следующее дополнительное словие: g′(х)≠0 при хє (a, b) (при этом условии и g (b) g (a) ≠0). В таком виде формулу (*) часто называют формулой Коши, а саму Заметим еще, что формулу (*) часто записывают в виде
теорему 4.11-теоремой Коши. 4.12. Теорема Дарбу. Пусть f-вещественная функция, дифференцируемая на f (b) , отрезке [a, b] и пусть λ-любое число, расположенное мeждy f (a) è
f (a) f (b) , либо f (b) f (a) . Утверждается, что существует такая точка сє (a, b) , что f′(c)=λ. Доказательство. Рассмотрим случай, когда f (a) f (b) , оставляя читателю разбор случая f (b) f (a) . f (b) имеют разные знаки (т.е. Предположим сперва, что f (a) è f (a) 0, f (b) 0 ) и λ=0. Так как f непрерывна на [a, b] , то в некоторой точке сє [a, b] f принимает свое наименьшее значение m. Из f (a) 0 следует, что f ( x) f (a ) 0 при всех значениях х, достаточно близких к a . При этих значениях xa х f ( x) f (a) и, значит, f (a) m , т.е c a . Точно также, из f (b) 0 f ( x) f (b) 0 при значениях х, достаточно близких к b ( x b) . следует, что xb При этих значениях х f ( x) f (b) и, значит, f (b) m , т.е c b . Итак, точка с, в которой f(c)=m, принадлежит интервалу (a, b) и является точкой экстремума функции (считаем,
что
f (a) f (b) ,
т.е.
либо
f . Согласно теореме 4.9, f′(c)=0=λ. Переходя к общему случаю
f (a) f (b) , рассмотрим вспомогательную функцию g, определяемую равенством: g(x)=f(x)-λ(x) (хє [a, b] ). Для этой функции g′(х)=f′(х)-λ при всех хє [a, b] и g (a) f (a) 0, a g (b) f (b) 0 . Согласно вышедоказанному, найдется такая точка сє (a, b) , что g′(с)=0, т.е. f′(c)=λ, ч.т.д. Замечание. Итак, производная вещественной функции, дифференцируемой на [a, b] , принимает любые промежуточные значения между f (a) è f (b) (в интервале (a, b) ). Если бы f′ была непрерывной функцией на [a, b] , то доказанное свойство производной вытекало бы из следствия 2 теоремы 3.102. Однако, производная f′ дифференцируемой на [a, b] функции f, вовсе не обязательно является непрерывной функцией. В качестве примера рассмотрим функцию f, определяемую равенствами: f(x)=x2sin
1 õ
при х≠0 и f(0)=0. При х≠0 f′(x)=2xsin
1 1 1 + +x2cos ( 2 ) õ õ õ
или
468 f′(x)=2xsin
1 1 -cos . õ õ
При
х0=0
имеем:
1 x lim x sin 1 0 . x x x 0
x 2 sin
f ( x) f (0) lim x 0 x 0 x 0
f (0) lim
Итак, f дифференцируема всюду на R, но производная f′ не является непрерывной в точке х=0, ибо
lim( 2 x sin x 0
1 1 cos ) x x не существует. В этом примере
производная f′ в точке х=0 претерпевает разрыв 2-го рода. Как показывает следующая теорема, это не случайно. 4.13. Теорема. Пусть функция f: [a, b] →R непрерывна на [a, b] и дифференцируема в интервале (a, b) . Если существует конечный или бесконечный предел
lim f ( x) xa0
lim f ( x) xa0
, то существует и предел
f ( x) f (a ) , равный xa x a0
f (a) lim
.
Доказательство.
Из
формулы
конечных
приращений
следует,
что
f ( x) f (a) f (a x ( x a)), где 0<θх<1 и x a . Устремляя х к a справа и xa f ( x) f (a) lim lim f ( x) lim f ( x) учитывая существование предела xa0 , получим: , xa xa 0
xa 0
ч.т.д. Замечание. Разумеется, аналогичное утверждение справедливо и в отношении точки b . Из доказанного следует, что если функция f дифференцируема в некотором промежутке, то в этом промежутке производная f′ не может иметь разрывов первого рода: в каждой точке f′ либо непрерывна, либо имеет разрыв второго рода. Заметим еще, что если для функции f:A→R (А-промежуток в R) в некоторой точке х0єА отношение
f ( x) f ( õ0 ) имеет своим пределом при х→х0 ∞ (+∞ или -∞), x õ0
то мы будем говорить, что производная f′(x0) равна ∞ (+∞ или -∞). После этого соглашения фраза «f дифференцируема в точке х0» будет для нас равносильна фразе «f имеет в точке х0 конечную производную». 4.14. Теорема. Если функция f:A→R непрерывна на промежутке А и имеет в точке х0єА бесконечную одностороннюю производную (т.е. левостороннюю или правостороннюю), то эта производная может быть бесконечностью лишь определенного знака, т.е. может равняться либо +∞, либо -∞. Доказательство. Пусть f в точке х0 имеет бесконечную правостороннюю производную:
lim
f ( x ) f ( x0 ) x x0
x x 0 0
(хєА).
469 Задавшись произвольным числом М>0, найдем такое δ>0, при
0<x-x0<δ будет
f ( x) f ( õ0 ) M . Выберем по произволу точку х1є(х0, x õ0
выполняться неравенство
f ( x1 ) f ( õ0 ) 0 , то и в любой другой точке х2є(х0, х0+δ) будет x1 õ0 f ( x2 ) f ( õ0 ) 0 , ибо в противном случае непрерывная в интервале (х0, х0+δ) x2 õ0 f ( x) f ( õ0 ) функция (мы допускаем вольность речи) обращается в нуль в некоторой x õ0 х0+δ). Если
точке х, лежащей между х1 и х2. Так как это противоречит неравенству
f ( x) f ( õ0 ) M , справедливому при всех хє(х0, х0+δ), то действительно, x õ0 f ( x) f ( õ0 ) отношение положительно при всех хє(х0, х0+δ) и потому для этих x õ0 f ( x) f ( õ0 ) M . Ввиду произвольности положительного числа М, значений х x õ0 f ( x ) f ( x0 ) lim x x0 можем написать: . x x 0 0
Если бы оказалось, что в некоторой точке интервала (х0, х0+δ) отношение
f ( x) f ( õ0 ) f ( x) f ( õ0 ) M при всех хє(х0, отрицательно, то мы имели бы: x õ0 x õ0 f ( x ) f ( x0 ) lim . x x0 х0+δ). Следовательно, в этом случае x x 0 0
Читателю предлагается проверить, что к аналогичным выводам приводит и предположение о том, что в точке х0 функция f имеет бесконечную левостороннюю производную. 4.15. Теорема. Пусть вещественные функции f и g определены в промежутке АR и
lim f ( x) 0, lim g ( x) 0 xx
xx 0
, где х0єА. Пусть также существуют конечные
0
производные f′(х0) и g′(х0), причем g′(х0)≠0. Тогда
lim xx
f ( x) f ( x0 ) g ( x) g ( x0 ) .
0
Доказательство. Существование конечных производных f′(х0) и g′(х0) влечет за собой непрерывность функций f и g в точке х0 (4.2). Поэтому из условия теоремы
470 следует,
что
и
f(x0)=0
Будем
g(x0)=0.
иметь
(при
f ( x ) f ( x0 ) f ( x) f ( x0 ) x x0 f ( x ) f ( x ) f ( x0 ) lim , g ( x) g ( x0 ) , ч.т.д. g ( x) g ( x) g ( x0 ) g ( x) g ( x0 ) откуда xx x x0 0
х≠х0)
Замечание. При всех хєА (х≠х0), достаточно близких к х0, g(x)≠0, так что для
f ( x) имеет смысл. В самом деле, так как при х→х0 g ( x) g ( x ) g ( x0 ) g ( x) g ( x0 ) lim lim 0, то при х≠х0 и достаточно близких к х0 x x0 x x0 g ( x) 0 и g(x)≠0. Далее, если х0 является концевой точкой промежутка А, то x x0 lim f ( x), lim g ( x)
этих значений х отношение
пределы
xx
следует понимать как односторонние пределы (справа
xx 0
0
или слева). Точно также в этом случае следует понимать производные f′(х0) и g′(х0). Заметим еще, что если g′(х0)=0, но f′(х0)≠0, то, согласно доказанному,
lim xx
g ( x) 0 f ( x) .
0
Отсюда следует, что
lim xx
g ( x) f ( x) , если только g(x) не обращается в 0 для значений х,
0
достаточно близких к х0. Теорему 4.15 и последующие за ней теоремы 4.16-4.19 в основном принадлежат Лопиталю и Бернулли. Высказанное в них правило обычно называют правилом 0 Лопиталя для раскрытия неопределенностей типа или . 0 4.16.Теорема. Пусть вещественные функции f и g определены в промежутке АR и
lim f ( x) 0, lim g ( x) 0 xx
xx 0
, где х0єR и либо принадлежит А, либо-не
0
принадлежа А-является предельной точкой промежутка А (например, если А= (a, b] и х0= a ). Пусть также в каждой точке хєА существуют конечные производные f′(х) и g′(х), причем g′(х)≠0. При этих условиях при х→х0 lim
f ( x) f ( x) lim , если только предел справа g ( x) g ( x)
существует (конечный или нет). Доказательство. Если х0єА, то функции f и g непрерывны в точке х0. Следовательно (в силу предельных соотношений
lim f ( x) 0, lim g ( x) 0 xx
xx 0
), f(x0)=0
0
и g(x0)=0. Если x0 A, то доопределим функции f и g, полагая f(x0)=g(x0)=0. В обoих случаях при любом хєА, х≠х0 функции f и g непрерывны на отрезке [x0,x] и дифференцируемы в интервале (x0,x) (или непрерывны на отрезке [x,x0] и дифференцируемы в интервале (x,x0)). Кроме того, при любом t из интервала (x0,x) (или
471 (x,x0)) g′(t)≠0. Таким образом, выполнены все условия, при которых справедлива формула Коши (см. замечание
к теореме 4.11):
f ( x) f (c x ) , где x0
lim
f ( x) g ( x)
xx
f ( x) f ( õ0 ) f (c x ) или g ( x) g ( õ0 ) g (c x )
существует (конечный или
0
бесконечный), будем иметь:
lim xx
f ( x) f ( x) lim g ( x) g ( x) , ч.т.д. xx
0
0
4.17. Теорема. Пусть вещественные функции f и g определены в интервале
f ( x) 0, lim g ( x) 0 (a,) и lim . Пусть также в каждой точке х из интервала x x
(a,) существуют конечные производные f′(х) и g′(х), причем g′(x)≠0. При этих условиях
lim
f ( x) f ( x) lim g ( x) g ( x) , если только предел справа
x
x
существует (конечный или нет). Доказательство. Рассмотрим функции φ и ψ, определенные в интервале (0, равенствами: φ(х)=f(
1 ) a
1 1 ), ψ(х)=g( ) (не ограничивая общности, можно считать, что x x
a >0). 1 1 lim ( x) lim f ( ) 0 lim ( x) lim g ( ) 0 Для этих функций имеем: и . x x x 0
x 0
x 0
x 0
1 ) существуют конечные производные a 1 1 1 1 φ′(х)= f ( ) ( 2 ) и ψ′(х)= g ( ) ( 2 ) причем ψ′(х)≠0. Предполагая, что x x x x Далее, в каждой точке х интервала (0,
существует конечный или бесконечный предел
lim
f ( x) g ( x) будем иметь: при х→+0
x
1 ( ) f f ( x) ( x) lim x lim предел lim 1 равен õ g ( x) . На основании доказанного в 4.16, ( x) g ( ) x
472
1
можем написать:
f( ) ( x) ( x) x lim lim ( x) ( x) или, при х→+0, предел lim 1 равен x 0
g( ) x
x 0
f ( x) f ( x) f ( x) lim lim g ( x) , откуда следует, что g ( x) x g ( x) . õ x
lim
Замечание. Читателю предлагается сформулировать и доказать аналогичную теорему для случая, когда функции f и g определены в интервале (-∞, a ) и
lim f ( x) lim g ( x) 0 x
x
(не ограничивая общности, можно считать, что
a <0).
4.18. Теорема. Пусть вещественные функции f и g определены в интервале
f ( x) , lim g ( x) (a, b) R и lim . Пусть также в каждой точке хє (a, b) x b x b
существуют конечные производные f′(х) и g′(х), причем g′(х)≠0. При этих условиях
lim
f ( x) f ( x) lim g ( x) g ( x) , если только предел справа существует (конечный или
x b
x b
бесконечный) Доказательство. Рассмотрим сперва случай, когда существует конечный предел
lim
f ( x) K . Так как производная g′ не обращается в 0 в интервале (a, b) , то по g ( x)
x b
теореме Дарбу (4.12) g′(х) сохраняет один и тот же знак при всех хє (a, b) . Пусть, например, g′(х)>0 при всех хє (a, b) . Применяя формулу Лагранжа (4.11), можем заключить, что g является строго возрастающей функцией в интервале
lim g ( x) x b
хє (a, b) .
lim
(a, b) и потому
. Не ограничивая общности, можем считать, что g(x)>0 при всех
Для
доказательства
справедливости
предельного
соотношения
f ( x) K зададимся произвольным ε>0 и найдем такое δ>0, что при g ( x)
x b
f ( x) b x b будет иметь место неравенство g ( x) K 2 .
(b , b) любое значение х и применим формулу Коши f ( x) f (b ) f (c) , (4.11) к промежутку [b , x] : g ( x) g (b ) g (c) где c (b , b) и Выберем в интервале
потому краткости
f (c) K g (c) 2 . Следовательно,
f ( x) f (b ) K g ( x) g (b ) 2 . Положим для
b x0 и напишем легко проверяемое тождество:
473
f ( x0 ) Kg ( x0 ) g ( x0 ) f ( x ) f ( x0 ) f ( x) K [1 ][ K ]. g ( x) g ( x) g ( x ) g ( x ) g ( x0 ) хє (b , b) ,
т.е.
хє(х0,
будем
b ),
f ( x0 ) Kg ( x0 ) f ( x) K . g ( x) g ( x) 2 η>0, что η<δ и при
b x b
Так как
иметь:
0
Считая,
g ( x0 ) 1, g ( x)
так
что
что
g ( x) , то найдется такое xb
f ( x0 ) Kg ( x0 ) . g ( x) 2
Тогда при
b x b
f ( x) f ( x) lim K K , откуда и следует, что будет иметь место неравенство . g ( x) g ( x) 2 x b К такому же выводу придем в случае, когда при всех хє (a, b) g′(х)<0 (в этом случае
g ( x) и, не ограничивая общности, можно считать, что g(x)<0 при всех xb хє (a, b) ). Пусть теперь
lim
f ( x) . Тогда производная f′ не обращается в 0 по крайней g ( x)
x b
мере вблизи точки
b , так что
lim
g ( x) 0 . Согласно уже доказанному, f ( x)
x b
lim
f ( x) g ( x) g ( x) lim lim 0, откуда , ч.т.д. g ( x) f ( x) f ( x)
x b
x b
x b
Замечание к теореме 4.18. Разумеется, аналогичное утверждение справедливо и в том случае, когда для функций f:( à, b )→R и g:( à, b )→R выполняются предельные
f ( x) , соотношения lim õà
lim g ( x) .
õà
4.19. Теорема. Пусть вещественные функции f и g определены в интервале
f ( x) , lim g ( x) . Пусть также в каждой точке х интервала (à,) и lim õ õ (à,) существуют конечные производные f′(х) и g′(х), причем g′(х)≠0. При этих f ( x) f ( x) lim lim , условиях g ( x) g ( x) если только предел справа существует (конечный или x
x
нет). Доказательство почти дословно повторяет доказательство теоремы 4.17 (только ссылку придется сделать на замечание к теореме 4.18) и предоставляется читателю. Замечание. Итак, высказанное в теоремах 4.16-4.19 правило Лопиталя для 0 раскрытия неопределенностей типа или состоит в том, что при определенных 0 условиях предел отношения функций равен пределу отношения производных, если этот последний существует. Следует, однако, заметить, что предел отношения функций
474 может существовать и без того, чтобы существовал предел отношения производных. Вот пример (Г.М. Фихтенгольц): lim x
x sin x 1 cos x 1, но lim не существует. x 1 x
4.20 Примеры.
sin ax a cos ax a lim x 0 b (теорема 4.15) 1. Если à 0 и b 0 , то x 0sin bx b cos bx 2.При х→1
x x x (ln x 1) 1 lim lim 1 ln x x 1 1 x x
lim
x
x x (ln x 1) 2 x x 1 2 x
4.16, примененная дважды) 3. При х→∞
lim( tg
x
1 x
ln tg
) lim e 2x 1
2
2
x 2 x 1 x
ln tg ; lim
x 2 x 1 lim x
lim
4. При х→
(теорема
(2 x 1) 2x (2 x 1) 2 x x 2 tg cos 2x 1 2x 1
2 (2 x 1) (2 x 1) lim lim( 2 x 1 ) 0. 2x 2x 1 sin sin( ) sin 2x 1 2x 1 2x 1 1 x x lim( tg ) e 0 1 (теорема 4.17). x 2x 1 2
1 x 2
2
Следовательно,
2
3 2 tg 3x cos 2 x cos x s xi n 1 cos 3 x lim lim 3 lim ; lim lim . 2 1 tgx cos 3x cos 3x ( s 3ix) 3n 3 cos 2 x 2 lim cos x 1 è lim tg 3x 1 Следовательно, при х→ (теоремы 4.18 и 4.16). tgx 3 cos 2 3x 9 2 xn nx n1 n! ... lim n x 0 (теорема 5. Если nєN, αєR и α>0, то lim x lim x e x x e x e 4.19, примененная n раз). 4.21 Определение. Если вещественная функция f дифференцируема в каждой точке некоторого промежутка АR и если функция f′ имеет производную (конечную или нет) в некоторой точке хєА, то эта производная ( f )( x) lim t x
f (t ) f ( x) (tєА) tx
называется второй производной функции f в точке х и обозначается f′′(х) или D2f(x) (существуют и другие, менее точные, обозначения, которых мы не будем
475 придерживаться; см. Г.М. Фихтенгольц «Курс дифференциального и интегрального исчисления», т.I ). Заметим, что если х-концевая точка промежутка А-области определения функции f, то производные f′(х) и f′′(х) являются односторонними производными. Если вторая производная f′′(х) существует и конечна в каждой точке некоторого промежутка, то функцию f будем называть дважды дифференцируемой в указанном промежутке. При этом можно поставить вопрос о существовании производной
( f )( x) lim t x
f (t ) f ( x) в той или иной точке х этого промежутка. Если tx
производная ( f )( x) существует (конечная или нет), то говорят о третьей производной функции f в точке х, которая обозначается f′′′(х) или f(3)(x). Указанные рассуждения можно продолжить и прийти к понятию n–ой производной функции f (или производной n–го порядка функции f) в той или иной точке х, которая обозначается f(n)(x) или Dnf(x) (nєN). Если при некотором кєN производная f(k)(x) существует и конечна во всех точках х некоторого промежутка АR, то функция f называется к раз дифференцируемой в промежутке А. Замечание. Для того, чтобы в некоторой точке х0єR существовала конечная производная f(n)(x0), необходимо (но, конечно, недостаточно), чтобы f была n-1 раз дифференцируема в некоторой окрестности точки х 0 (быть может, односторонней) и чтобы производная f(n-1) существующая в указанной окрестности, была непрерывной в точке х0. При этом производная f(n)(x0) (конечная или нет), если она существует, определяется равенством: f
(n)
f ( n1) (t ) f ( n1) ( x0 ) ( x0 ) lim при t→x0. t x0
4.22 Общие формулы для пpоизводных любого порядка некоторых элементарных функций. 1. Пусть μ-любое действительное число. Для степенной функции fμ, определенной на интервале (0,+∞) равенством fμ(х)=хμ, будем иметь ( см. 4.4): f′μ(х)=μхμ-1, f′′μ(х)=μ(μ-1)хμ-2, … Общий закон легко усматривается и мы можем написать:
f ( n ) ( x) ( 1)( 2)...( n 1) x n . Читателю предлагается оправдать эту формулу методом математической индукции. Если μ есть натуральное число m, то m–я производная функции fm в любой точке х>0 будет уже постоянным числом, равным m!, а все последующие производныенулями. 1 При μ=-1, когда рассматривается функция f-1, для которой f-1(x)= , имеем: õ
f (1n) ( x) (1)(2)(3)...(n) x 1 n
(1)n n! . õn 1
Эту формулу часто, ради краткости (но пренебрегая точностью), записывают
1 ( n) (1) n n! . так: ( ) x õ n 1
Для функции φμ: φμ(х)=(1+х)μ, х>-1 точно также, как и выше, будем иметь:
( x) ( 1)...( n 1)(1 x) ( n)
n
(1) n n! 1 ( n) (1) n n! ) . В , а также ( x) или ( 1 x (1 õ) n 1 (1 õ) n 1 (n) 1
476 частности, при х=0
(n) (0) ( 1)...( n 1). При μ=-1
(1n) (0) (1) n n! или
1 ( ) ( n) x0 (1) n n! 1 x 2. Для логарифмической функции ln:R+→R имеем (см. 4.4): ln ( x) (n)
потому ln (x)= f
( n 1) 1
(1) n1 (n 1)! ( x) . õn
Для функции f: f(x)=ln(1+x), x>-1 имеем f ( x) частности, f
( n)
1 и x
1 (1) n1 (n 1)! ( n) f ( x ) .В и 1 x (1 õ) n
(0) (1) n1 (n 1)!
3. Для экспоненциальной функции exp:R→R+ (exp(x)=ex) согласно 4.4 имеем: exp′(х)=exp(x), так что при любом nєN (и любом хєR) exp(n)(x)=exp(x)=ex. В частности, при х=0 и при любом nєN exp(n)(0)=1. 4. Для функции sin:R→R, согласно 4.4., имеем: sin′(x)=cosx=sin(x+ ). 2
). Эту формулу легко обосновать методом 2 математической индукции, что предоставляется читателю. Следовательно,
sin(n)(x)=sin(x+n
0 ïðè 1 ïðè В частности, при х=0 sin(n)(0)=sin 2 1 ïðè
n
÷åòíûõ n n 4k 1, k Z . n 4k 3, k Z
5. Для функции cos:R→R согласно 4.4., имеем: cos′(x)=-sinx, так что cos(n)(x)=-
). 2 В частности, при х=0 cos(n)(0)=
sin(n-1)(x)=-sin(x+(n-1)
0 ïðè íå÷åòíûõ n ) cos 1 ïðè n 4k 2, k Z . =-sin( 2 2 2 1 ïðè n 4k , k Z
n
n
6. Для функции arctg:R→ (
1
, ) , согласно 4.6, имеем: arctg′(x)= . 2 2 1 õ2
Обозначив для краткости у=arctgx (откуда х=tgy), находим:
1 2 cos y cos y sin( y ). Следовательно, arctg′′(х)=arctg′(x)= 1 tg 2 y 2 siny∙arctg′(x)∙sin(y+
cos y cos( y
2
2
)+
) arctg ( x) arctg ( x) cos(2 y
cos 2 y cos(2 y ) cos 2 y sin 2( y ). 2 2
2
)
477 Далее,
arctg ( x) 2 sin y cos y arctg ( x) cos(2 y
2
)arctg ( x)] [2 sin y cos y sin 2( y
2
2
) cos 2 y [2 sin(2 y
) 2 cos 2 y cos 2( y
2
)]arctg ( x)
2 cos y[cos y cos 2( y ) sin y sin 2( y )]arctg ( x) 2 cos 3 y cos(3 y ) 2 2 3 2 cos 3 y sin(3 y ) 2 cos 3 y sin 3( y ). 2 2 Таким
образом,
вырисовывается
arctg ( n ) ( x) (n 1)!cos n y sin n( y
2
)
общая
формула:
(при этом принимается 0!=1).
Читателю предлагается обосновать эту формулу методом математической индукции. В частности, при х=0 7.
arcsin ( x)
Для
1 1 x2
arctg ( n ) (0) (n 1)!sin
функции
arcsin:[-1,1]→[
, ], 2 2
n 2
.
согласно
4.6,
имеем:
при -1<x<1. Обозначая для краткости функцию arcsin одной
буквой у, мы видим, что функция у имеет конечную производную любого порядка в интервале (-1,1). Нас будут интересовать числа y(n)(0) при любом nєN. Для нахождения этих чисел поступим следующим образом. Так как в интервале (-1,1) имеет место тождество (у′(x))2(1-x2)=1, то 2у′(x)∙y′′(x)(1-x2)+(y′(x))2∙(-2x)=0 при всех хє(-1,1), откуда (так как у′(х) не обращается в 0) у′′(х)(1-х2)-у′∙х=0, хє(-1,1). (*) Отсюда уже следует, что у′′(0)=0. Далее, найдем n–ю производную от обеих частей тождества (*), применяя к произведениям у′′(1-х2) и у′∙х формулу Лейбница, которая доказывается так же, как и в упражнении 123 к главе 2 (заметим, что мы допускаем вольность речи: следовало, например, вместо 1-х2 говорить о функции φ, для которой φ(х)=1-х2 при всех хє(-1,1)). Будем иметь: y(n+2)(x)∙(1-x2)+n y
( x y ( n1) ( x) ny ( n) ( x)) 0
( n 1)
при
( õ) (2 x)
-1<x<1.
n(n 1) ( n ) y ( x) (2) 2
Отсюда,
при
х=0
получим:
y ( n2) (0) n 2 y ( n ) (0), при любом nєN. Следовательно, у′′(0)=y(4)(0)=y(6)(0)= =…=y(2k)(0)=…=0. Так как у′(0)=1, то у′′′(0)=12, y(5)(0)=32∙y″′(0)=32∙12, (7) 2 (5) 2 2 2 y (0)=5 ∙y (0)=5 ∙3 ∙1 и т.д. Методом математической индукции легко обосновать (что предоставляется читателю) формулу y(2k+1)(0)= =12∙32∙…∙(2k-1)2, кєN. Произведение 1∙3∙5∙…∙(2к-1) последовательных натуральных чисел одинаковой четности обозначается (2к-1)!! (а произведение 2∙4∙6∙…∙2к обозначается (2к)!!). Следовательно, arcsin(2k)(0)=0, кєN, arcsin(2k+1)(0)=12∙32∙…∙(2k-1)2=[(2k-1)!!]2. 4.23 Теорема. Пусть f–вещественная функция на отрезке [a, b] , n раз дифференцируемая на этом отрезке. Пусть также n–я производная f(n) непрерывна на [a, b] и дифференцируема в интервале (a, b) , т.е. в любой точке х этого интервала
478 существует и конечна производная f(n+1)(x). Утверждается, что каковы бы ни были [ a , b] , точки х0 и х (х≠х0) отрезка выражение Rn(x,x0)=f(x)f ( x0 ) f ( n ) ( x0 ) [f(x0)+ можно представить в виде ( x x0 ) ... ( x x0 ) n ] 1! n!
f ( n 1) ( x0 ( x x0 )) (1 ) n 1 p ( x x0 ) n1 , Rn(x,x0)= n! p
где
р-
произвольное
положительное число, а θ удовлетворяет условию 0<θ<1 (и зависит от выбора х0, х и р). Доказательство. Зафиксируем взятые по произволу на [a, b] точки х0 и х. Считая, для определенности, что вспомогательную функцию g:
a x0 x b, определим на отрезке [x0,x]
f (t ) f (t ) f ( n ) (t ) 2 g (t ) f ( x) [ f (t ) (x t) ( x t ) ... (x t)n ]. 1! 2! n! Согласно условию теоремы, функция g непрерывна на отрезке [x0,x] и дифференцируема в интервале (х0,х). При этом f (t ) f (t ) f (t ) f ( n1) (t ) g (t ) [ f (t ) f (t ) (x t) (x t) ( x t ) 2 ... ( x t ) n2 1! 1! 2! (n 2)!
f ( n ) (t ) f ( n ) (t ) f ( n1) (t ) n 1 n 1 (x t) (x t) ( x t ) n ], (n 1)! (n 1)! n!
x0
f ( n1) (t ) ( x t ) n , x0
g ( x) g ( x0 ) g (c) , где x0
Так
как
g(x)=0,
g(x0)=Rn(x,x0),
φ(х)=0
и
φ(х0)=(х-х0)р,
то
f ( n1) (c) Rn ( x, x0 ) f ( n1) (c) n p 1 R ( x , x ) ( x c) n p1 ( x x0 ) p . ( x c ) , откуда n 0 ð n! p n! p ( x x0 )
ñ x0 (0<θ<1), получим с=х0+θ(х-х0) и х-с=(х-х0)(1-θ), так что x x0 f ( n1) ( x0 ( x x0 )) (1 ) n p 1 ( x x0 ) n1 . окончательно Rn ( x, x0 ) Обозначив θ=
n! p a x x0 b
В случае доказательство проходит аналогично вышеизложенному, только функции g и φ определяются на отрезке [х,x0], причем функция φ задается равенством φ(t)=(t-x)p. Теорема доказана. Замечание. В главе 2 (упражнение 115) было доказано, что для любого действительного многочлена f степени n≥1 имеет место формула Тейлора:
479
f ( x0 ) f ( x0 ) f ( n ) ( x0 ) 2 f ( x ) f ( x0 ) ( x x0 ) ( x x0 ) ... ( x x0 ) n , где х и х01! 2! n! любые точки из R. . И хотя в главе 2 понятие производной было определено иначе, чем в главе 4 (и только для действительных многочленов), тем не менее, производная любого многочлена, вычисленная по определению главы 2, совпадает с производной того же многочлена, вычисленной по определению главы 4. Если вещественная функция f не является действительным многочленом, то точное равенство (*), справедливое для любых х и х0,-не имеет места. Теорема 4.23 показывает, что нужно добавить к правой части (*), чтобы-при условиях, сформулированных в теореме,-по-прежнему имело место точное равенство. Итак, при условиях теоремы 4.23,
f ( x0 ) f ( n ) ( x0 ) f ( n1) ( x0 ( x x0 ) n f ( x ) f ( x0 ) ( x x0 ) ... ( x x0 ) x 1! n! n! p x(1 ) n p1 ( x x0 ) n1 , (**) где х и х0-любые две точки отрезка [a, b] , для которого выполняются условия теоремы, р-любое положительное число, а число θ удовлетворяет неравенствам 0<θ<1. Формула (**) носит назавание формулы Тейлора с дополнительным членом в форме Шлемильха и Роша. Если в качестве р взять число n+1, то полученная формула
f ( x0 ) f ( n ) ( x0 ) f ( n1) ( x0 ( x x0 ) n f ( x ) f ( x0 ) ( x x0 ) ... ( x x0 ) ( x x0 ) n1 1! n! (n 1)! носит назавание формулы Тейлора с дополнительным членом в форме Лагранжа. Наконец, если взять р=1, то получается формула
f ( x0 ) f ( n ) ( x0 ) f ( n1) ( x0 ( x x0 )) n f ( x ) f ( x0 ) ( x x0 ) ... ( x x0 ) x, 1! n! n! x(1 ) n ( x x0 ) n1 (****) которая носит назавание формулы Тейлора с дополнительным членом в форме Коши. Если положить х0=0 (считая, разумееется, что эта точка принадлежит отрезку [a, b] , для которого справедливы условия теоремы 4.23), то формулы Тейлора с дополнительным членом в форме Лагранжа и Коши примут вид:
f (0) f ( n ) (0) n f ( n1) (x) n1 f ( x) f (0) x ... x x 1! n! (n 1)! f (0) f ( n ) (0) n f ( n1) (x) f ( x) f (0) x ... x (1 ) n x n1 1! n! n!
(***) (****)
Напишем формулу Тейлора для некоторых элементарных функций. 1) Функция exp (exp(x)=ex для любого хєR) бесконечно дифференцируема в R (4.22) и exp′=exp. Поэтому при любом хєR и любом nєN
ex 1
x xn ex ... x n1 . 1! n! (n 1)!
Так
как
480
ex e| x| | x |n1 n 1 n 1 x | x | и 0, то при любом хєR (n 1)! (n 1)! (n 1)! n
xn e n 0 n! x
(0!=1)
Функция f, для которой f(x)=ln(1+x), беконечно дифференцируема в
2)
интервале (-1, +∞) и при любом хє(-1, +∞) f
( n)
(1) n1 (n 1)! ( x) (4.22). В (1 x) n
частности, f(n)(0)=(-1)n-1(n-1)! Поэтому при любом хє(-1,+∞) и любом nєN
ln(1 x) x
ряд
(1)
x 2 x3 xn x n1 .... (1) n1 (1) n . 2 3 n (n 1)(1 x) n1
n 1
n 1
xn n
При
x>1
расходится (общий член не стремится к нулю). Поэтому
ограничимся значениями х, принадлежащими промежутку (-1,1]. При 0≤х≤1
x n1 0. (n 1)(1 x) n1 n
ln(1 x)
(1)
n 1
n 1
xn n
Следовательно,
. Однако, при -1<x<0
при
0≤х≤1
поведение дополнительного
члена становится неясным, и приходится прибегнуть к форме Коши дополнительного члена: n x2 (1 ) n n 1 x n n 1 ln(1 x) x .... (1) (1) x . При -1<x<0 будем 2 n (1 x) n1
иметь:
-θ<θx<0
(1) n x n1
и
1-θ<1+θx<1,
так
что
(1 ) | x| 1 n ( ) n 0. Таким образом, при всех (1 x) n1 1 | x | 1 x n 1
n
хє(-1,1] ln(1 x)
(1)
n 1
n 1
xn n
.
Обратим внимание, что величина ln(1+x) имеет смысл и при х>1; однако,
равенство ее сумме бесконечного ряда 3)
(1) n 1
n 1
xn n
имеет место только при
хє(-1,1]. Функция sin
бесконечно дифференцируема в R и при любом хєR sin(n)(x)=sin(x+n ) (см. 4.22). Поэтому при любом хєR и любом кєN 2
x3 x5 x 2 k 1 sin(x k ) 2 k k 1 sin x x .... (1) x . 3! 5! (2k 1)! (2k )! Так как дополнительный член стремится к 0 при к→∞, то при всех хєR
sin x (1) k 1
k 1
x 2 k 1 . (2k 1)!
481 4)
Функция cos бесконечно дифференцируема в R и при любом хєR n n cos(n)(x)=cos(x+ ). В частности cos(n)(0)=cos (4.22). Поэтому при 2 2 любом хєR и любом кєN
x2 x4 x 2k k cos x 1 .... (1) 2! 4! (2k )!
cos(x
(2k 1)
2 (2k 1)!
)
x 2 k 1 .
Так как дополнительный член стремится к 0 при к→∞, то при всех хєR
x 2k cos x (1) . (2k )! k 0 k
5) Функция arctg бесконечно дифференцируема в R и при любом хєR ( см. 4.22)
)n). 2 n В частности, при х=0 arctg(n)(0)=(n-1)!sin . Поэтому при всех хєR и любом кєN 2 arctg(n)(x)=(n-1)!cosn(arctgx)sin((arctgx+
x3 x5 x 2 k 1 k 1 arctgx x .... (1) Rk ( x), где дополнительный член Rk(x) 3 5 2k 1 (взятый в форме Лагранжа) имеет вид:
x 2k Rk(x)=(2k-1)!cos (arctgθx)sin2k(arctgθx+ ) 2 (2k )! x 2k 2k . =cos (arctgθx)sin2k(arctgθx+ ) 2 2k 2k
Поведение дополнительного члена при к→∞ неясно, если |x|>1. Но так как ряд
x
x x5 x 2 k 1 .... (1) k 1 ... расходится при |x|>1 (общий член не стремится к 3 5 2k 1 3
0), то мы ограничимся значениями х, принадлежащими промежутку [-1,1]. Для этих 1 lim R ( x) 0 значений х |Rk(x)| . Следовательно, при хє[-1,1] (и только , (так что k k 2k
при этих значениях х) 5)
arctgx (1) k 1
k 1
x 2 k 1 . 2k 1
Рассмотрим функцию (1+x)m (мы допускаем вольность речи), определенную в интервале (-1, +∞), где m-любое вещественное число, отличное от нуля и от всех натуральных чисел (при натуральных m имеем дело с формулой Ньютона для степени бинома). Эта функция бесконечно дифференцируема в интервале (-1, +∞), так что, согласно 4.22 и 4.23,
m(m 1) 2 m(m 1)(m 2)...(m n 1) n x .... x Rn ( x), где 2! n! m(m 1)(m 2)...(m n)(1 x) mn1 Rn ( x) (1 ) n x n1 n!
(1 x) m 1 mx
482
(m 1)(m 2) ... (m 1 n 1) n 1 x [mx(1 x) m1 ] . Исследуем на n! 1 x m(m 1) 2 x ...., называемый биномиальным рядом. Имеем: сходимость ряд 1 mx 2! an1 m(m 1)(m 2)...(m n 1)(m n) n1 m(m 1)...(m n 1) x n (m n) x x : , an (n 1)! n! n 1 n
так что при достаточно больших n
an1 n m | x | n | x | . an n 1
Следовательно, при |x|<1 биномиальный ряд абсолютно сходится (признак Даламбера), а при |x|>1–расходится. Ограничимся значениями х, принадлежащими интервалу (-1,1). При этих значениях х выражение
(m 1)(m 2) ... (m 1 n 1) n x , n!
(входящее множителем в Rn(x)) стремится к 0 при n→∞, ибо это выражение представляет собой общий член сходящегося биномиального ряда, построенного для функции (1+x)m-1. Далее, величина 1+θх удовлетворяет неравенствам 1-|x|<1+θх<1+|x|, откуда либо (1-|x|)m-1<(1+θх)m-1<(1+|x|)m-1 (при m>1), либо (1+|x|)m-1<(1+ +θх)m1 m-1 m-1 <(1-|x|) (при m<1). Следовательно, величина |mx(1+θх) | содержится между числами |mx|(1-|х|)m-1 и |mx|(1+|х|)m-1, не зависящими от n. Наконец, величина
1 1 при всех nєN, как это доказано при рассмотрении функции ln(1+x). 1 õ Rn ( x) n 0 и для этих значений х Следовательно, при хє(-1,1) n
m(m 1) 2 m(m 1)...(m n 1) n x ... x ... 2! n! 1 Например, при m= получаем: 2 1 1 3 5 1 3 5 ... (2n 1) n 1 x x 2 x 3 ... (1) n x ... или 2 8 16 2 4 ... 2n 1 x 1 (2n 1)!! n 1 (1) n x (-1<x<1). Заменяя здесь х на –х2, будем иметь: ( 2 n )! ! 1 x n 1 1 (2n 1)!! 2 n 1 x (-1<x<1). arcsin′(х)= n 1 ( 2n)!! 1 x2 4.24. Теорема. Пусть вещественная функция f непрерывна на отрезке [a, b] и дифференцируема в интервале (a, b) . Для того, чтобы f была постоянной на отрезке [a, b] (т.е. при всех хє [a, b] принимала одно и то же значение), необходимо и достаточно условие: f′(х)=0 для всех хє (a, b) Необходимость условия очевидна. (1 x) m 1 mx
Доказательство достаточности (с использованием формулы Лагранжа) предоставляется читателю. Следствие. Если две функции f: [a, b] →R и g: [a, b] →R непрерывны на отрезке [a, b] и дифференцируемы в интервале (a, b) , причем f′(х)=g′(х) для всех хє (a, b) , то эти функции на всем отрезке [a, b] разнятся лишь на постоянную: f(x)=g(x)+C (хє [a, b] , C=const).
483 4.25. Теорема. Пусть функция f: [a, b] →R непрерывна на отрезке [a, b] и дифференцируема в интервале (a, b) . Для того, чтобы функция f была неубывающей (невозрастающей) на отрезке [a, b] , необходимо и достаточно условие f′(х)≥0 (f′(х)≤0) для всех хє (a, b) . Доказательство этой теоремы также предоставляется читателю. 4.26 Теорема. Для того, чтобы непрерывная на [a, b] и дифференцируемая в (a, b) вещественная функция f была строго возрастающей (строго убывающей) на отрезке [a, b] , необходимы и достаточны условия: 1) f′(х)≥0 (≤0) для всех хє (a, b) 2) f′(х) не обращается тождественно в нуль ни в каком промежутке, составляющем часть (a, b) . Доказательство. Пусть f строго возрастает (строго убывает) на отрезке [a, b] . Тогда, в силу 4.25, f′(х)≥0 (≤0) для всех хє (a, b) . Далее, если бы выполнялось равенство f′(х)=0 для всех х из какого-либо промежутка, составляющего часть (a, b) , то (согласно 4.24) функция f была бы постоянной в этом промежутке. Так как это противоречит предположению о функции f, то f′(х) не обращается тождественно в 0 ни в каком промежутке, составляющем часть (a, b) . Этим доказана необходимость условий теоремы. Для доказательства их достаточности допустим, что условия 1) и 2) выполняются. Пусть, для определенности, f′(х)≥0 для всех хє (a, b) . Тогда, согласно 4.25, функция f будет неубывающей на [a, b] . Чтобы доказать, что f является строго возрастающей функцией, допустим противное, т.е. что существуют такие точки х 1,х2є [a, b] , что х1<х2, но f(х1)=f(х2). Тогда для всех хє(х1,х2) будем иметь f(х1)≤f(x)≤f(х2), т.е. функция f оказывается постоянной в промежутке (х1,х2). Так как это противоречит условию 2), то f является строго возрастающей на [a, b] , ч.т.д. Замечание. На практике обычно пользуются следующим достаточным признаком строгого возрастания (строгого убывания) функции: если функция f: [a, b] →R непрерывна на [a, b] и дифференцируема в интервале (a, b) , причем f′(х)>0 (<0) при всех хє (a, b) , кроме конечного числа значений х, то f является строго возрастающей (строго убывающей) функцией на [a, b] . Справедливость этого утверждения следует из теоремы Дарбу. Заметим еще следующее. Пусть А-промежуток в R, f-вещественная функция, определенная на А, и х 0-внутренняя точка промежутка А. Если существует такое δ>0, что (х0-δ, х0+δ)А и в промежутке (х0-δ,х0] функция f– строго возрастающая, а в промежутке [х0, х0+δ)-строго убывающая, то ясно, что в точке х0 f имеет собственный максимум (см. упр. 116 к главе 2). Согласно доказанному, для того, чтобы f имела в точке х0 собственный максимум, достаточно выполнение следующих условий: 1) f непрерывна в точке х0; 2) в интервалах (х0-δ,х0 ) и (х0, х0+δ) функция f дифференцируема и f′(х)>0 при всех х из (х0-δ,х0) (за исключением, быть может, конечного числа значений х), а при всех х из (х0, х0+δ) (кроме конечного числа значений х), f′(х)<0. Легко сформулировать (это предоставляется читателю) достаточные условия того, чтобы f имела в точке х0 собственный минимум, а также несобственный максимум и несобственный минимум. Если в точке экстремума функция f дифференцируема, то (согласно теореме 4.9) в этой точке производная f′обращается в 0.
484 Однако, в точке экстремума производная может не существовать вовсе или равняться 3
2
бесконечности (так будет, например, для функций |x| и õ в точке х0=0). Поэтому при разыскании точек экстремума функции f «подозрительными» по экстремуму следует считать те точки, в которых производная f′ обращается в 0 (такие точки назваются стационарными), а также те точки, в которых производная не существует или равна бесконечности. Если в интервале (a, b) , в котором разыскиваются точки экстремума непрерывной функции f, производная f′ существует и конечна во всех точках, за исключением конечного их числа, и если число стационарных точек функции f также конечно, то в этом случае разыскание точек экстремума особенно просто. В самом деле, общее число точек xi (i=1,2,…,k), «подозрительных» по экстремуму, оказывается конечным и мы можем расположить их в порядке возрастания: a x1 x2 ... xk 1 xk b. При этом в каждом из интервалов
(a, x1 ), ( x1 , x2 ),..., ( xk 1 , xk ), ( xk , b) производная f′ сохраняет определенный знак. Это следует из теоремы Дарбу, ибо все стационарные точки функции f находятся среди точек х1, х2,…,хк. Если теперь в интервале (a, x1 ) f′(х)>0, а в интервале (х1,х2) f′(х)<0, то в точке х1 функция f имеет собственный максимум. Если в интервале (a, x1 ) f′(х)<0, а в интервале (х1,х2) f′(х)>0, то в точке х1 функция f имеет собственный минимум. В остальных случаях точка х1 не является точкой экстремума функции f. Аналогичные рассуждения применимы к каждой из точек х2, х3,…,хк. При разыскании экстремумов исследование знака производной слева и справа от стационарной точки х 0 можно заменить исследованием знака второй производной f″(х0), если f″(х0)≠0 (для действительных многочленов это было доказано в упр. 117 к главе 2). В самом деле, если, например, f″(х0)>0, то при x<x0 и достаточно близких к х0
f ( x) f ( x0 ) f ( x) 0, откуда f′(х)<0 вблизи точки х0 слева. Аналогично x x0 x x0
доказывается, что f′(х)>0 вблизи точки х0 справа. Следовательно, в точке х0 функция f имеет собственный минимум (при f″(х0)<0–собственный максимум). Если f″(х0)=0, то к исследованию стационарной точки на экстремум можно привлечь высшие производные в точке х0, аналогично тому, как это сделано в упр. 117 к главе 2. В заключение заметим, что указанные правила исследования на эсктремум «подозрительных» значений х могут оказаться непригодными. Это будет в тех случаях, когда в любой близости от испытуемой точки содержится бесконечное множество других подобных же точек, и производная не сохраняет определенного знака с той или другой стороны от рассматриваемой точки. Следующие два примера взяты из вышеупомянутой книги Г.М. Фихтенгольца (т. I) 1 1) Пусть f(x)=x2 sin при х≠0 и f(0)=0. Тогда при х≠0 x
f ( x) 2 x sin
f ( x) f (0) 1 1 1 lim( x sin ) 0. cos , а при х=0 f (0) lim x x x x x 0 x 0
Мы видим, что в любой близости от стационарной точки х=0 как слева, так и справа производная бесконечное множество раз меняет знак (при nєN и x 1, а при x
1 f′(х)=1). (2n 1)
1 f′(х)=2n
485
1 2) Пусть f(x)=x2(1+sin ) при х≠0 и f(0)=0. В этом примере, как и в предыдущем, õ 1 1 f′(0)=0, а при х≠0 f′(x)=2x(1+sin )-cos . Следовательно, в любой близости от õ õ стационарной точки х=0 как слева, так и справа производная бесконечное множество раз меняет знак. В обоих примерах вышеуказанные правила исследования на экстремум неприложимы (для исследования на экстремум стационарной точки х=0). Заметим, что в примере 1) точка х=0 не является точкой экстремума функции f, ибо f(0)=0 и в любой окрестности точки х=0 функция бесконечное множество раз меняет знак. В примере 2) точка х=0 является точкой несобственного минимума функции f, ибо f(0)=0, при х≠0 f(х)≥0 и в любой окрестности точки х=0 функция f обращается в 0 бесконечное множество раз ( f (
1 2n
) 0) .
2
Дифференцирование векторнозначных функций. 4.27. Пусть А-промежуток в R и f–отображение А в С, т.е. f–комплекснозначная функция вещественной переменной. Определим функции f1:А→R и f2:А→R, полагая для любого tєА: f1(t)=Ref(t), f2(t)=Jmf(t). Тогда f(t)=f1(t)+if2(t) для любого tєА. Определение. Отображение f:А→С называется дифференцируемым в точке хєА, если
существует
конечный
предел
при
t→x
lim
f (t ) f ( x) a bi tx
(*) Если f дифференцируема в точке х, т.е. имеет место равенство (*), то число a bi называется производной функции f в точке х. При этом пишут: f′(x)= = a bi . 4.28. Теорема. Отображение f=f1+if2 промежутка АR в пространство С дифференцируемо в точке хєА тогда и только тогда, когда в этой точке дифференцируемы вещественные функции f1 и f2. При этом f′(x)=f′1(x)+if′2(x). Доказательство. Пусть f дифференцируема в точке х, т.е. имеет место (*). Задавшись произвольным ε>0, найдем такое δ>0, что при всех tєА(х-δ, х+δ) будет иметь
место
неравенство
|
f (t ) f ( x) (à bi) | , tx
т.е.
f1 (t ) f1 ( x) f (t ) f 2 ( x) à i[ 2 b] | или tx tx f (t ) f1 ( x) f (t ) f 2 ( x) [ 1 à ]2 [ 2 b]2 . Отсюда следует, что tx tx f (t ) f1 ( x) f (t ) f 2 ( x) | 1 à | и | 2 b | при всех tєА(х-δ, х+δ). Но это tx tx f1 (t ) f1 ( x) f (t ) f 2 ( x) b , т.е. f′1(x)= à и a и lim 2 и означает, что lim t x t x t x t x f′2(x)= b , откуда f ( x) a bi f1( x) if 2( x) . Обратно, пусть в точке хєА дифференцируемы обе функции f1 и f2. Обозначим f′1(x)= à , f′2(x)= b и докажем, что |
486 функция f=f1+if2
f (t ) f ( x) a bi . t x x
дифференцируема в точке х, причем lim t
Зададимся произвольным ε>0 и найдем такое δ1>0, что при всех tєА(х-δ1, х+δ1) будет:
f1 (t ) f1 ( x) a | . Точно так же, найдем такое δ2>0, что при всех tєА(х-δ2, tx 2 f 2 (t ) f 2 ( x) b | . Взяв δ=min(δ1, δ2), х+δ2) будет выполняться неравенство | tx 2 f1 (t ) f1 ( x) a | при всех tєА(х-δ, х+δ) будем иметь: | и tx 2 f (t ) f 2 ( x) | 2 b | . tx 2 |
Следовательно, для указанных значений t
|
f (t ) f1 ( x) f (t ) f 2 ( x) f (t ) f ( x) à ]2 [ 2 b ]2 . (a bi) | [ 1 tx tx tx Но это и означает дифференцируемость функции f в точке х и равенство
f ( x) a bi f1( x) if 2( x) .
4.29. Если функция f:А→С (АR) дифференцируема в точке х промежутка А, то она непрерывна в этой точке. Доказательство. Если функция f=f1+if2 дифференцируема в точке х, то (согласно 4.28) в точке х дифференцируемы вещественные функци f1 и f2, а это влечет за собой (см. 4.2) их непрерывность в точке х. Но тогда (см. 3.152) и функция f непрерывна в точке х. 4.30. Теорема. Если функции f:А→С и g:А→С (А-промежуток в R) дифференцируемы в точке хєА, то и функции f+g, fg и (для функции
f дифференцируемы в точке х g
f предполагается, что g(х)≠0). При этом: g
(a) (f+g)′(x)=f′(x)+g′(x); (b) (fg)′(x)=f′(x)g(x)+f(x)∙g′(x);
f f ( x) g ( x) f ( x) g ( x) (c) ( x) . g 2 ( x) g Доказательство этой теоремы дословно повторяет доказательство теоремы 4.3. 4.31. Определение. Пусть А- промежуток в R и f–отображение промежутка А в пространство Rn (n≥2). При любом tєА f(t)=(f1(t), f2(t),…,fn(t)), где f1:А→R, f2:А→R,…, fn:А→R суть компоненты отображения f (см. 3.152). Отображение f называется дифференцируемым в точке хєА, если существует такой элемент
a (a1 , a2 ,..., an ) R n , что ||
f (t ) f ( x) a || t 0. x tx
Такой
элемент à , если он существует, называется производной отображения f в точке х и обозначается f′(х).
487 4.32 Замечание. Предельное соотношение
||
f (t ) f ( x) a || t 0 x tx
равносильно такому
(
f1 (t ) f1 ( x) f (t ) f n ( x) f (t ) f 2 ( x) a1 ) 2 ( 2 a2 ) 2 ... ( n an ) 2 t 0. x tx tx tx
Отсюда следует, что отображение f дифференцируемо в точке х тогда и только тогда, когда в этой точке дифференцируемы все его компоненты f1, f2, …, fn. При этом f′(х)=(f1′(х), f2′(х),…, fn′(х)). Далее, из дифференцируемости отображения f в точке х следует непрерывность компонент f1, f2, …, fn в точке х (см. 4.2), а это влечет за собой непрерывность отображения f в точке х (см. 3.152). Легко доказать также (что предоставляется читателю), что если отображения f:А→Rn и g:А→Rn дифференцируемы в точке хєА, то и отображение f+g дифференцируемо в точке х, причем (f+g)′(x)=f′(x)+g′(x). Кроме того, если обозначить черезфункцию =f1g1+f2g2+…+fngn, то ( )′(x)= + . В самом деле, ( )′(x)=f1′(x)∙g1(x)+f1(x)g1′(x)+f2′(x)∙g2(x)+f2(x)g2′(x)+…+fn′(x)∙gn(x)+ +fn(x)gn′(x)=(f1′(x)∙g1(x)+f2′(x)∙g2(x)+…+fn′(x)∙gn(x))+(f1(x)∙g′1(x)+f2(x)∙g′2(x)++…+fn(x)∙g′n( x))= + . Заметим, что формула Лагранжа и правило Лопиталя не имеют места для комплекснозначных функций вещественного аргумента. Следующие примеры взяты из книги У. Рудина «Основы математического анализа». 1. Пусть функция f:R→С определена равенством: f(x)=cosx+isinx. Тогда при всех хєR f′(x)=-sinx+icosx. Выясним, имеет ли место формула Лагранжа применительно к промежутку [0,2π]. Имеем: f(2π)-f(0)=1-1=0; 2πf′(х)=2π(-sinx+icosx), откуда |2πf′(х)|=2π при любом хєR. Следовательно, f(2π)-f(0)≠2πf′(x), ни при каком значении хєR. 2. Пусть функции f:(0,1)→С и g:(0,1)→C определены равенствами: 1 1 f(x)=x, g(x)=x+x2(cos 2 +isin 2 ) при всех хє(0,1). õ õ Имеем: при х→0 lim
f ( x) lim g ( x)
1 1. 1 1 1 x(cos 2 i sin 2 ) x x
Вместе с тем,
1 1 1 1 1 1 2 i sin ) x [ sin ( 2 ) i cos ( 2 )] x2 x2 x2 x3 x2 x3 1 1 2 1 1 1 2 x(cos 2 i sin 2 ) (sin 2 i cos 2 ), так что x x x x x f ( x) x 1 1 1 1 и g ( x) 2 x 2 x (cos 2 i sin 2 ) 2(sin 2 i cos 2 ) x x x x x f ( x) 1 1 1 1 g ( x) 2 x 2 x (cos 2 i sin 2 ) 2(sin 2 i cos 2 ) x x x x g ( x) 1 2 x(cos
488
x
2(sin если
lim
1 1 1 1 2 i cos ) x 2 x (cos i sin ) x2 x2 x2 x2
считать,
что,
например,
f ( x) f ( x) 0 lim 1. g ( x) g ( x)
1 0<x< . 2
x , 2 x 2x 2
Следовательно,
при
х→0
4.33. Теорема. Пусть отображение f: [a, b] →Rn непрерывно на [a, b] и дифференцируемо в интервале (a, b) . Тогда существует такая точка сє (a, b) , что
|| f (b) f (a) || (b a) || f (c) || . Доказательство. Пусть f1, f2,…,fn–компоненты отображения f, т.е. при любом tє [a, b] f(t)=(f1(t), f2(t),…, fn(t)). Тогда f (b) f (a) ( f1 (b) f1 (a), f 2 (b) f 2 (a),..., f n (b) f n (a)). Определим
функцию
φ: [a, b] →R,
полагая
для
любого
tє [a, b]
(t ) f (b) f (a), f (t ) , (t ) ( f1 (b) f1 (a)) f1 (t ) ( f 2 (b) f 2 (a)) f 2 (t ) ... ( f n (b) f n (a)) f n (t ).
т.е.
Функция φ непрерывна на [a, b] и дифференцируема в интервале (a, b) . По формуле Лагранжа
(b) (a) (b a) (c),
где
сє (a, b) .
(b) (a) ( f1 (b) f1 (a)) ... ( f n (b) f n (a)) || f (b) f (a) || , (c) f (b) f (a), f (c) . Таким образом, 2
2
2
Но а
|| f (b) f (a) || 2 (b a) (c) (b a) f (b) f (a), f (c) (b a) || f (b) f (a) || || f (c) ||, т.е. || f (b) f (a) || (b a) || f (b) f (a) || || f (c) || . Отсюда 2
|| f (b) f (a) || (b a) || f (c) ||, ч.т.д. Замечание. Если f–отображение отрезка [a, b] в С, непрерывное на [a, b] и дифференцируемое в (a, b) , то доказанное в 4.33 неравенство принимает вид:
| f (b) f (a) | (b a) | f (c) |, ñ (a, b). Таков аналог формулы Лагранжа для отображений f: [a, b] →С или f: [a, b] →Rn. Дифференцирование элементарных функций комплексной переменной. 4.34 Определение. Пусть А-множество в пространстве С, z0-внутренняя точка множества А и f–функция из А в С. Функция f называется дифференцируемой в точке z0, если существует такое комплексное число w0, что при z→z0
lim
f ( z) f ( z0 ) w0 0 z z0
(*)
Это означает (с учетом того, что z0–внутренняя точка множества А), что по любому ε>0 можно найти такое δ>0, что все точки zєС, удовлетворяющие неравенству 0<|z-z0|<δ,-будут принадлежать множеству А и для них будет выполняться неравенство
f ( z) f ( z0 ) w0 . z z0 Если f дифференцируема в точке z0, т.е. имеет место равенство (*), то число w0 называется производной функции f в точке z0 и обознaчается f′(z0): f′(z0)=w0.
489
f ( z) f ( z0 ) f ( z 0 ). z z 0 z z
При этом равенство (*) можно записать в виде: lim
0
4.35. Теорема. Если функция f:А→С дифференцируема в точке z0єA (z0внутренняя точка множества АС), то она непрерывна в этой точке. Доказательство.
f ( z) f ( z0 ) f ( z 0 ) ( z ). z z0
Обозначим
| ( z ) | 0. Так как f(z)-f(z0)=(f′(z0)+α(z))(z-z0), то z z0
0, откуда и следует, что f(z0)|≤(|f′(z0)|+|α(z)|)·|z-z0| z z0
Тогда |f(z)-
lim f ( z ) f ( z 0 ) . z z0
4.36. Теорема. Если функции f:А→С и g:А→С дифференцируемы в точке f z0єАС (z0-внутренняя точка множества А), то и функции f+g, fg и g f дифференцируемы в точке z0 (для функции предполагается, что g(z0)≠0). При этом g (a) (f+g)′(z0)=f′(z0)+g′(z0); (b) (fg)′(z0)=f′(z0)·g(z0)+f(z0)g′(z0); (c) (
f ( z 0 ) g ( z 0 ) f ( z 0 ) g ( z 0 ) f )′(z0)= . g 2 ( z0 ) g
Доказательство этой теоремы дословно повторяет доказательство теоремы 4.3 4.37 Теорема. Пусть G и U–открытые множества в С и f–непрерывное инъективное отображение множества G в U. Пусть также функция φ:U→С дифференцируема в каждой точке множества U и для любого zєG имеет место равенство φ(f(z))=z. Тогда функция f дифференцируема во всякой точке z0єG, для которой φ′(f(z0))≠0, причем f′(z0)=
1 . ( f ( z 0 ))
Доказательство. Для любого zєG, z≠z0 имеем 1
( f ( z )) ( f ( z0 )) f ( z ) f ( z0 ) f ( z ) f ( z0 ) . z z0 ( f ( z )) ( f ( z0 )) f ( z ) f ( z0 ) Заметим, что f(z)≠f(z0) ввиду инъективности f. Так как
lim f ( z ) f ( z0 ) (непрерывность функции f) и функция φ z z0
дифференцируема в точке f(z0), то lim
( f ( z )) ( f ( z0 )) f ( z ) f ( z0 )
( f ( z0 )) при z→z0.
Поскольку φ′(f(z0))≠0, то при z→z0
lim
f ( z) f ( z0 ) 1 1 , т.е. f′(z0)= . z z0 ( f ( z 0 )) ( f ( z 0 ))
4.38. Теорема. Пусть множество АС, z0-внутренняя точка множества А и функция f:А→С дифференцируема в точке z0. Пусть также f(А)ВС, точка w0=f(z0) является внутренней точкой множества В и функция g:В→С дифференцируема в точке w0. Тогда суперпозиция h=g◦f дифференцируема в точке z0, причем
490 (g◦f)′(z0)=g′(f(z0))·f′(z0). Доказательство этой теоремы почти дословно повторяет доказательство теоремы 4.7 и предоставляется читателю. 4.39 Примеры вычисления производных некоторых элементарных функций комплексной переменной. 1. Производная степенной функции с натуральным и целым показателем. Пусть функция fn:С→С определена равенством: fn(z)=zn при всех zєС (nєN). Если n=1, то производная функции f1 (f1(z)=z при всех zєС) в любой точке z0єС равна 1:
f1 ( z ) f1 ( z 0 ) z z0 lim 1 при z→z0. z z0 z z0
f1( z0 ) lim
z 2 z02 lim( z z0 ) 2 z0 при z→z0. z z0 Так как z0-любая точка из С, то f 2( z ) 2 z для любого zєC. При n=2: f 2( z 0 ) lim
Индукцией по числу n (с использованием теоремы 4.36 (b)) легко доказать, что при любом n≥2 (nєN) f′n(z)=nzn-1 (z-любое из С). Это можно доказать и непосредственно:
f n( z ) lim
nz
n 1
wn z n w z
lim( w n1 w n2 z ... wz n2 z n1 ) z n1 z n1 ... z n1
при w→z (мы воспользовались непрерывностью степенной функции, см.
3.153). Если
f n( z )
целое,
n-отрицательное
0 z |n| 1 | n | z |n|1 z 2|n|
n
z
1 z | n|
и
(nєN, n≥2).
Согласно доказанному в 2.187, при любом z≠0 значений:
fn(z)=
z n1 n 2 n nz n1 при любом z≠0. z
2. Производная функции f(z)=
n
то
z n | z | (cos
n
z
имеет ровно n попарно различных
arg z 2k arg z 2k i sin ), где к=0,1,…,n-1. n n
Зафиксируем какое-либо из указанных значений к и рассмотрим функцию f:С\R-→С, для которой f(z)=
n
z n | z | (cos
arg z 2k arg z 2k i sin ). n n
Так как функция arg непрерывна на множестве С\R-, то легко видеть, что и функция f непрерывна на открытом множестве С\R-. Если z1≠z2 (z1,z2єС\R-), то f(z1)≠f(z2), т.е. отображение f инъективно. Если обозначить через φ функцию, для которой при всех zєС φ(z)=zn, то φ(f(z))=z для любого zєС\R-. Согласно теореме 4.37, для любого z0єС\R-.
f ( z0 ) ибо
n
z0 0 .
1 1 , n[ f ( z 0 )]n1 n(n z 0 ) n1
491
1 или n(n z ) n1 1 (zєС\R-). В частности ( z ) . 2 z
Так как z0–любая точка из С\R-, то можем написать: f ( z ) n коротко (но неточно): ( z )
1 n( z ) n1 n
В дальнейшем будем употреблять такую точную запись:
(n )( z )
n 1 z n(n z ) n1 nz
(zєС\R-).
3. Производная экспоненциальной функции exp (exp(z)=ez).
e z 1 1 при z→0. Лемма lim z Доказательство.
Пусть
где
z=x+iy,
х,уєR
и
х2+у2≠0.
Тогда
e 1 e (cos y i sin y ) 1 . z x iy z
x
e x 1 1 при x→0. Согласно доказанному в упражнении 83 к главе 3, lim x
e x 1 1 ïðè õ 0 ( x ) x Определим функцию α:R→R, полагая . 0 ïðè õ 0 ( õ) 0 даже если х при стремлении Тогда при всех хєR ех=1+х+х∙α(х) и lim õ0 к 0 принимает значение 0. Далее,
lim
cos y 1 cos y cos 0 lim sin 0 0 y y 0
cos y 1 ( y) y 0 даже
eсли
у
при
y→0.
Полагая,
ïðè y 0 ( y) 0 , будем иметь: cosy=1+y·β(y) и lim y 0 ïðè y 0
при
стремлении
к
0
принимает
значение
0.
Полагая
sin y 1 ïðè y 0 ( y) y ( y) 0 даже если у , получим: siny=y(1+γ) и lim y 0 0 ïðè y 0 при
стремлении
к
0
принимает
значение
0.
Следовательно,
e 1 (1 x x )[1 y i( y y )] 1 z x iy 1 y iy iy x xy ixy (1 ) x [1 y iy (1 )] 1 x iy z
492
y y y y i ( y) ( y) x ix (1 ( y)) x iy x iy x iy x iy x ( x)[1 y ( y) iy (1 ( y))] , откуда x iy 1 ( y)
ez 1 y 1 [ ( y) i ( y) x ( y) ix (1 ( y))] z x iy x ( x)[1 y ( y) iy (1 ( y))] . x iy
(*)
Если z→0 (не принимая значения 0), то и |z|→0, т.е. х→0 и у→0 (х иу могут принимать нулевые значения, но если х=0, то у≠0, а если у=0, то х≠0).
y Учитывая, что x iy
| y| x2 y2
1 и
x 1 и переходя к пределу в x iy
ez 1 1) 0 , ч.т.д. равенстве (*) при z→0, будем иметь: lim( z Теперь легко вычислить производную экспоненциальной функции в любой точке z0єС:
z z0 e z e z0 1 z0 e exp( z 0 ) lim lim[ e ] z z0 z z0
e z z0 1 e lim e z0 exp( z0 ) при z z0 z0
z→z0. Так как z0–любая точка из С, то
exp′(z)=exp(z) при всех zєС. При вычислении производной мы использовали теорему 2.195. 3. Производная логарифмической функции. Логарифмическая функция Ln, для которой Lnz=ln|z|+iargz,–непрерывна на множества С\R- (см. 2.203 и упражнение 79 к главе 3). Если z1≠z2 (z1,z2єС\R- ), то
e , т.е. z1=z2). Следовательно, Ln и Lnz1≠Lnz2 (в противном случае e есть непрерывное инъективное отображение множества С\R- в С. Так как exp(Lnz)=eLnz=z при всех zєС\R-, то, согласно теореме 4.37, Lnz1
Ln( z )
Lnz2
1 1 1 для любого zєС\R-. Обозначим через Е exp( Lnz) exp( Lnz) z
следующее множество: Е={zєС: zєR и z≤-1}. Если zєС\Е, то 1+zєС\R-. Согласно теореме 4.38, функция Ln(1+z) (мы допускаем вольность речи), определенная на множестве С\Е, дифференцируема в каждой точке этого множества и ее производная равна
(Ln◦φ)′(z)=Ln′(1+z)∙φ′(z)=
1 , где φ-функция, для которой φ(z)=1+z при всех 1 z
zєС\Е. 4. Производные тригонометрических и гиперболических функций комплексной переменной.
493 (а)
Так
как
при
любом
zєС
e zi e zi sin z 2i
(см.
2.199),
то
1 e zi e zi zi zi sin z (ie ie ) cos z, т.е. sin′(z)=cosz. Мы использовали 2i 2 теорему 4.38. (b)
Так
как
при
любом
c
zєС
e zi e zi z o s , 2
то
1 zi e zi e zi zi cos( z ) (ie ie ) sin z, т.е. 2 2i cos′(z)=-sinz. (с)
tg ( z )
Используя
теорему
4.36
(с),
находим:
sin( z ) cos z sin z cos( z ) 1 для любого z из С, отличного от cos 2 z cos 2 z
чисел вида (2k+1)
, где кєZ. 2
(d) Так как при любом zєС
e z e z e z e z shz , то shz chz , а 2 2
e z e z chz shz. 2 sh( z )chz shz ch( z ) ch 2 z sh2 z 1 2 для любого Далее, thz 2 2 ch z ch z ch z i (см. 2.199), где к-произвольное целое число. 2 6. Производные функций Arctg и Arcsin (а) Пусть Е={zєС: Rez=0 и |Jmz|≥1}
zєС, отличного от чисел вида (2k+1)
Согласно 2.208, при zєС\Е (и только при этих значениях z) значения функции
1 iz (мы допускаем вольность речи) принадлежат множеству С\R-, 1 iz
где
дифференцируема функция Ln. Следовательно, (теорема 4.38), на множестве С\Е дифференцируема функция Arctg, ибо Arctgz=
1 1 iz Ln . Имеем: 2i 1 iz
494
1 1 iz i(1 iz ) (1 iz ) (i) 1 1 1 (i z i z ) , 2 2 2i 1 iz 2i 1 z (1 iz ) 1 z2 1 т.е. Arctg ( z ) ( zєС\Е). 1 z 2 Arctg ( z )
(b) Пусть FС-множество всех действительных чисел z, удовлетворяющих неравенству |z|≥1.
В 2.211 на множестве С\F (с добавление точек -1 и 1) была определена функция Arcsin (главное значение арксинуса):
1 i
Arcsinz= Ln(iz 1 z ), 2
где
значение квадратного корня берется
с
положительной реальной частью. В 2.212 было показано, что при zєC\F (и только при этих значениях z) значения функции 1-z2 принадлежат множеству С\R-, где
... . Таким образом, функция iz 1 z (мы дифференцируема функция допускаем вольность речи) дифференцируема на множестве С\F и 2
(iz 1 z ) i
1
2
2 1 z 2
(2 z ) i
z 1 z 2
i(iz 1 z 2 ) 1 z 2
.
В 2.212 было также показано, что при любом zєС iz 1 z єC\R-, а на множестве C\R- дифференцируема функция Ln. Следовательно, функция Arcsin дифференцируема на множестве C\F (теорема 2
4.38),
1 1 i(iz 1 z 2 ) Arc sin ( z ) , i iz 1 z 2 1 z 2
причем:
Arc sin ( z )
1
т.е.
(zєС\F).
1 z 2
Замечание. Нетрудно доказать, что предоставляется читателю, что при zєС\F
Re(iz 1 z 2 ) 0, откуда следует, что
2
Re( Arc sin z )
2
.
4.40. Разложение в степенные ряды показательной тригонометрических функций и гиперболических функций комплексной переменной. (а) Определим функцию Е:С→С как сумму ряда:
zn z2 zn E ( z ) 1 z ... ... 2! n! n 0 n!
(*)
495 Применяя признак Даламбера, легко убедиться в том, что ряд в правой части равенства (*) абсолютно сходится при любом комплексном z, т.е. функция Е действительно определена на всем С. Используя результат упражнения 54 (или 55) к главе 3, для любых двух комплексных чисел z1 и z2 будем иметь:
z12 zn z2 zn ... 1 ...) x(1 z 2 2 ... 2 ...) 1 ( z1 z 2 ) 2! n! 2! n! 2 2 n n 1 n2 2 z2 z1 z2 z2 z2 z1 z 2nk z1k ( z1 z 2 ) ... ( z1 ... ... 2! 2! n! (n 1)! (n 2)! 2! (n k )! k! E ( z1 ) E ( z 2 ) (1 z1
z1n1 zn ( z z2 ) 2 1 1 ) ... 1 ( z1 z 2 ) 1 ... ( z1n nz1n1 z 2 ... Ñnnk z1k z 2nk (n 1)! n! 2! n!
z2
... z 2n ) ... E ( z1 z 2 ), т.е. E ( z1 z2 ) E ( z1 ) E( z2 ). В частности, для любого z=x+iyєC (х,уєR) имеем: E(z)=E(x)·E(iy).
x2 xn ... ... e x (см. 4.23), а Е(iy)= Но Е(х)= 1 x 2! n! 2 n (iy ) (iy ) y2 y3 y4 1 iy ... ... 1 iy i 2! n! 2! 3! 4! y5 y6 y7 i i ... (**) 5! 6! 7! Легко проверить (что предоставляется читателю), что сходимость комплексного
ряда
(a n 1
a n 1
n
bn i) (a n , bn R) равносильна сходимости двух вещественных рядов
n
и
b n 1
n
, причем
(a n 1
n
n 1
n 1
bn i) an i bn .
Применение этого утверждения будем называть отделением вещественной части
от мнимой в комплексном ряде
(a n 1
n
bn i ).
Отделяя вещественную часть от мнимой в правой части равенства (**), получим:
y2 y4 y6 y3 y5 y7 E (iy ) (1 ...) i( y ...), т.е., согласно 2! 4! 6! 3! 5! 7! 4.23,
E(iy)=cosy+isiny. Таким образом, E(z)=ex(cosy+isiny)=ez для любого zєС.
z2 zn zn ... ... Следовательно, e 1 z для любого zєС. 2! n! n 0 n! z
e iz e iz (b) При любом zєС sin z (2.199). 2i Согласно доказанному в (а),
496
(iz ) 2 (iz ) n e 1 iz ... ..., 2! n! n (iz ) 2 iz n (iz ) e 1 iz ... (1) ..., îòêóäà 2! n! (iz ) 3 (iz ) 2 n1 iz iz e e 2(iz ... ...) 3! (2n 1)! iz
z3 z 2 n1 n 2i ( z ... (1) ...). Ñëåäîâàòåë üíî , 3! (2n 1)! z3 z5 z 2 n 1 n sin z z ... (1) ... 3! 5! (2n 1)! e iz e iz (с) Так как при любом zєС (2.199), 2 2n (iz ) 2 (iz ) 2 n z2 z4 n z cos z 1 ... ... 1 ... (1) ..., т.е. 2! (2n)! 2! 4! (2n)! cos z
cos z 1
то
z2 z4 z 2n e z ez ... (1) n ... Так как при любом zєС chz 2! 4! (2n)! 2
z2 z4 z 2n ... ... (2.199), то chz 1 2! 4! (2n)! e z ez z3 z5 z 2 n1 z ... ... Аналогично, shz 2 3! 5! (2n 1)! Замечание. (а) Согласно доказанному в 4.23, при хє(-1,1)
(2n 1)!! 2 n x . ( 2 n )! ! n 1
arcsin ( x) 1
(2n 1)!! x 2 n1 Рассмотрим ряд x (хєR) и исследуем его на сходимость, n 1 ( 2n)!! 2n 1
применяя признак Даламбера. Имеем:
an1 (2n 1)!! x 2 n3 (2n 1)!! x 2 n1 : an (2n 2)!! 2n 3 (2n)!! 2n 1
так
что
lim
(2n 1) x 2 (2n 1) 2 x 2 x 2 , 2n 3 (2n 2) (2n 3) n (2n 2) 2n 1
an1 | x 2 | при n→∞. Поэтому при |x|<1, т.е. при хє(-1,1) an
рассматриваемый ряд абсолютно сходится, а при |x|>1–расходится. Считая, что хє(-1,1),
(2n 1)!! x 2 n1 . ( 2 n )! ! 2 n 1 n 1
обозначим S ( x) x
497 В главе 5 будет доказано, что степенной ряд можно почленно дифференцировать внутри круга сходимости (в вещественном случае-внутри промежутка сходимости). Отсюда будет следовать, что при всех хє(-1,1)
(2n 1)!! 2 n x arcsin ( x), т.е. (S-arcsin)′(x)=0 при всех хє(-1,1). На n 1 ( 2n)!!
S ( x) 1
основании теоремы 4.24, можем утверждать, что при всех хє(-1,1) S(x)-arcsinx=S(0)-arcsin0, т.е.
(2n 1)!! x 2 n1 arcsin x õ ( 2 n )! ! 2n 1 n 1
(|x|<1)
Напомним, что эта формула будет вполне доказанной после доказательства (в главе 5) теоремы о почленном дифференцировании степенного ряда. (b) Пусть Е={zєС: zєR и z≤-1}. Согласно доказанному в 4.39 (пример 4), функция 1 Ln(1+z) дифференцируема в С\Е и ее производная равна . Считая |z|<1, можем 1 z написать
1 1 z z 2 z 3 ... (1) n z n ... (упр. 27 к главе 3). Рассмотрим ряд 1 z n 1 n 1 z2 z3 z4 n z n z z ... (1) ... (1) 2 3 4 n 1 n 1 n 0
и исследуем его на сходимость, применяя признак Даламбера. Имеем:
an1 | z |n2 | z |n1 | z | (n 1) an1 : | z |, lim | z | при n→∞. т.е. n an n 2 n 1 n2 an Поэтому при |z|<1 рассматриваемый ряд сходится (абсолютно), а при |z|>1–расходится. Считая, что |z|<1, обозначим n 1 z2 z3 z4 n z S ( z ) z ... (1) ... 2 3 4 n 1
На основании вышеупомянутой теоремы о почленном дифференцировании степенного ряда можем утверждать, что функция S дифференцируема внутри круга |z|<1 и при этих значениях z
S ( z ) 1 z z 2 z 3 ...
1 . 1 z
Таким образом, производная функции Ln(1+z)-S(z) (мы допускаем вольность речи) равна нулю всюду внутри круга |z|<1. Отсюда, как мы это вскоре докажем, следует, что при любом zєС, для которого |z|<1, Ln(1+z)-S(z)=Ln(1+0)-S(0)=0, т.е.
z2 z3 z4 Ln(1 z ) z ... 2 3 4
(|z|<1)
(с) Пусть Е={zєС: Rez=0 и |Jmz|≥1}. Согласно доказанному в 4.39 (пример 6), на множестве С\Е функция Arctg дифференцируема и
Arctg ( z )
1 . 1 z 2
Считая, что |z|<1 (круг {zєС: |z|<1} С\Е), будем иметь:
Arctg ( z ) 1 z 2 z 4 z 6 ...
z3 z5 z7 ... Пусть S(z)= z 3 5 7
(|z|<1).
498 Рассуждая как и в пункте (b), заключаем, что (Arctg-S)′(z)=0 при любом z с |z|<1. Отсюда, как и выше, находим:
z3 z5 z7 Arctgz z ... 3 5 7
(|z|<1).
Заметим, что круг |z|<1 составляет лишь «малую» часть открытого множества, в котором непрерывна и дифференцируема функция Arctg. Однако, указанное разложение Arctgz в степенной ряд имеет место только в круге |z|<1. В чем причина этого явления? Дело в том, что сумма степенного ряда, как это будет доказно в главе 5, бесконечно дифференцируема внутри круга сходимости. Поэтому, если какая-либо функция разлагается в степенной ряд, то внутренность круга сходимости этого ряда не может содеражть точек разрыва непрерывности самой функции или ее производных. Производная функции Arctg ( Arctg ( z )
1 ) претерпевает разрыв непрерывности 1 z 2
в точках i, причем |i|=1. Поэтому радиус круга сходимости степенного ряда, в который разлагается функция Arctg, не может быть >1. Сделанное замечание относится и к функции Ln(1+z). Определения. Открытое связное множество D в пространстве С называется областью. Если D–область в С, то замыкание D называется замкнутой областью. Замечание. Если Г-граница области D, то, как легко видеть, D =DГ. Заметим, что граница области и граница замкнутой области могут не совпадать между собой
На рис. 1 прямолинейный отрезок, расположенный внутри круга, не принадлежит области D (он принадлежит границе области). Граница области D состоит из окружности и указанного отрезка. Граница замкнутой области D состоит только из точек окружности. Легко проверить, что для любой области D FrDFr D . Если z1=x1+iy1 и z2=x2+iy2–две различные точки из С, то отрезок с концами z1 и z2 состоит из всех таких точек zєС, которые представимы в виде z=z1+t(z2-z1) или z=(1t)z1+tz2, где t «пробегает» отрезок [0,1] в R. Напомним, что уравнение прямой на плоскости ХОУ, проходящей через точки (х1,у1) и (х2,у2), имеет вид:
x x1 y y1 . Если точка (х,у) прямой расположена между точками (х1,у1) и x 2 x1 y 2 y1 x x1 y y1 è (х2,у2) (и только в этом случае), то равные отношения x2 x1 y 2 y1 представляют собой число, принадлежащее [0,1]. Обозначив эти равные отношения через t, где t «пробегает» отрезок [0,1], мы получим параметрические уравнения отрезка с концами (х1,у1) и (х2,у2):
x x1 t ( x 2 x1 ) y y1 t ( y 2 y1 ),
tє[0,1]
499 Отсюда, переходя к комплексным числам, мы и получим параметрическое уравнение отрезка с концами z1 и z2 в пространстве С: z=z1+t(z2-z1). Этот отрезок будем обозначать [z1,z2] или [z2,z1]. Так как отображение φ:[0,1]→С, для которого φ(t)=z1+t(z2z1), -непрерывно и так как φ([0,1])=[z1,z2] то отрезок [z1,z2] представляет собой связное множество в С (теоремы 3.95 и 3.102). 4.42 Определение. Множество LС будем называть n–звенной ломаной концами z0 и w0 (z0≠w0), если существуют натуральное число n≥2 и попарно различные комплексные числа z1, z2,…,zn-1 (каждое из которых отлично от z0 и от w0) такие, что 1) L=[z0,z1][z1,z2]…[zn-1,w0] и 2) при любом iєN, удовлетворяющем неравенствам 1≤i≤n-1, отрезки [zi-1,zi] и [zi,zi+1] не лежат на одной прямой (за zn принимается w0). Отрезки [z0,z1], [z1,z2], …, [zn-1,w0] называются звеньями ломаной. Отрезок [v,w] (vєС, wєС, v≠w) будем называть однозвенной ломаной с концами v и w. Замечание. Согласно 3.97 и 3.95, всякая ломаная представляет собой связное множество в С. 4.43 Теорема. Для того, чтобы открытое множество GС было связным (т.е. являлоcь областью), необходимо и достаточно, чтобы любые две точки из G можно было соединить ломаной, целиком лежащей в G. Доказательство. Пусть G-область и z1,z2–любые две точки из G (z1≠z2). Докажем, что эти точки можно соединить ломаной, целиком лежащей в G. Обозначим через Н1 совокупность всех тех точек из G, каждую из которых можно соединить с z1 ломаной, целиком лежащей в G. Из того, что G-открытое множество в С, следует, что и Н1открытое множество в С. Все точки достаточно малой окрестности точки z1 (отличные от z1) принадлежат множеству Н1. Кроме того, Н1 содержит все те свои предельные точки, которые лежат в G. Желая доказать, что Н1=G, допустим противное. Тогда G можно разбить на два непустых непересекающихся подмножества Н 1 и G\Н1. При этом G\Н1 не содержит предельных точек для Н1, ибо Н1 содержит все те свои предельные точки, которые лежат в G. Множество Н1 также не содержит предельных точек для G\Н1, ибо Н1 открыто в С. Получили противоречие с утверждением теоремы 3.93. Следовательно, Н1=G и точку z2єG можно соединить с z1, ломаной, целиком лежащей в G. Пусть теперь любые две точки из G можно соединить ломаной, целиком лежащей в G. Зафиксируем какую-либо точку z1єG и для каждой точки zєG, отличной от z1, выберем ломаную L(z), соединяющую z с z1 и целиком лежащую в G (аксиома Цермeло). Так как G L(z ) (объединение по всем zєG, отличным от z1) и так как все ломаные L(z) имеют общую точку z1, то множество G связно (теорема 3.96), ч.т.д. 4.44. Определение. Ограниченная область в пространстве С называется nсвязной, если граница области имеет n компонент связности. В частности, ограниченная область в С называется односвязной, если граница области является связным множеством. 4.45 Теорема. Пусть D–область в пространстве С и функция f:D→С дифференцируема в D, причем всюду в D f′(z)=0. Тогда f(z)=const в D. Доказательство. Зафиксируем какую-либо точку z0єD и, взяв произвольную точку zєD, отличную от z0, соединим ее с точкой z0 ломаной [z0,z1][z1,z2]…[zn-1,z], целиком лежащей в D. Докажем сперва, что f(z1)=f(z0). Рассмотрим функции φ:[0,1]→D и F:[0,1]→С, определяемые равенствами: φ(t)=z0+t(z1-z0), F=f◦φ (т.е. F(t)=f(φ(t)) для любого tє[0,1]). Функции φ и F непрерывны на отрезке [0,1] и дифференцируемы в интервале (0,1): φ′(t)=z1-z0, F′(t)=f′(φ(t))∙φ′(t)=0 при любом tє(0,1). Согласно теореме 4.33, |F(1)-F(0)|≤|F′(с)|, где сє(0,1). Следовательно, |f(z1)-f(z0)|≤0, т.е. f(z1)=f(z0). Аналогично доказывается, что f(z2)=f(z1)=f(z0), f(z3)=f(z2)=f(z0),…, f(z)=f(zn)=f(z ). 1 0
500 Таким образом, для любой точки zєD имеет место равенство f(z)=f(z0), ч.т.д. Упражнения к главе 4. 1. Пусть f:R→R удовлетворяет неравенству |f(x)-f(y)|≤(x-y)2 при всех х,уєR. Доказать, что f(x)=const в R. Указание. Зафиксировав любую точку х0єR при любом хєR будем иметь: |f(x)-
f ( x) f ( x0 ) | x x0 |, x x0 f ( x ) f ( x0 ) 0, т.е. f′(х0)=0. Устремляя х к х0, получим: lim x x0 f(x0)|≤(x-x0)2, откуда (при х≠х0)
Так как х0-любая точка из R, то f′(х)=0 всюду в R. Применить формулу Лагранжа к отрезку [x0,x] или [x,x0], где х0-фиксированная точка из R, а х-любая точка из R. 2. Пусть вещественная функция f определена в окрестности точки х0єR и существует f″(х0). Доказать, что при h→0 lim
f ( x 0 h ) f ( x 0 h) 2 f ( x 0 ) f ( x0 ). h2
Указание. Рассматривая f(x0+h) и f(x0-h) как сложные функции от h (мы допускаем вольность речи) и применяя правило Лопиталя, будем иметь: при h→0
f ( x 0 h ) f ( x 0 h) 2 f ( x 0 ) f ( x0 h) f ( x0 h) lim 2h h2 1 f ( x0 h) f ( x0 ) f ( x0 h) f ( x0 ) 1 lim [ ] 2 f ( x0 ) f ( x0 ). 2 h h 2 C C C1 ... n1 n 0, где С0, С1,…,Сn–действительные 3. Пусть C0 2 n n 1 lim
числа. Доказать, что действительный многочлен С0+С1х+…+Сn-1xn-1+Cnxn имеет хотя бы один корень между 0 и 1. Указание. Рассмотрим действительный многочлен f, определяемый равенством: f(x)=C0x+
C C C1 2 õ ... n1 x n n x n1 для всех хєR. 2 n n 1
Так как f(0)=0 и f(1)=0, то, по теореме Ролля (4.10), найдется такая точка сєR, что 00 и функция f′ монотонно возрастает. Доказать монотонное возрастание функции g:(0,+∞)→R, определенной равенством g(x)=
Указание.
f ( x) при всех x>0. x
g ( x)
xf ( x) f ( x) x2
f ( x)
f ( x) f ( x) f (0) f (c) f ( x), где 0
x
f ( x) x 0,
так
как
501 5. Пусть f=f1+if2 и g=g1+ig2 –комплекснозначные непрерывные функции на промежутке [0,1), дифференцируемые в интервале (0,1). Пусть также f(0)=g(0)=0 и f′(t)→А, g′(t)→B при t→0, где А и В-комплексные числа, причем В≠0. Доказать, что при t→0 lim
f (t ) A lim g (t ) B
f (t ) . g (t )
Указание. Пусть А= a1 ia 2 , B= b1 ib2 . Так как
f (t ) t A, то f1(t ) a1 , f 2(t ) a2 при t→0. 0 Аналогично g1 (t ) b1 , g 2 (t ) b2 при t→0.
f (t ) f1(t ) if 2(t )
и
Следовательно, при t→0
f (t ) if 2 (t ) f (t ) f1 (0) f (t ) f 2 (0) f (t ) lim 1 lim[ 1 i 2 ] t t t 0 t 0 lim[ f1(c1 (t )) if 2(c2 (t ))] a1 ia2 A ибо 0
6. Пусть f:R→R определена равенством:
x12 f ( x) e 0
x0 x0
ïðè ïðè
Доказать, что f бесконечно дифференцируема в R и что f(n)(0)=0 при всех nєN. Указание. При х≠0
f ( x) e
1 x2
2 . Далее, x3
1
f ( x) f (0) e x f (0) lim lim 0 при x→0. x0 x 2
Индукцией по числу n легко доказать (что предоставляется читателю), что при х≠0
f
(n)
( x) e
1 x2
Pn ( x) , где Рn-действительный многочлен степени <3n, и что x 3n
f(n)(0)=0. 7. Пусть f:R→R определена равенством:
( x1a )2 ( x1b )2 e ïðè x (a, b) f ( x) e . ïðè x (a, b) 0 Доказать, что f бесконечно дифференцируема в R (этот факт выражают словами: f принадлежит классу С∞) и что при любом nєN
f ( n) (a) f ( n) (b) 0.
502
f ( x) f ( x) [
Указание. При хє (a, b)
2 2 ]. Так как ( x a ) 3 ( x b) 3
lim f ( x) lim f ( x) 0 f (a) f (b) и так как x a0 x b0 lim f ( x) lim f ( x) 0, òî è x a0 x b0 Индукцией
x ( a , b)
по
f (a) 0 и f (b) 0 (теорема 4.13).
числу
f ( n ) ( x) f ( x)
n
Pn ( x) , [( x a)( x b)]3n
доказать, где
что
при
Рn-действительный
многочлен степени <6n, и что f (a) f (b) 0. 8. Пусть F–непустое замкнутое подмножество пространства R. Доказать существование такой функции f:R→R класса С∞, для которой F является нульмножеством (т.е. f(х)=0 при всех хєF и f(х)≠0 при x F). Указание. Пусть G=Fc=R\F. G–открытое множество в R, которое представляет собой не более, чем счетное объединение попарно непересекающихся интервалов, среди которых могут быть и бесконечные (3.101). При этом мы исключаем случай F=R, как тривиальный. Определим функцию f:R→R следующим образом. Для любого хєF положим f(х)=0. Если х принадлежит конечному интервалу (a, b) G (a F , b F ), то ( n)
положим
f ( x) e
1 ( x a )
2
e
( n)
1 ( x b ) 2
a F , то полагаем f ( x) e
. Если х принадлежит интервалу (a,) G, где
1 ( x a )2
, а если х принадлежит интервалу (, b) G,
1 ( x b ) 2
. где b F , то полагаем f ( x) e Как следует из результатов упражнений 6 и 7, функция f бесконечно дифференцируема в точках множества G, а также в тех точках множества F, которые являются концами интервалов, составляющих множество G. При этом, в указанных точках множества F f(n) существует как односторонняя производная и обращается в нуль при любом nєN. Пусть теперь х0-любая точка множества F, не являющаяся левым концом какоголибо интервала, из которых состоит множествo G. Убедимся, что правосторонняя производная функции f в точке х0 равна 0. Зададимся произвольным ε>0 и найдем такое
δ>0, что при 0<x<δ
e
1 x2
x
. Пусть х-любое число, удовлетворяющее неравенствам
f ( x) f ( õ0 ) 0. x x0 Если x (a, b) G ãäå a, b F , òî x0 a x.
х0<x<х0+δ. Если хєF, то
503
Следовательно,
f ( x) f ( x0 ) e 0 x x0
1 ( x a )2
e x x0
1 ( x b ) 2
1 1
( x a )2
e x a ( x b ) 2 e . x a x x0
К такому же результату придем, если x (a,), где a F . Мы видим, что во всех случаях из х0<x<х0+δ
0
следует,
что
f ( x) f ( x0 ) f ( x) f ( x0 ) . Это и означает, что lim 0 при x→x0+0. x x0 x x0
Аналогично доказывается, что и левосторонняя производная функции f в точке х0 существует и равна 0. Итак, f дифференцируема в любой точке R и f′(x)=0 при хєF. Индукцией по числу n доказать, что f(n)(x) существует в любой точке хєR и что f(n)(х)=0 если хєF. 9. Пусть f:(0,+∞)→R дважды дифференцируема во всех точках области определения. Обозначим через М0, М1, М2 точные верхние границы функций |f|, |f′|, |f″| на (0,+∞) соответственно. Доказать, что М12≤4М0∙М2, предполагая, что М0, М1, М2-конечные числа. Указание. Для любых х>0 и h>0 по формуле Тейлора (с остаточным членом в форме Лагранжа) можем написать:
f ( x 2h) f ( x) f ( x) 2h
f (c) 4h 2 , откуда 2
M 1 [ f ( x 2h) f ( x)] h f (c) и f ( x) 0 M 2 h . 2h h M0 , будем иметь: | f ( x) | 2 M 0 M 2 . Так как это верно при Выбрав h M2 f ( x)
2 любом х>0, то M 1 2 M 0 M 2 , откуда M 1 4M 0 M 2 . 10. Пусть f дважды дифференцируема
на
| f ( x) | M const при всех хє(0,+∞). Доказать, что если lim f ( x) 0.
(0,+∞),
причем
lim f ( x) 0 , то и x
x
Указание. Зададимся произвольным ε>0 и найдем такое число Δ>0, что при х>Δ
| f ( x) |
2
. Рассуждая, как и в упражнении 9, для любых х>0 и h>0 будем иметь: 4M 1 f ( x) [ f ( x 2h) f ( x)] h f (c). 2h Выберем h
2M
и оценим | f ( x) | при х>Δ:
504
| f ( x) |
M
(| f ( x 2h) | | f ( õ) |)
f ( x) 0. что lim x 11.
2M
M
M
2
2M
2
. Это и доказывает,
Пусть две функции f:[ a, b ]→R и g:[ a, b ]→R непрерывны на отрезке [ a, b ]
и дифференцируемы в интервале ( a, b ). Доказать, что если f (a) g (a) и f′(x)>g′(x) при xє( a, b ), то f(x)>g(x) в ( a, b ]. Указаниe. Функция f-g строго возрастает на отрезке [ a, b ], ибо (f-g)′(x)>0 при xє( a, b ). Так как (f-g)( a )=0, то при a <x≤ b будет: f(x)-g(x)>0, т.е. f(x)>g(x). 12. Пусть функция f:[0,+∞)→R определена равенством: f(х)=хα-αх, где 0<α<1. Доказать, что при всех х>0 f(х)≤1-α. Указание. При х>0 f′(x)=αхα-1-α=α(хα-1-1)=α(
1 x1
1 ). Следовательно, при
0<x<1 f′(x)>0; при х=1 f′(1)=0; при x>1 f′(x)<0. Это и означает, что в точке х=1 функция f достигает максимума и одновременно f(1) будет наибольшим значением функции. Следовательно, при всех х≥0 f(x)≤f(1), т.е. хα-αх≤1-α, ч.т.д. 13. Доказать (используя результат упражнения 12), что если положительные числа р и q удовлетворяют равенству
1 1 1 , то для любых положительных чисел p q
a и b имеет место неравенство
ab
1 p 1 q a b p q
Указание. Так как р>1, то в неравенстве хα-αх≤1-α можно положить
Тогда неравенство примет вид
1 p
x
1 . p
1 1 x , где х может равняться любому p q
ap неотрицательному числу. Положим x q , где a и b –любые положительные b q p q a 1a 1 1 1 , откуда a b p a p b q или числа. Будем иметь: q q pb q p q bp
ab
1 p 1 q a b , p q
положительных
чисел:
Доказать, что если положительные числа p и q связаны равенством
1 1 1, p q
14.
a1 , a2 ,..., an
Пусть
ч.т.д. даны
два
набора
è b1 , b2 ,..., bn .
то имеет место неравенство (Коши и Гельдера):
505 n
a b
i i
i 1
1 p
aip biq i 1 i 1 n
n
1 q
Указание. Докажем сперва неравенство Коши-Гельдера для частного случая, n
когда
a
p i
i 1
n
b
1 è
q i
i 1
1.
n
неравенство принимает вид
a b i 1
В этом случае подлежащее доказательству
1 .
i i
Так как при любом i (1≤i≤n)
1 p 1 q ai bi , то p q n 1 n p 1 n q 1 1 ai bi ai bi 1. p i 1 q i1 p q i 1 ai bi
Рассмотрим теперь общий случай. Обозначим
ai
ai
a
1 p p i
n
(b)
Аналогично,
bi
, bi q
i
i 1
b
1 q q i
1.
.
(ai) p
Тогда
aip aip
n
( a )
è
p
i
i 1
1.
n
Следовательно, по доказанному,
ab 1, i 1
i i
т.е.
n
a b
i 1 1 p p i
i i
a b
1 q q i
1,
откуда 1 p
1 q
p q a b a b i i , i i i 1 i 1 i 1 n
15.
a1 , a2 ,..., an
Доказать,
n
что
если
p>1,
n
то
для
ч.т.д. любых
двух
наборов
è b1 , b2 ,..., bn положительных чисел имеет место неравенство,
установленное Минковским:
Указание. Пусть
1 p
1 p
1 p
p p p (ai bi ) ai bi . i 1 i1 i1 1 p q . Имеем: 1 p 1 1 p n
n
n
506 n
n
(a
i
i 1
bi ) (ai bi )(ai bi ) p
n
ai (ai bi )
p 1
i 1
1 p
i 1
1 q
1 p
p 1
n
bi (ai bi ) p1 i 1
1 q
aip (ai bi ) ( p1) q bip (ai bi ) ( p1) q i1 i1 i 1 i 1 n
n
1 p
1 p
n
1 q
[ aip bip ] (ai bi ) p . i 1 i1 i1 n
n
(a
n
1 p
1 p
Итак, 1 q
bi ) p [ aip bip ] (ai bi ) p , i1 i 1 i 1 n
i
i 1
n
n
n
откуда (деля обе
1 p q
n
части на
n
( (ai bi ) ) i 1
1 p
1 p
1 p
p p p (ai bi ) ai bi , i 1 i 1 i 1 n
n
n
ч.т.д.
Замечание. Читателю предлагается проверить, что векторное пространство (над полем действительных чисел) всех n–членных последовательностей действительных чисел можно нормировать, полагая для любого х=(x1, x2,…,xn)
|| x || p (| x1 | | x2 | ... | xn | ) p
p
p
1 p
(p>1)
Заметим еще, что если даны две последовательности (an ) è (bn ) положительных чисел, то, переходя к пределу при n→∞ в неравенствах Коши-Гельдера и Минковского, получим: 1 p
p q a b a b i i i i i 1 i 1 i 1
1 q
è
1 p
1 p
При этом из сходимости рядов в правых частях указанных неравенств следует сходимость рядов в левых частях. 16. Доказать, что при x (0,
2
) имеет место неравенство
2
x sin x x.
Указание. Неравенство sinx<x было доказано ранее (для x (0, доказательства неравенства
x sin x рассмотрим функцию
) ). Для 2 sin x f ( x) в x
(0, ]. В этом промежутке f непрерывна. В интервале 2 cos x x sin x x tgx f ( x) cos x 0. Применяя формулу Лагранжа к 2 x x2
промежутке
(0, ) 2
2
1 p
p p p (ai bi ) ai bi . i 1 i 1 i 1
507
[ x, ], будем иметь: f ( ) f ( x) f (c)( x) 0, 2 2 2 sin x 2 f ( x) f ( ) или при x (0, ) . 2 x 2
промежутку
откуда
17. Пусть функция f:( a, b )→R дважды дифференцируема в ( a, b ) и в некоторой точке ξє( a, b ) f″(ξ)≠0. Доказать, что в интервале ( a, b ) можно найти два значения х1 и х2 такие, что
f ( x2 ) f ( x1 ) f ( ). x2 x1 Указание. Пусть, для определенности, f″(ξ)>0. Тогда найдется такое h>0, что (ξh, ξ+h) (a, b) и при ξ-h<х<ξ f′(х)f′(ξ). Зафиксируем какое-либо значение х0є(ξ-h,ξ) и применим формулу Лагранжа к промежутку [х0,ξ]: f(ξ)-f(x0)=(ξ-x0)f′(c), где f′(с) f′(ξ), ибо αхє(ξ,х). Складывая подчеркнутые равенства, получаем: f(x)-f(x0)=(х-ξ)f′(αх)+(ξ-x0)f′(c), откуда
f ( x ) f ( x0 ) x x0 f ( x ) f (c). x x0 x x0 x x0 f ( x ) f ( x0 ) f (c) f ( ) , то найдется точка Так как при x→ξ+0 lim x x0 f ( x 2 ) f ( x0 ) f ( ). Рассмотрим функцию φ:[х0,ξ]→R, х2є(ξ,ξ+h), для которой x 2 x0 f ( x2 ) f ( x) определенную равенством: ( x) для любого хє[x0,ξ]. x2 x Эта
( )
функция
непрерывна
на
отрезке
[х0,ξ],
f ( x2 ) f ( ) f (c~) f ( ), ибо c~ ( , x2 ). x2
Следовательно,
в
f ( x2 ) f ( x1 ) f ( ), ч.т.д. x2 x1
некоторой
точке
причем
х1є(х0,ξ)
φ(х0)
φ(х1)=f′(ξ),
а
т.е.
18. Пусть функция f:(х0,+∞)→R дважды дифференцируема во всех точках
lim f ( x) 0, lim f ( x) 0.
области определения и õx0 0 õ Доказать, что в интервале (х0,+∞) существует такая точка ξ, что f″(ξ)=0. Указание. Доопределим функцию f в точке х0, полагая f(х0)=0. Тогда f непрерывна на промежутке [х0,+∞). Если f(х)=0 при всех хє[х0,+∞), то подлежащее доказательству утверждение становится очевидным. Пусть, для определенности, в
lim f ( x) 0, то найдется такая точка x >x , 2 1
некоторой точке x1>x0 f(x1)>0. Так как õ что f(x2)с f′(х3)<0. Найдем такое число
отрезке [x0,x2] достигается в Пусть, для определенности, в Δ>x3, что при х≥Δ |f(x)|≤1.
508 Подберем h>0 так, чтобы откуда | f (c1 ) |
2 | f ( x3 ) | . Будем иметь: f(Δ+h)-f(Δ)=h∙f′(с1) (с1>Δ), h
2 | f ( x3 ) | . Следовательно, h
f′(х3)
Непрерывная на отрезке [c,c1] функция f′ достигает своего наименьшего значения в некоторой точке ξ интервала (с,с1). Поэтому f″(ξ)=0, ч.т.д. 19. Пусть вещественная функция f дважды дифференцируема в промежутке [a,), причем f (a) 0, f (a) 0 è f ( x) 0 при x a. Доказать, что уравнение f(х)=0 имеет и притом единственный корень в интервале (a,). Указание. Написав формулу Тейлора с остаточным членом в форме Лагранжа, будем
иметь:
1 f (c) ( x a) 2 при любом 2 f ( x) 0 при x a следует, что
f ( x) f (a) f (a)( x a)
x a(a c x). Из условий f (a) 0 è
всюду f′(х)<0, т.е. функция f строго убывает и может обращаться в 0 только при одном значении х. Такое значение существует, ибо f(x)<0 при достаточно больших х. Решив неравенство
f (a) f (a)( x a) 0 f (a) | f (a) | ( x a) 0 x a
f (a) , | f (a) |
заключаем, что единственный корень х0 уравнения f(x)=0 удовлетворяет неравенствам
a x0 a
f (a) . | f (a) |
20. Пусть вещественная функция f дифференцируема на [a, b],
f ( a) 0 и
существует такое число A>0, что |f′(х)|≤А∙|f(x)| при всех x [a, b]. Доказать, что f(x)=0 для всех x [a, b]. Указание. Обозначим
1 , M 0 sup | f ( x) |, M 1 sup | f ( x) | . При этом мы предполагаем, 2 A [ a, x ] [ a , x0 ] 0 что x0 b. Если же x0 b, то вместо х0 следует взять точку b. Для любого x [a, x0 ] будем иметь: f ( x) f (a) ( x a) f (c), откуда | f ( x) | ( x0 a)M 1. x0 a
Из
неравенства
| f ( x) | A | f ( x) |
следует,
что
при
x [a, x0 ]
| f ( x) | AM 0 и, следовательно, М1≤АМ0. Из подчеркнутых неравенств следует, что 1 М0≤ ( x0 a) AM 0 , т.е. М0≤ M 0 . Значит, М0=0. Если x0 b, то больше нечего 2 доказывать. Если же x0 b, то повторяем вышеприведенные рассуждения с тем [a, x0 ] заменяется отрезком отличием, что отрезок [x0,x1], где
1 1 x0 2 A, åñëè x0 2 A b x1 1 b , åñëè x Ab 0 2
509 Таким образом, через конечное число шагов будет установлено равенство f(x)=0 при всех x [a, b]. 21. Замечание. Результат упражнения 20 легко распространить на векторнозначные функции. А именно: пусть функция f:[ a, b ]→Rn (f=(f1, f2, …, fn)) дифференцируема на [ a, b ], f (a) (0,0,...,0) и существует такое число А>0, что ||f′(х)||≤А∙||f(x)|| при всех x [a, b]. Тогда f(x)=(f1(x), f2(x),…, fn(x))=θ при всех
x [a, b], т.е. f1(x)=0, …, fn(x)=0 при всех x [a, b]. Для доказательствa этого утверждения используются те же рассуждения, что и в упражнении 20, только формула Лагранжа заменяется ее аналогом, справедливым для векторнозначных функций (теорема 4.33). Кроме того, модули чисел заменяются нормами элементов Rn. 22. Пусть при х, стремящемся к конечному или бесконечному пределу a , функции
α(х)
и
β(х)
являются
бесконечно
малыми,
т.е.
lim ( x) 0 õà
и
lim ( x) 0. Если при x a отношение ( õ) имеет конечный и отличный от õà ( õ) нуля предел, то α и β называются бесконечно малыми одного порядка. Например, при х→0 функция sinx (мы допускаем вольность речи) является бесконечно малой одного
sin x 1. x õ 0
lim порядка с х, ибо
( x) lim 0, то β считается бесконечно малой высшего порядка, чем Если ( x ) õ a бесконечно малая α. Этот факт записывается так: β=о(α) или β(х)=о(α(х)) при x a . (Читается: β(х) равно о-пти от α(х)). Например, при х→0 1-cosx=o(x), так как
1 cos x lim sin x 0. x õ 0 õ 0
lim
Вещественные функции f и g, определенные в некоторой окрестности точки a , называются равными с точностью до n–го порядка в точке a , если f(x)-g(x)=о((x- a )n) при x a , т.е.
f ( x) g ( x) 0. n ( x a ) õ a
lim Пусть,
например,
функция
f
дифференцируема
в
точке
a,
т.е.
f ( x) f (a ) f ( x) [ f (a) f (a)( x a)] f (a)) 0 или lim 0. x a x a õ a õ a Мы видим, что функция f в точке a равна с точностью до первого порядка линейной функции g, определенной равенством: g ( x) f (a) f (a)( x a). Обратно, пусть непрерывная в точке a функция f равна (в точке a ) с точностью до f ( x) (kx b) lim 0. первого порядка линейной функции kx b : xa õ a lim(
510 Тогда
lim[ f ( x) (kx b)] f (a) ka b 0, откуда b f (a) ka. õ a
f ( x) (kx b) f ( x) f (a) k ( x a) f ( x) f (a) k xa xa xa т.е. функция f дифференцируема в точке a и f (a) k. Доказать, что если функция f, определенная в некоторой окрестности точки a (быть может, односторонней, т.е. в промежутке вида [a, b) или (c, a] ) имеет в этой Следовательно,
точке конечные производные всех порядков до n–го включительно, то f равна с точностью до n–го порядка (в точке a ) многочлену Рn, определенному равенством:
f (a) f ( n ) (a) Pn ( x) f (a) ( x a) ... ( x a) n . 1! n! n Указание. Требуется доказать, что f ( x) Pn ( x) î (( x a) ), т.е. что f ( x) Pn ( x) lim 0 (*) ( x a) n õ a
Применим индукцию по числу n. При n=1 для любой функции f, a , и соответствующего ей многочлена дифференцируемой в точке P1 ( x) f (a) f (a)( x a) предельное соотношение (*) справедливо (как это доказано выше). Пусть предельное соотношение (*) верно при некотором n≥1 для любой функции, n раз дифференцируемой в точке a , и соответствующего ей многочлена Pn. Докажем, что соотношение (*) будет верным для числа n+1 какова бы ни была функция f, n+1 раз дифференцируемая в точке a . Применяя правило Лопиталя, будем иметь:
f (a) f n1 (a) 2 f ( x) [ f (a) f (a)( x a) ( x a) ... ( x a) n1 ] 2! (n 1)! lim n 1 ( x a) õ a
lim
f ( x) [ f (a) ( f )(a)( x a) ... (n 1)( x a) n
õ a
Так как многочлен
( f ) ( n ) (a) ( x a) n ] n!
(**)
( f ) ( n ) (a) f (a) ( f )(a)( x a) ... ( x a) n представляет n!
собой многочлен Pn, построенный для функции f′, то, согласно предположению индукции, предел в правой части равенства (**) равен 0, ч.т.д. Замечание. Доказанная формула
f (a) f (a) f ( n )(a) 2 f ( x) f (a ) ( x a) ( x a) ... ( x a) n î (( x a) n ) (в 1! 2! n! предположении, что f n раз дифференцируема в точке a ) называется формулой Тейлора
с
дополнительным
членом
в
форме
Пеано.
Так
как
î (( x a) ) ( x) ( x a) , где α-бесконечно малая при x a , то эта формула n
часто записывается в виде:
n
511
f (a) f (a) f ( n )(a) 2 f ( x) f ( a ) ( x a) ( x a) ... ( x a) n , 1! 2! n! где β(х)=n!α(х) есть бесконечно малая при x a . Заметим, что существование в точке a конечных производных f (a), f (a),..., f ( n1) (a), f ( n) (a) означает, что конечные производные f′(х),…,f(n-1)(x) существуют в некоторой окрестности точки a (быть может, односторонней), и, кроме того, означает наличие производной n–го порядка (конечной) в самой точке a . Заметим еще, что если для бесконечно малых (при
x a ) α и β имеет место предельное соотношение
lim
( x) 1 , то эти бесконечно ( x)
õ a
малые называются эквивалентными. При этом пишут: α(х)~β(х) при x a . Например, sinx~х при х→0,
1-cosx~
1 2 x 2
при х→0 и т.д.
23. Функция f( a, b )→R называется выпуклой снизу на интервале ( a, b ), если для любых различных точек х1 и х2 из этого интервала и любого числа λє(0,1) имеет место неравенство f(λх1+(1-λ)х2)<λ(х1)+(1-λ)(х2). Если для любых точек х1≠х2 из ( a, b ) и любого λє(0,1) имеет место противоположное неравенство, то функция f называется выпуклой сверху на интервале ( a, b ). Читателю предлагается проверить, что выпуклость снизу функции f на интервале ( a, b ) означает следующее: для любого интервала (x1,x2)( a, b ) «хорда», соединяющая точки A1(x1,f(x1)) и A2(x2,f(x2)), расположена выше графика функции f в этом интервале (см. рис.1).
Аналогичный геометрический смысл имеет выпуклость сверху функции f на интервале ( a, b ). Доказать, что если функция f дважды дифференцируема в интервале ( a, b ) и для всех хє( a, b ) f″(x)>0, то функция f выпукла снизу на интервале ( a, b ). Указание. Для любого xє(x1,x2) (где х1,х2-любые две точки из интервала ( a, b ), для которых x1<x2) ордината y точки упомянутой «хорды» с абсциссой х выражается равенством:
y f ( x1 )
f ( x2 ) f ( x1 ) ( x x1 ). x2 x1
512
f ( x2 ) f ( x1 ) ( x x1 )] 0. x2 x1 f ( x2 ) f ( x1 ) f ( ), где ξ-некоторая точка x2 x1
Требуется доказать, что f ( x) [ f ( x1 ) По формуле Лагранжа
интервала (x1,x2). Рассмотрим сперва случай, когда
f ( x) [ f ( x1 )
х1<х≤ξ. В этом
случае
f ( x2 ) f ( x1 ) ( x x1 )] f ( x) f ( x1 ) f ( )( x x1 ) f ( )( x x1 ) x2 x1
f ( )( x x1 ), где х1<η<х≤ξ. Так как f′(η)(х-х1)-f′(ξ)(х-х1)=-(х-х1)x (х-х1)(ξ-η)f″(μ),
где
η<μ<ξ,
то
x[f′(ξ)-f′(η)]=действительно
f ( x2 ) f ( x1 ) ( x x1 )] 0. Пусть теперь ξ<x<x2. В этом случае x2 x1 f ( x2 ) f ( x1 ) f ( x2 ) f ( x1 ) f ( x) [ f ( x1 ) ( x x1 )] f ( x) [ f ( x2 ) ( x2 x)] x2 x1 x2 x1 f ( x) f ( x2 ) f ( )( x2 x) f ( )( x2 x) [ f ( x2 ) f ( x)] f ( )( x2 x) f (c)( x2 x), где ξ<x
Так как
f ( )( x2 x) f (c)( x2 x) [ f ( ) f (c)]( x2 x) ( x2 x)[ f (c) f ( )] ( x2 x)(c ) f ( ), где νє(с,ξ), то и в этом случае (ξ<x<x2) f ( x2 ) f ( x1 ) f ( x) [ f ( x1 ) ( x x1 )] 0. x2 x1 Дословно повторяя вышеприведенные рассуждения, легко доказать, что если в интервале ( a, b ) f″(х)<0, то функция f выпукла сверху на интервале ( a, b ). 24. Доказать следующие неравенства:
1 n x y n (x>0, y>0, x≠у, n>1) (а) ( x y ) 2 2 n
(e x e y ) e (b) 2
x y 2
(c) xlnx+ylny>(x+y)ln
(x≠у)
x y (x>0, y>0, x≠у). 2
Указание Чтобы доказать неравенство (а), расмотрим функцию f:(0,+∞)→R, определяемую равенством: f(t)=tn для любого tє(0,+∞). Так как f′(t)=ntn-1, f″(t)=(n-1)ntn-2>0 для любого t>0, то функция f выпукла снизу на бесконечном интервале (0,+∞), т.е. для любых x>0, y>0, х≠у имеет место неравенство: f(λх+(1-λ)у)<λf(х)+(1-λ)f(у) при любом
1 x y f ( x) f ( y ) x y n xn yn ) , т.е. ( ) . λє(0,1). Беря λ= , получим: f ( 2 2 2 2 2 Неравенство (b) доказывается аналогично предыдущему, ибо для экспоненциальной функции exp″(х)=exp(х)=ех>0 при любом хєR. Впрочем, неравенство (b) легко доказать совершенно элементарно, ибо
513
e e e 2 x
y
x y 2
где a e Для
x y 2
0 è
e
x y 2
e 2
yx 2
1
1 2 2 a 1 a 1 1 (a 1) 0, 2 2a 2a
a
a 1.
доказательствa
неравенства
(с)
рассмотрим
функцию
f:(0,+∞)→R,
определяемую равенством f(t)=tlnt для любого tє(0,+∞). Имеем: f′(t)=lnt+1, f″(t)=
1 при t
всех tє(0,+∞). Следовательно, f выпукла снизу в интервале (0,+∞) и для любых х,у>0 (х≠у)
будет
( x y) ln
f(
x y f ( x) f ( y ) ) , т.е. 2 2
x y x ln x y ln y, ч.т.д. 2
x y x y x ln x y ln y ln 2 2 2
или
25. Доказать, что выпуклая (снизу или сверху) в интервале ( a, b ) функция непрерывна в этом интервале и имеет в каждой точке х 0є( a, b ) конечные односторонние производные. Указания. Если f выпукла снизу на интервале ( a, b ), то-f выпукла сверху на этом интервале и наоборот. Поэтому можно ограничиться рассмотрением функции f, выпуклой снизу на ( a, b ). Пусть х0-произвольная точка этого интервала. Установим, что в точке х0 существует конечная правосторонняя производная функции f, которую обозначим f+′(х0). Рассмотрим функцию φ:(х0,b)→R, определенную равенством
( x)
f ( x ) f ( x0 ) . x x0
Убедимся, что она строго возрастает в интервале (х0,b). Пусть х1,х2-любые две точки этого интервала, для которых x0<x1<x2
Обозначим
x1 x0 , откуда x 2 x0
х1=х0+λ(х2-х0)=(1-λ)х0+λх2. Так как λє(0,1) и 1-λє(0,1), то f(х1)=f((1-λ)х0+λх2)<(1λ)f(х0)+λf(х2). Отсюда f(x1)-f(x0)<λ(f(x2)-f(x0)) и
f ( x1 ) f ( x0 ) f ( x2 ) f ( x0 ) , т.е. x1 x0 x 2 x0
φ(х1)<φ(х2). Итак, φ строго возрастает в интервале (x0,b). Покажем, что в этом интервале φ ограничена снизу. С этой целью возьмем какую-либо точку
~ x (a, x0 ) и для любого
x0 ~ x , откуда х0=λх∙х+ +(1-λх)∙ ~ x ( x0 , b) обозначим x x . Так как λхє(0,1), то ~ xx ~ ~ f(х0)<λхf(х)+(1-λх)∙f( x ). Следовательно, λх[f(х)-f(x0)]+(1-λх)∙[f( x )-f(x0)]>0. ~ ~ Подставляя в это неравенство значение λх, получим: (x0- x )[f(х)-f(x0)]+(x-x0)∙[f( x )f ( x ) f ( x0 ) f ( ~ x ) f ( x0 ) f (~ x ) f ( x0 ) , т.е. ( x) f(x0)]>0, откуда для любого ~ ~ x x0 x x0 x x0 хє(x0,b). Таким образом, функция φ строго возрастает и ограничена снизу в интервале
lim ( x) f ( x0 ), что обеспечивает
(x0,b). Поэтому существует конечный предел õx 0 0 правостороннюю непрерывность функции f в точке х0.
514 Аналогично доказывается (это предоставляется читателю) существование конечной левосторонней производной f-′(х0) и левосторонняя непрерывность функции f в точке х0. 26. Пусть функция f строго возрастает и выпукла снизу в интервале ( a, b ), а функция g выпукла снизу в интервале J=(c,d), причем g(J)( a, b ). Доказать, что суперпозиция h=f ◦g выпукла снизу в интервале (c,d). Указание. Пусть х1 и х2 (х1<х2)–любые две точки интервала (c,d) и λ-любое число из интервала (0,1). Тогда g(λх1+(1-λ)х2)<λg(x1)+(1-λ)g(x2). Так как λg(x1)+(1λ)g(x2)є( a, b ), то (поскольку f строго возрастает и выпукла снизу в ( a, b )) f(g(λx1+(1λ)x2))
Такая функция f разывается решением дифференциального уравнения (*), удовлетворяющем начальным условиям y(a) y0 . Доказать, что уравнение (*) не может иметь более одного решения, удовлетворяющего начальным условиям, если для функции φ существует такое число А>0, что при всех хє[ a, b ] и любых y1,y2є[c,d] имеет место неравенство: |φ(х,y2)-φ(x,y1)|≤А∙|y2-y1| (**) Указание. Пусть f и g–два решения уравнения (*) такие, что f (a) y0 и
g (a) y0 . Тогда для функции h=f-g будем иметь: h′(х)=φ(х,f(x))- -φ(x,g(x)) при всех хє[ a, b ] и h(a) 0. Согласно условию, наложенному на функцию φ, |h′(x)|≤A|h(x)| при всех хє[ a, b ]. Отсюда и из равенства h(a) 0 следует (см. упражнение 20), что h(x)=0 при всех хє[ a, b ], т.е. что f=g.
515 28. Пусть функция φ определена на прямоугольнике [0,1]x[0,1] равенством φ(х,у)= y . Дифференциальное уравнение у′= y имеет по крайней мере два решения, удовлетворяющих начальным условиям у(0)=0: у=0 при всех хє[0,1] и y
1 2 x при 4
всех хє[0,1]. Ясно, что функция φ не может удовлетворять условию (**) из упражнения 27. И в самом деле, |φ(х,y2)-φ(х,y1)|= |
1 y1 y 2
y 2 y1 |
1 y1 y 2
| y 2 y1 |,
причем
множитель
становится сколь угодно большим при достаточно близких к нулю
значениях у1 и у2. Доказать, что дифференциальное уравнение у′= y имеет бесчисленное множество решений, удовлетворяющих начальным условиям у(0)=0 и найти все эти решения. Указание. Пусть функция f:[0,1]→[0,1] удовлетворяет уравнению у′= y (т.е. f′(x)= f (x) при всех хє[0,1]) и начальным условиям: f(0)=0. Тогда f(х)≥0 и f′(x)≥0 при всех хє[0,1]. Следовательно, f-неубывающая функция на [0,1]. Если f=0 всюду на [0,1], то мы получаем решение, упомянутое выше. Пусть в некоторой точке tє(0,1) f(t)>0. Тогда при t<x≤1 f(x)>0. Обозначим
x0 inf x : f ( x) 0 . x [ 0,1]
Если х0=0, то при 0<x≤1 f(x)>0 и мы будем иметь
f ( x) f ( x)
f ( x) 2 f ( x)
1 , откуда 2
1 x C (следствие из теоремы 4.24) при всех xє[0,1]. Так как f(0)=0, то C=0 и 2
1 2 x , xє[0,1]. 4
Получили второе решение из упомянутых выше. Если 0<x0<1 (х0≠1, ввиду непрерывности функции f), то в промежутке [0,x0] f(x)=0, а при x>x0 f(x)>0. Тогда в интервале (x0,1) и f ( x)
f ( õ) 12 , откуда
f ( x)
1 ( x õ0 ) 2 при всех xє[x0,1]. Итак, 4 0 ïðè õ [0, x0 ] f ( x) 1 ( x x0 ) 2 ïðè x ( x0 ,1] 4
1 1 x C1 . Так как f(x0)=0, то C1= õ0 2 2
(A)
Легко видеть, что эта функция дифференцируема на [0,1] и удовлетворяет как уравнению у′= y , так и начальным условиям y(0)=0. Мы видим, что все решения уравнения у′= y , удовлетворяющие начальным условиям y(0)=0, определяются равенством (А), где х0-любая точка отрезка [0,1].
516 29. Пусть φ1, φ2,…, φn-вещественные функции, определенные на замкнутом параллелепипеде
J [a, b]x[a1 , b1 ]x[a2 , b2 ]x...x[an , bn ] R n1 и c1, c2,…,cn–любые числа, такие, что
c1 [a1 , b1 ], c2 [a2 , b2 ],...., cn [an , bn ], т.е. с=(c1, c2,…,cn) [a1 , b1 ]x[a2 , b2 ]x...x[an , bn ] Рассмотрим систему дифференциальных уравнений
y1 1 ( x, y1 , y 2 ,..., y n ) y ( x, y , y ,..., y ) 2 2 1 2 n ................................. y n n ( x, y1 , y 2 ,..., y n )
Rn
(*)
с начальными условиями: y1 (a) c1 , y2 (a) c2 ,...., yn (a) cn . Решить эту систему с указанными начальными условиями означает найти такую функцию f:[ a, b ]→Rn (где f=(f1, f2,…,fn)), что при всех хє[ a, b ]
f i( x) i ( x, f1 ( x), f 2 ( x),..., f n ( x)), i=1,2,…,n и f (a) ( f1 (a), f 2 (a),..., f n (a)) c (c1, c2,…,cn). Рассматриваемую систему дифференциальных уравнений с вышеуказанными начальными условиями можно записать в виде одного уравнения: у′=φ(х,у), y(a) c, где y=(y1, y2,…,yn)єRn, а φ=(φ1, φ2,…, φn) есть функция, определенная на J со значениями в Rn. Доказать, что система (*) не может иметь более одного решения, удовлетворяющего начальным условиям, если для функции φ существует такое число А>0, что при всех хє[ a, b ] и любых y,z [a1 , b1 ]x...x[an , bn ] имеет место неравенство: ||φ(х,у)-φ(х,z)|| ≤А||y-z||. Указание. Пусть система (*) имеет два решения f=(f1, f2,…, fn) и g=(g1, g2,…, gn), которые оба удовлетворяют начальным условиям. Тогда функция h=f-g дифференцируема на [ a, b ], h(a) и h′(x)=φ(x,f(x))-φ(x,g(x)) при всех хє[ a, b ]. Следовательно, ||h′(x)||=||φ(x,f(x))-φ(x,g(x))||≤ ≤А||f(x)-g(x)||, т.е. ||h′(x)||≤А||h(x)||, при всех хє[ a, b ]. Согласно замечанию 21 к упражнению 20, h(x)=θ при всех хє[ a, b ], т.е. f=g, ч.т.д. 30. Рассмотрим систему дифференциальных уравнений
517
y1 y2 y y 3 2 .......... y y k k 1 yk f ( x) ( g1 ( x) y1 g 2 ( x) y2 ... g k ( x) yk )
(B)
с начальными условиями y1 (a) c1 , y2 (a) c2 ,...., yê (a) cê . Здесь f, g1, g2,…,gk–непрерывные вещественные функции на отрезке [ a, b ]. Расcматриваемая система-частный случай системы (*) из упражнения 29. Здесь k
( x, y) ( y 2 , y3 ,..., y k , f ( x) g i ( x) yi , i 1
так что k
|| ( x, y) ( x, z ) || ( y 2 z 2 ) 2 ... ( y k z k ) 2 ( g i ( x)( zi yi )) 2 i 1
k
|| y z || ( g i ( x)( zi yi )) 2 . 2
i 1
Применяя неравенство Коши-Буняковского, будем иметь: k
2 2 || ( x, y) ( x, z) || || y z || ( g i ( x)) || y z || 2
i 1
k
1 g i2 ( x) || y z || A || y z ||, где А-наибольшее значение непрерывной на i 1
отрезке [ a, b ] функции
1 g i2 ( x) .
На основании доказанного в упражнении 29, можем утверждать, что данная система дифференциальных уравнений не может иметь более одного решения, удовлетворяющего начальным условиям. Доказать, что дифференциальное уравнение y(k)+gk(x)y(k-1)+…+ +g2(x)∙y′+g1(x)y=f(x), где f, g1, g2,…,gk суть непрерывные на отрезке [ a, b ] функции, имеет не более одного решения, удовлетворяющего начальным условиям:
y(a) c1 , y(a) c2 ,...., y ( ê 1) (a) cê . Указание. Пусть данное дифференциальное уравнение имеет решение у=у(х) (хє[ a, b ]), удовлетворяющее начальным условиям. Обозначим y=y1, y′=y1′=y2, (k-1) (k) y″=y2′=y3,…, y =y′k-1=yk. Тогда y =yk′ и функции y1, y2, …,yk составляют решение системы (В) с вышеуказанными для нее начальными условиями. Таким образом, если бы дифференциальное уравнение y(k)+gk(x)y(k-1)+…+ +g2(x)∙y′+g1(x)y=f(x) (C) имело два различных решения, удовлетворяющих начальным условиям, то и система (В) имела бы два различных решения, удовлетворяющих начальным условиям. Так как
518 это противоречит доказанному, то дифференциальное уравнение (C) не может иметь более одного решения, удовлетворяющего начальным условиям. 31. Пусть функция f:[ a, b ]→R непрерывно дифференцируема на [ a, b ] (т.е. f′ непрерывна на [ a, b ]). Доказать, что f равномерно дифференцируема на [ a, b ], т.е. доказать, что для любого ε>0 существует такое δ>0, что при любых t,xє[ a, b ], удовлетворяющих неравенствам 0<|t-x|<δ, имеет место неравенство
|
f (t ) f ( x) f ( x) | . tx
Указание. Пользуясь равномерной непрерывностью функции f′ на [ a, b ], по любому ε>0 найдется такое δ>0, что из ξ,ηє[ a, b ], 0<|ξ-η|<δ следует |f′(ξ)-f′(η)|<ε. Тогда для любых t,xє[ a, b ], удовлетворяющих неравенствам 0<|t-x|<δ, будем иметь:
|
f (t ) f ( x) f ( x) || f (c) f ( x) | , ибо и при x
x|<|t-x|<δ.