Профессор А.Г.Ягола ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ (общий курс) Данный курс читается на физическом факу...
13 downloads
202 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Профессор А.Г.Ягола ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ (общий курс) Данный курс читается на физическом факультете МГУ им. М.В.Ломоносова в 4-ом семестре и сопровождается семинарскими занятиями. По окончании курса студенты сдают экзамен. Студенты физического факультета МГУ Н.Богданкевич, Н.Грачев, Е.Скрипка, А.Цуканов, С.Шарапова оказали мне большую помощь при подготовке электронной версии лекций. Пользуюсь случаем, чтобы выразить им мою самую искреннюю признательность. Литература Основная: 1. Васильева А.Б., Тихонов Н.А. Интегральные уравнения. – М.: Физматлит, 2002. 2. Эльсгольц Л.Э. Дифференциальные уравнения. Вариационное исчисление. – М.: УРСС, 2000. 3. Васильева А.Б., Медведев Г.Н., Тихонов Н.А., Уразгильдина Т.А. Дифференциальные и интегральные уравнения. Вариационное исчисление. – М.: Физматлит, 2003. Дополнительная: 1. Владимиров В.С., Вашарин А.А. Сборник задач по уравнениям математической физике. – М.: Физматлит, 2001. 2. Владимиров В.С., Жаринов В.В. Уравнения математической физики. – М.: Физматлит, 2001.
Глава 1. ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ. §1. Введение.
Уравнение называется интегральным, если неизвестная функция входит в уравнение под знаком интеграла. Разумеется, мы не будем рассматривать интегральные уравнения в такой общей постановке, а ограничимся изучением только одномерных линейных интегральных уравнений следующего вида: 1) Уравнение Фредгольма 2-го рода: b
y ( x) = λ ∫ K ( x, s ) y ( s )ds + f ( x), x, s ∈ [a, b], a
где K(x,s) – заданная непрерывная по совокупности аргументов функция, называемая ядром интегрального уравнения; f(x) – заданная непрерывная функция, называемая неоднородностью уравнения (если f ≡ 0 , то уравнение называется однородным); λ – вещественный параметр; y(x) – неизвестная 1
функция, которую мы будем считать непрерывной. Если это специально не оговаривается, все входящие в интегральные уравнения функции будем предполагать вещественными. Мы кратко также рассмотрим обобщение на многомерный случай (важное для курса методов математической физики, который будет читаться в следующем семестре). 2) Уравнение Фредгольма 1-го рода: b
∫ K ( x, s) y ( s)ds =
f ( x), x, s ∈ [a, b],
a
где, как и выше, K(x,s) – ядро интегрального уравнения, заданная непрерывная по совокупности аргументов функция; f(x) – заданная непрерывная функция, называемая неоднородностью уравнения (если f ≡ 0 , то уравнение называется однородным); y(x) – неизвестная непрерывная функция. 3) Уравнение Вольтерра 2-го рода: x
y ( x) = λ ∫ K ( x, s ) y ( s )ds + f ( x), x, s ∈ [a, b], a
обозначения те же, что и для уравнения Фредгольма 2-го рода. K(x,s) – функция, непрерывная по совокупности аргументов в треугольной области ∆ = ( x, s : a ≤ s ≤ x ≤ b) . Понятно, что, если доопределить нулем K(x,s) в области ([a,b]x[a,b])\∆ (вне треугольной области), то можно рассматривать уравнение Вольтерра 2-го рода как частный случай уравнения Фредгольма 2-го рода (возможно с ядром, терпящим разрыв в точках отрезка прямой x=s, x и s на отрезке [a,b]). Тем не менее, уравнение Вольтерра обладает рядом интересных свойств, благодаря которым мы будем его изучать специально. 4) Уравнение Вольтерра 1-го рода: x
∫ K ( x, s) y ( s)ds =
f ( x), x, s ∈ [a, b],
a
обозначения те же, что и выше. Примеры интегральных уравнений, возникающих при исследовании дифференциальных уравнений, будет приведены позже после введения понятий функции Коши и функции Грина в параллельно читаемом курсе обыкновенных дифференциальных уравнений. Очень большое количество интегральных уравнений 1-го рода появляется при рассмотрении так называемых обратных задач, возникающих в физике в тех случаях, когда непосредственное измерение физических характеристик невозможно или, по крайней мере, затруднительно. Например, все суждения об удаленных астрофизических объектах делаются на основании измерений на поверхности Земли или на искусственных спутниках. При определении геофизических исследований проще и дешевле проводить измерения на земной поверхности, чем проводить непосредственные измерения глубоко залегающих объектов. Прекрасный пример – компьютерная томография, позволяющая производить «неразрушающий контроль» состояния мозга человека. Некоторые примеры интегральных уравнений встречались в математических курсах и ранее. Например, интегральное уравнение f ( x) = 1 / 2π
+∞
∫ exp(ixs) y( s)ds, x ∈ (−∞, + ∞),
−∞
2
не являющееся интегральным уравнением Фредгольма, решается с помощью интегрального преобразования Фурье: y ( s ) = 1 / 2π
+∞
∫ exp(−ixs) f ( x)dx, s ∈ (−∞, + ∞).
−∞
Рассмотрим простейший пример уравнения Вольтерра 1-го рода: x
∫ y( s)ds =
f ( x), x, s ∈ [a, b].
a
Здесь K ( x, s ) ≡ 1. Будем предполагать, что решение y(s) – непрерывная на [a,b] функция. При исследовании интегральных уравнений нас будут интересовать три следующих основных вопроса. Во-первых, существование решения. Казалось бы, что решение существует в случае, если f(x) – непрерывно y ( x) = f ′( x). Но непрерывной дифференцируемая функция: тогда дифференцируемости недостаточно! На самом деле, интеграл в левой части уравнения обращается в нуль при x=a. Поэтому для разрешимости нужно потребовать дополнительно выполнение условия f(a)=0. Во-вторых, нас будет интересовать единственность решения. Очевидно, что при сформулированных выше условиях решение не только существует, но и единственно. В-третьих, нас будет интересовать устойчивость решения, т.е. будут ли изменения решения «малыми» при «малых» изменениях неоднородности f(x). Для того, чтобы говорить о «малости» изменений неоднородности, о близости функций, нам сначала нужно познакомиться с некоторыми понятиями теории линейных нормированных пространств.
3
§2. Метрические, нормированные и евклидовы пространства. Элементы теории линейных операторов. Множество L называется (вещественным) линейным пространством, если для любых двух его элементов x, y определен элемент x+y∈L (называемый суммой x и y), и для любого элемента x∈L и любого (вещественного) числа α определен элемент αx∈L, причем выполнены следующие условия: 1) для любых элементов x, y∈L x+y=y+x (коммутативность сложения); 2) для любых элементов x, y, z∈L (x+y)+z=x+(y+z) (ассоциативность сложения); 3) существует элемент 0∈L (называемый нулевым элементом, или нулем пространства L) такой, что для любого элемента x∈L x+0=x (существование нулевого элемента); 4) для любого элемента x∈L существует элемент (-x)∈L (называемый обратным к x) такой, что x+(-x)=0 (существование обратного элемента); 5) для любых элементов x,y∈L и любого (вещественного) числа α α(x+y)=αx+αy (дистрибутивность умножения суммы элементов на число); 6) для любых (вещественных) чисел α и β и любого элемента x∈L (α+β)x=αx+βx (дистрибутивность умножения суммы чисел на элемент); 7) для любых (вещественных) чисел α, β и любого элемента x∈L (αβ)x=α(βx) (ассоциативность умножения на число); 8) для любого элемента x∈L 1x=x (свойство единицы). Элементы линейного пространства называются векторами, поэтому линейное пространство иногда называется векторным. Элементы линейного пространства L (векторы) y1, …, yn называются линейно независимыми, если их линейная комбинация α1 y1+…+αn yn≠0 для любых чисел α1, …, αn, кроме α1=…=αn=0. Векторы y1, …, yn линейно зависимы в том и только в том случае, когда по крайней мере один из них является линейной комбинацией остальных. Если максимальное число линейно независимых векторов пространства L конечно, то это число называется (линейной) размерностью пространства L, а само линейное пространство называется конечномерным. В противном случае пространство L бесконечномерно. В качестве примера линейного пространства можно привести изучаемое в курсе линейной алгебры конечномерное векторное пространство Rn. Еще один пример – пространство (вещественных) функций, определенных на отрезке [a,b]. Очевидно, что это пространство можно рассматривать как линейное, если определить сумму элементов и умножение на вещественное число обычным образом (как?). Нулевым элементом этого пространства является функция, тождественно равная нулю. Подмножество L1 линейного L называется (линейным) подпространством L, если любая линейная комбинация элементов L1 принадлежит L1 (т.е. L1 само является линейным пространством). Дадим теперь определение метрического пространства: множество M называется метрическим пространством, если для любых двух его элементов x, y∈M определено вещественное число ρ(x,y) (называемое метрикой, или расстоянием), причем выполнены следующие условия: 1) для любых элементов x, y∈M ρ(x,y)≥0, и ρ(x,y)=0 тогда и только тогда, когда элементы x и y совпадают (x=y) (неотрицательность метрики); 2) для любых элементов x, y∈M ρ(x,y)=ρ(y,x) (симметричность метрики); 3) для любых элементов x, y, z∈M ρ(x,y)≤ ρ(x,z)+ ρ(y,z) (неравенство треугольника).
1
В метрическом пространстве можно ввести понятие сходимости последовательности элементов, а именно: последовательность элементов xn∈M, n=1, 2, …, сходится к элементу x0∈M (обозначается xn → x0 при n→∝), если ρ(xn, x0)→0 при n→∝.Можно дать определение открытого и замкнутого множества (как?). Заметим, что метрическое пространство не обязательно является линейным. Дадим далее определение нормированного пространства: линейное пространство N называется нормированным, если для любого элемента x∈N определено вещественное число ||x|| (называемое нормой), причем выполнены следующие условия: 1) для любого элемента x∈N ||x||≥0, и ||x||=0 тогда и только тогда, когда x=0; 2) для любого элемента x∈N любого (вещественного) числа α ||αx||=|α|||x|| (неотрицательная однородность нормы); 3) для любых элементов x, y∈N ||x+y||≤||x||+||y|| (неравенство треугольника). Нормированное пространство является метрическим: ρ(x,y)=||x-y||. В нормированном пространстве легко определить понятие сходимости последовательностей. Последовательность элементов xn∈N, n=1, 2, …, сходится (по норме пространства N) к элементу x0∈N (обозначается xn→ x0 при n→∝), если ||xn-x0||→0 при n→∝.Можно дать определение открытого и замкнутого множества (как?). Докажем теперь, что из сходимости по норме следует сходимость норм элементов последовательности к норме предельного элемента. Обратное, очевидно, неверно. Лемма. Если xn → x0 при n→∝, то || xn||→ || x0||. Доказательство. Докажем сначала неравенство, тривиально следующее из неравенства треугольника: для любых элементов x, y∈N |||x||-||y|||≤||x-y||. На самом деле, из неравенства треугольника следует ||x||=||x-y+y||≤||x-y||+||y||. Отсюда ||x||-||y||≤||x-y||. Меняя x и y местами, получаем ||y||=||y-x+x||≤||x-y||+||x||, или ||y||-||x||≤||x-y||. Из этих двух неравенств следует написанное выше. Пусть теперь xn→ x0 при n→∝. Тогда |||xn||-|| x0|||≤|| xn- x0|| →0, из чего и следует утверждение Леммы. В качестве примеров нормированных пространств можно привести конечномерное евклидово пространство Rn (изучавшееся в курсе линейной алгебры) и пространство C[a,b] функций, непрерывных на отрезке [a,b] (опишите подробнее это линейное пространство!). Норма в пространстве C[a,b] определяется ||y||C[a,b]=max{|y(s)|, s∈[a,b]}(докажите, что это на самом деле норма!). Сходимость по норме пространства C[a,b] называется равномерной сходимостью. Свойства равномерно сходящихся последовательностей непрерывных функций изучались в курсе математического анализа. В частности, было доказан критерий Коши равномерной сходимости, а именно, необходимым и достаточным условие равномерной сходимости функциональной последовательности является ее фундаментальность. Определение. Последовательность xn, n=1,2,…, элементов нормированного пространства N называется фундаментальной, если для любого ε>0 найдется номер K такой, что для любого n≥K и любого натурального p ||xn+p-xn||≤ε. Если последовательность сходится, то она фундаментальна (докажите!). Если же любая фундаментальная последовательность сходится, то нормированное пространство называется полным.
2
Определение. Полное нормированное пространство называется банаховым. Поскольку в курсе математического анализа было доказано, что критерий Коши является не только необходимым, но и достаточным условием равномерной сходимости, то, тем самым, было доказано, что пространство C[a,b] является банаховым. Очевидно, свойством полноты обладает и пространство Rn (докажите!). В дальнейшем нам потребуется и пространство функций, непрерывных с производными до p-го порядка включительно на интервале [a,b], сходимость в котором является равномерной со всеми производными до p-го порядка (p≥0 – целое). Такое пространство обозначается C(p)[a,b] (C(0)[a,b]= C[a,b]). Можно ввести много различных норм в этом пространстве, порождающих указанный выше тип сходимости. Из всех таких (эквивалентных) норм для нас удобнее всего будет следующая: p
|| y ||C ( p ) [ a ,b ] = ∑ max{| y ( k ) ( s ) |, s ∈ [a, b]}. k =0
Докажите, что это на самом деле норма, и пространство C(p)[a,b] является банаховым (!!!). Определение. Линейное пространство E называется евклидовым, для любых двух элементов x, y∈E определено вещественное число (x,y), называемое скалярным произведением, причем выполнены следующие условия: 1) для любых элементов x, y∈E (x,y)=(y,x) (симметричность); 2) для любых элементов x1,x2, y∈E (x1+x2,y)=( x1,y)+(x2,y) (аддитивность по первому аргументу); 3) для любых элементов x, y∈E и любого вещественного числа α (αx,y)= α(x,y) (однородность по первому аргументу) (в силу условий 2) и 3) и симметричности скалярное произведение является линейным как по первому, так и по второму аргументу); 4) для любого x∈E (x,x)≥0, причем (x,x)=0 тогда и только тогда, когда x=0 (свойство скалярного квадрата). Скалярное произведение порождает норму: ||x||E={(x,x)}1/2. Проверьте, что это на самом деле норма! Примером конечномерного линейного пространства является пространство n-мерных векторов Rn, изучавшееся в курсе линейной алгебры. Это пространство состоит из векторов-столбцов, а скалярное произведение в этом пространстве произведение определяется как (x,y)=x1y1+…+xnyn, где x1,…,xn; y1,…,yn; - компоненты векторов x и y соответственно. В курсе линейной алгебры было доказано неравенство КошиБуняковского: |(x,y)|≤||x||||y||, причем равенство выполняется тогда и только тогда, когда элементы x и y линейно зависимы. Проверьте сами, что неравенство Коши-Буняковского справедливо в любом евклидовом пространстве. Отметим, что пространство Rn является полным. Еще один пример евклидового, но уже бесконечномерного пространства рассматривался в курсе математического анализа. А именно, рассмотрим снова линейное пространство функций, непрерывных на отрезке [a,b], но введем норму с помощью скалярного произведения: для любых непрерывных на [a,b] функций y1(x), y2(x) положим b
( y1 , y 2 ) = ∫ y1 ( x) y 2 ( x)dx. a
3
Проверьте, что это на самом деле скалярное произведение! Пространство непрерывных функций с нормой, порожденной введенным скалярным произведением, обозначим h[a,b]. Тем самым, b
|| y || h[ a,b] = {∫ y 2 ( x)dx}}1 / 2 . a
Сходимость по норме h[a,b] называется сходимостью в среднем. В курсе математического анализа было доказано, что из равномерной сходимости следует сходимость в среднем (докажите!). Из сходимости же в среднем не следует не только равномерная, но даже поточечная сходимость (постройте пример!). Очевидно, что евклидово пространство h[a,b] является бесконечномерным (почему?). К сожалению, это пространство не является полным. На самом деле, легко построить последовательность функций, непрерывных на отрезке [a,b] (например, кусочно-линейных), которая сходится в среднем к разрывной функции: y(x)=0 при a≤x<(a+b)/2; y(x)=1 при (a+b)/2≤x≤b. Такая функциональная последовательность является фундаментальной в h[a,b], но не имеет в h[a,b] предел (почему? Докажите!). В курсе функционального анализа доказывается, что любое неполное нормированное пространство можно пополнить. Полное бесконечномерное евклидово пространство называется гильбертовым. Если пополнить пространство h[a,b], то мы получим гильбертово пространство L2[a,b]. Однако для того, чтобы описать, из каких элементов состоит это пространство, нужно знать не только интеграл Римана (который изучался в курсе математического анализа), но и интеграл Лебега. При изложении курса интегральных уравнений мы будем рассматривать пространство h[a,b], понимая, что это пространство неполно. Но в этом пространстве легко определить, что такое ортогональность, поскольку в этом пространстве задано скалярное произведение. Если же нам потребуется полнота, то мы будем рассматривать пространство C[a,b]. К сожалению (это доказывается в курсе функционального анализа), в этом пространстве нельзя ввести эквивалентную норму, порожденную скалярным произведением, т.е. превратить это пространство в гильбертово, сохранив в качестве сходимости по норме равномерную сходимость. Перейдем теперь к определению линейного оператора. Оператор А, действующий из линейного пространства L1 в линейное пространство L2 называется линейным, если для любых элементов y1 и y2 из L1 и любых вещественных чисел α1 и α2 выполнено равенство A(α1 y1+α2 y2)= α1A y1+α2A y2. Будем обозначать область определения оператора A как D(A). Для простоты будем считать D(A)= L1. Множество значений оператора A обозначим R(A). В данном случае R(A)⊆ L2 - линейное подпространство L2. Если оператор A взаимно однозначный, то можно ввести обратный оператор A-1 с областью определения D(A-1)=R(A) и множеством значений R(A-1)=D(A)= L1. Для линейного оператора вопрос о существовании обратного решается следующим образом: будем называть нуль-пространством оператора A множество KerA={x∈L1: Ax=0}. Очевидно, что KerA – линейное подпространство L1, причем 0∈ KerA. Если KerA≠{0} (в этом случае говорят, что нуль-пространство нетривиально), то оператор A называется вырожденным. Обратный оператор существует тогда и только тогда, когда оператор A не является вырожденным (докажите!). 4
В качестве основного примера линейного оператора мы будем рассматривать интегральный оператор Фредгольма b
Ay ≡
∫ K ( x, s) y(s)ds; x, s ∈ [a, b]. a
Если ядро K(x,s) непрерывно по совокупности аргументов (а это мы будем предполагать в течение всего курса), то в соответствии с теоремой о непрерывной зависимости от параметра собственного интеграла, доказанной в курсе математического анализа, оператор A действует в линейном пространстве функций, непрерывных на отрезке [a,b] и, очевидно, является линейным. Мы будем рассматривать линейные операторы, действующие в нормированных пространствах. Пусть оператор А отображает нормированное пространство N1 в нормированное пространство N2 (для простоты будем считать, что D(A)=N1). Определение. Оператор A называется непрерывным в точке y0∈D(A), если для любого ε>0 найдется такое δ>0, что для всех y∈D(A) и удовлетворяющих неравенству ||y-y0||≤δ выполняется неравенство ||Ay-Ay0||≤ε. Как и в курсе математического анализа можно дать эквивалентное определение непрерывности оператора в точке (докажите их эквивалентность!): Определение. Оператор A называется непрерывным в точке y0∈D(A), если для любой последовательности yn, n=1, 2, …, yn∈D(A), yn→y0, последовательность Ayn сходится к Ay0. Оператор A называется непрерывным на D(A) (на N1), если он непрерывен в каждой точке. Оказывается, что линейный оператор непрерывен тогда и только тогда, когда он непрерывен в нуле! На самом деле, если yn→y0, то yn - y0→0, а из линейности оператора вытекает, что Ayn→Ay0 тогда и только тогда, когда A(yn y0)→0 (завершите доказательство!). Определение. Нормой оператора А называется A N1 → N 2 = sup Ay N 2 y
N1 =1
Если это не будет вызывать разночтений, то для сокращения записи будем обозначать A N1→N 2 = A . Если A < +∞ , то оператор А называется ограниченным. В конечномерных пространствах любой линейный оператор является ограниченным (докажите!). Пример линейного неограниченного оператора. Пространство C [0, 1] очевидно является бесконечномерным пространством. Рассмотрим оператор d , определенный на линейном подпространстве дифференцирования A= ds непрерывно дифференцируемых функций из C [0, 1] . Покажем, что А неограниченный линейный оператор. Возьмем последовательность функций y n = cos n s . Тогда: yn = max cos ns = 1 , но Ay n (s ) = n ⋅ sin ns → ∞ при n → ∞ . s∈[ 0 ,1]
Теорема. Для любого y ∈ N1 выполнено неравенство
Ay ≤ A y ,
где А – линейный ограниченный оператор, действующий из нормированного пространства N 1 в нормированное пространство N 2 . 5
Доказательство. 1). Для y=0 теорема верна: 0=0.
y ≠ 0 . Возьмем элемент z =
2). Рассмотрим теперь случай
|| Az ||=|| A
единичный вектор: ||z||=1. Тогда
y y
y ||≤|| A || , из чего и следует y
утверждение теоремы. Теорема. Линейный оператор А: N 1 → N 2 , является непрерывным тогда и только тогда, когда он ограничен. Доказательство. Поскольку оператор A линейный мы будем исследовать непрерывность только в точке 0. 1) Докажем, что из ограниченности следует непрерывность. Возьмем при n→∞ .Тогда ||Ayn||≤||A||||yn||→0 , а последовательность yn→0 следовательно, оператор А непрерывный. 2) Докажем, что из непрерывности следует ограниченность. Предположим, что оператор A неограниченный. Тогда существует последовательность yn, n=1, 2, …; такая, что ||yn||=1, ||Ayn||≥n. Но при n→∞ ||Ayn/n||≥1, а yn/n→0, что противоречит непрерывности оператора A. b
Покажем теперь, что интегральный оператор Ay ≡ ∫ K ( x, s ) ⋅ y ( s ) ds , x ∈ [a, b] , a
является
ограниченным
из
2
в
h[a,b].
Запишем:
b
z ( x) = Ay = ∫ K ( x, s ) y ( s ) ds , 2
h[a,b]
2
b
y =
∫y
2
( s ) ds =1.
a
a
По неравенству Коши-Буняковского для каждого фиксированного x∈[a,b]: 2
b
b
∫ K ( x, s) y(s) ds ≤ ∫ K a
Интегрируем
a
по
x: Ay
2
b
2
b
( x, s ) ds × ∫ y ( s ) ds = ∫ K 2 ( x, s ) ds. . 2
a
a
b b
≤ ∫∫ K 2 ( x, s ) dx ds .
Поскольку
правая
часть
a a
неравенства не зависит от у, то: b b
A ≤
∫∫ K
2
( x, s ) dx ds <+∝,
a a
что и требовалось доказать. Докажите, что оператор интегральный оператор Фредгольма А является ограниченным при действии из C[a,b] в C[a,b], из h[a,b] в C[a,b] и из C[a,b] в h[a,b] и найдите оценки сверху для нормы оператора! В дальнейшем нам потребуется следующая тривиальная Лемма. Пусть линейный ограниченный оператор A действует из нормированного пространства N1 нормированное пространство N2, линейный ограниченный оператор B действует из нормированного пространства N2 нормированное пространство N3. Тогда ||BA||≤||A||||B||. Доказательство. Для любого элемента y из N1 (||y||=1) имеет место: ||BAy||≤||B||||Ay||≤||B||||A||||y||=||B||||A||. Отсюда и из определения нормы линейного оператора следует утверждение Леммы.
6
Определение. Последовательность yn,, n=1,2,…, элементов нормированного пространства N называется ограниченной, если существует константа C такая, что ||yn||≤C для всех n=1,2,…. . Любая сходящаяся последовательность является ограниченной (докажите!!!). Любая фундаментальная последовательность является ограниченной (докажите!!!). Определение. Последовательность yn,, n=1,2,…, элементов нормированного пространства N, обладающая тем свойством, что из любой ее подпоследовательности можно выделить сходящуюся, называется компактной. Легко доказать, что компактная последовательность является ограниченной. На самом деле, если последовательность yn,, n=1,2,…, не является ограниченной, то найдется подпоследовательность y nk такая, что || y nk ||≥ k , k = 1,2,... ,
из
которой
нельзя
выделить
сходящуюся
подпоследовательность. Замечание. В R1 критерий компактности последовательности определяется теоремой Больцано-Вейерштрасса: из любой ограниченной последовательности вещественных чисел можно выделить сходящуюся подпоследовательность. Аналогичное утверждение (какое?) имеет место и в Rn. Для ∞ -мерных пространств это не так. Пример 1. Приведем пример некомпактной последовательности вещественных чисел: 1, 2, 3, … . Очевидно, что из этой последовательности нельзя выделить сходящуюся подпоследовательность. Рассмотрим теперь следующую последовательность: 1, 1, 2, 1, 3, 1, … . Эта последовательность также некомпактна – из нее можно выделить сходящуюся подпоследовательность, но нельзя выделить сходящуюся подпоследовательность из любой ее подпоследовательности. Пример. Рассмотрим пространство h[a,b]. В курсе математического анализа доказывалось существование в h[a,b] ортонормированной системы, состоящей из бесконечного числа элементов (например, с помощью тригонометрической системы функций): ⎧0, i ≠ j . en , n = 1,2,... , e j = 1 , (ei , e j ) = δ ij = ⎨ ⎩1, i = j Покажем, что из последовательности членов ортонормированной системы (эта последовательность, очевидно, является ограниченной) нельзя выделить сходящуюся подпоследовательность. На самом деле: 2 ei − e j = (ei − e j , ei − e j ) = 2 , i ≠ j ⇒ ei − e j = 2 , если i≠j. Поэтому никакая подпоследовательность этой последовательности не может быть фундаментальной, а, следовательно, сходящейся. Рассмотрим теперь последовательность: e1, c, e2, c, e3, c, … (c – фиксированный вектор из h[a,b]). Эта последовательность также некомпактна – из нее можно выделить сходящуюся подпоследовательность, но нельзя выделить сходящуюся подпоследовательность из любой ее подпоследовательности. Постройте сами пример ограниченной, но некомпактной последовательности элементов C[a, b]. Дадим теперь определение вполне непрерывности линейного оператора, в нормированное действующего из нормированного пространства N1 пространство N2.
7
Определение. Линейный оператор А называется вполне непрерывным, если для любой ограниченной последовательности элементов y n из N1 последовательность zn=Ayn элементов N 2 такова, что из любой ее подпоследовательности можно выделить сходящуюся подпоследовательность. Таким образом, вполне непрерывный оператор преобразует любую ограниченную последовательность в компактную. Теорема. Вполне непрерывный оператор является ограниченным (а, следовательно, непрерывным). Доказательство. Предположим, что вполне непрерывный оператор A не является ограниченным. Тогда найдется последовательность yn, n=1,2,…, yn∈N1, ||yn||=1, такая, что ||Ayn||≥ n. Но тогда из последовательности zn=Ayn нельзя выделить сходящуюся подпоследовательность, что противоречит тому, что A – вполне непрерывный оператор. Заметим, что не любой непрерывный линейный оператор является вполне непрерывным. Пример. Рассмотрим единичный оператор I: h[a,b] → h[a,b], Iy=y для любого y. Он, очевидно, является ограниченным, но не является вполне непрерывным. Для доказательства этого утверждения достаточно рассмотреть последовательность членов ортонормированной системы из предыдущего примера и заметить, что Ien=en. Теорема. Пусть А - оператор Фредгольма, действующий из h[a,b] в h[a,b]. Тогда А - вполне непрерывный оператор. Доказательство. а) Докажем сначала, что А - вполне непрерывный h[a, b] → C[a, b] . Критерий компактности оператор при действии последовательности элементов пространства C[a,b] определяется теоремой Арцела, доказанной в курсе математического анализа. Теорема Арцела. Если последовательность элементов C[a,b] равномерно ограничена и равностепенно непрерывна, то из нее можно выделить равномерно сходящуюся подпоследовательность. Доказательство данной теоремы основывается на проверке условий теоремы Арцела. yn ≤ M , Рассмотрим последовательность y n ∈ h[a, b] такую, что b
n=1,2,…, и последовательность zn ( x ) = Ay n =
∫ K ( x, s) ⋅ yn (s) ds . Докажем, что a
последовательность zn(x) равномерно ограничена и равностепенно непрерывна. 1) Докажем сначала равномерную ограниченность. Обозначим K0=sup{|K(x,s)|: x,s∈[a,b]}. Поскольку функция K(x,s) непрерывна по совокупности аргументов x, s на замкнутом ограниченном множестве (квадрате) [a,b]x[a,b], то K0<+∞. (Более того, K0=max{|K(x,s)|: x,s∈[a,b]}). Тогда b
z n ( x) = ∫ K ( x, s ) y n ( s ) ds ≤ a
b
b
2 2 ∫a K ( x, s) ds ⋅ ∫a yn (s) ds ≤ M K o b − a 142 4 43 4 1424 3 ≤ K o2 ⋅( b − a )
≤M 2
для всех x ∈ [a, b] и всех n=1,2,… , а это и есть равномерная ограниченность.
8
2) Докажем теперь равностепенную непрерывность последовательности zn(x). Возьмем произвольные точки x1 , x2 ∈ [a, b] . Имеем b
z n ( x1 ) − z n ( x2 ) = ∫ [ K ( x1 , s ) − K ( x2 , s )] y n ( s ) ds ≤ a
b
b
a
a
2 2 ∫ [ K ( x1 , s) − K ( x2 , s)] ds ⋅ ∫ yn (s) ds.
Фиксируем произвольное ε>0. Функция K(x,s) непрерывна по совокупности аргументов x, s на замкнутом ограниченном множестве [a,b]x[a,b], а, следовательно, равномерно непрерывна на этом множестве. Поэтому для любого ε>0 найдется такое δ>0, что x1 − x2 ≤ δ .
K ( x1 , s ) − K ( x2 , s ) ≤
ε
M b−a
, если
Тем самым, для любого ε>0 найдется такое δ>0, что
z n ( x1 ) − z n ( x 2 ) ≤ ε для всех n=1,2,…, и всех x1 , x2 ∈ [ a, b] , удовлетворяющих
x1 − x2 ≤ δ , т.е. последовательность zn(x) равностепенно непрерывна. Итак, последовательность функций z n (x) , непрерывных на замкнутом интервале [a,b], равномерно ограничена и равностепенно непрерывна. Из теоремы Арцела следует, что из последовательности z n (x) можно выделить равномерно сходящуюся подпоследовательность, а, как было доказано в курсе математического анализа, равномерно сходящаяся последовательность непрерывных функций сходится к непрерывной функции. Очевидно, что этим же свойством обладает и любая подпоследовательность последовательности z n (x) . Следовательно, оператор А является вполне непрерывным при действии h[a, b] → C[a, b] . Но, т.к. из равномерной сходимости следует сходимость в среднем, то та же самая подпоследовательность непрерывных функций, которая сходится равномерно к некоторой непрерывной функции, сходится и в среднем к той же функции. Тем самым, оператор А является вполне непрерывным и из h[a,b] в h[a,b]. Теорема доказана. В дальнейшем нам потребуется аналогичное утверждение и для интегрального оператора типа Вольтерра. Слушателям предлагается доказать его самостоятельно. Нам потребуется понятие самосопряженного (или симметрического) оператора. Пусть оператор А действует E → E (Е- бесконечномерное евклидово пространство). Определение. Оператор A∗ : E → E будем называть сопряженным к оператору А, если ∀ y1 , y2 ∈ E ( Ay1 , y2 ) = ( y1 , A∗ y2 ) . (Докажите, что A∗ - линейный оператор!). Пусть А- ограниченный оператор. Покажем, что A = A∗ . Пусть y -любой элемент из E такой, что y = 1 . Тогда 2
Ay = ( Ay, Ay) = ( A∗ Ay, y) ≤ A∗ Ay y ≤ A∗ Ay ≤ A∗ A y = A∗ A . Поэтому для любого y∈E, ||y||=1, выполнено неравенство 2
Отсюда A ≤ A ∗
2
Ay ≤ A∗ A .
A .
9
Проведя аналогичные рассуждения A∗
2
≤ A∗
для оператора
A ∗ , получим
A . Из этих двух неравенств получаем, что A = A ∗ .
Определение. Если A = A ∗ , то оператор А называется самосопряженным. Рассмотрим оператор Фредгольма, действующий из E=h[a,b] в E=h[a,b]: b
Ay ≡ ∫ K ( x, s ) y ( s ) ds . Тогда для любых y1, y2∈E a
b b
∫∫
b b
∫∫
( Ay1 , y 2 ) = ( K ( x, s ) y1 ( s ) ds ) y 2 ( x ) dx = ( K ( x, s ) y 2 ( x ) dx ) y1 ( s ) ds = ( y1 , A∗ y 2 ), a a
a a
или b b
∫∫
∗
( y1, A y 2 ) = ( K ∗ ( s, x ) y 2 ( x ) dx ) y1 ( s ) ds, K ∗ ( s, x ) = K ( x, s ). a a
∗
Итак, A - оператор, сопряженный к оператору Фредгольма с ядром K(x,s) , также является оператором Фредгольма с ядром K ∗ ( x, s ) = K ( s, x) для любых x, s ∈ [a, b] . Если K ( x, s ) = K ( s, x) для любых x, s ∈ [a, b] , то ядро K ( x, s ) называется симметрическим. В этом случае интегральный оператор является самосопряженным (при действии из E в E). Докажите сами, что если ядро интегрального оператора не является симметрическим, то оператор не является самосопряженным. Напомним, что ядро интегрального оператора непрерывно по совокупности аргументов.
10
§3. Существование собственного значения у самосопряженного вполне непрерывного оператора. Пусть линейный оператор A действует в линейном пространстве L. Число Λ называется собственным значением оператора A, если существует элемент y≠0 такой, что Ay=Λy. Элемент y называется собственным вектором. Множество собственных векторов, соответствующих собственному значению Λ, является подпространством пространства N (докажите!). Число λ=1/Λ (Λ≠0) называется характеристическим числом оператора A. Пусть далее выполнены следующие условия для оператора А: 1) А: E→E (E – бесконечномерное евклидово пространство h[a,b]); 2) A = A ∗ ; 3) A – вполне непрерывный оператор. Мы докажем, что при этих условиях оператор A имеет по крайней мере одно собственное значение. Докажем сначала леммы, из которых и будет следовать этот важный результат. Лемма 1. Пусть А - самосопряженный оператор, и e – произвольный вектор из E, e = 1 . Тогда справедливо неравенство Ae
2
≤ A2e ,
причем равенство имеет место тогда и только тогда, когда е является собственным 2 вектором оператора A 2 , соответствующим собственному значению Λ = Ae . Доказательство. Из неравенства Коши-Буняковского легко следует 2 Ae = ( Ae, Ae ) = A2e, e ≤ A2e ⋅ e = A2e ,
(
)
причем знак равенства может быть тогда и только тогда, когда A2e и e линейно зависимы, т.е. A2e=Λe. Итак, e – собственный вектор оператора A2. Для того, чтобы найти Λ, 2 умножим равенство скалярно на e. Получаем, что Λ = Ae . Пусть теперь e – собственный вектор оператора A2, соответствующий 2 собственному значению Λ = Ae . Тогда A2e=||Ae||2e и ||A2e||=||Ae||2. Лемма 1 доказана.
Определение. Элемент е называется максимальным элементом (вектором) оператора A, если e = 1 и Ae = A . Как было доказано в предыдущем в параграфе, вполне непрерывный оператор является ограниченным. Лемма 2. Самосопряженный вполне непрерывный оператор А обладает максимальным вектором. Доказательство. Обозначим A = M . По определению нормы оператора существует последовательность yn, свойством:
y n = 1 , n=1, 2, …, такая, что z n = Ay n обладает
z n → A = M . Т.к. последовательность y n ограничена, и оператор А –
вполне непрерывный, то из последовательности z n можно выделить сходящуюся подпоследовательность z nk → z ∈ E . Переобозначим z nk = z n . Из сходимости z n → z при
z n → ∞ следует сходимость z n → z = M . Рассмотрим вектор ~z = и покажем, что M этот вектор является максимальным вектором оператора A. Рассмотрим z z n = n . Из Леммы 1 следует неравенство: последовательность ~ M Az n 1 1 1 2 2 A~z n = = A2 yn ≥ Ay n = zn . M M M M
z С другой стороны: A~ zn ≤ A ~ zn = A n = zn . M Из этих двух неравенств следует:
zn M
2
z n ≤ z n . Поскольку ~z n → ~ z , то, переходя к ≤ A~
пределу при n → ∞ , получим: M ≤ A~ z ≤ M , или
z A~ z = M , т.е. ~z = M
является
максимальным вектором для оператора А. Лемма 3. Если z - максимальный вектор самосопряженного оператора А, то z собственный вектор оператора A 2 , соответствующий собственному значению 2 Λ= A =M2. Доказательство. Из определения максимального вектора следует 2 2 M 2 = A = Az ≤ A 2 z ≤ A 2 z = A 2 ≤|| A || 2 = M 2 , т.е. Az
2
= A2 z .
По Лемме 1 z - собственный вектор оператора A 2 , соответствующий собственному 2 2 значению Λ = Az = A = M 2 , что и требовалось доказать.
Лемма 4. Если оператор A 2 обладает собственным вектором z, соответствующим собственному значению M 2 , то оператор А имеет собственный вектор, соответствующий собственному значению M или − M . Доказательство. A 2 z = M 2 z , а z – собственный вектор, т.е. z ≠ 0 . Перепишем это равенство в следующем виде: ( A 2 − M 2 I ) z = 0 , где I – единичный оператор. Это же равенство можно переписать в виде ( A − MI )( A + MI ) z = 0 . Возможны два случая: пусть сначала u = ( A + MI ) z ≠ 0 . Тогда ( A − MI ) u = 0 или Au = Mu , т.е. u – собственный вектор оператора A, соответствующий собственному значению M. Если же u = ( A + MI ) z = 0 , то z – собственный вектор оператора A, соответствующий собственному значению -M. Теорема. Самосопряженный вполне непрерывный оператор А, действующий в бесконечномерном евклидовом пространстве, обладает собственным вектором, соответствующим собственному значению Λ : Λ = A . Доказательство. По лемме 2 оператор А обладает максимальным вектором z. По лемме 3 этот вектор z является собственным вектором оператора A 2 ,соответствующим 2 собственному значению A , а по лемме 4 оператор А имеет собственный вектор, соответствующий собственному значению A или − A , т.е. Λ = A . ▲ Замечание. Эта теорема, вообще говоря, не верна, если отказаться от условий самосопряженности или вполне непрерывности. Пример. Вполне непрерывный оператор, который не имеет ни одного собственного значения, это, например, невырожденный оператор Вольтерра с непрерывным ядром. Этот результат мы получим позднее. Пример. Рассмотрим оператор умножения на x: Ay = x ⋅ y (x) для любой функции y(x) из h[a,b]. Оператор А самосопряженный, т.к. для любых y1(x), y2(x) из h[a,b]: b
b
a
a
( Ay1 , y 2 ) = ∫ x y1 ( x) y 2 ( x) dx = ∫ y1 ( x) x y 2 ( x) dx = ( y1 , Ay 2 ) . Оператор А не имеет собственных значений, т.к. если Λ -собственное значение А, то x y ( x) = Λ y ( x) , из чего следует, что y ( x) ≡ 0 при x ∈ [a, b] .
b
Рассмотрим оператор Фредгольма А: h[a, b] → h[a, b] , Ay = ∫ K ( x, s ) y ( s ) ds . a
Ядро K ( x, s ) удовлетворяет следующим условиям: оно вещественное, непрерывное по совокупности переменных ( x, s ) , не равное тождественно нулю и симметрическое. Теорема. Пусть выполнены все эти условия для интегрального оператора A . Тогда оператор Фредгольма обладает собственным значением Λ , Λ ≠ 0 : Ay = Λy , y ≠ 0 , y ∈ h[a, b] . Замечание. В теории интегральных уравнений удобнее использовать 1 характеристические числа: λ = , Λ ≠ 0 . Тогда в утверждении теоремы: λ A y = y . Λ Доказательство. Ранее было доказано, что оператор Фредгольма является вполне непрерывным, а при условии симметричности ядра и самосопряженным. Тем самым, по доказанной выше теореме оператор Фредгольма имеет хотя бы одно собственное значение. Для того, чтобы доказать, что это собственное значение не равно нулю, достаточно самостоятельно доказать следующее утверждение. Утверждение. Пусть A - линейный ограниченный оператор, A: N 1 → N 2 , N1 и N2 – нормированные пространства, и A ≠ 0 . Тогда A > 0 . (Докажите сами!)
§4. Построение последовательности собственных значений и собственных векторов вполне непрерывного самосопряженного оператора. Пусть вполне непрерывный самосопряженный оператор A действует в бесконечномерном евклидовом пространстве h[a,b]. В предыдущем параграфе мы доказали, что такой оператор обладает собственным значением Λ : Az = Λz , Λ = A . Очевидно, что это собственное значение является максимальным по модулю. На ~ ~ z =1 самом деле, пусть Λ - другое собственное значение: A~z = Λ~z . Будем считать, что ~ ~ z ≤ A ~ z = A = Λ . Тем самым, любое (иначе просто пронормируем ~z ). Тогда Λ = A~ другое собственное значение, если оно есть, по модулю не превосходит A . Рассмотрим процедуру построения последовательностей собственных значений и собственных векторов вполне непрерывного оператора A . В предыдущем параграфе мы доказали существование собственного значения Λ 1 : Λ 1 = A . Сопоставим
Λ 1 собственный вектор
ϕ1 . Будем считать
ϕ1 = 1.
Обозначим H 1 = h[a,b] - все бесконечномерное евклидово пространство. Пусть оператор A≠0 (очевидно, что нулевой оператор имеет и притом только нулевое собственное значение). Рассмотрим множество H 2 векторов y: ( y, ϕ 1 ) = 0 , y ∈ H 1 ( H 2 -ортогональное дополнение к ϕ 1 ). Отметим его следующие свойства: а) H 2 - линейное пространство. На самом деле, для любых вещественных чисел α1 и α2 и любых y1 и y2 таких, что ( y1 , ϕ1 ) = 0, ( y2 , ϕ1 ) = 0 ⇒ (α1 y1 + α 2 y2 ,ϕ1 ) = 0 . б) H 2 - замкнуто (если последовательность yn → y и ( yn , ϕ1 ) = 0 , то ( y, ϕ 1 ) = 0 , n →∞
т.е. из того, что yn∈H2 следует, что y∈H2). Доказательство. Применяя неравенство Коши-Буняковского, получаем ( y n , ϕ1 ) − ( y , ϕ1 ) = ( y n − y , ϕ1 ) ≤ y n − y ϕ1 ⇒ ( y n , ϕ1 ) − ( y , ϕ1 ) → 0 . 1 424 3
А
т.к.
→0
( yn , ϕ1 ) = 0 , то и ( y, ϕ 1 ) = 0 . в) H 2 - инвариантное подпространство относительно оператора A , т.е. AH 2 ⊆ H 2 (из того, что y ∈ H 2 следует, что z = Ay ∈ H 2 ). Доказательство. ( z , ϕ 1 ) = ( Ay, ϕ 1 ) = ( y, Aϕ 1 ) = ( y, Λ 1ϕ 1 ) = Λ 1 ( y, ϕ 1 ) = 0 . Далее будем рассматривать оператор A : H 2 → H 2 . Очевидно, что A - вполне непрерывный и самосопряженный;
A
H 2 →H 2
≤ A
H1 → H1
= A .
Тогда по теореме предыдущего параграфа оператор A , действующий H 2 → H 2 , обладающий собственным значением Λ 2 : Λ 2 = A H 2 → H 2 = sup Ay . y: y =1 ( y ,ϕ1 ) =0
Λ 2 соответствует собственный вектор ϕ2 . Будем Собственному значению Λ 2 =0, то процесс построения собственных значений считать ϕ 2 = 1 . Если заканчивается. В противном случае введем далее множество H 3 , состоящее из векторов y таких, что ( y, ϕ 1 ) = 0 , ( y, ϕ 2 ) = 0 . Повторяя рассуждения, приведенные выше, можно доказать, что оператор A , отображающий H 3 → H 3 , вполне непрерывный и самосопряженный, и по теореме предыдущего параграфа имеет собственное значение
Λ3 = A
такое, что
H3 →H3
= sup Ay , которому сопоставим собственный вектор y: y =1 ( y ,ϕ1 ) =0 ( y ,ϕ 2 ) =0
ϕ3 . Будем считать ϕ 3 = 1 . Если Λ 3 =0, то процесс заканчивается. В противном случае введем пространство H4 и т.д. Замечание. Очевидно, что Λ 3 ≤ Λ 2 ≤ Λ1 . Возможны два случая: 1) ∀n = 1,2,... A H n → H n ≠ 0 . Тогда мы получаем бесконечные последовательности Λn и ϕn . 2) Для некоторого n H n +1 ≠ 0
A
H n +1 → H n + 1
= 0 , т.е. для некоторого n сужение
оператора A на пространство Hn+1 станет нулевым оператором. Тогда Λ n +1 = 0 и процесс построения прекращается. Замечание. Для оператора Фредгольма важна последовательность характеристических чисел: λ1 ≤ λ 2 ≤ ... . Тогда следует рассматривать следующие два варианта: 1)бесконечное число λ n ; 2)конечное число λ n . Теорема. Собственные векторы самосопряженного оператора A , соответствующие различным собственным значениям, ортогональны. Доказательство. Пусть Aϕ 1 = Λ 1ϕ 1 , Aϕ 2 = Λ 2 ϕ 2 , Λ1 ≠ Λ 2 , ϕ1 и ϕ2 – соответствующие собственные векторы. Тогда 0 = ( Aϕ 1 , ϕ 2 ) − ( Aϕ 2 , ϕ 1 ) = (Λ 1 − Λ 2 )(ϕ 1 , ϕ 2 ) , из чего следует (ϕ 1 , ϕ 2 ) = 0 . 14243 ≠0
Теорема. Число собственных значений вполне непрерывного самосопряженного оператора A , удовлетворяющих условию: || A ||≥ Λ ≥ δ > 0 , ( δ - фиксированное положительное число) конечно. Доказательство. Предположим, что собственных значений бесконечно много. Выберем последовательность (различных) собственных значений Λ1 , Λ 2 ,..., Λ n ,... и для каждого
собственного
значения
выберем
собственные
вектора
ϕ 1 , ϕ 2 ,..., ϕ n ,... .
( ϕ n = 1 ∀n = 1,2,... ), по предыдущей лемме они образуют ортонормированную систему. из последовательности Оператор A - вполне непрерывный. Следовательно, Aϕ n = Λ n ϕ n можно выделить сходящуюся подпоследовательность. Покажем, что это не так. Возьмем произвольные натуральные числа i и j, i≠j. Тогда Aϕ i − Aϕ j
2
= Λ iϕ i − Λ j ϕ j
2
= (Λ i ϕ i − Λ j ϕ j ,Λ i ϕ i − Λ j ϕ j ) = Λ2i + Λ2j ≥ 2δ 2 > 0 ,
т.е. никакая подпоследовательность последовательности Aϕ n = Λ n ϕ n не является фундаментальной, а, следовательно, никакая подпоследовательность не может сходиться. Определение. Число линейно независимых собственных векторов, соответствующих собственному значению, называется кратностью собственного значения. Теорема. Ненулевому собственному значению вполне непрерывного оператора A может соответствовать только конечное число линейно независимых собственных векторов.
Доказательство. Пусть Λ ≠ 0 , и Λ соответствует бесконечно много линейно независимых собственных векторов ϕ 1 , ϕ 2 ,..., ϕ n ,... . Применив процедуру ГрамаШмидта, хорошо известную из курса линейной алгебры (на всякий случай, ниже мы опишем эту процедуру), мы можем преобразовать ϕ 1 , ϕ 2 ,..., ϕ n ,... в ортонормированную систему. А тогда доказательство этой теоремы дословно повторяет доказательство предыдущей теоремы, если мы обозначим Λ = δ > 0 . А именно, поскольку ϕ n = 1 , (ϕ i , ϕ j ) = 0, i ≠ j , а
Aϕ n = Λϕ n , из последовательности 2
Aϕ n нельзя выбрать 2
сходящуюся подпоследовательность, поскольку Aϕ i − Aϕ j = 2 Λ > 0 при i≠j. Этот результат противоречит тому, что оператор A является вполне непрерывным. Замечание. Нулевому собственному значению может соответствовать как конечное, так и бесконечное число линейно независимых собственных векторов. Если существует последовательность линейно независимых собственных векторов ϕ 1 , ϕ 2 ,..., ϕ n ,... , то, используя процедуру Грама-Шмидта, ее можно преобразовать в ортонормированную систему. Напомним формулы процедуры Грамаϕ1 , ϕ 2 ,..., ϕ n ,.. строятся Шмидта. По заданной последовательности векторов последовательности ψ 1 ,ψ 2 ,...,ψ n ,... и e1 , e2 ,...en ,... по формулам: на первом шаге -
ψ 1 = ϕ 1 , e1 =
ψ1 ; ψ1
на n-ом шаге n −1
ψ n = ϕ n − ∑ (ϕ n , e k ) e k , e n = k =1
ψn . ψn
Теперь мы можем формулировать основной результат о построении последовательности собственных значений, упорядоченных в порядке невозрастания модуля: Λ 1 ≥ Λ 2 ≥ ... ≥ Λ n ≥ ... . Каждое собственное значение повторяется в этой последовательности столько раз, какова его кратность (Почему? Докажите!). Каждому собственному значению соответствует собственный вектор, причем можно выбрать собственные векторы так, что они образуют ортонормированную систему. На самом деле, собственные векторы, соответствующие разным собственным значениям ортогональны, а собственные векторы, соответствующие одному и тому же собственному значению, можно ортогонализовать, используя процедуру Грама-Шмидта. При этом, если ненулевых собственных значений бесконечно много, то Λ n → 0 . n→∞
Последовательность
Λ n является монотонно невозрастающей и ограниченной снизу
(нулем). Поэтому эта последовательность имеет предел. Если этот предел больше нуля, то мы получаем противоречие с доказанным выше утверждением о том, что число собственных значений, модули которых превышают любое фиксированное положительное число, конечно. Подытожим результаты, полученные выше в данном параграфе, в следующей теореме. Теорема. Пусть оператор А действует из h[a,b] в h[a,b] и является вполне непрерывным и самосопряженным. Тогда следующий процесс построения последовательности собственных значений и собственных векторов оператора А: 1) H 1 = h[a, b] , Λ 1 = A H → H ; 1
1
↑
ϕ1 2) H 2 = { y ∈ h[a, b] : ( y, ϕ 1 ) = 0} , Λ 2 = A
H 2 →H 2
;
↑
ϕ2 …; n) H n = { y ∈ h[a, b] : ( y, ϕ 1 ) = 0,..., ( y, ϕ n −1 ) = 0} , Λ n = A
H n →H n
,
↑
ϕn …, где можно считать, что ϕ 1 , ϕ 2 ,..., ϕ n ,... образуют ортонормированную систему (критерий остановки процесса
A
H n +1 → H n +1
= 0 ) приводит к двум возможным результатам:
1) Λ1 ≥ Λ 2 ≥ ... ≥ Λ n > Λ n+1 = 0 - конечная последовательность собственных значений. 2) Λ 1 ≥ Λ 2 ≥ ... ≥ Λ n ≥ ... - бесконечная последовательность собственных значений. При этом в последовательности собственных значений каждое собственное значение будет повторяться столько раз, какова его кратность. Процесс приводит к нахождению всех собственных значений кроме, быть может, в случае 2) нулевого собственного значения. Следствия. 1) Для характеристических чисел вполне непрерывного самосопряженного оператора: а). λ1 ≤ λ 2 ≤ ... ≤ λ n (конечная последовательность характеристических чисел); б). λ1 ≤ λ 2 ≤ ... ≤ λ n ≤ ... (бесконечная последовательность характеристических чисел). В этом случае lim λ n = ∞ . Каждому характеристическому n←∞
числу λn можно сопоставить собственный вектор ϕn , причем векторы {ϕn} образуют ортонормированную систему. 2) Все полученные результаты верны для интегрального оператора с непрерывным, симметрическим и неравным тождественно нулю ядром. В этом случае вместо слов собственные векторы говорят собственные функции интегрального оператора или собственные функции ядра K ( x, s ) . Рассмотрим множество векторов y ∈ h[a, b] таких, что Ay = 0 . Множество таких векторов образует замкнутое линейное пространство в h[a,b](доказать самостоятельно). Это множество называется (см. §2) нуль-пространством оператора A и обозначается: Ker A = { y : Ay = 0} . Очевидно, что нуль-пространство нетривиально (т.е. содержит ненулевые элементы) тогда и только тогда, когда оператор A имеет нулевое собственное значение (напомним, см. §2, в этом случае оператор A называется вырожденным). Определение. Ядро интегрального оператора K(x,s) называется замкнутым, если интегральный оператор является невырожденным. Пусть А - вполне непрерывный самосопряженный оператор со следующей последовательностью характеристических чисел (неважно, конечной или бесконечной) : λ1 ≤ λ 2 ≤ ... ≤ λ n ≤ ... , которым соответствует ортонормированная последовательность собственных векторов ϕ 1 , ϕ 2 ,..., ϕ n ,... . Теорема. Вектор y принадлежит нуль-пространству оператора А ( y ∈ Ker A ) тогда и только тогда, когда ( y, ϕ k ) = 0 k = 1,2,... ( ϕ k - конечная или бесконечная последовательность). Доказательство. 1) Необходимость. Нуль-пространство оператора A – это множество векторов, соответствующих нулевому собственному значению: Ay = 0 ⋅ y . Пусть ϕ 1 , ϕ 2 ,..., ϕ n ,... последовательность векторов, соответствующих
характеристическим числам (ненулевым собственным значениям). Мы доказали ранее, что векторы, соответствующие различным собственным значениям самосопряженного оператора А, являются ортогональными, поэтому ( y, ϕ k ) = 0 k = 1,2,... 2) Достаточность. Рассмотрим множество P ∈ h[a, b] , состоящее из векторов y таких, что ( y, ϕ k ) = 0 k = 1,2,... Очевидно (докажите!), что Р - линейное пространство. Р - замкнутое линейное подпространство, т.к. для любой последовательности y n ∈ P ,
( y n , ϕ k ) = 0, k = 1,2,... и y n → y 0 , получаем в силу непрерывности скалярного произведения ( y 0 , ϕ k ) = 0, k = 1,2,... , т.е. y 0 – элемент Р. Р – инвариантное подпространство оператора А. Пусть y ∈ P , k = 1,2,... Тогда ϕ 1 ( Ay, ϕ k ) = ( y, Aϕ k ) = ( y, k ) = ( y, ϕ k ) = 0 . Таким образом, из y ∈ P следует Ay ∈ P , n=1, 2, …,
λk
λk
т.е. Р - инвариантное подпространство. Докажем теперь, что Р – нуль-пространство оператора А: y ∈ P такой, что A~ y ≠ 0, это не так. Тогда существует вектор ~ A = sup Ay = A~ y > 0 . По доказанному в предыдущем P→P
АР=0. Допустим, что ~ y = 1 . Следовательно,
параграфе оператор А
y∈ P y =1
имеет ненулевое собственное значение, а, следовательно, и характеристическое число ~ | λ |> 0 , которому соответствует собственный вектор, который не входит в последовательность ϕ n (иначе этот вектор был бы ортогонален сам себе). Мы приходим к противоречию с тем, что в последовательности характеристических чисел перечислены все характеристические числа с учетом кратности. Теорема доказана. Рассмотрим теперь следующий процесс построения для интегрального оператора А с симметрическим ядром K(x,s): пусть характеристические числа упорядочены в порядке неубывания модуля λ1 ≤ λ 2 ≤ ... ≤ λ n ≤ ... и им соответствует ортонормированная система ϕ 1 , ϕ 2 ,..., ϕ n ,... 1) Обозначим K (1) ( x, s ) = K ( x, s ) .
ϕ1 ( x ) ϕ1 ( s ) , и пусть интегральный оператор A(2) имеет λ1 (2) ядро K (x,s). Все функции ϕ 2 ,..., ϕ n ,... остаются собственными функциями и оператора A(2) , соответствующими тем же характеристическим числам λ2 ≤ ... ≤ λn ≤ ... , поскольку 2) Определим K ( 2 ) ( x, s ) = K ( x, s ) −
b
b
a
a
ϕ1 ( x) ϕ1 ( s) 1 1 ϕ k ( s) ds = ϕ k ( x) − 0 = ϕ k ( x) k = 2,3,... λ1 λk λk a
b
( 2) ∫ K ( x, s) ϕ k (s) ds = ∫ K ( x, s) ϕ k (s) ds − ∫
Функция ϕ 1
остается собственной функцией оператора A(2), но соответствующей
нулевому собственному значению ядра K ( 2 ) ( x, s ) . Поэтому λ1 отсутствует в последовательности характеристических чисел. Докажите, что оператор A(2) не имеет других характеристических чисел, отличных от указанных! … n ϕ ( x) ϕ i ( s ) . n+1) K ( n +1) ( x, s ) = K ( x, s ) − ∑ i
λi
i =1
(n+1)
( n +1)
Оператор A с ядром K ( x, s ) имеет те же характеристические числа и те же собственные функции, что и оператор A, кроме первых n характеристических чисел.
Если характеристических чисел бесконечное число, то мы получаем бесконечный ряд (мы не будем исследовать его сходимость). Если же характеристических чисел конечное число, то: K ( n +1) ( x, s ) ≡ 0 и n ϕ ( x) ϕ i ( s ) K ( x, s ) = ∑ i . Ядро интегрального уравнения получается вырожденным.
λi
i =1
Определение. Ядро K(x,s) называется вырожденным, если оно представимо в n
виде K ( x, s ) = ∑ a j ( x) b j ( s ) на [a, b] , где функции j =1
a j ( x), b j ( s) - непрерывны по своим
аргументам на интервале [a, b] . Можно считать, что a1 ( x),..., a n ( x) – линейно независимы, и b1 ( s ),..., bn ( s ) линейно независимы. Если это не так, число членов в сумме можно уменьшить (докажите!). Интегральный оператор с вырожденным ядром, очевидно, является вырожденным, т.е. у него всегда есть нулевое собственное значение, причем кратность нулевого значения равна ∞ . Для отыскания других собственных значений поступим следующим образом. Рассмотрим задачу на собственные значения и собственные функции для интегрального оператора с вырожденным ядром: b
n
Λ y ( x) = ∫ ∑ a j ( x) b j ( s) y ( s ) ds . a j =1
b
Обозначим
∫ y(s) b
j
( s ) ds = c j . Домножим левую и правую части на
bi (x)
и
a
проинтегрируем от a до b: b
Λ ci = ∑ c j ∫ a j ( x) bi ( x) dx, i = 1,2,..., n. j =1 a 1 44244 3 kij
⎛ c1 ⎞ ⎜ ⎟ Обозначим C = ⎜ M ⎟, ⎜c ⎟ ⎝ n⎠
K = {kij }in, j =1 ,
и получим задачу на собственные значения и
собственные векторы для матрицы K: K ⋅ C = Λ ⋅ C . Для отыскания собственных значений матрицы К можно, например, решить характеристическое уравнение det( K − ΛI ) = 0 . Если оператор А: h[a, b] → h[a, b] , т.е. действует в вещественном линейном пространстве h[a,b], он по определению может иметь только вещественные собственные значения. Тем не менее, при решении задач на семинарских занятиях могут находиться и комплексные собственные значения. В частности, комплексные корни может иметь записанное выше характеристическое уравнение. О чем же идет речь? Дело в том, что мы можем рассматривать тот же оператор в пространстве непрерывных комплекснозначных функций hC[a,b], состоящем из комплекснозначных функций вещественной переменной x: y ( x) = u ( x) + i v( x) x ∈ [a, b] , функции u(x), v(x) – непрерывные на [a,b] вещественные функции. Умножение на комплексное число элементов этого пространства определяется обычным образом. В этом пространстве b
можно ввести скалярное произведение: ( y1 , y 2 ) = ∫ y1∗ ( x) y 2 ( x) dx (здесь
*
- знак
a
комплексного сопряжения). Опишите свойства этого скалярного произведения (они
отличаются от свойств скалярного произведения в вещественном случае, в частности, ( y1 , y 2 ) = ( y 2 , y1 )* ) и проверьте, что это скалярное произведение порождает норму! Если же интегральный оператор А имеет симметрическое вещественное непрерывное ядро, то он имеет только вещественные собственные значения и при действии в пространстве hC[a,b]. Теорема. Пусть интегральный оператор с непрерывным симметрическим вещественным ядром K ( x, s ) действует в комплексном пространстве hC[a,b]. Тогда этот оператор может иметь только вещественные собственные значения. Доказательство. Пусть Λ - собственное значение оператора А, y ( x) ≠ 0 b
соответствующая собственная функция.
Тогда Λ y ( x) = ∫ K ( x, s ) y ( s ) ds . Применим a
операцию комплексного сопряжения к левой и правой части и получим: b
Λ∗ y ∗ ( x) = ∫ K ( x, s ) y ∗ ( s ) ds (т.е. Λ∗ - собственное значение оператора
А, а y ∗ -
a
соответствующая собственная функция). Домножим первое равенство на y*(x), второе на y(x) и проинтегрируем от a до b. Получим: b
b
b
Λ ∫ y ( x) dx = ∫ y ∗ ( x) ( ∫ K ( x, s ) y ( s ) ds ) dx ; 2
a
b
a
a
b
b
a
a
Λ∗ ∫ y ( x) dx = ∫ y ( x) ( ∫ K ( x, s ) y ∗ ( s ) ds ) dx . a
2
После вычитания, учитывая симметричность ядра K ( x, s ) , получаем b
(Λ − Λ∗ ) ∫ y ( x) dx = 0 , a 1 4243 2
≠0
∗
из чего следует Λ = Λ , т.е. Λ - вещественное число. Теорема доказана. В дальнейшем, как и ранее, мы будем рассматривать интегральные операторы с вещественными ядрами, действующие в пространствах непрерывных вещественных функций. Примем некоторые полезные для понимания примеры интегральных операторов. Примеры. Будем рассматривать [a, b] = [0, π ] и пространство h[0, π ] . Как было показано в курсе математического анализа, в этом пространстве функции ϕ n ( s ) = sin ns , n=1,2,… образуют ортогональную систему (чтобы получить ортонормированную систему, надо домножить каждую функцию на
2
π
). Эта система
замкнутая: из того, что непрерывная функция y(s) ортогональна всем функциям ϕ n ( s) = sin ns , n=1,2,…., следует, что y(s)≡0. Эта система полная: любая непрерывная на [0, π ] функция f(x) может быть разложена в ряд Фурье по указанным функциям, причем ряд Фурье сходится к f(x)в среднем. 2 ∞ sin nx sin ns 1) Составим ядро: K ( x, s ) = ∑ на [0, π ] × [0, π ] . Тогда по признаку π n =1 n2 Вейерштрасса записанный ряд сходится равномерно, т.к. каждый член этого ряда 1 мажорируется 2 . Из равномерной сходимости ряда следует, что функция K(x,s) n непрерывна по совокупности переменных. Очевидно, что ядро K(x,s) cимметрическое. Его собственные функции – sinns, а характеристические числа –
λ n = n 2 , n=1,2,… (если бы было другое характеристическое число, то соответствующая ему собственная функция была бы ортогональна всем sinns, а такой функции нет, т.к. sinns образуют замкнутую систему). Из замкнутости системы sinns следует, что ядро K(x,s) определяет невырожденный интегральный оператор, а, следовательно, замкнуто. 2 ∞ sin nx sin ns . Появляется собственное 2) Теперь рассмотрим ядро K ( x, s ) = ∑ π n=2 n2 значение Λ 0 = 0 кратности, равной 1, которому соответствует собственная функция sins. Оператор А с таким ядром является вырожденным, а его ядро невырожденное, но и незамкнутое. 2 ∞ sin 2nx sin 2ns . Интегральный оператор с таким ядром 3). Рассмотрим K ( x, s ) = ∑ π n =1 ( 2n) 2 имеет собственное значение Λ 0 = 0 бесконечной кратности (соответствующие собственные функции sins, sin3s, …). Интегральный оператор вырожденный, имеет бесконечномерное нуль-пространство, а его ядро невырожденное.
§5. Теорема Гильберта-Шмидта. Будем рассматривать интегральный оператор А, ядро которого K(x,s) удовлетворяет следующим условиям: K(x,s) – симметрическое, непрерывное по совокупности переменных на [a, b] × [a, b] и ≢ 0. В соответствии с результатами предыдущего параграфа этот оператор обладает конечной или бесконечной последовательностью характеристических чисел: λ1 ≤ λ 2 ≤ ... ≤ λ n ≤ ... , которым соответствует ортонормированная система собственных функций ϕ 1 , ϕ 2 ,..., ϕ n ,... . Определение. Функция f (x) называется истокопредставимой с помощью ядра
K ( x, s ) , если существует непрерывная функция g (x) такая, что:
b
f ( x) = ∫ K ( x, s ) g ( s ) ds a
или, что тоже самое, f = Ag (т.е. f (x) принадлежит множеству значений оператора А: f ∈ R ( A) , где оператор А действует h[a, b] → h[a, b] ). Любой f ( x) ∈ h[a, b] можно формально сопоставить ряд Фурье по системе функций ϕ k (x) :
∞
∑f k =1
k
ϕ k ( x)
Теорема Гильберта-Шмидта. помощью ядра K ( x, s ) , то ∞
f ( x) = ∑ f k ϕ k ( x), k =1
Если функция f (x) истокопредставима с она может быть разложена в ряд:
b
f k = ( f , ϕ k ) = ∫ f ( s ) ϕ k ( s ) ds ,
причем
этот
ряд
сходится
a
абсолютно и равномерно на [a, b] . ∞
Доказательство.
∑f
1) Докажем, что ряд
k =1
k
ϕ k ( x) сходится абсолютно и
равномерно на [a, b] . Для доказательства равномерной сходимости будем рассматривать случай, когда характеристических чисел бесконечно много (в противном случае ряд очевидно сходится). ϕ g Заметим, что f k = ( f , ϕ k ) = ( Ag , ϕ k ) = ( g , Aϕ k ) = ( g , k ) = k . Итак, нам надо доказать
λk λk ∞ ϕ ( x) . равномерную и абсолютную сходимость ряда ∑ g k k λk k =1
Для доказательства используем критерий Коши равномерной сходимости. Для нас представляет интерес сумма: k =n+ p
∑ gk
k = n +1
ϕ k ( x) ≤ λk
n+ p
ϕ k2 ( x) , 2 k = n +1 λk n+ p
2 ∑ gk ∑
k = n +1
где n и p – произвольные натуральные числа (здесь мы применили неравенство КошиБуняковского для сумм вещественных чисел). а) Используем неравенство Бесселя:
∞
∑g k =1
∞
ряд
∑g k =1
2 k
b
2 k
≤ ∫ g 2 ( s ) ds , из которого следует, что a
сходится (т.к. состоит из неотрицательных чисел и ограничен).
ϕ k ( x) b = ∫ K ( x, s ) ϕ k ( s) ds , т.к. ϕ k – собственная функция, λk a соответствующая характеристическому числу λ k . Если фиксировать x ∈ [a, b] , то б) Заметим, что
ϕ k ( x) - коэффициент Фурье ядра K ( x, s ) , и можно написать неравенство Бесселя: λk 2
2
b ∞ ⎛ ϕ k ( x) ⎞ ⎛ ϕ k ( x) ⎞ ⎟ ⎜ ⎟ ⎜ ≤ K 2 ( x, s ) ds ≤ K o2 (b − a) ( K o = max | K ( x, s ) | ). ≤ ∑ ∑ ∫ ⎜ λ ⎟ ⎜ λ ⎟ x , s∈[ a ,b ] k = n +1 ⎝ k =1 ⎝ k k ⎠ ⎠ a n+ p
∞
Из неравенства Бесселя для функции g (x) следует, что ряд
∑g
2 k
k =1
сходится, т.е.
выполняется критерий Коши как необходимое условие сходимости числового ряда: ∀ε > 0 ∃N
∀n ≥ N
∀p
n+ p
∑g
k = n +1 n+ p
∑
ε , N , n, p
k = n +1
gk
2 k
≤
ε2 K o2 (b − a )
.
Но
тогда
при
тех
же
ϕ k ( x) ≤ ε , т.е. выполняется критерий Коши как достаточное λk
условие равномерной сходимости ряда с общим членом g k
ϕ k ( x) . Итак, равномерная и λk
абсолютная сходимость ряда Фурье доказана. ∞
2) Докажем, что ряд Фурье
∑f k =1
ϕ k ( x) сходится к f (x) . Т.к. ряд состоит из
k
непрерывных функций и сходится равномерно на [a,b], то сумма ряда – непрерывная на ∞
[a,b] функция. Обозначим ω ( x) = f ( x) − ∑ f k ϕ k ( x) . Надо доказать, что ω ( x) ≡ 0 . k =1
b
b
b ∞
∞
b
a
a
a k =1
k =1
a
(ω ,ϕ i ) = ∫ ω ( x) ϕ i ( x) dx = ∫ f ( x) ϕ i ( x) dx − ∫ ∑ f k ϕ k ( x) ϕ i ( x) dx = f i − ∑ f k ∫ ϕ k ( x) ϕ i ( x) dx = = f i − f i = 0 ∀i = 1,2,... (из равномерной сходимости ряда следует, что можно менять местами интегрирование и суммирование). Итак, ω (x) ортогональна всем ϕ i (x) . Отсюда следует (см. предыдущий параграф), что ω (x) принадлежит нуль-пространству оператора А, т.е. Aω = 0 . Рассмотрим b
∫ω a
2
b
∞
b
a
k =1
a
( x) dx = ∫ [ f ( x) − ∑ f k ϕ k ( x)] ω ( x) dx = ∫ f ( x) ω ( x) dx = ( f , ω ) = ( Ag , ω ) = ( g , Aω ) = 0 .
Изменение порядка интегрирования и суммирования возможно в силу доказанной выше равномерной сходимости ряда Фурье. Т.к. ω (x) – непрерывная функция, то ω ( x) ≡ 0 . Теорема доказана. В заключение этого параграфа сформулируем без доказательства некоторые обобщения полученных результатов. Можно рассматривать задачу в многомерном случае. Пусть Ω - замкнутая ограниченная область: Ω ⊆ R n , для которой можно определить указанные ниже интегралы. Введем пространство h[Ω], состоящее из Ω, со скалярным произведением: функций, непрерывных на b
( y1 , y 2 ) = ∫ y1 ( x) y 2 ( x) dx, dx = dx1 dx2 ...dxn .
Рассмотрим
многомерное
a
уравнение Фредгольма 2-го рода:
y ( x) = λ ∫ K ( x, s ) y ( s )ds + f ( x), x, s ∈ Ω, Ω
интегральное
с ядром K ( x, s ), x, s ∈ Ω . Тогда при условии, что ядро непрерывно и симметрично по x, s , все результаты, полученные выше, остаются верными и в многомерном случае. Φ ( x, s ) , В курсе методов математической физики рассматриваются ядра K ( x, s ) = α x−s где Φ ( x, s ) непрерывная в Ω по совокупности аргументов и симметрическая функция, x − s = rxs -расстояние между точками x и s в пространстве R n . Если α < n , то ядра K ( x, s ) называются полярными ( n = dim R n ). Для таких ядер A: h[Ω] → h[Ω] является доказывается, что интегральный оператор вполне непрерывным, т.е. для интегральных операторов с полярными ядрами справедливы теоремы о существовании хотя бы одного собственного значения и теоремы о построении последовательности собственных значений. n Если α < , то ядра K ( x, s ) называются слабополярными. Для таких ядер 2 справедлива еще и теорема Гильберта-Шмидта. Все результаты могут быть перенесены на случай комплексных пространств h[a, b] и h[Ω] , но вместо требования симметричности ядра, если ядро является комплексным, надо требовать: K ( x, s ) = K ∗ ( s, x) , для любых x, s из Ω где ∗ - знак комплексного сопряжения.
§6. Неоднородные уравнения Фредгольма 2-го рода с симметрическими ядрами. Рассмотрим интегральное уравнение Фредгольма 2-го рода: b
y ( x) = λ ∫ K ( x, s ) y ( s ) ds + f ( x) ≡ λAy + f . a
Пусть ядро K ( x, s ) непрерывно по совокупности переменных, симметрическое и
≢ 0; λ - вещественное число ( λ ≠ 0 , в противном случае решение находится тривиально); f (x) - заданная непрерывная функция; λ1 ≤ λ 2 ≤ ... ≤ λ n ≤ ... последовательность характеристических чисел интегрального оператора, которым соответствует ортонормированная система собственных функций ϕ 1 , ϕ 2 ,..., ϕ n ,... Допустим, что решение уравнения существует. Преобразуем искомую функцию так, чтобы она стала истокопредставимой. Для этого будем искать решение в виде: y ( x) = f ( x) + g ( x) . Подставляя в исходное уравнение, получаем b
f ( x) + g ( x) = λ ∫ K ( x, s ) ( f ( s ) + g ( s ) ) ds + f ( x) . a
Сократив f(x), получим уравнение для g(x), операторная форма которого g = λA( g + f ) . Решение этого уравнения, если оно есть, является истокопредставимым. Следовательно, по теореме Гильберта-Шмидта, функция g (x) может быть разложена в равномерно и абсолютно сходящийся ряд Фурье по собственным функциям ядра K ( x, s ) : ∞
g ( x) = ∑ g k ϕ k ( x) . k =1
Вычисляя коэффициенты Фурье функций g и λA( g + f ) , получаем ⎛ ϕ g k = λ ( A( g + f ), ϕ k ) = λ (g + f , Aϕ k ) = λ ⎜⎜ g + f , k λk ⎝ Получаем систему уравнений: g k (λ k − λ ) = λ f k , k = 1,2,... Возможны два случая: 1) λ ≠ λ k , k = 1,2,... Тогда g k = для g (x) :
∞
λ
k =1
λk − λ
g ( x) = ∑
λ
λk − λ
⎞ λ ⎟⎟ = (g k + f k ) ⎠ λk
k = 1,2,...
f k . Тогда можно формально записать ряды Фурье
f k ϕ k ( x) , и для y(x):
∞
λ
k =1
λk − λ
y ( x) = f ( x) + ∑
f k ϕ k ( x) . Чтобы
построенный ряд Фурье на самом деле являлся решением, достаточно доказать, что этот ряд сходится равномерно на [a,b]. Заметим, что, поскольку λk→∞, то, начиная с некоторого номера,
λ λk − λ
=
1 λ λ ≤5 . λk 1 − 1 λk λ k
Тогда для достаточно больших n и любого натурального p n+ p n+ p f k ϕ k ( x) λ . ≤ f ( x ) 5 ϕ λ ∑ ∑ k k λk λk − λ n +1 n +1 Далее, как в предыдущем параграфе, можно доказать, что выполняется критерий Коши как достаточное условие равномерной сходимости, т.е. ряд Фурье сходится равномерно.
Замечание. Можно записать решение уравнения в следующем виде: b
∞
y ( x) = f ( x) + λ ∑ k =1
∫ f ( s) ϕ
k
( s ) ds ⋅ ϕ k ( x)
a
λk − λ
.
Предположим, что можно поменять местами суммирование и интегрирование: b ⎛ ∞ ϕ ( x)ϕ k ( s ) ⎞ ⎟ f ( s ) ds , y ( x) = f ( x) + λ ∫ ⎜⎜ ∑ k λk − λ ⎟⎠ a ⎝ k =1 1442443 R ( x , s ,λ )
b
или y ( x) = f ( x) + λ ∫ R( x, s, λ ) f ( s ) ds . В операторной форме уравнение Фредгольма 2-го a
y = λ A y + f , или ( I − λ A) y = f . Т.к. решение существует и единственно, то y = ( I − λ A) −1 f = f + λ Rλ f , где Rλ - интегральный оператор с ядром R( x, s, λ ) . В операторном виде полученный результат можно записать и так: ( I − λ A) −1 = I + λ Rλ . Определение. Ядро R( x, s, λ ) называется резольвентой. Рассмотрим теперь случай: 2) λ = λ ko . Пусть сначала λko – простое характеристическое число. Тогда при λ fk . k ≠ k 0 : (λk − λ ) g k = λ f k ; k = 1,2,...; k ≠ k 0 , и g k = λk − λ При k=k0: 0 ⋅ g ko = λ ⋅ f ko , λ ≠ 0 . f ko ≠ 0 , f ko = ( f ,ϕ ko ) , то уравнение не имеет решения. Следовательно, и Если исходное уравнение не имеет решений. Если же f ko = 0 , то получаем бесконечно много решений: g ko = c ko , cko - произвольная постоянная. Если же λ ko - характеристическое число кратности r , то получаем систему уравнений: ⎧0 ⋅ g ko = λ f ko ⎪0 ⋅ g ⎪ ko +1 = λ f ko +1 . ⎨ ⎪L ⎪⎩0 ⋅ g ko + r −1 = λ f ko + r −1 Система имеет решение тогда и только тогда, когда все коэффициенты Фурье f ko , f ko +1 , L , f ko + r −1 равны нулю. Если хотя бы один коэффициент Фурье не равен нулю, то система не имеет решений, а, следовательно, и исходное уравнение не имеет решений. Другими словами, условием разрешимости является ортогональность f ( x) всем собственными функциям, соответствующим характеристическому числу λ . В этом ∞ λ fk случае: y ( x) = f ( x) + ∑ ϕ k ( x) + cko ϕ ko ( x) + ... + cko+ r −1ϕ ko+ r −1 ( x) , λk − λ k =1 рода имеет вид:
k ≠ ko ... k ≠ k0 + r −1
где c ko ,..., c ko + r − 1 - произвольные константы. Бесконечный ряд, записанный в данном выражении, сходится абсолютно и равномерно. В результате проведенного исследования мы доказали две следующие теоремы. Теорема. Если однородное уравнение Фредгольма 2-го рода с непрерывным симметрическим ядром имеет только тривиальное решение (т.е. λ ≠ λ k , k = 1,2,... ), то
неоднородное уравнение имеет, и при том, единственное, решение для любой функции f ( x) . Если однородное уравнение имеет нетривиальное решение (λ = λk при некотором k), то неоднородное уравнение разрешимо тогда и только тогда, когда неоднородность – непрерывная функция f ( x) – ортогональна всем собственным функциям, соответствующим данному λ (т.е. ортогональна всем решениям однородного уравнения). В последнем случае, если решение есть, то существует и бесконечно много решений. Теорема. (Альтернатива Фредгольма для интегральных уравнений Фредгольма 2го рода с симметрическими ядрами). Либо неоднородное уравнение имеет решение для любой непрерывной функции f ( x) , либо однородное уравнение имеет нетривиальное решение.
§7. Принцип сжимающих отображений. Теоремы о неподвижной точке. Пусть D – оператор, вообще говоря, нелинейный, действующий из банахова пространства B в себя. Определение. Оператор D называется сжимающим (или сжимающим отображением), если существует константа q: 0≤q<1, такая, что ∀ y1 , y 2 ∈ B Dy1 − Dy 2 ≤ q y1 − y 2 . Очевидно (докажите!), что сжимающий оператор является непрерывным. Определение. Элемент y называется неподвижной точкой оператора D, если Dy = y . Ниже мы докажем, что у сжимающего оператора, действующего в банаховом пространстве, есть и при том единственная, неподвижная точка. Напомним, что банахово пространство – это полное нормированное пространство, и при доказательстве мы будем использовать полноту пространства B. Сначала докажем одно вспомогательное утверждение. Будем называть рядом следующую бесконечную сумму: ∞
z1 + z 2 + ... + z n + ... = ∑ z n n =1
z n ∈ B, n = 1,2,... ,
N
а его частичной суммой: S N = ∑ z n .
Как обычно, определим сходимость ряда как
n =1
SN →S ;
сходимость последовательности частичных сумм: если
N →∞
S , S N , zn ∈ B , то
говорят, что ряд сходится, а S называется его суммой. Поскольку пространство B полное, то необходимым и достаточным условием сходимости ряда является критерий Коши: ∀ ε > 0 ∃N
∀n ≥ N ∀p
n+ p
∑z
k = n +1
zn
k
≤ε .
Теорема (признак Вейерштрасса сходимости ряда). Пусть ≤ a n , a n ≥ 0, n = 1,2,... ( a n - последовательность неотрицательных чисел). Тогда из ∞
∞
n =1
n =1
сходимости числового ряда ∑ an следует сходимость ряда ∑ z n . Доказательство.
Из неравенства треугольника и условия теоремы следует n+ p
n+ p
n+ p
k = n +1
k = n +1
k = n +1
∑ z k ≤ ∑ z k ≤ ∑ ak .
Запишем критерий Коши как необходимое условие сходимости числового ряда из
ak: для ∀ ε > 0 ∃N
n+ p
∀n ≥ N ∀p
∑a
k = n +1
k
≤ ε . Из этого неравенства и неравенства,
полученного в начале доказательства теоремы, следует, что, начиная с этого номера, n+ p
∑z
k = n +1
k
≤ ε , т.е. выполняется критерий Коши как достаточное условие сходимости ряда в
банаховом пространстве B. Теорема (о неподвижной точке). Пусть D – сжимающий оператор. Тогда существует, и притом единственная, точка y ∈ B такая, что Dy = y . Эта точка может быть найдена методом последовательных приближений (простой итерации): y n+1 = Dy n , n = 0,1,2,... , y0 ∈ B - произвольная фиксированная точка из B (начальное приближение), причем y n → y : Dy = y . Доказательство.
1) Единственность. Пусть существуют две неподвижные точки y1 и y 2 : Dy1 = y1 , Dy 2 = y 2 , y1 ≠ y 2 . Тогда 0 < y1 − y 2 = Dy1 − Dy 2 ≤ q y1 − y 2 < y1 − y 2 , и мы приходим к противоречию. Единственность доказана. 2) Существование. Построим последовательность методом последовательных приближений (методом простой итерации): зададим произвольное начальное приближение y0 ∈ B и построим последовательность y n+1 = Dy n , n = 0,1,2,... . Докажем сходимость последовательности
y n+1 . Вместо изучения сходимости последовательности
мы будем изучать сходимость ряда y n +1 = ( y n +1 − y n ) + ( y n − y n −1 ) + ... + ( y1 − y 0 ) + y 0 . 14243 общий член ряда
Тогда: y n+1 − y n = Dy n − Dy n−1 ≤ q y n − y n−1 ≤ ... ≤ q n y1 − y 0 , 0 ≤ q < 1 . Отсюда общий 1 424 3 =const
член ряда мажорируется членом бесконечно убывающей геометрической прогрессии, а, тем самым, y n сходится по признаку Вейерштрасса: y n → y, y ∈ B . y, ~ y ≠ y. Покажем, что Dy = y , т.е. y – неподвижная точка. Пусть это не так: Dy = ~ Тогда для любого натурального n ~ ~ 0 < y − y ≤ y − y n+1 + y n+1 − y = Dy − Dy n + y n+1 − y ≤ q y − y n + y n +1 − y → 0 , из чего n →∞
y = 0 , или y = ~ y . Теорема доказана. следует, что y − ~
Теорема. Пусть D - оператор, отображающий банахово пространство B в себя, и существует натуральное число k такое, что D k - сжимающий оператор. Тогда существует единственная неподвижная точка оператора D (такая, что Dy = y ), причем y может быть найдено методом последовательных приближений: для любого y0 ∈ B y n +1 = D y n , n = 0,1,... , y n → y . Доказательство. 1) Возьмем любой элемент y 0 и получим последовательность: y0
y1 … ↑
y k −1 ↑
yk ↑
y k +1 … ↑
y 2 k −1 ↑
y 2k , … ↑
D y0 D k −1 y 0 D k y 0 D k +1 y 0 … D 2 k −1 y 0 D 2k y 0 Рассмотрим подпоследовательности: y0 , yk = D k y0 , y2k = D k ( D k y0 ),... → y (т.к. D k - сжимающий). y1, yk +1 = D k y1, y2k +1 = D k ( D k y1 ),... → y ( y то же, т.к. D k - сжимающий, и его неподвижная точка не зависит от выбора начального приближения в методе последовательных приближений). ……… yk −1, y2k −1 = D k yk −1, y3k −1 = D k ( D k yk −1 ),... → y . k Вернемся к исходной последовательности: она состоит из подпоследовательностей, каждая из которых сходится к y . Отсюда легко следует (докажите!!!), что и вся последовательность сходится к y . Очевидно, что элемент y является неподвижной точкой оператора D k . 2) Докажем, что неподвижные точки операторов D и D k совпадают. Пусть y = Dy . Подействуем слева и справа оператором D (k − 1) раз: y = D k y , т.е. неподвижная точка оператора D является неподвижной точкой оператора D k : y = D k y . В силу того, что D k - сжимающий оператор, а, следовательно, имеет только одну неподвижную точку, оператор D неподвижная точка оператора D единственна (если она существует).
утверждение: пусть y = D k y . Тогда Dy = D ( D k ) n y = D nk ( D y ) → y , поскольку метод простой итерации Докажем
обратное
n →∞
рассмотрим: сходится к
неподвижной точке независимо от начального приближения. В результате y = D y . Теорема доказана.
§8. Неоднородные уравнения Фредгольма 2-го рода с «малыми» λ . b
Будем рассматривать интегральный оператор A : Ay ≡ ∫ K ( x, s ) y ( s ) ds , где ядро a
K ( x, s ) непрерывно по совокупности переменных x, s , но не предполагается, вообще говоря, симметрическим. b
Определим оператор D : Dy = λ A y + f = λ ∫ K ( x, s ) y ( s ) ds + f ( x) ,
f ( x) - заданная
a
непрерывная функция. Интегральное уравнение Фредгольма 2-го рода можно записать в операторном виде: y ( x) = λ A y + f или y = Dy . Чтобы применить теорему о неподвижной точке, доказанную в предыдущем параграфе, оператор D нельзя рассматривать в пространстве h[a, b] , т.к. это – неполное пространство. Будем рассматривать оператор D : C[a, b] → C[a, b] ( C[a, b] - банахово, т.е. полное нормированное пространство). Очевидно, что D является непрерывным, вообще говоря, нелинейным оператором, а решение интегрального уравнения является его неподвижной точкой. Обозначим: max K ( x, s ) = M . x , s∈[ a ,b ]
Найдем достаточные условия, при которых оператор D является сжимающим. Возьмем произвольные y1 , y 2 ∈ C[a, b] и определим z1 = λ A y1 + f = D y1 ; z2 = λ A y2 + f = D y2 . Оценим модуль разности b
z1 ( x) − z 2 ( x) = λ ∫ K ( x, s )( y1 ( s ) − y 2 ( s ) ) ds ≤ λ M ⎛⎜ max y1 ( s ) − y 2 ( s ) ⎞⎟ (b − a ) = λ M (b − a) y1 − y 2 ⎝ s∈[ a ,b ] ⎠ a
z1 − z 2
Отсюда
C [ a ,b ]
= D y1 − D y 2
C [ a ,b ]
≤ λ M (b − a) y1 − y 2
C [ a ,b ]
.
Обозначим
q = λ M (b − a ) и потребуем, чтобы выполнялось условие q<1. В этом случае оператор D, действующий в банаховом пространстве C[a,b], является сжимающим, а, следовательно, имеет место доказанная в предыдущем параграфе теорема о неподвижной точке. 1 Теорема. Если λ < (такие λ будем называть «малыми»), то неоднородное M (b − a ) уравнение Фредгольма 2 рода имеет, и притом единственное, решение для любой непрерывной функции f ( x) ∈ C[a, b] , причем это решение может быть найдено методом последовательных приближений. 1 Следствие 1. Если λ < , то однородное уравнение имеет только тривиальное M (b − a ) решение. 1 Следствие 2. На интервале 0 < λ < нет характеристических чисел M (b − a ) интегрального оператора A . (Если у оператора A есть характеристические числа, то 1 λmin ≥ ). M (b − a) Рассмотрим метод последовательных приближений в данном случае. y n+1 = λ A y n + f n = 0,1,2,... y0 ≡ 0 . Тогда: b
1) y1 = λ ∫ K ( x, s ) ⋅ 0 ⋅ ds + f ( x) = f ( x) ; a
C [ a ,b ]
.
b
2) y 2 = λ ∫ K ( x, s ) f ( s ) ds + f ( x) ; a
3) b b b b ⎛b ⎞ ⎛ ⎞ y3 = λ2 ∫ K ( x, ξ ) ⎜ ∫ K (ξ , s ) f ( s ) ds ⎟ dξ + λ ∫ K ( x, s ) f ( s )ds + f ( x) = λ2 ∫ ⎜ ∫ K ( x, ξ ) K (ξ , s )dξ ⎟ f ( s )ds + a a a⎝a ⎝a ⎠ ⎠ 144424443 K 2 ( x,s )
b
+ λ ∫ K ( x, s ) f ( s )ds + f ( x) , K 2 ( x, s ) - повторное (итерированное) ядро. a
Продолжая,
y n +1 = f + λ A f + λ 2 A 2 f + ... + λ n −1 A n −1 f + λ n A n f .
получим:
An
–
b
интегральный оператор с повторным ядром K n ( x, s ) = ∫ K ( x, ξ ) K n −1 (ξ , s ) dξ , n=2,3,…; a
K1(x,s)≡K(x,s). Мы уже доказали, что последовательность yn имеет предел y, являющийся решением интегрального уравнения. y представляется рядом Неймана: 2 2 n n y = f + λ A f + λ A f + ... + λ A f + ... . Полученный результат можно представить в операторной форме. При «малых» λ решение интегрального уравнения существует и единственно. Если мы перепишем уравнение y = λ A y + f в виде ( I − λ A) y = f , то из доказанного следует существование обратного оператора, определенного на всем пространстве C[a, b] : y = ( I − λ A) −1 f . Покажем, что это выражение можно записать как y = f + λ R λ f , где Rλ - интегральный оператор с непрерывным по x,s ядром R( x, s, λ ) b
(резольвентой): y = f + λ ∫ R( x, s, λ ) f ( s ) ds , или ( I − λ A) −1 = I + λRλ . a
Докажем, что ряд K1 ( x, s ) + λ K 2 ( x, s ) + ... + λn−1 K n ( x, s ) +… сходится равномерно по 1 424 3 = K ( x ,s )
x, s ∈ [ a , b ] . 1) K1 ( x, s ) = K ( x, s ) ≤ M ; b
2) K 2 ( x, s ) ≤ ∫ K ( x,ξ ) K (ξ , s ) dξ ≤ M 2 (b − a) ; a
…; n) K n ( x, s ) ≤ M n (b − a ) n−1 ; …. Отсюда
λn−1 K n ( x, s ) ≤ ( λ M (b − a) ) M , n −1
1442443
0 ≤ q = λ M (b − a ) < 1 .
По
признаку
q n −1
Вейерштрасса равномерной сходимости функциональный ряд сходится равномерно, поскольку общий член этого ряда мажорируется общим членом бесконечной убывающей геометрической прогрессии: K ( x, s ) + λ K 2 ( x, s ) + ... = R( x, s, λ ) . В силу равномерной сходимости резольвента R( x, s, λ ) непрерывна по совокупности переменных ( x, s ) . M Суммируя геометрическую прогрессию, получаем оценку сверху: R ≤ . В 1 − λ (b − a ) силу равномерной сходимости записанного выше функционального ряда можно поменять местами интегрирование и суммирование и записать решение интегрального уравнения Фредгольма 2 рода в виде: b
y ( x) = f ( x) + λ ∫ R( x, s, λ ) f ( s ) ds . a
Рассмотрим теперь вопросы корректности математической постановки уравнения Фредгольма при «малых» λ : y = λ A y + f при условии, что это уравнение рассматривается в пространстве C[a,b]. Для этого надо ответить на три вопроса: 1) Существование решения. Мы доказали, что решение существует для любой непрерывной функции f (x) . 2) Единственность решения. Мы доказали, что решение единственно. 3) Устойчивость (непрерывная в пространстве C[a,b] зависимость решения от неоднородности f (x) ). Пусть заданы неоднородность f и «возмущенная» (заданная с ошибкой) ~ неоднородность f = f + δ f . Докажем устойчивость: по доказанному выше и для ~ «точной», и для «возмущенной» неоднородностей уравнение имеет решения: ~ y = λ A~ y+ f и y = λ A y + f , представимые с помощью резольвентного оператора. Запишем разность b ~ ~ ~ y − y = f − f + λ ∫ R( x, s, λ ) ( f − f ) ds . a
Далее Если
~ y−y
C [ a ,b ]
~ ≤ f −f
δ f → 0 , то и δ y = ~y − y
C [ a ,b ]
C [ a ,b ]
(1 + λ M R (b − a )) , где R ≤
M = MR. 1 − λ M (b − a )
→ 0 , т.е. мы доказали непрерывную зависимость
решения от неоднородности в норме пространства C[a,b]. Более того, полученное неравенство позволяет получить оценку погрешности решения, если известна оценка погрешности неоднородности. Следовательно, все три требования к корректности решения данного уравнения выполнены, и задача решения уравнения Фредгольма 2 рода с “малым λ ” в C[a, b] корректна (корректно поставлена). Докажите, что при тех же условиях эта задача корректна и в h[a,b]!
§9. Уравнение Вольтерра второго рода. Рассмотрим уравнение Вольтерра второго рода в операторной форме y = λ A y + f , где оператор A имеет вид: x
Ay = λ ∫ K ( x, s ) y ( s ) ds , x, s ∈ [a, b] . a
. Ядро K ( x, s ) - непрерывно по совокупности переменных на своей треугольной области определения ∆ = {x, s : a ≤ s ≤ x ≤ b} и не равно нулю тождественно, f(x) – непрерывная на [a, b] функция. x
Докажите: 1) Если y (s ) - непрерывная на [a,b] функция, то z ( x) = ∫ K ( x, s ) y ( s ) ds a
непрерывная на [a,b] функция, т.е. можно рассматривать оператор A как действующий в пространствах C[a, b] → C[a, b] или h[a, b] → h[a, b] . 2) Интегральный оператор Вольтерра является вполне непрерывным при действии: h[a, b] → C[a, b], h[a, b] → h[a, b] . Покажем, что интегральное уравнение Вольтерра 2 рода можно решать для любого λ методом последовательных приближений: y n +1 = λ A y n + f , y 0 ∈ C[a, b] , f ( x) ∈ C[a, b] . Как и в предыдущем параграфе определим оператор D: C[a, b] → C[a, b] следующим образом: для любого y∈C[a,b] Dy≡λAy+f и покажем, что оператор D (вообще говоря, не сжимающий) обладает тем свойством, что некоторая его степень - оператор D k - сжимающий (натуральное число k зависит от λ , но не зависит от f (!!!)). Теорема. Для любого λ существует натуральноe число k такое, что Dk сжимающий оператор. Доказательство. Возьмем две непрерывные функции y1 ( x) и y 2 ( x) . Определим z j = D y j , j = 1,2. z1 ( x) − z 2 ( x) = Dy1 − Dy 2 = λ Ay1 − Ay 2 . Обозначим M = max K ( x, s ) . Имеет место x , s∈∆
неравенство x
Ay1 − Ay 2 = ∫ K ( x, s ) ( y1 ( s ) − y 2 ( s ) ) ds ≤ M ( x − a) y1 − y 2
C [ a ,b ]
.
a
Отсюда
Ay1 − Ay 2
C[ a ,b ]
≤ M (b − a) y1 − y 2
C[ a ,b ]
и
Dy1 − Dy 2
C [ a ,b ]
≤ λ M (b − a) y1 − y 2
C [ a ,b ]
.
Далее x
| D 2 y1 − D 2 y 2 |≤ λ2 ∫ K ( x, s ) ( Ay1 − Ay 2 ) ds ≤ λ
M2 ( x − a ) 2 y1 − y 2 2!
2
a
C [ a ,b ]
и D 2 y1 − D 2 y 2
C [ a ,b ]
≤λ …
2
M2 (b − a ) 2 y1 − y 2 2!
C [ a ,b ]
≤λ
2
M2 (b − a ) 2 y1 − y 2 2!
C
D n y1 − D n y 2
C [ a ,b ]
n n M ≤λ (b − a ) n y1 − y 2 n ! 1442443
C [ a ,b ]
.
(q ) n
M (b − a ) n . Для любого λ при n → ∞ q n → 0 . Следовательно, n! q n < 1 . В качестве k выберем минимальное натуральное n , при котором
Определим q n = λ при больших n
n
n
Mn (b − a ) n < 1 . Очевидно, что D k - сжимающий оператор. Теорема доказана. n! Теперь мы можем применить теорему о неподвижной точке, доказанную в конце параграфа 7 и получить следствия. Следствие 1. ∀ λ однородное уравнение имеет только тривиальное решение. Следствие 2. Оператор Вольтерра не имеет характеристических чисел. Таким образом, оператор Вольтерра является примером вполне непрерывного оператора, не имеющего ни одного характеристического числа (оператор Вольтерра вполне непрерывный из h[a,b] в h[a,b], но не самосопряженный!!!). Следствие 3. Решение уравнения Вольтерра 2 рода можно найти методом последовательных приближений, который в данном случае называется методом Пикара: для любого начального приближения y0 :
λ
n
x
y0 ∈ C[a, b],
y n +1 = λ ∫ K ( x, s ) y n ( s ) ds + f ( x), n = 0,1,2,... , или y n +1 = λ A y n + f . a
Если y 0 = 0 , то получаем ряд Неймана y = f + λ A f + λ 2 A 2 f + ... + λ n A n f + ... .
§10. Уравнения с вырожденными ядрами. Теоремы Фредгольма. Будем рассматривать уравнения Фредгольма 2 рода с вырожденным ядром K ( x, s ) :
y = λ Ay + f ,
n
K ( x, s ) = ∑ a j ( x ) b j ( s ) , j =1
a j ( x), b j ( s) - непрерывны по своим аргументам
на [a, b] ; a1 ( x),..., a n ( x) – линейно независимы; b1 ( s ),..., bn ( s ) - линейно независимы (эти предположения не ограничивают общность); f (x) - заданная непрерывная функция. b
n
y ( x) = λ ∑ a j ( x) ∫ b j ( s ) y ( s ) ds + f ( x) или j =1 a 1 44244 3 c j − числа
n
y ( x) = λ ∑ c j a j ( x) + f ( x) . j =1
Умножим обе части равенства на bi (x) , i = 1,..., n, и проинтегрируем от a до b: b
n
b
b
ci = ∫ y ( x) bi ( x) = λ ∑ c j ∫ a j ( x) bi ( x) dx + ∫ f ( x) bi ( x) dx . j =1 a a a 1 442443 1 44244 3 k ij
fi
Получаем систему линейных алгебраических уравнений n
ci − λ ∑ k ij c j = f i , i = 1,..., n . j =1
Докажите, что задача решения системы линейных алгебраических уравнений (СЛАУ) и задача решения неоднородного уравнения Фредгольма 2-го рода с вырожденным ядром эквивалентны!!! Рассмотрим определитель СЛАУ: 1 − λ k11 − λ k12 ... − λ k1n
D (λ ) =
− λ k21
1 − λ k22 ...
... − λ kn1
... − λ kn 2
− λ k2 n
... ... ... 1 − λ knn
.
Определитель D(λ ) не равен нулю тождественно, т.к. D(0) = 1 . D(λ ) - полином от λ степени n . Число его корней не превосходит n. Вещественные корни полинома D(λ ) это характеристические числа интегрального оператора с вырожденным ядром. Для каждого заданного λ возможны два случая: 1) D(λ ) ≠ 0 ; 2) D(λ ) = 0 . Рассмотрим первый случай: D(λ ) ≠ 0 . Теорема. Если λ не является характеристическим числом (т.е. D(λ ) ≠ 0 ), то интегральное уравнение Фредгольма 2 рода имеет и притом единственное решение для любой непрерывной функции f (x) . 1 n Решение находится по формулам Крамера: ci = ∑ Dik (λ ) f k , где Dik (λ ) D(λ ) k =1 b
n
1 n ∑ Dik (λ ) ai ( x) ∫ f (s) bk (s) ds . i =1 D (λ ) k =1 a Т.к. в выражении для y(x) суммы конечные, то можно поменять местами операции
алгебраические дополнения: y ( x) = f ( x) + λ ∑
b
суммирования
и
интегрирования:
y ( x) = f ( x) + λ ∫ R ( x, s, λ ) f ( s ) ds , a
где
1 n n ∑ ∑ Dik (λ ) ai ( x) bk ( s ) - резольвента, D(λ ) и Dik (λ ) называются D(λ ) i =1 k =1 определителями Фредгольма. Перейдем ко второму случаю: D(λ ) = 0 . Рассмотрим сначала однородное уравнение: f = 0 . Тогда имеем однородную R ( x, s , λ ) =
n
ci − λ ∑ kij c j = 0
СЛАУ:
i, j = 1, n .
j =1
Т.к. λ – характеристическое число, то однородная система имеет нетривиальное решение (вообще говоря, может быть несколько линейно независимых решений). Пусть λ соответствует p линейно независимых решений: 1 ≤ p ≤ n (число линейно независимых решений – это кратность характеристического числа): p=n-r, r – ранг матрицы I-λK, K = {k ij }, i, j = 1,...n .
(
)
Обозначим нетривиальные решения однородной СЛАУ: c1( l ) ,..., cn( l ) , l = 1, 2,..., p . Запишем нетривиальное решение однородного уравнения Фредгольма 2 рода: n
ϕ l ( x) = ∑ ci(l ) ai ( x) .
(c
i =1
Т.к.
)
( l) (l ) 1 ,..., cn ,
векторы
l = 1, 2,..., p ,
линейно
независимы,
и
функции
a1 ( x ),..., a n ( x ) линейно независимы, то уравнение Фредгольма 2 рода имеет p линейно независимых решений, а общее решение однородного уравнения представимо в виде p
y ( x) = ∑ α l ϕ l ( x) , где α l - любые вещественные числа. l =1
Напомним некоторые сведения из линейной алгебры. Пусть дана СЛАУ: ⎛ x1 ⎞ ⎛ f1 ⎞ ⎜ ⎟ ⎜ ⎟ n BX = F ; X = ⎜ M ⎟ ∈ R ; F = ⎜ M ⎟ ∈ Rn . ⎜x ⎟ ⎜f ⎟ ⎝ n⎠ ⎝ n⎠ n n B - линейный оператор: R → R , ранг B = r (b) равен размерности R(B) . Однородное уравнение: BX = 0 имеет (n − r ) линейно независимых решений. B ∗ - транспонированная матрица. В курсе Рассмотрим теперь СЛАУ B ∗ X = G , линейной алгебры было доказано, что ранг B равен рангу B*. Если есть однородное уравнение с матрицей B ( BX = 0 ) и однородное уравнение с матрицей B ∗ ( B ∗ X = 0 ), то у них одно и то же число линейно независимых решений. Определение. Сопряженное (союзное) интегральное уравнение – это уравнение с ядром K ∗ ( x, s ) = K ( s, x) . b
Наряду с уравнением
y ( x) = λ ∫ K ( x, s ) y ( s ) ds + f ( x)
или в операторной форме
a
y = λ A y + f мы будем рассматривать союзное с ним интегральное уравнение: b
ψ ( x) = λ ∫ K * ( x, s)ψ ( s) ds + g ( x) a
g (x) - непрерывная функция.
(в операторной форме ⇔ ψ = λ A∗ψ + g ),
Союзное
уравнение
имеет
вид: b
n
ψ ( x) = λ ∑ c~j b j ( x) + g ( x) ,
c~ j = ∫ψ ( s ) a j ( s ) ds .
j =1
b n
ψ ( x) = λ ∫ ∑ a j ( s) b j ( x)ψ ( s) ds + g ( x) a j =1
Получаем
СЛАУ,
или
эквивалентную
a
союзному интегральному уравнению: n c~i − λ ∑ k ji c~ j = g i , j =1
b
g i = ∫ g ( s ) ai ( s ) ds, i = 1,..., n , a
b
k = ∫ a i ( s ) b j ( s ) ds = k ji , ∗ ij
K * = {k ij∗ } ,
a
~ i,j=1,…,n, или ( I − λ K ∗ )C = G . Мы получили СЛАУ с транспонированной матрицей. D (λ ) = 0 . Рассмотрим однородную систему. Определитель такой же: (l) (l ) ~ ~ c1 ,..., c n , l = 1,..., p, - линейно независимых решений ровно столько же, сколько и для исходной системы, т.е. p . Однородному исходному уравнению соответствует СЛАУ: ∗ ~ ( I − λ K )C = 0 , а однородному союзному уравнению: ( I − λ K )C = 0 . Мы доказали следующую теорему: Теорема. Для любого λ число линейно независимых решений однородного интегрального уравнения Фредгольма второго рода и союзного с ним однородного уравнения одинаково. Будем решать неоднородное уравнение в случае D(λ ) = 0 . Возникает вопрос: когда разрешима неоднородная система линейных алгебраических уравнений, определитель которой равен нулю? Пусть нам дана СЛАУ ⎛ f1 ⎞ ⎛ x1 ⎞ ⎜ ⎟ ⎜ ⎟ n n BX = F , B : R → R , F =⎜ M ⎟ , X =⎜ M ⎟ . ⎜f ⎟ ⎜x ⎟ ⎝ n⎠ ⎝ n⎠
(
)
Лемма (о разложении пространства Rn). R n = R( B) ⊕ Ker B∗ . Перед тем, как доказывать Лемму, выясним, как решать вопрос о разрешимости уравнения BX = F . Ответ очень простой: разрешимость означает, что F ∈ R (B) . Таким образом, чтобы убедиться, что решения есть, надо в соответствии с Леммой доказать, что F ⊥ Ker B ∗ . Для этого достаточно найти базис пространства Ker B∗ и проверить ортогональность F базисным векторам Ker B∗ . Доказательство. Заметим, что R ( B) = R( B) и Ker B ∗ = Ker B ∗ - это замкнутые линейные подпространства R n (докажите замкнутость!!!). 1) Докажем, что из Y ∈ R(B) следует, что Y ⊥ Ker B ∗ . Т.к. Y ∈ R(B) , то
Y = BX . Тогда ∀ψ ∈ Ker B∗ (Y ,ψ ) = ( BX ,ψ ) = ( X , B ∗ψ ) = 0 , т.е. Y ⊥ Ker B ∗ 2). Докажем, что из ψ ⊥ R(B) следует, что ψ ∈ Ker B ∗ . На самом деле, ψ ⊥ R(B) означает, что 0 = (ψ , BX ) = ( B ∗ψ , X ) ∀X ∈ R n . Отсюда B ∗ψ = 0 или ψ ∈ Ker B ∗ . Лемма доказана. Пусть BX = F . Как определить, есть ли решения? Надо найти все нетривиальные линейно независимые решения уравнения B∗ψ = 0 . Если F ортогональна всем этим решениям, то неоднородная система имеет решения; если F не ортогональна всем нетривиальным решениям уравнения B∗ψ = 0 , то уравнение BX = F не имеет решений. Получаем следующие условие разрешимости СЛАУ для уравнения Фредгольма 2 рода в случае D(λ ) = 0 : существует
X ∈ R n такой,
что
(l ) ⎛ f 1 ⎞ ⎛ c~1 ⎞ ⎟ ⎜ ⎟ ⎜ l = 1,..., p . ⎜ M ⎟⊥⎜ M ⎟ ⎜ f ⎟ ⎜ c~ ( l ) ⎟ ⎝ n⎠ ⎝ n ⎠ Чтобы СЛАУ для неоднородного уравнения Фредгольма 2 рода с вырожденным ядром была разрешима, необходимо и достаточно, чтобы вектор правой части был ортогонален всем линейно независимым решениям СЛАУ для однородного союзного b n n уравнения, т.е. ∑ f i c~i (l ) = 0, l = 1,..., p или ∫ f ( x) ∑ c~i ( l ) bi ( x) dx = 0 , ψ l (x) - решения i =1 i =1 a 144244 3
ψ l ( x)
b
однородного союзного уравнения. Т.е.
∫ f ( x)ψ
l
( x) dx = 0
l = 1,..., p .
a
Теорема. Неоднородное уравнение Фредгольма 2 рода с вырожденным ядром разрешимо тогда и только тогда, когда неоднородность f (x) ортогональна всем линейно независимым решениям однородного союзного уравнения. Теорема. Неоднородное уравнение Фредгольма 2 рода с вырожденным ядром разрешимо для любой неоднородности f (x) тогда и только тогда, когда однородное уравнение имеет только тривиальное решение (теорема уже доказана). Перейдем теперь к общему случаю невырожденного несимметрического ядра. Оказывается, что для каждого фиксированного λ неоднородное уравнение Фредгольма 2го рода с невырожденным ядром можно заменить эквивалентным интегральным уравнением с вырожденным ядром. Для уравнений же с вырожденными ядрами теория построена выше. Теорема. Интегральное уравнение Фредгольма 2 рода y = λ A y + f с невырожденным ядром при фиксированном λ можно заменить эквивалентным интегральным уравнением с вырожденным ядром. Доказательство. Для любого ε>0 ядро интегрального уравнения можно представить в виде суммы
K ( x, s ) = K в ( x, s ) + K ε ( x, s ) , где K в ( x, s) =
N (ε )
∑a k =1
k
( x) bk ( s) -
вырожденное ядро, K ε ( x, s ) - невырожденное ядро такое, что max K ε ( x, s ) = max K ( x, s ) − K в ( x, s ) ≤ ε .
x , s∈[ a ,b ]
x , s∈[ a ,b ]
Аппроксимировать ядро вырожденным с любой заданной точностью можно хотя бы потому, что в двумерном случае верна теорема Вейерштрасса о равномерной аппроксимации на квадрате [a, b]x[a, b] функции полиномами, зависящими от двух переменных: PN ( x, s ) = ∑ a nk x n s k . n+k ≤ N n , k = 0, N
Вернемся к интегральному уравнению и запишем его в виде: y = λ Tε y + λ S ε y + f , Tε - интегральный оператор с вырожденным ядром K в ( x, s ) , S ε - интегральный оператор с невырожденным ядром K ε ( x, s ) . Будем считать, что λ фиксировано и перепишем уравнение в виде: (I − λ S ε ) y = λ Tε y + f .
Если по заданному λ выберем ε > 0 так, чтобы λ <
1 , то λ станет “малым” ε (b − a )
для оператора S ε , и оператор (I − λ S ε ) будет обратимым: (I − λ S ε ) = I + λ Rε , где Rε −1
интегральный оператор с ядром Rε ( x, s, λ ) . Введем новую функцию: (I − λ S ε ) y = Y .
В силу обратимости оператора (I − λ S ε ) существует взаимно-однозначное соответствие: y ⇔ Y . Отсюда Y = λ (Tε + λ Tε Rε ) Y + f . Покажем, что уравнение для Y является уравнением с вырожденным ядром. Ядро интегрального оператора Tε + λ Tε Rε вырождено потому, что ядро
оператора Tε вырождено, и b N (ε )
N (ε )
b
a k =1
k =1
a
∫
~ ~ ∑ a k ( x) bk (ξ ) Rε (ξ , s, λ ) dξ = ∑ a k ( x) bk (s, λ ) , где bk (s, λ ) = ∫ bk (ξ ) Rε (ξ , s, λ ) dξ .
Тем самым, мы показали, что любому интегральному уравнению с невырожденным ядром эквивалентно интегральное уравнение с вырожденным ядром. На основании этого можно (но мы не будем это делать) получить результаты, аналогичные полученным выше для уравнений с вырожденными ядрами. Сформулируем теперь 4 теоремы Фредгольма. Теорема 1. Однородное уравнение (1)
b
ϕ ( x) − λ ∫ K ( x, s ) ϕ ( s ) ds = 0 a
и союзное с ним однородное уравнение (2)
b
ψ ( x) − λ ∫ K * ( x, s)ψ ( s) ds = 0 a
(K*(x, s)=K(s, x)) при любом фиксированном λ имеют либо только тривиальные решения, либо одинаковое конечное число линейно независимых решений: ϕ 1 ,..., ϕ n ; ψ 1 ,...,ψ n . Теорема была доказана для интегральных уравнений с вырожденными и симметрическими ядрами. В общем случае она доказывается путем сведения интегрального уравнения с невырожденным ядром к интегральному уравнению с вырожденным ядром. То, что любое характеристическое число имеет конечную кратность, было доказано ранее. Теорема 2.. Для разрешимости неоднородного уравнения (3)
b
ϕ ( x) − λ ∫ K ( x, s) ϕ ( s ) ds = f ( x) a
необходимо и достаточно, чтобы f (x ) была ортогональна всем линейно независимым решениям однородного союзного уравнения (2) ( f ( x) ⊥ ψ 1 ,ψ 2 ,...,ψ n , если λ характеристическое число). Теорема была доказана для случаев симметрических и вырожденных ядер. В общем случае она доказывается путем сведения интегрального уравнения с невырожденным ядром к интегральному уравнению с вырожденным ядром. Теорема 3 (Альтернатива Фредгольма). Либо неоднородное уравнение (3) разрешимо для любой неоднородности f (x ) либо однородное уравнение (1) имеет нетривиальное решение. Теорема была доказана для случаев симметрических и вырожденных ядер. В общем случае она доказывается путем сведения интегрального уравнения с невырожденным ядром к интегральному уравнению с вырожденным ядром. Теорема 4. Множество характеристических чисел однородного уравнения (1) не более, чем счетно, с единственной возможной предельной точкой ∞ . Этот результат справедлив для любого вполне непрерывного оператора. Нами он был получен для вполне непрерывных самосопряженных операторов, и, тем самым, доказан для случая симметрических ядер. Для интегральных операторов с вырожденными ядрами результат тривиален.
Замечание. Все эти теоремы мы доказали для случая, когда K ( x, s ) непрерывная функция по совокупности переменных на [a, b] × [ a, b] ; f (x ) , y (x) непрерывные на [a, b] функции; K ( x, s ) , f (x ) , y (x) - вещественные функции.
§11. Задача Штурма-Лиувилля. Рассмотрим начально-краевую задачу для дифференциального уравнения в частных производных второго порядка, описывающего малые поперечные колебания струны. Струна рассматривается как гибкая упругая нить. Если колебаний нет, то струна занимает отрезок [0,l] на оси x. Колебания струны происходят в плоскости (x,u) и описываются функцией u=u(x,t), t≥0 – время. В случае отсутствия внешних сил уравнение имеет следующий вид (так называемое однородное волновое уравнение): ρ ( x)u tt = C 0 u xx ( u tt и u xx - частные производные второго порядка по t и x соответственно). Вывод этого уравнения можно найти в любом учебнике по уравнениям математической физики. Здесь ρ (x ) – линейная плотность, C0 – натяжение струны, которое предполагается постоянным в процессе малых колебаний. Для однозначного определения решения требуется задать начальные: u ( x,0) = φ ( x); u t ( x,0) = ψ ( x) ; ( φ (x) – начальное смещение, ψ (x ) – начальная скорость) и граничные условия: u (0, t ) = 0; u (l , t ) = 0 (такие условия называются однородными граничными условиями первого рода). Для решения поставленной начально-краевой задачи применим метод разделения переменных. Будем искать все неравные тождественно нулю решения однородного волнового уравнения, удовлетворяющие однородным граничным условиям и представимые в виде произведения: u = X ( x )T (t ) . Подставляя произведение в уравнение, получаем: ρ ( x) X ( x)T ′′(t ) = C 0 X ′′( x)T (t ) . В этом уравнении легко разделяются переменные: X ′′( x ) T ′′(t ) . = ρ ( x ) X ( x ) C 0T ( t ) Последнее равенство возможно лишь в том случае, если X ′′( x ) T ′′(t ) = = −λ , ρ ( x ) X ( x ) C 0T ( t ) где λ - константа. Для функции X (x ) получаем уравнение X ′′( x ) + λρ ( x ) X ( x ) = 0 . Подставляя произведение X ( x)T (t ) в граничные условия, получаем граничные условия для X (x ) : X(0)=0; X(l)=0. Поскольку мы ищем нетривиальные решения, то получаем задачу на собственные значения и собственные функции: найти все значения параметра λ , при которых существует нетривиальное решение уравнения X′′(x)+ λρ(x)X(x)=0, удовлетворяющее однородным граничным условиям первого рода X(0)=0; X(l)=0. Эта задача является частным случаем задачи Штурма-Лиувилля, которую мы исследуем ниже. Мы же сейчас выпишем решение в простейшем случае: пусть ρ(x)= ρ0=const. Обозначая a2= C0/ρ0, после разделения переменных получим уравнение X ′′( x ) T ′′(t ) = = −λ X ( x ) a 2T ( t ) и следующую краевую задачу на собственные значения и собственные функции для X(x): X′′(x)+ λX(x)=0; X(0)=0; X(l)=0. Можно доказать (см. ниже), что собственные значения могут быть только вещественными (проверьте сами!!!) даже, если X(x) – комплекснозначная функция. В дальнейшем будем считать, что X(x) – вещественная функция. Легко убедиться (проверьте!!!), что если λ отрицательное число или нуль, то краевая задача для X(x) имеет
только тривиальное решение. Итак, будем искать собственные значения только среди положительных λ. Общее решение уравнения имеет вид: X(x)=C1sin(x√λ)+ C2cos(x√λ). Подставляя в первое граничное условие, получаем C2=0. Подставляя во второе граничное условие и сокращая на C1 (C1≠0, т.к. мы ищем нетривиальное решение), получаем уравнение для отыскания собственных значений: sin(x√λ)=0. 2
Отсюда
собственные
X n ( x) = sin
значения
πn
⎛ πn ⎞ ⎟ , n = 1,2,... , ⎝ l ⎠
λn = ⎜
а
собственные
функции
x . Эти функции хорошо знакомы из курса математического анализа. Там l было доказано, что система этих функций является замкнутой в пространстве h[0,l]. l Заметим, что || X n || 2 = . Заметим также, что записанная задача является задачей на 2 собственные значения и собственные функции для одномерного оператора Лапласа (взятого со знаком минус), поскольку X ′′( x) ≡ ∆1 X ( x) , ∆1 - одномерный оператор Лапласа. Для временной составляющей получаем уравнение Tn′′ + a 2 λ n Tn = 0 . πn πn Отсюда Tn = An cos at + Bn sin at , An , Bn - произвольные постоянные. Ищем l l теперь решение начально-краевой задачи в виде ∞ ∞ πn πn ⎞ πn ⎛ u ( x, t ) = ∑ Tn (t ) ⋅ X n ( x) = ∑ ⎜ An cos at + Bn sin at ⎟ ⋅ sin x, l l l ⎠ n =1 n =1 ⎝ т.е. в виде ряда Фурье по собственным функциям X n (x) с коэффициентами Фурье Tn (t ) (именно поэтому метод разделения переменных называют также методом Фурье). Каждый член ряда удовлетворяет как уравнению, так и однородным граничным условиям первого рода (кстати, каждый член ряда представляет собой стоячую волну – объясните почему!!!). Поэтому, если можно менять местами дифференцирование и суммирование, то записанный ряд удовлетворяет уравнению и граничным условиям. Попытаемся удовлетворить теперь и начальным условиям. Подставляя t=0, получаем ∞ πn u ( x,0) = ∑ An sin x = ϕ ( x) . l n =1 Отсюда коэффициент Фурье
2 πn An = ∫ ϕ ( x) ⋅ sin x . l 0 l l
Дифференцируя по t и полагая t=0, получаем
2 l πn ψ ( x) ⋅ sin x. x, Bn = u t ( x,0) = ∑ a ⋅ Bn ⋅ sin ∫ l πna 0 l l n =1 l Поскольку поведение ряда для решения определяется коэффициентами An и Bn, то возможность менять местами дифференцирование и суммирование определяется свойствами функций ϕ (x) и ψ (x) . Этот вопрос подробно исследуется в курсе методов математической физики. Рассмотренная задача на собственные значения и собственные функции является частным случаем задачи Штурма-Лиувилля, к рассмотрению которой мы и приступаем. ∞
πn
πn
l
Рассмотрим первую краевую задачу на собственные значения и собственные функции для оператора Штурма-Лиувилля (сокращенно задачу Штурма-Лиувилля): ⎧ Ly + λρ ( x) y = 0 , ⎨ ⎩ y (a ) = y (b) = 0 где оператор L имеет вид d ⎛ dy ⎞ Ly = ⎜ p( x) ⎟ − q( x) y . dx ⎝ dx ⎠ Коэффициенты p(x) , q(x) , p(x) удовлетворяют следующим условиям: p(x) непрерывно дифференцируемая, а q(x) и ρ (x) непрерывные на [a,b] функции, причем ρ ( x ), p ( x ) > 0 , q( x) ≥ 0 на [a, b] . Докажем, что оператор L является симметрическим на подпространстве дважды непрерывно дифференцируемых функций из h[a,b], удовлетворяющих однородным граничным условиям первого рода. Из этого результата сразу следует, что при изучении задачи Штурма-Лиувилля достаточно ограничиться вещественными λ. Возьмем произвольные дважды непрерывно дифференцируемые функции y(x) и z(x), удовлетворяющие граничным условиям y ( a ) = y (b) = z ( a ) = z (b) = 0 . Покажем, что
(Ly, z ) = ( y, Lz ) ,
где скалярное произведение берется в h[a,b]. Легко видеть, что b
b
b
b
b
d ⎛ dy ⎞ dy dy ⎛ dz ⎞ dz d ⎛ dz ⎞ ∫a dx ⎜⎝ p( x) dx ⎟⎠ z ( x)dx = p( x) dx z ( x) a − ∫a dx ⋅ ⎜⎝ p( x) dx ⎟⎠dx =− y p dx a + ∫a y dx ⎜⎝ p( x) dx ⎟⎠ dx . Подстановки обращаются в нуль в силу граничных условий. Отсюда сразу же следует симметричность оператора L. Рассмотрим теперь краевую задачу: Ly = f ; ⎧ ⎨ ⎩ y (a ) = y (b) = 0. Если существует функция Грина, то решение этой задачи для заданной непрерывной функции f(x), может быть представлено в виде b
y ( x) = ∫ G ( x, ξ ) f (ξ )dξ a
(G(x,ξ) – функция Грина). Функция Грина непрерывна по совокупности аргументов и симметрична: G ( x, ξ ) = G (ξ , x) для любых x, ξ на отрезке [a,b]. Как было доказано в курсе обыкновенных дифференциальных уравнений, для существования функции Грина достаточно доказать, что однородная краевая задача Ly = 0; ⎧ ⎨ ⎩ y (a ) = y (b) = 0; имеет только тривиальное решение. Допустим, что это не так. Тогда, не ограничивая общности, можно считать, что в некоторой точке x0∈(a,b) решение имеет максимальное положительное значение: y(x0)>0, y′(x0)=0 (если решение не принимает положительных значений, то домножим его на –1). Поскольку y(b)=0, то найдется точка x1∈(a,b), x0< x1,
такая что y(x)>0 для любого x на отрезке [x0,, x1], y′(x1)<0. Запишем однородное уравнение в виде d ⎛ dy ⎞ ⎜ p ( x) ⎟ = q ( x) y dx ⎝ dx ⎠ и проинтегрируем его в пределах от x0 до x1. Учитывая знаки функций p(x) и q(x), получаем противоречие: x1
0 > py ′ | xx = ∫ q ( x) y ( x)dx ≥ 0. 1
0
x0
Итак, функция Грина существует. Тогда, интегрируя от a до b уравнение в задаче Штурма-Лиувилля, домножив предварительно на функцию Грина, получим b ⎧ Ly = −λρ ( x) y; ⇔ y ( x ) = − λ ⎨ ∫a G( x,ξ ) ρ (ξ ) y(ξ )dξ . ⎩ y (a) = y (b) = 0;
Докажите(!!!), что задача Штурма-Лиувилля характеристические значения и собственные функции
эквивалентна
задаче
на
b
y ( x) = −λ ∫ G ( x, ξ ) ρ (ξ ) y (ξ )dξ a
для интегрального оператора с непрерывным ядром G ( x, ξ ) ρ (ξ ) . Если ρ (ξ ) ≠ 1 тождественно, то ядро интегрального оператора не является симметрическим. Симметризуем записанную задачу. Для этого умножим записанное выше уравнение слева и справа на ρ (x) и введем новые функцию
ϕ ( x) = y ( x) ρ ( x) и ядро
K ( x, ξ ) = ρ ( x) G ( x, ξ ) ρ (ξ ) , которое является непрерывным и симметрическим. Получаем задачу на характеристические числа и собственные функции для интегрального оператора с непрерывным симметрическим ядром b
ϕ ( x) = −λ ∫ K ( x, ξ ) ϕ (ξ )dξ a
.
Докажем, что ядро K(x,ξ) является замкнутым. Для этого достаточно показать, что из равенства b
∫ K ( x,ξ ) z (ξ )dξ = 0 a
следует, что z(ξ)≡0. Заметим, что предыдущее равенство имеет вид b
∫
ρ ( x) G ( x, ξ ) ρ (ξ ) z (ξ )dξ = 0
a
или b
∫ G ( x, ξ ) a
ρ (ξ ) z (ξ )dξ = 0 .
Действуя оператором L на левую и правую часть этого равенства, получаем, что для всех x
ρ ( x) z ( x) = 0, что и требовалось доказать. Итак, мы доказали следующую теорему:
Теорема. Задача Штурма-Лиувилля эквивалентна задаче на характеристические числа
и
собственные
функции
для
интегрального
оператора
с
непрерывным
симметрическим замкнутым ядром. Используя эквивалентность задачи Штурма-Лиувилля задаче на характеристические числа и собственные значения для интегрального оператора с симметрическим непрерывным и не равным тождественно нулю ядром, докажем следующие теоремы. Теорема. Существует бесконечно много собственных значений λn. Доказательство. Существование хотя бы одного характеристического числа λn для интегрального оператора с симметрическим непрерывным и не равным тождественно нулю ядром следует из результатов параграфа 3. Предположим, что характеристических чисел конечное число. Тогда, как было доказано в параграфе 4, ядро можно представить в виде N φ ( x )φ ( s ) n , K ( x, s ) = − Σ n n =1
λn
φ n (x) - ортонормированные собственные функции. Таким образом, ядро вырождено, а поэтому не может быть замкнутым. Теорема доказана. Теорема. Каждое собственное значение задачи Штурма-Лиувилля имеет кратность единица. Доказательство. Заметим, что собственное значение кратности единица называется простым собственным значением. Докажем, что каждое собственное значение является простым. Предположим, что это не так. Тогда некоторому собственному значению λ соответствуют две линейно независимые собственные функции y1(x), y2(x). Поскольку дифференциальное уравнение в задаче Штурма-Лиувилля является линейным уравнением второго порядка, то y1(x), y2(x) образуют фундаментальную систему решений. Поэтому любое решение дифференциального уравнения Ly + λρ ( x) y = 0 представимо в виде y(x)=C1 y1(x)+C2 y2(x). Поскольку функции y1(x), y2(x) обращаются в нуль в точках a, b, то этим же свойством обладает и любое другое решение. Но это противоречит теореме существования решения задачи Коши для уравнения Ly + λρ ( x) y = 0 с условиями Коши, имеющими, например, вид y(a)=1; y′(a)=0. Теорема доказана. Теорема. Собственные функции задачи Штурма-Лиувилля ортогональны с весом ρ (x) . Доказательство. По доказанному в параграфе 4 собственные функции ϕ n (x) ортогональны. Более того, что их можно выбрать так, что они образуют ортонормированную систему b ⎧1 k = n ∫a ϕ k ( x) ϕ n ( x) dx = ⎨⎩0 k ≠ n . Учитывая, что ϕ n ( x) = y n ( x) ρ ( x)
,
⎧1 k = n; = ρ y ( x ) y ( x ) ( x ) dx ⎨ k n ∫a ⎩0 k ≠ n; b
что и требовалось доказать. Теорема. Собственные значения задачи Штурма-Лиувилля положительны. Доказательство. Запишем уравнение в задаче Штурма-Лиувилля, которому удовлетворяет собственная функция yn(x), считая, что yn(x) нормирована с весом ρ (x) : b
∫y
2 n
( x) ρ ( x)dx = 1.
a
Домножим теперь уравнение на yn(x) и проинтегрируем от a до b. Интегрируем по частям и с учетом граничных условий получаем: b b b b d ⎛ dy n ⎞ Ly n + λ n ρ y n = 0 ⇒ ∫ y n (Ly n + λ n ρ y n )dx = ∫ y n ⎜p ⎟dx − ∫ q y n2 dx + λ n ∫ ρ y n2 dx = dx ⎝ dx ⎠ a a a a 2
b ⎛ dy ⎞ = − ∫ p ⎜ n ⎟ dx − ∫ q y n2 dx + λ n = 0. a a ⎝ dx ⎠ b
Отсюда ⎡ 2 ⎛ dy n ⎞ 2 ⎤ λ n = ∫ ⎢ q y n + p⎜ ⎟ ⎥dx. dx ⎝ ⎠ ⎥⎦ a ⎢ ⎣ b
Поскольку q(x)≥0, p(x)>0, а yn(x) не равно константе, то собственное значение строго положительно. Теорема доказана. Следствие. Имеет место следующая оценка снизу для наименьшего собственного значения 2 b⎡ b q( x) q( ~ x) b q( ~ x) q ( x) ⎛ dy1 ⎞ ⎤ 2 λ1 = ∫ ⎢q y1 + p⎜ ρ ( x) y12 ( x)dx ≥ ~ ∫ ρ ( x) y12 ( x)dx = ~ ≥ inf ≥ 0. ⎟ ⎥ dx ≥ ∫ x∈[a ,b ] ρ ( x ) dx ρ ( x ) ρ ( x ) a⎢ a ρ ( x) a ⎝ ⎠ ⎥ ⎣ ⎦ (~ x принадлежит [a,b]). Следующая теорема имеет исключительно важное значение в теории дифференциальных уравнений. Теорема. (Теорема Стеклова). Любая дважды непрерывно дифференцируемая на отрезке [a,b] и обращающаяся в нуль на концах отрезка функция f(x) раскладывается в абсолютно и равномерно сходящийся ряд Фурье по ортонормированной с весом ρ(x) системе собственных функций задачи ШтурмаЛиувилля: ∞
f ( x) = ∑ f n y n ( x), n =1
где коэффициенты Фурье равны b
f n = ∫ f ( x) ρ ( x) y n ( x)dx. a
Доказательство. Подействуем на функцию f(x) оператором L. Получим непрерывную функцию h(x). Тогда функция f(x) является решением следующей краевой задачи:
⎧ L f ( x) = h( x); ⎨ ⎩ f (a ) = f (b) = 0. Используя функцию Грина, получаем: b
b
a
a
f ( x) = ∫ G ( x, s ) h( s ) ds = ∫ K ( x, s )
h( s )
ρ ( x) ρ ( s )
ds.
Введем новые функции
f ( x) ρ ( x) = F ( x) ,
h( s )
ρ ( s)
= H ( s ).
Очевидно, что обе новые функции непрерывны на [a,b], истокопредставима с симметрическим непрерывным ядром K(x,s):
а
F(x)
b
F ( x) = ∫ K ( x, s ) H ( s ) ds. a
По теореме Гильберта-Шмидта F(x) раскладывается в абсолютно и равномерно сходящийся ряд по ортонормированной системе собственных функций интегрального оператора с ядром K(x,s): ∞
F ( x) = ∑ Fn ϕ n ( x), n =1
причем коэффициенты Фурье равны: b
Fn = ∫ F ( x)ϕ n ( x)dx. a
Поскольку
ϕ n ( x) = y n ( x ) ρ ( x) , имеем ∞
ρ ( x) f ( x) = ∑ Fn y n ( x) ρ ( x) . n =1
После сокращения на
ρ (x) получаем: ∞
f ( x) =
∑ Fn yn ( x). n =1
Докажите (!!!), что и после сокращения ряд сходится равномерно и абсолютно в силу свойств ρ(x). Для коэффициентов Фурье имеем: b
b
a
a
Fn = ∫ f ( x) ρ ( x) y n ( x) ρ ( x) dx = ∫ f ( x) y n ( x) ρ ( x)dx = f n . Теорема Стеклова доказана. В заключение параграфа заметим, что все полученные в данном параграфе результаты остаются справедливыми для второй краевой задачи (граничные условия имеют вид y′(a)=0; y′(b)=0), третьей краевой задачи (граничные условия имеют вид y′(a)-h1y(a)=0; y′(b)+h2y(b)=0; h1, h2 – положительные постоянные), а также для смешанных краевых задач, когда левом конце задается условие одного рода, а на правом другого. Необходимо помнить только, что для второй краевой задачи, если q(x)≡0, существует нулевое собственное значение.
§12. Интегральные уравнения Фредгольма I рода. Метод регуляризации А.Н.Тихонова. Этот параграф завершает первую главу, однако читаться он должен после прочтения второй главы, поскольку существенно использует методы вариационного исчисления. Рассмотрим интегральное уравнение Фредгольма первого рода: Ay ≡ ∫ K ( x, s )y (s )ds = f ( x ), b
x ∈ [c, d ] .
a
Как и ранее, будем предполагать, что ядро K ( x, s ) - функция, непрерывная по совокупности аргументов x ∈ [c, d ] , s ∈ [a, b ] , а решение y (s ) - непрерывная на отрезке [a, b] функция. Тем самым, мы можем рассматривать оператор A как действующий в следующих пространствах: A : C [a, b] → h[c, d ];
A : h[a, b] → h[c, d ]. Рассмотрим подробнее первый случай. Задача решения уравнения Фредгольма первого рода ( A : C [a, b] → h[c, d ]) является некорректно поставленной. Напомним условия корректной постановки задачи: 1) Решение существует для любой непрерывной на [c, d ] функции f (x) . На самом же деле, это не так: существует бесконечно много непрерывных функций, для которых решения нет. Мы не можем доказать это утверждение в общем виде. Для доказательства необходимо использовать некоторые сведения из функционального анализа, знание которых выходит за рамки данного курса. Поэтому поясним это утверждение только на примере: пусть ядро K ( x, s ) таково, что существует K x′ ( x0 , s ), x0 ∈ (c, d ) , для любого s ∈ [a, b] . Тогда существует
b
( ∫ K ( x, s ) y ( s )ds )′ a
для любой x = x0
непрерывной функции y(s). А теперь в качестве f (x) возьмём непрерывную функцию такую, что f ′( x) x = x не существует. Тогда очевидно, что решение интегрального 0
уравнения не существует. 2) Единственность решения. Будем требовать, чтобы ядро было замкнуто. Тогда, если решение есть, то оно единственно. Первые два условия корректности эквивалентны условию существования обратного оператора A −1 с областью определения D( A −1 )= h[c, d ] . Если ядро замкнуто, то обратный оператор существует, однако область его определения не совпадает с h[c, d ] . 3) Устойчивость решения. Это означает, что для любой последовательности f n → f , Ay n = f n , Ay = f , последовательность
y n → y . Устойчивость эквивалентна непрерывности обратного
оператора A −1 при условии, что обратный оператор существует. Покажем, что это не так. Рассмотрим следующий пример. Пусть последовательность непрерывных функций yn ( s ) , n=1, 2, …, такая, что yn ( s ) ≠ 0 на промежутке a+b a+b [ − dn , + d n ] и обращается в нуль вне данного интервала, max| yn ( s ) |=1, s∈[a, b], 2 2 а последовательность чисел d n → 0 + 0 . Такая функция может быть выбрана, например, кусочно-линейной. Тогда для любого x ∈ [c, d ]
a +b +dn 2
b
fn ( x) =
∫ K ( x, s) yn (s)ds = a +b∫ K ( x, s) yn (s)ds ≤ K0 ⋅1 ⋅ 2dn → 0 a
2
−dn
при n → ∞ , где K 0 = max K ( x, s ) , x ∈ [c, d ], s ∈ [a, b] .
Последовательность функций f n (x) равномерно, а, следовательно, и в h[c, d ] , сходится
к
f =0.
Хотя
решение
уравнения Ay = f ,
последовательность y n не стремится к y , так как y n − y
C [ a ,b ]
в
этом
случае
y =0
= 1.
Ранее мы доказали, что оператор A является вполне непрерывным при действии из h[a, b] в h[c, d ] и при действии из C[a, b] в h[c, d ] . Мы также привели пример последовательности y n , y n h[ a ,b ] = 1 , из которой нельзя выделить сходящуюся в h[a, b] подпоследовательность. В качестве такой последовательности можно выбрать, например, y n ( x ) ={
2 1 / 2 πn( x − a ) } sin ; n =1, 2,... b−a b−a
Очевидно, что эта последовательность равномерно (по норме C[a, b] ) ограничена, C[ a , b ] но из этой последовательности нельзя выделить сходящуюся в подпоследовательность (почему???). Предположим теперь, что оператор A −1 является непрерывным. Докажите сами (!!!), что, если оператор B : h[c, d ] → C[a, b] является непрерывным, а оператор A вполне непрерывный, то BA : C[a, b] → C[a, b] - вполне непрерывный оператор. Но тогда, поскольку для любого n A −1 Ay n = y n , то последовательность y n компактна, что неверно. Оператор, обратный к вполне непрерывному оператору, не может быть непрерывным. Итак, поскольку задача решения интегрального уравнения Фредгольма первого рода некорректно поставлена, то даже при очень малых ошибках в задании f ( x) решение может либо отсутствовать, либо очень сильно отличаться от искомого точного решения. Некоррректно поставленные задачи очень часто встречаются при обработке результатов физического эксперимента, в частности, в астрофизике, геофизике, ядерной физике и т. д. Функция f ( x) находится в результате эксперимента, поэтому неизбежно содержит ошибки. А. Н. Тихонов в 1963 году заложил основу теории решения некорректно поставленных задач, основанной на понятии регуляризирующего алгоритма (оператора). Оператор R( f δ , δ ) ≡ Rδ ( f δ ) называется регуляризирующим алгоритмом (РА) для решения операторного уравнения Ay = f ; A : C[a, b] → h[c, d ] , если: 1) Rδ ( f δ ) определен для любого f δ ∈ h[c, d ] и для любого 0 < δ < +∞ . Rδ ( f δ ) отображает h[c, d ] → C[a, b] при каждом фиксированном δ > 0 . 2) Для любой функции y ∈ C[a, b] и любой функции f δ ∈ h[c, d ] такой, что fδ − f
h[ c , d ]
≤ δ , δ > 0 , Ay = f ,
[ a ,b ] приближенное решение yδ = Rδ ( f δ ) ⎯C⎯ ⎯→ y при
δ → 0. Точно также можно определить регуляризирующий алгоритм решения операторного уравнения Ay = f , A: N1→N2, N1 и N2 – нормированные пространства. Некорректно поставленная задача называется регуляризируемой, если существует хотя бы один регуляризирующий алгоритм ее решения. Все математические задачи,
сводящиеся к решению операторного уравнения Ay = f , могут быть классифицированы следующим образом: 1) корректно поставленные; 2) некорректно поставленные, регуляризируемые; 3) некорректно поставленные, нерегуляризируемые. Понятно, что корректно поставленные задачи являются регуляризируемые, поскольку в качестве регуляризирующего алгоритма можно выбрать обратный оператор. Рассмотрим регуляризирующий алгоритм решения интегрального уравнения первого рода, предложенный А.Н.Тихоновым. Рассмотрим функционал Тихонова 2 2 2 M α [ y ] = Ay − f h[ c ,d ] + α ( y h[ a ,b ] + y′ h[ a ,b ] ) ,
y ( x) - непрерывно дифференцируемая функция; f ∈ h[c, d ]; число α > 0 называется параметром регуляризации. Теорема (А.Н.Тихонов). Для любой функции f ∈ h[c, d ] и любого параметра регуляризации α > 0 существует и притом единственная функция y α (s ) , реализующая минимум функционала M α [ y ] и являющаяся решением краевой задаче для интегродифференциального уравнения Эйлера. Доказательство. Для упрощения записи опустим обозначения функциональных пространств при записи норм в функционале Тихонова: 2 2 2 M α [ y ] = Ay − f + α ( y + y ′ ) , 2
⎛b ⎞ где y = ∫ y ( s )ds , y ′ = ∫ ( y ′( s )) ds , Ay − f = ∫ ⎜⎜ ∫ K ( x, s ) y ( s )ds − f ( x) ⎟⎟ dx . c⎝a a a ⎠ Посчитаем теперь вариацию функционала Тихонова и приравняем ее нулю. Мы посчитаем так называемую сильную вариацию, предоставив слушателям посчитать и приравнять нулю так называемую слабую вариацию d α M [ y + th] = 0 , dt t =0 при этом результат не изменится. Определим сначала граничные условия. Мы будем предполагать, что мы не знаем значения y(s) на концах отрезка [a, b], поэтому будем рассматривать задачу со свободными концами. В параграфе 2.5 были получены граничные условия для этого случая Fy ′ = 0 ; Fy ′ = 0 ; 2
b
b
2
2
2
2
a
d
b
если требуется найти экстремум функционала b
V [ y ] = ∫ F ( x, y, y ' )dx . a
Достаточно 2
заметить,
что
от
y'
в
функционале
Тихонова
зависит
только
b
α y′ = α ∫ ( y′( s )) 2 ds . Поэтому Fy′ = 2αy′ , и мы получаем однородные граничные условия a
второго рода
y ′(a) = 0 ; y ′(b) = 0 . Посчитаем вариацию функционала Тихонова. Для этого зададим приращение аргумента δy , выделим линейную по δy часть разности M α [ y + δy ] − M α [ y ] . Для получения уравнения Эйлера приравняем линейную часть приращения равной нулю. Итак, рассмотрим разность 2 2 2 M α [ y + δy ] − M α [ y ] = A( y + δy ) − f + α y + δy + y ′ + δy ′ − M α [ y ] ,
(
)
где δy непрерывно дифференцируемая функция, удовлетворяющая граничным условиям δy ′(a ) = 0 , δy ′(b ) = 0 . Заметим, что: A( y + δy ) − f
2
= ( Ay − f ) + Aδy
2
= (( Ay − f ) + Aδy, ( Ay − f ) + Aδy ) =
(
)
= ( Ay − f , Ay − f ) + 2(( Ay − f ), Aδy ) + ( Aδy, Aδy ) = ( Ay − f ) + 2 A* Ay − A* f , δy + Aδy 2
Последний член в этом выражении удовлетворяет неравенству
2
Aδy ≤ A
2
2
;
2 δy , из
которого следует, что Aδy 2 = o( δy ) . Далее 2 2 2 y + δy = ( y + δy, y + δy ) = y + 2( y, δy ) + δy ; 2 2 2 y ′ + δy ′ = ( y ′ + δy ′, y ′ + δy ′) = y ′ + 2( y ′, δy ′) + δy ′ . b
b
a
a
Преобразуем ( y′, δy′) = ∫ y′(s )δy ′(s )ds = y′δy b − ∫ y′′(s )δy (s )ds = −( y′′, δy ) , a причем y ′δy a = 0 , так как y′(a ) = y′(b ) = 0 . Итак, M α [ y + δy ] − M α [ y ] = b
( = 2(A Ay − A
)
= 2 A* Ay − A* f , δy + Aδy + 2α (( y, δy ) − ( y ′′, δy )) + α δy + α δy ′ = 2
2
)
(
2
)
f + α ( y − y′′), δy + Aδy + α δy + δy′ . Выделим линейную по δy часть приращения и приравняем ее нулю: *
*
(A Ay − A *
*
2
2
) (
2
)
f + α ( y − y′′), δy = ∫ A* Ay − A* f + α ( y − y′′) δy (s )ds = 0 . b
a
Слушателем предлагается самим сформулировать и доказать необходимый вариант основной леммы вариационного исчисления (параграф 2.3) и получить уравнение Эйлера A* Ay − A* f + α ( y − y ′′) = 0 . Окончательно получаем, что функция, на которой достигается экстремум функционала Тихонова, является решением второй краевой задачи для интегродифференциального уравнения Эйлера. ⎧ A* Ay + α ( y − y ′′) = A* f ; ⎨ ⎩ y ′(a ) = 0 , y′(b ) = 0. На решении этой задачи достигается минимум функционала Тихонова потому, что, если y является решением этой задачи, то 2 2 2 M α [ y + δy ] − M α [ y ] = Aδy + α δy + δy′ ≥ 0
(
)
для любого допустимого приращения δy . Перепишем краевую задачу в следующем виде: 1 * ⎧ ′′ A Ay − A* f ; ⎪y − y = α ⎨ ⎪⎩ y ′(a ) = 0 , y ′(b ) = 0. Докажем, что существует функция Грина для задачи: ⎧ y ′′ − y = F ; ⎨ ⎩ y ′(a ) = 0 , y ′(b ) = 0. Если функция Грина существует, то
(
b
)
y (τ ) = ∫ G (τ , ξ )F (ξ )dξ . a
Для доказательства существования функции Грина достаточно доказать, что однородная задача ⎧ y ′′ − y = 0; ⎨ ⎩ y ′(a ) = 0 , y′(b ) = 0; имеет только тривиальное решение. Общее решение уравнения y′′ − y = 0 можно записать в виде: ~ ~ y = C1eτ + C 2 e −τ = C1ch(τ − a ) + C 2 ch(τ − b ) . Из первого граничного условия получаем C 2 = 0 из второго - C1 = 0 . Следовательно, однородная краевая задача имеет только тривиальное решение, и функция Грина существует (постройте функцию Грина!!!). Если мы подействуем интегральным оператором с ядром функцией Грина (мы обозначим этот оператор G) на левую и правую часть интегро-дифференциального уравнения Эйлера, то получим интегральное уравнение Фредгольма второго рода 1 y = GA* Ay − GA* f ,
α
(
)
эквивалентное второй краевой задаче для уравнения Эйлера. Докажите сами (!!!) (рассуждая, как и в параграфе 1.11) эквивалентность этих двух задач. Ядро оператора A* A имеет вид: b
K~ (ξ , s ) = ∫ K (η , ξ )K (η , s )dη , a
*
а ядро оператора GA A : b
~ ~ G (τ , s ) = ∫ G (τ , ξ )K (ξ , s )dξ . a
Ядра K~ (η , s ) , K (ξ , s ) , G (τ , ξ ) непрерывны по совокупности аргументов, а, следовательно, ~ ядро G (τ , s ) также непрерывно по совокупности аргументов. Столь же очевидно, что 1 неоднородность в полученном уравнении Фредгольма второго рода − GA* f также
α
(
)
является непрерывной функцией. Для того, чтобы доказать существование и единственность решения уравнения Фредгольма, в силу альтернативы Фредгольма достаточно доказать, что однородное уравнение 1 y = GA* Ay
α
имеет только тривиальное решение. Однородное уравнение эквивалентно следующей краевой задаче: ⎧α ( y − y′′) + A* Ay = 0; ⎨ ⎩ y ′(a ) = y′(b ) = 0. Пусть y – любое ее решение. Домножим уравнение слева и справа на y и проинтегрируем в пределах от a до b, заметив, что
( y, y ) =
y , (A Ay, y ) = Ay , − ( y ′′, y ) = − ∫ y ′′(τ ) y (τ )dτ = − y ′y a + ∫ ( y ′) dτ = y ′′ . 2
*
2
b
b
b
a
2
a
Получим, что решение краевой задачи удовлетворяет равенству 2 2 2 Ay + α y + α y ′ = 0 . Поскольку α > 0 , то y ≡ 0 , что и требовалось доказать. Теорема доказана.
2
Лемма. Рассмотрим множество функций y(x), непрерывно дифференцируемых на [a, b] и таких, что y
2
2
h[ a ,b ]
+ y ′ h[ a ,b ] ≤ C 2 , C > 0 .
Тогда это множество равномерно ограничено и равностепенно непрерывно. Доказательство. Заметим, что из неравенства в условии леммы следует, что y ≤ C , y′ ≤ C . Докажем сначала произвольные x1 , x 2 ∈ [a, b ] . Тогда
равностепенную
x2
x2
x2
x1
x1
x1
y ( x1 ) − y ( x2 ) = ∫ y′dx ≤
∫ ( y′( x) ) dx ≤
∫ 1 ⋅ dx ⋅
2
непрерывность.
Возьмем
x1 − x2 ∫ ( y′( x )) dx ≤C x1 − x2 . b
2
a
Из этого неравенства следует, что множество функций является равностепенно непрерывным. Докажем равномерную ограниченность. b
Из неравенства ∫ y 2 ( x)dx ≤ C , C > 0 , применяя теорему о среднем, получим a
b
y (ξ ) ∫ dx ≤ C , ξ ∈ [a, b] . 2
a
Отсюда
y (ξ ) ≤
C . Возьмем произвольную точку x ∈ [a, b] . Тогда b−a
C C ~ + C x −ξ ≤ +C b−a ≡C b−a b−a ~ C не зависит ни от x, ни от y. Следовательно, множество функций равномерно ограничено. Лемма доказана. Следствие. Пусть {yn (x)} (n=1, 2, …) - последовательность непрерывно дифференцируемых на [a, b] функций, удовлетворяющих неравенству: y ( x) = y (ξ ) + y ( x) − y (ξ ) ≤ y (ξ ) + y ( x) − y (ξ ) ≤
yn
2 h[ a ,b ]
+ yn′
2 h[ a ,b ]
≤ C2, C > 0 ,
тогда эта последовательность является компактной в C[a, b]. Доказательство. По доказанной выше лемме, эта последовательность является равномерно ограниченной и равностепенно непрерывной. По теореме Арцела из неё можно выделить равномерно сходящуюся подпоследовательность. Равномерно сходящаяся последовательность непрерывных функций сходится к непрерывной функции. Теорема (А.Н.Тихонов). Пусть f δ (x) - непрерывная на [c, d ] ; f δ − f ≤δ, h[ c , d ]
δ ∈ [0, δ 0 ], δ 0 > 0 ; f : Ay = f , где A - интегральный оператор с ядром K ( x, s), x ∈ [c, d ], s ∈ [a, b] , непрерывным по совокупности аргументов и замкнутым; y ( x) непрерывно дифференцируемая на [a, b] функция. Пусть параметр регуляризации удовлетворяет следующим требованиям: α (δ ) : α (δ ) → 0 при δ → 0 и
δ2 ≤ C , C > 0 , для любого α (δ )
δ ∈ (0, δ 0 ] . Тогда yδα (δ ) = arg min M α (δ ) [ y ] , т.е. функция, на которой достигается минимум функционала Тихонова M α [ y ] = Ay − fδ
2 h[ c , d ]
(
2
2
)
+ α y h[ a ,b ] + y′ h[ a ,b ] , α=α(δ),
C [ a ,b ] обладает тем свойством, что yδα (δ ) ⎯⎯ ⎯ ⎯→ y при δ → 0 .
Перед тем, как перейти к доказательству теоремы, заметим, что мы получим регуляризирующий алгоритм Тихонова для случая, когда интегральный оператор при дополнительном условии непрерывной действует A : C[a, b] → h[c, d ] дифференцируемости точного решения интегрального уравнения: y ∈ C (1) [a , b] Доказательство. Предположим, что yδα (δ ) не стремится к y в C[a, b] при δ → 0 . Тогда существуют ε > 0 и последовательность δ k → 0 такие, что yδα (δ ) − y k
k
Заметим, что M α [ yδα ] = min M α [ y ] ≤ M α [ y ] = Ay − f δ
2
2
2
C [ a ,b ] 2
≥ε > 0. 2
+ α ( y + y′ ) ≤ δ 2 + α ( y + y′ ) .
Из этого неравенства получаем
Ayδα − f δ
2
+ α ( yδα
2
2
2
2
+ ( yδα )′ ) ≤ δ 2 + α ( y + y′ ) .
В левой части этого неравенства оба члена неотрицательны. Поэтому мы можем получить два неравенства, первое из которых имеет вид: yδα Если α=α(δ), то
2
2
+ ( yδα )′ ≤
δ2 2 2 + y + y′ . α
2 2 ~ δ2 2 2 ≤ C , и yδα (δ ) + ( yδα (δ ) )′ ≤ C + y + y ′ ≤ C . Следовательно, α
по лемме yδαk(δ k ) является компактной в пространстве C[a, b] , и существуют такая
подпоследовательность этой последовательности и такая функция y * , непрерывная на [a, b], что подпоследовательность равномерно сходится к y * . [ a ,b ] ⎯→ y * при k → ∞ . Тогда Не ограничивая общности, будем считать, что yδαk(δ k ) ⎯C⎯
Ayδαk(δ k ) − Ay
2
h[ c , d ]
2
= Ayδαk(δ k ) − f δ k + f δ k − f ≤ Ayδαk(δ k ) − f δ k + δ k ≤ δ k2 + α (δ k )( y + y ′ ) + δ k .
(Здесь мы использовали второе неравенство следующее из неравенства M α [ yδα ] ≤ M α [ y ] ). Переходя к пределу при k → ∞ , получаем Ay * − Ay = 0 . В силу взаимной однозначности интегрального оператора (условие замкнутости ядра) из [ a ,b ] равенства Ay* = Ay следует, что y* = y . Итак, yδαk(δ k ) ⎯C⎯ ⎯→ y при k → ∞ , и мы приходим к противоречию с предположением, что yδαk(δ k ) − y ≥ ε > 0 . Теорема доказана. Следствие.
Пусть δ = 0,
fδ = f ,
M α [ y ] = Ay − f
2
2
2
+ α ( y + y′ ) ,
[ a ,b ] ⎯→ y при α → 0 + 0 . y α = arg min M α [ y ] . Тогда y α ⎯C⎯ Доказательство предоставляется слушателям. О других способах выбора параметра регуляризации см. монографию: А.Н.Тихонов, А.В.Гончарский, В.В.Степанов, А.Г.Ягола. Численные методы решения некорректных задач. - М.: Наука, 1990.
Глава 2. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ. §1. Введение. В этой главе мы будем рассматривать задачи отыскания экстремумов (максимумов или минимумов) функционалов. Сразу отметим, что такие задачи относятся к числу важнейших задач современной математики и исследуются во многих математических курсах таких, как, например, «Экстремальные задачи», «Оптимальное управление», «Линейное программирование», «Выпуклое программирование» и некоторых других. Вариационное исчисление является классическим разделом математики, основы вариационного исчисления заложены еще в 17-ом веке. Функционалы, которые исследуются в вариационном исчислении, будут описаны ниже. Напомним, что функционал – это оператор, множество значений которого состоит из чисел. Мы будем рассматривать только вещественные функционалы, множествами значений которых являются вещественные числа. В дальнейшем вместо «вещественный функционал» мы будем говорить просто «функционал». Простейший пример - интеграл b
∫ y ( x)dx .
a
Каждой функции y(x), интегрируемой по Риману на отрезке [a, b], сопоставляется число – значение интеграла. Типичной задачей вариационного исчисления является задача Дьедонне: среди всех замкнутых плоских кривых заданной длины найти ту, которая ограничивает наибольшую площадь. Хорошо известно, что это окружность.
§2. Понятие вариации функционала. Мы будем изучать функционалы, действующие из линейного нормированного пространства Y в пространство вещественных чисел R1. В качестве пространства Y мы будем рассматривать следующие пространства: 1) C [a, b] – пространство непрерывных на [a, b] функций, в котором определена норма y C[ a ,b ] = max y ( x) . x∈[ a ,b ]
Напомним, что сходимость по норме этого пространства называется равномерной сходимостью на отрезке [a, b]. 2) C(1)[a, b] – пространство функций, непрерывных вместе со своими первыми производными на [a, b]. Норма в этом пространстве определяется как y C (1) [ a ,b ] = max y ( x) + max y ' ( x) . x∈[ a ,b ]
x∈[ a ,b ]
Можно ввести эквивалентную норму: y C [ a ,b ] = max{ y (1)
C [ a ,b ]
, y ' C [ a ,b ] }
(сходимость функциональных последовательностей по обеим введенным нормам одна и та же - равномерная сходимость на отрезке [a, b] как функций, так и их первых производных). Мы будем пользоваться только первой нормой. 3) C(p)[a, b] – пространство функций, непрерывных вместе со своими p-ми производными включительно на [a, b], нормированное с помощью p
y
C ( p ) [ a ,b ]
= ∑ max y ( k ) ( x) . k = 0 x∈[ a ,b ]
Сходимость по норме этого пространства – равномерная сходимость на отрезке [a, b] с производными до p-го порядка включительно. Итак, функционал V [ y ] : Y → R1 , где в качестве Y мы будем рассматривать только введенные выше функциональные пространства или их подмножества Y ' ⊆ Y , тогда V : Y ' → R1 . b
Приведем
пример
функционала:
V [ y ] = ∫ 1 + ( y ' ( x)) 2 dx
-
длина
кривой,
a
описываемой функцией y(x). V : C (1) [a, b] → R 1 Определение. Функционал V [ y ] называется непрерывным в точке y0 ∈ Y , если ∀ε > 0 ∃δ > 0 такое, что ∀y ∈ Y : y − y0 ≤ δ выполняется неравенство V [ y ] − V [ y 0 ] ≤ ε . Аналогично можно дать определение непрерывности функционала в точке y0 ∈ Y ' , если функционал рассматривается только на множестве Y ' . Функционал называется непрерывным на всём пространстве Y (множестве Y ' ), если он непрерывен в каждой точке Y (Y ' ) . Определение. Будем называть (замкнутым) шаром с центром в точке y0 и радиусом r > 0 множество точек: S r ( y0 ) = { y ∈ Y : y − y0 ≤ r} . Напомним, что точка y0 является точкой локального минимума (максимума) функционала V[y}, если найдется r > 0 такое, что V[y}≥ V[y0} (V[y}≤ V[y0}) для любого y ∈ S r ( y 0 ) (или y ∈ S r ( y0 ) ∩ Y ' , если речь идет о локальном минимуме на множестве Y ' . В дальнейшем мы будем говорить об отыскании только локальных минимумов или максимумов (локальных экстремумов), причем слово «локальный» мы будем опускать.
Пусть y0 ∈ Y - произвольная фиксированная точка, h ∈ Y - произвольный элемент Y. Рассмотрим функцию вещественной переменной t Φ (t ) ≡ V [ y 0 + th] , t – вещественное число. d Определение. Если существует Φ ' (t ) t =0 = V [ y 0 + th]t =0 для любого h ∈ Y , то эта dt производная называется вариацией функционала V в точке y0 и обозначается δV ( y 0 , h) . Очевидно, что V [ y 0 + th] − V [ y 0 ] = tδV ( y 0 , h) + o( t ) . Для того, что разъяснить смысл введенного понятия, вспомним математический анализ и рассмотрим случай, когда V : R n → R 1 (функция многих переменных). Тогда d Φ ' (t ) t =0 = V [ y 0 + th]t =0 называется производной функции V по направлению h. dt Теперь определим, что такое дифференцируемый функционал. Функционал V[y] если для любого h ∈Y называется дифференцируемым в точке y0, V [ y 0 + h] − V [ y 0 ] = dV ( y 0 , h) + o( h ) , где dV ( y 0 , h) - линейный и непрерывный по h функционал (который иногда называют сильной вариацией в точке y0 в отличие от функционала (от h) δV ( y 0 , h) , называемого в этом случае слабой вариацией в точке y0). Заметим, что точно такое же определение дифференцируемости вводилось и в курсе математического анализа для функций многих переменных V : R n → R 1 . При этом доказывалось, что, если функция многих переменных дифференцируема в точке y0, то в этой точке существуют производные по всем направлениям. Обратное, вообще говоря, неверно. Точно такая же ситуация и в вариационном исчислении - если существует сильная вариация, то существует и вариация (слабая вариация). Обратное неверно. Мы будем использовать только данное выше определение вариации d δV ( y 0 , h) = V [ y 0 + th]t =0 . dt Теорема (необходимое условие экстремума). Пусть y0 ∈ Y - точка экстремума
V [ y ] и существует δV ( y 0 , h) для всякого h ∈ Y . Тогда δV ( y 0 , h) = 0 . Доказательство. Пусть y 0 для определённости точка минимума функционала V [ y ] , для максимума доказательство аналогично. Тогда существует шар S r ( y 0 ) , r > 0 , r , то y 0 + th ∈ S r ( y 0 ) и такой, что V [ y ] ≥ V [ y 0 ] для любого y ∈ S r ( y 0 ) . Если t ≤ h V [ y 0 + th] ≥ V [ y 0 ] . Определим Φ (t ) = V [ y 0 + th] . Тогда для тех же t выполнено неравенство Φ (t ) ≥ Φ (0) . По условию теоремы Φ (t ) дифференцируема в точке t=0, а, следовательно, Φ ' (t ) t =0 = 0 . Таким образом, δV ( y 0 , h) = 0 , что и требовалось доказать. Теорема справедлива и в случае, когда функционал рассматривается на множестве Y ' ⊆ Y , но для таких h∈Y, что y0 + th ∈ Y ' по крайней мере для достаточно малых t. В этом случае нужно соответствующим образом изменить и определение вариации.
§3. Простейшая задача вариационного исчисления (задача с закреплёнными концами). Будем рассматривать множество функций Y ' ⊆ Y = C (1) [a, b] такое, что: Y ' = { y ∈ C (1) [a, b], y (a) = y 0 , y (b) = y1 } . Числа y0, y1 заданы. Тем самым, рассматривается множество непрерывно дифференцируемых на [a, b] функций, у которых известны значения на концах отрезка (концы закреплены). Будем рассматривать функционал b
V [ y ] = ∫ F ( x, y, y ' )dx . a
Простейшая задача вариационного исчисления (задача с закрепленными концами): найти экстремум этого функционала на множестве Y’. В вариационном исчислении принята следующая терминология. Будем говорить, что на функции y 0 ( x) достигается сильный минимум, если V [ y ] ≥ V [ y 0 ] для всякого y∈E’ из окрестности y0 в метрике пространства С[a, b] : max y ( x) − y 0 ( x) ≤ r , r > 0 (шар с x∈[ a ,b ]
центром в y0 радиуса r). Определение слабого минимума дается аналогично, но окрестность выбирается в метрике C (1) [a, b] :
max y ( x) − y 0 ( x) + max y ' ( x) − y 0 ' ( x) ≤ r , r > 0 .
x∈[ a ,b ]
x∈[ a ,b ]
В первом случае требуется, чтобы функции y(x) были равномерно «близки» к функции y0(x), а во втором случае дополнительно требуется равномерная «близость» и первых производных. Очевидно, что, если функционал имеет сильный минимум в точке y 0 (x), то он имеет и слабый минимум в той же точке. Обратное, вообще говоря, неверно. Определения слабого и сильного максимума даются аналогично. Необходимое условие экстремума, полученное в предыдущем параграфе, δV ( y 0 , h) = 0 , справедливо как для слабого, так и для сильного экстремума. Получим необходимое условие для задачи с закрепленными концами. Для этого посчитаем вариацию d δV ( y 0 , h) = V [ y + th]t =0 . dt b d d Cначала вычислим производную V [ y + th] = ∫ F ( x, y + th, y '+th' )dx , предполагая, что dt dt a функция F имеет все необходимые для этого непрерывные частные производные. Относительно h( x) ∈ C (1) [a, b] потребуем, чтобы y ( x) + th( x) ∈ Y ' . Отсюда h(a) = 0; h(b) = 0 . Перейдем к вычислению производной b
d V [ y + th] = ∫ [ Fy ( x, y + th, y '+th' )h + Fy ' ( x, y + th, y '+th' )h' ]dx . dt a Полагая t=0 и приравнивая нулю получившуюся вариацию, получаем, что для функции y (x) , на которой достигается экстремум, имеет место b
δV ( y, h) = ∫ [ Fy ( x, y, y ' )h + Fy ' ( x, y, y ' )h' ]dx = 0 . a
Разобьем интеграл на два и проинтегрируем по частям второй: b b d b ∫ Fy ' h' dx = Fy ' h a − ∫ Fy ' h dx . 123 a dx a =0
b
Подстановка Fy ' h a = 0, так как h(a) = h(b) = 0. Объединяя оба интеграла в один, получаем b
d Fy ' )h dx = 0 . dx a Ниже мы докажем, что, если этот интеграл равен нулю для любой функции h( x) ∈ C (1) [a, b] , обращающейся в нуль на концах отрезка h(a ) = h(b) = 0 , то d ( Fy − Fy ' ) ≡ 0 , при условии, что в скобках стоит непрерывная функция. Поэтому в dx качестве необходимого условия экстремума для задачи с закрепленными концами мы получаем следующую краевую задачу для уравнения Эйлера: d ⎧ ⎪( Fy − Fy ' ) = 0 . dx ⎨ ⎪⎩ y (a) = y 0 , y (b) = y1
∫ (F
y
−
Теорема (Необходимое условие экстремума для задачи с закрепленными концами). 1) Пусть y (x) осуществляет экстремум (сильный или слабый) в задаче с закреплёнными концами и дважды непрерывно дифференцируема. 2) Функция F ( x, y, y ' ) обладает непрерывными частными производными до второго порядка включительно. Тогда y (x) является решением краевой задачи для уравнения Эйлера d ⎧ ⎪( Fy − Fy ' ) = 0 , dx ⎨ ⎪⎩ y (a) = y 0 , y (b) = y1 или Fy − Fy ' x − Fy ' y y '− Fy ' y ' y" = 0; y (a) = y 0 , y (b) = y1 . Теорема уже доказана. Основная лемма вариационного исчисления. Пусть ϕ (x) - фиксированная b
непрерывная
на
[ a , b]
функция,
и
∫ ϕ ( x)h( x)dx = 0
для
всякой
непрерывно
a
дифференцируемой функции h(x) такой, что h(a ) = h(b) = 0 . Тогда ϕ ( x) ≡ 0 . Доказательство. Пусть ϕ (x) неравна нулю тождественно. Не ограничивая общности, будем считать, что эта функция принимает положительные значения (если ϕ ( x) ≤ 0 для всех x∈[a, b], то заменим ϕ (x) на − ϕ (x) ) Тогда в силу непрерывности ϕ (x) существуют точка x 0 ∈ ( a, b) такая, что ϕ ( x0 ) > 0 , и интервал [ x0 − δ , x0 + δ ] ⊆ (a, b), δ > 0 такой, что ϕ ( x) ≥
ϕ ( x0 )
для любого x ∈ [ x0 − δ , x0 + δ ] . 2 Пусть теперь h(x) - непрерывно дифференцируемая функция такая, что: ⎧h( x) ≡ 0, x ∉ ( x 0 − δ , x0 + δ ); ⎨ ⎩h( x) > 0, x ∈ ( x 0 − δ , x0 + δ ). x0 +δ x +δ b ϕ ( x0 ) 0 h( x)dx > 0 , что приводит к противоречию с Тогда ∫ ϕ ( x)h( x)dx = ∫ ϕ ( x)h( x)dx ≥ ∫ 2 a x0 −δ x0 −δ условием Теоремы. В качестве примера функции h(x), удовлетворяющей записанным выше условиям, можно привести ⎧( x − ( x0 − δ )) 2 ( x − ( x 0 + δ )) 2 , x ∈ ( x 0 − δ , x0 + δ ); h( x ) = ⎨ , x ∉ ( x 0 − δ , x0 + δ ). ⎩ 0
Приведем некоторые простые примеры: π
1. Пусть V [ y ] = ∫ y 2 dx , а граничные условия 0
а) y (0) = 0, y (π ) = 0 . Уравнение Эйлера в этом случае имеет вид 2 y = 0, Его решение, удовлетворяющее граничным условиям, y=0. На этом решении, очевидно, достигается минимум функционала. Если же граничные условия имеют вид б) y (0) = 0, y (π ) = 1 , то краевая задача для уравнения Эйлера не имеет решения в классе непрерывно дифференцируемых функций. π
2. Пусть V [ y ] = ∫ ( y 2 − ( y ') 2 ) dx , а граничные условия 0
y (0) = 0, y (π ) = 0 . Уравнение Эйлера в этом случае имеет вид y"+ y = 0 . Его общее решение y = C1 sin x + C 2 cos x . Краевая задача имеет бесконечно много решений ( C2 = 0 , C1 - произвольная постоянная). Рассмотрим некоторые частные случаи зависимости функции F ( x, y , y ' ) от своих аргументов. 1) F ( x, y , y ' ) = F ( x, y ) . Уравнение Эйлера имеет вид F y ( x, y ) = 0 .
Это уравнение не является дифференциальным, поэтому его решение (если оно существует), вообще говоря, не удовлетворяет граничным условиям y (a) = y 0 ; y (b) = y1 . Решение краевой задачи для уравнения Эйлера, вообще говоря, не существует. 2) F ( x, y, y ' ) = M ( x, y ) + N ( x, y ) y ' (линейность по y'). Уравнение Эйлера имеет вид d M y + y' N y − N ( x, y ) = M y + y ' N y − N x − y ' N y = 0, dx или M y − Nx = 0 . Полученное уравнение не является дифференциальным. Краевая задача для уравнения Эйлера, вообще говоря, не имеет решения. 3) F = F ( y ' ) . Уравнение Эйлера имеет вид Fy ' y ' y" = 0. Отсюда получаем два уравнения: y"= 0 (его общее решение y = C1 x + C 2 , C1, C2 – произвольные постоянные) и F y ' y ' ( y ' ) = 0. Если ki – корни последнего уравнения, то соответствующие решения уравнения Эйлера ~ y' = k i ⇒ y = k i x + Ci . Итак, решениями уравнения Эйлера являются прямые. Рассмотрим функционал l[ y ] =
x1
∫
1 + ( y ' ( x)) 2 dx;
y ( x0 ) = y 0 ; y ( x1 ) = y1 (длина кривой,
x0
соединяющей две точки на плоскости). Сказанное выше описывает известный факт, что
среди всех кривых, соединяющих две точки плоскости ( x0 , y 0 ), ( x1 , y1 ) , минимальную длину имеет отрезок прямой. 4) F = F ( x, y ' ) . Уравнение Эйлера имеет вид d F y ' ( x, y ' ) = 0 dx или F y ' ( x, y ' ) = C . 5) F = F ( y , y ' ) . Уравнение Эйлера имеет вид Fy − Fy ' y y ′ − Fy ' y ' y" = 0 , или d ( F − y ' F y ' ) = 0. dx Это уравнение, очевидно, имеет первый интеграл F − y ' Fy ' = C.
Рассмотрим теперь классическую задачу о брахистохроне - кривой, по которой материальная точка в поле тяжести скатывается за наименьшее время из точки (0, 0) в точку ( x1 , y1 ) . Эта задача была решена Иоганном Бернулли еще в 1696 году. Для упрощения рассмотрения на плоскости (x, y) ось y направлена вниз. В том же направления действует и сила тяжести. Заметим, что при движении в поле силы тяжести dS = 2gy ; S - длина пути, g – ускорение свободного падения. dt С другой стороны dS = 1 + ( y ' ) 2 dx. y=y(x) – траектория движения материальной точки. Время движения по траектории y=y(x) равно
T [ y] =
1
x1
1 + ( y' ) 2
2g
0
y
∫
dx.
Найдем траекторию y=y(x), для которой функционал T[y] принимает минимальное значение. Заметим, что подынтегральная функция не зависит явно от x, и вместо уравнения Эйлера запишем сразу его первый интеграл. F − y ' Fy ' = C , или 1 + ( y' ) 2 y
−
( y' ) 2 y (1 + ( y ' ) 2 )
= C.
Отсюда 1 y (1 + ( y ' ) 2 )
Вводя параметр t:
= C ; y (1 + ( y ' ) 2 ) = C1 . y ' = ctg t ,
находим
y= Теперь найдем x:
C1 C = C1 sin 2 (t ) = 1 (1 − cos(2t )). 2 2 1 + ctg (t )
C dy 2C1 sin t cos t dt = = 2C1 sin 2 t dt = C1 (1 − cos 2t ) dt ; x − C 2 = 1 (2t − sin 2t ). 2 y' ctg t Из выражений для x(t), y(t) и условия y (0) = 0 , находим C 2 = 0 . После замены 2t = t1 ≥ 0 C ~ и 1 = C1 получаем уравнение брахистохроны 2 ~ x = C1 (t1 − sin t1 ); ~ y = C1 (1 − cos t1 ). ~ Итак, брахистохрона – это циклоида. C1 находится из условия y ( x1 ) = y1 . Рассмотрим теперь задачу с закрепленными концами для функционала: dx =
b
∫ F ( x, y, y ' ,...., y
(n)
) dx.
a
Граничные условия имеют вид: y (a ) = y 0(1) , y (b) = y 0( 2) ; y ' (a ) = y1(1) , y ' (b) = y1( 2) ; ............... y ( n −1) (a ) = y n(1−)1 , y ( n −1) (b) = y n( 2−)1 . Напишите сами (!!!) уравнение Эйлера для этой задачи. Пусть теперь функционал имеет вид b
V [ y ] = ∫ F ( x, y1 ,... y n ; y1′ ,... y n′ ) dx, a
y = ( y1 ,... y n ) - вектор-функция. Рассмотрим задачу с закрепленными концами: y i (a ) = Ai ; y i (b) = Bi , где i = 1,...n; Ai , Bi - заданные числа.
Теорема. Пусть: 1) Функции y1 ( x),... y n ( x) осуществляют экстремум функционала
V [ y ] в задаче с закрепленными концами и дважды непрерывно дифференцируемы на отрезке [a, b] . 2) F ( x, y1 ,... y n ; y1′ ,... y ′n ) имеет непрерывные частные производные до второго порядка включительно. Тогда y1 ( x),... y n ( x) удовлетворяют системе уравнений Эйлера: d ⎧ ⎪ Fy i − Fy i′ = 0 , где i = 1,...n . dx ⎨ ⎪⎩ yi (a ) = Ai ; yi (b) = Bi ; Для доказательства сформулированного выше необходимого условия экстремума достаточно заметить, что если вектор-функция y(x)=( y1 ( x),... y n ( x) ) осуществляет
экстремум функционала V [ y ] в задаче с закрепленными концами в случае, когда можно менять все компоненты вектор-функции, то эта же вектор-функция осуществляет экстремум V [ y ] в случае, когда меняется одна компонента, а остальные фиксированы. Отсюда немедленно следует, что y(x) удовлетворяет записанной выше системе уравнений Эйлера. Пример. Рассмотрим пример из механики. n материальных точек, имеющих массы mi и координаты ( xi , y i , z i ) (i=1, …, n), движутся под действием сил
⎛ ∂u ∂u ∂u ⎞ ⎟⎟, ,− ,− Fi = ⎜⎜ − x y z ∂ ∂ ∂ i i i ⎠ ⎝
порожденных потенциальной функцией u = u ( x1 , y1 , z1 ,...x n , y n , z n ). Считая, что координаты точек зависят от времени t, заметим, что кинетическая энергия системы материальных точек имеет вид n m 2 2 2 ∑ i (( xi′ ) + ( y i′ ) + ( z i′ ) ). i =1 2 Введем функционал действия t2
∫ L dt
,
t1
где L – функция Лагранжа: L = T − u, или n m L = ∑ i ( xi′ ) 2 + ( yi′ ) 2 + ( z i′ ) 2 − u ( x1 , y1 , z1 ,...xn , y n , z n ). i =1 2
(
)
По принципу наименьшего действия (принцип Гамильтона) материальные точки движутся t2
по траекториям, для которых значение функционала
∫ L dt
минимально.
t1
t2
Система уравнений Эйлера для функционала
∫ L dt
имеет вид:
t1
⎧ ∂L d ∂L =0 − ⎪ ′ x dt x ∂ ∂ i i ⎪ ⎪ ∂L d ∂L = 0 , где i = 1,..., n . − ⎨ ′ y dt y ∂ ∂ i i ⎪ ⎪ ∂L d ∂L =0 − ⎪ ⎩ ∂z i dt ∂z i′ Вычисляя производные, получаем систему уравнений движения (к которым нужно добавить начальные условия): ⎧ ∂u ; ⎪mi xi′′ = − x ∂ i ⎪ ⎪ ∂u ; где i = 1,..., n . ⎨mi y i′′ = − ∂y i ⎪ ⎪ ∂u ; ⎪mi z i′′ = − ∂z i ⎩ Студентам предлагается самим (!!!) получить первый интеграл этой системы - закон сохранения энергии: T + u = const.
§4. Задачи на условный экстремум. Рассмотрим задачу об отыскании экстремума функционала b
V [ y, z ] = ∫ F ( x, y, z , y ′, z ′) dx , где y = y ( x ),
a
z = z ( x ) , с граничными условиями y (a ) = y0 ; z (a ) = z 0 ;
y (b ) = y1 ; z (b ) = z1 . Кроме того, предположим, что функции y = y ( x ), z = z ( x ) удовлетворяют уравнению связи Φ ( x, y, z , y ′, z ′) = 0 . Поскольку Φ зависит не только от функций y = y ( x ), z = z ( x ) , а и от их первых производных, такая связь называется неголономной. Теорема (Необходимое условие экстремума для задачи с закрепленными концами и неголономной связью). Пусть: 1) y ( x), z ( x) осуществляют экстремум V [ y, z ] в задаче с закрепленными концами и неголономной связью и дважды непрерывно дифференцируемы на [a,b]; 2) F , Φ имеют непрерывные частные производные до второго порядка включительно, причем Φ z′ ≠ 0 . Тогда существует дифференцируемая функция λ (x ) , такая, что y ( x), z ( x) удовлетворяют системе уравнений Эйлера для b
функционала
∫ H (x, y, z, y′, z′) dx , где H = F + λ (x)Φ : a
d ⎧ ⎪ Fy + λ Φ y − dx (Fy′ + λ Φ y′ ) = 0; ⎪ ⎪ F + λ Φ − d (F + λ Φ ) = 0; z z′ z′ ⎪⎪ z dx ⎨ ⎪ ⎪Φ ( x, y, z , y ′, z ′) = 0; ⎪ y (a ) = y ; y (b ) = y ; 0 1 ⎪ ⎪⎩ z (a ) = z 0 ; z (b ) = z1 .
Доказательство. Рассмотрим функционал V [ y + th1 ( x ), z + th2 ( x )], где h1 ( x ), h2 ( x ) непрерывно дифференцируемые функции, удовлетворяющие граничным условиям: h1 (a ) = h1 (b ) = 0;
h2 (a ) = h2 (b ) = 0; Посчитаем вариацию V и приравняем ее нулю: d V [ y + th1 ( x ), z + th2 ( x )] t =0 = δV ( y, z , h1 , h2 ) = 0. dt Так же, как в предыдущем параграфе, после интегрирования по частям (подстановки обращаются в нуль в силу граничных условий для h1 ( x ), h2 ( x ) ) получаем: b b b d d ⎛ ⎞ ⎛ ⎞ δV = ∫ (Fy h1 + Fy′ h1′ + Fz h2 + Fz′ h2′ )dx = ∫ ⎜ Fy − Fy′ ⎟h1dx + ∫ ⎜ Fz − Fz′ ⎟h2 dx = 0. dx ⎠ dx ⎠ a a⎝ a⎝ Если бы h1 ( x ), h2 ( x ) были бы независимыми, то мы получили бы систему уравнений Эйлера. Однако h1 ( x ), h2 ( x ) подчиняются (по крайней мере, для малых t) уравнению связи Φ[x, y + th1 , z + th2 , y ′ + th1′, z ′ + th2′ ] = 0 .
Получим уравнение, решая которое, мы сможем выразить h2 ( x ) Продифференцируем записанное выше равенство по t и положим t=0: dΦ = 0; dt t =0 или Φ y h1 + Φ y′ h1′ + Φ z h2 + Φ z′ h2′ = 0 .
через
h1 ( x ) .
Т.к. Φ z′ ≠ 0 , то Φy Φ y′ Φz h2 − h1 − h1′ . Φ z′ Φ z′ Φ z′ Φ y′ Φy Φ , b1 = − , тогда получим следующую задачу Коши Обозначим a 2 = − z , a1 = − Φ z′ Φ z′ Φ z′ для отыскания h2 ( x ) при условии, что h1 ( x ) задано: ⎧h2′ = a 2 h2 + (a1h1 + b1h1′ ); ⎨ ⎩h2 (a ) = 0. Уравнение, которому удовлетворяет h2 ( x ) , является линейным дифференциальным уравнением первого порядка. Общее решение этого уравнения хорошо известно из курса дифференциальных уравнений (например, может быть найдено методом вариации постоянной). Найдите сами (!!!) это общее решение и покажите, что решение задачи Коши имеет вид: x ⎞ ⎛x h2 = ∫ (a1h1 + b1h1′ )exp⎜ ∫ a2 dη ⎟dξ . a ⎠ ⎝ξ Итак, мы выразили h2 ( x ) через h1 ( x ) . Подставляя это выражение во второй интеграл в формуле для вариации, после простых преобразований (изменение порядка интегрирования по x и ξ) получаем: a x a b ⎞ ⎛x ⎞ ⎛x ⎟ ⎜ ⎟ ⎜ d d ⎛ ⎞ ⎛ ⎞ ⎜ Fz − Fz ′ ⎟dx (a1h1 + b1h1′ )exp⎜ a2dη ⎟dξ = (a1h1 + b1h1′ )dξ ⎜ Fz − Fz ′ ⎟ exp⎜ a2dη ⎟dx dx dx ⎝ ⎠ ⎝ ⎠ ⎟ ⎜ξ ⎟ ⎜ξ ξ b a b ⎠ ⎝ ⎠ ⎝ h2′ = −
∫
∫
b
=
∫
b
⎡ ( a1h1 + b1h1′ )γ (ξ )dξ = ⎢a1γ ∫ ∫ a
a
⎣
−
∫
∫
∫
d (b1γ )⎤⎥ h1dξ , dx ⎦
d ⎞ ⎛x Fz′ ) exp⎜ ∫ a 2 dη ⎟dx. Переобозначив переменную интегрирования dx ξ ⎠ ⎝ξ вместо ξ), окончательно получим b
где γ (ξ ) = ∫ ( Fz −
b
∫
⎡
d
d
⎤
δV = ⎢ Fy − Fy ′ + a1 γ − (b1γ )⎥ h1( x ) dx = 0. dx dx ⎣ ⎦ a
⎛x Φ ⎞ d Fz ' ) exp⎜ ∫ z dη ⎟dξ . ⎜ Φ z' ⎟ dξ x ⎝ξ ⎠ По основной лемме вариационного исчисления: d d Fy − Fy′ + a1 γ − (b1γ ) = 0 . dx dx Вспомнив, что такое a1 и b1 , получим b
Здесь γ ( x) = ∫ ( Fz −
(x
a1γ − Обозначим λ ( x) = −
γ ( x) Φ z'
Φy d d ⎛ Φ y' ⎞ (b1γ ) = − γ − ⎜⎜ − γ ⎟. Φ z' dx dx ⎝ Φ z ' ⎟⎠
. Очевидно, что λ (x) - дифференцируемая функция.
Тогда
d d (b1γ ) = λΦ y − ( λΦ y ' ) , dx dx и равенство нулю вариации приводит к уравнению d d Fy ' + λΦ y − (λΦ y ' ) = 0 , Fy − dx dx или d Fy + λΦ y − ( Fy ' + λΦ y ' ) = 0 . dx Мы получили первое из уравнений Эйлера, сформулированных в условиях теоремы. Перепишем второе уравнение таким образом: ⎛Φ ⎞ d d ⎛ ⎞ (λΦ z ' ) = ⎜⎜ z ⎟⎟(λΦ z ' ) + ⎜ Fz − Fz ' ⎟ dx dx ⎠ ⎝ ⎝ Φ z' ⎠ a1γ −
Рассмотрим это уравнение относительно λΦ z ' . Тогда
⎛x ⎞ ⎜ Φz ⎟ d λΦ z ' = ( Fz − Fz ' ) exp⎜ dη ⎟ dξ dξ ⎜ ξ Φ z' ⎟ b ⎝ ⎠ является его решением. Осталось сравнить полученное выражение с выведенной ранее формулой для γ ( x) = −λΦ z ' . Тем самым, второе уравнение из системы уравнений Эйлера тоже выполнено. Теорема доказана. Рассмотрим теперь задачу с голономной связью. Требуется найти экстремум функционала x
∫
∫
b
V [ y, z ] = ∫ F ( x, y, z , y ' , z ' )dx a
при выполнении граничных условий y (a ) = y0 ; y (b) = y1 ; z (a ) = z 0 ; z (b) = z1 ; и уравнения связи Φ ( x, y, z ) = 0 . Граничные условия нельзя считать независимыми, поскольку Φ (a, y 0 , z 0 ) = 0 ; Φ (b, y1 , z1 ) = 0 . Как и ранее, введем функцию H = F + λ (x)Φ и функционал b
∫ H ( x, y, z, z ' , y' ) dx . a
В отличие от задачи с неголономной связью теперь Φ z ' ≡ 0. Поэтому предположим, что Φ z ≠ 0 . Система уравнений Эйлера в данном случае имеет вид: d ⎧ ⎪⎪( Fy + λΦ y ) − dx Fy′ = 0; ⎨ ⎪( F + λΦ ) − d F ′ = 0. z z ⎪⎩ z dx
Теорема (Необходимое условие экстремума для задачи с закрепленными концами и голономной связью). Пусть: 1) функции y (x) и z (x) реализуют экстремум в поставленной выше задаче с голономной связью и дважды непрерывно дифференцируемы; 2) функция F непрерывна со своими частными производными до второго порядка включительно; 3) функция Φ непрерывна со своими частными производными, причем Φ z ≠ 0 . Тогда существует непрерывная функция λ (x ) такая, что y ( x) и z ( x) удовлетворяют системе уравнений, записанной выше. Доказательство. Выражение для вариации функционала получено при доказательстве предыдущей теоремы и имеет следующий вид: b d d δV = ∫ [( Fy − Fy′ )h1 + ( Fz − Fz′ )h2 ]dx = 0 . dx dx a Выразим теперь h2 через h1 из соотношения Φ y h1 + Φ z h2 = 0, полученного также, как и в предыдущей теореме. Отсюда легко находим Φy h2 = − h1 , Φz (используем условие Φ z ≠ 0 ). Подставляя h2 в выражение для вариации и применяя основную лемму вариационного исчисления, получаем уравнение Φy d d Fy′ ) − ( Fz − ( Fy − Fz′ ) = 0. dx dx Φz d Fz − Fz′ dx , получаем первое уравнение из системы уравнений Эйлера. Полагая λ = − Φz Второе уравнение системы – это записанное выше определение λ . Очевидно, что λ = λ ( x) - непрерывная функция. Теорема доказана. В качестве простого примера рассмотрим задачу об отыскании так называемых геодезических линий. Пусть уравнение Φ ( x, y, z ) = 0 задаёт некоторую поверхность в трёхмерном пространстве. Пусть на данной поверхности фиксированы две точки; поставим задачу отыскания геодезической линии, т.е. кривой минимальной длины, соединяющей эти точки. Если предположить, что уравнение кривой допускает введение параметризации с помощью параметра x, то данная задача сводится к минимизации функционала b
V [ y, z ] = ∫ 1 + ( y′) 2 + ( z ′) 2 dx. a
В заключение параграфа рассмотрим так называемую изопериметрическую задачу. Пусть требуется найти экстремум функционала b
V [ y ] = ∫ F ( x, y, y′)dx a
при выполнении граничных условий: y (a) = y0 ; y (b) = y1 ; и дополнительного условия: b
I [ y ] = ∫ G ( x, y, y ′)dx = l a
(функционал I [ y ] имеет заданное значение).
Задача называется изопериметрической, т.к. если: b
I [ y] =
∫
1 + ( y ′) 2 dx = l ;
a
то требуется найти кривую, на которой достигается экстремум функционала V [ y ] , проходящую через заданные точки, причем длина кривой (ее периметр) задана. Для того, чтобы применить полученные в данном параграфе результаты, введем новую функцию x
z ( x) = ∫ G ( x, y, y ′)dx. a
Очевидно, что z (a) = 0, z (b) = l. Перепишем изопериметрическую задачу в следующем виде: найти экстремум функционала b
V [ y, z ] = ∫ F ( x, y, y ′)dx a
при выполнении граничных условий y (a ) = y0 , y (b) = y1 , z (a) = 0, z (b) = l ; и уравнения неголономной связи Φ ( x, y, z , y ′, z ′) ≡ − z ′ + G ( x, y, y ′) = 0 . b
Запишем систему уравнений Эйлера для функционала
∫ Hdx , где H = F + λΦ : a
d ⎧ ⎪⎪( Fy + λG y ) − dx ( Fy′ − λG y′ ) = 0; ⎨ ⎪ d λ = 0. ⎪⎩ dx Обратите внимание на второе уравнение, из которого следует, что λ = const . Теорема (Необходимое условие экстремума для изопериметрической задачи с закрепленными концами). Пусть: 1) y ( x) реализует экстремум функционала b
V [ y ] = ∫ F ( x, y, y′)dx и дважды непрерывно дифференцируема;
2) функции F и G
a
непрерывны вместе со своими производными до второго порядка включительно. Тогда существует λ = const такое, что y ( x) удовлетворяет уравнению Эйлера для функционала: b
∫ Hdx , где H = F + λG . a
Доказательство следует немедленно из теоремы о необходимом условии для задачи с закрепленными концами и неголономной связью. Рассмотрим теперь задачу отыскания кривой заданной длины, ограничивающей b
максимальную
площадь.
В
этом
случае,
F=y,
V [ y ] = ∫ ydx ,
G = 1 + ( y′) 2 ,
a
H = y + λ 1 + ( y′) 2 , λ = const . Первый интеграл для уравнения Эйлера имеет вид: H − y′H y′ = C1 , или
y + λ 1 + ( y′) 2 − y′λ Приводя подобные члены, имеем
y′ 1 + ( y′) 2
= C1 .
y − C1 = −λ
1
. 1 + ( y′) 2 Введём вспомогательный параметр t : y′ = tg t . Тогда y − C1 = −λ cos t . Найдем x(t): dy λ sin t dx = = dt = λ cos tdt ⇒ x − C2 = λ sin t . y′ tgt Исключая параметр t, получим уравнение окружности ( x − C2 ) 2 + ( y − C1 ) 2 = λ2 . Параметры C1 , C2 и λ можно найти из системы: ⎧( x − C 2 ) 2 + ( y − C1 ) 2 = λ2 ; ⎪ ⎪⎪ y (a ) = y0 ; ⎨ y (b) = y1 ; ⎪b ⎪∫ Gdx = l. ⎪⎩a
§5. Задачи с подвижной границей. Рассмотрим задачу минимизации функционала x1
V [ y ] = ∫ F ( x, y, y ′)dx a
при условии, что левый конец функции, на которой достигается экстремум, закреплен: y (a ) = y 0 ,
а правый может перемещаться вдоль заданной кривой y = ϕ (x ) (см. рисунок, x1 - абсцисса точки пересечения кривых y ( x ) и ϕ ( x ) , x∈[a, b]). y
ϕ(x)
y(x)
y0
a
x1
x
Пример: пусть требуется найти расстояние от точки на плоскости с координатами (a, y0) до кривой y = ϕ (x ) . Задача сводится к минимизации функционала
Введем функционал B[ y ] :
x1
∫
1 + ( y ′) dx . 2
a
x1 = B[ y ] . Теорема (Необходимые условия экстремума для задачи с левым закрепленным и правым подвижным концами). Пусть 1) y ( x ) осуществляет экстремум в поставленной выше задаче с подвижной границей и дважды непрерывно дифференцируема; 2) F – функция, непрерывная со своими частными производными до второго порядка включительно; 3) ϕ ( x ) непрерывна с первой производной. Тогда: 1) y ( x ) d удовлетворяет уравнению Эйлера Fy − Fy′ = 0 ; 2) при x = x1 выполнено условие dx трансверсальности (F − ( y ′ − ϕ ′)Fy′ ) x = x1 = 0 .
Доказательство. Прежде всего, докажем, что выполняется уравнение Эйлера. На самом деле, если y (x) такова, что на ней реализуется экстремум функционала V[y] в классе функций, когда один конец закреплен, а другой подвижен, то на ней реализуется экстремум и в классе функций, когда оба конца закреплены (граничное условие на правом конце y(x1)=ϕ(x1), x1 – абсцисса точки пересечения функции, на которой достигается экстремум, с кривой y = ϕ (x ) ). Как доказано в параграфе 3 для задачи с закрепленными концами, в этом случае выполняется уравнение Эйлера. Посчитаем теперь вариацию функционала V. Зададим приращение h(x) и рассмотрим функцию переменной t:
V [ y + th ] =
B [ y + th ]
∫ F (x, y + th, y ′ + th′)dx . a
Посчитаем ее производную по t: d V [ y + th ] = dt
B [ y + th ]
d ∫ [F h + F h′]dx + F (B[ y + th], y(B ) + th(B ), y ′(B ) + th′(B )) ⋅ dt B[ y + th] . y
y′
a
Положим t = 0 , тогда y + th → y ( x ) , B[ y + th] t =0 = x1 . Вариация равна: x
[
]
1 d d δV = V [ y + th ] t =0 = ∫ Fy ( x, y, y ′)h + Fy′ ( x, y, y ′)h′ dx + F ( x1 , y ( x1 ), y ′( x1 ) ) ⋅ B[ y + th ] t =0 . dt dt a Интегрируя второй член в подынтегральном выражении по частям, используя граничное x1 d ⎛ ⎞ условие на левом конце h(a)=0 и равенство ∫ ⎜ Fy ( x, y, y ′) − Fy′ ( x, y, y ′) ⎟hdx = 0 , dx ⎠ a⎝ поскольку выполняется уравнение Эйлера, получим выражение для вариации и приравняем его нулю: dB δV = Fy′ ( x1 , y ( x1 ), y ′( x1 ) )h( x1 ) + F ( x1 , y ( x1 ), y ′( x1 ) ) ⋅ = 0. dt t =0 Обозначим B[ y + t ⋅ h] = B(t ) , причем B (0) = x1 . По определению B(t):
y (B(t ) ) + t ⋅ h(B(t ) ) ≡ ϕ (B(t ) ) , т.к. абсцисса точки пересечения кривой, записанной в левой части, с ϕ (x) есть B (t ) . Продифференцируем записанное тождество по t и получим: y ′(B(t ) )B ′(t ) + t ⋅ h ′(B(t ) )B ′(t ) + h(B(t ) ) = ϕ ′(B(t ) )B ′(t ) . Отсюда B ′(t ) =
1)
h(B(t ) ) ϕ ′(B(t ) ) − y ′(B(t ) ) − t ⋅ h′(B(t ) )
Рассмотрим два случая: Если ϕ ′( x1 ) ≠ y ′( x1 ) , т.е. ϕ ′(B (t ) ) − y ′(B (t ) ) t =0 ≠ 0 , то можно сделать предельный
переход при t → 0 :
h( x1 ) . ϕ ′(x1 ) − y ′( x1 ) В этом случае выражение для вариации имеет вид: B ′(0) =
⎧
δV = ⎨ F y ′
x = x1
+F
x = x1
⋅
⎫ 1 ⎬h( x1 ) = 0 . ϕ ′( x1 ) − y ′( x1 ) ⎭
⎩ Учитывая, что h(x1) – произвольное число, и сокращая на h(x1), получаем (F − ( y ′ − ϕ ′) Fy′ ) = 0 , x = x1
т.е. условие трансверсальности. 2) Если ϕ ′( x1 ) = y ′( x1 ) , то B ′(t ) ⎯t⎯ ⎯→ ∞ . Рассмотрим выражение для вариации: →0
dB = 0, dt t =0 а это возможно тогда и только тогда, когда F ( x1 , y ( x1 ), y ′( x1 ) ) = 0 . А это и есть условие трансверсальности в случае ϕ ′( x1 ) = y ′( x1 ) . Теорема доказана. Рассмотрим важный частный случай – задачу со свободным правым концом.
δV = F y ′ ⋅ h + F ⋅
y
y0
a
b
x
Пусть B(t ) = b , т.е. левый конец закреплен, а правый может перемещаться по прямой x = b (см. рисунок). В этом случае мы не можем ввести функцию ϕ (x) , т.к. уравнение dB границы x = b . Понятно, что = 0 . Повторяя рассуждения, приведшие нас к dt t =0 получению вариации в предыдущей теореме, имеем: δV = Fy′ ⋅ h(b) = 0 . Отсюда Fy′
x =b
= 0 - граничное условие в случае, когда правый конец свободен.
Рассмотрим теперь случай, когда функционал имеет вид: B[ y ]
V [ y ] = ∫ A( x, y ) 1 + ( y ′) 2 dx , a
и пусть функция A( x, y ) ≠ 0 и дифференцируема по x, y . В частности, при A ≡ 1 функционал V [ y ] определяет длину кривой. Условие трансверсальности в этом случае переходит в условие ортогональности y (x) к ϕ (x) . На самом деле, A( x1 , y ( x1 )) y ′( x1 ) A( x1 , y ( x1 )) 1 + ( y ′( x1 )) 2 − ( y ′( x1 ) − ϕ ′( x1 ) ) = 0. 1 + ( y ′( x1 )) 2 Приводя к общему знаменателю, после сокращения на ненулевые множители получаем 1 + ϕ ′( x1 ) y ′( x1 ) = 0 , откуда: 1 , y ′( x1 ) = − ϕ ′( x1 ) т.е. условие ортогональности. Если рассматривать задачу с подвижной границей, в которой правый конец закреплен, а левый – подвижен, то мы получим тот же результат, только с условием трансверсальности на левом конце. Теперь рассмотрим задачу, в которой оба конца являются подвижными: пусть левый конец функции, на которой осуществляется экстремум функционал V[y], может перемещаться вдоль кривой y=ϕ1(x), а правый конец вдоль кривой y=ϕ2(x)(см. рисунок).
y
y(x) ϕ2(x) ϕ1(x)
x1
x2
x
В этом случае должны выполнятся условия трансверсальности на правом и на левом концах. На самом деле, если функция y (x) такова, что на ней реализуется экстремум в классе функций, когда оба конца подвижны, то на ней реализуется экстремум и в классе функций, когда левый конец «правильно» закреплен, а правый подвижен. Из этого следует, что выполняется условие трансверсальности на правом конце (аналогичное утверждение справедливо и для левого конца). Очевидно (см. доказательство теоремы), что функция, на которой достигается экстремум, удовлетворяет уравнению Эйлера. В заключение параграфа рассмотрим пример. Пусть требуется найти экстремум функционала
1 + ( y ′) V [y] = ∫ dx y 0 при условии, что левый конец закреплен, а правый может перемещаться вдоль заданной прямой: y (0 ) = 0 ; y1 = x1 − 5 . Запишем первый интеграл уравнения Эйлера F − y ′Fy′ = C , x1
2
или
1 + ( y ′) y′ − y′ =C, 2 y y 1 + ( y ′) 2
или 2 1 = C y 1 + ( y ′) . ~ Введем параметр y ′ = tg t . Тогда y = C1 cos t . Для отыскания x(t) запишем ~ C1 sin t dt dy ~ dx = =− = −C1 cos t , y′ tg t откуда ~ ~ x = −C1 sin t + C 2 . Исключаем параметр t и получаем уравнение окружности (x − C1 )2 + y 2 = C 2 2 с центром в точке (C1 ,0 ) и радиусом C 2 . Из условия на левом конце находим
( x − C )2 + y 2 = C 2 .
Для отыскания константы C заметим, что для данного функционала условие трансверсальности совпадает с условием ортогональности кривых y=y(x) и y=ϕ(x).
Окружность ортогональна прямой лишь в случае, когда диаметр окружности лежит на этой прямой. Отсюда легко находим, что C = 5 , т.е. (x − 5)2 + y 2 = 25 , или y = ± 10 x − x 2 .
§6. Достаточное условие экстремума в задаче с закрепленными концами. Вернемся к задаче с закрепленными концами: найти минимум функционала x1
V [ y ] = ∫ F (x, y, y ′)dx ч0
при условии, что
y (x0 ) = y 0 ; y ( x1 ) = y1 . Необходимое условие экстремума было получено в параграфе 3. Получим теперь достаточное условие минимума (достаточное условие максимума получается аналогично). Конечно, можно попытаться исследовать знак d2 производной V [ y + th ] для всех допустимых h(x). Здесь же мы будем dt 2 t =0 использовать другой подход. Пусть на функции y = y ( x ) достигается минимум функционала V[y] для задачи с закрепленными концами: y ( x ) = y 0 , y ( x1 ) = y1 . Это означает, что V [~ y ] − V [ y ] ≥ 0 для всех ~ y (x ) в окрестности y ( x ) таких, что ~ ~ y ( x0 ) = y0 , y ( x1 ) = y1 . Функционал V [~ y ] мы можем рассматривать как криволинейный интеграл второго рода
V [~ y] =
x1
∫ F (x, ~y , ~y ′) dx = ∫~ F (x, y, y') dx
x0
C
~ y ( x ), x ∈ [x0 , x1 ] }. Введем кривую по кривой C = { ( x, y ) : y = ~
C = { ( x, y ) : y = y ( x ), x ∈ [x0 , x1 ] }
()
~ y ], I (C ) = V [ y ]. и обозначим I C = V [~ Нужно оценить знак выражения ~ I C − I (C ) = F (x, y, y ′)dx − F ( x, y, y ′)dx ,
()
∫
~ C
∫
C
точнее получить условия, при которых это выражение неотрицательно. Для этой цели преобразуем разность интегралов по двум, вообще говоря, различным кривым в интеграл по одной кривой. Будем считать, что функция y = y ( x ) содержится в центральном или собственном поле экстремалей. Экстремалью называется решение уравнения Эйлера. Пусть область G на плоскости (x,y) содержит кривую, заданную функцией y ( x ) . Если через каждую точку области G проходит и при том единственная функция, являющаяся решением уравнения Эйлера, то говорят, что множество таких экстремалей образует собственное поле. Поле экстремалей называется центральным, если выполнены те же условия, но все экстремали пересекаются в одной точке ( (x 0 , y 0 ) или (x1 , y1 ) ).
В обоих случаях можно однозначно определить функцию p ( x, y ) . p ( x, y ) - производная в точке x той экстремали y ( x ) , которая проходит через
точку ( x, y ) . В случае центрального поля функция p ( x, y ) определена везде в области G, кроме точки пересечения экстремалей (x 0 , y 0 ) или (x1 , y1 ) . y
G y1
y = y (x) y0 x0
x1
x
Определим интеграл ⎫ ⎧ ~ ⎛d ⎞ J C = ∫ ⎨ F ( x, y, p ( x, y ) ) + ⎜ y ( x) − p ( x, y ) ⎟ F p ( x, y, p ( x, y ) )⎬dx ~ C⎩ ⎝ dx ⎠ ⎭ ~ по кривой C ⊆ G . Заметим, что J (C ) = I (C ) = V [ y ] , так как y ( x ) принадлежит d полю экстремалей, поэтому y ( x) − p( x, y ) = 0 на кривой C . dx ~ Перепишем исследуемый интеграл J (C ) = ∫ F ( x, y, p ) − pF p dx + F p dy и
()
С~
[
]
заметим, что это криволинейный интеграл второго рода. Покажем, что под знаком интеграла стоит полный дифференциал. Для этого достаточно показать, что ∂ (F − pFp ) = ∂ Fp . ∂y ∂x Поскольку F ≡ F ( x, y, p ( x, y )) , имеем ∂ (F − pFp ) = Fy + Fp p y − Fp p y − p(Fpy + Fpp p y ), ∂y ∂ F p = F px + F pp p x . ∂x Через каждую точку ( x, y ) области G проходит экстремаль, поэтому в каждой точке ( x, y ) выполняется соотношение (уравнение Эйлера):
d ⎛ ⎞ = 0, ⎜ Fy − F p ( x, y, p ( x, y ))⎟ dx ⎝ ⎠ y= y(x )
y = y ( x ) - экстремаль (т.е. решение уравнения Эйлера), проходящая через заданную точку. Или
Fy − F px − F py p − F pp ( p x + p y p ) = 0 ,
()
∂ (F − pFp ) = ∂ Fp выполняется. Тем самым, интеграл J C~ ∂y ∂x не зависит от выбора пути интегрирования, и ~ V [ y ] = J C = ∫ {F ( x, y, p ) + ( y ′ − p ) ⋅ F p (x, y, p )}dx = I (C ) .
то есть равенство
()
~ C
Поэтому ~ ~ ~ ∆V = I (C ) − I (C ) = I (C ) − J (C ) = ∫ {F ( x, y, y ′) − F ( x, y, p ) − ( y ′ − p ) ⋅ F p ( x, y, p )}dx . C~
Определим теперь функцию Вейерштрасса: E ( x, y, y ′, p ) ≡ F ( x, y, y ′) − F ( x, y, p ) − ( y ′ − p ) ⋅ F p ( x, y, p ) .
Очевидно достаточное условие минимума: E ≥ 0 в окрестности y ( x ) . В зависимости от того, какая выбирается окрестность – слабая или сильная, мы получим слабый или сильный минимум. Сформулируем еще раз достаточное условие сильного (слабого) минимума: 1) y = y ( x ) удовлетворяет уравнению Эйлера; 2) y = y ( x ) может быть включена в собственное или центральное поле экстремалей; 3) E ( x, y, y ′, p ) ≥ 0 в сильной (слабой) окрестности y = y ( x ) . В случае сильного (слабого) максимума достаточно выполнение условия E ≤ 0. Получим еще одно достаточное условие минимума, которое легко проверить. Будем предполагать, что F ( x, y, y ′) дважды непрерывно дифференцируема по y ′ . Разложим эту функцию в ряд Тейлора в точке p (по третьему аргументу) с остаточным членом в форме Лагранжа: ( y ′ − p )2 F (x, y, q ), F ( x , y , y ′) = F ( x , y , p ) + ( y ′ − p ) ⋅ F y ′ ( x , y , p ) + y ′y ′ . 2 q ∈ [ p, y ′] или q ∈ [ y ′, p ]. Очевидно, что функция Вейерштрасса имеет вид ( y ′ − p )2 F ( x , y , q ) . E ( x, y, y ′, p ) = y ′y ′ 2 Для того, чтобы было выполнено условие E ≥ 0 , достаточно потребовать выполнения неравенства Fy′y′ > 0 на экстремали y = y ( x ) . Это условие Лежандра. Можно также требовать выполнения неравенства Fy′y′ ≥ 0 в (слабой
или сильной) окрестности y ( x ) . Сформулируйте сами (!!!) условие Лежандра для максимума). Рассмотрим пример. Пусть нам дана задача с закрепленными концами для функционала a
V [ y ] = ∫ ( y ′) dx 0
3
с граничными условиями y (0 ) = 0 , y (a ) = b , a > 0 , b > 0 . Из уравнения Эйлера y ′′ = 0 получаем, что y = C1 x + C 2 . Из граничных условий находим кривую, для которой выполняется необходимое условие экстремума:
b x. a Эта кривая может быть включена в центральное поле экстремалей – множество функций вида y = Cx (C – произвольная постоянная), или собственное поле b экстремалей - множество функций вида y = x + C (C – произвольная a постоянная Функция Вейерштрасса имеет вид 3 2 E ( x, y, y ′, p ) = ( y ′) − p 3 − ( y ′ − p )3 p 2 = ( y ′ − p ) ( y ′ + 2 p ) и обращается в нуль при y ′ = p , y ′ = −2 p . b b На решении y ( x ) = x , p = > 0 . Поэтому в слабой окрестности y ( x ) a a выполнено неравенство E ≥ 0 ; в сильной окрестности это неравенство, очевидно, не выполняется. Тем самым, функция y ( x ) реализует слабый минимум функционала V[y]. Еще легче проверить условие Лежандра: b Fy′y′ = 6 y ′ y = b x = 6 > 0 . a a В заключение скажем несколько слов о численных методах в вариационном исчислении: d 1) Прежде всего уравнение Fy − Fy′ = 0 с граничными условиями dx y ( x0 ) = y 0 , y ( x1 ) = y1 можно решать численными методами. 2) Можно использовать и следующий подход. Экстремум функционала y = y (x ) =
b
V [ y ] = ∫ F ( x, y, y ′)dx a
ищется на множестве функций вида y n = ∑ α n wn ( x ) , где wn ( x ) - заданные N
n =1
функции. Задача сводится к отысканию минимума (или максимума) функции N переменных. Очевидно, что max V [ y ] ≥ max ϕ (α 1 ,...α n ) ≥ min ϕ (α 1 ,...α n ) ≥ min V [ y ] . Можно применять и другие подходы. Из-за недостатка времени мы не можем рассмотреть их подробно. Эти методы изучаются в курсе “Численные методы”, а также в специальных курсах, посвященных численным методам решения экстремальных задач.