Глава 1 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ 1.1. Электромагнитное поле Принято считать, что в пространстве задано п...
32 downloads
257 Views
4MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Глава 1 ОСНОВНЫЕ СВОЙСТВА ЭЛЕКТРОМАГНИТНОГО ПОЛЯ 1.1. Электромагнитное поле Принято считать, что в пространстве задано поле некоторой величины, если в каждой точке пространства (или в некоторой его части) определено значение этой величины. Поле может быть скалярным или векторным в зависимости
от
характера
исследуемой
величины,
стационарным
(установившимся), если оно не меняется с течением времени в каждой точке пространства, или нестационарным (неустановившимся) в противном случае. Знаменитый английский учёный Джемс Клерк Максвелл (1831–1879), основатель
теоретической
электродинамики,
является
создателем
электромагнитной теории света. Развивая идею английского физика Майкла Фарадея о том, что взаимодействия между электрически заряженными телами осуществляются посредством электромагнитного поля, Д.К. Максвелл на основе обобщения эмпирических законов электрических и магнитных явлений в шестидесятых годах XIX века сформулировал фундаментальные уравнения классической
макроскопической
электродинамики,
описывающие
электромагнитные явления в произвольной среде. Французский физик Шарль Огюстен Кулон в 1785 году установил один из основных законов электростатики, определяющий силу взаимодействия между двумя "точечными" электрическими зарядами, в виде:
F =k
q1q2 , r2
(1.1)
где F – сила взаимодействия зарядов; q1 , q 2 – величины взаимодействующих зарядов;
r – расстояние
между
зарядами;
k – коэффициент
пропорциональности, величина которого определяется выбором системы единиц физических величин, входящих в это выражение; так, например, в системе единиц измерения физических величин СГС (сантиметр, грамм, секунда) коэффициент k полагается равным единице. Закон Кулона позволил 3
ввести понятие электрического поля. Силы электрического поля будут вполне определены, если в каждой точке этого поля определена сила, действующая на помещённый в ней единичный положительный заряд. Эта сила называется напряжённостью электрического поля и обычно обозначается буквой E . При q1 = q , а q 2 = 1 в соответствии с законом Кулона имеем
E =k
q r, r3
(1.2)
где r – радиус-вектор, проведённый из заряда q в рассматриваемую точку поля. Для описания электрических процессов в материальной среде вводится вектор электрической индукции D = D (E ) . Для большинства изотропных сред
D = εE ,
(1.3)
где ε = ε( x, y , z ) – диэлектрическая проницаемость (для вакуума в системе СГС
ε = 1 ). При этом поток вектора электрической индукции через произвольную замкнутую поверхность S определяется электрическим зарядом, находящимся в объёме V, ограниченном этой поверхностью, то есть:
∫ D dS = 4π∫ ρdV . S
(1.4)
V
Здесь dS = n dS , где n – единичный вектор внешней нормали к граничной поверхности, а ρ – плотность заряда в пространстве (заряд в единице объёма). Поднеся компас к проводнику с током, датский физик Ханс Кристиан Эрстед в 1820 году обнаружил, что магнитная стрелка устанавливается перпендикулярно проводнику. Из опыта Эрстеда следует, что магнитное поле имеет направленный характер и должно характеризоваться векторной величиной. Основную силовую характеристику магнитного поля назвали магнитной индукцией, которую принято обозначать буквой B . Для описания магнитных процессов в среде вводится вектор магнитной напряжённости H = H (B ) . Для большинства изотропных сред B = µH ,
(1.5) 4
где µ = µ( x, y , z ) – магнитная проницаемость среды (для вакуума в системе СГС
µ = 1 ). Вполне очевидно, что силовые линии магнитного поля замкнуты сами на себя. Поэтому для любого магнитного поля поток вектора магнитной индукции через любую замкнутую поверхность равен нулю, то есть
∫ B dS = 0 .
(1.6)
S
Из опыта известно, что для магнитного поля, как и для электрического, справедлив принцип суперпозиции: поле B , порождаемое несколькими токами, равно векторной сумме полей Bi , порождаемых каждым током в отдельности, т.е. B = ∑ Bi . Пусть замкнутый контур лежит в плоскости, перпендикулярной i
току. При этом циркуляция вектора B по контуру L равна
∫ B dl = L
4π I, c
где под I следует понимать ток, охватываемый контуром, при этом вектор dl совпадает с касательной в каждой точке контура в направлении обхода. Если некоторый контур охватывает несколько проводов с током, то в силу принципа суперпозиции имеем ⎛
⎞
BK ⎟⎟dl = ∑ ∫ BK dl = ∫ B dl = ∫ ⎜⎜⎝ ∑ ⎠ K K L
Здесь
L
L
I K – алгебраическая
пространстве, где
∑ I K = ∫ jn dS . K
4π ∑ IK . c K
величина.
Если
токи
текут
во
всём
Этот интеграл берётся по произвольной
S
поверхности S , натянутой на контур. Вектор j определяет плотность тока в той точке, где расположена площадка dS ; n – орт положительной нормали к этой площадке (т.е. нормали, образующей с направлением обхода контура при вычислении циркуляции правовинтовую систему). При этом
5
∫ B dl = L
4π j dS . c ∫S
Для большинства изотропных сред j = σE + jCTP ,
(1.7)
σ = σ( x, y , z ) – удельная
где
электропроводимость,
jCTP – плотность
так
называемых сторонних токов, т.е. токов, поддерживаемых любыми силами, кроме сил электрического поля. Согласно гипотезе Д.К. Максвелла магнитное поле порождается не только токами, текущими в проводнике, но и переменными электрическими полями в диэлектриках или в вакууме. Величина, пропорциональная скорости изменения электрического поля во времени, была названа Максвеллом током смещения. При этом циркуляция вектора магнитной напряжённости вдоль замкнутого контура L определяется полным током через произвольную поверхность S , ограниченную рассматриваемым контуром, в виде
∫ H dl = L
4π 1d j dS + D dS . ∫ c S c dt ∫S
(1.8)
В 1826 году немецкий физик Георг Симон Ом установил закон, согласно которому сопротивление R контура определяется выражением
R=
E , I
где E – электродвижущая сила (эдс), равная работе, совершаемой над единичным зарядом при обходе им замкнутого контура; I – сила тока:
I =−
dq . dt
В
1831
году
выдающийся
английский
физик
Майкл
Фарадей,
основоположник учения об электромагнитном поле, описал ставший теперь классическим эксперимент, открывший новую главу электродинамики. Много раз повторяя свои опыты в различных вариантах, М. Фарадей пришёл к выводу, что при всяком пересечении проводником линий магнитной индукции в последнем появляется ток, названный им индукционным, при этом протекший 6
заряд ∆q пропорционален числу пересечённых силовых линий ∆Φ и обратно пропорционален электрическому сопротивлению проводника R , то есть 1 R ⋅ ∆q = ∆Φ . c
Д.К. Максвелл ввёл связанный с контуром магнитный поток Φ = ∫ B n dS , S
где S – натянутая на контур поверхность. Отождествив величину ∆Φ с приращением потока Φ и учитывая закон Ома, Д.К. Максвелл придал закону электромагнитной индукции М. Фарадея следующий вид:
E = RI = − R
dq 1 dΦ =− dt c dt
или E =−
1 ∂B n dS . c ∫S ∂t
Вполне очевидно, что напряжённость электрического поля, определяющая индукционный ток в опыте М. Фарадея, неэлектростатического происхождения. Циркуляция этого поля по контуру даёт величину эдс, индуцируемой в контуре: E = ∫ E dl . L
При этом 1d
∫ E dl = − c dt ∫ B dS ,
(1.9)
L
т.е. циркуляция вектора напряжённости электрического поля вдоль замкнутого контура L (эдс индукции) определяется скоростью изменения потока вектора магнитной индукции через поверхность S , ограниченную рассматриваемым контуром. Знак "минус" соответствует правилу Ленца для направления индуцированного тока. Если считать, что вектора электромагнитного поля E , B , D и H являются непрерывными функциями координат, то, рассматривая потоки векторов B и D через поверхности, ограничивающие бесконечно малые 7
объёмы, и циркуляции векторов E и H по бесконечно малым контурам, можно от интегральных уравнений (1.4), (1.6), (1.8) и (1.9) перейти к системе дифференциальных уравнений Максвелла, характеризующих поле в каждой точке пространства. В соответствии с определением соответствующих функций имеем:
∫ D dS ∂Dx ∂D y ∂Dz d ; + D dS = lim S = divD = + ∫ ∆V → M ∆V ∂y ∂z dV S ∂x ∂Bx ∂B y ∂Bz d = = + + B d S div B ; ∂x ∂y dV ∫S ∂z
∫ H dl d Hdl = lim L 2 = n rotH = ∫ r → 0 πr dS L ∂H y ⎞ ⎛ ∂H x ∂H z ⎞ ⎛ ∂H y ∂H x ⎞ ⎤ ⎡⎛ ∂H ⎟⎟i + ⎜ ⎟⎟k ⎥ ; = n ⎢⎜⎜ z − − − ⎟ j + ⎜⎜ ∂ ∂ ∂ ∂ ∂ ∂ y z z x x y ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎦ ⎣ d E dl = n rotE = dS ∫ ∂E y ⎞ ⎛ ∂E x ∂E z ⎞ ⎛ ∂E y ∂E x ⎞ ⎤ ⎡⎛ ∂E ⎟⎟k ⎥ . ⎟⎟i + ⎜ − − = n ⎢⎜⎜ z − ⎟ j + ⎜⎜ ∂ x y ∂ ∂ z x ∂ ∂ y z ∂ ⎠ ⎝ ⎠ ⎦ ⎠ ⎝ ⎣⎝
В рассматриваемом случае дифференциальные уравнения Максвелла принимают вид: divD = 4πρ ,
(1.10)
divB = 0 ,
(1.11)
rotH =
4π 1 ∂D , j+ c c ∂t
rotE = −
(1.12)
1 ∂B . c ∂t
Уравнения позволяющей
Максвелла рассчитывать
(1.13) не
образуют
полной
электромагнитные
замкнутой
процессы
при
системы, наличии
материальной среды. Поэтому их необходимо дополнить соотношениями (1.3),
8
(1.5) и (1.7), которые называют уравнениями состояния или материальными уравнениями. 1.2. Волновое уравнение
Английский математик У. Гамильтон ввёл символ
∇=i
∂ ∂ ∂ +j +k , ∂x ∂y ∂z
называемый "набла". При своём применении он сохраняет черты как вектора, так и оператора дифференцирования. "Умножение" (т.е. действие) оператора Гамильтона на скаляр f и вектор A (точнее на скалярное и векторное поля соответственно) производится по следующим естественным правилам
⎛ ∂ ∂f ∂f ∂f ∂ ⎞ ∂ = gradf , +k +j + k ⎟⎟ f = i +j ∇f = ⎜⎜ i z y x x y z ∂ ∂ ∂ ∂ ∂ ∂ ⎠ ⎝
⎛ ∂ ∂A ∂Ay ∂Az ∂ ∂ ⎞ ⎟⎟(i Ax + jAy + k Az ) = x + + = div A , ∇ А = ⎜⎜ i + j +k ∂x ∂y ∂z ∂y ∂z ⎠ ⎝ ∂x ⎛ ∂ ∂ ∂ ⎞ ∇ × A = ⎜⎜ i + j + k ⎟⎟ × (i Ax + jAy + k Az ) = ∂y ∂z ⎠ ⎝ ∂x ⎛ ∂A ∂Ay ⎞ ⎟⎟ + = i ⎜⎜ z − y z ∂ ∂ ⎝ ⎠
i A ∂ ⎛ y ∂Ax ⎞ ∂ ⎛ ∂A ∂A ⎞ ⎟⎟ = j ⎜⎜ x − z ⎟⎟ + k ⎜⎜ − z x x y ∂ ∂ ∂ ∂ ⎠ ⎝ ⎝ ⎠ ∂x Ax
j ∂ ∂y Ay
k ∂ = rot A . ∂z Az
Рассмотрим электромагнитное поле в однородной непроводящей (σ = 0) среде в области поля, не содержащей ни зарядов (ρ = 0) , ни токов ( j = 0 ) . При этих условиях, используя оператор набла, уравнения (1.10)–(1.13) удобно представить в виде: 1 ∇ × H − D& = 0 c
(1.16)
1 ∇ × E + B& = 0 c
(1.17)
∇B = 0
(1.15) 9
∇D = 0 .
(1.14)
Точка над буквой означает дифференцирование по времени. Дифференциальное уравнение, которому должен удовлетворять каждый из векторов поля в отдельности, можно получить путём исключения другого. Подставив соотношение (1.5) в уравнение (1.17), разделив его на µ и векторно умножив на оператор набла, получаем: ⎛1 ⎞ 1 ∇ × ⎜ ∇ × E ⎟ + ∇ × H& = 0 . ⎝µ ⎠ c
(1.18)
Дифференцируя по времени уравнение (1.16), имеем 1 && ∇ × H& − D = 0. c
(1.19)
Выражение (1.19) с учётом материального уравнения (1.3) позволяет выражение (1.18) представить в виде ⎛1 ⎞ ε ∇ × ⎜ ∇ × E ⎟ + 2 E& = 0 . ⎝µ ⎠ c
(1.20)
В результате последующих преобразований выражение (1.20) можно привести к виду:
∇2 E −
εµ && E + ∇(ln µ ) × (∇ × E ) + ∇[E ∇(ln ε )] = 0 . c2
(1.21)
Аналогично находим
∇2H −
εµ && H + ∇(ln ε ) × (∇ × H ) + ∇[H∇(ln µ )] = 0 . c2
(1.22)
∂2 ∂2 ∂2 Здесь ∇ = 2 + 2 + 2 . ∂x ∂y ∂z 2
В рассматриваемой части пространства среду будем считать однородной. В этом случае ∇(ln ε ) = 0 и ∇(ln µ ) = 0 . При этом уравнения (1.21) и (1.22) принимают вид:
∇2 E −
εµ && E =0 c2
(1.23)
∇2H −
εµ && H = 0. c2
(1.24) 10
Уравнение вида (1.23) или (1.24) называется уравнением д’Аламбера или волновым уравнением.
1.3. Скалярные волны
В однородной среде в областях, где отсутствуют заряды и токи, любой из декартовых компонентов A(r , t ) векторов поля E или H в соответствии с уравнениями (1.23) и (1.24) удовлетворяет однородному волновому уравнению ∂2 A c2 2 − ∇ A = 0. ∂ t 2 εµ
Пусть
(1.25)
r ( x, y, z ) – радиус-вектор некоторой точки
P, а
s (s x , s y , s z ) –
единичный вектор с фиксированным направлением. При этом любое решение уравнения (1.25) в виде A = A(r s ,t ) определяет плоскую волну, так как в каждый момент времени величина A постоянна в плоскостях r s = const , которые перпендикулярны к единичному вектору s . Удобно выбрать такое положение осей декартовой системы координат
ξ, ζ, η , чтобы ось Oζ была бы направлена вдоль орта s . Тогда в соответствии с рис.1.1 имеем
r ⋅s =ζ или xs x + ys y + zs z = ζ . η
z
ζ
y P r
x
O ξ
Рис.1.1. Распространение плоской волны
11
В системе координат x, y, z имеем
∇2 A =
∂2 A ∂2 A ∂2 A + + . ∂x 2 ∂y 2 ∂z 2
Переходя к новой системе координат, получаем
∂ ∂ζ ∂ ∂ ∂ ∂ ∂ ∂ sx ; sy ; = sz . = = = ∂z ∂ζ ∂x ∂ζ ∂x ∂ζ ∂y ∂ζ При этом
∇2 A =
(
)
∂2 A 2 ∂2 A 2 2 s s s . + + = x y z ∂ζ 2 ∂ζ 2
Таким образом, в системе координат ξ, ζ, η уравнение (1.25) принимает вид: ∂2 A c2 ∂2 A − = 0. ∂t 2 εµ ∂ζ 2
(1.26)
Для решения этого уравнения перепишем его в виде
⎛∂ c ∂ ⎞⎛ ∂ c ∂ ⎞ ⎜ − ⎟⎜ + ⎟A = 0. ⎜ ∂t ⎟⎜ ∂t ⎟ ∂ ζ ∂ ζ εµ εµ ⎝ ⎠⎝ ⎠ Введём новые переменные
t−
εµ ζ = p; c
t+
εµ ζ = q. c
Отсюда находим
t=
1 (q + p ) , ζ = 1 c (q − p ) . 2 εµ 2
При этом ∂ ∂t ∂ ∂ζ 1 ⎛ ∂ ∂ c ∂ ⎞ ⎟, = ⎜⎜ − + = ∂p ∂t ∂p ∂ζ ∂p 2 ⎝ ∂t εµ ∂ζ ⎟⎠ ∂ ∂t ∂ ∂ζ 1 ⎛ ∂ ∂ c ∂ ⎞ ⎟. = ⎜⎜ + + = ∂q ∂t ∂q ∂ζ ∂q 2 ⎝ ∂t εµ ∂ζ ⎟⎠ Применив эти соотношения к функции A , получаем
12
∂2 A 1 ⎛ ∂2 A c2 ∂2 A ⎞ ⎟ = 0. = ⎜ − ∂p∂q 4 ⎜⎝ ∂t 2 εµ ∂ζ 2 ⎟⎠ Отсюда следует, что общее решение уравнения (1.26) имеет вид:
A = A1 ( p ) + A2 (q ) , где A1 и A2 – произвольные функции, т.е. любая функция от аргумента
t±
εµ ζ будет решением уравнения (1.26). c
⎛ εµ ⎞ Пусть, например, A2 = 0 . При этом A = A1 ⎜⎜ t − ζ ⎟⎟ . Легко видеть, что в c ⎝ ⎠ каждой плоскости ζ = const при изменении времени изменяется и поле. С другой стороны, в каждый момент времени поле различно для разных значений координат ζ . Вполне очевидно, что значение поля будет одним и тем же для сочетаний координаты ζ и момента времени t , удовлетворяющих условию: c t − ζ = const . εµ
(1.27)
Положив в этом условии t = 0 , получаем − ζ = const = −ζ 0 . Тогда условие (1.27) можно записать в виде: εµ t = ζ − ζ0 . c
Это значит, что если при t = 0 в некоторой точке ζ = ζ 0 пространства поле имело некоторое фиксированное значение, то через промежуток времени t то же самое значение поле будет иметь на расстоянии, равном
c t от начальной εµ
точки в направлении оси Oζ . Отсюда следует, что электромагнитное поле распространяется в пространстве, например, вдоль оси Oζ , со скоростью V=
c c = , где εµ n
εµ = n – показатель преломления среды. Таким образом,
⎛ 1 ⎞ функция A1⎜ t − ζ ⎟ определяет плоскую волну, бегущую в положительном ⎝ V ⎠ 13
1 ⎞ ⎛ направлении оси Oζ . Очевидно, что функция A2 ⎜ t + ζ ⎟ определяет плоскую ⎝ V ⎠ волну, бегущую в противоположном, отрицательном, направлении оси Oζ . В точке r = r0 пространства возмущение, вызванное волной, зависит только от времени: A(r0 , t ) = f (t ) . Важный частный случай электромагнитных волн представляют волны, в которых поле является простой периодической функцией времени. Такая волна называется монохроматической. Зависимость компонентов поля от времени в монохроматической волне определяется множителем вида: cos(ωt + δ ) , где ω – угловая частота волны. При этом функцию f (t ) можно представить в виде: f (t ) = a cos(ωt + δ ) .
(1.30)
Величина a (a > 0 ) называется амплитудой, а аргумент косинуса, т.е. ωt + δ называется фазой. Величина ν =
ω 1 = называется частотой колебаний. 2π T
При замене величины t на t + T значение функции f (t ) остаётся неизменным. Поэтому величина T является периодом колебаний. Волновые функции в форме (1.30) называют гармоническими функциями относительно времени. Заменив в выражении (1.30) величину t величиной t −
rs . При этом V
получаем ⎡ ⎛ rs⎞ ⎤ A(r , t ) = a cos ⎢ω⎜ t − ⎟+δ . V ⎠ ⎥⎦ ⎣ ⎝
(1.31)
Полученная волновая функция определяет гармоническую плоскую волну, распространяющуюся в направлении, заданном единичным вектором s . Расстояние, на которое перемещается поверхность волны за время T , равное периоду одного колебания, определяет период изменения напряжённости поля в пространстве, равный λ = VT = V
2π . Расстояние, равное λ , называется ω
длиной волны, при этом приведённая к вакууму длина волны λ 0 = cT = nλ . Эта длина
волны
соответствует
длине
14
распространяющейся
в
вакууме
гармонической волны той же частоты. Легко убедиться, что величина A(r , t ) , определяемая выражением (1.31), не изменится, если величину r s заменить величиной r s + λ . Выражение (1.31) можно представить в виде: A(r , t ) = a cos[ωt − k r + δ] ,
(1.32)
где k = ks называется волновым вектором или вектором распространения волны в среде, при этом волновое число k =
ω 2π 2π = =n = nk0 . λ λ0 V
Амплитуда a и начальная фаза δ плоской монохроматической волны не зависят от r и t, т.е. одинаковы во всём пространстве во все моменты времени, а, следовательно, выражение (1.32) определяет однородную волну. Никакие реальные волны этим свойством не обладают. Плоскую монохроматическую волну можно рассматривать как частный случай гармонических волн более сложной формы, в общем виде определяемых уравнением
A(r ,t ) = a(r )cos[ωt − g (r )] ,
(1.33)
где a > 0 и g – вещественные скалярные функции положения. Поверхности
g (r ) = const
называют поверхностями постоянной фазы или волновыми
поверхностями. Расчёты, связанные с гармоническими волнами, упрощаются, если использовать экспоненциальные функции вместо тригонометрических. При этом уравнение (1.33) можно записать в виде
A(r ,t ) = Re {U (r ) exp(− iωt )} =
[
]
1 U (r ) exp(− iωt ) + U ∗ (r ) exp(iωt ) , 2
(1.34)
где U (r ) – комплексная функция вида: U (r ) = a(r )exp[ig (r )] , а символ Re означает, что берётся вещественная часть. Если операции, производимые над функцией A , линейны, то в выражении (1.34) символ Re можно опустить и оперировать непосредственно в комплексной функцией вида:
A(r ,t ) = U (r )exp(− iωt ) .
(1.35) 15
∂2 A = −ω2U (r )exp(− iωt ) , а Используя выражение (1.35), находим, что 2 ∂t ∇ 2 A = exp(− iωt )∇ 2U (r ) . При этом уравнение (1.25) принимает вид: ∇ 2U + n 2 k 02U = 0 .
(1.36)
Полученное уравнение называют уравнением Гельмгольца. Величину U называют комплексной амплитудой волны. В частности, для плоской волны, имеем
g (r ) = ω
rs − δ = k r s − δ = k r − δ. V
При этом U (r ) = a(r ) exp(i k r ), где a(r ) = a0 (r ) exp (− iδ ) . 1.4. Векторные волны
Простейшим электромагнитным полем является поле плоской волны. Электромагнитную плоскую волну общего вида определим векторами
E = E (ψ ) , H = H (ψ ) , где ψ = t −
rs . V
При этом
∂ E ∂ E ∂ψ ∂ E , E& = = = ∂t ∂ψ ∂t ∂ψ
∇E = i
∂ E ∂ψ ∂ E ∂ψ ∂ E ∂ψ 1 ∂E 1 ∂E + j +k = − (i s x + js y + k s z ) =− s , ∂ψ ∂ x ∂ψ ∂ y ∂ψ ∂ z V ∂ψ V ∂ψ
(∇ × E )x = ∂ E z − ∂y
=−
∂ Ey ∂z
=
∂ Ez ∂ ψ ∂ E y ∂ ψ = − ∂ψ ∂ y ∂ψ ∂ z
⎞ 1 ∂ Ez 1 ∂ Ey 1 ⎛∂E s z = ⎜⎜ sy + × s ⎟⎟ ; V ⎝ ∂ψ V ∂ψ V ∂ψ ⎠x
вполне очевидно, что (∇ × E ) y = при этом ∇ × E =
⎞ ⎞ 1 ⎛∂E 1 ⎛∂E ⎜⎜ × s ⎟⎟ ; × s ⎟⎟ , (∇ × E )z = ⎜⎜ V ⎝ ∂ψ V ⎝ ∂ψ ⎠z ⎠y
1 ∂E ×s . V ∂ψ
Аналогично получаем 16
∂H 1 ∂H 1 ∂H H& = , ∇× H = , ∇H = − s ×s. ∂ψ V ∂ψ V ∂ψ Подставив полученные выражения в уравнения Максвелла (1.10)–(1.13), с учётом материальных уравнений (1.3) и (1.5), преобразуем их к виду: s
∂E = 0, ∂ψ
(1.37)
s
∂H = 0, ∂ψ
(1.38)
∂H V ∂E ×s −ε = 0, ∂ψ c ∂ψ
(1.39)
∂E V ∂H ×s +µ = 0. ∂ψ c ∂ψ
(1.40)
Полагая постоянную интегрирования равной нулю (т.е. пренебрегая постоянным полем во всём пространстве) и учитывая, что
c = εµ = n , в V
результате интегрирования выражений (1.37)–(1.40) получаем s E = 0,
(1.41)
s H = 0,
(1.42)
E= H =−
µ (H × s ) , ε
(1.43)
ε (E × s ). µ
(1.44)
Из вида равенств (1.41) и (1.42) следует "поперечность" электромагнитного поля, поскольку векторы электрической и магнитной напряжённости поля лежат в плоскости, перпендикулярной к направлению распространению поля. Как следует из выражений (1.43) и (1.44), векторы E и H ортогональны друг другу и образуют вместе с ортом s правую систему ортогональных векторов, как показано на рис.1.2. Кроме того, из выражений (1.43) и (1.44) следует, что
E=
µ ε H, H= E. ε µ
17
В результате получаем
εE= µH.
(1.45) H
O E
s Рис.1.2. Взаимное расположение векторов напряженности электрического E и магнитного H полей и вектора s направления распространения электромагнитной волны
1.4.1. Поляризация плоских монохроматических волн
Направим ось z системы координат x, y, z вдоль волнового вектора
k = ks . Тогда у векторов E и H могут быть отличны от нуля только проекции на оси x и y . Уравнения Максвелла допускают, в частности, такое решение, при котором у вектора E во всех точках в пространстве и во все моменты времени отлична от нуля только одна проекция, например, E x ( z , t ) . Вследствие свойства поперечности у вектора H при этом отлична от нуля только проекция на ось y , т.е. H y ( z , t ) . Эти проекции связаны между собой соотношением ε E x = µ H y . Мгновенный "снимок" такой волны, показывающий векторы E и H в разных точках оси z в один момент времени, показан на рис.1.3. В этом случае говорят, что волна имеет линейную (или плоскую) поляризацию. Плоскость, в которой лежит вектор напряжённости электрического поля волны
E и волновой вектор k , называют плоскостью поляризации или плоскостью колебаний. Чтобы представить себе изменение электрического и магнитного полей с течением времени, можно считать, что вся система векторов, показанная на рис.1.3, движется как целое вдоль оси z со скоростью V (в вакууме со скоростью c ). 18
E
z
H
Рис.1.3
Свет, в котором представлены все направления колебаний вектора E в плоскости, перпендикулярной к направлению распространения, называется естественным светом. Излучение обычных источников света не поляризовано. Линейно поляризованный свет получают, пропуская естественный через оптические
поляризаторы,
действие
которых
основано
на
различных
физических принципах. С их помощью можно не только получить линейно поляризованный свет, но и выяснить, имеет ли исследуемое излучение линейную
поляризацию.
Выполняющее
такую
роль
поляризационное
устройство называют анализатором. В отличие от обычных источников света излучение газового лазера, окна разрядной трубки которого наклонены на некоторый угол к её оптической оси (угол Брюстера), обладает линейной поляризацией. В общем случае вектор E может иметь любые направления в плоскости, перпендикулярной к направлению распространения волны. Пусть наряду с волной, поляризованной в плоскости
xOz , в том же направлении (в
направлении оси z ) распространяется другая волна той же частоты ω , но поляризованная в плоскости
yOz , как показано на рис.1.4. Вследствие
линейности уравнений Максвелла такое наложение (суперпозиция) волн также является решением уравнений. В зависимости от разности фаз складываемых линейно поляризованных волн результирующая волна моет иметь различную поляризацию. 19
z
y
ϕz
Ay
δ
ϕx
x
Ax Рис.1.4. Распространение электромагнитной волны
Рассмотрим электрическое поле E ( z , t ) волны, возникающей при сложении двух волн одинаковой частоты с ортогональными направлениями линейной поляризации:
Ex ( z , t ) = E0 x exp[i (kz − ωt )] = Ax exp(− iϕ x )exp[i (kz − ωt )]
(1.46)
E y ( z , t ) = E0 y exp[i (kz − ωt )] = Ay exp(− iϕ y )exp[i(kz − ωt )] .
(1.47)
При одинаковых (или отличающихся на nπ , где n – целое число) фазах ϕ x и ϕ y комплексных амплитуд E0 x и E0 y в каждой точке происходит сложение взаимно перпендикулярных колебаний в одной фазе, что даёт колебание в новом направлении. Результирующая волна будет линейно поляризованной. Направление её поляризации зависит от отношения амплитуд Ax и Ay , как показано на рис.1.5.
y
y
y
Ay 0 − Ay
Ay 0
Ay 0
Ax = 0
x
Ax x
Ay = 2 Ax , ϕx = ϕ y
y
Ax x
Ax = Ay , ϕx = ϕ y Рис.1.5
20
0
y
Ax
− Ax Ay = 0
Ay x
0
Ax x
Ay = 2 Ax , ϕ y = ϕx + π
Пусть волна, поляризованная в плоскости y 0 z , отстаёт по фазе на
1 π от 2
1 волны, поляризованной в плоскости x0 z , т.е. ϕ x − ϕ y = π . Если амплитуды 2 этих волн одинаковы
(Ax = Ay = A) ,
то вектор E в любой точке z будет
вращаться в плоскости x0 y против часовой стрелки, оставаясь неизменным по модулю. Например, в точке z = 0 имеем
E x (t ) = A cos(ωt + ϕ x )
(1.48)
1 ⎞ ⎛ E y (t ) = A cos⎜ ωt + ϕ x − π ⎟ = A sin (ωt + ϕ x ) . 2 ⎠ ⎝
(1.49)
Такую волну называют поляризованной по кругу или циркулярно поляризованной. Когда при наблюдении навстречу волне вращение вектора E в фиксированной плоскости происходит так, как в рассмотренном примере при
z = 0 , т.е. против часовой стрелки, то говорят о волне левой круговой поляризации. Правая круговая поляризация соответствует вращению вектора в фиксированной плоскости z = const в направлении часовой стрелки:
E x (t ) = A cos(ωt + ϕ x )
(1.50)
1 ⎞ ⎛ E y (t ) = A cos⎜ ωt + ϕ x + π ⎟ = − A sin (ωt + ϕ x ) , 2 ⎠ ⎝
(1.51)
т.е. волна E y (t ) опережает по фазе волну E x (t ) на
1 π. 2
На практике для превращения линейно поляризованного света в свет с круговой поляризацией используют анизотропные кристаллические пластинки, в которых две волны с ортогональными направлениями линейной поляризации имеют различные фазовые скорости. Подбором толщины пластинки можно получить на выходе заданную разность фаз этих волн и тем самым требуемое состояние поляризации. При использовании комплексной записи в виде (1.46) и (1.47) для складываемых волн с ортогональными направлениями линейной поляризации результирующая волна имеет линейную поляризацию, если отношение 21
комплексных амплитуд
E0 y
к
E0 x
выражается вещественным числом.
Результирующая волна имеет круговую поляризацию, если отношение комплексных амплитуд определяется мнимым числом, по модулю равным единице. При
E0 y E0 x
⎛ π⎞ = exp⎜ i ⎟ = i , волна будет иметь правую круговую ⎝ 2⎠
поляризацию, а при
E0 y E0 x
= −i – левую. В общем случае при наложении
световых колебаний во взаимно перпендикулярных плоскостях кривая, которую описывает конец вектора E в произвольной фиксированной плоскости
z = const , является геометрическим местом точек, координаты которых определяются уравнениями вида:
E x = Ax cos(τ + ϕ x )
(1.52)
E y = Ay cos(τ + ϕ y )
(1.53)
Ez = 0 .
(1.54)
Здесь τ = kz − ωt . Для того, чтобы исключить τ из уравнений (1.52) и (1.53), перепишем их в виде:
Ex = cos τ cos ϕ x − sin τ sin ϕ x Ax Ey Ay
(1.55)
= cos τ cos ϕ y − sin τ sin ϕ y .
(1.56)
При этом
Ey Ex sin ϕ y − sin ϕ x = cos τ sin (ϕ y − ϕ x ), Ax Ay Ey Ex cos ϕ y − cos ϕ x = sin τ sin (ϕ y − ϕ x ). Ax Ay Возведя в квадрат левую и правую части этих уравнений и сложив полученные выражения соответствующих частей, имеем
22
2
2
E ⎛ Ex ⎞ ⎛ E y ⎞ ⎟ − 2 E x y cos δ = sin 2 δ , ⎜⎜ ⎟⎟ + ⎜ ⎜ ⎟ Ax Ay ⎝ Ax ⎠ ⎝ Ay ⎠
(1.57)
где δ = ϕ y − ϕ x . Выражение (1.57) представляет собой уравнение конического
Ax 2 + 2 Bxy + Cy 2 = H
сечения. Известно, что квадратичная форма эллиптической,
если
дискриминант
будет
D = AC − B 2 > 0 .
формы
В
рассматриваемом случае соответствующий дискриминант равен 1 cos 2 δ sin 2 δ D = 2 2 − 2 2 = 2 2 > 0. Ax Ay Ax Ay Ax Ay
y
ν µ ψ
α
2 Ay
x
O
2 Ax Рис.1.6. Эллиптически поляризованная волна
Таким образом, уравнение (1.57) описывает эллипс, вписанный в прямоугольник, стороны которого параллельны осям координат Ox и Oy и имеют длины 2 Ax и 2 Ay , как показано на рис.1.6. Положив в уравнении (1.57) величину
E x = Ax ,
E x = Ax cos δ ,
т.е.
(± Ax , ± Ay cos δ)
и
получаем эллипс
E y = Ay cos δ ,
касается
(± Ax cos δ, ± Ay ).
а
сторон
при
E y = Ay
прямоугольника
получаем в
точках
В этом случае говорят, что волна,
описываемая уравнениями (1.52)–(1.54), эллиптически поляризована. В общем случае оси эллипса не параллельны осям Ox и Oy .
23
Пусть Oµ
и Oν – новые оси, совпадающие с осями эллипса, а
ψ (0 ≤ ψ < π) – угол между осью Ox и направлением главной оси Oµ , как показано на рисунке. При этом компоненты Eµ и Eν связаны с компонентами
E x и E y соотношениями Eµ = E x cos ψ + E y sin ψ
(1.58)
Eν = − E x sin ψ + E y cos ψ .
(1.59)
Если 2a и 2b
(a ≥ b ) – длины
осей эллипса, то уравнение эллипса
относительно осей Oµ и Oν можно записать в виде:
Eµ = a cos(τ + ϕ 0 )
(1.60)
Eν = b sin (τ + ϕ0 ) .
(1.61)
Чтобы определить амплитуды a и b , приравняем в развёрнутом виде правые части уравнений (1.58) и (1.60) и уравнений (1.59) и (1.61). При этом, учитывая выражения (1.52) и (1.53), получаем
a(cos τ cos ϕ0 − sin τ sin ϕ0 ) = cos τ(Ax cos ϕ x cos ψ + Ay cos ϕ y sin ψ ) −
− sin τ(Ax sin ϕ x cos ψ + Ay sin ϕ y sin ψ ),
b(sin τ cos ϕ0 + cos τ sin ϕ0 ) = cos τ(Ay cos ϕ y cos ψ − Ax cos ϕ x sin ψ ) +
+ sin τ(Ax sin ϕ x sin ψ − Ay sin ϕ y cos ψ ).
Приравнивая коэффициенты при cos τ и при sin τ , имеем
a cos ϕ 0 = Ax cos ϕ x cos ψ + Ay cos ϕ y sin ψ ,
(1.62)
a sin ϕ 0 = Ax sin ϕ x cos ψ + Ay sin ϕ y sin ψ ;
(1.63)
b cos ϕ0 = Ax sin ϕ x sin ψ − Ay sin ϕ y cos ψ ,
(1.64)
b sin ϕ0 = − Ax cos ϕ x sin ψ + Ay cos ϕ y cos ψ .
(1.65)
Возведя левые и правые части этих уравнений в квадрат и последовательно складывая полученные части уравнений (1.62) и (1.63) и уравнений (1.64) и (1.65), находим, что
a 2 = Ax2 cos 2 ψ + Ay2 sin 2 ψ + Ax Ay sin 2ψ cos δ , b 2 = Ax2 sin 2 ψ + Ay2 cos 2 ψ − Ax Ay sin 2ψ cos δ , 24
где δ = ϕ y − ϕ x . Отсюда следует, что
a 2 + b 2 = Ax2 + Ay2 .
(1.66)
Перемножив левые и правые части уравнений (1.62) и (1.64) и уравнений (1.63) и (1.65) и сложив соответствующие части полученных выражений, имеем
± ab = Ax Ay sin δ .
(1.67)
Наличие двух знаков в уравнении (1.67) определяет возможность двух направлений вращения вектора E , конец которого описывает эллипс. Поделив левые и правые части уравнений (1.64) и (1.65) соответственно на левые и правые части уравнений (1.62) и (1.63), получаем
±
b Ax sin ϕ x sin ψ − Ay sin ϕ y cos ψ − Ax cos ϕ x sin ψ + Ay cos ϕ y cos ψ . = = a Ax cos ϕ x cos ψ + Ay cos ϕ y sin ψ Ax sin ϕ x cos ψ + Ay sin ϕ y sin ψ
Отсюда следует, что
Ax2 sin 2 ϕ x sin ψ cos ψ + Ax Ay sin ϕ x sin ϕ y sin 2 ψ −
− Ax Ay sin ϕ x sin ϕ y cos 2 ψ − Ay2 sin 2 ϕ y sin ψ cos ψ = = − Ax2 cos 2 ϕ x sin ψ cos ψ + Ax Ay cos ϕ x cos ϕ y cos 2 ψ − − Ax Ay cos ϕ x cos ϕ y sin 2 ψ + Ay2 cos 2 ϕ y sin ψ cos ψ. Преобразовав это выражение, получаем
(A
2 x
)
− Ay2 sin 2ψ = 2 Ax Ay cos δ cos 2ψ .
Отсюда следует, что
tg 2ψ =
2 Ax Ay
Ax2 − Ay2
Обозначим
Ay Ax
cos δ . = tgα , где 0 ≤ α ≤
(1.68) π . 2
При этом уравнение (1.68) можно представить в виде:
tg 2ψ =
2 sin α cos α 2tgα δ = cos δ cos cos 2 α − sin 2 α 1 − tg 2 α
или
tg 2ψ = tg 2α cos δ .
(1.69) 25
Из выражений (1.66) и (1.67) следует, что
±
2 Ax Ay 2ab 2tgα sin δ = = sin δ = 2 sin α cos α sin δ 2 2 2 2 a +b Ax + Ay 1 + tg 2 α
±
2ab = sin 2α sin δ . a + b2
или (1.70)
2
Обозначим ±
b π⎞ ⎛ π = tgχ , где χ ⎜ − ≤ χ ≤ ⎟ – вспомогательный угол, при 4⎠ a ⎝ 4
этом численное значение tgχ определяет величину отношения осей эллипса, а знак при χ характеризует два варианта, которые можно использовать при описании эллипса. При этом выражение (1.70) можно представить в виде: sin 2χ = sin 2α sin δ .
(1.71)
Итак, если заданы величины Ax и Ay , относящиеся к произвольному положению осей, разность фаз δ и если 0 ≤ α ≤
π , то главные полуоси эллипса 2
a и b и угол ψ (0 ≤ ψ < π) , который большая ось эллипса образует с осью Ox , определяются формулами:
a 2 + b 2 = Ax2 + Ay2
(1.72)
tg 2ψ = tg 2α cos δ
(1.73)
sin 2χ = sin 2α sin δ .
(1.74)
С другой стороны, если известны длины осей a и b и ориентация эллипса (т.е. заданы величины a , b и ψ ), то эти формулы позволяют найти амплитуды
Ax и Ay и разность фаз δ . Существуют оптические устройства, которые позволяют определять эти величины прямым способом. В предельных случаях эллипс поляризации вырождается либо в прямую, либо в окружность. Согласно выражению (1.57) эллипс вырождается в прямую при δ = ϕ y − ϕ x = mπ , где m = 0, ± 1, ± 2, K . При этом
26
Ey Ex
= (− 1)
m
Ay Ax
.
В этом случае имеем линейно поляризованную волну. В том случае, когда эллипс вырождается в окружность, имеем круговую поляризацию волны. Вполне очевидно, что условием этого является преобразование описанного прямоугольника в квадрат, что эквивалентно выравниванию амплитуд:
Ax = Ay = A . Кроме того, в этом случае один из компонентов вектора E должен равняться нулю, когда другой достигает максимального значения. Последнее π условие эквивалентно равенству: δ = ϕ y − ϕ x = ±(2m − 1) , где m = 1, 2, 3, K . 2
При соблюдении названных условий уравнение (1.57) принимает вид уравнения окружности:
E x2 + E y2 = A 2 . В случае правой поляризации sin δ > 0 . При этом
δ=
π + 2mπ , где m = 0, ± 1, ± 2, K ; 2
E x = a cos(τ + ϕ x ) , π ⎞ ⎛ E y = a cos⎜ τ + ϕ x + + 2mπ ⎟ = −a sin (τ + ϕ x ) . 2 ⎠ ⎝ При левой поляризации sin δ < 0 . При этом π δ = − + 2mπ , где m = 0, ± 1, ± 2, K ; 2
E x = a cos(τ + ϕ x ) , π ⎞ ⎛ E y = a cos⎜ τ + ϕ x − + 2mπ ⎟ = a sin (τ + ϕ x ) . 2 ⎠ ⎝ Если вместо вещественного представления компонентов вектора E использовать комплексное:
E x = Ax exp[i(τ + ϕ x )],
[
]
E y = Ay exp i (τ + ϕ y ) ,
то 27
Ey Ex
=
Ay Ax
[
]
exp i (τ + ϕ y − τ − ϕ x ) =
Ay Ax
exp(iδ )
или
Ey Ex
=
Ay Ax
e iδ .
Значение этого отношения позволяет сразу же определить характер поляризации: – линейная поляризация электромагнитной волны, если δ = ± mπ , где
m = 0, 1, 2, K ; при этом Ey Ex
= (− 1)
m
Ay Ax
;
– правая круговая поляризация электромагнитной волны, если Ax = Ay ,
δ=
π + 2mπ , где m = 0, ± 1, ± 2, K ; при этом 2 Ex ⎡ ⎛π ⎛ π⎞ ⎞⎤ = exp ⎢i⎜ + 2mπ ⎟⎥ = exp⎜ i ⎟ = i ; Ey ⎝ 2⎠ ⎠⎦ ⎣ ⎝2 – левая круговая поляризация электромагнитной волны, если
π Ax = Ay , δ = − + 2mπ , где m = 0, ± 1, ± 2, K ; 2 при этом
Ex ⎡⎛ π ⎞⎤ ⎛ π⎞ = exp ⎢i⎜ − + 2mπ ⎟⎥ = exp⎜ − i ⎟ = −i . Ey ⎠⎦ ⎝ 2⎠ ⎣⎝ 2 Можно показать, что в общем случае для правой эллиптической поляризации мнимая часть отношения
Ey Ex
положительна, тогда как для левой
эллиптической поляризации она отрицательна. На рис.1.7 показаны эллипсы поляризации при разных значениях δ .
28
δ=0
0<δ<
π 2
δ=
π 2
π <δ<π 2
δ=π
π<δ<
3π 2
δ=
3π 2
3π < δ < 2π 2
Рис.1.7. Эллиптическая поляризация при различных значениях разности фаз δ
1.4.2. Характеристика состояния поляризации с помощью параметров Стокса
Для характеристики эллипса поляризации необходимы три независимые величины, к которым из уже рассмотренных можно отнести амплитуды Ax и
Ay и разность фаз δ или малую и большую полуоси эллипса a и b и угол ψ , характеризующий ориентацию эллипса. Для практических целей состояние поляризации удобно характеризовать параметрами, обладающими одинаковой физической размерностью. Такие параметры были введены английским физиком и математиком Джорджем Габриелем Стоксом в 1852 году при его исследованиях частично поляризованного света. Параметрами Стокса для плоской монохроматической волны служат следующие четыре величины:
s0 = Ax2 + Ay2
(1.75а)
s1 = Ax2 − Ay2
(1.75б)
s 2 = 2 Ax Ay cos δ
(1.75в)
s3 = 2 Ax Ay sin δ .
(1.75г)
Лишь три из этих величин независимы, так как справедливо тождество
s02 = s12 + s 22 + s32 .
(1.76) 29
Из
выражения
(1.75)
следует,
что
параметр
s0
пропорционален
интенсивности волны. Напомним, что
s0 =
⎛
Ax2 ⎜1 + ⎜ ⎝
Ay Ax
= tgα . При этом из соотношения (1.75) имеем
2 Ay2 ⎞ ⎟ = Ax2 1 + tg 2 α = Ax . Ax2 ⎟⎠ cos 2 α
(
)
Полученное соотношение позволяет выражение (1.74) преобразовать к виду: sin 2χ = 2 cos 2 αtgα sin δ = 2 cos 2 α
Ax Ay Ax2
sin δ = 2
Ax Ay sin δ s0
.
Учитывая при этом выражение (1.75г), получаем
s3 = s0 sin 2χ .
(1.77)
В результате подстановки соотношений (1.75б) и (1.75в) в выражение (1.68) имеем s 2 = s1tg 2ψ .
(1.78)
Подставим соотношения (1.77) и (1.78) в выражение (1.76):
s02 = s12 + s12tg 2 2ψ + s02 sin 2 2χ . Отсюда находим, что
s1 = s0 cos 2χ cos 2ψ .
(1.79)
При этом выражение (1.78) можно представить в виде: s 2 = s0 cos 2χ sin 2ψ . Итак, s1 = s0 cos 2χ cos 2ψ
(1.80а)
s2 = s0 cos 2χ sin 2ψ
(1.80б)
s3 = s0 sin 2χ .
(1.80в)
Отсюда следует, что параметры s1 , s2 и s3 достаточно простыми соотношениями
связаны
с
углом
χ
30
π⎞ ⎛ π ⎜− ≤ χ ≤ ⎟, 4⎠ ⎝ 4
характеризующим
эллиптичность поляризации и направление вращения электрического вектора, и с углом ψ (0 ≤ ψ < π ) , характеризующим ориентацию эллипса. z
s3 s0 O s1 2ψ
x
2χ
P
s2
y
Σ
Рис.1.8. Представление состояния поляризации монохроматической волны по Пуанкаре (сфера Пуанкаре)
Полученные выражения (1.80а)–(1.80в) определяют возможность простого геометрического представления различных состояний поляризации: параметры Стокса s1 , s2 и s3 можно рассматривать как декартовы координаты точки P на сфере Σ радиуса s0 , причём углы 2χ и 2ψ являются сферическими угловыми координатами этой точки, как показано на рис.1.8. Таким образом, каждому возможному состоянию поляризации плоской монохроматической волны заданной интенсивности (s0 = const ) соответствует одна точка на сфере Σ и наоборот. Так как знак угла χ определяет направление вращения вектора, то, как следует из выражения (1.80в), правая поляризация представляется точками на поверхности Σ , лежащими выше экваториальной плоскости (плоскости xy ), а левая поляризация – точками на поверхности Σ , лежащими ниже этой плоскости. Для линейно поляризованного света разность фаз δ равна нулю или числу, кратному π . В соответствии с выражением (1.80в) параметр Стокса s3 равен нулю, если χ = mπ , где m = 0, ± 1, ± 2, K . Таким образом, линейная поляризация представляется точками окружности в экваториальной плоскости. Для круговой
31
поляризации Ax = Ay и при правой поляризации угол δ =
π , а при левой 2
π поляризации угол δ = − . При этом в соответствии с соотношением (1.74) 2 sin 2χ = ±1. Следовательно, правая круговая поляризация представляется
северным полюсом (s1 = s2 = 0, s3 = s0 ) , а левая круговая поляризация – южным полюсом (s1 = s2 = 0, s3 = − s0 ) . Рассмотренное
геометрическое
представление
различных
состояний
поляризации точками на сфере было предложено французским математиком, физиком и философом Жюлем Анри Пуанкаре. Оно чрезвычайно полезно в кристаллооптике для определения влияния кристаллических сред на состояние поляризации проходящего через них света. Сфера Σ называется сферой Пуанкаре. 1.4.3. Характеристика состояния поляризации квазимонохроматической световой волны с помощью параметров Стокса
Итак, строго монохроматический свет всегда поляризован, т.е. конец электрического (или магнитного) вектора в каждой точке пространства движется периодически, описывая эллипс, который в особых случаях переходит в круг или прямую линию. В том случае, когда конец вектора движется совершенно нерегулярно и такие световые колебания не имеют никаких преимущественных направлений в плоскости, перпендикулярной к направлению распространения, свет называется неполяризованным. Эти два случая относятся к экстремальным. В общем случае изменение векторов поля не является ни вполне регулярным, ни вполне нерегулярным; при этом можно сказать, что свет частично поляризован. Обычно такой свет получается из неполяризованного при отражении или рассеянии. Рассмотрим квазимонохроматическую световую волну со средней частотой световых колебаний ν , распространяющуюся в положительном направлении оси
z . Пусть
E x (t ) и
E y (t ) – два взаимно ортогональных компонента 32
электрического
вектора
в
некоторой
точке
O,
перпендикулярные
к
направлению распространения. При этом
E x (t ) = Ax (t ) exp{i[ϕ x (t ) − 2πν t ]}
[
(1.81)
]
E y (t ) = Ay (t ) exp{i ϕ y (t ) − 2πν t }.
(1.82)
В большинстве известных приложений спектральные амплитуды световых колебаний заметно отличаются от нуля лишь в частотном интервале шириной ∆ν , малом по сравнению со средней частотой ν . При этом ∆t ⋅ ∆ν ~ ∆t – время когерентности света. Заметим, что при ∆ν ≈
1 , где 4π
1 величина ∆t ∆t
определяет длительность одного волнового цуга. При ∆t → ∞ частотный интервал ∆ν → 0 , т.е. при этом имеем монохроматический свет. Если бы свет был строго монохроматическим, то величины Ax , Ay , ϕ x и ϕ y были бы постоянными. Для квазимонохроматической волны эти величины зависят также от времени t , но за любой интервал времени, малый по сравнению с временем когерентности, их изменение относительно невелико. Предположим, что запаздывание компонента E y электрического вектора относительно компонента Ex равно ε , что можно осуществить с помощью прибора, называемого компенсатором, и определим интенсивность I (θ, ε ) световых колебаний в направлении, которое образует угол θ с положительным направлением оси x . Также колебания можно выделить, пропуская свет через соответствующим образом ориентированный поляризатор. Вполне очевидно, что сквозь поляризатор пройдут колебания, определяемые проекциями компонентов
Ex
и
Ey
на соответствующее направление, т.е. модуль
электрического вектора после введения запаздывания ε можно записать в виде: E (t ; θ, ε ) = Ex cos θ + E y eiε sin θ ,
(1.83)
при этом интенсивность света
33
I (θ, ε ) = E (t ; θ, ε )E ∗ (t ; θ, ε ) = J xx cos 2 θ + J yy sin 2 θ + + J xy e − iε cos θ sin θ + J yxeiε sin θ cos θ ,
(1.84)
где J xx , K – элементы матрицы E x E *y ⎞⎟ = E y E *y ⎟ ⎠
⎛ E x E x* J =⎜ ⎜ E y E x* ⎝
2 ⎛ A x =⎜ ⎜ Ax Ay exp − i (ϕ x − ϕ y ) ⎝
[
Здесь скобками
]
[
]
Ax Ay exp i (ϕ x − ϕ y ) Ay2
(1.85)
⎞ ⎟. ⎟ ⎠
обозначены усреднённые по времени величины.
Диагональные элементы матрицы J вещественны и представляют собой интенсивности компонентов Ex и E y электрического вектора. Следовательно, шпур S p J этой матрицы, т.е. сумма её диагональных элементов, равен полной интенсивности света: S p J = J xx + J yy = Ex Ex* + E y E *y .
(1.86)
Недиагональные элементы в общем случае комплексны, но они являются комплексно-сопряжёнными. Заметим, что матрица, для которой J ji = J ij* при всех i и j , называется эрмитовой. Определитель матрицы когерентности неотрицателен, т.е. J = J xx J yy − J xy J yx ≥ 0 . Элементы матрицы когерентности
заданной волны можно определить с помощью относительно простых экспериментов. Для этого необходимо лишь измерить интенсивность для нескольких
различных
значений
θ
(ориентации
поляризатора)
и
ε
(запаздывания, обусловленного компенсатором) и решить соответствующие уравнения, полученные из выражения (1.84). Пусть
I (θ, ε )
обозначает
результат
измерения,
соответствующий
определённой паре значений углов θ и ε , которую обозначим в виде: {θ, ε}. Удобно использовать следующие их значения:
{0°, 0}, {45°, 0}, {90°, 0}, {135°, 0}, ⎧⎨45°, π ⎫⎬, ⎧⎨135°, π ⎫⎬ . ⎩
2⎭ ⎩
34
2⎭
Из выражения (1.84) следует, что элементы матрицы когерентности выражаются через интенсивности, полученные в результате измерений при шести сочетаниях указанных значений величин θ и ε в виде: J xx = I (0°, 0 ), J yy = I (90°, 0 ), J xy =
1 [I (45°, 0) − I (135°, 0)] + 1 i ⎡⎢ I ⎛⎜ 45°, π ⎞⎟ − I ⎛⎜135°, π ⎞⎟⎤⎥ , 2 2 ⎣ ⎝ 2⎠ ⎝ 2 ⎠⎦
J yx =
1 [I (45°, 0) − I (135°, 0)] − 1 i ⎡⎢ I ⎛⎜ 45°, π ⎞⎟ − I ⎛⎜135°, π ⎞⎟⎤⎥ . 2 2 ⎣ ⎝ 2⎠ ⎝ 2 ⎠⎦
⎫ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎭
(1.87)
Отсюда следует, что для определения элементов матрицы J xx , J yy и вещественной части J xy (или J yx ) необходим лишь поляризатор. Величины J xx и J yy можно определить, используя результаты измерений с поляризатором, ориентированным так, чтобы пропускать компоненты с азимутами θ = 0° и θ = 90° соответственно. Для получения вещественной части J xy необходимы
измерения с поляризатором, вначале ориентированным так, что он пропускает компоненту с азимутом θ = 45° , а затем – компоненту с азимутом θ = 135° . Для определения мнимой части
J xy
(или
J yx ), согласно двум последним
соотношениям в (1.87), необходим компенсатор, который вносил бы разности фаз в четверть периода между компенсаторами
Ex
и
Ey
(например,
четвертьволновая пластинка). Поляризатор при этом вначале ориентирован так, что он пропускает компоненту с азимутом θ = 45° , а затем – компоненту с азимутом θ = 135° . Последние два измерения нужны для идентификации правой и левой круговой поляризации. Итак, для характеристики квазимонохроматической плоской волны, вообще говоря, необходимы четыре вещественные величины, например, J xx , J yy , вещественная и мнимая части J xy (или J yx ). В своих исследованиях,
относящихся к частично поляризованному свету, Стокс ввёл несколько отличное представление с четырьмя параметрами, тесно связанное с 35
рассмотренным. Параметрами Стокса общего вида являются следующие четыре величины: ⎫ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎭
s0 = Ax2 + Ay2 , s1 = Ax2 − Ay2 , s2 = 2 Ax Ay cos δ , s3 = 2 Ax Ay sin δ ,
где, как и прежде, перпендикулярных
Ax
(1.88)
и
Ay – мгновенные амплитуды двух взаимно
компонентов
электрического
вектора
Ex
и
Ey ,
а
δ = ϕ x − ϕ y – разность их фаз. Для монохроматического света Ax , Ay и δ не
зависят от времени, при этом выражения (1.88) переходят в параметры Стокса монохроматической волны, определяемые соотношениями (1.75а)–(1.75г). Из выражений (1.88) и (1.85) следует, что параметры Стокса и элементы матрицы когерентности связаны соотношениями s0 = J xx + J yy , s1 = J xx − J yy , s2 = J xy + J yx ,
s3 = i (J yx − J xy ); J xx =
1 (s0 + s1 ), 2
J yy =
1 (s0 − s1 ), 2
J xy
1 = (s2 + is3 ), 2
J yx =
1 (s2 − is3 ). 2
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ⎭
(1.89)
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
(1.90)
Как и элементы матрицы когерентности, параметры Стокса любой плоской квазимонохроматической волны можно определить с помощью простых экспериментов. И в этом случае обозначим через I (θ, ε ) интенсивность 36
световых колебаний в направлении, образующем угол θ с осью Ox , когда компонент E y запаздывает на величину ε по отношению к компоненту Ex . Тогда на основании соотношений (1.87) и (1.90) имеем s0 = I (0°,0 ) + I (90°,0),
⎫ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎭
s1 = I (0°,0) − I (90°,0 ),
s2 = I (45°,0 ) − I (135°,0 ), π⎞ π⎞ ⎛ ⎛ s3 = I ⎜ 45°, ⎟ − I ⎜135°, ⎟ . 2⎠ ⎝ 2⎠ ⎝
(1.91)
Параметр s0 определяет полную интенсивность. Параметр s1 равен разности интенсивностей линейно поляризованного света, прошедшего через поляризаторы с азимутами θ = 0° и θ = 90° . Так же интерпретируется и параметр s2 , но для азимутов θ = 45° и θ = 135° . Наконец, параметр s3 равен разности интенсивностей света, прошедшего через прибор, пропускающий колебания с правой круговой поляризацией, и света, прошедшего через прибор, пропускающий колебания с левой круговой поляризацией. Используя
соотношения
(1.90),
условие
J xx J yy − J xy J yx ≥ 0
можно
представить в виде: s02 ≥ s12 + s22 + s32 .
При
(1.92)
суперпозиции
распространяющихся
в
нескольких одном
независимых
направлении,
световых
матрица
волн,
когерентности
результирующей волны равна сумме матриц когерентности для отдельных волн. Чтобы доказать это, рассмотрим компоненты электрических векторов (в обычном
комплексном
(n = 1, 2, K, N ) .
представлении)
отдельных
волн
E xn
и
E yn
Компоненты электрического вектора результирующей волны
равны N
N
n =1
n =1
Ex = ∑ Exn , E y = ∑ E yn ,
а, значит, элементы матрицы когерентности для этой волны определяются выражением 37
N
N
* J kl = Ek El* = ∑ ∑ Ekn Elm = ∑ Ekn El*n +
n =1 m =1
n
∑
n≠m
Ekn El*m .
Так как предполагается, что волны независимы, каждый член последней суммы равен нулю и, следовательно, J kl = ∑ J kl n ,
(1.93)
n
где J kl n = Ekn El*n – элементы матрицы когерентности n -ой волны. Из формулы (1.93) следует, что матрица когерентности для сложной волны равна сумме матриц когерентности для всех составляющих волн. Свет, который обладает тем свойством, что интенсивность любого его компонента, перпендикулярного к направлению распространения, одинакова, при этом на эту интенсивность не оказывает влияния никакое предыдущее взаимное запаздывание перпендикулярных друг другу компонентов, на которые можно разложить свет, называется полностью неполяризованным светом. Другими словами, такой свет должен обладать тем свойством, чтобы соблюдалось условие I (θ, ε ) = const при всех значениях θ и ε . Его часто называют естественным светом. Как следует из выражения (1.84), интенсивность I (θ, ε ) не зависит от θ и ε при J xy = J yx = 0 и J xx = J yy . При этом I (θ, ε ) = J xx + J yy = I .
В соответствии с формулой (1.89) для полностью неполяризованного света имеем: s0 = I , s1 = s2 = s3 = 0 . В случае строго монохроматического (полностью поляризованного) света величины Ax , Ay , ϕ x и ϕ y в выражениях (1.81) и (1.82) не зависят от времени. При этом матрица когерентности имеет вид: ⎡ Ax2 J =⎢ − iδ ⎣⎢ Ax Ay e
Ax Ay eiδ ⎤ ⎥, Ay2 ⎦⎥
где δ = ϕ x − ϕ y .
38
Легко видеть, что в этом случае определитель матрицы когерентности равен нулю, т.е. J = J xx J yy − J xy J yx = 0 . При этом, как следует из соотношений (1.90), имеем s02 = s12 + s22 + s32 .
Рассмотрим теперь разложение некоторой произвольной волны на взаимно независимые
поляризованную
и
неполяризованную
части,
используя
представление через параметры Стокса. Соотношения (1.93) и (1.90) позволяют сделать вывод о том, что параметры Стокса системы независимых волн равны сумме соответствующих параметров Стокса отдельных волн. Как было показано,
для
неполяризованной
волны
справедливо
соотношение:
s1 = s2 = s3 = 0 . Обозначим четыре параметра Стокса s0 , s1, s2 и s3 одним символом s . Тогда для волны, характеризующейся параметром s , требуемое разложение можно записать в виде: s = s (1) + s (2 ) ,
(1.94)
где s (1) = s0 − s12 + s22 + s32 , 0, 0, 0 ;
(1.95)
s (2 ) = s12 + s22 + s32 , s1 , s2 , s3 .
(1.96)
Параметр s (1) соответствует неполяризованной, а s (2 ) – поляризованной части волны. Следовательно, с помощью параметров Стокса степень поляризации исходной волны можно выразить в виде: P=
I поляр I полн
s12 + s22 + s32 = . s0
(1.97)
С помощью параметров Стокса можно также записать выражения, определяющие форму и ориентацию эллипса поляризации, связанного с поляризованной частью волны. Если, как и раньше, соотношение ±
b π⎞ ⎛ π = tgχ ⎜ − ≤ χ ≤ ⎟ a 4⎠ ⎝ 4
39
определяет отношение малой и большой осей эллипса поляризации и направление вращения электрического вектора, то на основании соотношений (1.80в) и (1.96) имеем s3
sin 2χ =
s12
+
s22
+
s32
.
(1.98)
Угол ψ (0 ≤ ψ < π) между большой осью и осью Ox определяется в соответствии с выражениями (1.78) и (1.96) соотношением tg 2ψ =
s2 . s1
(1.99)
Итак, параметры Стокса, как и матрица когерентности, служат полезным инструментом
для
систематического
анализа
состояния
поляризации
квазимонохроматической волны. 1.5. Закон сохранения энергии электромагнитного поля
Умножим уравнение (1.12) на E , а уравнение (1.13) на H и образуем разность полученных произведений: E rotH − H rot E =
4π 1 ∂D 1 ∂B jE + E + H . c c ∂t c ∂t
(1.100)
Заметим, что ⎛∂E ∂H div(E × H ) = i ⎜⎜ ×H +E× ∂x ⎝ ∂x ⎛∂E ∂H + k ⎜⎜ ×H +E× ∂z ⎝ ∂z
⎞ ⎟⎟ + ⎠
⎛∂E ∂H ×H +E× j ⎜⎜ ∂y ⎝∂y
⎞ ⎟⎟ + ⎠
⎞ ⎟⎟. ⎠
Из свойств смешанного произведения векторов следует, что ⎛ ∂E ⎞ ⎞ ⎛ ∂E ⎛ ∂H ⎟⎟ , i ⎜⎜ E × i ⎜⎜ ×H ⎟⎟ = H ⎜⎜ i × ∂x ⎠ ∂x ⎝ ⎠ ⎝∂x ⎝
далее. В результате получаем
40
⎛ ∂H ⎞ ⎛∂H ⎞ ⎟⎟ = −i ⎜⎜ × E ⎟⎟ = − E ⎜⎜ i × ∂x ⎝ ⎠ ⎝ ∂x ⎠
⎞ ⎟⎟ ⎠
и так
⎛ ∂H ⎛ ∂E ∂H ∂H ∂E ∂E ⎞ ⎟⎟ − E ⎜⎜ i × div(E × H ) = H ⎜⎜ i × + j× +k × +j× +k × ∂x ∂y ∂z ∂x ∂y ∂z ⎠ ⎝ ⎝ = HrotE − E rotH .
Полученное
векторное
тождество
позволяет
выражение
⎞ ⎟⎟ = ⎠
(1.100)
представить в виде 1⎛ ∂D ∂ B ⎞ 4π ⎟+ ⎜⎜ E +H j E + div (E × H ) = 0 . с ⎝ ∂t ∂ t ⎟⎠ c Умножив это выражение на
(1.101)
c и проинтегрировав по произвольному 4π
объёму, получаем 1 ⎛ ∂D c ∂B ⎞ ⎟ ⎜ E H dV + j E dV + div (E × H ) dV = 0 . + ∫ 4π V∫ ⎜⎝ ∂ t 4π V∫ ∂ t ⎟⎠ V В соответствии с теоремой Остроградского-Гаусса имеем
∫ div (E × H )dV = ∫ (E × H )dS ,
V
где
S
S – замкнутая поверхность, ограничивающая объём V. При этом
полученное выражение можно представить в виде 1 ⎛ ∂D ∂B ⎞ c ⎜⎜ E ⎟⎟ dV + ∫ jE dV + +H ∫ ∫ (E × H )dS = 0 . ∂t ⎠ π 4π V ⎝ ∂ t 4 V S
(1.102)
Используя материальные уравнения (1.3) и (1.5), получаем
( )
E
∂D ∂ 1 ∂ 1 ∂ (E D ) , = E (ε E ) = εE 2 = 2 ∂t 2 ∂t ∂t ∂t
H
1 ∂ ∂ ∂B (H B ) . = H (µH ) = 2 ∂t ∂t ∂t
Обозначим 1 1 E D = we , H B = wm , 8π 8π
∫ (we + wm )dV = W .
V
При этом выражение (1.102) принимает вид: dW c (E × H ) n dS = 0 . + ∫ j E dV + 4π ∫S dt V
41
(1.103)
Плотность тока j в уравнениях Максвелла можно представить в виде суммы токов j = jc + jV ,
(1.104)
где плотность тока проводимости jc = σE ,
а плотность конвекционного тока jV = ρ ⋅ V ,
где V – скорость конвекционного движения заряда. Обозначив скорость движения заряда qk через Vk , будем считать, что Vk << c , где c – скорость света в вакууме. Сила, действующая со стороны поля
(E , B ) на заряд q , движущийся со скоростью V , определяется так называемым законом Лорентца 1 ⎡ ⎤ F = q ⎢ E + (V × B )⎥ , c ⎣ ⎦ основанным на экспериментальных данных. Отсюда следует, что если все заряды qk за время δt смещаются на расстояние δx = Vk δt (k = 1, 2, K) , то полная работа, выполненная при этом, равна δA = ∑ Fk δxk = ∑ qk EkVk δt , k
k
так как Vk (Vk × B ) = 0 . Если число заряженных частиц велико, то распределение зарядов можно считать непрерывным. При этом qk = ρdV , где ρ – плотность зарядов. Тогда последнее равенство можно представить в виде δA = δt ∫ ρV E dV ,
(1.105)
V
при этом интегрирование выполняется по произвольному объёму. Выражение (1.105) удобно представить в виде δA = jV E dV . δt V∫
(1.106)
42
Определим вектор G и скаляр Q соотношениями G=
c E×H 4π
(1.107)
Q = ∫ jc E dV = ∫ σE 2 dV . V
(1.108)
V
Равенство (1.102) и соотношения (1.106)–(1.108) позволяют представить выражение (1.103) в виде dW δA =− − Q − ∫ G n dS . dt δt S
Если
замкнутая
поверхность
(1.109) S
представляет
собой
граничную
поверхность полного поля, то потоком энергии через граничную поверхность можно пренебречь, что эквивалентно равенству ∫ G n dS = 0 . Для непроводящей S
среды
(σ = 0)
величина Q = 0 . При этом выражение (1.109) в результате
интегрирования принимает вид: W + A = 0 . Следовательно, в замкнутой системе в непроводящей среде (т.е. при отсутствии потерь энергии) увеличение энергии W в единицу времени определяется работой по переносу зарядов в течение этого времени. При σ ≠ 0 величина Q , называемая джоулевым теплом, определяет количество теплоты, выделяемой в единицу времени в проводнике из-за наличия электрического сопротивления. Если замкнутая поверхность не охватывает собой полного поля, то поле достигает этой поверхности и в соответствии с выражением (1.109) происходит дополнительное уменьшение энергии, т.е. поверхностный интеграл в выражении (1.109) определяет поток энергии через эту поверхность. Таким образом, величина W определяет полную энергию, заключённую внутри объёма. В непроводящей среде, свободной от зарядов и токов, в соответствии с выражением (1.109) имеем dW d d = ∫ (we + wm )dV = ∫ wdV = − ∫ G n dS . dt dt V dt V S
43
Следовательно, величину we можно отождествить с плотностью энергии электрического поля, а wm – с плотностью энергии магнитного поля. Плотность потока энергии электромагнитного поля определяется так называемым вектором Умова-Пойнтинга, равным G=
c E×H . 4π
(1.107)
Заметим, что впервые вектор плотности потока любого вида энергии был введён в 1874 году русским физиком Николаем Алексеевичем Умовым. Направление вектора Умова-Пойнтинга перпендикулярно векторам E и H и совпадает с направлением распространения электромагнитной энергии, а его величина равна энергии, переносимой в единицу времени через единичную площадку, перпендикулярную вектору G . В оптике наибольший интерес представляет усреднённый вектор УмоваПойнтинга. Величина его служит мерой интенсивности света, а направление указывает направление распространения света. 1.6. Электромагнитное поле на границе раздела двух сред
Любая оптическая система представляет собой систему поверхностей раздела двух сред с различными свойствами, характеризуемыми величинами ε и µ . Уравнения электромагнитного поля можно применить к каждой среде с учётом значений электрических и магнитных параметров, характеризующих каждую среду. Однако, необходимо иметь систему граничных условий, которые связывали бы на границе раздела двух сред два решения уравнений электромагнитного поля, каждое из которых справедливо в отдельности по одну сторону от границы раздела. Выведем соотношения, описывающие переход электромагнитного поля через такую поверхность раздела. Заменим поверхность раздела сред S тонким переходным слоем, внутри которого
ε
и
µ
быстро,
но
непрерывно
меняются
от
значений,
характеризующих среду с одной стороны поверхности, до значений с другой её стороны. Внутри этого слоя построим цилиндр, ограниченный с боков 44
частоколом нормалей к поверхности S в пределах малых площадок δS1 и δS2 , параллельных поверхности S и служащих основаниями цилиндра с каждой её стороны, как показано на рис.1.9. Поскольку во всём цилиндре вектор B и его производные непрерывны, мы можем применить теорему ОстроградскогоГаусса к интегралу от divB , взятому по объёму цилиндра, в виде:
∫ divB dV = ∫ B ⋅ n dS = 0 .
V
(1.110)
S
n12 δS 2
n2 δh
ε2 , µ2
δS1
n1 S
ε1, µ1
Рис.1.9. К выводу граничных условий для нормальных компонентов B и D
Здесь n – единичный вектор внешней нормали. Заметим, что второй интеграл берётся по всей поверхности цилиндра. Так как площадки dS1 и dS2 предполагаются малыми, можно считать, что на них вектор магнитной индукции B принимает постоянные значения B1 и B2 . Тогда выражение (1.110) можно заменить выражением вида: B1n1δS1 + B2 n2δS 2 + вклад от стенок = 0 .
(1.111)
Если высота цилиндра dh стремится к нулю, то переходный слой переходит в поверхность, а вклад от стенок цилиндра исчезает при условии, что отсутствует поверхностный поток магнитной индукции. Такой поток никогда не наблюдается и, следовательно, в пределе имеем
(B1n1 + B2n2 )δS = 0 ,
(1.112)
45
где δS – площадь поверхности пересечения рассматриваемого цилиндра с поверхностью S . Если n12 – единичный вектор нормали, направленный из первой среды во вторую, то n1 = − n12 , а n2 = n12 . При этом соотношение (1.112) принимает вид: n12 (B2 − B1 ) = 0 ,
(1.113)
т.е. нормальная составляющая вектора магнитной индукции непрерывна на поверхности раздела двух сред. Подобным образом можно исследовать электрическое поле на границе раздела двух сред. Однако, в этом случае при наличии зарядов следует учесть выражение (1.10). При этом аналогично выражению (1.110) получаем
∫ divD dV = ∫ D n dS = 4π∫ ρdV .
V
(1.114)
S
При слиянии площадок δS1 и δS2 объёмная плотность зарядов ρ переходит
в
поверхностную
плотность
зарядов
~ ρ,
определяемую
соотношением lim ∫ ρdV = ∫ ~ ρdS .
δh → 0
V
(1.115)
S
Аналогично объёмная плотность тока j переходит в поверхностную ~ плотность тока j : ~ lim ∫ jdV = ∫ j dS .
δh → 0
(1.116)
V
Если площадку δS и высоту δh выбрать достаточно малыми, то выражение (1.114) можно заменить выражением вида: D n δS + D n δS + вклад от стенок = 4π~ ρδS . 1 1
1
2 2
2
Вклад от стенок при уменьшении высоты δh уменьшается, приближаясь к нулю и поэтому в пределе при δh → 0 получаем n (D − D ) = 4π~ ρ, 12
2
1
(1.117)
т.е. при наличии на поверхности раздела сред слоя с поверхностной плотностью заряда ~ ρ нормальный компонент вектора электрического
46
смещения при переходе через эту поверхность испытывает скачок, равный 4π~ ρ. Исследуем теперь поведение тангенциальной составляющей векторов электрического и магнитного полей. Заменим поверхность раздела сред переходным слоем, а цилиндр, показанный на рис.1.9, прямоугольной площадкой, стороны которой параллельны и перпендикулярны поверхности S , как показано на рис.1.10. t2
P2
ε 2µ 2 ε1µ1
Q2
n12 t
P1
t1
Q1
τ
S
Рис.1.10. К выводу граничных условий для тангенциальных компонентов E и H
Пусть
τ – единичный
вектор,
перпендикулярный
плоскости
рассматриваемого прямоугольника. Используя уравнение (1.13), в соответствии с теоремой Стокса имеем 1 &
∫ rotE ⋅ τdS = ∫ E ⋅ dr = − c ∫ B r dS . S
L
(1.118)
S
Здесь первый и третий интегралы берутся по площади прямоугольника, а второй – вдоль его границ. Если длины P1Q1 = δl1 и P2 Q2 = δl 2 малы, то на каждой из этих сторон вектор E можно заменить постоянными векторами E1 и E2 . При этом и вектор B& можно считать постоянным. Тогда выражение (1.118) можно заменить выражением вида: 1& E1t1δl1 + E2t2δl2 + вклад от концов = − B τδlδh , с
(1.119)
где δl – линейный элемент, по которому прямоугольник пересекается с поверхностью раздела, t – единичный вектор касательной к поверхности. Если теперь постепенно уменьшать высоту прямоугольника, то вклад от концов P1P2 и Q1Q2 будет уменьшаться, приближаясь к нулю. Предположим
47
также, что вектор B& при этом остаётся конечным. Тогда в пределе при δh → 0 получим
(E1t1 + E2t2 )δl = 0 .
(1.120)
В соответствии с рисунком t1 = −t = − τ × n12 , t2 = t = τ × n12 . При этом выражение (1.120) принимает вид:
τ[n12 × (E2 − E1 )] = 0 . Так как ориентация прямоугольника, а, следовательно, и единичного вектора τ , произвольна, то n12 × (E2 − E1 ) = 0 ,
(1.121)
т.е. тангенциальная составляющая электрического вектора непрерывна на поверхности раздела двух сред. Аналогичный анализ поведения тангенциальной составляющей магнитного вектора позволяет получить выражение, аналогичное выражению (1.119), вида: 1& 4π ~ H1t1δl1 + H 2t2δl2 + вклад от концов = D τδlδh + j τδl . с c
(1.122)
В результате предельного перехода (δh → 0 ) получаем n12 × (H 2 − H1 ) =
4π ~ j. c
(1.123)
Итак, из полученных соотношений следует, что векторы напряжённости электрического E и магнитного H полей и векторы электрической D и магнитной B индукции удовлетворяют следующим граничным условиям: 1. Тангенциальные составляющие напряжённости электрического поля непрерывны, т.е. Et1 = Et 2 , на границе раздела двух сред, где физические свойства среды, характеризуемые значениями ε и µ , изменяются скачками. 2. Нормальные компоненты вектора электрической индукции непрерывны, т.е. Dn1 = Dn2 , при отсутствии поверхностных зарядов на границе раздела сред.
48
3. Тангенциальные составляющие вектора напряжённости магнитного поля непрерывны, т.е. H t1 = H t 2 , при отсутствии поверхностных токов на границе раздела сред. 4. Нормальные составляющие вектора магнитной индукции непрерывны, т.е. Bn1 = Bn2 . 1.6.1. Плоская волна на границе раздела двух однородных изотропных сред
Применим
соотношения,
которым
удовлетворяют
векторы
электромагнитного поля на поверхностях, где физические свойства среды претерпевают разрыв, к исследованию распространения плоской волны, падающей на плоскую поверхность, разделяющую две однородные изотропные среды. Если на границу раздела двух однородных сред с разными оптическими свойствами падает плоская волна, то она разделяется на две волны: проходящую во вторую среду и отражённую. Существование двух волн определяется необходимостью соблюдения граничных условий прохождения электромагнитного поля на поверхности раздела двух сред. Предположим, что эти волны также являются плоскими, для которых следует определить значения амплитуд и направлений распространения. Индексами i , r и t будем обозначать падающую, отражённую и проходящую (преломлённую) волны. Плоская волна, распространяющаяся в направлении единичного вектора s (i ) , полностью определена, если известно поведение возмущения во времени в одной точке пространства, поскольку, если F (t ) представляет зависимость возмущения от времени в какой-то одной точке, то эта зависимость в другой точке, отстоящей от первой на расстоянии, определяемом вектором r , будет
[ (
) ]
F t − r s (i ) V . Уравнение, определяющее напряжённость E (r , t ) электрического поля или индукцию B (r , t ) магнитного поля, представим в виде: 49
A (r , t ) = A0 exp[− i (ωt − k r )], A0 = a exp(iϕ) , при этом переменная часть фазового множителя в
где
выражении, определяющем гармоническую электромагнитную плоскую волну, равна
⎛ rs⎞ τ = ωt − k r = ω⎜ t − ⎟, V ⎠ ⎝ где s – единичный вектор направления распространения волны; V – скорость (фазовая) распространения волны. На границе двух сред вторичные поля будут так же изменяться во времени, как и первичное поле падающей волны. Следовательно, если s (r ) и s (t ) – единичные векторы в направлении распространения отражённой и падающей волн, то, приравнивая аргумент трёх волновых функций в произвольной точке r ( x, y, z ) на поверхности раздела двух сред, получаем
⎛ r s (i ) ⎞ ⎛ r s (r ) ⎞ ⎛ r s (t ) ⎞ ⎟⎟ = ωr ⎜⎜ t − ⎟⎟ = ωt ⎜⎜ t − ⎟⎟ , ωi ⎜⎜ t − V V V 1 ⎠ 1 ⎠ 2 ⎠ ⎝ ⎝ ⎝ где V1 и V2 – скорости распространения волн в первой и во второй средах. Чтобы
граничные
условия
соблюдались
в
любой
момент
времени,
коэффициенты при t в переменной части фазового множителя должны быть одинаковыми
для
всех
трёх
волн.
Поэтому
частоты
отражённой
и
преломлённой волн равны частоте ωi падающей волны. При этом r s (t ) r s (r ) r s (i ) =t− =t− . t− V2 V1 V1
(1.124)
Выбрав в качестве поверхности раздела сред плоскость z = 0 , соотношения (1.124) можно представить в виде: x s x(i ) + y s (yi ) V1
=
x s x(r ) + y s (yr ) V1
=
x s x(t ) + y s (yt ) V2
.
(1.125)
Равенства (1.125) должны выполняться для любых значений x и y на поверхности раздела, а поэтому
50
(i ) s (yr ) s (yt ) s x(i ) sx(r ) sx(t ) s y = = , = = . V1 V1 V2 V1 V1 V2
(1.126)
Плоскость, определяемая вектором s (i ) и нормалью к поверхности раздела, называется плоскостью падения. Из соотношений (1.126) следует, что и векторы s (r ) и s (t ) лежат в этой плоскости. Считая плоскость xz плоскостью падения и обозначая через θi , θr и θ t углы, которые векторы s (i ) , s (r ) и s (t ) образует с осью Oz , в соответствии с рис.1.11 имеем s x(i ) = sin θi ,
s (yi ) = 0,
⎫ ⎪ ⎪ ⎬ ⎪ ⎪⎭
sz(i ) = cos θi ;
(r ) s x(r ) = sin θr , s y = 0, sz(r ) = cos θr ;
s x(t ) = sin θt ,
s (yt ) = 0,
sz(t ) = cos θt . z
(1.127)
T|| T⊥
A|| A⊥
s (t )
θt 2 1
O s (i )
θi
θr
x
s (r ) R||
R⊥
Рис.1.11
Если волна распространяется из первой среды во вторую, то проекция вектора s на ось Oz положительна, а если в противоположном направлении – то отрицательна. Таким образом,
sz(i ) = cos θi ≥ 0 , sz(r ) = cos θr ≤ 0 , s z(t ) = cos θt ≥ 0 .
(1.128)
Подставив соотношения (1.127) в первую систему равенств (1.126), получаем sin θi sin θ r sin θt = = . V1 V1 V2
(1.129) 51
Отсюда следует, что sin θ r = sin θi , при этом, как следует из соотношений (1.128), cos θ r = − cos θi . Следовательно, θ r = π − θi . Последнее соотношение вместе с утверждением, что нормаль s (r ) к отражённой волне лежит в плоскости падения, соответствует закон отражения плоской волны от плоской поверхности раздела двух сред. Напомним, что в среде, характеризуемой величинами ε и µ , скорость распространения
электромагнитной
волны
V=
c , εµ
где
c – скорость
распространения волны в вакууме. Используя соотношение Максвелла, согласно
которому
показатель
преломления
среды
n = εµ ,
из
соответствующего равенства (1.129) находим, что
εµ sin θi V1 n = = 2 2 = 2 = n12 . sin θt V2 ε1µ1 n1
(1.130)
Следующее отсюда соотношение n1 sin θi = n2 sin θt вместе с утверждением, что нормаль s (t ) к прошедшей волне лежит в плоскости падения, составляет закон преломления (закон Снеллиуса-Декарта) плоской волны на границе раздела двух сред. Если n2 > n1 , то n12 > 1 . При этом говорят, что оптическая плотность второй среды больше, чем первой. В этом случае, учитывая выражение (1.130), имеем sin θt =
1 sin θi ≤ sin θi . n12
Однако, если вторая среда оптически менее плотная, чем первая (т.е. если n12 < 1 ), то угол θt приобретает вещественное значение при том условии, что sin θt =
sin θi ≤ 1. n12
sin 2 θ i sin θi > 1: cos θ t = ±i −1 . При 2 n12 n12 52
Таким образом, при n12 < 1 угол θt приобретает вещественное значение лишь для таких углов падения θi , для которых sin θi ≤ n12 . При sin θi > n12 наблюдается так называемое полное внутреннее отражение. 1.6.2. Формулы Френеля
Определив направления распространения отражённой и преломлённой волн, определим их амплитуды. Предположим, что обе среды (однородные и изотропные) обладают нулевой проводимостью и, следовательно, совершенно прозрачны (нет выделения джоулева тепла, а, следовательно, нет и потерь электромагнитной энергии). Их магнитные проницаемости фактически будут отличаться от единицы на пренебрежимо малые величины, а поэтому будем считать, что µ1 = µ 2 = 1 . Пусть Ei = A exp(− iτ i ) , где A – амплитуда вектора электрического поля падающей волны, которую будем считать комплексной величиной с фазой, равной постоянной части аргумента волновой функции. Переменная её часть имеет вид: ⎛ r s (i ) ⎞ ⎛ x sin θ i + z sin θ i ⎟⎟ = ω⎜⎜ t − τ i = ω⎜⎜ t − V1 V1 ⎠ ⎝ ⎝
⎞ ⎟⎟ . ⎠
(1.131)
Разложим каждый вектор на составляющие компоненты: параллельный (с индексом ||) и перпендикулярный (с индексом ⊥ ) плоскости падения. Выбор положительных
направлений
для
параллельных
и
перпендикулярных
составляющих вектора показан на рис.1.11. Тогда составляющие вектора электрического поля падающей волны в левой системе координат можно записать в виде: E x(i ) = − A|| cos θi exp(− iτ i ), E y(i ) = A⊥ exp(− iτi ), E z(i ) = A|| sin θi exp(− iτi ).
⎫ ⎪⎪ ⎬ ⎪ ⎪⎭
(1.132)
53
Вектор магнитного поля определяется соотношением (1.44), которое при µ = 1 можно представить в виде: H = εs × E .
Это выражение удобно представить в виде: H x i + H y j + H z k = ε (s x i + s y j + s z k )× (E x i + E y j + E z k ). При этом
( ) ε (s ( ) E ( ) − s ( ) E ( ) ), ε (s ( ) E ( ) − s ( ) E ( ) ).
H x(i ) = ε1 s (yi ) E z(i ) − s z(i ) E y(i ) , H y(i ) = H z(i ) =
1
i z
i x
i x
z
i
1
i x
i y
i y
i x
С учётом соотношений (1.127) и (1.132) находим, что составляющие вектора магнитного поля падающей волны в левой системе координат равны
H x(i ) = − A⊥ cos θi ε1 exp(− iτi ), H y(i ) = − A|| ε1 exp(− iτi ), H z(i ) = A⊥ sin θi ε1 exp(− iτi ). Аналогично, если T
и R – комплексные амплитуды прошедшей и
отражённой волн, то соответствующие составляющие векторов электрического и магнитного полей равны следующим величинам. Поле прошедшей волны. Ex(t ) = −T|| cos θt exp(− iτi ),
⎫ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎭
E y(t ) = T⊥ exp(− iτt ), Ez(t ) = T|| sin θt exp(− iτi ); H x = −T⊥ cos θt ε 2 exp(− iτi ), (t )
H y(t ) = −T|| ε 2 exp(− iτt ), H z(t ) = T⊥ sin θt ε 2 exp(− iτi ),
(1.133)
где ⎛ r s (t ) ⎞ ⎛ x sin θt + z sin θt ⎞ ⎟⎟ = ω⎜⎜ t − ⎟⎟ . τt = ω⎜⎜ t − V2 ⎠ V2 ⎝ ⎠ ⎝ Поле отражённой волны. 54
(1.134)
E x(r ) = R|| cos θ r exp(− iτ r ), E y(r ) = R⊥ exp(− iτ r ), E z(r ) = − R|| sin θ r exp(− iτ r ); H x = − R⊥ cos θ r ε1 exp(− iτ r ), (r )
H y(r ) = − R|| ε1 exp(− iτ r ), H z(r ) = R⊥ sin θ r ε1 exp(− iτ r ),
⎫ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎭
(1.135)
⎞ ⎟⎟ . ⎠
(1.136)
где ⎛ r s (r ) ⎞ ⎛ x sin θ r + z sin θ r ⎟⎟ = ω⎜⎜ t − τ r = ω⎜⎜ t − V1 ⎠ V1 ⎝ ⎝
Граничные условия (1.121) и (1.123) требуют, чтобы на границе раздела двух сред тангенциальные составляющие векторов E и H были непрерывны. Следовательно, должны выполняться соотношения E x(i ) + E x(r ) = E x(t ) , H x(i ) + H x(r ) = H x(t ) , E y(i ) + E y(r ) = E y(t ) ; H y(i ) + H y(r ) = H y(t ) ,
⎫⎪ ⎬ ⎪⎭
(1.137) B
при этом условия для нормальных составляющих векторов определяемые
выражениями
(1.113)
и
(1.117),
естественным
и
D,
образом
выполняются. Подставив в соотношения (1.137) соответствующие значения всех
составляющих
векторов
E
и
H
и
учитывая
тот
факт,
что
cos θ r = cos(π − θi ) = − cos θi , при τi = τ r = τ t получаем следующие четыре соотношения
(A|| + R|| )cos θi = T|| cos θt ,
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ⎭
A⊥ + R⊥ = T⊥ ,
ε1 ( A⊥ − R⊥ ) cos θi = ε 2 T⊥ cos θt , ε1 (A|| − R|| ) = ε 2 T|| .
(1.138)
Каждое из уравнений (1.138) содержит составляющие компоненты векторов поля одного типа. Следовательно, волны рассматриваемых двух типов независимы друг от друга. Выразим из уравнений (1.138) составляющие компоненты векторов поля отражённой и прошедшей волн через составляющие компоненты векторов поля падающей волны.
55
Используя соотношения Максвелла n = ε (µ = 1) , получаем T|| =
2n1 cos θi A|| , n2 cos θi + n1 cos θt
2n1 cos θi .T⊥ = A⊥ , n1 cos θi + n2 cos θt R|| = −
n2 cos θi − n1 cos θt A|| , n2 cos θi + n1 cos θt
n cos θi − n2 cos θt R⊥ = 1 A⊥ . n1 cos θi + n2 cos θt
⎫ ⎪ ⎪ ⎬ ⎪ ⎪⎭
(1.139)
⎫ ⎪ ⎪ ⎬ ⎪ ⎪⎭
(1.140)
Используя полученные соотношения и материальные уравнения, легко убедиться в том, что граничные условия (1.113) и (1.117) для нормальных составляющих векторов поля соблюдаются. Соотношения (1.139) и (1.140) называются формулами Френеля. В несколько ином менее общем виде эти формулы были получены Френелем в 1823 году. Умножим числитель и знаменатель первого из уравнений (1.139) на sin θt :
T|| =
2n1 cos θi sin θt 2 sin θt cos θi A|| = A|| = n2 sin θt cos θi + n1 sin θt cos θt sin θi cos θi + sin θt cos θt
=
2 sin θt cos θi A|| = sin θt sin θi (sin θi cos θt + cos θi sin θt ) + cos θt cos θi (sin θi cos θt + cos θi sin θt )
=
2 sin θt cos θi A|| . sin (θi + θt ) cos(θi − θt ) Аналогично преобразуется второе из уравнений (1.139). Теперь умножим на sin θt числитель и знаменатель первого из уравнений
(1.140): R|| = =− =−
n2 sin θ t cos θ i − n1 sin θ t cos θ t sin θ i cos θ i − sin θ t cos θ t A|| = − A|| = n2 sin θ t cos θ i + n1 sin θ t cos θ t sin θ i cos θ i + sin θ t cos θ t
sin θ t sin θ i (sin θ t cos θ i − sin θ i cos θ t ) + cos θ t cos θ i (cos θ t sin θ i − sin θ t cos θ i ) A|| = sin (θ i + θ t ) cos(θ i − θ t )
sin (θ i − θ t ) cos(θ i + θ t ) tg (θ i − θ t ) A|| = − A|| . sin (θ i + θ t ) cos(θ i − θ t ) tg (θ i + θ t )
56
Аналогично преобразуется второе из уравнений (1.140). В результате преобразований уравнения (1.139) и (1.140) приобретают обычно принятую форму: T|| =
2 sin θt cos θi A|| , sin (θi + θt ) cos(θi − θt )
2 sin θt cos θi T⊥ = A⊥ ; sin (θi + θt ) R|| = −
tg (θi − θt ) A|| , tg (θi + θt )
sin (θi − θt ) R⊥ = − A⊥ . sin (θi + θt )
⎫ ⎪ ⎪ ⎬ ⎪ ⎪⎭
⎫ ⎪ ⎪ ⎬ ⎪ ⎪⎭
(1.141)
(1.142)
Так как углы θi и θt вещественны (случай полного внутреннего отражения пока исключаем), то тригонометрические функции, стоящие в правой части уравнений (1.141) и (1.142), также вещественны. Следовательно, фаза каждого компонента отражённой и прошедшей волн либо равна фазе соответствующего компонента падающей волны, либо отличается от неё на π . Так как знаки T|| и T⊥ совпадают со знаками A|| и A⊥ , фаза прошедшей волны равна фазе падающей. При нормальном падении волны угол θi = 0 , а, следовательно, и угол θt = 0 . При этом соотношения (1.141) и (1.142) принимают вид: 2 A|| , n +1 2 T⊥ = A⊥ , n +1
T|| =
n −1 A|| , n +1 n −1 R⊥ = − A⊥ , n +1
R|| = −
где n =
⎫ ⎪⎪ ⎬ ⎪ ⎪⎭
(1.143)
⎫ ⎪⎪ ⎬ ⎪ ⎪⎭
(1.144)
n2 . При этом различие между параллельным и перпендикулярным n1
компонентами исчезает. Из соотношений (1.134) следует, что фаза отражённой волны отличается от падающей на π . С другой, стороны, в случае отражённой 57
волны фаза зависит от относительных значений углов θi и θt . Если оптическая плотность второй среды больше, чем первой (т.е. ε 2 > ε1 ), то θt < θi . При этом, согласно соотношениям (1.142), знаки R|| и R⊥ отличны от знаков A|| и A⊥ , т.е. фазы падающей и отражённой волн отличаются на
π . При тех же
обстоятельствах значение tg (θi − θt ) положительно, но tg (θi + θt ) в знаменателе выражения,
определяющего
величину
R|| ,
при
θi + θt >
π 2
становится
отрицательным; в этом случае фазы компонентов R|| и A|| совпадают. Заметим, что при θi + θt =
π величина R|| = 0 ⋅ A|| = 0 . 2
1.6.3. Коэффициенты отражения и пропускания света на границе раздела двух сред
Интенсивность света (плотность потока энергии электромагнитного поля) в соответствии с выражением (1.107) равна G=
c c ε 2 cn 2 EH = E = E . 4π 4π µ 4πµ
Предположим, что обе среды (однородные и изотропные) обладают нулевой проводимостью и, следовательно, совершенно прозрачны. Их магнитные проницаемости практически будут отличаться от единицы на пренебрежимо малые величины, что позволяет принять µ1 = µ 2 = 1 . При этом интенсивность света равна G=
cn 2 E . 4π
(1.145)
Поэтому световой поток падающей волны, который попадает на единицу площади поверхности раздела сред за одну секунду, равен J (i ) = G (i ) cos θi =
cn1 2 A cos θi . 4π
58
Световой поток отражённой и преломлённой волн, покидающей единицу площади поверхности раздела за одну секунду, определяется подобными же выражениями, а именно: cn1 2 R cos θi ; 4π cn 2 J (t ) = G (t ) cos θt = 2 T cos θt . 4π
J (r ) = G (r ) cos θi =
Отношения J (r ) R ρ = (i ) = 2 J A 2
(1.146)
и J (t ) n2 cos θt T τ = (i ) = n1 cos θi A 2 J 2
(1.147)
называют коэффициентами отражения и пропускания соответственно. 2
2
2
2
2
2
2
2
2
Здесь A = A|| + A⊥ , R = R|| + R⊥ , T = T|| + T⊥ . Используя выражения (1.141) и (1.142), получаем n2 cos θt 2 tg 2 (θi − θt ) 2 sin 2 (θi − θt ) 2 A (ρ + τ) = R + T = 2 A|| + A⊥ + 2 n1 cos θi tg (θi + θt ) sin (θi + θt ) 2
2
2 sin 2 θt cos 2 θi n2 cos θt A|| + +4 2 2 n1 cos θi sin (θi + θt ) cos (θi − θt ) 2 n2 cos θt sin 2 θt cos 2 θi 2 2 A⊥ = A|| + A⊥ . +4 2 n1 cos θi sin (θi + θt )
Отсюда следует, что ρ + τ = 1 . Этот результат непосредственно следует и из закона сохранения энергии. 1.6.4. Поляризация света на поверхности раздела двух сред
Отражение и пропускание света на поверхности раздела двух сред зависит от поляризации падающей волны. Определим коэффициенты отражения и пропускания
света,
поляризованного
плоскости падения.
59
параллельно
и
перпендикулярно
Пусть вектор E падающей волны образует с плоскостью падения угол α i . Тогда A|| = A cos α i , A⊥ = A sin α i . Пусть, далее, 2 cn1 A|| cos θi = J (i ) cos 2 α i , 4π cn 2 J ⊥(i ) = 1 A⊥ cos θi = J (i ) sin 2 α i ; 4π
J ||(i ) =
cn1 2 R|| cos θi , 4π cn 2 J ⊥(r ) = 1 R⊥ cos θi . 4π J ||(r ) =
Тогда (r ) (r ) J ||(r ) J ⊥(r ) J (r ) J || + J ⊥ 2 ρ = (i ) = = (i ) cos α i + (i ) sin 2 α i = (i ) J J J || J⊥
(1.148)
= ρ|| cos 2 α i + ρ ⊥2 sin 2 α i , где
ρ|| = ρ⊥ =
J ||(r ) J ||(i )
=
R|| A||
2 2
tg 2 (θ − θt ) = 2 i tg (θi + θt )
R⊥ sin (θi − θt ) J⊥ . = = J ⊥(i ) A⊥ 2 sin 2 (θi + θt ) (r )
2
2
⎫ ⎪ ⎪⎪ ⎬ ⎪ ⎪ ⎪⎭
(1.149)
Подобным же образом получаем J (t ) τ = (i ) = τ|| cos 2 α i + τ ⊥ sin 2 α i , J
(1.150)
где
J ||(t )
2
n cos θt T|| sin 2θi sin 2θt τ|| = (i ) = 2 = 2 2 n1 cos θi A J || sin (θi + θt ) cos 2 (θi − θt ) || (t )
2
n cos θt T⊥ sin 2θi sin 2θt J . τ ⊥ = ⊥(i ) = 2 = 2 n1 cos θi A⊥ J⊥ sin 2 (θi + θt ) 60
⎫ ⎪ ⎪⎪ ⎬ ⎪ ⎪ ⎪⎭
(1.151)
Легко убедиться, что и в этом случае
ρ|| + τ|| = 1 , ρ ⊥ + τ ⊥ = 1 . При нормальном падении волны различие между параллельным и перпендикулярным компонентами исчезает, при этом, используя соотношения (1.143), (1.144), (1.146) и (1.147), получаем
⎫ ⎪ ⎪ ⎬ ⎪ ⎪⎭
2
⎛ n −1⎞ ρ=⎜ ⎟ ⎝ n + 1⎠ 4n τ= . (n + 1)2
(1.152)
Заметим, что lim ρ = 0 , lim τ = 1. Вполне очевидно, что аналогичные n →1
n →1
результаты получаются и для предельных значений R|| , T|| и R⊥ , T⊥ . z
θt 2 1
O
(i )
θi
(t )
π θr 2
x
(r )
Рис.1.12. К определению угла полной поляризации (угла Брюстера)
Весьма важное явление наблюдается при θi + θt =
π . В этом случае 2
tg (θi + θt ) = ∞ , а, следовательно, в соответствии с первым из выражений (1.149), величина ρ|| = 0 . Как следует из рис.1.12, при θi + θt =
π отражённый и 2
преломлённый лучи перпендикулярны друг другу. Из закона преломления следует, что
61
⎛π ⎞ n2 sin θt = n2 sin ⎜ − θi ⎟ = n2 cos θi = n1 sin θi . ⎝2 ⎠ При этом
tgθi = n .
(1.153)
Угол θi , определяемый этим выражением, называется углом полной поляризации или углом Брюстера. Его важность впервые была отмечена Давидом Брюстером в 1815 году. Если свет падает под этим углом, электрический вектор отражённой волны не имеет составляющей в плоскости падения. 1,0 0,9 0,8 0,7 0,6 0,5 0,4 57°
0,3 0,2
(a )
0,1
θt = 0°
(б ) (в )
10° 20° 30° 40° 50° 60° 70° 80° 90°
Рис.1.13. Зависимость отражательной способности от угла падения: (а) – ρ ⊥ ; (б) –
1 (ρ|| + ρ⊥ ); (в) – ρ|| 2
Зависимость коэффициента отражения света поверхностью стекла (стекло марки БК6 с показателем преломления nd = 1,53998 ) от угла падения θi показана на рис.1.13. Здесь представлены кривые: (а) ρ ⊥ = ρ ⊥ (θi ) , (б)
62
1 (ρ|| + ρ ⊥ ) = ρ||+ ⊥ (θi ) , (в) ρ|| = ρ|| (θi ) . Значения соответствующих величин, 2 вычисленные с использованием формул (1.149), приведены в таблице:
θi
0
20º
45º
57º
70º
80º
90º
(а)
0,045
0,053
0,101
0,165
0,316
0,554
1,000
(б)
0,045
0,045
0,056
0,083
0,178
0,394
1,000
(в)
0,045
0,038
0,010
0
0,041
0,234
1,000
Кривая
Для кривой (б) имеем ρ=
1 (ρ|| + ρ ⊥ ) = ρ|| cos 2 α i + ρ ⊥ sin 2 α i = ρ|| + (ρ ⊥ − ρ|| )sin 2 α i . 2
Отсюда следует, что 1 (ρ ⊥ − ρ|| ) = (ρ ⊥ − ρ|| )sin 2 α i . 2 При этом sin 2 α i =
1 . Таким образом, кривая (б) на рис.1.13 соответствует 2
углу α i = 45° . Направление беспорядочным,
колебаний
в
случайным
естественном образом.
свете
быстро
изменяется
Соответствующее
значение
коэффициента отражения ρ можно получить путём усреднения по всем направлениям. Среднее значение функции sin 2 α равно: 2
sin α cp
π 2
π 2
1
2 2 2 = ∫ sin 2 αdα = − ∫ 1 − cos 2 αd (cos α ) = ∫ 1 − x 2 dx = π0 π0 π0 1
2⎛1 1 2⎛ 1 π⎞ 1 ⎞ = ⎜ x 1 − x 2 + arcsin x ⎟ = ⎜ 0 + ⋅ ⎟ = . 2 π⎝2 2 2⎠ 2 ⎠0 π⎝ Среднее значение функции cos 2 α равно: cos 2 α cp = 1 − sin 2 α cp =
1 . 2
63
Так как средние значения sin 2 α и cos 2 α равны
1 , то для средних 2
значений J ||(i ) и J ⊥(i ) получаем J ||(i ) = J ⊥(i ) =
1 (i ) J . 2
(1.154)
Однако, для отражённого света оба компонента в общем случае неодинаковы. Действительно, используя соотношения (1.154), имеем (r )
J ||
(r )
J⊥
(r ) 1 J || 1 = J (i ) = ρ|| J (i ) , ( i) 2 J || 2
1 = 2
J ⊥(r ) (i ) 1 (i ) (i ) J = 2 ρ ⊥ J . J⊥
При этом коэффициент отражения определится выражением вида: (r ) (r ) J (r ) J || + J ⊥ 1 ρ = (i ) = = (ρ|| + ρ ⊥ ), (i ) 2 J J
(1.155)
т.е. и в этом случае зависимость коэффициента отражения от угла θi будет описываться кривой (б) на рис.1.13. В общем случае отражённый свет частично поляризован. Степень его поляризации P можно определить выражением вида: P=
ρ|| − ρ ⊥ ρ|| + ρ ⊥
.
Учитывая формулу (1.155), это выражение можно представить в виде: P=
{
}
1 ρ|| − ρ ⊥ . 2ρ
Выражением в фигурных скобках определяют иногда поляризованную часть отражённого света. Аналогичные соотношения можно получить и для проходящего света. Можно показать, что для естественного света также справедливо равенство: ρ + τ = 1. В случае линейно поляризованного падающего света отражённый и прошедший свет остаётся линейно поляризованным, так как их фазы либо не
64
изменяются, либо изменяются на π . Однако, направления колебаний в отражённом и проходящем свете изменяются относительно направления колебаний в падающем свете в противоположные стороны. Покажем это. z
(t )
2 1
x
O
(i )
(r )
Рис.1.14. К определению знаков азимутальных углов
Угол α между плоскостью колебаний и плоскостью падения, называемый азимутом колебания, будем считать положительным, если плоскость колебаний поворачивается по часовой стрелке вокруг направления распространения, как показано на рис.1.14. Можно предположить, что азимут колебания изменяется в пределах от −
π π до . Для падающей, отражённой и прошедшей волн 2 2
электрического поля имеем tgα i =
A⊥ R T , tgα r = ⊥ , tgα t = ⊥ . A|| R|| T||
Используя формулы Френеля (1.141) и (1.42), получаем cos(θi − θt ) tgα i , cos(θi + θt )
(1.156)
tgα t = cos(θi − θt )tgα i .
(1.157)
tgα r =
Так как 0 ≤ θi ≤
π π , 0 ≤ θt < (при n > 1), то 2 2
tgα r ≥ tgα i ,
(1.158)
tgα t ≤ tgα i .
(1.159) 65
Знак равенства в соотношении (1.156) справедлив лишь при нормальном или скользящем падении света ( θi = θt = 0 или θi =
π ), а в соотношении 2
(1.157) – лишь при нормальном падении. Из неравенств (1.156) и (1.157) следует, что при отражении угол между плоскостью колебаний и плоскостью падения увеличивается, а при преломлении он уменьшается. В том случае, когда угол падения равен углу Брюстера, т.е. при θi + θt =
π , 2
в соответствии с формулой (1.156) tgα r = ∞ при любом значении угла α i . Из закона Брюстера следует, что свет поляризуется при падении его на границу раздела двух сред под углом Брюстера. Однако, доля отражённого при этом света сравнительно мала. Поляризовать падающий свет без изменения направления
его
распространения
можно
с
помощью
стопы
тонких
плоскопараллельных пластинок. Используя выражения (1.151), находим, что отношение интенсивности двух компонент волны после прохождения через обе поверхности пластинки определяется формулой вида: 2
⎛ τ⊥ ⎞ ⎜ ⎟ = cos 4 (θi − θt ) < 1 . ⎜τ ⎟ ⎝ || ⎠ Таким образом, при выходе из пластинки параллельный компонент преобладает над перпендикулярным, причём степень поляризации тем больше чем больше угол θi . Если угол θi равен углу Брюстера, то θt =
tgθi = n ; при этом получаем 2
4
⎛ τ⊥ ⎞ ⎛ 2tgθi ⎞ ⎛ 2n ⎞ 4 4 ⎜ ⎟ = sin 2θi = ⎜ ⎟ ⎜ 1 + tg 2 θ ⎟ = ⎜⎝ 1 + n 2 ⎟⎠ . ⎜τ ⎟ i ⎠ ⎝ ⎝ || ⎠
66
π − θi , а 2
2
При
nd = 1,56889
(стекло
марки
БК10)
получаем
⎛ τ⊥ ⎞ ⎜ ⎟ ~ = 0,675 . ⎜τ ⎟ ⎝ || ⎠
Следовательно, если свет проходит, например, через пять пластинок, то это отношение равно 0,657 5 ~ = 0,14 . История открытия поляризованного света весьма интересна. Двойное лучепреломление, которое возникает при прохождении света через кристалл исландского шпата, впервые наблюдал датчанин Эразм Бартолини в 1669 году. Х. Гюйгенс подробно исследовал это явление и описал его закономерности с помощью весьма остроумной, хотя и формальной, теории в 1690 году. Первое в истории науки феноменологическое определение поляризации света дал И. Ньютон. Он же ввёл понятие обыкновенного и необыкновенного лучей. Сам термин "поляризация света" был введён французским физиком Э. Малюсом, который более столетия спустя после работ Х. Гюйгенса открыл явление поляризации света при отражении от поверхности стекла и воды. Двойное преломление света в кристаллах можно использовать для превращения естественного света в поляризованный. Сами расщепившиеся в кристалле компонента линейно поляризованы. Для разделения образовавшихся пучков лучей В. Никель впервые предложил остроумное устройство, использующее различие показателей преломления для этих лучей. Оно получило название призмы Николя. Сегодня различных поляризационных призм существует довольно много. Однако, призма Николя сыграла в оптике большую роль и стала настолько популярной, что сегодня "Николь" и "поляризационная призма" – синонимы. В настоящее время наиболее удобный метод получения поляризованного света заключается в использовании так называемых поляроидных плёнок. Их действие
основано
на
свойстве,
известном
как
дихроизм.
Вещества,
обладающие этим свойством, имеют различные коэффициенты поглощения для света, поляризованного в различных
направлениях. Например, можно
изготовить плёнки из поливинилового спирта с внедрённым иодом, которые 67
пропускают почти 80% света, поляризованного в одной плоскости, и менее 1% света, поляризованного в перпендикулярном направлении. 1.6.5. Полное внутреннее отражение
При распространении света из оптически более плотной среды в среду с меньшей оптической плотностью, т.е. когда n = n12 =
ε µ n2 = 2 2 < 1, ε1µ1 n1
sin θt = 1 при sin θi = n12 , при этом θt = 90° , а направление распространения света совпадает с касательной к поверхности раздела. Если величина угла θi превышает предельное значение (sin θi > n12 ) , то свет не входит во вторую среду. Весь падающий свет отражается обратно в первую среду, т.е. в этом случае наблюдается полное внутреннее отражение. Таким образом, поток энергии через границу раздела двух сред отсутствует, однако, тем не менее, электромагнитное поле во второй среде не равно нулю. Действительно, если в фазовом множителе прошедшей волны, определяемом выражением (1.134), положить sin 2 θi 1 sin θt = sin θi , cos θt = ±i −1 , n n2
(1.160)
то получим
⎡
⎛
⎞⎤
⎣
⎝
nV2 ⎠⎦
⎡
x sin θi ωz ⎟⎟⎥ exp ⎢m exp(− iτt ) = exp ⎢− iω⎜⎜ t − где n = n12 =
⎢⎣ V2
⎤ sin 2 θi − 1⎥ , n2 ⎥⎦
n2 . n1
В результате имеем ⎡ ⎛ x sin θi ⎞⎤ ~ ⎟⎟⎥ , E (t ) = T exp(− iτt ) = T exp ⎢− iω⎜⎜ t − nV ⎝ 2 ⎠⎦ ⎣
⎡ ωz sin 2 θ ⎤ ~ i 1 − где T = T exp ⎢m ⎥ при n < 1 . n2 ⎢⎣ V2 ⎥⎦ 68
(1.161)
Выражение
(1.161)
описывает
неоднородную
волну,
которая
распространяется вдоль поверхности раздела сред в плоскости падения (т.е. в направлении оси x ) и меняется экспоненциально с изменением расстояния z от этой поверхности. Напомним, что волна называется неоднородной, если поверхности постоянной амплитуды не совпадают с поверхностями постоянной фазы. При положительном знаке перед корнем в выражении (1.161) при увеличении расстояния z от поверхности амплитуда росла бы неограниченно, что противоречит опыту. При отрицательном знаке амплитуда очень быстро уменьшается
с
глубиной
проникновения
z,
причём
ωz n n z = 2πν z = 2π z = 2π , т.е. эффективная глубина проникновения порядка V2 c λ0 λ длины волны. Экспериментальная проверка наличия возмущения во второй (менее плотной) среде представляет довольно трудную задачу, поскольку любое устройство, используемое для обнаружения возмущения, будет нарушать граничные условия. Грубое подтверждение можно получить, если поместить вторую преломляющую среду на расстоянии около четверти длины волны от поверхности раздела, на которой происходит полное внутреннее отражение, и наблюдать проникновение излучения во вторую среду. И, тем не менее, проникновение поля во вторую (менее плотную) среду наблюдалось в очень тонких опытах Л.И. Мандельштама ещё 1914 году. Чтобы применить формулы Френеля (1.142) к случаю полного внутреннего отражения, перепишем их в виде: R|| = −
sin θi cos θi − sin θt cos θt A|| , sin θi cos θi + sin θt cos θt
⎫ ⎪ ⎪ ⎬ ⎪ ⎪⎭
sin θi cos θt − sin θt cos θi R⊥ = − A⊥ . sin θi cos θt + sin θt cos θi
(1.162)
Подставив в эти выражения значения величин, определяемых формулами (1.160) (при положительном знаке перед квадратным корнем), получаем 69
R|| = −
n 2 cos θi − i sin 2 θi − n 2 n 2 cos θi + i sin 2 θi − n 2 2
R⊥ =
cos θi − i sin θi − n
⎫ ⎪ ⎪⎪ ⎬ ⎪ ⎪ ⎪⎭
A|| ,
2
cos θi + i sin 2 θi − n 2
A⊥ .
(1.163)
Следовательно, R|| = A|| , R⊥ = A⊥ ,
(1.164)
т.е. для каждого компонента интенсивность света, отражённого при полном внутреннем отражении, равна интенсивности падающего света. Таким образом, хотя во второй среде поле отлично от нуля, но поток энергии через поверхность отсутствует. Можно показать, что хотя в общем случае компонент вектора УмоваПойнтинга в направлении, нормальном к границе, конечен, его значение, усреднённое по времени, равно нулю. Это означает, что не существует постоянного потока во вторую среду, а энергия течёт туда и обратно. И, наконец, определим изменение фаз компонент отражённой и падающей волн. На основании соотношений (1.164) можно принять, что R|| A||
iδ
= e || ,
R⊥ = e iδ ⊥ . A⊥ R||
Согласно соотношениям (1.163) каждое из отношений
( )
определяется выражением, имеющим форму ψ ψ ∗
−1
A||
R⊥ A⊥
. Следовательно, если α –
( )
аргумент ψ (т.е. ψ = ae iα , где a и α вещественны), то e iδ = ψ ψ ∗ tg
и
−1
= e 2iα , т.е.
δ = tgα , а поэтому 2 sin 2 θi − n 2 1 tg δ|| = − , 2 n 2 cos θi 2
2
sin θi − n 1 tg δ ⊥ = − . 2 cos θi
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ⎭
(1.165)
70
Отсюда следует, что обе компоненты испытывают скачки фаз разной величины. Вследствие этого линейно поляризованный свет при полном внутреннем отражении оказывается поляризованным эллиптически. При этом для относительной разности фаз δ = δ ⊥ − δ|| имеем 1 1 tg δ ⊥ − tg δ|| 1 2 . tg δ = 2 1 1 2 1 + tg δ ⊥ tg δ|| 2 2
Подставив в это выражение соотношения (1.165) и преобразовав, получаем cos θi sin 2 θi − n 2 1 . tg δ = 2 sin 2 θi
(1.166)
π⎞ ⎛ Это выражение обращается в нуль при скользящем падении ⎜ θi = ⎟ и при 2⎠ ⎝ ~ ~ падении света под критическим углом θi sin θi = n . Между этими двумя
(
)
углами лежит угол, соответствующий максимуму относительной разности фаз. Он определяется уравнением: d d θi
(
)
2 2 2 ⎛ 1 ⎞ 2n − 1 + n sin θ i = 0. ⎜ tg δ ⎟ = ⎝ 2 ⎠ sin 3 θ i sin 2 θ i − n 2
Положив числитель дроби равным нулю, получаем sin 2 θ i =
2n 2 . 1+ n2
(1.167)
Подставив это соотношение в выражение (1.166), получаем формулу, определяющую максимальную величину δ m относительной разности фаз, в виде: 1 1 − n2 . tg δ m = 2 2n
(1.168)
Ещё Френелем было показано, что при полном внутреннем отражении можно из линейно поляризованного света получить свет, поляризованный по кругу. Выбирая направление поляризации падающей волны под углом 45° к плоскости падения (т.е. α i = 45° ), получаем равные амплитуды компонент: 71
A|| = A⊥ . Тогда в соответствии с равенствами (1.164) имеем: R|| = R⊥ . Затем
подбираем величины n и θi таким образом, чтобы относительная разность фаз δ была равна 90° . Для получения такого значения δ при одном отражении необходимо, чтобы в соответствии с соотношением (1.168) π 1− n2 . tg = 1 = 4 2n
При этом n = 2 − 1 = 0,414 . Отсюда следует, что показатель преломления n21 =
1 более плотной среды относительно менее плотной должен быть, по n
крайней мере, не менее 2,41. Это значение показателя преломления довольно велико, хотя непоглощающие вещества, показатель преломления которых приближается или даже превышает его, существуют. Френель использовал два полных внутренних отражения в стекле. Когда n21 = 1,51 , то, согласно соотношениям (1.167) и (1.168), максимальная относительная разность фаз δ m = 45°56′ получается при угле падения θi , равном 51°20′ . Поэтому в соответствии с уравнением (1.166) значение δ = 45° можно получить при одном из следующих углов падения: θi = 48°37′ , θi = 54°37′ . При
этом
разность
фаз
в
90°
возникает
в
результате
двух
последовательных полных внутренних отражений при любом их приведённых углов. Для получения такой разности фаз применяется стеклянный блок, известный как ромб Френеля, главное сечение которого показано на рис.1.15. Линейно поляризованный свет
Свет, поляризованный по краю
54°37′ Рис.1.15. Ромб Френеля
72
Вполне очевидно, что ромб Френеля можно использовать для получения эллиптически поляризованного света. В этом случае азимут падающего (линейно поляризованного) света должен отличаться от 45° . Можно также с помощью ромба Френеля получить линейно поляризованный свет из света, поляризованного эллиптически. Измерение предельного (критического) значения угла θi позволяет удобно и достаточно точно определять показатель преломления, используя равенство
n = sin θi .
Приборы,
используемые
рефрактометрами.
73
для
этой
цели,
называются
Глава 2 ОСНОВЫ ГЕОМЕТРИЧЕСКОЙ ОПТИКИ 2.1. Основное уравнение геометрической оптики Рассмотрим гармоническое электромагнитное поле общего вида
E (r ,t ) = E0 (r ) exp(− iωt ),
⎫ ⎬ ⎭
H (r ,t ) = H 0 (r ) exp(− iωt ), где вектора
E0 (r ) и
(2.1)
H 0 (r ) определяются комплексными векторными
функциями положения, при этом вещественные части стоящих справа выражений описывают физические поля. Подставив выражения (2.1) в уравнения Максвелла (1.14)–(1.17), в среде, свободной от зарядов и токов, получаем rot E0 − ik 0 µ H 0 = 0 ,
(2.2)
rot H 0 + ik 0 µ E0 = 0 ,
(2.3)
div ε E0 = 0
(2.4)
div µ H 0 = 0 .
(2.5)
При выводе этих уравнений были использованы материальные уравнения D = ε E , B = µ H и соотношения k 0 =
ω 2π = , где λ 0 – длина волны в вакууме. c λ0
Однородную плоскую волну, распространяющуюся в среде с показателем преломления n = εµ в направлении, определяемом единичным вектором s , можно представить следующими векторными функциями:
E0 (r ) = e exp(ik 0 ns ⋅ r ),
H 0 (r ) = h exp(ik 0 ns ⋅ r ),
⎫ ⎬ ⎭
(2.6)
где e и h – постоянные векторы, в общем случае комплексные. На достаточно больших расстояниях от малого источника поля s ⋅ r ≈ r . Поэтому разумно предположить, что в этих случаях поле общего типа можно представить в виде: E0 (r ) = e (r ) exp[ik 0 L(r )],
H 0 (r ) = h (r ) exp[ik 0 L(r )],
⎫ ⎬ ⎭
(2.7) 3
где L(r ) – "оптический путь" – вещественная скалярная функция положения; e (r ) и h (r ) – векторные функции положения, обязательно комплексные, если
необходимо учесть все возможные состояния поляризации излучения. Применив к выражениям (2.7) хорошо известные векторные тождества, получаем rot E0 = (rot e + ik 0 grad L × e ) exp (ik 0 L ) ,
(2.8)
div ε E0 = (ε div e + e ⋅ grad ε + ik 0 ε e ⋅ grad L ) exp (ik 0 L ) .
(2.9)
Аналогичные выражения получаем для rot H 0 и для div µ H 0 . Полученные выражения позволяют преобразовать уравнения (2.2)–(2.5) к виду:
grad L × e − µ h = −
1 rot e , i k0
(2.10)
grad L × h + ε e = −
1 rot h , i k0
(2.11)
e grad L = −
1 (e grad ln ε + div e ), i k0
(2.12)
h grad L = −
1 (h grad ln µ + div h ) . i k0
(2.13)
Пусть λ 0 → 0 . При этом k 0 → ∞ . Если в этом случае выражения, которые
умножаются на
1 , не будут чрезвычайно большими, то правыми частями i k0
уравнений (2.10)–(2.13) можно пренебречь и записать их в виде: grad L × e − µ h = 0 ,
(2.14)
grad L × h + ε e = 0 ,
(2.15)
e ⋅ grad L = 0 ,
(2.16)
h ⋅ grad L = 0 .
(2.17)
Легко видеть, что уравнения (2.16) и (2.17) получаются из уравнений (2.14) и (2.15), если умножить их скалярно на grad L.
4
Из уравнения (2.14) следует, что h =
1 grad L × e . При этом уравнение µ
(2.15) можно представить в виде:
[
]
1 (e ⋅ grad L ) ⋅ grad L − e (grad L )2 + ε e = 0 . µ
(2.18)
В соответствии с уравнением (2.16) первый член полученного уравнения обращается в нуль. При этом, поскольку вектор e не равен нулю во всём рассматриваемом пространстве, получаем:
( grad L )2 = n 2 ,
(2.19)
где n = εµ – показатель преломления среды. Функцию L(r ) называют эйконалом, а уравнение (2.19) – уравнением эйконала. Важно обратить внимание на то, что уравнение (2.19) получено в предположении, что
λ 0 → 0 . Раздел оптики, в котором пренебрегают
конечностью длин волн, что соответствует предельному переходу при λ 0 → 0 , называется
геометрической
оптикой,
поскольку
в
этом
приближении
оптические законы можно сформулировать на языке геометрии. Уравнение (2.19) называют основным уравнением геометрической оптики. Поверхности
L(r ) = const
называют
геометрическими
волновыми
поверхностями или геометрическими волновыми фронтами. Заметим, что в однородной среде в областях, свободных от зарядов и токов любая из декартовых компонентов A(r , t ) векторов поля E и H удовлетворяет однородному волновому уравнению (1.25), например, в форме
n 2 ∂ 2 A(r , t ) ∇ A(r , t ) = 2 , c ∂t2 2
решение которого можно записать в виде: A( x, y, z; t ) = A(r , t ) = A0 (r ) exp{ik 0 [L(r ) − ct ]}, где A0 (r ) и L(r ) – действительные величины. Величину A0 (r ) удобно заменить величиной exp a(r ) . При этом
5
∇ 2 A = div gradA = div[ Agrad (a + ik 0 L )] . Используя тождество ∇( fA ) = f∇A + A ∇f ′ , получаем ∇ 2 A = Adivgrad (a + ik 0 L ) + grad (a + ik 0 L )gradA = A∇ 2 (a + ik 0 L ) +
[
+ A grad (a + ik 0 L )
2
или
]
[
{
]}
∇ 2 A = A ∇ 2 (a + ik 0 L ) + grad (a + ik 0 L ) . 2
n2 ∂2 A Кроме того, 2 2 = − n 2 k 02 A . c ∂t
В результате имеем
[
]
A ∇ 2 a + ik 0∇ 2 L + ( grad a ) + 2ik 0 ( grad a )( grad L ) − k 02 ( grad L ) + n 2 k 02 = 0
или
2
{∇ a + (grad a )
2
2
[
2
]}
{
}
− k 02 ( grad L ) − n 2 + ik 0 2( grad a )( grad L ) + ∇ 2 L = 0 . 2
Разделив это уравнение на k 02 , получаем:
(grad L )
2
[
]
{
}
λ20 λ 2 − n − 2 ∇ 2 a + ( grad a ) − i 0 2( grad a )( grad L ) + ∇ 2 L = 0 . 2π 4π 2
В пределе при λ → 0 из равенства нулю действительной части получаем основное уравнение геометрической оптики в форме (2.19). Формулу (2.19) можно представить в виде: 2
2
2
⎛ ∂L ⎞ ⎛ ∂L ⎞ ⎛ ∂L ⎞ 2 ⎜ ⎟ + ⎜⎜ ⎟⎟ + ⎜ ⎟ = n . ⎝ ∂x ⎠ ⎝ ∂y ⎠ ⎝ ∂z ⎠
(2.20)
Формулы (2.19) и (2.20) справедливы лишь тогда, когда изменения a(r ) на расстояниях, сравнимых с длиной волны, малы по сравнению с самой величиной a(r ) . Поэтому нельзя ожидать, что геометрическая оптикадаст правильное описание поля, например, на границе тени, так как там интенсивность света резко меняется, или вблизи точек, где происходит резкая концентрация света (например, вблизи резкого изображения точки). Ответ на вопрос о распространении интенсивности поля в таких областях даёт теория дифракции. 6
2.2. Световые лучи
Энергия,
протекающая
через
основание
цилиндра,
ось
которого
параллельна орту s , а площадь поперечного сечения равна единице, за время t равна энергии, содержащейся в цилиндре длиной V ⋅ t , где V – скорость распространения электромагнитного поля в пространстве. Следовательно, поток энергии, равный энергии, протекающей через основание цилиндра в единицу времени, равен V ⋅ w , где w – плотность энергии электромагнитного поля. Плотности электрической и магнитной энергии соответственно равны we =
1 1 E D , wm = H B, 8π 8π
при этом плотность энергии электромагнитного поля равна w = we + wm . Учитывая соотношение (1.45), получаем w=
ε 2 µ 2 E = H . 4π 4π
(2.21)
С другой стороны, вектор Умова-Пойнтинга в соответствии с выражением (1.107) равен G=
c c c ε 2 c µ 2 E×H = EHs = E s= H s. 4π 4π 4π µ 4π ε
(2.22)
Сравнивая выражения (2.21) и (2.22), получаем
G=
c w⋅ s =V ⋅ w⋅ s . εµ
(2.23)
Отсюда следует, что вектор Умова-Пойнтинга определяет поток энергии и по величине, и по направлению распространения. Векторы электрической и магнитной напряжённости гармонического электромагнитного поля можно представить выражениями вида:
E (r , t ) = Re{E0 (r ) exp(− iωt )} =
[
]
1 E0 (r ) exp(− iωt ) + E0∗ (r ) exp(− iωt ) , 2
H (r , t ) = Re{H 0 (r ) exp(− iωt )} =
[
(2.24)
]
1 H 0 (r ) exp(− iωt ) + H 0∗ (r ) exp(− iωt ) , (2.25) 2
7
где E0 и H 0 – комплексные векторные функции координат. Так как частоты колебаний в оптическом диапазоне излучения очень велики ( ω достигает величины порядка 1015 c −1 ), непосредственно наблюдать мгновенные значения ни одной из таких быстро осциллирующих величин невозможно. Можно говорить лишь об их значениях, усреднённых за некоторый интервал времени − τ ≤ t ≤ τ , который велик по сравнению с периодом колебаний T =
2π . В частности, средняя по времени плотность ω
энергии электрического поля равна τ
τ
[
1 ε 2 ε 1 2 we = E dt = E exp(− 2iωt ) + 2 E0 E0∗ + ∫ ∫ 2τ − τ 8π 16πτ − τ 4
]
+ E0∗ exp(2iωt ) dt . 2
Здесь τ
τ
1 1 exp(− 2iωt )dt = − exp(− 2iωt ) = ∫ 2τ − τ 4iωτ −τ =−
1 [exp(− 2iωt ) − exp(2iωt )] = 1 T sin 2ωτ . 4iωτ 4π τ
Поскольку время τ велико по сравнению с периодом T , величина
T мала τ
по сравнению с единицей, а поэтому интегралом, содержащим exp(− 2iωt ) , можно
пренебречь.
Подобным
же
образом
можно
показать,
что
τ
1 T 1 sin 2ωτ , а следовательно, и интегралом, содержащим exp(2iωt )dt = ∫ 4π τ 2τ − τ exp(2iωt ) можно пренебречь. В результате окончательно получаем we ≈
ε E0 E0∗ . 16π
(2.26)
Аналогично находим, что средняя по времени плотность энергии магнитного поля равна wm ≈
h H 0 H 0∗ . 16π
(2.27) 8
Среднее по времени значение вектора Умова-Пойнтинга равно τ
τ
1 c (E × H )dt = c 1 ∫ 1 [E0 × H 0 exp(− 2iωt ) + G = ∫ 2τ − τ 4π 4π 2 τ − τ 4
+ E0 × H 0∗ + E0∗ × H 0 + E0∗ × H 0∗ exp(2iωt )]dt ≈ ≈
(
)
{
(2.28)
}
c c E0 × H 0∗ + E0∗ × H 0 = Re E0 × H 0∗ . 16π 8π
Подставив выражения (2.7) в выражения (2.26) и (2.27), получаем ε µ e ⋅ e ∗ , wm = h ⋅ h ∗. 16π 16π
we =
(2.29)
Из выражений (2.14) и (2.15) следует, что 1 gradL × e µ
(2.30)
1 e ∗ = − gradL × h ∗ . ε
(2.31)
h=
При этом выражения (2.29) принимают вид we = − wm =
(
)
(
)
1 1 e gradL × h ∗ = e × h ∗ gradL , 16π 16π
(
)
1 (gradL × e )h ∗ = 1 e × h ∗ gradL . 16π 16π
В результате имеем we = wm =
(
)
1 e × h ∗ gradL . 16π
Следовательно, в приближении геометрической оптики усреднённые по времени плотности электрического и магнитного полей равны друг другу. Подставив выражения (2.7) в выражение (2.28), получаем G =
{
}
c Re e × h ∗ . 8π
Используя соотношение (2.30), полученное выражение можно представить в виде: G =
{ (
)}
{(
)
}
c c Re e × gradL × e ∗ = Re e ⋅ e ∗ gradL − (e gradL )e ∗ . 8πµ 8πµ
В соответствии с уравнением (2.16): e gradL = 0 .
9
При этом G =
{(
)
}
(
)
c c Re e ⋅ e ∗ gradL = e ⋅ e ∗ gradL . 8πµ 8πµ
Первое из выражений (2.29) позволяет представить полученное выражение в виде G =2
c we gradL . εµ
(2.32)
Средняя по времени плотность полной энергии w = we + wm = 2 we . При εµ = n 2 отношение
grad L c в соответствии с = V , а отношение n εµ
уравнением (2.19) эйконала определяет некоторый единичный вектор s , равный
s=
gradL gradL = . n gradL
(2.33)
В результате получаем, что G =V w s .
(2.34)
Отсюда следует, что направление усреднённого по времени вектора Умова-Пойнтинга совпадает с нормалью к геометрическому волновому фронту, а абсолютная его величина равна произведению средней плотности энергии на скорость V =
c . Выражение (2.34) свидетельствует о том, что в приближении n
геометрической оптики средняя плотность полной энергии электромагнитного поля распространяется со скоростью V =
c . Полученные результаты позволяют n
ввести понятие геометрических световых лучей. Геометрические световые лучи можно определить как траектории перемещения плотности световой энергии, ортогональные геометрическим волновым фронтам L = const , при этом направление перемещения в каждой точке траектории совпадает с направлением усреднённого вектора УмоваПойнтинга.
10
Если радиус-вектор r (s ) точки P, расположенной на луче, рассматривать как функцию длины s дуги луча, то в соответствии с рис.2.1 отношение dr = s , при этом уравнении луча в соответствии с выражением (2.33) можно ds
представить в виде: n
dr = gradL(r ) ds
(2.35)
P
P2
dr
s
P1 r0
r
Рис.2.1
Умножив уравнение (2.35) скалярно на орт s , получаем
n=
dr gradL(r ) . ds
Но
dr gradL(r ) =
∂L( x, y, x ) ∂L( x, y, x ) ∂L( x, y, x ) dx + dy + dz = dL(r ) . ∂x ∂y dz
При этом
n=
dL(r ) . ds
(2.36)
Дифференцируя выражение (2.35) по s , получаем
d ⎛ dr ⎞ d d dr d dL dn dr = = gradL = gradn , ⎜ n ⎟ = gradL = ds ⎝ ds ⎠ ds dr ds dr ds dr dr то есть
d ⎛ dr ⎞ ⎜ n ⎟ = gradn . ds ⎝ ds ⎠
(2.37)
11
В однородной среде n = const , при этом уравнение (2.37) принимает вид:
d 2r = 0 . Очевидное решение этого уравнения можно представить в виде: ds 2 r = sa + b , где a и b – постоянные векторы. Это решение представляет собой уравнение прямой линии, направленной вдоль вектора a и проходящей через точку r = b . Следовательно, в однородной среде световые лучи есть прямые линии. Рассмотрим два волновых фронта: L1 = L = const и L2 = L + dL = const , как показано на рис.2.2. Из выражения (2.36) следует, что приращение эйконала
dL(r ) определяется произведением расстояния между волновыми фронтами на показатель преломления среды. Интеграл
∫ nds
вдоль кривой, определяющей
траекторию луча, называется оптической длиной этой кривой.
L = const
L + dL = const
ds
Рис.2.2. Смещение волнового фронта на расстояние ds
Представим себе, что два фиксированных положения волнового фронта связаны между собой множеством световых лучей, проходящих на своём пути оптические
среды,
разделяющие
рассматриваемые
волновые
фронты.
Обозначая квадратными скобками оптическую длину произвольного луча, проходящего через соответствующие точки P1 и P2 волнового фронта в первом и во втором положениях (смотри, например, рис.2.1), получаем: P2
[P1P2 ] = ∫ nds = L(P2 ) − L(P1 ) .
(2.38)
P1
12
Так как значение эйконала L при каждом положении волнового фронта постоянно, то постоянна и разность эйконалов при двух фиксированных положениях волнового фронта. При этом из выражения (2.38) следует, что P2
∫ nds =const .
(2.39)
P1
С другой стороны, nds =
c ds = cdt , где dt – время прохождения световой V
волной расстояния ds вдоль луча (время распространения поля или переноса световой энергии на расстояние ds вдоль луча). Следовательно, время распространения световой волны от точки P1 до точки P2 равно T2
P
1 2 T = ∫ dt = ∫ nds =const . c P1 T1 Основываясь на этой физической интерпретации выражения (2.39), его называют
законом
формулируют
так:
таутохронизма оптическая
(законом
длина
одновременности),
световых
лучей
однако,
между
двумя
фиксированными положениями волнового фронта постоянна.
2.3. Закон преломления
Учитывая тождество уравнением
(2.35)
вектор
rotgrad = 0 , находим, что в соответствии с ns = n
dr , ds
называемый
лучевым
вектором,
удовлетворяет соотношению: rotns = 0 .
(2.40)
Рассмотрим прохождение луча через поверхность раздела двух сред. Заменим поверхность раздела сред S тонким переходным слоем, внутри которого величины ε и µ быстро, но непрерывно меняются от значений, характеризующих среду с одной стороны поверхности, до значений – с другой её стороны. Построим элементарную прямоугольную площадку, стороны
13
которой P1Q1 и P2Q2 параллельны, а стороны P1 P2 и Q1Q2 перпендикулярны к поверхности S , как показано на рис.2.3. t2
Q2
P2
t
ε2 , µ2 ε1, µ1
S
N12
t1
τ
Q1
P1
Рис. 2.3. К выводу закона преломления
Пусть
t – единичный вектор касательной к поверхности, а
N12 –
единичный вектор нормали, направленный из первой среды во вторую. Если обозначить через τ единичный вектор нормали к элементарной площадке, то, интегрируя выражение (2.40) по площади элемента и используя теорему Стокса, получаем:
∫ (rotns )τd ∑ = ∫ ns dr ,
∑
(2.41)
С
где второй интеграл берётся по ограничивающему элементарную площадку d ∑ контуру
P1Q1Q2 P2 P1 . Если длина отрезков
P1Q1 = δl1 ,
P2Q2 = δl2
и
P1 P2 = Q1Q2 = δh мала, то на каждой из этих сторон вектор ns можно заменить постоянными векторами n1s1 и n2 s 2 . Тогда этот интеграл можно представить в виде суммы: n1s1 ⋅ t1 δl1 + n2 s2 ⋅ t 2 δl2 +
1 (n1s1 + n2 s2 ) (N12 + N 21 )δh = 0 . 2
(2.42)
При δh → 0 справедливо равенство δl1 = δl2 = δl . При этом выражение (2.42) принимает вид:
(n1s1t1 + n2 s2t 2 )δl = 0 .
(2.43)
В соответствии с принятым на рис.2.3 направлением векторов имеем: t1 = −t = − τ × N12 ; t 2 = t = τ × N12 .
14
Подставив эти соотношения в выражение (2.43), получаем:
(n2 s2 − n1s1 ) (τ × N12 ) = τ [N12 × (n2 s2 − n1s1 )] = 0 , или N12 × (n2 s2 − n1s1 ) = 0 .
(2.44)
Отсюда следует, что тангенциальная составляющая лучевого вектора ns непрерывна при переходе через поверхность раздела двух сред или, что то же ~ самое, вектор N12 = n2 s2 − n1s1 перпендикулярен к этой поверхности в точке ~ падения луча, при этом N12 = µN12 , где µ – скалярный множитель, называемый астигматической постоянной или постоянной отклонения. N12
n2
n2 s 2 i2
S
~ N12
n1s1
i1 n1
Рис. 2.4. К выводу закона преломления
Пусть i1 и i2 – углы, образованные падающим и преломлённым лучами с нормалью к поверхности раздела двух сред в точке падения, т.е. с нормалью
N12 , как показано на рис.2.4. Тогда в соответствии с выражением (2.44) имеем: n2 (N12 × s 2 ) = n1 (N12 × s1 ) ,
(2.45)
при этом:
n2 sin i2 = n1 sin i1 .
(2.46)
Итак, в соответствии с выражением (2.45) луч падающий, нормаль к поверхности раздела сред в точке падения луча и луч преломлённый лежат в одной плоскости. При этом в соответствии с выражением (2.46) отношение
15
синуса угла падения луча к синусу угла преломления равно отношению показателей преломления сред
n2 . Эти два положения, выражаемые n1
формулами (2.45) и (2.46), определяют закон преломления Снелиуса-Декарта. Обратимся вновь к выражению (2.44) и покажем применение его для построения хода преломлённого луча. Умножив это выражение на некоторый масштабный множитель M , получаем
(Mn′s ′ − Mns ) × N = 0 .
(2.47)
Пусть на преломляющую поверхность произвольной формы в точку Q падает луч, направление которого определяется ортом s , как показано на рис.2.5. Отложим от точки Q в направлении орта s отрезок QA1 , равный nM единиц линейной меры (например, 100n мм). Из точки A1 в направлении орта
N проведём линию. На этой линии определим положение точки A2 , удалённой от точки Q на расстояние QA2 = n′M тех же единиц линейной меры, например, с помощью циркуля. Через точки Q и A2 проведём линию, направление которой определим ортом s ′ . Поскольку построения на рис.2.5 выполнены в соответствии с формулой (2.47), орт s ′ определяет направление хода преломлённого луча.
n′ n
A1
N
nM n′M Q
A2
s′ N
s
Рис.2.5. Преломление луча на поверхности раздела двух сред
С другой стороны, из выражения (2.44) следует, что
n′s ′ = ns + µN .
(2.48) 16
Эта формула является основной в методе расчёта хода луча через систему сферических, а также несферических поверхностей, предложенном Иваном Васильевичем Лебедевым в 1938 году (журнал "Оптико-механическая промышленность", 1938, №7). Умножив скалярно обе части выражения (2.48) на вектор N , получаем
µ = n′ cos i ′ − n cos i .
(2.49)
Используя закон преломления в форме (2.49) легко преобразовать к виду:
µ = n′ 2 − n 2 + (nN s ) − nN s . 2
(2.50)
Для луча, отражённого поверхностью, имеем: n′ = n , а i ′ = π − i . При этом
µ = −2n cos i = −2nN s . Подставив это соотношение в выражение (2.48), при n′ = n получаем s ′ = s − 2 N (N s ) .
(2.51)
Формула (2.51) является одной из основных, применяемых при решении задач юстировки зеркальных и зеркально-призменных систем. Выразим орты s , N и s ′ через их проекции на оси декартовых координат:
s = sxi + s y j + sz k , N = N xi + N y j + N z k , s ′ = s ′x i + s ′y j + s ′z k . Подставив эти выражения в формулу (2.51), преобразуем её к виду:
⎛ s ′x ⎞ ⎛ sx ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ s ′y ⎟ = m′⎜ s y ⎟ , ⎜ s′ ⎟ ⎜s ⎟ ⎝ z⎠ ⎝ z⎠
(2.52)
где матрица m′ имеет вид:
⎛ 1 − 2 N x2 ⎜ m′ = ⎜ − 2 N x N y ⎜ ⎝ − 2N x N z
− 2N x N y 1 − 2 N y2
− 2N y N z
− 2N x N z ⎞ ⎟ − 2N y N z ⎟ . ⎟ 1 − 2 N z2 ⎠
17
(2.53)
2.4. Принцип Ферма
Принцип
Ферма,
известный
теперь
как
принцип
наикратчайшего
оптического пути, утверждает, что оптическая длина реального луча между P2
любыми двумя оптически несопряжёнными точками P1 и P2 , равная
∫ nds ,
P1
короче оптической длины любой другой кривой, соединяющей эти точки и лежащей в некоторой регулярной окрестности луча. Под регулярной окрестностью понимается область, которую можно заменить лучами таким образом, что через каждую её точку будет проходить один (и только один) луч. Покажем справедливость принципа Ферма в случае прохождения света через одну преломляющую поверхность произвольной формы, разделяющую две однородные среды с показателями преломления n и n′ .
n′
n N2 M
−i
N1 P1
− i′
P2
S Рис.2.6. Принцип Ферма и закон преломления
Обратимся к рис.2.6, на котором показан путь луча, проходящего через оптически несопряжённые точки
P1 и
P2
и падающего в точку
N1
преломляющей поверхности S , который образует с нормалью к поверхности в точке падения луча углы i и i ′ . Выберем на преломляющей поверхности точку
N 2 , бесконечно близкую к N1 . При этом отрезок кривой N1 N 2 будем считать величиной
первого
порядка
малости,
что
позволяет
заменить
его
дифференциалом: N1 N 2 = dS . Соединив точку N 2 с точками P1 и P2 , получим путь P1 N 2 P2 , соседний с путём P1 N1 P2 луча. Оптическая длина хода луча P1 N1 P2 18
может быть представлена в виде: [P1 P2 ] = ns + n′s ′ , где s = P1N1 , а s ′ = N1 P2 . При переходе от траектории луча P1 N1 P2 к соседней траектории P1 N 2 P2 оптическая длина хода луча получит приращение, равное:
d [P1P2 ] = nds + n′ds′ .
(2.54)
Чтобы определить величину этого приращения, восстановим в точке N1 перпендикуляр N1M к лучу P1 N 2 . Из-за малости угла N1 P1 N 2 можно принять
P1M ≈ P1 N1 . Поэтому отрезок MN 2 можно рассматривать как приращение ds отрезка P1 N1 = s при замене пути луча P1 N1 путём P1 N 2 . Пренебрегая величинами выше первого порядка малости, из треугольника MN1 N 2 находим, что ds = − dS sin i . При этом приращение отрезка N1P2 = s′ равно ds′ = dS sin i′ . Полученные выражения позволяют равенство (2.54) представить в виде:
d [P1 P2 ] = (n′ sin i ′ − n sin i )dS .
(2.55)
Отсюда получаем d [P1 P2 ] = n′ sin i ′ − n sin i . dS
При соблюдении закона преломления имеем: d [P1P2 ] = 0, dS
(2.56)
т.е. при соблюдении закона преломления длина оптического пути [P1P2 ] имеет экстремальное значение, что свидетельствует о справедливости принципа Ферма. С другой стороны, можно считать, что при соблюдении принципа Ферма равенство n′ sin i ′ = n sin i определяет закон преломления. Если каждому числу x из чисел некоторого класса сопоставлено другое число y , то, как известно, мы имеем дело с функцией y = y ( x ) . Если каждой
функции y ( x ) из некоторого класса функций сопоставлено некоторое число F , то говорят, что задан функционал F [ y ( x )] . Вариацию функционала обозначают символом δF [ y ( x )] . Вариация функционала является аналогом дифференциала функции. Для достижения функционалом F [ y ( x )] экстремального значения 19
необходимо, чтобы вариация (если она существует) при некоторой функции y=~ y ( x ) обращалась в ноль. Учитывая изложенное, принцип Ферма в обозначениях аппарата вариационного исчисления можно записать в виде: P2
δ ∫ nds = 0 .
(2.57)
P1
Поскольку n =
c , где c = const , выражение (2.57) можно представить V
эквивалентным выражениям вида: P2
ds = 0, V P1
δ∫
(2.58)
T2
т.е. δ ∫ dt = 0 . T1
С другой стороны, k = nk 0 , т.е. λ 0 = nλ , что позволяет выражение (2.57) представить в виде: P2
ds = 0. λ P
δ∫
(2.59)
1
Принцип Ферма содержит в себе и обобщает следующие положения лучевой оптики: 1. Закон преломления распространения света в однородной среде, т.е. в среде с постоянным показателем преломления. 2. Законы преломления и отражения лучей на поверхностях раздела сред, т.е. на тех поверхностях, где показатель преломления меняется скачком. 3. Позволяет рассчитать путь света в среде с показателем преломления, непрерывно изменяющимся вдоль пути, для которого справедливо уравнение (2.57). 4. Устанавливает закон обратимости светового пути, в соответствии с которым линия, представляющая собой возможный путь течения световой энергии, распространяющейся в одном направлении, есть также возможный путь её течения в обратном направлении.
20
Действительно, если вариация интеграла (2.57) равна нулю, когда он берётся в пределах от P1 до P2 , то она также равна нулю при перемене пределов интегрирования местами (т.е. в пределах от P2 до P1 ). Следует помнить, что все приведённые выше положения применимы только в пределах тех условий, в которых справедливы законы геометрической (лучевой) оптики.
2.6. Интегральный инвариант Лагранжа-Пуанкаре
Предположим, что показатель преломления n является непрерывной функцией координат. Тогда, применив теорему Стокса к интегралу от нормального компонента rot ns , взятому по любой открытой поверхности, получаем:
∫ n s ⋅ dr = 0 .
(2.60)
C
Интегрирование
выполняется
по
замкнутому
контуру
C,
ограничивающему указанную поверхность. Полученное выражение называется интегральным инвариантом Лагранжа-Пуанкаре и означает, что интеграл P2
∫ n s ⋅ dr , взятый между любыми двумя точками поля
P1 и P2 , не зависит от
P1
пути интегрирования. Можно показать, что формула (2.60) остаётся справедливой и в том случае, когда контур C пересекает поверхность, разделяющую две однородные среды с разными показателями преломления. Для доказательства этого будем считать, что контур C делится на части C1 и C2 , расположенными по разные стороны от преломляющей поверхности S , а точки пересечения контура C с поверхностью S соединены другой кривой K , лежащей на этой поверхности, как показано на рис.2.7.
21
C2 S K
C1
n2 n1
Рис.2.7. К выводу инварианта Лагранжа-Пуанкаре при наличии поверхности раздела двух однородных сред
Применяя формулу (2.60) к обоим контурам C1 K и C2 K и складывая полученные выражения, имеем:
∫ n1s1 ⋅ dr + ∫ n2 s2 ⋅ dr + ∫ (n2 s2 − n1s1 ) ⋅ dr = 0 .
C1
C2
(2.61)
K
Интеграл вдоль кривой K равен нулю, поскольку, как было показано при ~ выводе закона преломления, вектор N12 = n2 s2 − n1s1 , перпендикулярен к поверхности S в любой точке кривой K . При этом выражение (2.61) сводится к выражению (2.60), что и требовалось доказать.
2.5. Конгруэнции лучей
Уравнение произвольной прямой в пространстве можно определить уравнением вида: x = a11 + a12 z , y = a21 + a22 z .
(2.62)
Задавая независимым друг от друга величинам коэффициентов a11 , K, a22 всевозможные значения, получим уравнения всех прямых, заполняющих пространство.
Связывая
величины
коэффициентов
одной
зависимости
F1 (a11 , a12 , a21 , a22 ) = 0 , получаем комплекс прямых. Вполне очевидно, что в общем случае через каждую точку пространства проходит конус лучей с вершиной в этой точке. Добавляя ещё одну зависимость F2 (a11 , a12 , a21 , a22 ) = 0 , 22
мы выделяем из комплекса конгруэнцию [от лат.congruens (congruentis) – соразмерный, соответствующий, совпадающий] прямых. Пусть через каждую точку некоторой поверхности z = f ( x, y ) проходит прямая, определяемая коэффициентами a11 , a12 , a21 , a22 , которые являются функциями от x и y : a11 = a11 ( x, y ),
a12 = a12 ( x, y ),
a21 = a21 ( x, y ),
a22 = a22 ( x, y ). В результате получаем конгруэнцию прямых, так как из написанных четырёх равенств можно исключить x и y и получить два уравнения, связывающих величины a11 , K, a22 . Конгруэнцией прямых, например, является совокупность исходящих из светящейся точки лучей после выхода из оптической системы при условии, что последняя среда однородна. Соотношение (2.40), а, именно, rot ns = 0 , определяет все системы лучей, которые могут существовать в неоднородной среде, и выделяет их из более общих семейств кривых. В однородной среде, т.е. при n = const , это соотношение принимает вид: rot s = 0 .
(2.63)
Левую часть соотношения (2.40) можно заменить тождеством rot ns = n rots + ( grad n ) × s .
(2.64)
Умножив при этом соотношение (2.64) скалярно на вектор s , получаем, что система лучей в любой среде должна удовлетворять соотношению: s ⋅ rots = 0 .
(2.65)
Система кривых, заполняющих некоторую часть пространства так, что через каждую точку этой части пространства в общем случае проходит одна кривая, называется конгруэнцией. Если существует семейство поверхностей, пересекающих каждую кривую под прямым углом, то рассматриваемую систему кривых называют нормальной конгруэнцией. Если такого семейства
23
поверхностей нет, то говорят о косой конгруэнции. В обычной (световой) геометрической оптике рассматривают только нормальные конгруэнции лучей. Косые конгруэнции играют важную роль в электронной оптике. Если все лучи, составляющие конгруэнцию, имеют вид прямых, то такая конгруэнция называется прямолинейной конгруэнцией лучей. Формулы (2.63) и (2.65) определяют необходимые и достаточные условия, соблюдение которых свидетельствует о том, что конгруэнция лучей является соответственно нормальной и нормальной прямоугольной.
2.7. Теорема Малюса
Если все лучи в однородной среде имеют общую точку, например, исходят из точечного источника, то говорят, что лучи образуют гомоцентрический пучок. Такой пучок образует нормальную конгруэнцию, поскольку каждый луч пучка пересекает под прямым углом сферические поверхности (волновые фронты), центр которых расположен в точке пересечения лучей. В 1808 году французский физик Этьен Луи Малюс (1775–1812 гг.) показал, что если гомоцентрический пучок прямолинейных лучей преломляется или отражается какой-либо поверхностью, то получающийся после этого пучок лучей (в общем случае уже не гомоцентрический) тоже образует нормальную конгруэнцию. Позднее Дюпин (1816 г.), Кветеле (1825 г.) и Жергонн (1825 г.) обобщили результат Малюса. Работы этих учёных позволили сформулировать следующую
теорему,
называемую
теоремой
Малюса:
нормальная
прямолинейная конгруэнция остаётся нормальной после любого числа преломлений и отражений. Рассмотрим
нормальную
прямолинейную
конгруэнцию
лучей
в
однородной среде с показателем преломления n1 , которые преломляются на поверхность S , отделяющей эту среду от другой однородной среды с показателем преломления n2 , как показано на рис.2.8.
24
P
A2
A1 n2
n1
B1
B2 Q
L1
L2
S
Рис.2.8. К доказательству теоремы Малюса
Пусть L1 – один из волновых фронтов в первой среде, A1 и P – точки пересечения произвольного луча в первой среде с поверхностями L1 и S соответственно, а A2 – точка на преломлённом луче. Если точку A1 сместить в другую точку B1 на том же волновом фронте, то точка P на поверхности преломления сместится в точку Q . Теперь на преломлённом в точке Q луче выберем такую точку B2 , чтобы оптический путь от B1 до B2 равнялся оптическому пути от A1 до A2 ,т.е. чтобы соблюдалось равенство:
[ A1 PA2 ] = [B1QB2 ] .
(2.66)
Если перемещать точку B1 по всей поверхности L1 , то точка B2 при своём перемещении заполнит поверхность L2 . Покажем, что преломлённый луч QB2 перпендикулярен к этой поверхности. Вычисляя интегральный инвариант Лагранжа-Пуанкаре по замкнутому пути A1 PA2 B2QB1 A1 , получаем:
∫
n ds +
A1PA2
∫
ns dr +
A2 B2
∫
B2QB1
n ds +
∫ ns dr = 0
B1 A1
на основании равенства (2.66) имеем
∫
A1PA2
nds +
∫ nds = 0 .
B2QB1
25
(2.67)
Кроме того, поскольку на волновом фронте L1 единичный вектор s в каждой точке перпендикулярен к нему, интеграл
∫ ns ⋅ dr = 0 .
В результате
B1 A1
выражение (2.67) принимает вид:
∫ n s ⋅ dr = 0 .
(2.68)
A2 B2
Полученное соотношение должно выполняться на поверхности L2 для любого отрезка кривой. Это возможно только в том случае, если s ⋅ dr = 0 для каждого линейного элемента dr поверхности L2 , т.е. если преломлённые лучи перпендикулярны к ней или, другими словами, если преломлённые лучи образуют нормальную конгруэнцию, что и требовалось доказать. Поскольку точка B1 на волновом фронте L1 выбрана произвольно, то равенство [ A1 PA2 ] = [B1QB2 ] позволяет утверждать, что оптическая длина пути между любыми двумя волновыми фронтами одинакова для всех лучей. Вполне очевидно,
что
этот
результат
остаётся
справедливым
для
случая
последовательных преломлений (и отражений) на нескольких поверхностях, а так же, как это непосредственно следует из выражения (2.38), в случае распространения лучей в среде с непрерывно изменяющимся показателем преломления. Эта теорема, доказанная с помощью интегрального инварианта Лагранжа-Пуанкаре, называется принципом равного оптического пути. Из этой теоремы
следует,
что
геометрические
волновые
фронты
нормальной
конгруэнции лучей или совокупности нормальных конгруэнций, образованных в результате последовательных преломлений (и отражений), "оптически параллельны" друг другу. С последней теоремой невольно ассоциируется гипотетическая теорема, впервые выдвинутая в 1690 году Х.Гюйгенсом, согласно которой каждую точку волнового фронта можно считать центром вторичного светового возмущения, порождающего элементарные сферические волны, при этом волновым фронтом в любой последующий момент времени служит огибающая этих вторичных
26
сферических волн. Принцип Гюйгенса может служить правилом для построения поверхностей, "оптически параллельных" друг другу. Дополнив построение Гюйгенса утверждением, что вторичные волны интерферируют между собой, О.Френель в 1818 году впервые смог объяснить явление дифракции. Это сочетание построения Гюйгенса с принципом интерференции называется принципом Гюйгенса-Френеля. Позднее (в 1882 г.) Г.Кирхгоф
придал
исследованиям
Френеля
строго
математическое
обоснование, и с этого времени началось широкое изучение дифракции. Тем не менее, в большинстве практически важных случаев из-за математических трудностей приходится прибегать к приближённым методам и тут принцип Гюйгенса-Френеля служит мощным инструментом, позволяющим решать большинство вопросов, встречающихся в прикладной оптике.
27
Глава 3 ОСНОВЫ ТЕОРИИ ГЕОМЕТРИЧЕСКОГО ПОСТРОЕНИЯ ИЗОБРАЖЕНИЯ ПРЕДМЕТА СИСТЕМОЙ ОПТИЧЕСКИХ ПОВЕРХНОСТЕЙ 3.1. Параксиальная оптика Теоретические соотношения, полученные в предположении, что лучи, проходящие через оптически сопряжённые точки в пространстве предметов и изображений, расположены в непосредственной близости от оптической оси, принято называть параксиальной оптикой (от греч. para – возле, мимо, вне и лат. axis – ось) или оптикой Гаусса. Рассмотрим ход луча через одну преломляющую поверхность сферической формы, центр кривизны которой расположен в точке C , разделяющую однородные среды с показателями преломления n и n′ , как показано на рис.3.1. Следует заметить, что в случае одной преломляющей поверхности сферической формы любая прямая, проведённая через центр её кривизны, может быть принята за оптическую ось. Однако, будем считать, что рассматриваемая преломляющая поверхность входит в состав некоторой центрированной системы
оптических
поверхностей,
обладающей
вполне
определённым
положением оптической оси, под которой понимаем линию, проходящую через центры кривизны всех поверхностей. Точку пересечения преломляющей поверхности с оптической осью (точку O ) называют вершиной этой поверхности. Расстояние от вершины O поверхности до центра C её кривизны равно радиусу r кривизны поверхности. Если центр кривизны поверхности расположен
справа
от
её
вершины,
то
величина
положительной, в противном случае – отрицательной.
3
радиуса
считается
n −i
A
n′
N − i′
A′ N
A −σ
K
O
C
σ′
A′
∆ −s
r
s′
Рис.3.1. Преломление луча осевого пучка на сферической поверхности раздела двух однородных сред
Пусть в среде с показателем преломления n
на оптической оси
расположена некоторая светящаяся точка A . Рассмотрим ход луча, исходящего из точки A под углом − σ к оптической оси и падающего на преломляющую поверхность в точке N . Нормалью к преломляющей поверхности в точке падения луча служит прямая NC , а её направление от точки падения определяется ортом N . Орт нормали N направлен из среды с показателем преломления n в среду с показателем преломления n′ . Направление луча AN определяется ортом A . Этот луч с нормалью к поверхности в точке падения образует угол падения − i . Преломлённый в точке N поверхности луч проходит в среде с показателем преломления n′ и пересекает оптическую ось в точке A′ под углом σ′ к ней. Направление луча NA′ определяется ортом A ′ . Этот луч с нормалью к поверхности в точке падения образует угол преломления − i ′ . Угол падения i будем считать положительным, если для совмещения орта
A падающего луча с ортом нормали N орт A следует повернуть вокруг точки падения луча (вокруг точки N ) против часовой стрелки; в противном случае угол будем считать отрицательным. Аналогично угол преломления луча i′ будем считать положительным, если для совмещения орта A ′ преломлённого луча с ортом нормали N орт A ′ необходимо повернуть вокруг точки N против часовой стрелки; в противном случае – отрицательным. 4
Положительным направлением оптической оси системы поверхностей принято считать направление слева направо. При этом угол σ будем считать положительным, если для совмещения орта A с оптической осью его следует повернуть вокруг точки A против часовой стрелки; в противном случае – отрицательным. Аналогично угол σ′ будем считать положительным, если для совмещения орта A ′ с оптической осью его следует повернуть вокруг точки A′ против часовой стрелки, в если по часовой стрелке, то отрицательным. Обозначим отрезки OA = − s и OA′ = s′ , при этом начало отрезков s и s′ будем считать расположенным в вершине O преломляющей поверхности. В соответствии с рис.3.1 имеем
r r−s r r − s′ = . = , sin σ sin i sin σ′ sin i ′ Учитывая закон преломления в форме (2.46), из этих соотношений получаем n sin σ r − s ′ sin i ′ sin σ . = = r − s sin i sin σ′ n′ sin σ′
(3.1)
Из точки N на оптическую ось опустим перпендикуляр NK = m . Тогда в соответствии с рисунком имеем sin σ = − sin σ′ =
m m =− , 2 NA m 2 + (∆ − s )
m m = . 2 2 NA′ m + (s ′ − ∆ )
При этом 2 m 2 + ( s′ − ∆ ) sin σ =− . 2 sin σ′ m 2 + (∆ − s )
(3.2)
Из рисунка следует, что ∆ = r − r 2 − m 2 . Вполне очевидно, что lim ∆ = 0 . m→0
Будем считать, что в общем случае отрезки s ≠ 0 и s′ ≠ 0 . Тогда lim sin σ = lim σ = 0 , lim sin σ′ = lim σ′ = 0 .
m→0
m →0
m→0
m →0
При этом из соотношения (3.2) следует, что 5
m 2 + (s ′ − ∆ ) s′ sin σ = − lim = 0. lim 2 m →0 sin σ′ m→0 s0 m 2 + (∆ − s ) 2
Полученный результат позволяет соотношение (3.2) представить в виде: r − s0′ ns0′ = . r − s0 n′s0
(3.3)
Это соотношение легко преобразовать к виду: ⎛ 1 1⎞ ⎛ 1 1⎞ n′⎜⎜ − ⎟⎟ = n⎜⎜ − ⎟⎟ . ⎝ s0′ r ⎠ ⎝ s0 r ⎠
(3.4)
В результате получили формулу, известную под названием формулы Аббе, хотя она была выведена ещё Ньютоном. Формула (3.4) получена в предположении, что луч, выходящий из осевой точки A , пересекает преломляющую поверхность на высоте m → 0 . Такой луч принято называть параксиальным лучом. Вполне очевидно, что при этом формула (3.4) справедлива для любой преломляющей поверхности вращения несферической поверхности, если радиус кривизны в вершине поверхности
r0 ≠ 0 . Если осевая точка предмета расположена на бесконечно большом расстоянии от вершины O преломляющей поверхности, т.е. если s0 = ∞ , то осевая точка изображения A0′ займёт положение, называемое задним фокусом поверхности и обозначаемое через F0′ , а отрезок s0′ , называемый задним фокусным расстоянием f 0′ , в соответствии с формулой (3.4) определится соотношением
f 0′ =
n′r . n′ − n
(3.5)
Вполне очевидно, что при s0′ = ∞ точка A0 займёт положение переднего фокуса
F0 , при этом переднее фокусное расстояние
f0
определится
соотношением
f0 = −
nr . n′ − n
(3.6) 6
Из выражений (3.5) и (3.6) следует, что
f 0′ n′ =− . f0 n
(3.7)
3.2. Оптика виртуальных лучей
Восстановим в вершине O преломляющей поверхности перпендикуляр к оптической оси. На этом перпендикуляре, на произвольном расстоянии от оптической оси, равном h , обозначим точку P . Проведём из точки P в точки
A0 и A0′ линии, которые с оптической осью образуют углы − α и α′ , как показано на рис.3.2, при этом отрезки OA0 и OA0′ соответственно равны − s0 и
s0′ . Перепишем формулу (3.4) в виде:
n ′ n n′ − n . − = s0′ s0 r P
A′ A0
h
−α
α′
C
O
−l
l′
A0′
s0′
− s0 A
Рис.3.2. Построение хода нулевого луча
Умножим левую и правую части этой формулы на h . Тогда в соответствии с рис.3.2 получаем n′tgα′ − ntgα = h
где tgα =
n′ − n , r
(3.8)
h h , tgα′ = . s0 s0′
7
В вычислительной практике тангенсы углов обозначают просто углами. При этом полученное выражение можно представить в виде рекуррентной формулы для i -ой преломляющей поверхности:
ni +1α i +1 − ni α i = hi
ni +1 − ni . ri
(3.9)
Эта формула справедлива для любой преломляющей поверхности, при этом для i + 1 поверхности имеем
hi +1 = hi − αi +1di ,
(3.10)
где d i – расстояние между вершинами i -ой и i + 1 -ой поверхностей. Плоскость, перпендикулярную оптической оси и проходящую через вершину поверхности будем называть главной плоскостью преломляющей поверхности. Линию A0 HA0′ называют первым нулевым лучом. По сути дела правильнее было бы называть этот луч осевым фиктивным [фр. fictive < лат. fictio – вымысел] лучом. В плоскости, перпендикулярной оптической оси и проходящей через точку
A0 , т.е. в плоскости предмета, отложим отрезок A0 A = −l , как показано на рис.3.2. Луч, выходящий из точки A предмета, проходит через центр кривизны преломляющей
поверхности
без
изменения
направления
и
пересекает
плоскость изображения в точке A′ на расстоянии A0′ A′ = l ′ от оптической оси. При этом поперечное увеличение изображения, образованного преломляющей поверхностью, определяется отношением
V0 =
l ′ s0′ − r . = l s0 − r
(3.11)
Сопоставив левую и правую части соответственно выражений (3.3) и (3.11), получаем
V0 = Но
ns0′ . n′s0
(3.12)
s0′ hs0′ α = = . Тогда из выражений (3.11) и (3.12) следует, что s0 hs0 α′
nlα = n′l ′α′ . 8
Вполне
очевидно,
что
это
выражение
справедливо
для
любой
произвольной последовательности преломляющих поверхностей вращения. Записанное в виде:
ni li α i = ni +1li +1α i +1 ,
(3.13)
это выражение называется инвариантом Лагранжа-Гельмгольца. Рассмотрим применение полученных соотношений для решения частных задач. 3.3. Кардинальные точки оптической системы
Оптическую систему из k сферических преломляющих поверхностей принято записывать в виде:
r1 = d1 = r2 = rk −1 = rk =
n1 = n2 = .
d k −1 = nk = nk +1 =
Из формулы (3.9) следует, что
α i +1 =
ni n − ni α i + hi i +1 . ni +1 ni +1ri
(3.14)
Пусть расстояние от вершины первой поверхности до осевой точки предмета равно s1 . Тогда высота h1 = s1α1 . Выбрав произвольно значение угла
α1 (или высоты h1 ) и подставив в формулу (3.14), находим значение угла α 2 : α2 =
n1 n −n α1 + 2 1 s1α1 . n2 n2 r1
Затем находим высоту нулевого луча на главной плоскости второй поверхности:
h2 = h1 − α 2 d1 . Полученные значения угла α 2 и высоты h2 позволяют вычислить значения угла α 3 и высоты h3 . Продолжая подобные вычисления, находим высоту hk на 9
главной плоскости последней в системе поверхности и угол α k +1 . Положение изображения,
образованного
определится расстоянием
рассматриваемой
оптической
системой,
s′ от вершины k -ой поверхности до точки
пересечения нулевого луча с оптической осью, равным
s′ =
hk . α k +1
Из инварианта (3.13) следует, что поперечное увеличение изображения, образованного системой оптических поверхностей, равно
V0 =
lk +1 n1α1 = . l1 nk +1α k +1
Таким образом, при известных значениях радиусов кривизны оптической системы,
расстояний
между
вершинами
поверхностей
и
показателей
преломления разделяемых поверхностями сред расчёт первого нулевого (осевого фиктивного) луча позволяет определить положение изображения и его поперечное увеличение.
H′
1-я поверхность
k-я поверхность
h1 B′
hk
Ok f′
α k +1
F′
s ′F ′
Рис.3.3. Кардинальные точки оптической системы
Если предмет расположен на бесконечно большом расстоянии от оптической системы, то в этом случае угол α1 = 0 . Выбрав при этом любое
значение высоты h1 , в результате расчёта хода нулевого луча находим высоту hk на главной плоскости последней поверхности и последний угол α k +1 , 10
образованный нулевым лучом с осью, как показано на рис.3.3. Точка пересечения луча с осью определяет положение изображения бесконечно удалённой осевой точки и называется задним фокусом F ′ оптической системы. Плоскость, перпендикулярная к оптической оси и проведённая через точку F ′ , называется задней фокальной плоскостью. Положение фокуса F ′ относительно последней поверхности системы определяется задним фокальным отрезком s′F ′ , в соответствии с рис.3.3 равным: s ′F ′ =
hk . α k +1
(3.15)
Плоскость H ′ , нормальная к оптической оси и содержащая точку пересечения падающего луча с продолжением выходящего, называется задней главной плоскостью; точка пересечения главной плоскости с оптической осью (точка B ′ ) называется задней главной точкой. При этом заднее фокусное расстояние, равное расстоянию от задней главной точки до заднего фокуса определяется соотношением: f′=
h1 . α k +1
(3.16)
При некотором положении осевой точки предмета её изображение, образованное оптической системой, расположено на бесконечно большом расстоянии. Эта точка F называется передним фокусом оптической системы, а плоскость, нормальная к оптической оси и проходящая через передний фокус, называется передней фокальной плоскостью. Положение переднего фокуса относительно вершины первой поверхности определяется передним фокальным отрезком s F . Плоскость H , нормальная к оптической оси и содержащая точку пересечения продолжения луча, проходящего через передний фокус F оптической системы, с продолжением выходящего из оптической системы луча при α k +1 = 0 , называется передней главной плоскостью, а точка пересечения передней главной плоскости с оптической осью (точка B ) называется передней главной точкой. Расстояние от передней главной точки до переднего фокуса 11
называется передним фокусным расстоянием. Переднее фокусное расстояние и передний фокальный отрезок можно вычислить в результате расчёта обратного хода нулевого луча. Главные точки B и B ′ и фокусы F и F ′ называются кардинальными точками оптической системы. 3.4. Геометрическое построение изображения и основные оптические формулы H A
P1
l
F
B
H′ P1′ B′
A0′
F′
A0
− l′ −z
−f
P2
P2′
f′
−s
z′
A′
s′
Рис.3.4. Геометрическое построение изображения
Обратимся к рис.3.4, на котором оптическая система представлена главными плоскостями H и H ′ и, соответственно, главными точками B и B ′ , и определено положение фокусов F и F ′ . Кроме того, на рисунке показано некоторое положение предмета l = A0 A . Требуется построить изображение этого предмета. Для этого достаточно построить изображение A′ одной лишь точки A . Опустив из точки A′ перпендикуляр на оптическую ось, получим изображение A0′ A′ всего отрезка A0 A . Чтобы найти изображение точки A , достаточно определить ход двух лучей, исходящих из точки A , и найти точку их пересечения в пространстве изображений. Один луч, исходящий из точки A , направим параллельно оптической оси. При этом выходящий из оптической системы луч должен 12
пройти через задний фокус F ′ и пересечься с лучом падающим в точке P1′ на задней главной плоскости на расстоянии B′P1′ = l от оптической оси. Таким образом, положение луча P1′F ′ определено. Второй луч, исходящий из точки A , направим в передний фокус F оптической системы. Этот луч должен пересечься с выходящим из оптической системы параллельно её оптической оси лучом в точке P2 на передней главной плоскости на расстоянии BP2 = −l ′ от неё. Построенные в пространстве изображений лучи P1′F ′ и P2 A′ пересекаются в точке A′ , которая оптически сопряжена, следовательно, с точкой A . Перпендикуляр A′A0′ , опущенный на оптическую ось из точки A′ , определяет изображение отрезка A0 A . Для получения основных аналитических соотношений, необходимых в практике расчёта оптических систем, обратимся вновь к рис.3.3. На рисунке введены обозначения: l = A0 A , l ′ = A0′ A′ , f = − BF , f ′ = B′F ′ . В оптике принято считать, что свет распространяется слева направо. Для отрезков, лежащих на оптической оси, принято следующее правило знаков: если направление отсчёта отрезка совпадает с направлением движения света (слева направо), отрезок считается положительным, в противном случае – отрицательным. Для отрезков, перпендикулярных к оптической оси, один конец которых лежит на оси, действует следующее правило знаков: если отрезок лежит выше оси, он положителен (например, отрезок A0 A ), в противном случае он считается отрицательным (например, отрезок A0′ A′ ). Для последующего вывода необходимых соотношений введём отрезки на оптической оси, начала которых лежат в точках F и F ′ , а концы – в оптически сопряжённых точках A0 и A0′ соответственно: − z = FA0 и z ′ = F ′A0′ . Из подобия треугольников FA0 A и FBP2 получаем: −
l′ − f . = l −z
(3.17)
Отсюда следует, что поперечное увеличение изображения, образованного оптической системой, равно 13
V0 =
l′ f =− . l z
(3.18)
Из подобия треугольников F ′A0′ A′ и F ′B′P1′ получаем − l ′ z′ = . l f′
(3.19)
В этом случае поперечное увеличение изображения равно V0 =
l′ z′ =− . l f′
(3.20)
Приравнивая правые части соотношений (3.18) и (3.20), получаем формулу Ньютона в виде:
zz ′ = ff ′ .
(3.21)
Заметим, что положение главной точки
B
в оптической системе
определяется отрезком z = − f . При этом в соответствии с формулой Ньютона отрезок z ′ = − f ′ , что соответствует положению главной точки B′ , т.е. задняя главная плоскость является изображением передней главной плоскости и, следовательно, точки P1 и P1′ и P2 и P2′ являются оптически сопряжёнными. Кроме того, как следует из выражений (3.18) и (3.20), при z = − f и z ′ = − f ′ поперечное увеличение в изображении главных плоскостей V0 = 1X . Таким образом, произведение отрезков x и z ′ для оптической системы постоянно и равно произведению её фокусных расстояний. Введём отрезки − s = BA0 и s ′ = B′A0′ . Начало этих отрезков считаем лежащими в точках B и B′ . В соответствии с рисунком имеем z=s− f, z ′ = s ′ − f ′.
⎫ ⎬ ⎭
(3.22)
Подставив эти значения величин z и z ′ в формулу Ньютона, получаем
f ′s + fs′ = ss′ . Поделив это выражение почленно на ss′ , приводим его к виду: f′ f + = 1. s′ s
(3.23)
14
Эту формулу называют формулой отрезков или оптической формулой. Используя равенства (3.22), находим: s′ f ′ + z ′ . = s f +z
(3.24)
Из формулы (3.21) следует, что z′ =
ff ′ . z
Подставив это значение z ′ в выражение (3.24), получаем s′ f ′ z + f f′ = . = s z f +z z
(3.25)
В соответствии с формулой Ньютона имеем: f ′ z′ = . z f
(3.26)
При этом s′ f ′ z ′ = = . s z f′
(3.27)
Умножив эти соотношения на −
f и учитывая соотношения (3.18) и f′
(3.20), получаем V0 = −
f s′ . f′ s
Заметим, что V0 =
(3.28) s ′ hs ′ α = = . При этом s hs α′
l′ f α . =− l f ′ α′
(3.29)
Отсюда следует, что
fαl = − f ′α′l ′ . Применив
(3.30) инвариант
Лагранжа-Гельмгольца
последовательно ко всем поверхностям системы, получаем n1α1l1 = nk +1α k +1lk +1
или 15
в
форме
(3.13)
nαl = n′α′l ′ .
(3.31)
Сопоставив соотношения (3.29) и (3.30), имеем f′ n′ =− . f n
(3.32)
Таким образом, для оптической системы в воздухе, т.е. при n = n′ = 1 , формулы (3.21), (3.23) и (3.29) принимают вид:
zz ′ = − f ′ 2
(3.33)
1 1 1 − = s′ s f ′
(3.34)
nα . n′α′
(3.35)
V0 =
Умножив формулу отрезков (3.34) на h и учитывая, что
h h′ = α, а = α′ , s s′
получаем α ′ − α = hϕ ,
(3.36)
где ϕ – оптическая сила системы поверхностей, при этом ϕ =
16
1 . f′
Глава 4 ОСНОВНЫЕ ПОНЯТИЯ И СООТНОШЕНИЯ ФОТОМЕТРИИ Слово "фотометрия" составлено из двух греческих слов: "фос" (ϕϖζ ) – свет и "метрео" (µετρεω) – измеряю, т.е. в переводе на русский язык, его следует понимать как "световые измерения". В бытовом понимании "свет" – это ощущение, которое возникает у человека под влиянием падающего в его глаз электромагнитного излучения с длинами волн, лежащими в пределах от 380нм до 780нм. В технике под словом "свет" понимают то излучение, которое вызывает зрительное ощущение. Измерение этого излучения и составляет задачу фотометрии. Первой фотометрической работой в истории науки было разделение звёзд по их блеску (по освещённости от этих звёзд) на шесть классов – звёздных величин, выполненное Гиппархом во II веке до Р.Х. В звёздном каталоге Птоломея, приложенном к его "Альмагесту", содержатся оценки звёздных величин свыше 1000 звёзд. Сопоставляя их с современными объективными измерениями освещённости от этих же звёзд, установили, что когда одна звезда имеет звёздную величину на единицу больше, чем другая, то освещённость от первой в 2,5 раза меньше, чем от второй. Постепенное расширение общего интереса к измерениям света можно проследить по литературным памятникам и отметить его у Данте (XIII в.), у Леонардо да Винчи (XV в.) и у Галилея (XVII в.). Начало практического применения некоторых видов световых измерений можно, по-видимому, отнести к концу XVI и началу XVII веков и особенно к XVIII веку, когда были опубликованы книги основоположников фотометрии французского учёного Пьера Бугера (1698–1758) (Bouguer P.Essai d’optique sur la gradation de la lumiere. – Paris, 1729) и немецкого учёного Иоганна Генриха Ламберта (1728–1777) (Lambert J.H. Photometria, sive de mensura et gradibus luminis, colarum et umbrae – Augsburg, 1760). С тех пор методы световых 1
измерений непрерывно совершенствуются, следуя за ускоряющимся темпом технического прогресса, предъявляющего всё более высокие требования к различным видам измерений лучистой энергии. С древнейших времён и до XIX века единственная возможность замечать и оценивать излучение была связана со зрением человека. Естественно поэтому, что все фотометрические законы и соотношения развивались только в связи с воздействием излучения на глаз наблюдателя и что световые измерения могли осуществляться
только
в
пределах
видимого
спектра.
С
появлением
приёмников, чувствительных к ультрафиолетовым и инфракрасным лучам, содержание фотометрии стало расширяться и в настоящее время её можно определить как совокупность методов и теории, охватывающих энергетику процессов
излучения,
распространения
и
превращения
(в
частности,
поглощения) лучистой энергии в любой части электромагнитного спектра. Однако,
чаще
всего
фотометрические
соотношения
применяются
к
ультрафиолетовому, видимому и инфракрасному излучениям, объединяемым в общем понятии оптического излучения. 4.1. Интенсивность
излучения
некогерентного
источника
конечных
размеров в геометрическом приближении Плотность потока энергии электромагнитного поля определяется вектором Умова-Пойнтинга.
G=
c c E×H = EHs , 4π 4π
где E и H – векторы напряжённости электрического и магнитного полей соответственно. Направление вектора Умова-Пойнтинга перпендикулярно векторам E и H и совпадает с направлением распространения электромагнитной волны, а его величина равна энергии, переносимой в единицу времени через единичную площадку, перпендикулярную вектору G . Таким образом, вектор G = vws , где 2
w – плотность энергии, а v – скорость распространения электромагнитных волн. Строго монохроматическое поле, которое можно рассматривать как фурьекомпоненту произвольного поля, создаёт гармонический осциллятор или набор подобных осцилляторов с одинаковой частотой излучения. В оптике обычно имеют дело с источниками, излучающими свет в узком, но конечном диапазоне частот. Такой источник можно рассматривать как набор большого числа гармонических осцилляторов, частоты которых попадают в указанный диапазон. Для вычисления интенсивности света в какой-либо точке P пространства необходимо просуммировать все поля, созданные каждым осциллятором (элементом источника), т.е. E = ∑ En ; n
H = ∑ Hn . n
Так как частоты колебаний в оптическом диапазоне излучения очень велики, непосредственно наблюдать мгновенные значения ни одной из таких быстро осциллирующих величин невозможно. Можно говорить лишь об их значениях, усреднённых за некоторый интервал времени, который велик по сравнению с периодом колебаний. Величина среднего по времени вектора Умова-Пойнтинга служит мерой интенсивности света в некоторой точке P , т.е. I (P ) = G = =
c 4π
∑ n
c c E ×H = 4π 4π
∑
En × H n =
n, m
(4.1)
En × H n + ∑ En × H m . n≠m
Световые колебания, создаваемые различными элементами источника, можно считать независимыми (взаимно некогерентными), причём среднее значение поля равно нулю. Тогда
∑
n ≠m
En × H m = 0 .
3
Поэтому при решении многих оптических задач можно принять, что вторая сумма в выражении (4.1) равна нулю (в этих случаях говорят, что поля некогерентны). Тогда I (P ) = где
c ∑ En × H n = 4π n
Gn – вектор
∑ Gn
,
(4.2)
n
Умова-Пойнтинга,
соответствующий
n -му
элементу
источника. Направление
усреднённого
по
времени
вектора
Умова-Пойнтинга
совпадает с нормалью к геометрическому волновому фронту, а абсолютная его величина равна произведению средней плотности энергии
w на скорость
распространения электромагнитных волн V . Волновой фронт излучения точечного источника в однородной среде имеет сферическую форму. Источники излучения конечного размера принято считать точечными, если их угловые размеры малы, при этом в геометрической оптике источник излучения считается точечным, если его угловой размер стремится к нулю. Свет от источника распространяется, как правило, во все стороны, заполняя всё окружающее пространство. Для анализа пространственного распределения излучаемой источником энергии используют представление о телесном угле.
r
O
Рис.4.1. Телесный угол
4
Телесным углом называется часть пространства, заключённая внутри одной
полости
некоторой
конической
поверхности
(с
замкнутой
направляющей), порождаемой движением прямой линии (образующей), проходящей через неподвижную точку (вершину конической поверхности), как показано на рис.4.1 при этом всякая (не проходящая через вершину) линия, которую
образующая
пересекает
при
своём
движении,
называется
направляющей. Если вершина телесного угла расположена в центре сферы произвольного радиуса r , то коническая поверхность, ограничивающая телесный угол, выражает на сфере часть её поверхности, площадь S которой пропорциональна квадрату радиуса r , т.е. S = ωr 2 . Коэффициент ω является мерой телесного угла. Единицей телесного угла является стерадиан (ср). Телесный угол, равный одному стерадиану, соответствует части поверхности сферы, площадь которой равна площади квадрата со стороной, равной радиусу сферы. Коническая поверхность телесного угла может принимать различные формы. Если это поверхность прямого кругового конуса с плоским углом 2α при вершине, то телесный угол (в стерадианах) ω = 2π(1 − cos α ) = 4π sin 2
α . 2
Если конус телесного угла разворачивается в плоскость, то телесный угол, соответствующий полупространству, оказывается равным 2π ср и, наконец, если площадь S охватывает всю поверхность сферы, то полный телесный угол в каждой точке пространства равен 4π ср. Когда коническая поверхность сжимается около какого-то направления и площадь вырезаемой конусом поверхности сферы становится бесконечно малой, телесный угол также становится бесконечно малым и равным dω =
dS . r2
Пусть δS – элемент поверхности волнового фронта, соответствующего определённой точке поверхности источника излучения. Через поверхность δS проходят конические пучки лучей, исходящих из каждой точки источника. Осевые лучи этих пучков заполняют конус с телесным углом dω , как показано 5
на рис.4.2. Если угол раствора конуса достаточно мал, то можно пренебречь зависимостью проекции вектора Gn от направления и записать выражение (4.2) в виде: I (P ) = ∑ Gn = ∑ I n . n
(4.3)
n
δS
Источник излучения
Конус с телесным углом δω , образованный центральными лучами
Рис.4.2. К выводу закона интенсивности в геометрической оптике для некогерентного источника излучения конечных размеров
Предположим, что число точечных источников (осцилляторов) настолько велико, что их распределение без существенной ошибки можно считать непрерывным. Вклад от каждого точечного источника бесконечно мал, однако, суммарный эффект конечен. В этом случае сумма (интеграл) пропорциональна телесному углу δω , т.е. I (P ) = Lδω ,
а полный (усреднённый по времени) поток энергии δΦ e , проходящий через элемент δS в единицу времени, равен
δΦ e = LδωδS .
(4.4)
Формула (4.4) играет важную роль в фотометрии. 4.2. Оптическое
излучение.
Световой
поток.
эффективные характеристики оптического излучения
6
Энергетические
и
Одним из видов энергии (греч. energeia – действие) является излучение, испускаемое телами естественного и искусственного происхождения. Такие тела называют источниками излучения. Известными каждому естественными источниками излучения являются Солнце, Луна, Земля, планеты и созвездия, небо, облака, полярные сияния. Искусственные источники оптического излучения могут быть тепловыми, люминесцентными и газоразрядными. Сюда же относятся светодиоды и лазеры. Приёмниками излучения можно считать все тела живой и неживой природы, поглощающие излучение. По типу действия излучения различают приёмники тепловые (болометры, термоэлементы, терморезисторы и др.), фотоэлектрические (фотоэлементы, фотоумножители, фотосопротивления), фотографические (фотографические слои). Среди приёмников живой природы, прежде всего, можно назвать глаза (сетчатку глаз) и кожу человека и листья растений.
Приёмники
излучения
обладают
различным
механизмом
преобразования энергии излучения. Исследование этого механизма помогает наиболее эффективно использовать энергию излучения. Как известно, любое материальное тело, имеющее температуру выше нуля абсолютной
шкалы,
излучает
энергию
в
окружающее
пространство.
Следовательно, все тела, с которыми нам приходится иметь дело в жизни, непрерывно обмениваются энергией, так как любой поток излучения переносит энергию от излучающего тела к поглощающему. При тепловом излучении световое излучение обусловлено спонтанными переходами электронов с высоких уровней энергии на более низкие; инфракрасное излучение происходит за счёт изменения колебательного и вращательного движений атомов; при люминесцентном излучении атомы и электроны спонтанно переходят с высоких уровней энергии на более низкие, а возбуждаются электромагнитным полем. В газоразрядном источнике излучение возникает в результате электрического разряда в атмосфере инертных газов, паров металла или их смесей. Принцип действия излучающих полупроводниковых диодов (светодиодов) основан на явлении электролюминесценции при протекании тока 7
в структурах с p − n -переходом. Устройство, генерирующее когерентные электромагнитные волны за счёт вынужденного испускания или вынужденного рассеяния света активной средой, находящейся в оптическом резонаторе, называется лазером. Слово "лазер" представляет собой аббревиатуру слов английского выражения: "Light Amplification by
Stimulated Emission of
Radiation" – усиление света вынужденным излучением. Непрерывный спектр электромагнитного излучения распространяется от γ -лучей с минимальной длиной волны 10−7 мкм, возникающих при распаде
радиоактивных элементов, до длинноволновых радиоизлучений и излучений генераторов переменного тока промышленной частоты с длиной волны 6000км. Средняя
область
спектра
электромагнитного
излучения,
охватывающая
инфракрасное излучение с длиной волн от 1мм до 0,78мкм, видимое излучение – от 0,78мкм до 0,38мкм и ультрафиолетовое излучение с длинами волн от 0,38мкм до 0,01мкм, носит название оптической области спектра. Излучение
этой
Объединение
области
излучений
спектра этих
называется
спектральных
оптическим областей
в
излучением. одну
группу
объясняется как единством принципов возбуждения оптического излучения, так и общностью методов их преобразования и использования. Полная энергия излучения любого спектрального состава, переносимая электромагнитными волнами за единицу времени, значительно превышающую периоды световых колебаний, через какую-либо поверхность, определяет мощность излучения, которую в оптике принято называть потоком излучения или лучистым потоком. Количественной характеристикой излучения является его мощность (поток излучения) Φ e , а качественной характеристикой – его спектральный
состав,
при
Φ e = Φ e (λ ) ,
этом
где
λ – длина
волны
монохроматического излучения. Спектральный состав излучения определяется спектральной плотностью потока излучения, равной ϕeλ =
dΦ eλ . dλ
8
Спектральная
плотность
потока
излучения
ϕeλ
характеризует
распределение энергии в спектре. При заданной (или известной) зависимости ϕeλ от λ полный поток излучения в области спектра от λ1 до λ 2 определяется
очевидным выражением вида: λ2
Φ e = ∫ ϕeλ dλ .
(4.5)
λ1
Спектр излучения называют сплошным, если спектральная плотность потока излучения ϕeλ – непрерывная функция λ , отличная от нуля в широком интервале длин волн. Сплошной спектр имеет, например, свет, излучаемый раскалёнными твёрдыми телами и жидкостями. Спектр излучения называют линейчатым, если ϕeλ практически отлична от 1 нуля лишь в узких дискретных интервалах длин волн λ i ± ∆λ i 2
(∆λ i << λ i ) ,
каждому из которых соответствует своя спектральная линия. Линейчатый спектр имеют, например, газоразрядные источники излучения. Полный поток сложного
излучения,
имеющего
линейчатый
спектр,
определяется
суммированием: k =n
Φ e = Φ eλ1 + Φ eλ 2 + K + Φ eλn = ∑ Φ eλk . k =1
Спектр излучения называют полосатым, если соответствующие ему спектральные линии образуют дискретные группы – полосы, которые состоят из множества тесно расположенных линий. Непрерывную полосу имеют, например, спектр излучения люминофора в люминесцентном источнике излучения. Для обнаружения излучения и количественной оценки (измерения) потока излучения применяют приёмники излучения (приёмники лучистой энергии), которые, как правило, неодинаково реагируют на потоки излучения различного спектрального приёмниками.
состава.
Такие
Следовательно,
приёмники реакция
называют
селективного
селективными приёмника
при
воздействии на него потока излучения будет зависеть не только от величины
9
последнего, но и от спектрального состава излучения. В общем виде этой зависимости можно придать следующую математическую форму:
dX λ = S абс (λ )dΦ eλ ,
(4.6)
где dΦ eλ – поток излучения в пределах малого спектрального диапазона
dΦ eλ = ϕeλ dλ ; dX λ – некоторая величина, характеризующая изменение реакции приёмника;
Sабс (λ ) – абсолютная
спектральная
характеристика
чувствительности приёмника излучения. Спектральная
характеристика
приёмника
излучения
определяет
спектральный диапазон его работы. Чувствительностью приёмника излучения называют отношение изменения измеряемой реакции приёмника (например, тока или напряжения), вызванного падающим на приёмник излучения, к количественной характеристике этого излучения в заданных эксплуатационных условиях. Абсолютной спектральной характеристикой
чувствительности
приёмника
излучения
называют
зависимость монохроматической чувствительности S абс (λ ) , измеренной в абсолютных единицах, от длины волны падающего на приёмник потока излучения. Если приёмником излучения является глаз человека, то величиной dX λ принято считать световой поток dΦ λ , пропорциональный потоку излучения
dΦ eλ и соответствующий вызываемому им зрительному ощущению в глазу, при этом коэффициент пропорциональности принято называть коэффициентом видности K λ . В этом случае формула (4.6) имеет вид:
dΦ λ = K λ dΦ eλ . В
большинстве
(4.7) случаев
спектральные
характеристики
приёмников
излучения имеют вид плавных кривых с одним максимумом при λ = λ max , при этом абсолютная спектральная характеристика однотипных приёмников изменяется от приёмника к приёмнику. Однако, относительная спектральная характеристика
чувствительности
приёмника 10
излучения
S (λ ) =
S абс (λ ) , S λ max
определяющая
зависимость
его
монохроматической
чувствительности,
отнесённой к значению максимальной чувствительности, от длины волны регистрируемого излучения, остаётся практически неизменной для приёмников излучения одного и того же типа, но зависит от материала чувствительного слоя приёмника и для известных применяемых материалов приводится в справочниках. Зная из справочника S (λ ) и измерив Sλ max , можно легко определить
S абс (λ ) . Вполне очевидно, что относительная спектральная
характеристика чувствительности приёмника излучения S (λ ) может изменяться в пределах 0 ≤ S (λ ) ≤ 1 . Учитывая изложенное, выражение (4.6) можно представить в виде:
dX λ = S абс (λ )ϕλ dλ = S λ max S (λ )ϕλ dλ .
(4.8)
Чтобы получить полную реакцию приёмника от всего потока излучения, необходимо проинтегрировать выражение (4.8): ∞
X = S λ max ∫ S (λ )ϕλ dλ = S λ max Φ eэф . 0
Таким образом, эффективным потоком излучения Φ eэф источника для данного приёмника излучения называют поток, который при чувствительности приёмника, постоянной по всему спектру и равной максимальному значению
Sλ max , вызвал бы такую же реакцию приёмника, какую вызывает весь падающий реальный поток при реальной спектральной чувствительности. Интегральный поток от источника равен ∞
Φ e = ∫ ϕeλ dλ . 0
Следовательно, можно определить интегральную чувствительность ∞
X S= = Sλ max Φe
∫ S (λ )ϕeλ dλ 0
∞
∫ ϕeλ dλ
= Sλ max χ .
0
11
(4.9)
Отношение интегралов в полученном выражении показывает, какую долю в сложном потоке, падающем на приёмник излучения, составляет эффективный поток Φ eэф для данных приёмника излучения и источника. Это отношение обозначают буквой χ и называют коэффициентом использования потока излучения данным приёмником излучения или спектральным коэффициентом полезного действия (КПД) приёмника. Если приёмником излучения является глаз человека, то относительную спектральную характеристику глаза называют функцией (или коэффициентом) относительной спектральной видности (или чувствительности глаза) Vλ , определяемой отношением
Vλ =
Kλ . K λ max
Как
показали
коэффициент
(4.10) многочисленные
видности
Kλ
(при
экспериментальные дневном
зрении)
исследования,
достигает
своего
максимального значения K λ max при длине волны излучения λ max = 0,555 мкм,
при этом при λ = λ max функция относительной видности Vλ достигает своего максимального значения, равного единице. Из выражения (4.10) следует, что 0 ≤ Vλ ≤ 1. Итак, как следует из формул (4.7) и (4.10), монохроматическому потоку излучения dΦ eλ длины волны λ соответствует световой поток, равный
dΦ λ = K λ dΦ eλ = K λ max Vλ dΦ eλ .
(4.11)
При сплошном спектре излучения распределение светового потока определяется спектральной плотностью светового потока fλ =
dΦ eλ dΦ λ = Kλ = K λ ϕeλ , dλ dλ
где ϕeλ – спектральная плотность потока излучения. Для светового потока в пределах малого спектрального диапазона (для элементарного потока) имеем dΦ λ = f λ dλ = K λ ϕeλ dλ .
(4.12) 12
При этом световой поток сложного излучения со сплошным спектром равен λ2
λ2
Φ = ∫ K λ ϕeλ dλ = K λ max ∫ Vλ ϕeλ dλ . λ1
(4.13)
λ1
Здесь λ1 и λ 2 – длины волн, определяющие границы спектральной чувствительности
глаза.
За
пределами
видимой
области
спектра
подинтегральная функция равна нулю. 4.3. Фотометрические величины и единицы их измерения 4.3.1. Сила света
На некоторой ступени развития культуры и науки человек, получивший в своё распоряжение разнообразные источники искусственного света, начал интересоваться возможностью их сопоставительной количественной оценки. Одна из первых задач в области световых измерений состояла в том, чтобы определить какой из двух источников светит сильнее и во сколько раз. В 1604 году Иоганн Кеплер сформулировал один из главных законов фотометрии, согласно которому освещение, производимое источником света, изменяется обратно пропорционально квадрату расстояния до него. Если два источника освещают поверхность, расположенную на расстоянии r1 и r2 от каждого из них, то при одинаковом освещении каждым из них в соответствии с законом, сформулированным И.Кеплером, имеем I1 I 2 = , r12 r22
(4.14)
где I1 и I 2 – величины, характеризующие свечение сравниваемых источников в направлении на освещаемую поверхность. Эти величины получили название сил света источников. Выражение (4.14) позволяет рассчитать во сколько раз сила света одного источника больше силы света другого. Единица силы света, которая всегда была исходной для практики, воспроизводилась в разное время по-разному. Первыми эталонами силы света 13
были свечи. Сохранились сведения об английской спермацетовой свече и немецких парафиновых и стеариновых свечах, которые изготавливались особо тщательно. Во Франции около 1800 года свеча была заменена лампой Карселя, к фитилю которой подводилось сурепное масло. В Англии в 1887 году была предложена пентановая лампа, в бесфитильной горелке которой сгорала смесь паров пентана и подогретого воздуха. Из эталонов, питаемых жидким топливом, наиболее практичной оказалась лампа Гефнера, в тщательно стандартизованный корпус, которой наливался химически чистый амилацетат. Лампа Гефнера служила эталоном в Германии, Австрии, Швейцарии и некоторых других странах до 1948 года. Значительно более удобными в работе были эталоны, использующие свечение твёрдых тел. В 1879 году француз Виоль предложил считать единицей ту силу света, которую даёт в направлении, перпендикулярном к поверхности, квадратный сантиметр чистой платины при температуре её затвердевания. Эта единица (единица Виоля) была примерно в 20 раз больше пентановой свечи. Однако, этот эталон оказался нестабильным и от него вскоре пришлось отказаться. В 1909 году метрологические учреждения Англии, Франции и США согласились поддерживать некоторую новую единицу силы света, близкую к пентановой свече, с помощью группы тщательно изготовленных и постоянно контролируемых ламп накаливания. Первоначально групповой эталон состоял из угольных ламп, а в дальнейшем были созданы аналогичные группы из вольфрамовых ламп. Зафиксированной таким образом единице силы света было присвоено название "международная свеча". С 1924 года эта единица силы света была принята в СССР. Ею пользовались до 1948 года, когда она повсеместно была заменена канделой (кд) (от английского candle – свеча). Ещё в 1947 году канделу (в то время её называли новой свечой) было принято воспроизводить с помощью эталона, использующего свечение абсолютно чёрного тела, яркость которого при температуре затвердевания 14
чистой платины было решено считать равной 60кд⋅cм-2. С 1 января 1948 года эта
единица
была
повсеместно
принята
за
основу
измерения
всех
фотометрических величин. Важно отметить, что единица силы света является одной из семи основных единиц Международной системы – СИ. Сила света источника в общем случае зависит от направления излучения и в разных направлениях бывает весьма различной. Если источник имеет форму цилиндра (например, прямая газосветная лампа), то его наибольшая сила света направлена перпендикулярно к оси цилиндра, а наименьшая – вдоль оси. Нередко можно встретить графическое изображение распределения силы света источника в виде кривой в полярной системе координат, радиусы-векторы которой пропорциональны силам света источника в соответствующих направлениях. Такая кривая даёт наглядное представление о распределении света,
излучаемого
источником,
чем
светильником,
т.е.
источником,
в
окружающее
помещённым в некоторую арматуру. 4.3.2. Световой поток
Предположим,
что
источник
dSu
излучает
свет
пространство в пределах телесного угла dωu , вершина которого совпадает с источником dSu . Будем считать, что в некотором направлении сила света (в канделах) в пределах телесного угла dωu равна dI . С центром в вершине телесного угла построим сферы радиусов r1, r2 и r3 , как показано на рис.4.3, и обозначим через dS1, dS2 и dS3 элементарные площадки, вырезанные конусом телесного угла dωu на соответствующих сферах. Согласно закону обратной пропорциональности
квадрату
пропорциональна отношениям
dS1, dS2
и
dS3
расстояния
освещённость
площадок
dI dI dI , , . За единицу времени на площадке r12 r22 r32
упадёт одна и та же энергия, которая переносится
15
рассматриваемым пучком лучей в пределах угла dωu . Составив произведения dI dI dI dS1 , 2 dS2 и 2 dS3 , замечаем, что каждое из них равно dIdωu , так как 2 r2 r3 r1 dS1 dS2 dS3 = 2 = 2 = dωu . r12 r2 r3 dS3 dωu
dS2 dS1
r1
r2 r3
Рис.4.3. Световой поток источника dSu внутри телесного угла dωu
Величина
d 2Φ = dIdωu
(4.15)
равная световой мощности, переносимой пучком лучей, распространяющимся внутри телесного угла dωu , получила название светового потока. Световой поток, определяемый соотношением (4.15) представляет собой ту часть полного светового потока, излучаемого источником dSu , которая приходится на телесный угол dωu . Если сила света источника зависит от направления распространения излучения, то полный световой поток dΦ , излучаемый источником dSu в окружающее пространство, равен dΦ = ∫ dIdωu ,
(4.16)
ωu
где ωu ≤ 4π . Единица светового потока – люмен (лм) (от латинского lumen – свет, лампа), при этом световой поток, распространяющийся внутри телесного угла в 16
1ср при силе света источника, расположенного в его вершине, равной 1кд, равен 1лм, т.е. лм=кд⋅ср. В светотехнической практике часто пользуются представлением о средней сферической силе света I θ источника излучения как о силе света такого условного источника Su , который, излучая одинаково во все стороны, излучает такой же световой поток, что и реальный источник. Вполне очевидно, что полный световой поток Φ источника связан с его средней сферической силой света I θ простым соотношением:
Φ = 4πI θ . При определении понятий силы света и светового потока предполагалось, что источник света расположен в вершине телесного угла, т.е. в точке. Однако, источник излучения точкой физически быть не может. Следует обратить внимание на то обстоятельство, что понятие силы света источника непосредственно связано с направлением излучения, при этом лучи, исходящие из разных точек источника и падающие на освещаемый предмет, должны располагаться внутри малого телесного угла. В равной мере и расстояние от источника до освещаемой поверхности приобретает определённость только тогда, когда размер источника мал по сравнению с расстоянием, на котором определяется создаваемое им освещение. Прекрасным примером точечного источника могут служить звёзды, каждая из которых имеет огромные размеры. Однако, расстояние до звёзд столь велико, что их размеры не мешают точному определению направления на них. Таким образом, чем больше расстояние, на котором наблюдается световое действие источника, тем с большим основанием можно считать его точечным. Так, например, если источником излучения служит равномерность светящийся диск, то погрешность определения силы света не превышает 1%, если расстояние до источника превосходит его диаметр всего лишь в пять раз. 4.3.3. Освещённость. Светимость
Величина 17
dEn =
dI , r2
(4.17)
которая определяет величину освещения на поверхности, расположенной на расстоянии r от источника излучения dSu с силой света dI , при нормальном падении
лучей,
как
показано
на
рис.4.4,
называется
освещённостью
поверхности. За единицу освещённости принимается такая освещённость, которую создаёт источник излучения силой света в 1кд на поверхности, расположенной нормально к направлению излучения на расстоянии 1м от источника. Единица освещённости – люкс (лк) (от латинского lux – свет солнца, освещение). а)
dS cos ϕ
б)
dS r
r
ϕ
dSu
dSu
N
Рис.4.4. Лучи источника излучения dSu , падающие на поверхность dS по нормали к ней (а) и под углом ϕ к нормали (б)
Умножим числитель и знаменатель отношения (4.17) на бесконечно малый телесный угол dωu , в котором сила света источника dSu равна dI . В результате получаем dIdωu d 2 Φ dE n = 2 = , dS 0 r dω u
где d 2Φ = dIdωu – световой поток, распространяющийся от источника dSu в телесный
угол
dωu ,
а
dS0 = r 2dωu – площадь
элемента
поверхности,
нормальной к направлению излучения, на которой попадает этот поток. Отсюда следует, что освещённость поверхности представляет собой поверхностную плотность падающего на неё светового потока. Таким образом, единица 18
освещённости люкс определяет такую поверхностную плотность светового потока, при которой световой поток в 1лм покрывает поверхность площадью, равной 1м2. Если лучи от источника падают на поверхность под углом ϕ к нормали N к поверхности, как показано на рис.4.4, то тот же световой поток
d 2Φ падает на площадку dS = dEϕ =
dS0 . В этом случае cos ϕ
dI cos ϕ = dEn cos ϕ . r2
(4.18)
Каждый элемент dSm излучающей или освещённой поверхности излучает или отражает в окружающее пространство (точнее, в полупространство, измеряемое
телесным
углом
2π )
некоторый
световой
поток
d 2Φ изл .
Поверхностная плотность излучаемого или отражённого светового потока dM =
d 2 Φ изл dS m
(4.19)
называется светимостью. Единица светимости – люмен на квадратный метр (лм⋅м-2). 4.3.4. Яркость
Предположим,
что
бесконечно
малый
элемент
dSu
излучающей
поверхности освещает бесконечно малый элемент dSm некоторой поверхности, расположенной на расстоянии r от dSu . Будем считать, что из каждой точки элемента dSu лучи проходят через принятую в качестве осевой точку элемента dS , образуя телесный угол dω . При этом световой поток, падающий на поверхность элемента dS , в соответствии с выражением (4.4) равен d 2Φ = LdωdS0 = LdωdS cos ϕ ,
где ϕ – угол между осью телесного угла dω и нормалью к элементу dS . Коэффициент пропорциональности L называется яркостью излучающего элемента dSu в направлении к освещаемому элементу dS . Телесный угол в этом уравнении 19
dω =
dSu cos ϕu , r2
где ϕu – угол между осью телесного угла dω и нормалью к элементу dSu . При этом d 2Φ = L
dSu cos ϕu dS cos ϕ . r2
Заметим, что отношение
(4.20) dS cos ϕ определяет телесный угол dωu с r2
вершиной в любой точке элемента dSu . В соответствии с выражением (4.15) световой поток d 2Φ = dIdωu . При этом из выражения (4.20) следует, что d 2Φ dI . L= = dSu cos ϕu dωu dSu cos ϕu
(4.21)
Выражение (4.21) определяет яркость поверхности Su в любой её точке и в любом направлении (при любом значении угла ϕu ) отношением силы света элемента поверхности в выбранном направлении к площади проекции этого элемента на плоскость, перпендикулярную направлению силы света. Отсюда следует, что за единицу яркости следует принять яркость такой поверхности, для которой сила света, выраженная в канделах, равна выраженной в квадратных метрах площади её проекции на плоскость, перпендикулярную к направлению силы света. Таким образом, единица яркости – кандела на квадратный метр (кд⋅м-2). Выражение (4.20) можно представить в виде: d 2Φ = LdS0 cos ϕu dωu = LdS cos ϕdω .
(4.22)
В этом выражении в среднюю часть входят величины, относящиеся только к площадке излучателя dSu , а в правую часть – те же величины, но относящиеся к площадке dS . Если площадку dS перемещать в направлении пучка лучей, сохраняя её величину и угол падения ϕ , то как телесный угол
dωu , так и телесный угол dω , а, соответственно и световой поток d 2Φ , будут 20
изменяться
пропорционально
изменению
обратной
величины
квадрата
расстояния между площадками. Следовательно, яркость L должна оставаться постоянной в направлении рассматриваемого пучка лучей и равной яркости элемента dSu в этом направлении. Это справедливо только в тех случаях, когда среда, через которую распространяется пучок лучей, не поглощает и не рассеивает свет. Изложенные соображения позволяют распространять понятие яркости поверхности на пучок световых лучей, при этом представление о яркости светового пучка следует считать более общим. Понятие яркости пучка лучей, введённое в трудах академика Владимира Александровича Фока, Андрея Александровича Гершуна, Сергея Осиповича Майзеля и др., оказалось весьма удобным при исследовании
объёмных
источников или рассеивающих
излучение сред, например, безоблачного неба, где невозможно указать поверхность, с которой можно было бы связать определение яркости, т.е. в подобных случаях понятие яркости поверхности вообще теряет смысл. Единственным объектом, которому можно приписать, например, яркость безоблачного неба, является сам пучок световых лучей, пришедший к нам с того или иного направления. Обратимся вновь к выражению (4.22), из которого находим, что dEϕ d 2Φ dE L= = = n, dS cos ϕdω cos ϕdω dω т.е. яркость элементарного пучка лучей пропорциональна освещённости, которую он создаёт на перпендикулярной к нему поверхности и обратно пропорциональна телесному углу, который он заполняет. Из выражения (4.21) следует, что
dI = LdSu cos ϕu .
(4.23)
Для элемента источника, излучающего по закону Ламберта, яркость излучающей поверхности одинакова по всем направлениям. Если для всех направлений (т.е. для всех значений угла ϕu ) L(ϕu ) = L = const , то
dI = dI 0 cos ϕu , 21
где dI 0 = LdS u – сила света излучающего элемента dSu в нормальном к нему направлении (т.е. при ϕu = 0 ). Если для всех точек светящейся поверхности Su справедлив закон Ламберта, то I = I 0 cos ϕ u . Если поверхность dSu излучает равномерно во всех направлениях, то полный световой поток, излучаемый элементом dSu по одну сторону от себя, равен 2π
dΦ = LdSu ∫ cos ϕu dωu . 0
Телесный угол ωu = 2π(1 − cos ϕu ) , и, соответственно, dωu = 2π sin ϕu dϕu . Тогда ϕu =
dΦ = πLdSu
π 2
∫ 2 sin ϕu cos ϕu dϕu = πLdSu .
ϕu = 0
При этом светимость поверхности
M=
dΦ = πL . dSu
Пусть
освещённость
рассеивающей
(4.24) поверхности
поверхности
соотношением (4.24) равна L =
M =E,
равна а
E.
яркость
Светимость её
в
идеально
соответствии
с
E . Значение идеального рассеивателя состоит в π
том, что с его предельными свойствами удобно сравнивать свойства всех реальных материалов. 4.3.5. Световая энергия. Экспозиция
Классическая фотометрия, основы которой были заложены трудами П.Бугера и И.Ламберта в XVIII веке, предполагают применение непрерывно излучающих источников, отвечающих требованиям стабильности излучения в течение длительного времени, которое само по себе значения не имело. Однако, уже давно стали выявляться случаи, в которых длительность свечения играла существенную роль. Примером такого случая может служить применение
22
импульсных источников света, которые с некоторых пор начали приобретать всё более широкое распространение. Длительность свечения импульсных источников излучения измеряется иногда тысячными и даже миллионными долями секунды, что очень существенно, например, для фотографии. Излучение импульсного источника обладает переменной мощностью, которая, возрастая от нуля, достигает за малые доли секунды своего максимального значения, а затем падает до нуля. Поэтому излучение импульсного источника характеризуют или длительностью импульса и максимальной мощностью излучения или энергией импульса, которая определяется интегралом от мощности по времени излучения. Одним из видов навигационного ограждения пути корабля в море, осуществляемому с помощью плавающих буёв или бакенов, являются проблесковые огни. В тёмное время суток эти огни, вспыхивающие периодически на десятые доли секунды, позволяют мореплавателю определять своё
местоположение.
Темновые
паузы
имеют
значительно
большую
длительность. Инерционные свойства глаза заставляют принимать во внимание не только силу света проблескового огня, но и длительность свечения. При фотометрических процессах (фотография, фотосинтез) результат также зависит не только от освещённости светочувствительного слоя, но и от времени освещения. В связи с тем, что число таких случаев непрерывно растёт и они приобретают всё большее значение, оказалось необходимым пополнить фотометрическую систему рядом новых величин, из которых в первую очередь надо отметить следующие: 1. Световая энергия Q в соответствии с определением равна τ
Q = ∫ Φdt
(4.25)
0
и измеряется в люмен-секундах (лм⋅с). 2. Экспозиция (или количество освещения) H определяется интегралом
23
τ
H = ∫ Edt
(4.26)
0
и измеряется в люкс-секундах (лк⋅с). Но Φ = ∫ EdS . Тогда dQ = ∫ EdSdt = HdS . При этом τ
S
H=
dQ . dS
(4.27)
Из последнего выражения следует, что экспозиция H представляет собой поверхностную плотность световой энергии. 4.4. Энергетические величины
Итак, распределение светового потока по телесному углу определяется силой
света,
по
поверхности – освещённостью
или
светимостью,
а
одновременно по телесному углу и по поверхности – яркостью. Представление о световом потоке и обо всех связанных с ним величинах формировалось в процессе развития визуальной фотометрии. Существенными факторами, определяющими формирование этих представлений, во-первых, было то, что невидимые излучения ещё не были известны, и, во-вторых, то, что глаз человека был единственным средством обнаружения и оценки излучения любого источника. Таким образом, световой поток оказывался естественной мерой всякого излучения. 4.4.1. Связь между световыми и энергетическими величинами
К видимому свету, свойства которого были изучены ещё И.Ньютоном, добавились открытые в начале XIX века инфракрасное и ультрафиолетовое излучения. Позже была установлена их общая электромагнитная природа и общая скорость распространения в вакууме. Появились разнообразные приёмники излучения, чувствительные к излучению различного спектра, а соответственно
расширился
и
спектральный
диапазон
применяемого
излучения. Одновременно с этим во всё большей степени ощущалась 24
необходимость оценки общей мощности переносимого электромагнитного излучения независимо от его спектрального состава, которая получила название потока излучения (или лучистого потока). Поток излучения принято обозначать буквой P или Φ e и, как всякую мощность, измерять в ваттах. Как естественное средство того, что поток излучения становится основой радиационной энергетики, возникла потребность во всех видах производных величин, применяемых для характеристики его пространственного распределения, т.е. появилась необходимость в системе энергетических величин, построенных аналогично системе световых (визуальных) величин. Отличие этих новых величин от прежних состоит только в том, что вместо светового потока в их определения входит поток излучения. Наиболее естественным и удобным способом наименования этих новых энергетических величин принят такой, при котором за каждой энергетической величиной сохраняется название её светового аналога с добавлением слова "энергетической". Что касается обозначения, то за каждой энергетической величиной сохраняется обозначение, используемое для аналогичного светового понятия, с добавлением внизу индекса e . Таким образом, плотность потока излучения по телесному углу получает название энергетической силы света или силы излучения источника и определяется соотношением I e =
dΦ e , где dΦ e – dω
бесконечно малый поток излучения, распространяющийся от источника внутри бесконечно малого телесного угла dω . Энергетическая сила света измеряется в ваттах на стерадиан (Вт⋅ср-1). Поверхностная плотность потока излучения имеет следующие названия: энергетическая освещённость, равная Ee = энергетическая светимость, равная M e =
dΦ e изл dSu
dΦ e пад dS
, и
, где dΦ e пад и dΦ e изл –
бесконечно малые потоки, падающий на элемент поверхности и излучаемый элементом поверхности. Соответственно, эти величины измеряют в ваттах на квадратный метр (Вт⋅м-2). Аналогичным образом вводится и понятие об 25
энергетической яркости как о поверхностной плотности энергетической силы света, равной
Le =
dI e , dS cos ϕ
т.е. об энергетической силе света, отнесённой к площади проекции элемента поверхности на плоскость, перпендикулярную к направлению энергетической силы света. Эта величина измеряется в ваттах на стерадиан и на квадратный метр (Вт⋅ср-1⋅м-2). 4.4.2. Световая эффективность
При сплошном спектре полный поток излучения в соответствии с формулой (4.5) равен ∞
∞
Φ e = ∫ dΦ eλ = ∫ ϕeλ dλ . 0
(4.28)
0
Если поток излучения dΦ eλ приходится на видимую часть спектра, то при этом возможно световое воздействие излучения на глаз и ощущение некоторого светового потока dΦ λ , в соответствии с выражением (4.11) равного
dΦ λ = K λ maxVλ ϕeλ dλ , где
K λ max – коэффициент
максимальной
световой
(4.29) пропорциональности, эффективностью
который
излучения.
Если
называют мощность
измеряется в ваттах, а световой поток – в люменах, то коэффициент K λ max равен числу люменов светового потока, вызванного потоком излучения в один ватт при той длине волны излучения, при которой Vλ = 1 , т.е. при
λ 0 = 0,555 мкм. Развитие фотометрии как теоретической, так и экспериментальной, позволило Международному комитету мер и весов принять в 1977 году, что 1ВТ излучения частоты ν 0 = 540 ⋅ 1012 Гц ( λ 0 =
26
c = 0,555 мкм), обладающего ν0
наибольшей световой эффективностью при дневном освещении, эквивалентен 683лм светового потока. Световой эффективностью излучения называют отношение светового потока к потоку вызвавшего его излучения. Вполне очевидно, что световая эффективность излучения зависят от спектрального состава излучения и равна нулю в тех случаях, когда излучение не содержит потока в видимой части спектра. Световая эффективность солнечного излучения близка к 100лм⋅Вт-1, а для монохроматических потоков световая эффективность K λ = Vλ K m , где
K m =683лм⋅Вт-1, а Vλ – относительная спектральная чувствительность глаза. Световой поток источника излучения сложного спектрального состава может быть определён как сумма элементарных световых потоков всех его монохроматических составляющих:
Φ = K m ∫ Vλ d Φ eλ = K m ∫ Vλ ϕeλ dλ . λ
(4.30)
λ
Это выражение определяет понятие светового потока, откуда следует, что световой поток является величиной, пропорциональной потоку излучения, оценённому в соответствии с относительной спектральной чувствительностью среднего глаза. Иногда световой поток выражают в ваттах, условно называемых световыми ваттами, число которых считается равным интегралу ∫ Vλ dΦ eλ , если λ
поток излучения dΦ eλ = ϕeλ dλ выражен в ваттах. Важно обратить внимание на то, что один световой ватт эквивалентен 683лм независимо от спектрального состава излучения. Отношение светового потока в световых ваттах к потоку излучения в ваттах представляет собой безразмерную величину, равную
η=
∫Vλϕeλ dλ λ
(4.31)
∫ ϕeλ dλ λ
27
которую называют световым коэффициентом полезного действия (к.п.д.) излучения. Величина этого коэффициента может достигать единицы, если речь идёт о монохроматическом излучении с длиной волны λ = 0,555 мкм. Во всех других случаях световой к.п.д. излучения меньше единицы и падает до нуля, если излучение не захватывает видимой области спектра.
K mη = 683η лм⋅Вт-1 определяет световую
Заметим, что произведение
эффективность излучения, которая, естественно, зависит от его спектрального состава и может принимать значения от 683лм⋅Вт-1 до нуля. Следует различать световую эффективность излучения и световую эффективность источника, которая равна отношению светового потока к мощности, потребляемой им от источника энергии, например, от электрической сети. Световая эффективность источников света колеблется от 8÷9лм⋅Вт-1 для низкотемпературных вакуумных ламп накаливания (у вакуумных ламп давление остаточных газов в колбе после откачки
10-5÷10-7мм рт.ст.)
до
9÷13,5лм⋅Вт-1
для
высокотемпературных
газонаполненных ламп накаливания (у газонаполненных ламп после откачки колба заполняется смесью инертных газов, давление которых у холодной лампы приближённо равно 600мм рт.ст.). Световая эффективность ламп накаливания с йодным циклом достигает 25÷30лм⋅Вт-1 при среднем сроке службы до 2000ч. Большая заслуга в создании электрических ламп накаливания принадлежит выдающемуся русскому учёному Александру Николаевичу Лодыгину (1847– 1923), который разработал конструкцию ламп накаливания с угольной нитью в 1872 году и создал первые образцы ламп, пригодных для работы. Американский изобретатель и предприниматель Томас Алва Эдисон (1847– 1931) усовершенствовал лампу накаливания, предложив в 1879 году конструкцию
лампы,
основные
принципиальные
элементы
которой
сохранились до настоящего времени. Выдающаяся роль в деле создания газоразрядных источников света принадлежит русским электротехникам. Академик Петербургской АН Василий 28
Владимирович Петров (1761–1834) в 1802 году первым получил устойчивую электрическую дугу в воздухе и указал на возможность её использования в качестве источника света. Однако, лишь спустя 70 лет удалось осуществить на этом принципе источник, приемлемый для целей освещения. Заслуга эта принадлежит
известному
русскому
изобретателю
Петру
Николаевичу
Яблочкову (1847–1894), создавшему источник, нашедший применение как в России, так и за рубежом и получивший название "свеча Яблочкова". Световая эффективность современных газоразрядных ламп равна: натриевых ламп – до 1009лм⋅Вт-1, люминесцентных ламп – до 70–80лм⋅Вт-1, ртутных ламп высокого давления (ВД) и сверхвысокого давления (СВД) – до 60лм⋅Вт-1, а газовых ламп ВД и СВД – до 45–50лм⋅Вт-1. При значительно более высокой световой эффективности (световой отдаче), чем у ламп накаливания, газоразрядные лампы имеют и значительно больший срок службы. Если средний срок службы осветительной лампы накаливания равен 1000ч. и не может быть увеличен без снижения и без того низкой световой эффективности, то срок службы современных люминесцентных ламп достигает 14000ч. Легко видеть, что равенства, подобные равенству (4.30), можно составить не только для светового потока, но и для любой другой фотометрической величины. Например, для яркости, выраженной в канделах на квадратный метр, справедливо равенство:
L = K m ∫ Vλ d Le = K m ∫ Vλ Leλ dλ , Le
(4.32)
λ
где Vλ имеет прежнее значение, а dLe = Leλ dλ – энергетическая яркость, приходящаяся на спектральный интервал λ, λ + dλ , Вт⋅ср-1⋅м-2. Заметим, что яркость излучения капиллярных ртутно-кварцевых ламп СВД с водяным охлаждением достигает (1,5 ÷ 1,8) ⋅ 109 кд⋅м-2 при средней визуальной яркости Солнца L = 1,95 ⋅ 109 кд⋅м-2.
4.5. Фотометрические свойства тел
29
Фотометрические свойства окружающих нас предметов определяют яркость и цветность (окраску), которые они принимают под влиянием падающего излучения. 4.5.1. Общие соотношения
Для определённости будем считать, что освещённый предмет представляет собой плоский слой прозрачного вещества, как показано на рис.4.5, толщина которого мала по сравнению с линейными размерами его освещаемой поверхности. Пусть на поверхность слоя из пространства, расположенного перед ним падает произвольно распределённый по направлениям световой поток Φ пад . Освещённый слой разделит упавший на него световой поток на три части: поток Φ отр , отражённый от слоя в ту полусферу, из которой пришёл падающий поток; поток Φ пр , прошедший через слой и вышедший в другую полусферу, и поглощённый поток Φ погл , который в веществе слоя превратится в теплоту или другую форму энергии. В соответствии с законом сохранения энергии сумма отражённого, прошедшего и поглощённого световых потоков равна падающему потоку: Φ отр + Φ пр + Φ погл = Φ пад
или Φ отр Φ пад
+
Φ пр Φ пад
+
Φ погл = 1. Φ пад
(4.33)
Отношение светового потока, отражённого от слоя, к световому потоку, падающему
на
слой,
называется
коэффициентом
отражения
слоя
и
обозначается буквой ρ . Отношение светового потока, прошедшего через слой, к световому потоку, падающему на слой, называется коэффициентом пропускания слоя и обозначается буквой τ .
30
Отношение светового потока, поглощённого в слое, к световому потоку, падающему
на слой, называется
коэффициентом поглощения слоя и
обозначается буквой α . При этом в соответствии с формулой (4.33) имеем ρ + τ + α = 1.
(4.34)
Для окрашенных веществ эти коэффициенты зависят от спектрального состава падающего излучения. Для монохроматического излучения с длиной волны λ ± δλ их принято обозначать ρ(λ ) , τ(λ ) и α(λ ) . Спектральную зависимость коэффициентов ρ(λ ) , τ(λ ) и α(λ ) удобно изображать графически, откладывая по оси абсцисс длину волны λ , а по оси ординат – один из коэффициентов. Пример такого графика показан на рис.4.6. Поток
излучения
любого
спектрального
состава
всегда
можно
рассматривать как сумму большого числа монохроматических составляющих с мощностями dΦ eλ = ϕeλ dλ , каждая из которых, попав на слой, претерпевает изменения, зависящие от его спектральных свойств. При этом мощности отражённой, пропущенной и поглощённой монохроматической составляющей излучения могут быть представлены в виде произведений: ρ(λ )Φ eλ , τ(λ )Φ eλ и α(λ )Φ eλ .
Световой поток падающего излучения можно определить выражением (4.30) в виде:
Φ пад = K m ∫ Vλ d Φ eλ = K m ∫ Vλ ϕ eλ dλ . λ
λ
Вполне очевидно, что световые потоки: отражённый от слоя, прошедший через него и поглощённый в нём, определяются подобными интегралами вида:
Φ отр = K m ∫ ρ(λ )Vλ ϕ eλ dλ ; λ
Φ пр = K m ∫ τ(λ )Vλ ϕ eλ dλ ; λ
Φ погл = K m ∫ α(λ )Vλ ϕ eλ dλ . λ
31
В соответствии с этим визуальные коэффициенты отражения, пропускания и поглощения можно определить выражениями в такой форме:
ρ=
∫ ρ(λ )Vλϕeλ dλ λ
∫ Vλϕeλ dλ
,
(4.35)
,
(4.36)
λ
τ=
∫ τ(λ )Vλϕeλ dλ λ
∫ Vλϕeλ dλ λ
α=
∫ α(λ )Vλϕeλ dλ λ
∫ Vλϕeλ dλ
,
(4.37)
λ
где все интегралы берутся в пределах видимого спектра. Если в выражениях (4.35), (4.36) и (4.37) формально положить множитель
Vλ ≡ 1 , то они примут вид выражений, определяющих энергетические коэффициенты отражения ρe , пропускания τe и поглощения α e . Таким образом, ρe =
∫ ρ(λ )ϕeλ dλ λ
,
(4.38)
,
(4.39)
∫ ϕeλ dλ λ
τe =
∫ τ(λ )ϕeλ dλ λ
∫ ϕeλ dλ λ
αe =
∫ α(λ )ϕeλ dλ λ
∫ ϕeλ dλ
,
(4.40)
λ
где все интегралы распространены на весь спектр излучения источника. Отсюда
следует,
что
энергетические
коэффициенты
отражения,
пропускания и поглощения характеризуют фотометрические свойства слоя для нейтрального приёмника. Действие всех известных нейтральных приёмников излучения основано на нагревании, возникающем при поглощении падающего 32
на них излучения. Поэтому все нейтральные приёмники имеют чёрную поверхность, причём хороший приёмник должен поглощать излучение в невидимых областях спектра такую же часть падающего на него излучения, как и в видимой области. Поверхность современного нейтрального приёмника имеет высокий и практически одинаковый коэффициент поглощения в спектральном диапазоне излучения от 0,3мкм до 40мкм. В соответствии с выражениями (4.35)–(4.40) величина коэффициентов отражения, пропускания и поглощения зависит не только от спектральных свойств материалов, определяемых функциями ρ(λ ) , τ(λ ) и α(λ ) , но также от ϕeλ . Влияние спектральной чувствительности глаза на
вида функции
коэффициенты ρ, τ и α подобно влиянию спектрального состава падающего излучения, при этом изменение спектральной чувствительности глаза, наступающие, например, при приходе к сумеречному зрению, влечёт за собой изменение
величины
материалов,
этих
коэффициентов.
спектральные
Только
характеристики
для
которых
нейтральных в
пределах
рассматриваемого интервала длин волн не зависят от длины волны, коэффициенты отражения, пропускания и поглощения не зависят ни от спектрального
состава
чувствительности
глаза
падающего и
излучения,
совпадают
с
их
ни
от
значениями
спектральной для
любого
монохроматического излучения. 4.5.2. Полезные сведения из электромагнитной теории света
Уравнения
Максвелла
характеризующие
связывают
электромагнитное
поле,
между с
его
собой
величины,
источниками,
т.е.
с
распределением в пространстве электрических зарядов ρ и токов j , системой дифференциальных
уравнений.
Дифференциальные
уравнения,
которые
должны удовлетворять каждый из векторов в отдельности, можно получить путём исключения остальных векторов. При этом в однородной среде в области
33
поля, не содержащей ни зарядов (ρ = 0 ) , ни токов ( j = 0 ) , дифференциальные уравнения имеют вид: ∇2E −
εµ && E = 0. c2
(4.41)
∇2H −
εµ && H = 0. c2
(4.42)
Здесь
c – скорость света в вакууме; точка над буквой означает
дифференцирование по времени. Уравнение вида (4.41) или (4.42) называется уравнением д′Аламбера или волновым уравнением. Эти уравнения волнового движения
определяют
существование
распространяющихся со скоростью V =
электромагнитных
волн,
c . εµ
В однородной среде в области, где отсутствуют заряды и токи, любой из декартовых компонентов A(r , t ) векторов поля E или H в соответствии с уравнениями (4.41) или (4.42) удовлетворяет однородному волновому уравнению ∂2 A − V 2∇ 2 A = 0 . 2 ∂t
(4.43)
Пусть r ( x, y, z ) – радиус-вектор некоторой точки P , а s (s x , s y , s z ) – единичный вектор с фиксированным направлением. При этом любое решение уравнения (4.43) в виде A = A(r ⋅ s , t ) определяет плоскую волну, так как в каждый момент времени величина A постоянна в плоскостях r ⋅ s = const , которые перпендикулярны к единичному вектору s . В точке r0 пространства возмущение, вызванное волной, зависит только от времени, т.е. A(r0 , t ) = f (t ) . Важный частный случай электромагнитных волн представляют волны, в которых поле является простой периодической функцией времени. Такая волна называется монохроматической. Зависимость компонентов поля от времени в монохроматической волне определяется множителем вида cos(ωt + δ ) , где ω –
34
угловая частота волны, а δ – начальная фаза. При этом функцию f (t ) можно представить в виде f (t ) = a cos(ωt + δ ) .
(4.44)
Величина a (a > 0 ) называется амплитудой, а аргумент косинуса (ωt + δ ) – фазой. Величина ν =
ω 1 = называется частотой колебаний и представляет 2π T
собой число колебаний в секунду. При замене величины t на t + T значение функции f (t ) остаётся неизменным. Поэтому величина T называется периодом колебаний. Волновые функции в форме (4.44) называют гармоническими функциями относительно времени. Рассмотрим волновую функцию, которая определяет гармоническую плоскую волну, распространяющуюся в направлении, заданном единичным вектором s . Для этого в выражении (4.44) заменим величину t величиной t−
r ⋅s . При этом получаем V ⎡ ⎛ r ⋅s ⎞ ⎤ A(r , t ) = a cos ⎢ω⎜ t − ⎟+δ . V ⎠ ⎥⎦ ⎣ ⎝
(4.45)
Расстояние, на которое перемещается поверхность волны за время T , равное
одному
периоду
колебаний,
определяет
напряжённости поля в пространстве, равный λ = VT = V
период
изменения
2π . Длина волны λ ω
называется длиной волны, при этом приведённая длина волны λ 0 = cT = nλ . Эта длина волны соответствует распространяющейся в вакууме гармонической волне той же частоты. Легко убедиться, что величина A(r , t ) , определяемая выражением (4.45), не изменится, если величину r ⋅ s заменить на r ⋅ s + λ . Выражение (4.45) можно представить в виде: A(r , t ) = a cos(ωt − k ⋅ r + δ ) ,
(4.46)
где k = ks называется волновым вектором или вектором распространения волны в среде, при этом волновое число k =
ω 2π 2π = =n = nk0 . Под A(r , t ) можно V λ λ0
35
понимать любую из проекций векторов E и H на оси декартовой системы координат. Амплитуда a и начальная фаза δ плоской монохроматической волны не зависят от r и t , т.е. одинаковы во всём пространстве во все моменты времени, а, следовательно, выражение (4.46) определяет однородную волну. Никакие
реальные
монохроматическую
волны
этим
волну
можно
свойством
не
рассматривать
обладают. как
Плоскую
частный
случай
гармонических волн общего вида, определяемых уравнением
A(r , t ) = a(r ) cos[ωt − g (r )] ,
(4.47)
где a > 0 и g – вещественные скалярные функции положения. Поверхности
g (r ) = const
называют поверхностями постоянной фазы или волновыми
поверхностями. В отличие от предыдущего случая поверхности постоянной амплитуды волны, определяемой уравнением (4.47), вообще говоря, не совпадают с поверхностями постоянной фазы. Говорят, что такое уравнение определяет неоднородную волну. Расчёты, связанные с гармоническими волнами, упрощаются, если использовать экспоненциальные функции вместо тригонометрических. При этом уравнение (4.47) можно записать в виде
A(r , t ) = Re {U (r ) exp(− iωt )},
(4.48)
где U (r ) = a(r ) exp[ig (r )], а символ Re означает, что берётся вещественная часть. Заметим, что изучение свойств плоской монохроматической волны важно потому, что любая электромагнитная волна может быть представлена в виде суперпозиции таких простых волн, поскольку сумма любых решений уравнений Максвелла является их решением. Кстати сказать, последнее утверждение в этом замечании позволяет от уравнения (4.48) перейти к уравнению вида:
A(r , t ) = U (r ) exp(− iωt ) .
(4.49)
Отсюда следует, что A(r , t ) = U (r ) exp(− iωt ) , а ∇ 2 A = exp(− iωt )∇ 2U (r ) . При этом уравнение (4.43) принимает вид: ∇ 2U + n 2 k02U = 0 .
(4.50) 36
Полученное уравнение называют уравнением Гельмгольца. Величину U называют комплексной амплитудой волн. В частности, для плоской волны имеем ⎛ r ⋅s ⎞ g (r ) = ω⎜ ⎟ − δ = k (r ⋅ s ) − δ = k ⋅ r − δ ⎝ V ⎠
при этом U (r ) = a exp(ik ⋅ r ) , где a = a0 exp(− iδ ). 4.5.3. Поляризация плоских монохроматических волн
Итак, решение уравнений Максвелла в форме (4.45) даёт бегущую плоскую монохроматическую волну. В бегущей плоской электромагнитной волне вектора E и H в каждой точке пространства и в каждый момент времени образуют с волновым вектором k правую тройку векторов. В этом заключается свойство поперечности электромагнитных волн. Направим ось z системы координат вдоль волнового вектора k . Тогда у векторов E и H могут быть отличны от нуля только проекции на оси x и y . Уравнения Максвелла допускают, в частности, такое решение, при котором у вектора E во всех точках в пространстве и во все моменты времени отлична от нуля только одна проекция, например,
Ex ( z , t ) . Вследствие свойства
поперечности у вектора H отлична от нуля только проекция на ось y , т.е.
H y ( z , t ) . Эти проекции связаны между собой соотношением
ε Ex = µ H y .
Мгновенный "снимок" такой волны, показывающий векторы E и H в разных точках оси z в один момент времени, показан на рис.4.7. В этом случае говорят, что волна имеет линейную, или плоскую, поляризацию. Плоскость, в которой лежит вектор напряжённости электрического поля волны E и волновой вектор k , называют плоскостью поляризации или плоскостью колебаний. Чтобы представить себе изменение электрического и магнитного полей с течением времени, можно считать, что вся система векторов, показанная на рис.4.7, движется как целое вдоль оси z со скоростью c (в вакууме). 37
Излучение обычных источников света не поляризовано. Свет, в котором представлены
все
направления
колебаний
вектора
E
в
плоскости,
перпендикулярной направлению распространения, называется естественным светом. Линейно поляризованный свет получают, пропуская естественный через оптические поляризаторы. Действие этих устройств основано на различных физических принципах. С их помощью можно не только получить линейно поляризованный свет, но и выяснить, имеет ли исследуемое излучение линейную
поляризацию.
Выполняющее
такую
роль
поляризационное
устройство называют анализатором. Интенсивность пропускаемого через анализатор линейно поляризованного света при повороте анализатора изменяется от максимального значения, когда направление поляризации совпадает с направлением пропускания анализатора, и до нуля, когда эти направления перпендикулярны друг другу. В отличие от обычных источников света излучение газового лазера, окна разрядной трубки которого наклонены на некоторый угол к её оптической оси (угол Брюстера), обладает линейной поляризацией. В общем случае вектор E может иметь любые направления в плоскости, перпендикулярной направлению распространения волны. Пусть наряду с волной, поляризованной в плоскости
x0 z , в том же направлении (в
направлении z ) распространяется другая волна той же частоты ω , но поляризованная
в
y0 z .
плоскости
Вследствие
линейности
уравнений
Максвелла такое наложение (или суперпозиция) волн также является решением уравнений.
В
зависимости
от
разности
фаз
складываемых
линейно
поляризованных волн результирующая волна может иметь различную поляризацию. Рассмотрим электрическое поле E ( z , t ) волны, возникающей при сложении двух волн одинаковой частоты с ортогональными направлениями линейной поляризации:
Ex ( z , t ) = E0 x exp[i(kz − ωt )] = a exp(− iϕ1 )exp[i(kz − ωt )], 38
(4.51)
E y ( z , t ) = E0 y exp[i (kz − ωt )] = b exp(− iϕ2 )exp[i (kz − ωt )] .
(4.52)
При одинаковых (или отличающихся на nπ , где n – целое число) фазах ϕ1 и ϕ2 комплексных амплитуд E0 x и E0 y в каждой точке происходит сложение взаимно перпендикулярных колебаний в одной фазе, что даёт колебание в новом направлении. Результирующая волна будет линейно поляризованной. Направление её поляризации зависит от отношения амплитуд a и b , как показано на рис.4.8. Пусть волна, поляризованная в плоскости y 0 z , отстаёт по фазе на волны, поляризованной в плоскости x0 z , т.е. ϕ1 − ϕ2 =
1 от 2π
1 . Если амплитуда 2π
этих волн одинаковы (a = b ) , то вектор E в любой точке z будет вращаться в плоскости x0 y против часовой стрелки, оставаясь неизменным по модулю. Например, в точке z = 0 имеем
Ex (t ) = a cos(ωt + ϕ1 )
(4.53)
1 ⎞ ⎛ E y (t ) = a cos⎜ ωt + ϕ1 − π ⎟ = a sin (ωt + ϕ1 ) . 2 ⎠ ⎝
(4.54)
Такую волну называют поляризованной по кругу или циркулярно поляризованной. Когда при наблюдении навстречу волне вращение вектора E в фиксированной плоскости происходит как в рассмотренном примере при
z = 0 , т.е. против часовой стрелки, то говорят о волне левой круговой поляризации. Правая круговая поляризация соответствует вращению вектора в фиксированной плоскости z = const в направлении по часовой стрелке:
Ex (t ) = a cos(ωt + ϕ1 )
(4.55)
1 ⎞ ⎛ E y (t ) = a cos⎜ ωt + ϕ1 + π ⎟ = −a sin (ωt + ϕ1 ) , 2 ⎠ ⎝
(4.56)
т.е. E y (t ) опережает по фазе волну Ex (t ) на
1 π. 2
На практике для превращения линейно поляризованного света в свет с круговой поляризацией используют анизотропные кристаллические пластинки, 39
в которых две волны с ортогональными направлениями линейной поляризации имеют различные фазовые скорости. Подбором толщины пластинки можно получить на выходе заданную разность фаз этих волн и тем самым требуемое состояние поляризации. При использовании комплексной записи (4.51) и (4.52) для складываемых волн
с
ортогональными
направлениями
линейной
поляризации
результирующая волна имеет линейную поляризацию, если отношение комплексных амплитуд
E0 y
к
E0 x
выражается вещественным числом.
Результирующая волна имеет круговую поляризацию, если отношение комплексных амплитуд определяется мнимым числом, по модулю равным единице. При при
E0 y E0 x
E0 y E0 x
⎛ π⎞ = exp⎜ i ⎟ = i волна будет с правой круговой поляризацией, а ⎝ 2⎠
= −i – с левой. В общем случае при наложении световых колебаний во
взаимно перпендикулярных плоскостях кривая, которую описывает конец вектора E в произвольной точке пространства, является геометрическим местом точек, координаты которых
Ex = a1 cos(τ + ϕ1 )
(4.57)
E y = a 2 cos(τ + ϕ 2 )
(4.58)
Ez = 0 .
(4.59)
Здесь τ = kz − ωt . Для того, чтобы исключить τ из первых двух уравнений (4.57) и (4.58), перепишем их в виде
Ex = cos τ cos ϕ1 − sin τ sin ϕ1 a1 Ey a2
(4.60)
= cos τ cos ϕ2 − sin τ sin ϕ2 .
(4.61)
При этом
40
E Ex sin ϕ2 − y sin ϕ1 = cos τ sin (ϕ2 − ϕ1 ) a1 a2
(4.62)
E Ex cos ϕ2 − y cos ϕ1 = sin τ sin (ϕ2 − ϕ1 ) . a1 a2
(4.63)
Возведя в квадрат левую и правую части этих уравнений и сложив полученные выражения соответствующих частей, имеем 2
2
⎛ Ex ⎞ ⎛ Ex ⎞ E E ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ − 2 x y cos ϕ = sin 2 ϕ , a1 a2 ⎝ a1 ⎠ ⎝ a2 ⎠
(4.64)
где ϕ = ϕ2 − ϕ1 . Выражение (4.64) представляет собой уравнение конического сечения. Известно, что квадратичная форма
Ax 2 + 2 Bxy + Cy 2 = H
будет
эллиптической, если дискриминант формы δ = AC − B 2 > 0 . В рассматриваемом случае соответствующий детерминант равен 1 a12 δ=
−
cos ϕ − a1a2
cos ϕ a1a2 1 a12
(
)
1 sin 2 ϕ 2 = 2 2 1 − cos ϕ = 2 2 ≥ 0 . a1 a2 a1 a2
Таким образом, уравнение (4.64) описывает эллипс, вписываемый в прямоугольник, стороны которого параллельны осям координат x, y и имеют длины 2a1 и 2a2 , как показано на рис.4.9. Положив в уравнении (4.64) величину Ex = a1 , получаем E y = a2 cos ϕ , а при E y = a2 , получаем Ex = a1 cos ϕ , т.е. эллипс касается сторон прямоугольника в точках
(± a1 cos ϕ; ± a2 ) .
(± a1; ± a2 cos ϕ)
и
В этом случае говорят, что волна, описываемая уравнениями
(4.57), (4.58) и (4.59), эллиптически поляризована. В общем случае оси эллипса непараллельны осям 0 x и 0 y . Пусть
0µ
и
0ν – новые оси, направленные по осям эллипса, а
ψ (0 ≤ ψ < π ) – угол между 0 x и направлением главной оси 0µ , как показано на рис.4.10. При этом компоненты Eµ и Eν связаны с Ex и E y соотношениями 41
Eµ = Ex cos ψ + E y sin ψ
⎫⎪ ⎬. ⎪⎭
Eν = − Ex sin ψ + E y cos ψ Если 2a и 2b
(4.65)
(a ≥ b ) – длины
осей эллипса, то уравнение эллипса
относительно осей 0µ и 0ν можно записать в виде: Eµ = a cos(τ + ϕ0 )
⎫ ⎬. ⎭
Eν = mb sin (τ + ϕ0 )
(4.66)
Наличие двух знаков определяет возможность двух направлений вращения электрического (магнитного) вектора, конец которого описывает эллипс. Чтобы определить амплитуды a и b , приравняем в развёрнутом виде правые части уравнений (4.65) и (4.66). При этом, учитывая выражения (4.60) и (4.61), получаем a cos ϕ0 cos τ − a sin ϕ0 sin τ = cos τ(a1 cos ϕ1 cos ψ + a2 cos ϕ2 sin ψ ) −
− sin τ(a1 sin ϕ1 cos ψ + a2 sin ϕ2 sin ψ );
m b cos ϕ0 sin τ m b sin ϕ0 cos τ = cos τ(a2 cos ϕ2 cos ψ − a1 cos ϕ1 sin ψ ) +
+ sin τ(a1 sin ϕ1 sin ψ − a2 sin ϕ2 cos ψ ).
Приравнивая коэффициенты при cos τ и sin τ , получаем
a cos ϕ0 = a1 cos ϕ1 cos ψ + a2 cos ϕ2 sin ψ;
⎫ ⎪ ⎪ ⎬ ⎪ .⎪⎭
a sin ϕ0 = a1 sin ϕ1 cos ψ + a2 sin ϕ2 sin ψ; m b cos ϕ0 = a1 sin ϕ1 sin ψ − a2 sin ϕ2 cos ψ; m b sin ϕ0 = −a1 cos ϕ1 sin ψ + a2 cos ϕ2 cos ψ Возведя,
левые
и
правые
части
этих
(4.67)
уравнений
в
квадрат
и
последовательно складывая полученные части первых и последующих двух уравнений, находим, что a 2 = a12 cos 2 ψ + a22 sin 2 ψ + a1a2 sin 2ψ cos ϕ ; b 2 = a12 sin 2 ψ + a22 cos 2 ψ − a1a2 sin 2ψ cos ϕ , где ϕ = ϕ1 − ϕ2 . Отсюда следует, что a 2 + b 2 = a12 + a22 .
(4.68)
Используя выражения (4.67), легко показать, что 42
(
)
± ab cos 2 ϕ0 + ab sin 2 ϕ0 = ± ab = a1a2 sin ϕ .
(4.69)
Кроме того, b a1 sin ϕ1 sin ψ − a2 sin ϕ2 cos ψ − a1 cos ϕ1 sin ψ + a2 cos ϕ2 cos ψ . = = a a1 cos ϕ1 cos ψ + a2 cos ϕ2 sin ψ a1 sin ϕ1 cos ψ + a2 sin ϕ2 sin ψ
m
Отсюда находим a12 sin 2 ϕ1 sin ψ cos ψ − a1a2 sin ϕ1 sin ϕ2 cos2 ψ + a1a2 sin ϕ1 sin ϕ2 sin 2 ψ − − a22 sin 2 ϕ2 sin ψ cos ψ = = −a12 cos 2 ϕ1 sin ψ cos ψ + a1a2 cos ϕ1 cos ϕ2 cos 2 ψ − a1a2 cos ϕ1 cos ϕ2 sin 2 ψ + + a22 cos 2 ϕ2 sin ψ cos ψ. Преобразовав это выражение, получаем
(a
2 1
)
− a22 sin 2ψ = 2a1a2 cos ϕ cos 2ψ .
Отсюда следует, что tg 2ψ =
2a1a2 cos ϕ . a12 − a22
Обозначим
(4.70)
a2 π = tgα , где 0 ≤ α ≤ . a1 2
При этом уравнение (4.70) можно представить в виде: tg 2ψ =
2tgα 2 sin α cos α cos ϕ = cos ϕ 2 1 − tg α cos 2 α − sin 2 α
или tg 2ψ = tg 2α cos ϕ .
(4.71)
Из выражений (4.68) (4.69) следует, что ±
2ab 2a1a2 2tgα sin = ϕ = sin ϕ = 2 sin α cos α sin ϕ 1 + tg 2α a 2 + b 2 a12 + a22
±
2ab = sin 2α sin ϕ . a 2 + b2
или
Обозначим ±
(4.72)
b = tgχ , a
43
где
π⎞ ⎛ π χ ⎜ − ≤ χ ≤ ⎟ – вспомогательный 4⎠ ⎝ 4
угол,
определяющий
форму
и
ориентацию эллипса колебаний. При этом выражение (4.62) можно переписать в виде: sin 2χ = sin 2α sin ϕ .
(4.73)
Итак, если заданы величины a1 и a2 и разность фаз ϕ , относящиеся к произвольному положению осей, и если 0 ≤ α ≤ a и b и угол ψ
(0 ≤ ψ < π) ,
π , то главные полуоси эллипса 2
который большая ось образует с осью 0 x ,
определяются формулами
a 2 + b 2 = a12 + a22 ;
(4.74а)
tg 2ψ = tg 2α cos ϕ ;
(4.74б)
sin 2χ = sin 2α sin ϕ .
(4.74в)
С другой стороны, если известны длины осей a и b и ориентация эллипса (т.е. заданы a , b и ψ ), то эти формулы позволяют найти амплитуды a1 и a2 и разность фаз ϕ . Существуют оптические устройства, которые позволяют определять эти величины прямым способом. В предельных случаях эллипс поляризации вырождается либо в прямую, либо в окружность. Согласно (4.64) эллипс вырождается в прямую при ϕ = ϕ2 − ϕ1 = mπ , где m = 0, ± 1, ± 2, K . При этом
Ey Ex
= (− 1)
m
a2 . В этом случае a1
имеем линейно поляризованную волну. В том случае, когда эллипс вырождается в окружность, имеем круговую поляризацию волны. Вполне очевидно,
что
условием
этого
является
преобразование
описанного
прямоугольника в квадрат, что эквивалентно выравниванию амплитуд: a1 = a2 = a . Кроме того, при этом один из компонентов вектора E должен равняться нулю, когда другой достигает максимального значения. Последнее условие эквивалентно равенству:
44
π ϕ = ϕ2 − ϕ1 = ±(2m − 1) , где m = 1, 2, 3, K . 2 При соблюдении названных условий уравнение (4.64) принимает вид уравнения окружности: Ex2 + E y2 = a 2 . В случае правой поляризации sin ϕ > 0 . При этом ϕ=
π + 2mπ , где m = 0, ± 1, ± 2, K ; 2
Ex = a cos(τ + ϕ1 ) , π ⎛ ⎞ E y = a cos⎜ τ + ϕ1 + + 2mπ ⎟ = −a sin (τ + a1 ) . 2 ⎝ ⎠ Для левой поляризации sin ϕ < 0 . При этом π ϕ = − + 2mπ , где m = 0, ± 1, ± 2, K ; 2 Ex = a cos(τ + ϕ1 ) , π ⎛ ⎞ E y = a cos⎜ τ + ϕ1 + + 2mπ ⎟ = a sin (τ + a1 ) . 2 ⎝ ⎠ Если вместо вещественного представления компонентов вектора E использовать комплексное: Ex = a1 exp[i (τ + ϕ1 )], E y = a2 exp[i (τ + ϕ2 )], то Ey Ex
=
a2 a exp[i (τ + ϕ2 − τ − ϕ1 )] = 2 exp(iϕ) a1 a1
=
a2 i ϕ e . a1
или Ey Ex
Значение этого отношения позволяет сразу же определить характер поляризации: 45
– линейная поляризация электрической волны, если
ϕ = ± mπ , где
m = 1, 2, 3, K ; при этом Ey Ex
= (− 1)
m
a2 ; a1
– правая круговая поляризация электрической волны, если a1 = a2 ,
ϕ=
π + 2mπ , где m = 0, ± 1, ± 2, K ; при этом 2 Ey
⎡ ⎛π ⎞⎤ ⎛ π⎞ = exp ⎢i⎜ + 2mπ ⎟⎥ = exp⎜ i ⎟ = i ; Ex ⎠⎦ ⎝ 2⎠ ⎣ ⎝2
– левая круговая поляризация электрической волны, если
a1 = a2 ,
π ϕ = − + 2mπ , где m = 0, ± 1, ± 2, K ; при этом 2
Ey
⎡⎛ π ⎛ π⎞ ⎞⎤ = exp ⎢i⎜ − + 2mπ ⎟⎥ = exp⎜ − i ⎟ = −i . Ex ⎝ 2⎠ ⎠⎦ ⎣⎝ 2
Можно показать, что в общем случае для правой эллиптической поляризации мнимая часть отношения
Ey Ex
положительна, тогда как для левой
эллиптической поляризации она отрицательна. На рис.4.10 показаны эллипсы поляризации при разных значениях ϕ . Характеристика состояния поляризации с помощью параметров Стокса.
Для характеристики эллипса поляризации необходимы три независимые величины, к которым из уже рассмотренных можно отнести амплитуды a1 и a2 и разность фаз ϕ или малую и большую полуоси эллипса a и b и угол ψ , характеризующий ориентацию эллипса. Для практических целей состояние поляризации удобно характеризовать параметрами, обладающими одинаковой физической размерностью. Такие параметры были введены Стоксом в 1852 году при его исследованиях частично поляризованного света. Параметрами 46
Стокса для плоской монохроматической волны служат следующие четыре величины: s0 = a12 + a22 ,
(4.75а)
s1 = a12 − a22 ,
(4.75б)
s2 = 2a1a2 cos ϕ ,
(4.75в)
s3 = 2a1a2 sin ϕ .
(4.75г)
Лишь три из них независимы, так как справедливо тождество
s02 = s12 + s22 + s32 .
(4.76)
Из выражения (4.75а) следует, что параметр
s0
пропорционален
интенсивности волны. Напомним, что s0 =
⎛ a12 ⎜⎜1 + ⎝
a2 = tgα . Из соотношения (4.75а) имеем a1
a22 ⎞ a12 2 2 ⎟ = a1 1 + tg α = . a12 ⎟⎠ cos2 α
(
)
Полученное соотношение позволяет выражение (4.74в) преобразовать к виду: sin 2χ = 2 cos 2 αtgα sin ϕ = 2 cos 2 α
a1a2 2a a sin ϕ sin ϕ = 1 2 . 2 s0 a1
Учитывая при этом выражение (4.75г), получаем s3 = s0 sin 2χ .
(4.77)
В результате подстановки соотношений (4.75б) и (4.75в) в выражение (4.70) имеем
s2 = s1tg 2ψ .
(4.78)
Подставим соотношения (4.77) и (4.78) в выражение (4.76): s02 = s12 + s12tg 2 2ψ + s02 sin 2 2χ . Отсюда следует, что s1 = s0 cos 2χ cos 2ψ .
(4.79)
При этом выражение (4.78) принимает вид: 47
s2 = s0 cos 2χ sin 2ψ . Таким
образом,
соотношениями эллиптичность
связаны и
характеризующим
s1, s2
параметры с
углом
направление ориентацию
s3
и
достаточно
π⎞ ⎛ π χ ⎜− ≤ χ ≤ ⎟, 4⎠ ⎝ 4
вращения, эллипса.
и
с
простыми
характеризующим
(0 ≤ ψ < π) ,
ψ
углом
Полученные
соотношения,
определяющие параметры s1, s2 и s3 , удобно свести всех вместе: s1 = s0 cos 2χ cos 2ψ ,
(4.80а)
s2 = s0 cos 2χ sin 2ψ ,
(4.80б)
s3 = s0 sin 2χ .
(4.80в)
Полученные
выражения
(4.80)
определяют
возможность
простого
геометрического представления различных состояний поляризации: параметры Стокса s1, s2 и s3 можно рассматривать как декартовы координаты точки P на сфере ∑ радиуса s0 , причём 2χ и 2ψ являются сферическими угловыми координатами этой точки, как показано на рис.4.11. Таким образом, каждому возможному состоянию поляризации плоской монохроматической волны заданной интенсивности (s0 = const ) соответствует одна точка на сфере ∑ и наоборот. Так как знак угла χ определяет направление вращения, то, как следует из выражения (4.80в), правая поляризация представляется точками на поверхности ∑ , лежащими выше экваториальной плоскости (плоскости xy ), а левая поляризация – точками на ∑ , лежащими ниже этой плоскости. Для линейно поляризованного света разность фаз ϕ равна нулю или числу, кратному π . В соответствии с выражением (4.80в) параметр Стокса s3 равен нулю, если χ = mπ , где m = 0, ± 1, ± 2, K . Таким образом, линейная поляризация представляется точками окружности в экваториальной плоскости. Для круговой поляризации a1 = a2 и при правой поляризации угол ϕ =
π , а при левой 2
π поляризации угол ϕ = − . При этом в соответствии с соотношением (4.74в) 2 48
sin 2χ = ±1 . Следовательно, правая круговая поляризация представляется
северным полюсом (s1 = s2 = 0, s3 = s0 ) , а левая круговая поляризация – южным полюсом (s1 = s2 = 0, s3 = − s0 ) . Такое геометрическое представление различных состояний поляризации точками на сфере было предложено Пуанкаре. Оно чрезвычайно полезно в кристаллооптике для определения влияния кристаллических сред на состояние поляризации проходящего через них света. Сфера ∑ называется сферой Пуанкаре. Итак, строго монохроматический свет всегда поляризован, т.е. конец электрического (или магнитного) вектора в каждой точке пространства движется периодически, описывая эллипс, который в особых случаях переходит в круг или прямую линию. В том случае, когда конец вектора движется совершенно нерегулярно и такие световые колебания не имеют никаких преимущественных направлений в плоскости, перпендикулярной к направлению распространения, свет называется неполяризованным. Эти два случая относятся к экстремальным. В общем случае изменение векторов поля не является ни вполне регулярным, ни вполне нерегулярным, при этом можно сказать, что свет частично поляризован. Обычно такой свет получается из неполяризованного при отражении или рассеянии. Рассмотрим квазимонохроматическую световую волну со средней частотой
ν , распространяющуюся в положительном направлении от z . Пусть Ex (t ) и E y (t ) – два взаимно ортогональных компонента электрического вектора в некоторой точке O , перпендикулярные к направлению распространения, при этом Ex (t ) = a1 (t )exp{i[ϕ1 (t ) − 2πν t ]},
E y (t ) = a2 (t )exp{i[ϕ2 (t ) − 2πν t ]}.
⎫ ⎬ ⎭
(4.81)
Если бы свет был монохроматическим, то амплитуды a1 и a2 и начальные фазы ϕ1 и ϕ2 были бы постоянными. Для квазимонохроматической волны эти величины зависят также от времени. Однако, за любой интервал времени, 49
малый по сравнению с временем когерентности, т.е. малый по сравнению с величиной, обратной эффективной спектральной ширине света ∆ν , их изменение относительно невелико. Предположим, что запаздывание компонента E y относительно компонента E x равно ε , что можно осуществить, например, с помощью одного из оптических компонентов, и рассмотрим интенсивность
I (θ, ε ) световых
колебаний в направлении, которое образует угол θ с положительным направлением оси x . Такие колебания можно выделить, пропуская свет через соответствующим образом ориентированный поляризатор. Компонент электрического вектора в рассматриваемом направлении после введения запаздывания ε можно определить выражением вида: E (t ; θ, ε ) = Ex cos θ + E y exp(iε )sin θ .
(4.82)
При этом I (θ, ε ) = E (t ; θ, ε )E * (t ; θ, ε ) =
= J xx cos θ + J yy sin θ + J xy exp(− iε )cos θ sin θ + J yx exp(iε )sin θ cos θ , 2
2
(4.83)
где J xx , J xy , K – элементы матрицы
⎛ Ex Ex* ⎜ J =⎜ * ⎜ E y Ex ⎝
Ex E *y ⎞⎟ ⎛⎜ a12 ⎟=⎜ E y E *y ⎟ ⎜ a1a2 exp(iϕ) ⎠ ⎝
Здесь ϕ = ϕ2 (t ) − ϕ1 (t ) , а скобки
a1a2 exp(− iϕ) ⎞⎟ ⎟. a22 ⎟ ⎠
(4.84)
означают, усреднение по времени.
Матрица когерентности квазимонохроматической волны J представляет собой эрмитову матрицу, диагональные элементы которой вещественны и представляют собой интенсивности E x и E y компонентов электрического вектора, а недиагональные элементы – в общем случае комплексны. Напомним, что матрица называется эрмитовой, если J ij = J *ji
при всех i и j . Элементы
матрицы когерентности заданной волны можно определить с помощью относительно простых экспериментов, суть которых состоит в измерении интенсивности для ряда значений
θ 50
(ориентации поляризатора) и
ε
(запаздывания, обусловленного применяемым компенсатором) и последующем решении соответствующих уравнений, полученных из выражения (4.83). Пусть
{θ, ε}
обозначает результаты измерений, соответствующие определённой паре
значений θ, ε . Удобно использовать следующие их значения:
{0 , 0}, {45 , 0}, {90 , 0}, {135 , 0}, ⎧⎨45 , π2 ⎫⎬, ⎧⎨135 , π2 ⎫⎬ . o
o
o
o
⎩
o
⎭ ⎩
o
⎭
Из выражения (4.83) следует, что элементы матрицы когерентности выражаются через интенсивности, полученные в результате измерений при шести приведённых значения пар θ, ε в виде:
( ) = I ( 90 , 0 ), 1 1 ⎡ ⎛ π ⎞⎤ π⎞ ⎛ = [I ( 45 , 0 ) − I (135 , 0 )] + i ⎢ I ⎜ 45 , ⎟ − I ⎜135 , ⎟⎥ , 2 2 2 2
J xx = I 0o , 0 , J yy J xy J yx
o
o
o
o
o
⎠⎦ ⎠ ⎝ ⎣ ⎝ 1 1 ⎡ ⎛ π ⎞⎤ π⎞ ⎛ = I 45o , 0 − I 135o , 0 − i ⎢ I ⎜ 45o , ⎟ − I ⎜135o , ⎟⎥ . 2 2 ⎣ ⎝ 2⎠ ⎝ 2 ⎠⎦
[(
)]
) (
⎫ ⎪ ⎪ ⎪⎪ ⎬ ⎪ ⎪ ⎪ ⎪⎭
(4.85)
Из равенств (4.85) видим, что для определения J xx , J xy и вещественной части J xy (или J yx ) необходим лишь поляризатор. Для определения мнимой части J xy (или J yx ) требуется также согласно двум последним соотношениям (4.85) компенсатор, который вносил бы разность фаз в четверть периода между компонентами
Ex
и
Ey
электрического вектора. В качестве такого
компенсатора можно применить, например, четвертьволновую пластинку. Итак, для характеристики квазимонохроматической плоской волны, вообще говоря, необходимы четыре вещественные величины, например,
J xx , J xy , вещественная и мнимая части J xy (или J yx ). В своих исследованиях частично поляризованного света Стокс ввёл несколько отличное представление с четырьмя параметрами, тесно связанными с рассмотренными. Параметрами Стокса общего вида являются следующие четыре величины:
51
⎫ ⎪ ⎪⎪ ⎬ ⎪ ⎪ ⎪⎭
s0 = a12 + a22 , s1 = a12 − a22 , s2 = 2 a1a2 cos ϕ , s3 = 2 a1a2 sin ϕ ,
(4.86)
где, как и прежде, a1 и a2 – мгновенные значения амплитуд двух взаимно перпендикулярных
компонентов
Ex
и
Ey
электрического
вектора, а
ϕ = ϕ2 − ϕ1 – разность их фаз. Для монохроматического света амплитуды a1 и a2 и разность фаз ϕ не зависят от времени и выражения (4.86) становятся выражениями (4.85). Из выражений (4.86) и (4.84) следует, что параметры Стокса и элементы матрицы когерентности связаны соотношениями: s0 = J xx + J yy ,
(4.87а)
s3 = i (J xy − J yx ) ;
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ⎭
1 (s0 + s1 ), 2 1 = (s0 − s1 ), 2 1 = (s2 − is3 ), 2 1 = (s2 + is3 ). 2
⎫ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎭
(4.87б)
s1 = J xx − J yy , s2 = J xy + J yx ,
J xx = J yy J xy J yx
Применив соотношения (4.85) и (4.87а), получаем
( ) ( ) = I (0 , 0 ) − I (90 , 0 ), = I (45 , 0 ) − I (135 , 0 ),
s0 = I 0o , 0 + I 90o , 0 , s1 s2
o
o
o
o
π⎞ π⎞ ⎛ ⎛ s3 = I ⎜135o , ⎟ − I ⎜ 45o , ⎟ . 2⎠ ⎝ 2⎠ ⎝
⎫ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪⎭
52
(4.88)
Из этих соотношений видно, что параметр s0 представляет собой полную интенсивность.
Параметр
s1
равен
разности
интенсивностей
линейно
поляризованного света, прошедшего через поляризаторы, с азимутами θ = 0o и θ = 90o . Так же интерпретируется и параметр s2 , но для азимутов θ = 45o и θ = 135o . И, наконец, параметр s3 равен разности интенсивностей света, прошедшего через прибор, пропускающий колебания с правой круговой поляризацией, и света, прошедшего через прибор, пропускающий колебания с левой круговой поляризацией. Используя соотношения (4.87а), легко убедиться, что при соблюдении условия
s02 = s12 + s22 + s32
справедливо равенство
J xx J yy = J xy J yx , т.е. для
монохроматической плоской волны J xx J yy − J xy J yx = 0 . Для неполяризованной волны (естественный свет) справедливо соотношение s1 = s2 = s3 = 0 . Однако, при этом s0 > 0 . Таким образом, в общем случае имеем s02 ≥ s12 + s22 + s32 . Можно показать, что любую квазимонохроматическую световую волну можно рассматривать как сумму полностью неполяризованной м полностью поляризованной волн, не зависящих друг от друга, и что такое представление единственно. Обозначим четыре параметра Стокса s0 , s1 , s 2 , s3 одним символом s . Тогда, очевидно, для волны, характеризующейся параметром s , требуемое представление запишется в виде
s = s (1) + s (2 ) ,
(4.89)
где s (1) = s12 + s22 + s32 , s1 , s2 , s3 ,
(4.89а)
а s (2 ) = s0 − s12 + s22 + s32 , 0, 0, 0 .
(4.89б)
Параметр s (1) соответствует поляризованной, а s (2 ) – неполяризованной части волны. Следовательно, с помощью параметров Стокса степень поляризации исследуемой волны можно определить отношением
53
P=
I поляр I полн
=
s12 + s22 + s32 . s0
(4.90)
При этом форма и ориентация эллипса поляризации, связанного с поляризованной частью волны, в соответствии с соотношениями (4.77) и (4.89а), определяется выражением s3
sin 2χ =
s12 + s22 + s32
,
(4.91)
1 π где − π < χ ≤ . Угол ψ (0 ≤ ψ < π) между большой осью эллипса и осью 0 x 4 4 определяется в соответствии с выражениями (4.78) и (4.89а) соотношением tg 2ψ =
s2 . s1
Итак, параметры Стокса, как и матрица когерентности, служат полезным инструментом
для
систематического
анализа
состояния
поляризации
квазимонохроматической волны. 4.5.4. Отражение и преломление плоской волны на границе раздела двух однородных изотропных сред
Полное электромагнитное поле, включающее падающую, отражённую и преломлённую волны, должно удовлетворять определённым граничным условиям, которые могут быть получены предельным переходом из уравнений Максвелла. Уравнения электромагнитного поля можно применить к каждой среде
с
учётом
значений
электрических
и
магнитных
параметров,
характеризующих эту среду. Любая оптическая система представляет собой систему поверхностей раздела двух сред с различными свойствами, характеризуемыми величинами ε и
µ . Полная теория должна быть в состоянии описывать явления,
происходящие на границе раздела двух сред. Математически это означает, что необходимо иметь систему, граничных условий, которые связывали бы на границе раздела двух сред два решения уравнений электромагнитного поля, 54
каждое из которых справедливо в отдельности по одну сторону от границы раздела. Выведем соотношения, описывающие переход электромагнитного поля через такую поверхность раздела. Граничные условия на поверхностях раздела
Заменим поверхность раздела сред T тонким переходным слоем, внутри которого
ε
и
µ
быстро,
но
непрерывно
меняются
от
значений,
характеризующих среду стороны поверхности, до их значений с другой её стороны. Внутри этого слоя построим цилиндр, ограниченный с боков частоколом нормалей к поверхности T в пределах малых площадок δS1 и δS2 , параллельных поверхности T и служащих основаниями цилиндра с каждой её стороны, как показано на рис.4.12. Поскольку во всём цилиндре вектор B и его производные непрерывны, мы можем применить теорему ОстроградскогоГаусса к интервалу от divB , взятому по объёму цилиндра. Тогда согласно уравнению (4.4) получим
∫ divB dV = ∫ B ⋅ n dS = 0 .
V
(4.92)
S
Здесь n – единичный вектор внешней нормали. Заметим, что второй интеграл берётся по всей поверхности цилиндра. Так как площадки dS1 и dS2 предполагаются малыми, можно считать, что на них вектор B принимает постоянные значения B1 и B2 . Тогда выражение (4.92) можно заменить следующим: B1 ⋅ n1δS1 + B2 ⋅ n2 δS 2 + вклад от стенок = 0 .
(4.93)
Если высота цилиндра dh стремится к нулю, то необходимый слой переходит в поверхность, в вклад от стенок цилиндра исчезает при условии, что отсутствует поверхностный поток магнитной индукции. Такой поток никогда не наблюдается и, следовательно, в пределе
(B1 ⋅ n1 + B2 ⋅ n2 )δS = 0 ,
(4.94)
где δS – площадь пересечения рассматриваемого цилиндра с поверхностью T . 55
Если n12 – единичный вектор нормали, направленный из первой среды во вторую, то n12 = −n1 = n2 . При этом из соотношения (4.94) следует, что n12 (B2 − B1 ) = 0 ,
(4.95)
т.е. нормальная составляющая вектора магнитной индукции непрерывна на поверхности раздела. Подобным образом можно рассмотреть электрическое смещение D , но в этом случае при наличии зарядов появится дополнительный член. Аналогично выражению (4.92) из соотношения (4.3) следует
∫ divD dV = ∫ D ⋅ n dS = 4π∫ ρdV .
V
S
(4.96)
V
При слиянии площадок δS1 и δS2 объёмная плотность зарядов ρ ρ , определяемую соотношением переходит в поверхностную плотность заряда ~ ρdS . lim ∫ ρdV = ∫ ~
δh → 0
V
S
Аналогично объёмная плотность тока j переходит в поверхностную ~ плотность тока j : ~
jdV = ∫ j dS . δh → 0 ∫ lim
V
S
Если площадку δS и высоту δh выбрать достаточно малыми, то из выражения (4.96) получаем D1 ⋅ n1δS1 + D2 ⋅ n2 δS 2 + вклад от стенок = 4π~ ρ δS . Вклад от стенок стремится к нулю с уменьшением δh и поэтому в пределе при δh → 0 получаем n (D − D ) = 4π~ ρ, 12
2
(4.97)
1
т.е. при наличии на поверхности раздела слоя с поверхностной плотностью заряда ~ ρ нормальная составляющая вектора электрического смещения при переходе через эту поверхность испытывает скачок, равный 4π~ ρ. Исследуем теперь поведение тангенциальных составляющих векторов E и
H . Заменим поверхность резкого раздела сред переходным слоем, а цилиндр, 56
показанный
на рис.4.12, прямоугольной
площадкой, стороны
которой
параллельны и перпендикулярны поверхности T , как показано на рис.4.13. Пусть τ – единичный вектор, перпендикулярный плоскости рассматриваемого прямоугольника. Используя теорему Стокса, из уравнения (4.2) получаем
∫ rotE ⋅ τdS = ∫ E ⋅ dr = − S
L
1 ∂B τdS . c ∫S ∂t
(4.98)
Здесь первый и третий интегралы берутся по площади прямоугольника, а второй – вдоль его границ. Если длины P1Q1 = δl1 и P2 Q2 = δl 2 малы, то на каждой из этих сторон вектор E можно заменить постоянными векторами E1 и E2 . Подобным же образом постоянным значением можно заменить и вектор
∂B . При этом из уравнения (4.108) в соответствии с рис.4.13 находим ∂t E1 ⋅ t1δl1 + E 2 ⋅ t 2 δl 2 + вклад от концов = −
1 ∂B τδlδh , с ∂t
(4.99)
где δl – линейный элемент, по которому прямоугольник пересекается с поверхностью
раздела.
Если
теперь
постепенно
уменьшать
высоту
прямоугольника, то вклад от концов P1P2 и Q1Q2 будет стремиться к нулю. Полагая, что вектор
∂B остаётся конечным, в пределе при δh → 0 получим ∂t
(E1t1 + E2t2 )δl = 0 .
(4.100)
Если t – единичный вектор касательной к поверхности раздела в плоскости прямоугольника, то t1 = −t = − τ × n12 , t2 = t = τ × n12 . При этом из выражения (4.100) следует τ[n12 × (E2 − E1 )] = 0 .
Так как ориентации прямоугольника, а, следовательно, и единичного вектора τ , произвольна, то n12 × (E2 − E1 ) = 0 ,
(4.101)
57
т.е. тангенциальная составляющая электрического вектора непрерывна на поверхности раздела сред. И,
наконец,
рассмотрим
поведение
тангенциальной
составляющей
магнитного вектора. Анализ выполним аналогичным образом. При этом вместо выражения (4.99) получаем H 1 ⋅ t1δl1 + H 2 ⋅ t 2 δl 2 + вклад от концов =
1 ∂D 4π ~ τδlδh + j τδl . с ∂t c
(4.102)
В результате предельного перехода при δh → 0 находим n12 × (H 2 − H1 ) =
4π ~ j. c
(4.103)
Итак, из полученных соотношений следует, что векторы напряжённости электрического и магнитного полей E и H и векторы электрической и магнитной индукции D и B удовлетворяют следующим граничным условиям: 1. Тангенциальные компоненты напряжённости электрического поля
(
)
непрерывны Et1 = Et 2 на границе раздела двух сред, где физические свойства среды, характеризуемые значениями ε и µ , изменяются скачками.
(D
n1
2. Нормальные компоненты вектора электрической индукции непрерывны
)
= Dn2 в отсутствие поверхностных зарядов на границе раздела сред. 3. Тангенциальные компоненты вектора напряжённости магнитного поля
(
)
непрерывны H t1 = H t 2 в отсутствие поверхностных токов на границе раздела.
(B
n1
4. Нормальные компоненты вектора магнитной индукции непрерывны
)
= Bn2 . Для оптических частот большинство сред практически немагнитно и
поэтому B равно H . Применим соотношения, которым удовлетворяют векторы поля на поверхностях, где физические свойства среды претерпевают разрыв, к исследованию распространения плоской волны, падающей на плоскую границу, разделяющую две однородные изотропные среды. Законы отражения и преломления
58
Уравнение, определяющее напряжённость электрического поля E (r , t ) или индукцию магнитного поля B (r , t ) , удобно представить в виде: F (r , t ) = F0 exp(iϕ)exp[− i (ωt − k r )], т.е. переменная часть фазового множителя в выражении, определяющем гармоническую электромагнитную плоскую волны, равна
⎛ r ⋅s ⎞ τ = ωt − k r = ω⎜ t − ⎟, V ⎠ ⎝ где s – единичный вектор направления распространения волны; V – скорость (фазовая) распространения волны. Если на границу раздела двух однородных сред с разными оптическими свойствами падает плоская волна, то естественно предположить, что она разделится на две волны: проходящую во вторую среду и отражённую.
59
Глава 5 СВЕТОТЕХНИКА ОПТИЧЕСКИХ СИСТЕМ 5.1 . Световая трубка Пусть P (ξ, η) – произвольная точка на некоторой изучающей поверхности
S , отнесённая к какой-либо криволинейной системе координат на этой поверхности. При этом световой поток (усреднённый по времени), изучаемый площадкой
dS
S
поверхности
в телесный угол
dω в направлении,
определяемом полярными углами (α, β ) , равен d 2Φ = LdωdS cos ε ,
(5.1)
где L – фотометрическая яркость излучения площадки dS в точке (ξ, η) в направлении
(α, β ) ,
т.е. в общем случае L = L(ξ, η; α, β ) ; фотометрическая
яркость излучения, определяемая по физическому воздействию, может отличаться от субъективного ощущения яркости, поскольку глаз человека обладает разной чувствительностью к излучению различных длин волн; ε – угол между направлением (α, β ) и нормалью к элементу поверхности, как показано на рис.5.1. Множитель cos ε в выражении (5.1) определяет тот факт, что физический смысл имеет не сам элемент поверхности dS , а его проекция на плоскость, перпендикулярную к направлению (α, β ) .
(α, β) Нормаль к dS
ε
P(ξ, η) dS Рис.5.1. Угол между направлением (α, β ) и нормалью к элементу поверхности
3
Пусть сечение телесного угла dω наклонной плоскостью образует площадку dSν на некотором расстоянии R от площадки dS вдоль оси телесного угла dω под углом εν к ней, как показано на рис.5.2. При этом d 2Φ = L
dSν cos εν dS cos ε = Ldων dSν cos εν . R2 N
O
dων
ε
(5.2) Nν
εν
dS
Oν dS ν
dω R
Рис.5.2. Сечение телесного угла dω наклонной плоскостью
С другой стороны, световой поток, проходящий через площадку dSν , равен
d 2Φ ν = Lν dων dSν cos εν .
(5.3)
В общем случае d 2Φ ν = τd 2Φ , где τ – коэффициент пропускания среды, разделяющей площадки dS и dSν . Поскольку в рассматриваемом случае нас интересует лишь соотношения геометрических величин, среду будем считать абсолютно прозрачной, что эквивалентно равенству τ = 1. При этом из сопоставления выражений (5.2) и (5.3) следует, что L = Lν . Полученное равенство позволяет интерпретировать величину L не только как яркость излучающей поверхности, но и как яркость излучения в плоском сечении светового пучка. Совокупность геометрических лучей, заполняющих телесный угол dω , образует гомоцентрический пучок лучей, исходящих из точки излучающего элемента,
опирающийся
на
освещаемый
элемент.
Совокупность
геометрических лучей, проходящих через две произвольно расположенные площадки (диафрагмы), размеры которых значительно меньше расстояния 4
между ними, образует совокупность геометрических пучков лучей, называемую физическим пучком, при этом поверхность, ограничивающую поперечные размеры физического пучка, принято называть световой трубкой. Из сопоставления выражений (5.1) и (5.2) следует, что dωdS cos ε = dων dSν cos εν .
(5.4)
Величину d 2G = dωdS cos ε называют геометрическим фактором пучка световых лучей. Инвариантность геометрического фактора d 2G относительно площадок dS и dSν физического пучка, определяемая выражением (5.4), означает,
что
он
является
мерой
множества
геометрических
лучей,
составляющих физический пучок, не зависящей от того, какая из площадок является
излучающей.
Вполне
очевидно,
что
геометрический
фактор
элементарного физического пучка, ограниченного площадками dS и dSν , не зависит от выбора расстояния R между ними, а, следовательно, не зависит от выбора расстояния R (при τ = 1) и величина светового потока, проходящего через площадки dS и dSν , контуры которых образуют контуры световой трубки. При этом яркость излучения в каждом сечении плоскостью телесного угла остаётся неизменной. Поэтому яркость Lν = L можно считать яркостью элементарного физического пучка. Понятие яркости пучка лучей, введённое в трудах академика Владимира Александровича Фока, Андрея Александровича Гершуна, Сергея Осиповича Майзеля и других, оказалось весьма удобным при исследовании объёмных источников излучения или рассеивающих излучение сред, например, неба, где исходное, и вполне естественное, определение яркости, строго говоря, вообще теряет смысл. 5.2. Инвариант Штраубеля
Пусть через некоторую элементарную площадку dSν1 в пределах телесного угла dων1 под углом εν1 к нормали к площадке dSν1 проходит некоторый поток излучения. Будем считать, что площадка dSν , образованная сечением телесного угла dων1 плоскостью, расположена на поверхности dSν , разделяющей среды, 5
показатели преломления которых равны nν = nν1 и nν′ = nν 2 . Ось телесного угла
dων , вершина которого расположена в точке в пределах площадки dSν , образует с нормалью к последней угол εν , а после преломления на границе раздела двух сред – угол ε′ν , как показано на рис.5.3. В соответствии с законом преломления nν sin εν = nν′ sin ε′ν .
Возведя в квадрат обе части этого равенства и дифференцируя, получаем nν2 sin εν cos εν dεν = nν′2 sin ε′ν cos ε′ν dε′ν .
− ε ν1
(5.5)
Oν1 dων1
dS ν1
nν = nν1
− εν
dων
dSν Sν Oν nν′ = nν 2
dω′ν − ε′ν
dSν 2
dων 2 Oν 2
− εν2
Рис.5.3. Элементарная площадка dSν через, которую проходит поток излучения
Построим элементарный телесный угол dων , ограничив его четырьмя гранями пирамиды (частный случай конической поверхности), а именно: двумя меридиональными плоскостями XOM и XON , образующими элементарный двугранный угол dϕ , и двумя плоскостями, проходящими через центр O сферы радиуса R и через элементы дуг малых кругов на поверхности сферы, как 6
показано на рис.5.4. Если элементарную площадку, вырезанную на поверхности сферы, принять в виду малости длин элементарных дуг меридиональных сечений, равных Rdεν , за прямоугольник, то площадь этого элемента поверхности определяется произведением основания прямоугольника, длина которого равна R sin εν dϕ , на его высоту, равную Rdεν . При этом элементарный телесный угол dων , равный отношению dων =
dS , определится выражением R2
dS R sin εν dϕRdεν = = sin εν dεν dϕ . R2 R2
(5.6)
После преломления пучка лучей на границе раздела двух сред телесный угол dω′ν определится аналогичным выражением вида: dω′ν = sin ε′ν dε′ν dϕ ,
(5.7)
где dϕ′ равен углу dϕ , так как согласно первой части формулировки закона преломления луч падающий, луч преломлённый и нормаль к поверхности раздела двух сред в точке падения луча лежат в одной плоскости. x dϕ
X
Rdεν dS
R sin εν
εν O Y
dων
Z
z
ϕ
dϕ
N M
y
Рис.5.4. Элементарный телесный угол dων , ограниченный четырьмя гранями пирамиды (частный случай конической поверхности)
Сопоставив выражения (5.6) и (5.7) с выражением (5.5), получаем 7
nν2 cos εν dων = nν′2 cos ε′ν dω′ν .
(5.8)
Полученная формула определяет взаимосвязь телесных углов до, и после преломления световой трубки на поверхности раздела двух сред. Умножив обе части выражения (5.8) на величину dSν , получаем
nν2 dων dSν cos εν = nν′2 dω′ν dSν cos ε′ν .
(5.9)
Учитывая свойство световой трубки, определяемое выражением (5.4), при
nν = nν1 и nν′ = nν 2 имеем nν2 dων dSν cos εν = nν21dων1dSν1 cos εν1 ; nν′2dω′ν dSν′ cos ε′ν = nν22 dων 2 dSν 2 cos εν 2 ,
где, по сути дела, dSν′ = dSν . Учитывая выражение (5.9), получаем nν21dων1dSν1 cos εν1 = nν2 dων dSν cos εν =
(5.10)
= nν′2 dω′ν dSν′ cos ε′ν = nν22 dων 2 dSν 2 cos εν 2 .
Величину n 2 d 2G = n 2 dωdS cos ε называют оптическим фактором. Можно предположить, что площадка dSν1 расположена на преломляющей поверхности
Sν −1 , а
площадка
dSν 2 – на
поверхности
Sν +1 .
Обобщая
соотношение (5.10) на произвольное число преломляющих поверхностей, получаем
n 2 d 2G = const .
(5.11)
Это соотношение определяет основной инвариант для световой трубки: произведение квадрата показателя преломления, проекции элементарной площадки, контур которой определяет контур световой трубки, на плоскость, перпендикулярную оси трубки, и элементарного телесного угла с вершиной в точке этой площадки остаётся инвариантным для элементарной световой трубки, претерпевающей преломления на каком угодно числе преломляющих поверхностей: n12 dω1dS1 cos ε1 = K = nν2 dων dSν cos εν = K = n 2p dω p dS p cos ε p = d 2 J . (5.12)
8
Эта формула была строго доказана в 1902 году Штраубелем и называется теоремой, или инвариантом, Штраубеля. При абсолютной прозрачности сред, разделяемых преломляющими поверхностями, в соответствии с законом сохранения энергии световой поток, проходящий через световую трубку, претерпевающую какое угодно число преломлений, в соответствии с выражением (5.3) равен d 2Φ = L1dω1dS1 cos ε1 = K = Lν dων dSν cos εν = K = L p dω p dS p cos ε p .
Разделив эти равенства почленно на инвариант Штраубеля, получаем Lp L1 Lν = K = = K = = L0 , n12 nν2 n 2p
где L0 – так называемая редуцированная (или приведённая к вакууму) яркость. В соответствии с рис.5.3 имеем dων =
dSν1 cos εν1 dS cos ε ; dω′ν = ν 2 2 ν 2 , 2 Rν1 Rν 2
где Rν1 и Rν 2 – расстояния от осевой точки Oν площадки dSν до осевых точек
Oν1 и Oν 2 площадок dSν1 и dSν 2 соответственно. Эти соотношения позволяют выражение (5.9) представить в виде: nν2 dSν dSν1 cos εν cos εν1 nν′2 dSν dSν 2 cos ε′ν cos εν 2 = . Rν21 Rν22
(5.13)
Пусть в выражении (5.13) углы εν = εν1 = ε′ν = εν 2 = 0 , а площадки dSν , dSν1 и dSν 2 световых трубок имеют круглую форму. При этом площадь этих элементарных площадок равна dSν1 = π(dlν1 ) ; dSν 2 = π(dlν 2 ) ; dSν = π(dmν ) , 2
2
2
где dlν1 , dlν 2 , dmν – радиусы соответствующих площадок. Обозначим dmν dmν = dσν1 ; = dσ ν 2 . Rν1 Rν 2 Эти соотношения и принятые обозначения позволяют выражение (5.13) представить в виде:
9
2 2 2 2 nν2 (dlν1 ) (dσν1 ) = nν′2 (dlν 2 ) (dσν 2 ) .
Применив
полученное
выражение
к
последовательности
из
p
преломляющих поверхностей, в соответствии с инвариантом Штраубеля получаем n1dσ1dl1 = n2 dσ 2 dl2 = K = nν dσν dlν = K = n p dσ p dl p .
(5.14)
Для оптически сопряжённых отрезков, т.е. в том случае, когда отрезок
dlν +1
является изображением отрезка
dlν , это выражение называется
инвариантом Лагранжа-Гельмгольца и записывается в виде
nαl = n′α′l ′ , где
l,
(5.15)
l ′ – оптически
сопряжённые
малые
отрезки,
расположенные
перпендикулярно оптической оси; α , α′ – малые углы, образованные лучами светового пучка с оптической осью в пространстве предметов и изображений соответственно. Отношение малых отрезков определяет величину поперечного увеличения: V=
l ′ nα . = l n′α′
(5.16)
Из малой величины поперечных размеров световой трубки следует, что инвариант Лагранжа-Гельмгольца справедлив для малых отрезов l и l ′ и для лучей, образующих малые углы α и α′ с осью световой трубки, т.е. в параксиальной (от греч. para′ – возле, мимо, вне и лат. axis – ось) области. Инвариант Лагранжа-Гельмгольца является одним из основных соотношений параксиальной оптики. 5.3. Ограничение световых пучков лучей в оптической системе
Любая оптическая система состоит из элементов, имеющих ограниченные размеры, вследствие чего из всего светового потока, излучаемого каждой изображаемой
точкой
(точнее,
малым
элементом
поверхности),
через
оптическую систему проходит только часть его. Вместе с тем ограничена и величина предмета (угловая или линейная), из каждой точки которого световой 10
поток попадает в оптическую систему. Первое ограничение определяет освещённость изображения, а второе – угловую или линейную величину изображаемого предмета, называемую угловым или линейным полем системы. Входной зрачок
C
Выходной зрачок
B A
− σA
ω
P′
P
Входной люк
− ω′
σ′A′
A′
Выходной люк
Рис.5.5. Ограничение световых пучков лучей в оптической системе.
Оптическая система, как правило, содержит последовательность диафрагм, ограничивающих световые пучки лучей, формирующих изображение. Под диафрагмой будем понимать не только отверстие в непрозрачном экране, но и края линз и зеркал или края их оправ. Будем считать, что диафрагмы имеют круглую форму с центром на оптической оси системы. Найдём параксиальное изображение каждой диафрагмы в пространстве предметов, образованное предшествующей ей оптической системой. Изображение диафрагмы (в частном случае непосредственно диафрагма), которое видно из осевой точки предмета A под наименьшим углом 2σ A , как показано на рис.5.5, определяет
максимальную угловую величину светового пучка лучей, проходящих через оптическую систему, и называется входным зрачком оптической системы. Реальная диафрагма, изображение которой (или сама диафрагма) является входным зрачком, называется апертурной диафрагмой. Изображение входного зрачка, образованное всей системой поверхностей в пространстве изображений, называется выходным зрачком оптической системы. Угол σ A , образованный с оптической осью лучом, выходящим из осевой точки A предмета в край 11
входного зрачка, называется апертурным углом в пространстве предметов или передней
угловой
апертурой.
Соответствующий
угол
σ′A′
называется
апертурным углом в пространстве изображений или задней угловой апертурой. Произведение синуса апертурного угла на показатель преломления среды соответствующего
пространства
(соответственно передней
называется
или задней). Числовая
числовой
апертурой
апертура определяет
предельное разрешение в дифракционной картине изображения двух точек, образованного идеальной оптической системой. Изображение диафрагмы (в частном случае сама диафрагма), которое из центра входного зрачка P видно под наименьшим углом 2ω как показано на рис.5.5, ограничивает величину изображаемого предмета и называется входным люком, при этом угол 2ω называется угловым полем оптической системы в пространстве предметов, а угол ω – углом поля. Реальная диафрагма, изображение которой является входным люком, называется полевой диафрагмой. Изображение входного люка, образованное оптической системой в целом в пространстве изображений, называется выходным люком. Как следует из рисунка, верхний крайний луч наклонного светового пучка, выходящего из точки B в плоскости предмета, проходит через верхние крайние точки входного люка и входного зрачка. Нижний крайний луч наклонного светового пучка, выходящего из точки C в плоскости предмета, проходит через верхнюю крайнюю точку входного люка и нижнюю крайнюю точку входного зрачка, то есть световой пучок полностью перекрывается экраном входного люка. Таким образом, для точек в плоскости предмета в промежутке между точками B и C происходит нарастающее срезание световых пучков от нулевого в точке B до полного в точке C . Такое срезание световых пучков называется виньетированием. Вполне очевидно, что если входной люк расположен в плоскости предмета (полевая диафрагма при этом может быть расположена в плоскости промежуточного или конечного изображения), то виньетирование
световых
пучков
лучей
отсутствует.
Иногда
при
конструировании оптических устройств (при разработке оптических систем) 12
эффект виньетирования применяют для устранения части пучка лучей, недопустимо нарушающих его гомоцентричность. Кроме того, с помощью дополнительных диафрагм можно существенно уменьшить влияние на качество изображения света, рассеянного на торцах линз и поверхностях оправ линз, на стенках корпусов оптических устройств и т.п. Пусть
2 y A – линейное
поле
оптической
системы
в
пространстве
предметов, а 2 y ′A′ – в пространстве изображений. При этом луч, выходящий из внеосевой точки предмета в направлении центра P входного зрачка, образует полевой угол ω , тангенс которого равен tg ω =
где
y , ap − a
a – расстояние от передней главной точки H оптической системы до
осевой точки A предмета ; a P – расстояние от передней главной точки до осевой точки P (центра) входного зрачка. В пространстве изображений имеем аналогичное соотношение вида: tg ω′ =
y′ . a′p′ − a′
Угловое увеличение W изображения, образованного оптической системой, определяется отношением W=
tg ω′ . tg ω
Луч, выходящий из внеосевой точки предмета и проходящий через центр входного зрачка, называется главным лучом. Если апертурная диафрагма расположена в задней фокальной плоскости той части оптической системы, которая предшествует этой диафрагме, то входной зрачок будет находиться в бесконечности и все главные лучи в пространстве предметов будут параллельны оптической оси. Такая оптическая система называется системой с телецентрическим ходом главных лучей в пространстве предметов или телецентрической
со
стороны
предмета.
Если
апертурная
диафрагма
расположена в передней фокальной плоскости той части системы, которая 13
следует за этой диафрагмой, то выходной зрачок будет находиться в бесконечности и все главные лучи в пространстве изображений будут параллельны оптической оси. В этом случае оптическая система называется телецентрической со стороны изображения. Плоскость, в которой расположены оптическая ось и главный луч, называется меридиональной плоскостью. Плоскость, перпендикулярная к меридиональной плоскости по главному лучу (в которой расположен главный луч), называется сагиттальной плоскостью. 5.4. Световой
поток,
проходящий
через
оптическую
систему
от
излучающего элемента поверхности, расположенного на оптической оси перпендикулярно к ней
Элементарный
световой
d 2Φ ,
поток
излучаемый
элементом
dS ,
расположенным на оптической оси перпендикулярно к ней, и проходящий через элементарную площадку dΣ входного зрачка оптической системы в пределах телесного угла
dω , как показано на рис.5.6, определяется
выражением (5.1) в виде:
d 2Φ = Lσ dωdS cos σ ,
(5.17)
где Lσ – яркость излучающего элемента в направлении, образующем угол σ с оптической осью; dω – элементарный телесный угол с вершиной в осевой точке площадки dS ; σ – угол между осью телесного угла dω и оптической осью. dΣ dω − dσ
dS A
−σ
dS ′
dϕ
P K
14
P′
σ′ A′
2
Рис.5.6. Элементарный световой поток d Φ , излучаемый элементом dS
Обозначив отрезок AP = − R , в соответствии с рисунком получаем dω =
dΣ R sin σdϕRdσ = = sin σdσdϕ . R2 R2
(5.18)
При этом d 2Φ = Lσ dS sin σ cos σdσdϕ ,
(5.19)
где dϕ – элементарный двугранный угол между двумя меридиональными (проходящими через оптическую ось) плоскостями, как показано на рис.5.6, и составляющими боковые стенки телесного угла dω . Для определения светового потока
dΦ , излучаемого элементарной
площадкой dS и заполняющего весь входной зрачок оптической системы, проинтегрируем выражение (5.19) по всей площади входного зрачка, т.е. в пределах изменения переменных 0 ≤ ϕ ≤ 2π и при круглой форме зрачка 0 ≤ σ ≤ σ КР где σ К – значение угла σ , соответствующее краю входного зрачка, т.е. апертурный угол осевого пучка лучей в пространстве предметов. Таким образом,
dΦ =
σ К 2π
∫ ∫ LσdS sin σ cos σdσdϕ .
(5.20)
0 0
Задача
определения
потока
dΦ
существенно
упрощается,
если
предположить, что яркость Lσ = L = const , т.е. является величиной постоянной во всех точках излучающего элемента dS и не зависит от угла излучения σ (при этом говорят, что элемент dS излучает по закону Ламберта). При этом условии выражение (5.20) можно переписать в виде: dΦ = LdS
σ К 2π
∫ ∫ sin σ cos σdσdϕ .
(5.21)
0 0
В результате интегрирования выражение (5.21) принимает вид: dΦ = πLdS sin 2 σ .
(5.22)
Этот световой поток проходит сквозь оптическую систему и падает на элементарную площадку dS ′ , которая становится изображением площадки dS , 15
как показано на рис.5.6. Вполне очевидно, что световой поток dΦ′ , падающий на площадку dS ′ , определится аналогичным выражением вида:
dΦ′ = πL′dS ′ sin 2 σ′ ,
(5.23)
где σ′ – апертурный угол осевого пучка лучей в пространстве изображений (или задний апертурный угол оптической системы). Как было показано, L = n 2 L0 ; L′ = n′ 2 L0 , где L0 – редуцированная яркость; n
и
n′ – показатели преломления сред в пространстве предметов и
изображений соответственно. Если принять во внимание тот факт, что в реальной оптической системе неизбежны потери светового потока (поглощение, френелево отражение на поверхностях), учитываемые коэффициентом пропускания τ(τ < 1) , то вместо светового потока dΦ из системы выходит поток dΦ′ = τdΦ , а, следовательно, меньший потока dΦ . При этом dΦ′ = τπL′dS ′ sin 2 σ′ ,
(5.24)
2
⎛ n′ ⎞ где L′ = ⎜ ⎟ L . При n′ = n : L′ = L . ⎝n⎠ Условие синусов Аббе
Учитывая выражение (5.22), получаем dΦ ′ = τπLdS sin 2 σ .
(5.25)
Приравняв правые части выражений (5.24) и (5.25), находим, что n 2 dS sin 2 σ = n′2dS ′ sin 2 σ′ .
(5.26)
Учитывая геометрическое подобие оптически сопряжённых плоскостей фигур, одна из которых является предметом, а другая – его изображением, можно написать 2
dS ′ ⎛ dy ′ ⎞ =⎜ ⎟ , dS ⎜⎝ dy ⎟⎠ где dy и dy′ – линейные отрезки оптически сопряжённых элементов площадок dS и dS ′ . При этом выражение (5.26) можно переписать в виде: 16
n 2 dy 2 sin 2 σ = n′2 dy′2 sin 2 σ′ . Извлекая, квадратный корень из обеих частей этого равенства, получаем инвариант вида:
ndy sin σ = n′dy′ sin σ′ .
(5.27)
Отсюда находим, что n sin σ dy ′ . =V = n′ sin σ′ dy
(5.28)
Из условия V = V0 = const следует так называемое условие синусов Аббе: n sin σ = const . n′ sin σ′
(5.29)
Если в изображении A′ осевой точки предмета A полностью устранена сферическая аберрация, то соблюдение условия (5.29) является необходимым и достаточным условием совершенного изображения элементарного отрезка dy , перпендикулярного оптической оси, а, следовательно, и всей элементарной площадки dS , проходящей через точку A и содержащей отрезок dy . При этом изображение образует сколь угодно широкие пучки лучей, образующих любые углы σ с оптической осью. Пусть расстояние от передней главной плоскости оптической системы до осевой точки предмета равно − a , а от задней главной плоскости до параксиального изображения этой точки равно a′ . При этом линейное увеличение системы равно V0 =
na ′ . При соблюдении условия синусов n′a
справедливо равенство
na′ n sin σ . = n′a n′ sin σ′ Отсюда следует, что
a sin σ = a ′ sin σ′ .
(5.30)
Но a sin σ = m , а a′ sin σ′ = m′ , где m и m′ – расстояния от оптической оси до точек пересечения крайних лучей, образующих углы σ и σ′ с оптической осью, со сферами радиусов
a
и
a′ соответственно. Таким образом, 17
применительно к реальным оптических системам представления о главных плоскостях, справедливые в параксиальной области, для конечного осевого пучка лучей должны быть заменены представлениями о главных сферах, понимая под последними сферы, которые проходят через главные точки оптической системы, а радиусы сфер равны a (передняя главная сфера) и a′ (задняя главная сфера). Заметим, что при a → ∞ при m = a sin σ ≠ 0 угол σ → 0 . При этом расстояние a′ стремится к величине
f ′ , называемой задним фокусным
расстоянием. Как следует из (5.30), при a → ∞ имеем f′=
m . sin σ′
Условие
(5.31) синусов
Аббе
в
этом
случае
определяется
равенством
m = const . sin σ′
Следуя Аббе, назовём пару оптически сопряжённых точек A и A′ на оси оптической системы, для которых отсутствует сферическая аберрация лучей широкого пучка
и, кроме
того,
выполнено
условие
синусов, парой
апланатических точек. 5.5. Освещённость в осевой точке изображения
При анализе свойств световых трубок по умолчанию предполагалось стигматичное отображение каждой точки элементарных площадок, при этом явления дифракции не учитывались. Результаты такого анализа дают практически важное представление об идеальном распределении светового потока в плоскости изображения. При этом освещённость в каждой точке изображения естественным образом определяется отношением элементарного светового потока к элементарной площадке, на которую он падает, т.е. E0′ =
dΦ′ . dS ′
18
Используя формулу (5.24), находим, что освещённость E0′ в осевой точке изображения определяется выражением E0′ = τπL sin 2 σ′ .
(5.32)
2
⎛ n′ ⎞ Но L′ = ⎜ ⎟ L . При этом ⎝n⎠ E0′ = τπL0 A′2 .
(5.33)
Величину A′ = n′ sin σ′ в оптике называют числовой апертурой со стороны изображения или задней числовой апертурой; величину L0 =
1 L называют n2
редуцированной яркостью излучения (пучка лучей). Пусть числовая апертура светового пучка лучей в пространстве предметов (передняя числовая апертура) A = n sin σ . Тогда, учитывая формулу (5.28) при соблюдении условия (5.29)
получаем E0′ =
τπ L A2 , 2 0 V0
(5.34)
где V0 – поперечное увеличение изображения образованного оптической системой.
a′
P′
F ′ σ′ − z′p′
A′ z′
p′ Рис.5.7. Выходной зрачок оптической системы
Пусть радиус выходного зрачка оптической системы равен a′ , а расстояние от центра выходного зрачка до осевой точки изображения PA′ = p′ , как показано на рис.5.7. При этом в соответствии с рисунком имеем
19
sin σ′ = 2
a′ 2 a′ 2 = a′ 2 + p′ 2 p′ 2
1 . a′ 2 1+ 2 p′
Подставив это соотношение в выражение (5.32), получаем πa′2 E0′ = τL 2 p′
1 . a′ 2 1+ 2 p′
(5.35)
У большинства светосильных зеркальных и зеркально-линзовых систем выходной зрачок имеет форму кольца. Пусть R′ – радиус выходного зрачка, а r ′ – радиус экранируемой части зрачка. При этом освещённость в осевой точке
изображения определится очевидным выражением вида:
(
)
E0′ = τπL sin 2 σ′H − sin 2 σ′BH ,
где sin 2 σ′H =
(5.36)
R′2 r ′2 2 ′ σ = ; sin . BH R′2 + p′2 r ′ 2 + p′ 2
Это выражение можно записать в виде
(
)
E0′ ≈ τπL 1 − η2 sin 2 σ′ ,
где σ′ = σ′H ; η =
(5.37)
r′ – коэффициент линейного экранирования зрачка по R′
диаметру. Синус апертурного угла эквивалентной оптической системы, имеющей сплошной выходной зрачок круглой формы и создающей такую же освещённость в осевой точке изображения, равен sin σ′ЭКВ = sin 2 σ′Н − sin 2 σ′ВН .
В соответствии с рис.5.7 имеем ⎛ z′ z′ ′ ⎞ p′ = z′ − z′p′ = f ′⎜⎜ − p ⎟⎟ , ⎝ f′ f′⎠
где f ′ – фокусное расстояние системы. При этом
p′ = f ′(− V0 + V0 ЗР ) ,
(5.38) 20
где V0 = −
z′ – поперечное увеличение изображения предмета, образованного f′
оптической системой, а V0 ЗР = −
z′p′ – поперечное увеличение изображения f′
входного зрачка, образованного оптической системой.
DЗР = 2a – диаметр
Пусть
входного
зрачка,
а
′ = 2a′ – диаметр DЗР
выходного зрачка. При этом
V0 ЗР =
a′ . a
(5.39)
Заметим, что при
p′ ≥ 10a′ с погрешностью, не превышающей 1%,
освещённость в изображении осевой точки определяется выражением
E0′ = τL′
πa ′ 2 . p′2
(5.40)
Подставив в это выражение соотношения (5.38) и (5.39), получаем 2
⎛ 2a ⎞ 1 V02ЗР , E0′ = τπL⎜⎜ ⎟⎟ 2 4 ⎝ f ′ ⎠ (V0 ЗР − V0 ) где
(5.41)
2a DЗР = = 2 A – относительное отверстие оптической системы. f′ f′
Величину
(2A)2
– называют
геометрической
светосилой
оптической
системы, а величину τ(2A) называют физической светосилой системы. 2
Если предмет расположен на весьма большом расстоянии от оптической системы, то величину V0 = −
z′
можно считать достаточно малой, полагая
z′ ≈ 0 . При этом формула (5.41) принимает вид: f′ 2
⎛ 2a ⎞ 1 E0′ = τπL′⎜⎜ ⎟⎟ . 4 ⎝ f′⎠
(5.42)
При однократном увеличении изображения, т.е. при V0 = −1X , формула (5.41) принимает вид:
21
2
V02ЗР ⎛ 2a ⎞ 1 ′ E0 = τπL ⎜⎜ ⎟⎟ . 2 4 ⎝ f ′ ⎠ (1 + V0 ЗР ) Формула Манжена-Чиколева
Рассмотрим важный в технике дальнего освещения (случай освещения прожектором) вопрос об освещённости бесконечно удалённого изображения. Пусть источник света (предмет) расположен вблизи переднего фокуса F оптической системы. В этом случае его изображение окажется расположенным на весьма большом расстоянии p′ от выходного зрачка оптической системы, как показано на рис.5.8, где оптическая система представлена бесконечно тонким компонентом ϕ , а источник света представлен элементом dS = πy 2 , все точки которого обладают одинаковой яркостью и излучают равноярко во всех направлениях. ϕ
Вых.зр.
A
B′
2y
A′ 2 y′
F
p′B′
p′
Рис.5.8. Оптическая система, как бесконечно тонкий компонент ϕ
Освещённость E0′ в точке A′ , расположенной на оптической оси системы, определится формулой (5.32):
E0′ = τπL′ sin 2 σ′ . В рассматриваемом случае с достаточной степенью приближения можно считать, что sin σ′ =
a′ 1 ′ . , где радиус выходного зрачка системы a′ = DЗР p′ 2
22
′ – площадь выходного зрачка оптической системы. При этом Пусть S ЗР имеем E0′ =
′ τπL′S ЗР , 2 p′
(5.43)
′ = πa′2 . где S ЗР Сопоставив полученное соотношение с формулой (4.17): dEn =
dI , можно r2
сделать вывод о том, что рассматриваемая оптическая система с источником излучения dS в отношении светового действия эквивалентна излучателю с осевой силой света ~ ′ , I 0 = L ′S ЗР 2
где яркость
~ ⎛ n′ ⎞ L ′ = τL′ = τ⎜ ⎟ L ; ⎝n⎠
L – яркость источника света. При этом
выражение (5.43) можно представить в виде: E0′ =
I0 . p′ 2
(5.44)
При n′ = n = 1 : ′ . I 0 = τLS ЗР
(5.45)
Полученную формулу, т.е. выражение (5.54), называют формулой Манжена-Чиколева. Как следует из рис.5.8, эта формула справедлива для всех точек на оптической оси в пространстве изображений, расположенных не ближе точки B′ , так как для более близких точек действующей будет не вся световая поверхность выходного зрачка, а только часть её. В соответствии с рис.5.8 имеем D′ 2 y′ = ЗР , p ′ − p ′B′ p ′B′
′ – диаметр выходного зрачка. где DЗР При этом 23
p′B ′ ≥ p′
′ DЗР . ′ + 2 y′ DЗР
Обозначим 2 y = d . При этом 2 y′ =
z′ d. f′
При z′ ≈ p′ − f ′ получаем p′B′ ≥ p′
′ f ′ DЗР . ′ + ( p′ − f ′)d f ′ DЗР
(5.46)
При p′ = ∞ : p′B′(∞ ) ≥ f ′
′ DЗР . d
Формула Манжена-Чиколева может быть применена и в тех случаях, когда выходной зрачок имеет не только форму круга, но и более сложную форму, например, в проекционных системах, когда источник света в виде нитей или спирали лампы накаливания изображается конденсором в плоскость входного зрачка проекционного объектива. Полученные
соотношения
позволяют
весьма
просто
оценить
эффективность применения оптической системы в составе осветительного устройства. Пусть источник излучения имеет площадь dS ИСТ и яркость L . Его сила света I ИСТ в направлении нормали к поверхности будет равна I ИСТ = LdS ИСТ . В соответствии с формулой (5.45) осевая сила света источника в сочетании с оптической системой равна ′ . I 0 = τLS ЗР Отношение
рассматриваемых
величин
силы
света
называется
коэффициентом усиления оптической системы: m=
I0 I ИСТ
=τ
′ S ЗР . dS ИСТ
(5.47)
Коэффициент m определяет "выигрыш в силе света", обеспечиваемый применением оптической системы.
24
′ , а Пусть диаметр выходного зрачка оптической системы равен DЗР 1 1 ′ = πDЗР ′2 , а dSИСТ = πd 2 , диаметр источника излучения равен d . Так как S ЗР 4 4 имеем 2
⎛ D′ ⎞ m = τ⎜ ЗР ⎟ . ⎝ d ⎠
(5.48)
В некоторых системах (например, в прожекторах) коэффициент усиления m может достигать величины 10 000 и даже более. 5.6. Световой
поток,
проходящий
через
оптическую
систему
от
излучающего элемента поверхности, расположенного вне оптической оси
Y B1 ϕ
dS ′
A′
α′0
β1
α′ y′
q′ p′
dΣ′ dr ′ dϕ
A0′
r ′ p′ B2
p′ r ′ cos ϕ
−ω
r ′ sin ϕ
β2
Z
X
Рис.5.9. Определение светового потока, падающего на элементарную площадку dS ′ в плоскости изображения оптической системы
Определим световой поток, падающий на элементарную площадку dS ′ в плоскости
изображения
оптической
системы,
содержащую
точку
A′ ,
расположенную вне оптической оси, как показано на рис.5.9. Предположим при этом, что световой поток, выходящий из системы, заполняет её выходной зрачок, имеющий форму круга, и что яркость излучения в пределах всего пучка лучей остаётся постоянной и равной L′ . 25
Разобьём выходной зрачок системы на элементарные кольца бесконечно близкими концентрическими окружностями. Выделим элемент площади dΣ′ одного из колец, ограниченный окружностями, радиусы которых равны r ′ и r ′ + dr ′ , и углом dϕ между двумя меридиональными плоскостями, одна из которых образует некоторый угол ϕ с осью Z . Площадь этого элемента зрачка равна r ′dr ′dϕ . При этом световой поток, проходящий через элементарную световую трубку, образованную двумя площадками (сечениями) dΣ′ = r ′dr ′dϕ и
dS ′ , равен L′dS ′r ′dr ′dϕ cos 2 (q′, X ) d Φ′ = , q′ 2 2
(5.49)
где q′ – расстояние от элемента dΣ′ кольца с координатами (r ′ sin ϕ; 0; r ′ cos ϕ) до элемента dS ′ с координатами (0; p′; y′) . В соответствии с рис.5.9 имеем cos(q′, X ) =
p′ ; q′2 = p′2 + y′2 + r ′2 − 2r′y′ cos ϕ . q′
(5.50)
Поток dΦ′ , проходящий через элемент изображения dS ′ , находим, выполняя интегрирование по всей площади кругового зрачка радиуса a′ : a′
2π
0
0
dΦ′ = L′p′2dS ′ ∫ r ′dr ′ ∫
( p′
dϕ 2
+ y′2 + r ′2 − 2r ′y′ cos ϕ
)
2
.
Представим это выражение в виде: a′
2π
dϕ . 2 ( a + b cos ϕ ) 0
dΦ′ = L′p′ dS ′ ∫ r ′dr ′ ∫ 2
0
Первое интегрирование выполняем по формулам
dϕ
A sin ϕ
dϕ
∫ (a + b cos ϕ)2 = a + b cos ϕ + B ∫ a + b cos ϕ , где A =
b a и B= 2 ; 2 b −a a − b2 2
⎛ a −b 1 ⎞ dϕ 2 ⎜⎜ = arctg tg ϕ ⎟⎟ ∫ a + b cos ϕ a 2 − b2 + 2 ⎠ a b ⎝ при условии, что a > b . 26
(5.51)
Заметим, что 2π
2π
π
dϕ dϕ dϕ ∫ a + b cos ϕ = ∫ a + b cos ϕ + ∫ a + b cos ϕ = 0 0 π
2π π ⎡ ⎛ a−b 1 ⎞ ⎤ ⎛ a−b 1 ⎞ ⎢arctg ⎜ ⎥ = ⎜ a + b tg 2 ϕ ⎟⎟ + arctg ⎜⎜ a + b tg 2 ϕ ⎟⎟ ⎥ = 2 2 ⎢ a −b ⎣ ⎠π ⎦ ⎠0 ⎝ ⎝ 2 [arctg∞ − arctg 0 + arctg 0 − arctg (− ∞ )] = = 2 2 a −b 2 2π ⎡ π ⎛ π ⎞⎤ = . − − = ⎜ ⎟ ⎥ 2 2 ⎢2 2 2 2 ⎝ ⎠ ⎦ a −b ⎣ a −b
2
2π
sin ϕ = 0 . Тогда Кроме того, A a + b cos ϕ 0
dϕ
2π
a
∫ (a + b cos ϕ)2 = a 2 − b 2
2
a −b
2
=
(a
2πa 2
−b
2
)
3
. 2
При этом выражение (5.51) принимает вид
( p′
a′
dΦ = 2πL′p′ dS ′ ∫ 2
0
2
)
+ r ′2 + y′2 r ′dr ′
[(p′ + r′ + y′ ) − 4 y′ r′ ] 2
2
2 2
2
2
3
.
(5.52)
2
Для выполнения интегрирования в выражении (5.52) введём новую переменную α′ – угол между лучами B1 A′ и B2 A′ , проведёнными из точки A′ к концам диаметра B1B2 элементарного кольца в меридиональной плоскости. Как следует из рис.5.9,
α′ = β1 − β2 , где β1 и β2 – углы с осью Z лучей B1 A′ и B2 A′ . Так как tgβ1 =
p′ p′ , а tgβ2 = , то y′ − r ′ y′ + r ′ −1
2 p′r ′ tgβ1 − tgβ2 y′ + r ′ − y ′ + r ′ ⎛ p′ 2 ⎞ ⎜ ⎟ ; 1 = p′ + tgα′ = = 2 2 2 2 2 2 2 ⎜ ⎟ ′ ′ ′ ′ ′ 1 + tgβ1tgβ2 − + − y′ − r ′ y r p y r ⎝ ⎠
27
(
cos α′ = 1 + tg α′ = = =
( p′ ( p′ ( p′
2
2
2
+ y′ + r ′ 2
+ y′ + r ′ 2
)
−1
2
=
( p′
p′ 2 + y ′ 2 − r ′ 2 + y′ − r ′
2
2
p′ 2 + y ′ 2 − r ′ 2
)
2 2
(
+ y′ + r ′ 2
2
2
2
)
)
2 2
(
)
(
2
2
)
=
− 4 r ′ r ′ + p′ + 4 r ′ r ′ + p′ − 4 y ′ r ′ 2
2
− 4 y′ r ′ 2
2
2
2
2
2
2
=
;
2
2r ′dr ′
− sin αdα = −
=
2
4
p′ 2 + y ′ 2 − r ′ 2
2 2
)
+ 4 p′ r ′ 2
− 4 r ′ p′ + y ′ + r ′ + 4 r ′ + 4 p′ r ′ 2
p′ 2 + y ′ 2 − r ′ 2 2
)
2 2
−
( p′ + y′ + r ′ ) − 4 y′ r ′ 2( p ′ + y ′ + r ′ )2r ′ − 8 y ′ r ′ dr ′ = − ( p′ + y ′ + r ′ ) 2[( p ′ + y ′ + r ′ ) − 4 y ′ r ′ ] ( p′ + y′ + r ′ ) − 4 y′ r ′ + ( p′ + y′ − r ′ )( p′ − y′ + r ′ ) = = −2r ′dr ′ [ ( p′ + y ′ + r ′ ) − 4 y ′ r ′ ] ( p′ + y′ + r ′ )( p′ + y′ + r ′ + p′ + y′ − r ′ )− 4 y′ r ′ − K = −2r ′dr ′ [ ( p′ + y′ + r ′ ) − 4 y′ r ′ ] 2 y ′ ( p′ + y ′ − r ′ ) K− = [(p′ + y′′ + r ′′ ) − 4′ y′ r′′ ] ′ ′ ′ ′ ′ 2( p + y + r )( p + y ) − 2 y ( p + y + r ) = −2r ′dr ′ = [(p′ + y′ + r′ ) − 4 y′ r ′ ] 2
2
2
2 2
2
2
2
2
2
2
2
2
2
2
2
2
2 2
2
2
2
2
2
2 2
2
2
2
2
2
2
3
2
2
2
2
2
2
3
2
2
2
3
2
2
2
2
2
2
2
2
2
2
2
2 2
2
[(p′ + y′ + r ′ ) − 4 y′ r ′ ] 2 2
2
2
2
2 2
2
p′2 + y′2 + r ′2
2
3
2
2
2
= −4 p ′ 2
2
2
2
2
2
2 2
2
2
2
2
2
2 2
2
2
2
2
3
2
2
3
2
2
2
r ′dr ′ . 2
Итак, sin α′dα′ = 4 p′
2
p′ 2 + y ′ 2 + r ′ 2
[(p′ + y′ + r′ ) − 4 y′ r′ ] 2
2
2 2
2
2
3
r ′dr ′ .
(5.53)
2
Сопоставив выражения (5.52) и (5.53), получаем α′
0 1 dΦ′ = πL′dS ′ ∫ sin α′dα′ , 2 0
(5.54)
28
где
α 0 – угол между лучами, проведёнными из точки
A′
плоскости
изображений к концам диаметра в меридиональной плоскости кругового сечения пучка лучей, выходящих из оптической системы и собирающихся в точке A′ . В результате интегрирования в выражении (5.54) получаем 1 1 dΦ′ = πL′dS ′(1 − cos α′0 ) = πL′dS ′ sin 2 α 0 , 2 2
где cos α′0 =
( p′
p ′ 2 + y ′ 2 − a′ 2 2
+ y ′ + a′ 2
) − 4 y ′ a′
2 2
2
2
(5.55)
.
Заметим, что для точки A′ , расположенной на оптической оси системы,
y′ = 0 , а, следовательно, p′ 2 − a′ 2 cos α 0 = 2 . При этом p′ + a ′ 2
1 p ′ 2 + a′ 2 − p′ 2 + a′ 2 a′ 2 dΦ′ = πL′dS ′ = πL′dS ′ 2 = πL′dS ′ sin 2 σ′ , 2 2 2 2 p′ + a′ p′ + a ′ где σ′ – апертурный угол оптической системы в пространстве изображений. В этом случае формула (5.55) естественным образом переходит в формулу (5.23). В реальной оптической системе выходящий световой поток dΦ′ меньше входящего потока dΦ и равен dΦ′ = τdΦ , где τ – коэффициент пропускания оптической системы. 5.7. Освещённость элемента изображения, расположенного вне оптической оси системы
Освещённость в некоторой точке, расположенной вне оптической оси в плоскости изображения, определяется отношением потока dΦ′ к площади элемента изображения dS ′ , содержащего эту точку. В соответствии с формулой (5.55) это отношение равно: 1 E′ = πτL′ sin 2 α′0 . 2
(5.56)
Полагая заднюю апертуру наклонного пучка лучей сравнительно малой, что справедливо для подавляющего большинства применяемых систем, 29
формулу (5.56) можно преобразовать в более удобному виду. Действительно, 1 если величина sin α 0 сравнительно невелика, то можно принять, что 2 1 a′ cos ω′ , sin α′0 ≈ 2 p′A′ где в соответствии с рис.5.9: p′A′ – отрезок, соединяющий центр выходного зрачка p′ с рассматриваемой точкой A′ ; a′ – радиус кругового сечения наклонного пучка лучей, сходящихся в точке A′ , плоскостью выходного зрачка. В соответствии с рисунком p′A′ =
1 a′ p′ . При этом sin α′0 ≈ cos 2 ω′ . 2 p′ cos ω′
Последнее соотношение позволяет выражение (5.56) представить в виде: a′2 E ′ = πτL′ 2 cos 4 ω′ . p′
Положив в формуле (5.32) sin σ′ =
(5.57) a′ , получаем p′
a′ 2 E0′ = πτL′ 2 . p′
(5.58)
Из сопоставления соотношений (5.57) и (5.58) следует, что E ′ = E0′ cos 4 ω′ .
(5.59)
При выводе формулы (5.59) предполагалось, что оптическая система образует безаберрационное изображение предмета и апертурной диафрагмы. В случае реальной оптической системы формулу (5.58) удобно переписать в виде: dΦ ′ a0′2 E0′ = = τπL′ 2 , dS0′ p′
(5.60)
а формулу (5.57) удобно представить в таком виде: E′ =
a′2 dΦ ′ dS 0′ dS 0′ τπL′ 0 2 cos 4 ω′ . = dS 0′ dS ′ dS ′ p′
(5.61)
Из сопоставления формул (5.60) и (5.61) следует, что E′ =
a′ 2 dS 0′ E0′ cos 4 ω′ . 2 a0′ dS ′
(5.62) 30
Вполне очевидно, что аберрации в изображении апертурной диафрагмы, образованном следующей за ней частью оптической системы, определяют неравенство
a′ 2 ≠ 1 , а неравенство a0′2
dS0′ ≠ 1 определяется дисторсией в dS ′
изображении предмета. Назовём произведение рассматриваемых отношений аберрационным коэффициентом Русинова (коэффициентом аберрационного виньетирования) и обозначим его через PУС (ω′) : a′ 2 dS 0′ PУС (ω′) = 2 . a0′ dS ′
(5.63)
При этом формулу (5.62) можно представить в виде:
E ′ = PУС (ω′)E0′ cos 4 ω′ .
(5.64)
31
Глава 6 СТРУКТУРА ИЗОБРАЖЕНИЯ, ОБРАЗОВАННОГО ОПТИЧЕСКОЙ СИСТЕМОЙ, И ОЦЕНКА ЕГО КАЧЕСТВА Распределение освещённости в плоскости изображения определяется выражением
E0 ( x′, y′) = τπL′( x′, y′)sin 2 σ′ cos4 w′ ,
(6.1)
где L′( x′, y′) – распределение яркости излучения в направлении главных лучей, осреднённой в пределах светового пучка лучей; τ – коэффициент пропускания света оптической системой и средами, разделяющими предмет, оптическую систему и плоскость изображений; σ′ – угол, образованный крайним лучом осевого пучка с оптической осью в пространстве изображений; w′ – угол (полевой угол) между главным лучом и оптической осью в пространстве изображений.
n′2 Распределение яркости L′( x′, y′) = 2 L( x, y ) , где L( x, y ) – распределение n яркости излучения поверхностью предмета; n и n′ – показатели преломления сред в пространстве предметов и изображений соответственно. Следовательно,
n′2 2 E0 ( x′, y′) = τπL( x, y ) 2 sin σ′ cos 4 w′ . n
(6.2)
Поперечное увеличение изображения, образованного оптической системой, определяется соотношением вида:
V=
n sin σ , n′ sin σ′
где σ – угол, образованный крайним лучом, исходящим из осевой точки предмета, с оптической осью. При этом выражение (6.2) можно представить в виде:
sin 2 σ E0 ( x′, y′) = τπL( x, y ) 2 cos 4 w′ . V
Пусть, например, sin w′ = 0,1, что соответствует углу w′ ≈ 6° . Тогда
(
)
2
cos4 w′ = 1 − sin 4 w′ = 1 − 2 sin 2 w′ + sin 4 w′ = 0,9801 . Таким образом, при достаточно большом, например, для объективов зрительных труб, угловом поле изображения приближённо можно считать, что
sin 2 σ E0 ( x′, y′) = τπ 2 L( x, y ) V
(6.3)
E0 ( x′, y′) = KL( x, y ) ,
(6.4)
или
sin 2 σ = const . где K = τπ V2 Итак, при сравнительно малом, но достаточно большом, например, для объективов зрительной трубы, угловом поле распределение освещённости на плоскости изображения идеально отображает распределение яркости излучения поверхностью предмета. Важно отметить, что формула (6.1) получена для идеальной оптической системы на основе представлений геометрической оптики. Оптическую систему будем считать геометрически идеальной, если она удовлетворяет следующим условиям, сформулированным Д.К. Максвеллом в 1858 году: – все лучи, вышедшие из точки предмета A( x, y ) и прошедшие через оптическую систему, должны сойтись (пересечься) в точке изображения
A′( x′, y′) ; – каждый элемент плоскости предмета, нормальной к оптической оси и содержащей точку A( x, y ) , должен быть изображён элементом плоскости, нормальной к оптической оси и содержащей точку A′( x′, y′) ; – высота изображения y′ должна быть пропорциональна высоте предмета
y , причём коэффициент пропорциональности должен быть постоянным независимо от местоположения точки A( x, y ) в плоскости предмета.
Отклонения от первого условия определяют поперечные аберрации широких и узких пучков лучей, образующих изображение; отклонения от второго условия определяют кривизну поверхности изображения, а отклонения от третьего условия нарушают подобие изображения предмету и называются дисторсией. Однако, в изображении, образованном геометрически идеальной оптической системой, распределение освещённости не является идеальным отображением яркости излучения поверхностью предмета, поскольку в этом случае каждая точка предмета изображается в виде дифракционного пятна, радиус первого тёмного кольца в котором (радиус кружка или пятна Эри) при круглой форме зрачков определяется формулой
rg′ =
1,22λ . 2n′ sin σ′
Вполне
(6.5)
очевидно,
что
при
прочих
равных
условиях
размер
дифракционного пятна в изображении точки тем меньше, чем меньше длина волны излучения λ . Этим, например, объясняется тот факт, что для повышения эффективности применения планарной технологии производства современной полупроводниковой
электроники
наблюдается
постоянное
стремление
использовать излучение более коротких длин волн. Из соотношения (6.5) следует, что только при λ = 0 безаберрационная оптическая система формирует геометрически идеальное изображение. Если предположить, что величина светового потока, излучаемого точечным источником (точечным предметом), мала, но конечна, то вполне очевидно, что яркость излучения такого источника должна быть бесконечно большой, при этом бесконечно велика, должна быть и освещённость геометрически идеального изображения точки. Освещённость идеализированного изображения точки можно описать с помощью так называемой δ -функции Дирака:
[
(
)]
δ( x′, y′) = lim N 2 exp − N 2 π x′2 + y′2 . N →∞
Представим это выражение в виде:
(6.6)
N2 δ( x′, y′) = lim = N →∞ exp N 2 π x′2 + y′ 2
[ (
= lim
N →∞
)]
1 . 1 1 2 2 2 2 2 2 2 + π x′ + y′ + N π x′ + y′ + K 2 N2
(
)
(
)
Отсюда следует, что при x′ = 0 и y′ = 0 функция δ(0, 0 ) = ∞ . Если x′ ≠ 0 и (или) y′ ≠ 0 , то δ( x′, y′) = 0 . Кроме того,
N ∫ ∫ exp[− N ∫ ∫ δ(x′, y′) dx′dy′ = Nlim →∞
∞
2
−∞
∞
2
)]
(
π x′2 + y′2 dx′dy′ =
−∞
= lim N
∞
2
N →∞
∫ exp(− N
−∞
2
)
(
)
−∞
N 2 πx′2 = u .
Обозначим
∞
πx′ dx′ ∫ exp − N 2 πy′2 dy′. 2
Тогда
2 N 2 πx′dx′ = du
(
2
и,
соответственно,
1
− 1 dx′ = u 2 du . 2N π
При этом получаем ∞
∫ exp(− N
−∞
2
∞
)
)
πx′ dx′ = 2 ∫ exp − N πx′ dx′ = 2
2
0
1 N π
∞
∫ exp(− u )u
−
1 2 du .
0
Известно, что гамма-функция определяется интегралом Эйлера в виде: ∞
Γ(t ) = ∫ exp(− u )u t −1du . 0
Из сопоставления интегралов следует, что t = ∞
∫ exp(− N 0
2
)
∞
(
)
πx′ dx′ = ∫ exp − N 2 πy′2 dy′ = 2
0
1 . Но 2
⎛1⎞ Γ⎜ ⎟ = π . При этом ⎝2⎠
1 . В результате получаем, что N
∞
∫ ∫ δ(x′, y′) dx′dy′ = 1.
−∞
Итак, δ -функция обладает следующими свойствами:
⎧∞, при x′ = x0′ ; y′ = y0′ ; ′ ′ ′ ′ δ( x − x0 , y − y0 ) = ⎨ 0, при x′ ≠ x0′ и (или ) y′ ≠ y0′ ; ⎩ ∞
∫ ∫ δ(x′ − x0′ , y′ − y0′ ) dx′dy′ = 1 .
−∞
Отсюда
следует,
что
если
δ -функция
описывает
распределение
освещённости в идеализированном изображении точки, то световой поток, формирующий это изображение, равен единице. С другой стороны, если яркость излучения точечного источника света равна нулю, то освещённость в изображении точки, а, следовательно, и поток, его формирующий, тоже будут равны нулю. Поэтому освещённость в идеализированном изображении точки определим произведением вида:
E0 ( x′, y′) δ( x′ − x0′ , y′ − y0′ ) . Пусть f ( x′, y′) – любая функция переменных x′ и y′ . Если f ( x′, y′) непрерывна при
x′ = x0′ и y′ = y0′ , то справедливо следующее важное
соотношение ∞
∫ ∫ f (x′, y′)δ(x′ − x0′ , y′ − y0′ ) dx′dy′ = f (x0′ , y0′ ),
−∞
т.е. справедливо соотношение
f ( x′, y′)δ( x′ − x0′ , y′ − y0′ ) = f ( x0′ , y0′ )δ( x′ − x0′ , y′ − y0′ ) .
(6.7)
Свойство δ -функции, определяемое соотношением (6.7), называется фильтрующим свойством δ -функции. Таким образом, выражение
E0 ( x′, y′)δ( x′ − x0′ , y′ − y0′ ) = E0 ( x0′ , y0′ )δ( x′ − x0′ , y′ − y0′ ) . Вполне очевидно, что световой поток, формирующий как реальное изображение точки (с учётом дифракции и аберраций), так и идеализированное, должен быть одним и тем же, равным входящему в оптическую систему с учётом коэффициента пропускания сред оптической системы. Следовательно
∞
∫ ∫ E (x′ − x0′ , y′ − y0′ ) dx′dy′ =
−∞
(6.8)
∞
=
∫ ∫ E0 (x′, y′)δ(x′ − x0′ , y′ − y0′ )dx′dy′ = E0 (x0′ , y0′ ),
−∞
где E0 ( x0′ , y0′ ) – величина освещённости в изображении точки, определяемая формулой (6.1) или формулой (6.3). Функцию D( x′ − x0′ , y′ − y0′ ) , определяемую отношением
D( x′ − x0′ , y′ − y0′ ) =
E ( x′ − x0′ , y′ − y0′ ) , E0 ( x0′ , y0′ )
называют функцией рассеяния точки (ФРТ). При этом из выражения (6.8) находим, что ∞
∫ ∫ D(x′ − x0′ , y′ − y0′ ) dx′dy′ = 1.
(6.9)
−∞
Таким образом, ФРТ можно интерпретировать как изображение точечного источника излучения, в котором распределён поток излучения, равный единице. Заметим, что
E ( x′ − x0′ , y′ − y0′ ) = D( x′ − x0′ , y′ − y0′ )E0 ( x0′ , y0′ ) ,
(6.10)
где E ( x′ − x0′ , y ′ − y0′ ) – распределение освещённости в реальном изображении точки, образованном оптической системой. Если ФРТ постоянна для всех точек плоскости изображения (аберрации практически не изменяются в пределе всей плоскости изображения), то освещённость в рассматриваемой точке с координатами x′, y ′ зависит только от расстояния,
на
котором
она
находится
от
точки
идеализированного
изображения с координатами x0′ , y0′ . Это означает, что оптическая система удовлетворяет условию пространственной инвариантности, т.е. в соответствии с терминологией, принятой в оптике, она обладает изопланатической коррекцией аберрацией или, просто, она изопланатична. В общем случае оптические системы этому условию не удовлетворяют. Однако, плоскость
изображения всегда можно разделить на кольцевые зоны, концентричные осевой точке изображения, в пределах которых условие изопланатичности практически соблюдается, т.е. в пределах которых ФРТ изменяется в допустимых пределах. Поскольку в изображении точки освещённость распределена на малой, но конечной площади, то вполне очевидно, что распределение освещённости в изображении других точек будет влиять на общее распределение освещённости в изображении этих точек. Будем считать излучаемый каждой точкой предмета свет некогерентным, при этом освещённость в каждой точке плоскости изображения равна сумме освещённостей от каждой изображаемой точки. В общем случае изображающая система линейна, если E ( x′, y′) = ∑ ai Ei ( x′, y′) . i
6.1. Оптическая система как фильтр пространственных частот В общем случае влияние оптической системы на структуру образованного ею изображения можно определить с помощью математического оператора, который
показывает,
как
нужно
преобразовать
функцию
E0 ( x0′ , y0′ )
идеализированного изображения, чтобы получить функцию распределения освещённости E ( x′, y ′) в действительном изображении. Такое воздействие оптической
системы,
удовлетворяющей
требованиям
линейности
и
изопланатичности, можно описать с помощью передаточной функции. Передаточная функция должна быть достаточно универсальна, чтобы её можно было применить к системам различного назначения. Другое важное требование, предъявляемое к передаточной функции, состоит в том, чтобы её можно было измерить. Рассмотрим распределение освещённости на плоскости изображения вдоль линии, параллельной, например, оси
x′ . В этом случае
E0 ( x0′ , y0′ ) =
= E0 ( x0′ , y0′ = const ) . Если эту линию совместить с осью x′ , то y0′ = 0 . При этом E0 ( x0′ , y0′ ) = E0 ( x0′ ) и, соответственно,
E ( x′ − x0′ ) = E ( x0′ )Dл ( x′ − x0′ ) ,
(6.11)
где Dл ( x′ − x0′ ) – функция рассеяния линии (ФРЛ), причём
Dл ( x′ − x0′ ) =
∞
∫ D( x′ − x0′ , y′ − y0′ )dy′ .
−∞
Условие нормировки ФРЛ таково, что ∞
∞
−∞
−∞
∫ Dл (x′ − x0′ ) dx′ = ∫ ∫ D(x′ − x0′ , y′ − y0′ ) dx′dy′ = 1.
В случае изопланатической системы
Dл ( x′ − x0′ i ) = Dл (x′ − x0′ j ).
Удобно обозначить x0′ = x′ − ξ′ . При этом ФРЛ можно представить в виде, показанном на рис.6.1.
Dл (ξ′)
ξ′
0 Рис.6.1. Функция рассеяния линии
Обратимся к рис.6.2, на котором распределение освещённости в идеализированном изображении в направлении оси x′ представлено кривой
E0 = E0 ( x0′ ) . Определим освещённость изображения E ( x′) в произвольной точке с координатой x′ . Для этого надо найти сумму ординат, равных
Dл (ξ′)E0 ( x′ − ξ′) при изменении координаты ξ′ (отсчитываемой от точки с координатой x′ ) теоретически от − ∞ до ∞ . При каждом значении координаты
ξ′ соответствующую ординату можно считать принадлежащей ФРЛ в изображении предмета с абсциссой x0′ = x′ − ξ′ и отстоящей от центра этой функции (т.е. от абсциссы x0′ ) на расстоянии, равном ξ′ , как показано на рис.6.2. Таким образом, распределение освещённости в изображении предмета определяется выражением
E ( x′ ) =
∞
∫ Dл (ξ′)E0 (x′ − ξ′)dξ′ .
(6.12)
−∞
E0
E0 ( x0′ )
Dл (ξ′)E0 ( x′ − ξ′) Dл (ξ′)E0 ( x′ = x0′ )
x′ − ξ′
O
ξ′
x′
x′ Рис.6.2. К выводу свёртки функций
Dл (ξ′) и E0 ( x′ − ξ′)
Этот интеграл представляет собой так называемую свёртку функции
E0 ( x0′ ) распределения освещённости вдоль оси x′ в идеализированном изображении предмета, образованного оптической системой, с функцией рассеяния линии Dл (ξ′) . Свёртку функций часто обозначают значком ⊗ . При этом E = Dл ⊗ E0 . В
общем
случае
распределения
освещённости
E0 ( x0′ , y0′ )
в
идеализированном изображении предмета формула (6.12) принимает вид:
E ( x′, y′) =
∞
∫ ∫ D(ξ′, η′)E0 (x′ − ξ′, y′ − η′) dξ′dη′ ,
(6.13)
−∞
где ξ′, η′ – координаты ФРТ. Можно показать, что линейный процесс, определяемый интегралом (6.13), на языке преобразования Фурье записывается в чрезвычайно простой форме, что приводит к интересным и полезным соображениям о действии оптической системы как фильтра пространственных частот.
Уместно напомнить, что формула (6.12), а, соответственно, и формула (6.13), получены в предположении, что вид функции D(ξ′, η′) в пределах рассматриваемых участков изображения не изменяется, т.е. в переделах рассматриваемых
участков
изображения
оптическая
система
обладает
изопланатической коррекций аберраций, при этом каждая точка предмета излучает некогерентный свет. При решении многих задач физики и математики необходимо осуществить разложение периодической функции f ( x ) с периодом, равным p , в ряд по тригонометрическим функциям:
f ( x ) = a0 + a1 sin
2π 2π 2π x + b1 cos x + K + an sin n x+ p p p
n =∞⎛ nx nx ⎞ 2π x + K = a0 + ∑ ⎜⎜ an sin 2π + bn cos 2π ⎟⎟ . + bn cos n p p p⎠ n =1 ⎝
(6.14)
Ряд вида (6.14) называется рядом Фурье, а разложение функции f ( x ) в ряд Фурье составляет задачу гармонического анализа. В приложениях зачастую ограничиваются конечным числом членов и получают при этом приближение функции тригонометрическим многочленом. Легко убедиться, что коэффициенты такого ряда Фурье определяются формулами:
a0 =
an =
bn =
1 p
2 p
2 p
1 p 2
∫ f (x ) dx ,
1 − p 2 1 p 2
∫
1 − p 2 1 p 2
f ( x )sin 2π
nx dx , p
nx ∫ f (x )cos 2π p dx, (n = 1, 2, K).
1 − p 2
Во многих случаях, представляет интерес, когда ряд Фурье сходится в обычном смысле, т.е. поточечно, и каким образом он описывает функцию f ( x ) . На такую постановку вопроса в значительной степени даёт ответ следующая
⎛ 1 1 ⎞ p, p ⎟ так ⎝ 2 2 ⎠
теорема Дирихле. Пусть f ( x ) удовлетворяет в интервале ⎜ − называемым условиям Дирихле:
⎛ 1 1 ⎞ p, p ⎟ можно разбить на конечное число интервалов, в ⎝ 2 2 ⎠
− интервал ⎜ −
которых f ( x ) непрерывна и монотонна; − если x0 является точкой разрыва функции
f ( x ) , то существуют
f ( x0 + 0 ) и f ( x0 − 0 ) . Тогда ряд Фурье функции f ( x ) сходится и имеет место n ⎛ ⎡ nx nx ⎞⎤ lim ⎢a0 + ∑ ⎜⎜ an sin 2π + bn cos 2π ⎟⎟⎥ = n →∞ p p ⎠⎦ n =1 ⎝ ⎣ ⎧ f ( x ), если f ( x ) непрерывна в x; ⎪ = ⎨ f ( x + 0 ) + f ( x − 0 ) в противном случае. ⎪ 2 ⎩
Запишем ряд Фурье в виде:
f ( x ) = a0 + где ω =
n =∞
n =∞
n =1
n =1
∑ an sin nωx + ∑ bn cos nωx ,
2π . p
Представим функцию exp(ix ) в виде степенного ряда
1 2 2 1 3 3 1 4 4 1 i x + i x + i x + K + in xn + K = n! 2! 3! 4! 1 1 1 ⎛ 1 ⎞ ⎛ ⎞ = ⎜1 − x 2 + x 4 − K⎟ + i⎜ x − x 3 + x 5 − K⎟ = cos x + i sin x. 4! 3! 5! ⎝ 2! ⎠ ⎝ ⎠
exp(ix ) = 1 + ix +
Таким образом, exp(ix ) = cos x + i sin x , т.е. получаем известную формулу Эйлера. При этом
f ( x ) = a0 + +
n =∞
n =∞
a
∑ 2ni [exp(inωx ) − exp(− inωx )] +
n =1
b
∑ 2n [exp(inωx ) + exp(− inωx )] =
n =1
= a0 +
где
n =∞
∑
n =1
bn + ian ⎤ ⎡ bn − ian ( ) ( ) exp in x exp in x ω + − ω ⎥⎦, ⎢⎣ 2 2
bn − ian 1 = p 2 =
1 p
1 p 2
1 p 2
∫ f (x )(cos nωx − i sin nωx )dx =
1 − p 2
∫ f (x )exp(− inωx )dx;
1 − p 2
bn + ian 1 = 2 p
При n = 0 :
1 p 2
∫
f ( x )(cos nωx + i sin nωx )dx =
1 − p 2
1 p
1 p
1 p 2
∫ f (x )exp(inωx )dx .
1 − p 2
1 p 2
∫ f (x )dx = a0 .
1 − p 2
Изменив знак величины n , т.е. заменив n на − n , из формулы для получаем формулу для
f (x ) =
bn + ian 2
bn − ian . А тогда 2
n=∞
∑ Cn exp(inωx ),
(6.15)
n = −∞
где Cn =
1 p
1 p 2
∫ f (x )exp(− inωx )dx .
1 − p 2
(6.16)
Пусть N – пространственная частота функций (гармоник), составляющих ряд Фурье, при этом N =
n . Единичное изменение частоты N определим p
разностью
∆N =
ni +1 ni 1 − = . p p p
Тогда
f (x ) =
1 p 2
n =∞
∑ g (N ) exp(i 2πNx )∆N , где g (N ) = ∫ f (x )exp(− i 2πNx )dx .
n = −∞
1 − p 2
Пусть некоторая функция
f ( x ) задана на всей вещественной оси.
Предположим, что нас интересуют её значения в интервале [x0 , x0 + p ]. При этом
функцию
f (x )
на
всей
вещественной
оси
можно
заменить
последовательностью её значений в интервале [x0 , x0 + p ] с периодом, равным
p , т.е. можно заменить функцию f ( x ) соответствующей периодической функцией. Тогда функцию f ( x ) в интервале [x0 , x0 + p ] можно представить рядом Фурье. Вполне очевидно, что в этом случае функция, представленная рядом Фурье, вне интервала [x0 , x0 + p ] не будет совпадать с функцией f ( x ) . Для целого ряда задач было бы полезно иметь выражение, подобное ряду Фурье, представляющее функцию f ( x ) , заданную в промежутке от − ∞ до ∞ . При этом будем считать, что f ( x ) в любом конечном интервале подчиняется ∞
условиям Дирихле и является абсолютно интегрируемой, т.е.
∫ f (x ) dx < ∞ .
−∞
Чтобы распространить полученное выражение на случай непериодических функций, можно устремить период p к бесконечности. Основной интервал тогда становится бесконечно большим, при этом величину
1 можно считать p
бесконечно малым изменением пространственной частоты N , т.е.
1 = dN . p
Тогда суммирование бесконечно большого числа колебаний всех частот от − ∞ до ∞ , определяемое полученным бесконечным рядом, можно представить интегралом ∞
f (x ) =
∫ g (N ) exp(i 2πNx )dN ,
(6.17)
−∞
при этом функция g ( N ) определяется через f ( x ) формулой
g (N ) =
∞
∫ f (x ) exp(− i 2πNx )dx .
(6.18)
−∞
Эти соотношения можно представить в виде:
1 ∞ f (x ) = g (ω) exp(iωx )dω 2π −∫∞
(6.19)
и, соответственно,
g (ω) =
∞
∫ f (x ) exp(− iωx )dx ,
(6.20)
−∞
где ω = 2π
n 1 , dω = 2π при p → ∞ . p p
Выражение (6.19) можно представить в виде:
⎤ 1 ∞⎡ 1 ∞ ( ) ( ) exp f (x ) = f x i x d − ω ω ⎥ exp(iωx )dω = ∫⎢ ∫ 2π −∞ ⎣ 2π −∞ ⎦ 1 ∞~ = ∫ g (ω) exp(iωx ) dω. 2π −∞ При этом
1 ∞ ~ g (ω) = ∫ f (x ) exp(− iωx ) dx . 2π − ∞ Выражение (6.18) определяет прямое преобразование Фурье функции f ( x ) и записывается в виде:
F [ f ( x )] = g ( N ) =
∞
∫ f (x )exp(− i 2πNx )dx ,
(6.21)
−∞
а обратное преобразование Фурье записывается в таком виде:
F
−1
∞
[g (N )] = f (x ) = ∫ g (N ) exp(i 2πNx )dN .
(6.22)
−∞
Это выражение можно рассматривать как представление функции f ( x ) в виде
линейной
комбинации
(т.е.
интеграла)
элементарных
функций
характерного вида exp(i 2πNx ) . Вполне очевидно, что комплексное число g ( N ) представляет собой просто весовой коэффициент, на который следует умножить элементарную функцию частоты N при синтезе искомой функции
f (x ) . Преобразование Фурье функции двух переменных f ( x, y ) определяется формулой вида:
F [ f ( x, y )] = g (N x , N y ) =
=
∞
∫∫
[
(6.23)
]
f ( x, y )exp − i 2π(N x x + N y y ) dxdy,
−∞
при этом обратное преобразование Фурье записывается в виде:
[
]
F −1 g (N x , N y ) = f ( x, y ) = =
∞
[
(6.24)
]
∫ ∫ g (N x , N y )exp i 2π(N x x + N y y ) dN x dN y .
−∞
Заметим,
[
что
]
для
любой
пары
частот
(N x , N y )
функция
exp i 2π(N x x + N y y ) = 1 при i 2π(N x x + N y y ) = i 2πn , где n – целое число. При этом y = −
N Nx n n = xtgα + y0 , где tgα = − x , y0 = . Направление, x+ Ny Ny Ny Ny
перпендикулярное к этой линии, определится очевидным уравнением вида:
Ny π⎞ 1 ⎛ y = xtg ⎜ α + ⎟ + y0 = xtgθ + y0 , где tgθ = − . Отсюда следует, что = 2⎠ tgα N x ⎝
N y = N x tgθ . При этом N x x + N y y = N x x + N x ytgθ =
Nx (x cos θ + y sin θ) . cos θ
Повернём систему координат xoy вокруг начала координат в положение x′oy′ в соответствии с уравнением
⎛ x ⎞ ⎛ cos θ − sin θ ⎞⎛ x′ ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ . y sin θ cos θ ⎝ ⎠ ⎝ ⎠⎝ y ′ ⎠ При этом
[
]
N ⎡ ⎤ exp i 2π(N x x + N y y ) = exp ⎢i 2π x ( x cos θ + y sin θ)⎥ = cos θ ⎣ ⎦ N ⎡ ⎤ = exp ⎢i 2π x x′ cos 2 θ − y ′ sin θ cos θ + x′ sin 2 θ + y ′ sin θ cos θ ⎥ = cos θ ⎣ ⎦ = exp(i 2πNx′),
(
где N =
)
Nx , т.е. N x = N cos θ , а N y = N x tgθ = N sin θ . cos θ
y
x′
1 Ny
θ x
0 1 Nx
~ p
Рис.6.3. Линии равной фазы
Таким образом, точно так же, как одномерное, двумерное преобразование Фурье можно рассматривать как представление функции
[ (
f ( x, y ) в виде
)]
линейной комбинации элементарных функций вида exp i 2π N x x + N y y , при этом каждая элементарная функция в плоскости xoy
"направлена" по
отношению к оси x под углом θ , как показано на рис.6.3. Здесь N x =
Ny =
n , при этом py
N = N x2 + N y2 ; величина угла
соотношением: θ = arctg
Ny
θ
n ; px
определяется
. Пространственный период (т.е. расстояние
Nx
между линиями равной фазы) можно определить очевидным выражением вида:
p 1 ~ p= = = n N
1 N x2
+
N y2
.
Для функции, обладающей осевой симметрией, удобно перейти к полярной системе координат:
x′ = r ′ cos ϕ , y′ = r ′ sin ϕ , при этом r ′ = x′2 + y′2 , tgϕ =
y′ ; x′
N x = ρ cos γ , N y = ρ sin γ , при этом ρ = N x2 + N y2 , tgγ =
Ny Nx
.
Тогда F [ f (r ′, ϕ)] = g (ρ, γ ) , где g (ρ, γ ) =
∞ 2π
∫ ∫ f (r ′, ϕ)exp[− i 2πr ′ρ(cos γ cos ϕ + sin γ sin ϕ)]r ′dr ′dϕ . 0 0
Из
свойства
осевой
симметрии
функции
f (r ′, ϕ)
следует,
f (r ′, ϕ) = f (r ′) . При этом
g (ρ, γ ) =
∞
2π
−∞
0
∫ f (r ′)r ′dr′ ∫ exp[− i 2πr ′ρ cos(ϕ − γ )]dϕ .
Используя тождество
1 2π J 0 (a ) = exp[− ia cos(ϕ − γ )]dϕ , 2π ∫0 где J 0 (a ) – функция Бесселя первого рода нулевого порядка, получаем ∞
g (ρ, γ ) = g (ρ ) = 2π ∫ f (r ′)J 0 (2πr ′ρ)r ′dr ′ . 0
(6.25)
что
Полученное выражение преобразования Фурье, играющее важную роль в решении оптических задач, называется преобразованием Фурье-Бесселя или, иначе, преобразованием Ганкеля. Путём аналогичных рассуждений можно показать, что обратное преобразование Фурье функции g (ρ ) , обладающей осевой симметрией, определяется выражением вида: ∞
f (r ′) = 2π ∫ g (ρ )J 0 (2πr ′ρ )ρdρ .
(6.26)
0
Следовательно, для функций, обладающих осевой симметрией, различие между действиями прямого и обратного преобразования Фурье отсутствует, т.е. преобразование Ганкеля обладает свойством симметрии. Из определения преобразования Фурье вытекает ряд математических следствий, облегчающих нахождение фурье-образа (иначе спектра Фурье или частотного
спектра).
Эти
следствия
принято
формулировать
в
виде
математических теорем. 1. Теорема линейности
F [αf ( x, y ) + β F ( x, y )] = αF [ f ( x, y )] + βF [F ( x, y )]. 2. Теорема подобия
(
)
Если F [ f ( x, y )] = g N x , N y , то F [ f (ax, by )] =
1 ab
⎛ N Ny ⎞ ⎟⎟ . g ⎜⎜ x , a b ⎠ ⎝
Отсюда следует, что "растяжение" координат в пространственной области
( x, y )
приводит к "сжатию" координат в области частот
(N x , N y )
и к
изменению общей амплитуды спектра. 3. Теорема смещения
(
)
Если F [ f ( x, y )] = g N x , N y , то
[
]
F [ f ( x − a, y − b )] = g (N x , N y )exp − i 2π(N x a + N y b ) . т.е. смещение функции в пространственной области вызывает линейный фазовый сдвиг в области частот. 4. Теорема Парсеваля
(
)
Если F [ f ( x, y )] = g N x , N y , то ∞
f ( x, y ) dxdy = 2
∫∫
−∞
∞
∫∫
g (N x , N y ) dN x dN y . 2
−∞
Теорему Парсеваля обычно интерпретируют как закон сохранения. 5. Теорема свёртки
(
)
(
)
Если F [ f ( x, y )] = g N x , N y , а F [F ( x, y )] = G N x , N y , то
⎤ ⎡∞ F ⎢ ∫ ∫ f (ξ, η)F ( x − ξ, y − η)dξdη⎥ = g (N x , N y )G (N x , N y ). ⎦ ⎣−∞ Доказательство
⎡∞ ⎤ F ⎢ ∫ ∫ f (ξ, η)F ( x − ξ, y − η)dξdη⎥ = ⎣−∞ ⎦ ∞
⎡∞ ⎤ = ∫ ∫ ⎢ ∫ ∫ f (ξ, η)F ( x − ξ, y − η)dξdη⎥ exp − i 2π(N x x + N y y ) dxdy = ⎦ −∞ ⎣−∞ =
∞
∫∫
−∞
[
]
⎧∞ ⎫ f (ξ, η)⎨ ∫ ∫ F ( x − ξ, y − η) exp − i 2π(N x x + N y y ) dxdy ⎬dξdη . ⎩−∞ ⎭
[
]
Введём новые переменные q = x − ξ и p = y − η . При этом
[
]
[
] [
]
exp − i 2π(N x x + N y y ) = exp − i 2π(N x ξ + N y η) exp − i 2π(N x q + N y p ) .
Тогда
F [ f ( x, y ) ⊗ F ( x, y )] = =
∞
∫ ∫ f (ξ, η)exp [− i 2π(N x ξ + N y η)]dξdη ×
−∞
×
∞
∫ ∫ F (q, p ) exp [− i 2π(N x q + N y p )]dqdp = g (N x , N y )G (N x , N y ),
−∞
т.е. преобразование Фурье свёртки двух функций полностью эквивалентно более простой операции умножения их образов. Теорема свёртки известна как теорема Бореля. 6. Теорема автокорреляции
(
)
Если F [ f ( x, y )] = g N x , N y , то
⎡∞ ⎤ 2 F ⎢ ∫ ∫ f (ξ, η) f * ( x − ξ, y − η)dξdη⎥ = g (N x , N y ) . ⎣−∞ ⎦ Эту теорему можно рассматривать как частный случай теоремы свёртки. 7. Интегральная теорема Фурье Во всех точках, где функция f ( x, y ) непрерывна,
FF -1 [ f ( x, y )] = F -1F [ f ( x, y )] = f ( x, y ) , т.е. в результате последовательного выполнения прямого и обратного преобразования Фурье некоторой функции f ( x, y ) получается преобразуемая функция за исключением точек разрыва. В каждой точке разрыва функции два последовательных преобразования её дают среднее значение величины f ( x, y ) в окрестности этой точки. Теоремы
преобразования
Фурье
определяют
основные
правила
выполнения преобразований и могут существенно упростить решение задач, связанных с использованием анализа Фурье. В соответствии с теоремой свёртки преобразование Фурье распределения освещённости E ( x′, y′) , определяемого формулой (6.13), равно произведению преобразований
Фурье
ФРТ
D(ξ′, η′) и распределения освещённости
E0 ( x0′ , y0′ ) в идеализированном изображении предмета: e(N x , N y ) = d (N x , N y )e0 (N x , N y ).
(6.27)
Формула (6.27) определяет механизм образования изображения: каждой составляющей
пространственного
спектра
e0 (N x , N y )
распределения
освещённости при идеализированном изображении предмета соответствует
коэффициент d (N x , N y ) , который можно назвать "множителем передачи" или "множителем контраста" оптической системы. Таким образом, функция
d (N x , N y ) , характеризующая состояние коррекции аберраций в изображении,
образованном оптической системой, по сути дела выполняет роль фильтра пространственных частот.
Функция d (N x , N y ) , определяющая то, каким образом каждая частотная
составляющая
передаётся
оптической
системой
с
учётом
дифракции,
остаточных аберраций и ошибок изготовления оптической системы, называется оптической передаточной функцией (ОПФ) системы. ОПФ, являющаяся преобразованием Фурье ФРТ, представляет собой в общем
случае
комплексную
функцию,
которую
можно
записать
в
показательной форме через модуль комплексной функции T ( N ) и аргумент ϕ( N ) :
d (N x , N y ) =
∞
∫ ∫ D(x′, y′)exp[− i 2π(N x x′ + N y y′)]dx′dy′ =
−∞
[
]
= T (N x , N y )exp − iϕ(N x , N y ) .
(6.28)
В случае одномерного распределения освещённости в идеализированном изображении предмета (этот случай чаще всего встречается при измерении ОПФ, когда предмет представляет собой решётку из параллельных штрихов, узкую
щель
и
т.п.)
ОПФ
становится
функцией
одного
аргумента –
пространственной частоты N , например, вдоль оси x′
d (N ) =
∞
∫ Dл ( x′)exp[− i 2πNx′]dx′ .
−∞
Используя формулу Эйлера, получаем
d (N ) =
∞
∞
−∞
−∞
∫ Dл (x′)cos 2πNx′dx′ − i ∫ Dл (x′)sin 2πNx′dx′ =
= C ( N ) − iS ( N ), где
интегралы,
обозначенные
через
C
и
(6.29)
S , называются косинус-
преобразованием и синус-преобразованием функции рассеяния линии. Модуль комплексной функции по определению равен
T (N ) =
[C (N )] 2 + [S (N )] 2 = 2
2
(6.30)
⎤ ⎡∞ ⎤ ⎡∞ = ⎢ ∫ Dл ( x′) cos 2πNx′dx′⎥ + ⎢ ∫ Dл ( x′)sin 2πNx′dx′⎥ , ⎦ ⎣ −∞ ⎦ ⎣ −∞ а аргумент ϕ( N ) может быть определён из соотношений:
sin ϕ( N ) =
S (N ) , T (N )
(6.31)
cos ϕ( N ) =
C (N ) . T (N )
(6.32)
Для лучшего понимания смысла модуля T ( N ) и аргумента ϕ( N ) комплексной ОПФ рассмотрим более подробно, как изображается отдельная частотная составляющая спектра идеализированного изображения предмета оптической системой, имеющей известную функцию рассеяния. Пусть распределение освещённости в идеализированном изображении предмета (или в его частотной составляющей) определяется косинусоидой с постоянной составляющей E0 , как показано на рис.6.4а, при этом
E0 ( x′) = E0 + E1 cos 2πNx′ ,
(6.33)
1 где N – пространственная частота, заметим, что период ~ p= .
N
Пусть Dл (ξ′) – функция рассеяния линии. Тогда ∞
∞ ⎡ E ( x′) = ∫ Dл (ξ′) E0 ( x′ − ξ′)dξ′ = E0 + E1 ⎢cos 2πNx′ ∫ Dл (ξ′) cos 2πNξ′dξ′ + ⎣ −∞ −∞ ∞ ⎤ + sin 2πNx′ ∫ Dл (ξ′)sin 2πNξ′dξ′⎥ = E0 + E1[C ( N ) cos 2πNx′ + ⎦ −∞ + S ( N )sin 2πNx′] = E0 + E1T ( N )[cos ϕ( N ) cos 2πNx′ + sin ϕ( N )sin 2πNx′].
В результате получаем, что
E ( x′) = E0 + E1T ( N ) cos[2πNx′ − ϕ( N )] .
(6.34)
E0 ( x ′ )
a) E1
E0
0 1 ~ p= N
E ( x′)
E1T ( N )
б)
E0
0
∆x′
Рис.6.4. Распределение освещённости в идеализированном
б ) изображениях
Отсюда
следует,
что
полученное
a ) и действительном
распределение
освещённости
в
изображении предмета при косинусоидальном распределении освещённости в его идеализированном изображении остаётся косинусоидальным и той же пространственной частоты. Однако, модуляция, равная отношению амплитуды переменной составляющей распределения освещённости к среднему её значению (т.е. к постоянной составляющей) для полученного распределения освещённости сказывается меньше, чем для исходного, как показано на рис.6.4б. Действительно, для идеализированного изображения имеем
E1 , E0
m=
(6.35)
а при действительном распределении освещённости величина
m′ =
E1 T (N ) , E0
т.е. T ( N ) =
(6.36)
m′ . m
(6.37)
Таким образом, значение модуля ОПФ, т.е. значение T ( N ) , для каждой пространственной частоты равно отношению модуляции распределения освещённости в действительном изображении к модуляции распределения освещённости в идеализированном изображении гармонической составляющей соответствующей частоты и называется коэффициентом передачи модуляции (КПМ)
системы.
Совокупность
значений
КПМ
для
различных
пространственных частот составляет функцию передачи модуляции (ФПМ) или частотно-контрастную характеристику оптической системы. Распределение освещённости в действительном изображении отличается от распределения освещённости в идеализированном изображении ещё и сдвигом косинусоиды на угол ϕ( N ) , определяющим линейное смещение косинусоиды на расстояние ∆x′ =
ϕ( N ) . Совокупность значений сдвига 2πN
(смещения) фазы ϕ( N ) для различных пространственных частот составляет функцию передачи фазы (ФПФ) системы. Как следует из выражений (6.29)– (6.32), если N = 0 , то T (0 ) = 1, а ϕ(0 ) = 0 . Определим контраст идеализированного изображения выражением
k=
E0 ( x′)max − E0 ( x′)min . E0 ( x′)max + E0 ( x′)min
Но E0 ( x′)max = E0 + E1 , а E0 ( x′)min = E0 − E1 . Тогда
k=
E0 + E1 − E0 + E1 E1 = = m. E0 + E1 + E0 − E1 E0
(6.38)
При этом контраст действительного изображения равен
k′ = =
E ( x′)max − E ( x′)min = E ( x′)max + E ( x′)min
E0 + E1T ( N ) − E0 + E1T ( N ) E1 = T ( N ) = mT ( N ) = m′. E0 + E1T ( N ) + E0 − E1T ( N ) E0
Отсюда следует, что
T (N ) =
k ′ m′ = . k m
При k = 1 , т.е. при E1 = E0 , T ( N ) = k ′ = m′ . Итак,
нормированное
распределение
освещённости
в
изображении
точечного предмета, образованном оптической системой, называется функцией рассеяния точки (ФРТ). Другими названиями этой же характеристики являются следующие:
выходной
сигнал
импульсного
типа,
функция
Грина,
дифракционная картина Фраунгофера. ФРТ является одной из двух наиболее полных характеристик, описывающих качество изображения, образованного оптической системой. Распределение освещённости E ( x′, y′) в изображении любого предмета в принципе можно рассчитать как свёрстку распределения освещённости в идеализированном изображении предмета, т.е. E0 ( x′, y′) , и ФРТ. Практически же для любого реального предмета, распределение освещенности, в идеализированном изображении которого непрерывно, подобный расчёт является довольно сложной процедурой. В то же время одиночные светящиеся точки или совокупность таких дискретных точек часто являются предметами для оптических систем, применяемых в астрономии, что придаёт ФРТ не только теоретическое значение, но и определённый практический смысл. Второй из двух наиболее полных характеристик качества изображения является комплексная оптическая передаточная функция (ОПФ), удобная для характеристики качества изображения при непрерывном распределении освещённости в нём. Математически ФРТ и ОПФ взаимозаменяемы, так как каждая из них может быть получены путём Фурье-преобразования другой.
Применение ОПФ удобно потому, что, во-первых, процессы Фурьепреобразования функции E0 ( x′, y′) , умножения её на ОПФ и обратного Фурьепреобразования результата для получения функции E ( x′, y′) выполнить проще, чем эквивалентную математическую процедуру свёртки; во-вторых, ОПФ для ряда независимых факторов, ухудшающих качество изображения, могут быть объединены простым их перемножением, в результате чего получается полная ОПФ изображающей системы. 6.2.
Структура
изображения
оптической системой
точечного
предмета,
образованного