ИЗВЕСТИЯ АКАДЕМИИ НАУК СССР. 1937 BULLETIN DE L'ACADEMIE DES SCIENCES DE L4JRSS Classe des sciences mathematiques et naturellea
Отделение математических и естественных наук
А. К. МИТРОПОЛЬСКИЙ
ОБ УСТАНОВЛЕНИИ КОРРЕЛЯЦИОННЫХ УРАВНЕНИИ ПО СПО СОБУ ЧЕБЫШЕВА [Представлено академиком С. Н. Бернштейном) В этой статье устанавливается общий вид корреляционных уравнений как непосредственный результат применения способа Чебышева. Для упрощения вычислений использованы определители; коэффициенты корреляционных уравнений выражены при помощи основных моментов. 1. Положим, что корреляционное уравнение, выражающее мость статистической величины Х2 от Хъ имеет вид:
зависи
h
где £io\). есть нормированное значение статистической величины Х 1 ? а Г(^)/1 — условный основной момент статистической величины Х2. Пусть в уравнений (1) функции cpg (£x) 1) являются ортогональными функциями от £1? т. е. удовлетворяют условиям
4ь
( = ° > е с л и / =£ s }
ZPhl-b(Zi(h))
\
ф 0
если/^g \
(2)
2) связаны с предшествующими им функциями равенством *-i
9*(*io\))= УЬ — 2 ?*' Ф & о\))
(S = О, А),
(3)
тде gr gj /—некоторые постоянные коэффициенты, причем
2. Определим функции Cf)g(Si) и коэффициенты уравнения (1), пользуясь символами Чебышева:
(4)
cg корреляционного
hi
(/,g)=2^/- E b l ).9/(Si(i 1 )). 3i = l
(5)
126
А. К. МИТРОПОЛЬСКИЙ
При этом заметим, что, принимая во внимание (3) и условия орто гональности (2), мы можем написать: 2 Phi- lb (SlO'x))]2 - 2
Pj
>!' { **<'*> — 2 **> f ^ &(h))} ?* ( ' 1 ( ^
=
ft,
= 2 P^l • **<**> Ф* (Sl( ^ ))
= (
(6)
^' ^
3i=l
Введенные условия (2) и (3) дают возможность найти функции ? e (£i). Умножая (3) последовательно на Phi- ?o(Sio\)), Рь/. фИ^оо), ... , Pjj.qv-i^itfx)) и суммируя повеем значениям Д — 1, А:1? определим коэффициенты #gj, Подставляя значения этих коэффициентов в (3), находим
9.(6i) = ^ - - ^ ? . ( S i ) - - { j f | f 9 i ( S i ) - - | S ^ - 9 o ( E i ) ,
3. Коэффициенты cg корреляционного уравнения (1) определяются при условии, что сумма ft,
h
zn = 2 p 3l/ . { ^ - 2 c *
{8
>
будет минимумом. Это условие дает систему h -f- 1 уравнений, которые получаются, если приравнять нулю первые производные выражения (8) по с/, где / = 0,А. Имеем: fti
=
—Т £ '
2 Pi»/- 9/ (£10\)) { г((й/1 — 2 с« Ф* (6l<Ji))} = ° ?W
g=o
или ftl
r
2 P h i - l u m Ф/ (Sio-i)) = 2 Р и - ?/ ^ Sl ^>)2 с *Ф* (Sl o'i)) Ji=l
3i = l
g= 0
(/ = °> h) ( 9 )
ОБ УСТАНОВЛЕНИИ КОРРЕЛЯЦИОННЫХ УРАВНЕНИЙ
127
При введенных условиях ортогональности (2) система /г + 1 уравне ний (9) примет вид hi
-К
r
•
=с
2 fti/- $w **<-*«>>) * 2 ?'*'• [ ?*
(Sl(
b>)]2
(г = °- л )-
(10)
И следовательно, искомые коэффициенты оказываются отделенными и мо гут быть вычислены по формуле
2 X/*^>/i * M W cg = i^r
(g = О, Л). 2^/-[^(CiO-i)
(11)
) ] 12 8
Применяя последовательно эту формулу, находим: С
° ~~ (0, 0) > г1Д-с0.(0,.1) • 1
(1,1) г 2 / 1 - - с , - (0, 2 ) - C l . ( l , 2 ) 2 ~~ (2,2) ' г з д - с 0 . ( 0 , 3 ) - C l . ( l , 3 ) - c 2 - (2,3)
Сз
С
~
? (12)
(з, з)
— ^g/l ~ С 0 - < 0 ' g ) — С 1 ' t 1 » g ) — °2- (2> g ) — * ~ ~ (g,g)
— g g - J g — I , gf) ~
4. Наконец, при тех же самых условиях ортогональности (2), вели чина критерия tn корреляционного уравнения h-vo порядка, представ ляющая минимум суммы (8), равна kx
h
ч ь = 2 ри- ^ {'"ей/!—2 с * Ф« (Ею\))} = = 2 ^/'
г
Г( 2/1 —
^
2 °ё 2 ft"i/' ^ / i 9* (SKii>)
или
{.2^/-r(^)/i^(§i(ix))}a ^/i = 4 h - i — ^ 2 P i i / - ^ i / i f ^ K h ) )
= S/I-L—
Jl
~~(Л7А)
(13)
J'=I
с основной ошибкой
ъ=|/"*-
(14)
Так как в выражении (13) из'цл-i вычитается существенно положи тельная величина, то всегда имеет место неравенство: lh
(15)
128
А. К.
МИТРОПОЛЬСКИЙ
Таким образом с повышением порядка корреляционного уравнения степень приближения его к графику зависимости статистической вели чины Х2 от Хг возрастает. И следовательно, критерий ^ , взятый вместе с его основной ошибкой, позволяет очень просто оценить достоинство корреляционного уравнения Л-го порядка. 5. При вычислении корреляционных уравнений наиболее удобно пользоваться определителями, выражая коэффициенты корреляционных уравнений при помощи основных моментов. В рассматриваемом случае корреляционных уравнений, когда взяты нормированные значения статистических величин, символы Чебышева (5) могут быть представлены при помощи основных моментов следующим образом: Г Г
3/0
3/0
'//о
4/0
Г
'g+i/o
/4-1/0
r
g+2/0
(16)
(7, g) = ''/-i/o
r
3/0
r
//o
3/0
'4/0
r
/+i/o
f/0
r
'2/-2/0
r
/-l/0
/+J/0
В частности (0,g) = {i,g-l)
I1 0 (2,g)=
rgl0
0 1 Г
I 1 1
r
g+2f0
0
1 1
1
Г
(18)
rg+1/0
3/0
0
(17)
= relo,
3/0
Г
'g/o
3/0
r
4/0
r
g+ljQ
g+2/0
(19)
(3,g) =
1
0
0
1
'3/0
1
r,3/0
'4/0
и так далее. 6. Введем теперь обозначения:
D<*>:
1 0 1
0 1
1
f/i-1/О
7*Л/0
7*3/0
7*/i/0
^Л-f-l/O
7*3/0
7*4/0
r
7*^+2/0
7*/i/0
T'/i-j-l/O
fh+2/0
h+lj0
' • • /"2/1 — 1/0
7*2/1/0
(20)
OB УСТАНОВЛЕНИЙ КОРРЕЛЯЦИОННЫХ УРАВНЕНИЙ
D^ =
1 0 1
ВГ =
гн/о 1 0 1
0 1
1
•
Oi-i/o
0
7"3/0
•
rhIQ
r
^3/0
^4/0
• ••
^h+1/0
0 1 7*3/0
^/г+2/0 • • •
1
r
h+ll0
r
2h-l/0
129
i/i
7*2/1
(21)
*hl
• • ^-1/0
1
7*3/0
• • rh/0
Si
7*4/0
- • • ^Л+1/О
6i
(22)
^Vf-l/O Ol+2/O • • • Г2Н-1/0 Й и заметим, что минор определителя (22), соответствующий элементу &J, равен 1 0 1 . . . rft_1/0 0 1 г3/о •. . rhl0 ^(ft-1)=l l r3/0 г4/0 . . . rft+1/0 | (23) Oi/O
Oi-l/O
fhlO
O i + l / O • • • 7*2^-2/0
Тогда, рассматривая выражения (7), находим
i i
9i(Si) = -
l
1
1
0
о
l
1
Га 3/0
92(£i)
1 0
«i 2>(D
0 1
1
0
1
1
0
1
г
^i
1
Г
3/0
Г
Г
Г
4/0
Г
3/0
C?3 ( У =
з/о
4/0 ^1
1 0
1
0
*
r
3/0
1
Г
Г
4/0
3/0
g/o
(24)
о
1
... 1
i
г
з/о
• • • ^i
r
4/0
• • • ^1
Г
r
П
5/0
r
3/0 r
*+i/o
g+2/o • • • €i•8
<M*i):
'g-1/0 'з/0 3/0
r
g-l/0
ИМЕН, Серия, математич., № 1
r
g/0
r
g/o
'4/0
r
g + l / 0 • • • r 2g-2/0
130
А. К. МИТРОПОЛЬСКИЙ
7. Определим далее величину (g, g). Заменяя в выражении (6) ф^^) на основании (24), имеем: kl
hl
о?)*
2
2 Phh [<Р« (Sio-x))] = 2 ftx/- Йо\) 4 Ь п • Умножая каждый член g-ro столбца определителя D^ и суммируя по всем значениям ]\ = 1, /с ь получим: (fiS g) = 2 Л,/. [ф, (Sio-,))]2 - - ^ S ) .
на pjlf. S?^)
(25)
Из равенства (25), левая часть которого есть величина существенно положительная, следует, что определители D^) и ZKs-1) имеют одинако вый знак. Поэтому, давая g убывающие значения, найдем, что все опре делители £)(*), Z>(s-D, Z)^-2), . . . , D&\ D^\ Z><°> будут иметь одинаковый знак. Но /)(0) == Го/0 -
1 > 0.
Отсюда мы заключаем, что все определители ZX°>, 7)0), . . . , /)(«> являются положительными: /)(*)> 0 ( g - Г Т ) . (26) 8. Выразим также при помощи определителей коэффициенты cg. Рассматривая выражения (12), находим: Г
Сп
=
0/1 __. 1_0_ ___
Q
д(о> Г
0/1
r
i/i
1 0 0 1 1 0 0 1 1
Г
3/0
Г
0/1
r
i/i
Г
2/1
1 0 0 1 1 г3/0 1 0 1 Со • =
1 гз/о
Д(2)
(27)
'3/0 Г
4/0
0 1
1
Г
0/1
Г
3/0
г
1/1
Г
3/0
Г
4/0
Г
2/1
Г
4,0
Г
Г
3/1 1
5/0
1 0 1
0 1
1
Г
3/0
Г
Г
4/0
Г
3/0
Г
Г
Г
4/0
Г
3/0
3/0 4/0
5/0
Г
Г
5/0
6/0 1
°1 Д(3)
ОБ УСТАНОВЛЕНИИ КОРРЕЛЯЦИОННЫХ
1 1 0 1
0 1
1 г3/0
Г
Г
3/0
1 rg 0 r g+l/0 Са
=
1 0
0
1
Г
Я10
' ' '1/1 ' * Г 2/1
r
g+2/0 • ' • Г*М
1 г3/0
Г
3/0
Г
Г
£+1/0
Г
131
• • ro/i
.
4/0
1
УРАВНЕНИЙ
D(g)
* */о . . • rg+W
4/0
(27)
. *f
г
•
r
'
g+2!0
r £ + 2 / 0 • • • 2g!Q
J
Подставляя найденные выражения cg и yg (£x) в (1), мы можем кор реляционное уравнение й-го порядка представить в виде: Г
0"х)М
2и
^D(g-DD(g)
(28)
'
Этот общий вид корреляционного уравнения совпадает с формулой, полученной Нейманом иным путем. 9. Представим, наконец, при помощи определителей критерий L^. Рассмотрим выражение (13). Принимая во внимание (24), получаем К 2Р^/- Г 8?)/1ФЛ(£Ю-1)) :
(29)
/>(A-D *
*i=i
Кроме того, на основании (25), имеем: (30)
Следовательно, ^ ) 2
&< s/i-i — D: (h-i)D(h)
(31)
'
Постепенно повышая порядок корреляционного уравнения (28), начи ная с А = 1 , и оценивая результат при помощи критерия (31) с его основной ошибкой (14), мы можем выразить зависимость статистической величины Х2 от Х1 с достаточной точностью, определяемой величиной ^ . Собирая в (28) члены с одинаковыми степенями ^ и замечая, что 1 ug —
0
1
. . . г^_1/0
0
rg+1j0
. . . г л/0
0
1
Г
3/0
• • • rg/Q
Г1/1
7>+2/0
• - . 7*7i+l/0
1
7*3/0
>*4/0
• • • Tg+1/O
7*2/1
ТУьЗ/0
• • • J7i+2/0
f/i/0
f/i+1/0
Oi+2/O
fh/l
fh+g+l/O
• • • 7*2/i/0
• • • fh+g-l/O
(32)
мы можем представить корреляционное уравнение А-го порядка в виде «-0
U
Кз, )•
(33) 9*
А. К. МИТРОПОЛЬСКИЙ
132
10. В заключение рассмотрим множественное корреляционное урав нение, выражающее зависимость статистической величины Хг от ста тистических величин Х2,
Х 3 , . . . , Х]\[,
Положим, что это уравнение является линейным и имеет вид: N
(34) g=2
где функции ф ( у удовлетворяют условиям ортогональности
(35)
8-1
и связаны с предшествующими им функциями <№ = £*-2 **./*&),равенством
(36)
причем коэффициенты аё определяются при условии, что сумма fe2
&3
3*2 = 1 З з ^ !
k.V
^
£=2
3"у=1
будет минимумом. При этих условиях, применяя метод, изложенный выше, находим: R(g)
-2L
л
где й<*> -
В(*)* =
(
(38) (39)
(г-1) '
• rlg
1
г12
ГхЗ
Г21
1
^23
Гц
Гу2
1
r
gi
'"«г
/у,
.
£i
£2
£з
•
»-21
1
>*23
• • •
^З!
^ЗЗ
1
rgl
7g2
rgi
•
•
r2g
•
rsg
.
1
.. s g r
2g
• • r3g .
(40)
(41)
1
a E ^ и R%£ являются минорами определителей В ^ и В<*>% соответ-ствующими элементу гтп.
ОБ УСТАНОВЛЕНИИ КОРРЕЛЯЦИОННЫХ УРАВНЕНИЙ
133
Подставляя найденные выражения ag и ф (?#) в (34), мы можем мно жественное линейное корреляционное уравнение написать в виде: Д. r
mh) ia.) /... / aN) - Z g=2
R(g) R(g)*
_(*-!> o(g) • /ill
11
^'
11
Лесо-Техническая Академия. Ленинград. ЛИТЕРАТУРА К § 1 М а р к о в А. А., Исчисление вероятностей ( M a r k o f f A. A., The calculus of pro babilities), 4 изд., Ленинград 1924, стр. 427—437. R o m a n o v s k y V., Note on orthogonalising series of functions and interpolation, Biometrika, Vol. XIX, 1927, pp. 93—97. R o m a n o v s k y V., Sulle regressioni multiple, Giornale dell'Istituto Italiano degli Attuari, Anno II, n. 2, 1931. P e a r s o n K., On a general method of determining the successive terms in a skew re gression line, Biometrika, vol. XIII, 1921, pp. 296—300. A n d e r s o n W., Researches into the theory of regression, Lund 1932, pp. 7—19. W i c k s e l l S. D., Analytical theory of regression, Lund 1934, pp. 14—17. К §2 Ч е б ы ш е в П. Л., О непрерывных дробях ( T c h e b y c h e f f P. L., Sur les frac tions continues) 1855, «Сочинения П. Л. Чебышева, изданные под ред. А. А. Мар кова и Н. Я. Сонина» («Oeuvres de P. L. Tchebycheff»), т. I, СПБ 1899, стр. 203—230. Ч е б ы ш е в П. Л., Об интерполировании по методу наименьших квадратов ( T c h e b y c h e f f P. L., Sur Interpolation par la methode des moindres carres), 1859. «Сочинения П. Л. Чебышева», т. I, СПБ 1899, стр. 473—498. К §7 S t i e l t j e s Th., Recherches sur les fractions continues, 1894. Ch. II. «Oeuvres com pletes de Th. J. Stieltjes». Tome II. Groningen 1918, pp. 419—430. C a s t e l n u o v o G., Calcolo delle probability. Vol. II, 2 ed., Bologna 1928, p. 160. Б е р н ш т е й н С. Н., Теория вероятностей ( B e r n s t e i n S. N., The theory of probabilities), 2 изд., Москва 1934, стр. 307. К §8 N е у m a n J., Further notes on non-linear regression, Biometrika, Vol. XVIII, 1926, pp. 257—262. D i e u l e f a i t С. Е., Contribution a Г etude de la theorie de la correlation, Bio metrika, Vol. XXVI, 1934, pp. 379—403. D i e u l e f a i t C.E., Theorie de la correlation, Rosario 1935, pp. 31—47. К §9 М и т р о п о л ь с к и й А. К., О корреляционных уравнениях ( M i t r o p o l s k y А. К., On correlation equations). Напечатано в книге: Богословский С. А. и Зи новьев В. П., Статистический метод учета лесных ресурсов, Ленинград 1932, стр. 114—119.
A. MITROPOLSKY
134
A. MITROPOLSKY. ON ESTABLISHING THE CORRELATION BY TCHEBYCHEFF'S METHOD
EQUATIONS
SUMMARY
1. The general form of the correlation equations is established in this paper as an immediate result of the application of the Tchebycheff's method. The correlation equation expressing a dependence of statistical varia ble X2 upon Xx has the following general form h r
O\)/l
DfDf*
where r\il)n is the conditional standard moment of statistical variable X2 on the assumption t h a t the statistical variable Хл takes the value Xi(jx), and the determinants
Df, are given by (20)—(23). This general form of correlation equation coincides with the formula obtained by Neyman otherwise. 2. Establishing the general form of correlation equation the standard values Sx(Ji) of statistical variable X± are taken, and the coefficients of correla tion equation are expressed by determinants composed of standard moments. Owing to this the brief formulae are received which are convenient for computations. In particular, the Tchebycheff's symbols assume a very simple form as follows
(A 8) =
3. By means of the Tchebycheff's method the general form of mul tiple linear correlation equation is also established: r
i/oi)/(i.)/ •-. / g=2nll
л
11
in which ^i/o a )/(j,)/.../o» is the conditional standard moment of statis tical variable Xx on the assumption that the statistical variables X& X 3 , . . . , XJV takes the values L X 20*2)? > XN(j^) 3(j8b and the determinants B<*>, R№* (40)-(41).
and their co-factors
are given
by