講座 情報 をよむ統 計字1
統計学の基礎 上 田 尚一 著
朝倉書店
講座 〈情 報 を よむ統計 学〉 刊 行の辞
情 報 の 流 通 ル ー トが 多様 化 し,ア
情報 化 社会 への 対応
な りま し た.誰...
56 downloads
635 Views
30MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
講座 情報 をよむ統 計字1
統計学の基礎 上 田 尚一 著
朝倉書店
講座 〈情 報 を よむ統計 学〉 刊 行の辞
情 報 の 流 通 ル ー トが 多様 化 し,ア
情報 化 社会 への 対応
な りま し た.誰
な っ た … こ の こ と は歓 迎 して よい で し ょ う.た 情 報 か ら玉 を選 び,そ は,玉
ク セ ス しや す く
もが 簡 単 に 情 報 を利 用 で き る よ うに だ し,玉 石 混 交 状 態 の
の 意 味 を正 し く よみ と る 能 力 が 必 要 で す.現
と石 を 識 別 せ ず に 誤 用 し て い る,あ
る い は,意
実に
図 を カム フ ラー
ジ ュ し た 情 報 に 誘 導 さ れ る結 果 に な っ て い る … そ う い うお そ れ が あ る よ うで す. 特 に,数
字 で 表 わ され た 情 報 に つ い て は,数
値 で 表 現 され て い る と い
うだ け で,正 確 な情 報 だ と思 い 込 ん で し ま う人 が み られ る よ うで す ね. ど う い う観 点 で,ど
情 報 の よみか き 能 力が 必要
え ず に,結
ん な方 法 で 計 測 した の か を考
果 と し て 数 字 に な っ た 部 分 だ け をみ て い
る と,「 簡 単 に ア ク セ ス で き る 」こ とか ら 「簡 単 に 使 え る 」 と勘 違 い し て,イ
ー ジ ィ に考 え て し ま う … こ う い う危 険 な側 面 が あ る こ と に 注 意
し ま し ょ う. 数 値 を求 め る 手 続 き を考 え る と,「 た ま た ま そ う な っ た の だ 」 と い う 以 上 に ふ み こ ん だ 言 い 方 は で き な い こ と が あ り ま す.ま 正 し い と して も,そ
た,そ
の数字 が
の 数 字 が 「一 般 化 で き る傾 向 性 と解 釈 で き る 場 合 」
と,「 調 査 した そ の ケ ー ス に 関 す る こ と だ と い う以 上 に は 一 般 化 で き な い場 合 」 と を,識 別 し な け れ ば な ら な い の で す .
その基礎 をなす 統計 学
こ う い う 「情 報 の よ み か き能 力 」 を もつ こ とが 必 要 で す.ま
た,情
報 の う ち 数 値 部 分 を 扱 う に は,
「統 計 的 な 見 方 」 と 「そ れ に 立 脚 した 統 計 手 法 」 を学 ぶ こ とが 必 要 で す. こ の 講 座 は,こ
う い う観 点 で 統 計 学 を学 ん で い た だ く こ と を期 待 して
ま とめ た もの で す. 当 面 す る問 題 分 野 に よ っ て,扱 うデ ー タ も,必 要 と さ れ る 手 法 も ち が い ます か ら,そ の こ と を考 慮 に 入 れ る … しか し,で き るだ け 広 く,体 系づ け て 説 明 す る … こ の 相 反 す る条 件 を み た す た め に,い 冊 に わ け て い ま す.
くつ か の 分
ま え が き
この テ キ ス ト の主題
統 計 学 で は,た
くさ ん の観 察 対 象 に つ い て 観 察 し た結 果 の
数 字 を 1セ ッ トの 情 報 と して 扱 い ま す か ら,普 通 の 数 字 の 扱
い と ちが い ま す. 観 察 対 象 を い くつ か の 区 分 に わ け て各 区 分 の 情 報 を 比較 し ます.そ 区 分 の 情 報 を 1つ の 平 均 値 に 表 わ す と比較 しや す くな ります が,必
れ ぞれ の
ず しもそれ
で十 分 とは い え ませ ん.観 察 単位 ひ とつ ひ とつ が そ れ ぞ れ個 性 を も って い ま す か ら,平 均 値 だ け に 注 目す るの で は な く,傾 向 性 で は 表 わせ な い個 性 に も 目 を む け る こ とが 必 要 です.し
た が って,「 平 均 値 」の 比 較 だ け で な く,「 ひ ろが り
幅 」を表 わす 標 準 偏 差 を比 較 した り,「 デ ー タ の分 布 」を比 較 す る こ とが 必 要 と な る の で す. こ の テ キ ス トで は,こ このテキス ト の構成
れ らの 比 較 に 関 す る基 礎 的 な 手 法 を説 明 し ます.
第 1章 で,1 セ ッ トの 情 報 の 特 徴 を 1つ の 指 標 で 代 表 す る ため に平 均 値 を,ま た,そ の 代 表値 か らの へ だ た りを 測 る た
め に標 準 偏 差 を使 うこ と を説 明 した後,第 表 現 方 法 と して1970年
2章,第
3章 で,こ
れ に か わ る情 報
代 に新 し く提 唱 され た 5数 要 約 や ボ ッ ク ス プ ロ ッ トが
有 効 で あ る こ と を解 説 して い ます. 「平 均 値 を比 較 す る」場 合,観
察 単 位 を適 当 に 区 分 け す る と,そ れ ぞ れ の 区
分 の 情 報 を平 均 値 で 代 表 させ て よ い状 態 に な り ます.第
4章 で は,「 区 分 け し
て比 較 す る」手 法 に 関 して,分 散 や 決 定 係 数 を使 っ て そ の有 効 性 を評 価 で き る こ と,し た が っ て,区 分 間 の 差 と して 「情 報 の 中 か ら傾 向 性 を見 出 す 」ため の 分 析 手 法 と して 使 え る こ と を 説 明 し ま す.ま
た,あ
る 前 提 をみ た し て い る な
ら,見 出 さ れ た 「傾 向 性 」が 誤 差 の 範 囲 を こ え て い る こ とを検 定 す る手 法 が 使 え るこ と を説 明 します(第 5章). こ れ らの 方 法 を適 用 す る場 合,た
とえ ば 「比 較 す る 区分 の 構 成 の ち が い に よ
る影 響 」が 比 較 を乱 して い る場 合 が あ りま す.第
6章 で は,そ
うい う影 響 を補
正 し,比 較 で き る平 均 値 を誘 導 す る方 法 を説 明 します. 第 7章 で は,「 各 セ ッ トの 情 報 を表 わす 分 布 形 」そ の もの を比 較 す る方 法 を 解 説 し ます.形
の 比 較 を考 え る こ とか ら くる 扱 い に く さが あ り,一 般 に は 取 り
上 げ られ て い な い 問 題 点 が あ り ます が,情 報 の 比 較 とい う意 味 で は適 用 範 囲 の 広 い手 法 で す. この テ キ ス ト の説 明方法 す が,そ
この テ キ ス トで は,実 際 の 問 題 解 決 に 直 結 す る よ うに,適 当 な実 例 を取 り上 げ て 説 明 して い ます.数 理 を解 説 す る の で
の 数 理 が なぜ 必 要 と な る の か,そ
う し て,数 理 で ど こ ま で対 応 で き,
ど こに 限界 が あ るの か … そ こ を は っ き りさせ る ため に 選 ん だ 実例 です. 実 際 の 問 題 を扱 い ます か ら,コ ン ピュー タ を使 うこ と を前 提 と して い ます. 学 習 を助 け る ソフ ト
この シ リー ズ で は,そ の よ うな 学 習 を助 け る た め に,第 巻 『統 計 ソ フ ト UEDA
9
の 使 い方 』に デ ー タ解 析 学 習 用 と して
筆 者 が 開発 した統 計 ソ フ トUEDA(Windows版CD-ROM)を
添 付 し,そ の解
説 を用 意 して あ り ます. 分 析 を実 行 す る た め の プ ロ グ ラ ム ば か りで な く,手 法 の 意 味 や 使 い 方 の 説 明 を画 面 上 に 展 開 す る プ ロ グ ラ ム や,適
当 な 実 例 用 の デー タ を お さ め た デ ー タ
ベ ー ス も含 まれ て い ます . こ れ ら を 使 っ て,
テ キ ス ト本 文 を よむ → 説 明 用 プ ロ グ ラム を使 っ て理 解 を確 認 す る → 分 析 用 プ ロ グ ラム を使 っ て テ キ ス トの 問題 を解 い て み る → 手 法 を活 用 す る力 をつ け る →…
と い う学 び 方 を サ ポ ー トす る 「学 習 シ ス テ ム 」に な っ て い る の で す. こ の テ キ ス ト と一 体 を な す もの と し て,利
用 して い た だ くこ とを期 待 し て い
ま す. 2002年
8月
上 田 尚 一
1 22 33 4 477
次
目
. 統 計 的 な 見 方
1
.1 統 計 デ ー タ と統 計 的 見 方
.2 平均 値 の意義 と限界 .3 傾 向 性 と個 別 性
1
4
71
.4 ひ ろ が り幅 の 指 標 に よ る表 現 問
題1
11
16
. 情 報 の統 計 的 表 現 (1)
19
.1 標 準 偏 差 の 定 義 と 計 算
192
.2 中 位 値 ・四 分 位 偏 差 値 に よ る 表 現 .3 分 布 に よ る表 現 .4 分 布 形 の モ デ ル .5 平 均 値 の 分 布 問
題2
24
272 35 42
45
. 情 報 の 統計 的 表現(2)
49
.1 デ ー タ の バ ッ ジ と して の 特 徴 3.2 情 報 の 表 現 力
49
51
3.3 5数 要 約,ボ
ッ ク ス プ ロ ッ ト
3.4 5数 要 約,ボ
ッ ク ス プ ロ ッ トの 代 案
.4 分
析
3.6 補 足:ボ
例
題
3
583
63
ッ ク ス プ ロ ッ トに お け る フ ェ ン ス の 表 現
3.7 補 足:中 位 値,四 問
54
分位 値 の計算
74
. デ ー タ の 対比 .1 区 分 け す る
774
.2 種 々 の 分 散 とそ の 計 算 .3 分 散 分 析 の 考 え 方
84
80
71
69
7654
4.4 分 析 結 果 の 表 示
87
4.4 説 明 基 準 の 精 密 化 .6 分
析
例
90
924
.7 主 効 果 と交 互 作 用 効 果 問
題
96
4 101
5. 有 意 性 の 検 定
105
.1 有 意 性 の 検 定
1055
.2 F 比 の 分 母 の解 釈 に 関 す る 注 意 .3 帰 謬 法 と仮 説 検 定 の 論 理 .4 ア ウ トラ-イヤ ー 検 出
1135
1175
.5 平 均 値 に 関 す る 仮 説検 定
1205
.6 平 均 値 の 差 に 関 す る仮 説 検 定 .7 実 験 計 画
題
1245
1305
.8 実 験 計 画 に お け る 3条 件 問
1095
139
5 143
6. 混 同 要 因 へ の 対 処
147
.1 混 同 要 因 へ の 対 処
1476
.2 直 接 法 に よ る 標 準 化
150
.3 間接 法 に よ る 標 準 化
1536
.4 指 数 に お け る標 準 化
156
問
題
6
159
7. 分 布 形 の 比 較
162
.0 分 布 形 の 比 較
1627
.1 ロー レ ン ツ カ ー ブ とジ ニ 係 数
163
.2 分 布 形 表 現 手 段 と し て の ロ ー レ ン ツ カ ー ブ の 位 置 づ け .3 累 積 分 布 図 の 表 現 法 .4 適 合 度 の 検 定
1797
.5 ロ ー レ ンツ カ ー ブ に お け る観 察 単 位 の サ イ ズ 差 の 扱 い .6 基 礎 デ ー タの 表 現 に 関 す る 問 題 問
付
題
7
190
録 A. 図 ・表 ・例 題 の 資 料 源
1677
172
195
187
183
B. 付 表:図
・表 ・問 題 の 基礎 デ ー タ
C. 統 計 ソ フ トUEDA
索
引
198
213
215
◎ スポ ッ ト 偏 差,残 差,誤 差 一 様 分 布 165
142
統 計 学 で扱 う数 は,具
体 的 な 意 味 を もつ 数 的 情 報
189
《シ リー ズ 構 成 》 1. 統 計 学 の 基 礎
どん な場 面で も必要 な基本概 念.
2. 統 計 学の論 理
種 々 の 手 法 を広 く取 り上 げ る.
3. 統 計 学 の 数 理
よ く使 わ れ る手 法 を くわ し く説 明.
4. 統 計 グ ラ フ
情 報 を 表 現 し,説
5. 統 計 の 活 用 ・誤 用
気 づ か な い で 誤 用 して い ませ ん か.
6. 質 的 デ ー タ の 解 析
意識調査 な どの数 字 を扱 うため に.
7. ク ラ ス タ ー 分 析
多 次 元 デ ー タ解 析 と よ ば れ る
8. 主 成 分 分 析 9. 統 計 ソ フ ト UEDA
明 す る た め に.
手 法 の う ち よ く使 わ れ る もの. の 使 い 方
1∼8に 共 通 で す.
1 統 計 的 な 見 方
た く さ ん の 数 字 を 1つ の セ ッ トと し て 扱 う …,そ な 見 方 」が 必 要 と さ れ る こ と を 指 摘 し,い す(1.1).つ
づ い て,「1 セ ッ トの 数 字 の 代 表 値 」 と し て 平 均 値 を 使 う場
合 に 注 意 す べ き 前 提 を 説 明 し(1.2),実 は,傾
の こ と か ら 「統 計 的
くつ か の 基 本 用 語 を 説 明 し ま
際の デー タに適用す る ときに
向 性 を 計 測 す る 指 標 と し て 使 え る が,誤
し ま す(1.3).ま
た,平
用 もあ り うる こ とを 注意
均 値 で は 計 測 で き な い 「個 別 性 」 を み る た め に
標 準 偏 差 を 併 用 す べ き こ と を 指 摘 し ま す (1.4).
1.1 統計 デー タ と統 計 的見 方 ①
例 1 あ る人 が 「私 の 給 料 は 月23万
円 だ.他
の 人 と比 べ て,少
な い 」 と言 っ
た と し ま し ょ う. この発 言に おけ る 「私 の給 料 」は,そ
の 人 に 関 す る固 有 の 情 報,す
な わ ち,「 一 定 の 数 値 」
で あ る の に 対 して 「 他 の 人 と比 べ る 」た め に ア タマ に え が い て い る もの は,「 統 計 デ ー タ」 で す. こ こ で 「統 計 デ ー タ 」と い う コ トバ を使 っ た の は,そ
の デ ー タ の 特 性 に 関 し て,い
くつ か の 区別 を 要 す る点 が あ る か らで す. ま ず,特 定 の(1 つ の)数 値 で は あ りませ ん.他 く さ ん の 数 値 で 記 録 され る こ とに な り ます.そ 後 で 考 え る に し て も,は
の 大 勢 の 人 々 の 情 報 で す.当
然,た
れ ら を 1つ の 数 値 で 代 表 させ る こ と を
じめ か ら特 定 の 数 値 を ア タ マ に え が い て い る わ け で は あ り ま
せ ん. た だ し,「 私 と 比 べ る」 と い う意 図 を もっ て い る わ け で す か ら,そ れ た 「1セ ッ トの デ ー タ 」で す.そ け が な さ れ て い る もの で す.た
う して,そ
とえ ば,同
の観 点 で求 め ら
れ ら は,「 比 べ る」た め に 適 し た 定 義 づ
期 入 社 で 同 職 種 な ど と,「 あ る範 囲 を 想 定 」
し,そ の 範 囲 の何 人 か の デ ー タ を 求 め る の で す . こ れ ら 1セ ッ トの 情 報 を 使 っ て 「条 件 が 同 じだ か ら差 が な い は ず な の に,差 が あ る 」 と い う論 理 の 運 び を と りま す . し た が っ て, 「条 件 が 同 じ だ と して も,個 人 差 が あ る」 こ と を 問題 に し よ う とす るの で す か ら,他 の 特 定 の 人 と 比 べ る 域 に と ど ま らず, 「同 じ条 件 を もつ 他 の 人 々 の 情 報 」 を求 め て,そ
れ と比 べ る こ と を考 え るべ き で す.こ
の だ」 と い う こ とに な るの で す が,そ み なせ る こ とが,必
う考 え て,「 だ か ら 平 均 値 を使 う
の 前 提 と して,「 同 一 条 件 に あ る 人 々 の 値 だ 」 と
要 で す.
条 件 が 著 し くち が うな ら,「 条 件 が ち が う か ら ね 」で 話 は 終 わ りで す.し
た が っ て,
全 く同 じ と ま で は い わ な い(い え な い)に し て も,「 同 じ とみ なせ る 」こ と が 必 要 で す . そ う し て, 「条 件 が 同 じ で もあ り う る差 」を 測 り, 「そ の 範 囲 を こ え て い る か 否 か 」を 判 断 す る 方 法 を 採 用 す る … そ れ が,統 ②
基 本 概 念 と用 語
ドが 登 場 して い ま す.そ
私,他
ず,こ
の 人,同
じ条 件,平
均 値 とい うい くつ か の キ イ ワ ー
して,2 つ の 数 字 の 比 較 とい う域 を こ え る問 題 に な っ て い る
こ と に 注 意 して くだ さ い.し が,ま
計 手 法 の 論 理 で す.
た が っ て,統
計 的 な 見 方 や 数 理 を 学 ぶ こ とが 必 要 で す
の 例 で 使 わ れ て い る 「統 計 的 な 思 考 」の 基 本 概 念 と用 語 と を 説 明 し て お
き ま し ょ う. 観 察 単 位―
情 報 を 対 比 す る 単 位,た
集
比 較 す る た め に 想 定 した 条 件 をみ た す 「 観 察 単 位 の あ つ ま り」.
団―
等 質 化―
とえ ば 人,事
業所,地
集 団 に 属 す る 各 メ ン バ ー の 値 に つ い て,ひ
点 な ど.
とつ ひ と つ ち が う が,
その差 が 「 想 定 し た条 件 下 で も起 こ り う る 差 とみ な せ る」よ うに す る こ と.た
と え ば,そ
う み なせ るデ ー タ を 求 め ま す.
統 計 デ ー タ― 各 観 察 単 位 に つ い て 求 め た観 察 値.た で,い ③
統 計 的比 較
だ し,こ れ に つ い て は,⑤
くつ か の 場 合 に わ け て 細 か く定 義 しな お し ま す.
集 団 の 情 報 を 扱 う こ とに と も な っ て,「 差 の 有 無 」に 関 す る発
言 が 特 別 の 論 理 構 成 を と る こ とに な り ます. 条 件 の ち が い を もつ 情 報(い わ ば 個 人 差 を もつ デ ー タ)と 比 べ る の で す か ら,比 較 の 結 果 に つ い て は 「個 人 差 を考 慮 に 入 れ た 形 」を採 用 す べ き で す .た
とえば
「差 は な い 」 とい う発 言 は, 「こ の 程 度 の 差 は よ くあ る こ と だ,と とい う 言 い 方 に, 「差 が あ る 」と い う発 言 は,
りた て て い う ほ どの 差 で は な い 」
「こ ん な に 大 き い差 は め っ た に 起 こ ら な い 」 とい う言 い 方 に か え るべ き 場 合 が あ る で し ょ う. こ の よ うに, 「大 き い,小 こ と に な り ます.ま
さい 」 と い う言 い 方 に 可 能 性 の 程 度 を 表 わ す 形 容 詞 を つ け る た,
同 じ条 件 下 で も起 こ り う る個 人 差 を こ え る 差 だ け が 検 出 で き る こ とに な りま す. 数 学 的 な 意 味 で 「大 き い,小
さ い 」 と い え る の は 特 殊 な 場 合 で す,し
た が っ て,数
値 の 大 小 比 較 に お い て, 「可 能 性 の 大 小 を考 慮 に 入 れ た 比 較 」の た め の 論 理 と数 理 が 必 要 と な る の で す. ④
例 2 こ こ で,①
の 例 とい くぶ ん ち が う例 を取 り上 げ ま し ょ う.
あ る 人 が 「わ が 社 は 他 社 と 比 べ て 賃 金 水 準 が 低 い 」と 言 っ た と し ま し ょ う.①
で取
り上 げ た発 言 例 と ち が うの は,「 私 」の と こ ろ が 「わ が 社 」 と な って い る と こ ろ で す. こ の 場 合,比
較 し よ う とす る 「わ が 社 の 情 報 」や 「 他 社 の 情 報 」は,個
人 ご とに 決 ま
る 「 個 人 を 単 位 と して み た 情 報 」を 「企 業 を単 位 とす る形 に ま とめ た情 報 」で す.そ して,個
う
人 の レベ ル で の 比 較 で は な く,「 企 業 に か か わ る要 因(た と え ば 業 績)に よ っ
て 生 じる 差 」 を 問 題 に して い る の で し ょ う.そ
う だ と し て も,賃
「 個 人 を 単 位 」 とす る 要 因 が 共 存 し て い ま す か ら,個
金 の 高 低 に つ い て,
人 ベ ー ス で の 要 因 の 影 響 は,な
ん ら か の 方 法 で 消 し去 っ て,「 企 業 を 単 位 とす る差 と し て 説 明 さ れ る部 分 」を 把 握 す る こ と を考 え ま す. た と えば 年 齢 ○ ○ ∼○ ○ 歳 と特 定 して そ の 年 齢 で の 平 均 賃 金 を比 べ る とか, 年 齢 構 成 の ち が い に よ る 影 響 を補 正 した 平 均 賃 金 を 計 算 し て 比 べ る な どの 方 法 を と る こ とが 必 要 です. ① の 例 で も,こ い ま す が,使
の 例 と 同 様 に,個
人 レベ ル の 情 報 と企 業 レベ ル の 情 報 が 関 与 し て
い 方 が ち が う こ と に 注 意 し ま し ょ う.
① で は,「 個 人 レベ ル の 値 に み ら れ る 差 」 を考 察 の 対 象 と して い ま す.企 の 情 報 は,個
業 レベ ル
人 レベ ル の 比 較 に 影 響 す る要 因 と し て,「 個 人 レベ ル の 差 を 説 明 す る た
め 」に 使 っ て い ます. こ れ に 対 し,④
では 「 企 業 レベ ル の 値 に み られ る差 」を 考 察 の 対 象 と し て い ま す.
個 人 レベ ル の 情 報 が 関 与 し て く る に し て も,比 較 の 目的 外 で す.ま 査 した 情 報 を集 計 して,集
た,個
人 ご とに調
団 レベ ル の 情 報 を 求 め て し ま え ば 不 要 な 情 報 と さ れ る の で
す. した が っ て,情 一 致 し ませ ん .
報 を 求 め る 単 位(調 査 単 位)と 情 報 を 比 較 す る 単位(観 察 単 位)と は
⑤
よ って,②
に ま とめ た 概 念 規 定 を,調 査 単 位 と観 察 単 位 と を 区 別 す る こ と に
関 連 し て,変 更 あ る い は 追 加 して お き ま し ょ う. 観 察 単 位―
情 報 を 対 比 す る基 本 単 位.た
調査 単 位―
情 報 を 求 め る た め に 調 査 す る単 位.必
と えば,人,事
業 所,地
点 な ど.
ず し も観 察 単 位 と一 致 し な
い.
観 察 値―
各 調 査 単 位 に つ い て 求 め た 観 察 値.
統 計 デ ー タ― 各 観 察 単 位 ご とに 求 め られ た 観 察 値,あ
る い は,各
調 査 単位 ご と
に 求 め られ た 観 察 値 か ら誘 導 さ れ た 集 計 値 . 調 査 単 位 ひ とつ ひ と つ の 値 を 「 個 別 デ ー タ」 と よ び,そ わ ち,統
れ か ら誘 導 さ れ た 値,す
な
計 デ ー タ を 「集 計 デ ー タ 」 と よぶ こ と もあ り ます .
1.2 平 均 値 の 意 義 と限 界 ①1.1節
に あ げ た 2つ の 例 の ど ち らの 場 合 に つ い て も,多 数 の 観 察 単 位 の 観 察 値
を 扱 うこ とに な り ます.た
だ し,多 数 の観 察 値 と い っ て も,あ
る 集 団 を想 定 して,そ
の範 囲 に属 す る観 察 単 位 に つ い て 求 め た 1セ ッ トの 値(ひ と つ ひ とつ の 値 が 異 な る に し て も,あ
る共 通 性 を もつ 1セ ッ トの 値)だ とい え ま す.
した が っ て, 等 質 性 が 十 分 高 い と判 定 さ れ れ ば,そ を使 う こ と を考 え ら れ ま す.す
れ ら を代 表 す る 1つ の 値
べ て の 観 察 値 が 代 表 値 に 等 し い と い う こ と で は あ りま
せ ん が, 「代 表 値 か らの 差 を考 慮 外 に お い て よ い 」 とい うこ と で す. ②
統 計 的 な 見 方 で 「平 均 値 」 を使 う こ とが 多 い の は,そ
す が,そ 合,あ
の 前 提 を確 認 し ま し ょ う.そ
る い は,そ
う い う理 由 が あ る た め で
う して よ い 場 合 ば か りで な く,そ
うで きな い 場
う し て は い け な い場 合 が あ り ます.
い い か え る と,平 均 値 す な わ ち 「1セ ッ トの デ ー タ を代 表 す る 1つ の 値 」だ け に 注 目 して よ い 場 合 と,そ れ か らの 差,す
なわ ち 「 個 性 を表 わす値 」を無視 で きな い場合
と を み き わ め る こ と が 必 要 で す. 「集 団 の 情 報 を 1つ の 平 均 値 で 代 表 す る こ と」は 「 観 察 単 位 の 個 別 性 を無 視 す る こ と 」を 意 味 す る. → そ う して よ い 場 合 で あ る こ と を確 認 す る ◇ 注 説 明の 数理 を 明確 に す るため に,以 下 で は,数 学 的 な記 号 を使 い ます. あ る変数 X の値 をい くつ か の観 察 単位 に つ い て求 め た と き,変 数 を表 わ す 記 号 X と観 察 単 位番 号 を表 わす 記 号 Iをセ ッ トに してXIと また,こ れ らの合 計 を表 わす には,X1+X2+X3+…
表 わ します. とか くか わ りに,記 号 Σ を用 い て
Σ〓1XIと 表 わ し ます.こ の 表 現 に お い て,足 と略 記 す る こ ともあ ります.足
しあげ る範 囲 を示 す 部 分 を省 略 して ΣXI
しあ げ る範 囲 を限 定 す る ときに は,そ の範 囲 を 明示 す るこ
とが 必要 で す が,「 た い て いの場 合 は全 部 だか ら,省 略 し よ う」とい う趣 旨で す. 先へ い くと,XIJの よ うに 2つ以 上 の 添 字 を使 う場 合 が あ ります が,そ の場 合 に は, XI =ΣXIJの よ うに略 記 で き ます .左 辺 右 辺 を比 べ て,足 しあげ るの はJ につ い て で あ る と 判 断 で き るか ら,省 略 して よい の です. ③
説 明 を具 体 的 に 進 め る た め に,統 計 手 法 を適 用 しよ う とす る 問 題 分 野 を い くつ
か に わ け て 考 え ま し ょ う. ④
最 も説 明 しや す い の は,「 実 験 デ ー タ」 を扱 う場 合 で す.
計 測 し よ う とす る値 を μ と表 わ し ま す.精 だ が,若
密 に観 察 す れば その 値 が得 られ るは ず
干 の 観 察 誤 差 が 生 じ る … そ う い う場 合 は,観
を N とす る)N 個 の観 察 値XJを
求 め,そ
XJ=μ+eJひ
とつ ひ と つ の 観 察 値
X=μ+e平
均値
に つ い て,e
の 分 散 は,eJの
察 を く りか え して(観 察 回 数
れ ら の 平 均 値 X を使 え ば
分 散 の1/√Nの
オ ー ダ ー で 小 さ くな る こ と が 証 明 さ れ
て い ま す か ら,そ れ が 許 容 限 度 以 下 に な る よ うに N を 定 め れ ば,μ ≒Xと が で き る … こ れ が,平 実 際 の 実 験 で は,計
み ること
均 値 を 使 う こ との 根 拠 に な っ て い る の です. 測 し よ う と す る値 が 1つ で は な く,種 々 の 条 件 に 対 応 す る 値
μJで す か ら,上 の 数 式 表 現 に そ れ ぞ れ の 条 件 に 対 応 す る添 字J を つ け て XJI=μJ+eJIひ
とつ ひ とつ の 観 察 値
XJ=μJ+eJそ
れ らの 平 均 値
とか く こ とに な り ます,以
下 で はeJIを 偏 差 と よび ま し ょ う.
平 均 値 は,各 条 件 を もつ 観 察 値 の 範 囲 ご とに 求 め ます か ら,XJで い に よ る 差 は 消 え ませ ん か ら,添 字J が 必 要 で す.同 応 す る 添 字 Iの 方 は不 要 と な り ま す.よ
す.条
件 の ちが
一 条 件 下 で の く りか え し に 対
っ て,
μJ≒XJ だ とみ て よ い こ とに な り ます. こ の よ う な 論 理 を適 用 す る に は
条件 の ちが い を可 能 な限 り考 慮 に入れ る
局所管理
同 一 条 件 下 で の 観 察 を く りか え す
反復
の 2つ の 原 理 を 取 り入 れ て,観 局 所 管 理 と反 復 は,あ 条 件 と よ ば れ て い ま す.実
察 値 の 求 め 方 を計 画 す る こ とが 必 要 な の で す.
と で 説 明 す る ラ ン ダ ミゼ ー シ ョ ン と あ わ せ て,Fisherの 験 計 画 の 分 野 で 強 調 さ れ て い ます が,そ
統 計 手 法 の 適 用 に あ た っ て 考 え るべ き 基 本 概 念 で す. こ れ ら の 条 件 をみ た し て い る な ら 観 察 値=真
値+誤
差
3
の 分 野 に 限 らず,
だ とい う解 釈 に も とづ い て,観 察 値 の 平 均 値=真
値 とみ な し て,平
均 値 を使 うことに
な る の で す. ⑤
種 々 の 要 因 が 関 与 して い る,そ
う して,観
察 値 は そ れ ら の影 響 を受 け て い ます
から XJI=μJ+eJI
ひ とつ ひ とつ の 観 察 値
と表 わ す こ と が で き る に して も 多 種 多 様 な 要 因 が 相 互 に 関 連 し あ う形 で 関 与 し て お り, そ れ ら を特 定 し た形 で の観 察 値 が 得 に くい こ と か ら,実 験 デ ー タ の 場 合 の よ う に局 所 管 理 や く りか え しの 原 理 が 働 く とは 限 りませ ん か ら,「 平 均 値 を使 う こ との 根 拠 づ け 」は 得 られ ませ ん. 条 件 の ち が い に 対 応 す る添 字J と個 々 の 観 察 単 位 に 対 応 す る 添 字 Iが 区 別 さ れ な い の だ と考 え れ ば よ い で し ょ う.こ の た め に,平 均 を 計 算 す る と,条 件 の 相 違 を 度 外 視 し て 平 均 す る こ とに な りま す.い X=μ
いか え る と,こ の 場 合 の 平 均 値 は
条 件 の 異 な る観 察 値 の 平 均 値
に な り,区 分J に よ る ち が い が 消 さ れ た もの に な っ て し ま い ま す. こ の こ とか ら,「 1セ ッ トの 観 察 値 に つ い て み ら れ る共 通 な 側 面 」 を測 っ た もの と解 釈 で き ま す が,「 測 られ た 共 通 な 側 面 を ど う説 明 す る か 」 と い う問 題 が 残 り ま す.ま た,そ ん.し
れ で 計 測 され な い 「偏 差 の 部 分 を考 慮 外 に お く」 こ と の 根 拠 づ け は 得 ら れ ませ たが っ て 観 察 値=傾
向 性 の 計 測 値+個
別性 の計 測値
とみ なす こ とに な り ます. な ん らか の 方 法 で 「 傾 向 性 と個 別 性 と を識 別 で き る な ら ば 」 と い う条 件 を つ け た上 で,傾
向 性 を 測 る た め に 平 均 値 を使 う効 用 は 認 め ら れ ま す.
条 件が つ いて い ますか ら 平 均 値 だ け を使 わ ず,個
別 性 を測 る偏 差 に も注 意 を 向 け よ
とい うこ とです. ⑥
社 会 科 学 の分 野 で は 「同 一 条 件 に そ ろ え て 観 察 しに く い 」こ と か ら く る注 意 点
を ⑤ で 強 調 し ま した が,「 実 験 を計 画 す る 場 面 で採 用 さ れ る 考 え 方 を 適 用 す る こ と」 は で き ま す. た と え ば,人
々 の 意 識 は 1年 や 2年 で 変 化 す る も の で は な い,10年
をお い て は じめ て検 出 で き る も の だ … そ う判 断 で き る な ら ば,あ
ぐら いの 間隔
い つ づ く 2年 の 観
察 結 果 を 「同 じ条 件 下 で の く りか え し観 察 値 」 とみ なす こ とが で き ます. し た が って,1980年,1981年,1990年,1991年
の デ ー タ を 分 析 す れ ば,10年
間
の ち が い が,「 調 査 の 仕 方 な ど か ら起 こ る 非 本 質 的 な 差 」の 域 を こ え て い る か 否 か を 判 定 す る こ と が で き ます . 要 は,小 に よ っ て,統
さ い 影 響 しか もた ら さ な い と判 断 で き る 区 分 を 「同 じ条 件 と み な す 」こ と 計 的 比 較 の 論 理 を適 用 で き る よ う に す る … こ う い う意 図 で 「分 析 計 画
を た て る 」の で す. 条 件 を 制 御 しに く い こ とか ら く る 問 題 は ほ か に も あ りま す が,こ
こ で は,条
件のち
が い に 注 意 す る こ との 必 要 性 と有 効 性 を指 摘 す る こ とで 終 え ま し ょ う. ⑦
以 上 を ま とめ て,平
ま ず 第 一 は,偏
均 値 で み て よ い場 合 は …
差 を 「 誤 差 」 と み て よ い 場 合 で す.
誤 差 と い う コ トバ は,偏
差 が 「と りた て て論 ず る必 要 の な い 事 情 に よ っ て 起 こ っ た
もの だ と確 認 で き る」 と と も に,「 そ れ が 小 さ くて,比
較 に 影 響 を も た ら さ な い 」場 合
を 指 す の だ と了 解 し ま し ょ う.自 然 科 学 の 実 験 デ ー タ で は た い て い そ う な っ て い る で し ょ う が,社 会 科 学 の 領 域 で は,そ 第 二 は,偏 も,小
うみ なせ る場 合 ば か りで は あ り ませ ん .
差 が 小 さ くて 無 視 で き る場 合 で す,第
一 の よ う に き び し く考 え な く て
さ い か ら よ し と す る(あ ま り き び し く考 え る と使 え る デ ー タ が な い の で)と い
う こ と で す.条 の は,こ
件 を制 御 し て観 察 す る こ との 難 しい 社 会 科 学 の 分 野 で 平 均 値 を使 え る
の 場 合 で す.
「集 団間 の差 と して説 明 され るべ き差」が 見過 ごされ る可能性 が あ る 平均値 を使 う場 合 には 注意す る こ と
1.3 傾 向 性 と 個 別 性 ① 前 節 で は,平 均 値 を使 っ て デ ー タ の傾 向 を 見 出 す こ と が で き る が,「 傾 向 か ら は ず れ た 個 別 性 を無 視 す べ き で は な い」 こ と を強 調 し て お き ま し た .そ の 指 摘 の 重 要 さ を理 解 して も ら う た め に,こ
こ で は,い
味 で は 前 節 の つ づ き で す が,こ
の 節 の 例 示 を追 う こ とに よ っ て,平
くつ か の例 を あ げ て お き ま し ょ う.そ
の意
均値 を比較 す る上
で の 注 意 点 を具 体 的 に 把 握 し ま し ょ う. ② 観 察 単 位 が た と え ば 地 域 区 分 の 場 合,そ れ ぞれ あ る大 き さ を も ち,そ の 大 き さ の ち が い が 異 な る場 合 が あ り ます .そ う い う観 察 単 位 に つ い て 求 め られ た 観 察 値 を 比 較 す る と き,大 特 に,地
き さ の 相 違 を ど う扱 うか と い う問 題 が あ りま す.
域 デ ー タ の 場 合,情
報 を 求 め る た め の 区 切 り(調 査 単 位)は
自由 に決 め る
こ とが で き ます か ら,分 析 す る と き に,「 そ の 区 切 り どお り で よ い か ど うか 」を 考 え る こ とが 必 要 と な るの で す. た と え ば,人
口 密 度 を 比 べ る た め に は,「 面 積 あ た りの 計 数 」の 形 の 指 標 を 使 え ば
よ い … それ で よ さ そ う です が,そ 次 の 図1.3.1(a)を
う簡 単 に は い え ませ ん.
み て く だ さ い.こ
れ で 人 口密 度 を比 べ る こ と が で き る で し ょ う
か.
人 口密 度 の 計 算 や グ ラ フ の 書 き方 の 問 題 で は な く.デ ー タ の 取 り上 げ 方 の 問 題 で す.
図1.3.1(a)
人 口 密 度 の 比 較(1)
図1.3.1(b)
各 市 町 村 の 人 口密 度 を計 算 して,5 段 階 に
人 口密 度 の 比 較(2)
図 のマ ー クひ とつ ひ とつ が 「2km×2kmの 地域区分」
区分 して 濃 淡 模 様 で図 示 し た もの です.
に 対 応 し て い ます.こ
の よ う な小 地 域 区
分(地 域 メ ッ シ ュ と よ び ま す)別 に 種 々 の 統 計 デ ー タが 求 め られ て い ます.
③
大 き い 静 岡 市 に 注 目 し ま し ょ う.人
口密 度 の 高 い 中 心 部 と人 口 密 度 の 低 い 山 間
部 とが 「1つ の 区 分 」に く く られ て い ます.そ
の 情 報 を 1つ の 平 均 値 で代 表 させ る と,
中 心 部 で は 周 辺 部 の 低 い値 に ひ か れ て 実 態 よ り低 い値 に な り,周 辺 部 で は 中 心 部 の 高 い 値 に ひ か れ て 実 態 よ り高 い値 に な り ます.ど
ち ら に して も
「ゆ が み 」 を も つ 情 報 表 現 に な って い る の で す. よ り小 さ い 地 域 区 分 を観 察 単 位 と して 情 報 を求 め る と 図1.3.1(b)の
よ う に な り,
実 態 を正 し く把 握 で き る 表 現 に な り ま す. 図1.3.1(a)で
は,こ
の 情 報 を 「市 町 村 区 分 」別 平 均 値 に 集 約 し た と き に 市 町 村 区
分 の サ イ ズ が 異 な る ため に 「ゆ が み 」が 生 じた の で す. こ うい う不 適 当 な 平 均 化 は,こ
の 例 に 限 らず よ くみ ら れ る 「誤 用 」で す.
集 団 の サ イ ズ の ち が い が もた らす 影 響 を 「サ イ ズ効 果 」と よ び ま し ょ う. 「サ イ ズ が ち が う な ら1km2あ し ょ うか.一
た り に 換 算 す れ ば よ い 」 と,簡 単 に,考
えて よ い で
般 化 して い う と,「 集 団 の サ イ ズ を分 母 に と っ た相 対 値 」に す る こ と で
サ イ ズ 効 果 を 消 去 で き る と は 限 ら な い の で す. 「条 件 の ち が う地 域 区 分 の 情 報 の 平 均 を と る」 こ とに よ っ て 条 件 の ち が い と し て 説 明 さ れ るべ き有 意 な 差 が か く され て し ま っ た …
こ う考 え る と,平 均 値 の 誤 用 例 で す.
区 分 が 大 き い ほ ど,両 極 端 の 値 の 影 響 が 消 さ れ て,平 中 庸 に 近 い値 に な る.た
均値 は
だ し,そ の こ と と,平 均 値 を 使 う こ
との 利 点 ・欠 点 は 別 で あ る.
こ の例 で は,地
域 区 分 を小 さ くす る こ と に よ っ て,そ
れ ぞれ の区分 に つ いては 区分
内 で の 条 件 の ち が い は 考 慮 しな くて よ い状 態 に な っ た,よ
っ て,そ
れ ぞれの 区分 の情
報 を平 均 値 で 代 表 させ て よ い … こ う い う考 え 方 が 必 要 な の で す. 県 別 あ る い は 市 町 村 別 の 統 計 デ ー タ は豊 富 に あ っ て 気 軽 に 利 用 で き ま す が,種 情 報 の 地 域 差 を み る 問 題 で は,ど 問題 で す.こ
れ は,そ
う い う問 題 の典 型 例 で す.
④ 図1.3.2(a)は,あ ます が,ど
々の
うい う地 域 区 分 に よ っ て 情 報 を 表 現 す る か が 大 きい
る 新 聞 記 事 の 引 用 で す.も
っ と も ら し い 見 出 しが つ い て い
うで し ょ うか?
こ の 例 で は,血
圧 の 平 均 値(X
求 め て 比 較 して い ます.こ
と表 わ す)を 歩 く距 離 に よ る 区 分(A
の 図 に よ る と,歩
ほ ど X が 小 さ くな っ て い ます か ら,見
図1.3.2(a)
と表 わ す)別 に
く距 離 の 長 い 区 分(図 の 横 軸 の 右 の 部 分)
出 しの よ う に 結 論 づ け て よ さ そ う で す.
歩 く こ と は 健 康 に よ い
左 上 の グ ラ フか ら見 出 しの 説 明 につ な が る で し ょ うか.こ
れ を考 えて くだ さい
しか し,こ
れ を うの み に し て は い け ませ ん.統
計 デ ー タ で裏 づ け され た 結 論 か,そ
う で な い 仮 説 か を は っ き り区 別 し ま し ょ う. X の 大 小 に は 「年 齢 」が 大 き く影 響 して い ます.多 因 で し ょ う.こ の 大 きい 要 因 の 扱 い は,ど
分,「 歩 く距 離 」以 上 に 大 き い 要
うな っ て い るの で し ょ う か.
年 齢(以 下 C と か く)の 高 低 と 歩 行 距 離(以 下 A とか く)の 長 短 と は 相 関 関 係 を も っ て い ます.し
たが って
A の大 きい区分 → C の値 が低 い Aの 小 さ い 区 分 → C の 値 が 高 い と な っ て い る か も しれ ませ ん.も
しそ うな ら
A の大小
X の 大小
C の 大小
の 2つ の 因 果 関 係 の ど ち らが 効 い て い る の か 判 断 で き ませ ん. こ うい う場 合,C
の 扱 い を確 認 し な い で,A
と X との 関 係 に 関 す る 結 論 を 出 す こ
とは で き ませ ん. こ の例 の 場 合 は,年
齢 を 考 慮 に 入 れ ず,歩 行 距 離 だ け で わ け た 数 字 を使 っ て い ます
か ら,「 こ の グ ラ フか らは 何 と もい え な い 」 とす る の が 正 し い 結 論 で あ り,「 歩 く こ と は健 康 に よ い 」 とい う こ と は,立
証 さ れ て い な い の で す.
も う一 段 くわ しい 情 報 が 必 要 で す. 原 報 告 書 を み る と,年 齢 別 に わ け た 数 字 が 掲 載 さ れ て い ます(付 表 M 参 照). 次 の 図1.3.2(c)は 図1.3.2(a)で
そ れ を使 っ て 書 き換 え た もの で す(第 6章 参 照).
み られ た ほ どは っ き り し た 差 は 認 め ら れ ませ ん.こ
れ が統 計 デー タ
か らい え る こ と です. ⑤
重 要 な注 意 点
結 論 の 当 否 が 問 題 視 さ れ る の は 当 然 で す が,統
計の 問題 と し
て は,結 論 を誘 導 す る論 理 も問 題 視 す べ き で す.
図1.3.2(b)
図1.3.2(a)中
の グ ラフ
図1.3.2(c)
図1.3.2(b)の
お き か え
デ ー タ に よ っ て 裏 づ け ら れ た 結 論 と,裏 づ け の とれ て い な い 結 論(仮 説)と を 区 別 す る と い う趣 旨 です. も ち ろ ん,「 立 証 さ れ て い な い 」 とい う こ と は,必
ず し も,否 定 す る こ と で は あ り
ま せ ん.デ
ー タ に よ っ て 裏 づ け で き な い と き に は,「 肯 定 も,否 定 も で き な い」 と す
る の が,統
計 手 法 側 の 答 え で す.一
当 す る統 計 手 法 と して は,理
見 す る と あ い ま い な 結 論 の よ う で す が,実
証 を担
に か な っ た結 論 で す.
「差 が あ る とは い え な い 」と い う結 論 を,「 差 が な い 」と い い か え て は い け な い の で す. 立 証 さ れ て い な い こ と を立 証 され て い るか の ご と く説 明 す る の も,「 誤 読 」 です. デ ー タ に も とつ く立 証 を 目的 とす る の が 統 計 手 法 で す か ら,こ
こ は,き
び し く考 え
ね ば な り ませ ん. あ る要 因(分 析 対 象 要 因)の 効 果 を把 握 し よ う と して い る 場 合,そ
れ に 匹敵 す る大
き さ の 効 果 を もつ 別 の 要 因 を 無 視 す る と,観 察 さ れ た 差 が,「 分 析 対 象 要 因 に よ る差 」 か,「 無 視 され た 要 因 に よ る差 」か が 識 別 され ませ ん. す なわ ち 要 因A に 注 目 し て 集 団 をA1,A2,…
に 区分 して比 較 した
と き,「 差 が み ら れ た 」 と して も 「よ っ て そ の 差 は,A
に よ る差 だ 」 とは い え な い.
混 同 要 因 C が あ る と予 想 さ れ る と き に は, 要 因 C に よ る 区 分C1,C2,… そ の 各 区 分 ご とに,A
に わ け た上,
に よ る 区 分 を適 用 して 比 較 す る.
「A に よ る 区 分 に C に よ る差 が 重 な っ て い る」 こ とに 気 づ か な い た め に 発 生 す る 誤 読 を 「シ ン プ ソ ン の パ ラ ド ッ ク ス 」 と よ ん で い ま す.一 い 読 み 方 で す か ら,パ
方 が 誤 読 で あ り,一 方 が 正 し
ラ ドッ ク ス で は あ り ま せ ん が,誤
読 で あ る こ とに 気づ か な い
と,「 パ ラ ド ッ ク ス に み え る」の です. シ ン プ ソ ン の パ ラ ドッ ク ス 混 同 要 因 を見 過 ご した た め に 起 き る誤 読
1.4 ひ ろ が り幅 の 指 標 に よ る表 現 ①
平 均 値 に よ る表 現 を適 用 す る に あ た っ て の 問 題 点 が 「平 均 値 か らの 偏 差 を考 慮
外 に お く こ と」か ら く る も の だ とす れ ば,「 偏 差 を表 わ す 指 標 」に も注 目 した ら ど うか … これ が ,重 要 な,そ う して,有 効 な考 え 方 で す.平 均 値 の 簡 明 さ を 考 慮 し て そ れ
が使 え る よ う な状 態 に す る(そ れ が 前 節)こ と を考 え る に し て も 限 度 が あ り ま す か ら, 偏 差 を 表 わ す 指 標 の 重 要 性 は,か こ の テ キ ス トの 主 題 は,こ
わ り ませ ん.
の こ とに 関 連 して い ます.第
い 方 な ど を順 を 追 っ て 説 明 して い き ま す が,ま
ず,偏
2章 以 下 で,そ
の定義 や使
差 自体 が 重 要 な 情 報 で あ る 例 を
あ げ て お き ま し ょ う. ②
図1.4.1で
は,平
を採 用 して い ま す.し
均 値 X の 年 齢 別 差 異 を み る た め に 「平 均 値 を線 で む す ぶ 」形 か し,こ の 線 を 過 信 し て,図
に付 記 した よ うな誤解 は な い で
し ょ うか. 図1.4.2の
よ うに,ひ
ろ が り幅 を示 す 形 に し ま し ょ う.
平 均 値 を つ ら ね る線 の 上 下 に, (平 均 値+標
準 偏 差)の 値 をつ らね る線 と,
(平均 値-標
準 偏 差)の 値 をつ らね る線
を書 き足 して お くと, 年 齢 と と も に 上 昇 す る傾 向 性 と,個 人 ご と に 見 出 され る 差 異 とが ほ ぼ 同程 度 の 大 き さ で あ る こ と が わ か りま す. し た が っ て,図 に 付 記 し た よ うな 説 明 に な る で し ょ う. 一 般 化 す る と, 「 事 実 を 示 す 」た め に は 「 事 実 の 一 半 」で あ る平 均 値 だ け で な く, 個 人差 もあわせ て示す べ きだ とい う こ とで す. 前 節 の 図1.3.2(a)の 図1.4.1
場 合 に お い て 「歩 行 距 離 の 他 に 年 齢 も考 慮 せ よ」 と い い ま し
血 圧 の 年 齢 別 変 化(1) 平 均値 の 推 移
図1.4.2
血圧 の 年 齢 別 変 化(2) ひ ろ が り幅 も示 す
年 齢 とと も に血 圧 が上 昇 す る こ とは 誰 に も
これ だ け大 きい個 人 差 が あ るの だ か ら,
み られ る傾 向 だ。
健 康 に 注意 す れ ば,歳
を と っ て も….
図1.4.3
た が,さ
ら に 大 きい 個 人 差 が あ る の で す か ら,ま
に え が き ま し ょ う.そ ③
賃 金 の年 齢 別 推 移
う し て,カ
ず,そ
ミに か き ま し ょ う.
個 人 差 の 表 わ し方 は い ろ い ろ あ りま す.こ
き ま す が,典
の こ と を示 す こ の 図 を ア タ マ
の テ キ ス トで 順 を追 っ て 説 明 して い
型 的 な 例 を あ げ て お き ま し ょ う.
図1.4.3は,賃
金 に 関 し て 階 級 区 分 を 設 け,各
区 分 に 属 す る人 数 を示 す 「分 布 図 」
と よ ば れ る形 式 です(注1,2). た とえば 「ど の く ら い の 賃 金 を も ら って い る 人 が 多 い か 」, 「ど の く ら い の ひ ろ が りが あ る か 」 な ど を よ み と る こ とが で き ます.図 (も ち ろ ん,図 当 然,年
の ピー クの 位 置 お よ び 幅 に 注 目す れ ば よ い の で す
は 同 じス ケ ー ル で か い て あ りま す).
齢 に よ っ て ちが い ま す か ら,図
は,年
齢 層 で わ け て あ りま す.
ピー ク の位 置 が 年 齢 と と もに 右 に ず れ て い ます.す れ て 賃 金 が 高 く な る 傾 向 」(注 3)が よ み とれ ます.し
な わ ち,「 年 齢 が 高 くな る に つ か し,高 年 齢 で ピ ー ク が 2つ に
な っ て い る こ と に も 注 意 し ま し ょ う. こ の よ う な 分 布 図 は,1 つ の ピー ク を もつ 形 に な る の が 普 通 で す が,こ 合,年
齢 の 高 い 層 で は,そ
∼(5)と し て あ り ます .気
う な っ て い な い よ う で す.そ
の 例 の場
の 理 由 は … 章 末 の 問8(1)
を つ け さ え す れ ば 簡 単 な こ と で す.
◇ 注 1 この分 布 図 に おい て棒 の幅 が そ ろ って い ない こ とに 注 意 しま しょ う.基 礎 デー タ が その よ うに与 え られ てい るので す.こ うい う場 合 に 関 す る注 意 は後 述 し ます. ◇ 注 2 この 図 は,棒 グ ラフ で は あ り ませ ん.形 きさ を棒 の長 さで 図示 す る棒 グ ラフ とちが い,X
と し て棒 を使 って い ます が,値
X の大
の 値 域 に属 す るデー タ数 を棒 の 面積 で 図
示 す る もの です か ら,別 の タ イプ の グ ラ フです. ◇ 注 3 図1.4.3の 例 で は,ひ ろが り幅 が 大 き くな っ た こ とか ら,平 均 値 が 大 き くな った の です か ら,「誰 もがそ うな った 」わけ で は あ りませ ん. ④
こ の よ うに 個 人 差,い
きに 現 わ れ る」,そ う し て,そ
い か え る と,平 均 的 な 傾 向 との ち が い が 「意 図 し な い と れ が 貴 重 な 情 報 だ とみ られ る こ とが あ り ます.
平 均 値 か らの 外 れ す な わ ち 「誤 差 」で は あ り ませ ん.
図1.4.4
右 の 方 の 点 線 は,将
出 生率 の 推移
来 人 口 を推 定 す る ため に 想 定 さ
れ た 3 とお りの値 で す.こ
れ らの 想 定 値 を設 定 す る
際 に 「ヒ ノエ ウ マ の 状 態 を考 慮 に 入 れ て い る か 否 か 」が 問題 点 で す.
図1.4.4は,そ
の例 で す.
ヒ ノエ ウ マ の 年 に 出 生 率 が 「異 常 に 下 が って い る」こ と を ど う解 釈 し ま し ょ うか. も ち ろ ん,「 迷 信 を信 じて い る人 が 多 い 」 とい う解 釈 は あ た りませ ん. 出 産 や 育 児 に 対 して 種 々 の 考 え 方 が あ っ て,そ て ゆ れ た」の だ とみ られ ます.気
れ が,「 ヒ ノ エ ウ マ を き っ か け に し
持 ち次 第 で こ の く ら い動 く,そ
うみ れ ば,こ
の 情報
は, 今 の と こ ろ 異 常 現 象 の よ う だ が,将
来 こ の レベ ル ま で下 が る可 能 性 が あ る,
そ う い う変 化 の 前 兆 だ と よめ る で し ょ う. ⑤
情 報 表 現 手 段 と して の 効 用
とす る 以 上,平
均 値 と と も に,そ
これ らの 例 か ら わ か る よ う に,集
団 を考察 単位
れ か らの 偏 差 を み る の は 当 然 だ とい え ます.
平 均 値 を比 較 す る に し て も,偏 差 の 存 在 を考 慮 す る こ と に よ っ て は じめ て,現
象 の 全 貌 を把 握 で き る の で す.
平 均 値 だ け に 注 目 す る,あ は,そ
る い は,平
均 値 だ け しか 使 え な い … そ う い う場 合 に
の こ とに よ る 限 界 を考 慮 に 入 れ て 説 明 し な け れ ば な り ませ ん.
ま た,「 個 性 に 注 目す る」 と い う 意 味 で は,偏 さ れ る 場 合 も あ る で し ょ う.た
と えば,図1.4.4の
で き る こ とが あ り ま す. 偏 差 は,有 とい うべ きで す. し た が っ て,
意 な情 報 で あ る
差 そ の もの が,主 よ う に,状
た る考 察 対 象 だ と
態 変 化 の 前 兆 だ と解 釈
分 散 が 大 き い こ とは, 有 意 な 情 報 を 多 く含 ん で い る こ と だ とい っ て も よ い で し ょ う. 平 均 値 は,そ ⑥
の 有 意 な 情 報 を か く し て し ま う の で す.
情報 誤読 の 一 因
こ れ ら の 説 明 か ら わ か る よ う に,「 統 計 手 法 」で は,そ
れ
が 当 然 の よ うに 平 均 値 が 使 わ れ て い ます が,「 個 人 差 を無 視 し て よ い 」 とい うわ け で は あ り ませ ん. 統 計 数 字 を 使 っ た 議 論 に 関 し て,「 個 性 を 無 視 して い る」 と い っ た 批 判 が な さ れ る こ とが あ りま す が,そ
れ は,平
均 値 だ け に 注 目 し て い る こ と に 対 す る批 判 で し ょ う.
平 均 値 だ け で な く,そ れ か ら の 偏 差 の 両 面 に 注 目 し ま し ょ う. 平 均す るこ とに よって 消 して よ い の は 「誤 差 」 消 して い け な い の は 「 個 性」
問題 1
問 1 入 学 試 験 の た め に 試 験 結 果 を 分 析 す る場 合 と,教 育 方 法 を検 討 す る た め に 在 学 生 の 試 験 結 果 を分 析 す る場 合 との ち が い は ど こ に あ る か. 問 2 次 の 2つ の グ ラ フ は,い い て 示 し た もの だ が,ち
記 し た 資 料 を参 照 し て,考
図1.A.1
ず れ も週 休 2 日制 の 普 及 状 況 を1970年
が っ た 印 象 を与 え る.そ
と1980年
の 理 由 を考 え よ.ま
た,図
につ に注
え た理 由 を確 認 せ よ.
週 休 2 日制 の 普 及 率(1)
図1.A.2
週 休 2 日制 の 普 及 率(2)
労働省:賃 金労働時間制度総合 調査 によ る.
問 3 図1.3.1(a)と
同様 の 問 題 が か くれ て い る 地 域 区 分 は 他 に も あ る だ ろ う.人
口
密 度 を表 わ す 統 計 地 図 をみ て 調 べ よ. 問 4 (1)滋
賀 県 の 人 口 密 度 を計 算 し て み よ.そ の 上 で,資
料 に掲 載 され て い る数
字 と照 合 し て み よ. (2)人
口 密 度 の 計 算 に お け る 分 母 と し て,ど
ん な 指 標 が 使 わ れ て い るか を 調
べ よ .普 通 使 わ れ る の は 総 面 積 で あ る が,「 可 住 地 面 積 」を 使 っ た も の が あ る だ ろ う. 問 5 県 別 デ ー タに つ い て は 「 社 会 生 活 統 計 指 標(総 務 庁 統 計 局 刊)」 な ど使 いや す い 形 に ま とめ た 資 料 が 刊 行 さ れ て い る.そ
れ を参 照 して,情
基 準 と し て どん な ケ ー ス が あ る か を 調 べ よ.た
報 を 「県 別 」に 表 わ す
と え ば 「○ ○ 県 に 住 ん で い る 人 」
に つ い て カ ウ ン トす る場 合,「 ○ ○ 県 に 所 在 す る施 設 を利 用 した も の 」に つ い て カ ウ ン トす る場 合 な ど さ ま ざ ま な 場 合 が あ る. 問 6 各 地 の 「暮 ら しや す さ」 を県 別 デ ー タ を 使 っ て 比 べ て い る例 が 多 い が,「 県 」を 単 位 と して 扱 う こ と に 問 題 は な い か.た
とえ ば,京
都 府,大
阪 府,兵
て み る こ と は 妥 当 と い え る か. 問 7 (1)賃
金 に 関 して 調 べ て み た い こ と(何 で も よ い)を あ げ よ.
庫 県 を比 べ
(2)(1)に あ げ た こ と を議 論 す る ため に 使 うべ き情 報 に つ い て(い くつ か の 情 報 を使 うだ ろ う,そ
の ひ とつ ひ と つ に つ い て)
a.雇
用 者 ひ と りひ と りの レベ ル の 情 報
b.企
業 レベ ル の 情 報
c.経
済一般 の情 報
の いずれ に あた るか を区別せ よ 問 8 (1)統
計 書,た
と え ば 「賃 金 セ ン サ ス 」をみ て,平 均 賃 金 の 情 報 が,ど
んな区
分 別 に 集 計 さ れ て い る か を 調 べ よ. (2)種
々 の 集 団 区 分 に つ い て,平 均 給 与 額 の 年 齢 別 推 移 を 示 す グ ラ フ をか け.
(3)年
齢 別 推 移 の 形 を み て,産
向,共
業 別 あ る い は 企 業 規 模 別 に 共 通 に み られ る 傾
通 に は み ら れ な い傾 向 を指 摘 せ よ.
(4)年 齢 別 推 移 をみ る と,年 齢 層40∼50を じて い る よ う に み え る.こ (5)図1.4.3で 問 9 統 計 書,た
の こ と を,ど
ピー ク に し て,上
昇 か ら下 降に 転
う説 明 す る か.
み ら れ た 「分 布 形 の変 化 」は,ど
と え ば 「賃 金 統 計 年 報 」を み て,賃
う説 明 され るか.
金 に 関 す る 情 報 を,ど
の よ うな
指 標(平 均 値 以 外 の 表 わ し方)で 表 わ して い るか を 調 べ よ. 間10 銀 行 業 の 賃 金 は 他 の 産 業 と比 べ て 高 い と い わ れ て い る が,そ す る た め に は,種
う だ ろ うか.確
認
々 の 条 件 の ち が い を考 慮 に 入 れ て 比 較 しな け れ ば な ら な い.
問11 (1)図1.3.2(a)の
情 報 は 新 聞 記 事 の 引 用 で あ る が,基
「国 民 栄 養 の 現 状,平
礎 情 報 は,厚
生省 の
成 3年 版 」に 掲 載 さ れ て い る.こ れ を み て,「 歩 く こ と と健
康 との 関 係 」に 関 し て ど ん な情 報 が 求 め られ て い る か を 調 べ て み よ. (2)種
々 の 新 聞 に 同 じ記 事 が 掲 載 さ れ て い た が,見
ち が っ て い た.新
出 しの 付 け 方 が そ れ ぞ れ
聞 の縮 刷 版 を み て,調 べ てみ よ.
見 出 し をみ て そ う だ と思 い こ む の は 危 険 なの で 注 意 す る こ と. 間12 新 聞 や テ レ ビ で は,統
計 数 字 を グ ラ フ に 表 わ し て 説 明 して い る こ と が 多 い が,
統 計 数 字 の 取 り上 げ 方 に 疑 問 を も たせ る例 が あ るか も し れ な い.そ
うい う例 を あ
げ よ. 間13 統 計 デ ー タ を 収 録 し た デ ー タベ ー ス に つ い て,収
録 したデー タに関 す る定義 や
求 め 方 な どに 関 す る 説 明 が 与 え られ て い る か ど うか を 調 べ よ. 問14 (1)時
系 列 デ ー タ に 関 し て○ 年 分,○
らの 時 間 属 性 の 定 義 に 関 し て,た
月 分 と い う 表 示 が あ る だ ろ う が,そ
れ
とえ ば,「 月 初 分 」,「月 末 分 」,「月 間 分 」,「年
間 各 月 分 の 平 均 値 」… な ど の 区 別 が 明 示 さ れ て い るか ど うか を 調 べ よ. (2)生 産 指 数,出
荷 指 数,在
庫 指 数 に お け る 「○ 年 ○ 月 分 」 と い う こ との 定 義
を 調 べ よ. (3)地 域 区 分 別 の デ ー タ に 関 して,た
とえ ば 「県 別 」が ど う い う意 味 の 県 別 で
あ るか ( 問 6参 照 )を示 す 説 明 が 収 録 さ れ て い るか ど うか を調 べ よ. 間15 た と え ば1980年
のGNPの
数 字 を検 索 し て み よ.1980年
と は 「そ の 年 の 経 済
情 勢 に 関 す る 情 報 で あ る」 こ と を 意 味 す る が,検 に,何
年 の 価 格 を使 っ た 評 価 値 で あ るか,何
索 シ ス テ ム に よ っ て は,さ
ら
年 の 報 告 書 に 掲 載 され た 数 字 で あ る
か を指 定 す る よ うに 求 め て く るか も しれ な い.そ
れ に 応 じて,使
い た い もの を指
定 す る こ と. こ うい う問 い合 わせ が 出 て こ な い デ ー タベ ー ス もあ る だ ろ う.そ の 場 合 は,検 索 され た 数 字 の属 性 に 関 す る説 明 が つ い て い る か 否 か を 調 べ,そ
の数 字 につい て
○年 の事実 に関す る △ 年 に な され た 推 計 値 で あ り, □ 年 の 価 格 を使 っ て 評 価 さ れ て い る も の か を 答 え よ.
問 題 に つ いて (1)問 題 の 中 に は,UEDAの
プ ロ グ ラム を使 って,テ キ ス ト本 文 で の 説 明 を碓
認す るた め の問 題 や,テ キ ス トで 使 っ た説 明 例 を コ ン ピュー タ上 で再 現 す る も の な どが含 まれ て い ます. した が っ て,UEDAの (2)UEDAの
プ ログ ラム を使 うこ とを想 定 して い ます.
使 い 方 に つ い て は,本 シ リー ズの 第 9巻 『 統 計 ソフ トUEDAの
使
い方 』を参 照 して くだ さい. (3)問 題 文 中 でプ ログ ラム ○○ とい う場合,UEDAの (4)多
くの デ ー タは,UEDAの
プ ログ ラム を指 します.
デ ー タベ ー ス 中 に収 録 され て い ます.そ の フ ァ
イル名 は,そ れ ぞれ の付 表 に付 記 され て い ます が,そ れ を そ の ま ま使 うの で な く,い くつ か の キ イワー ドを付 加 した もの を使 う こ とが あ ります か ら,問 題 文 中 に示 す フ ァイル 名 を指 定 して くだ さ い. (5)プ ロ グ ラム 中の 説 明文 や処 理 手順 の展 開 が,本 文 で の 説 明 とい くぶ ん ちが っ て い る こ とがあ ります が,判 断 で きる範 囲 の ちが い です. (6)コ ン ピュー タで 出力 され る結 果 の桁 数 な どが 本 文 中 に表 示 され る もの とち が うこ とが あ ります.
2 情 報 の統 計 的表 現(1)
この 章 で は,ま ず,1 セ ッ トの デ ー タの 特 性 を表 わ す 平 均 値 ・標 準偏 差 あ るい は 中位 値 ・四分 位偏 差 値 な どの 指 標,つ づ い て,分 布 形 に よる 表現 を説 明 します.ま た,分 布 形 の モデ ル と して想 定 され る正 規 分布 に つ い て説 明 します. これ らは統 計 学 の 基本 概 念 と して ど ん なテ キ ス トで も説 明 されて い る こ とで す が,こ の テ キ ス トで は後 の章 との つ な が りを考 慮 に 入れ て,少 しちが う展 開 にな っ てい ます.
2.1 標準 偏 差 の定 義 と計 算 ①
標 準 偏 差 は,偏
観 察 値XIに
差 の 大 き さ を 測 る指 標 と し て普 通 に 使 わ れ て い る もの で す.
つ い て 平 均 値 μ か ら の 偏 差DI=XI-μ
に 注 目 す る の で す が,そ
れ ら
の 大 き さ に つ い て,「 ほ ぼ こ の 範 囲 に あ る 」 とい う見 方 を採 用 で き る で し ょ う. 基 準 とす る μ と比 べ て 大 き い 値,小
さ い 値 が あ り ま す か ら,た
と え ば,「 平 均 値
140に 対 し て ±10の 範 囲 だ と い っ た 見 方 を し よ う」 と い う こ と で す.い
い か え る と,
偏 差 は ひ とつ ひ とつ の 観 察 単 位 ご と に 異 な る が,「 この 程 度 が 標 準 だ 」 と い う見 方 で す.「 偏 差 の 平 均 的 な 大 き さ を み る」の だ とい っ て も よ い で し ょ うが,平 「足 し て N で わ る」,と い う こ とで は な く,そ
均 す なわ ち
う理 解 で き る よ うに 定 義 す る と い う こ
と で す. 統 計 学 で は,偏
差 の 標 準 的 大 き さ を 測 る指 標 と して,次
の よ う に 定 義 され る 「 標準
偏 差 」を使 い ます.
(1) σ2を分 散 と よび,そ ②
の 平 方 根 σが 標 準 偏 差 で す.
偏 差 そ の も の の 平 均 で な く,ま ず 偏 差 を 「2乗 し た値 の 平 均 」を求 め た 上 で 「平
方 根 を とる 」… そ れ が 標 準 偏 差 だ と 了 解 す れ ば よい で し ょ う.な ぜ そ うい う回 り道 を
表2.1.1
平 均 値,標
準 偏 差 の 計 算 フ ォ ー ム 1と計 算 例
基 礎 デー タは,問 題 2の 問 3に 示 して あ ります.計
算 して,例
示 どお りに な る こ と を確 認 して
く だ さ い.
した 形 を と る の か 気 に な る か も しれ ませ ん が,説 表2.1.1の まず,観
明 を省 略 し ま す.
左 側 が こ の 式 に よ る 計 算 フ ォ ー ム で あ り,右 側 が 計 算 例 で す. 察 値 を表 の 2列 目に 転 記 し ま す(1 列 目 は デ ー タ番 号).そ
の 計 を 求 め て 観 察 単 位 数 で わ れ ば,平
均 値 が 得 ら れ ます.例
れ が 偏 差 を 測 る基 準 値 で す か ら,各 観 察 値 の 横 に 転 記 し ます.そ し ます.当
然,正
の 値 と負 の 値 が 現 わ れ ます.平
う し て,こ
示 で は,39.8で う して,偏
れ ら
す.こ 差 を計算
均 値 を 基 準 と し た 偏 差 に つ い て は,
そ れ ら の 計 が 0に な る は ず で す か ら,検 算 し ま し ょ う. 分 散 は,偏
差 を 2乗 し,そ の 合 計 を求 め,観
察 単 位 数 で わ っ て 求 め ら れ ま す.
最 後 に 平 方 根 を と っ て(2 乗 を とっ て い る の で,も
と の 単 位 に も どす ため),標
準偏
差 が 求 め られ ます. ③
な お,計
こ と は,必
算 の 過 程 で 「ひ とつ ひ と つ の 観 察 値XIの
要 で す.標
準 偏 差 は,こ
偏 差 を 求 め て 記 録 して お く」
れ ら の 偏 差 を代 表 す る 指 標 で す が,デ
ー タの 中に
他 と 同 一 に は 扱 い に くい 「 外 れ 値 」(ア ウ トラ イヤ ー と よ び ま す)が 混 在 して い る 可 能 性 が あ り,そ の 場 合 に は,も
と に も ど っ て,ひ
と つ ひ と つ の 観 察 値XIに
注 目す る こ
とに な りま す. ま た,表2.1.2の
よ う に,偏 差 の 2乗 の 欄 を 用 意 し て お く こ と も考 え ら れ ます.そ
うす れ ば た と え ば偏 差 平 方 和 に 対 し て どの 偏 差 が 効 い て い る か が わ か り ます か ら,ア ウ トラ イ ヤ ー を指 摘 す る参 考 と な る で し ょ う.た 大 半 を 占 め る と きに,標
とえ ば 観 察 値 の 1つ が偏 差 平 方 和 の
準偏 差 が 「 偏 差 の 標 準 だ 」 とは い え ま せ ん.そ
れ を 除 い て,
標 準 偏 差 を再 計 算 す べ きで し ょ う. 表2.1.2の
例 の 場 合,偏
差 平 方 和 は296で
す が,そ
デ ー タ 7の 偏 差 が 影 響 し て い る こ と が わ か り ま す.い
の う ち121す
な わ ち41%は
い か え る と,こ
の 例 で は,
「デ ー タ全 体 を 1つ の バ ッ ジ とみ て 個 別 変 動 を測 っ た もの 」 と は み な しが た い の で す. こ の デ ー タ を 除 い て 計 算 し た偏 差 平 方 和157.72に た個 別 変 動 を測 る」の が,こ
よ っ て,「 デ ー タ の 多数 部 分 で み
の 例 で は 当 を 得 た 扱 い と い え る で し ょ う.
表2.1.2
平 均 値,標
準偏 差 の 計 算 例
デー タ7 を 除 い て 計 算 した 場 合.
な お,デ ④
ー タ7 を 除 くこ と に 関 す る根 拠 づ け に つ い て は,後
こ の 例 か ら わ か る よ う に,計
も の で は あ り ませ ん.た
と えば,ひ
述 し ます.
算 は,「 最 後 の 答 え が 出 さ え す れ ば よ い 」 とい う とつ ひ とつ の 観 察 値 に 対 応 す る偏 差 は,標 準 偏 差
の 計 算 結 果 の 妥 当 性 をチ ェ ッ クす る た め に 必 要 な 情 報 で す.し
た が っ て,計
算 手順 は
有 用 な情 報 を記 録 して お き,必 要 に 応 じて 参 照 で き る よ う に 組 み 立 て るべ き で す. 表2.1.1の ⑤
計 算 フ ォ ー ム は,そ
の 観 点 を考 慮 に 入 れ て い ます.
分 散 の計 算式 を
(2) と書 き換 え る こ とが で き ま す が,こ とが あ り ます.章 ⑥
ま た,分
の 式 を 使 っ て 計 算 す る と計 算 誤 差 が 大 き くな る こ
末 の 問 題2 の 問9 が この こ と を示 す 例 で す. 散 の 定 義 式 で,デ
ー タ数N
で わ っ た と こ ろ をN-1で
わ る よ うに教
え て い る テ キ ス トも あ り ま す. こ れ は,「 デ ー タ に も とつ く推 定 」の 性 質 に 関 し て,か ち 「 不 偏 性 」を重 視 し よ う と い う立 場 か ら き て い ます.こ あ っ て も推 定 精 度 が よ い 」 とい う理 由 で,N
説 明 した 後,再 ⑦
表2.1.1の
なわ
れ に 対 し て,「 か た よ りは
で わ る こ と を お す 立 場 もあ りえ ま す.
こ の テ キ ス トは 後 者 の 立 場 を と っ て い ます が,こ で も 大 差 な し と考 え て お い て くだ さ い.第
た よ り の な い こ と,す
5章 で,推
こ で は,N
が 多 い場合 は どち ら
定 あ る い は 不 偏 性 と い う用 語 を
論 し ます. 計 算 フ ォー ム は,「 デ ー タ数 が 少 な い 場 合 」 を想 定 し て い ま す.
デ ー タ数 が 多 い 場 合 は,ひ
とつ ひ とつ の 値 を列 記 す る か わ りに,次
値 域 を 区 切 っ て,各
の 例 示 の よ うに,
区 切 り に 入 る デー タ 数 を 記 録 す る形(度 数 分 布 表)に し
た上 で計算 す る別 フ ォ ー ム(表2.1.3)を こ の フ ォ ー ム で は,値
採 用 し ま し ょ う.
域,度
数 の 欄 が 「度 数 分 布 表 」で す.そ
の 右 側 に つ づ け た欄
表2.1.3
が 平 均 値,標
平 均 値,標
準 偏 差 の 計 算 フ ォ ー ム2と
計算例
準 偏 差 を計 算 す る た め の 欄 で す.
計 算 で は,各 値 域 の 観 察 値 を 「 各 値 域 の 中 央 値 とみ な す 」 と い う お きか え(近 似)を 適 用 して い ま す(表 で は こ れ を代 表 値 と表 示). 例 示 で は,10∼20の れ る80個
区 間 に 含 ま れ る10個
の 値 を す べ て25,…
10+25×80+…
の 値 を す べ て15,20∼30の
と み な し て い ま す.し
と し ま す.6700は175の
た が っ て,計
区 間 に含 ま の 計 算 は15×
ミス プ リ ン トで は あ りま せ ん .
偏 差 の 2乗 和 に つ い て も 同 様 で す.度
数 を か け るの を わ す れ な い こ と.
⑧
値 域 の 中 央 値XKと
計 算 手 順 と して は 「 観 察 値XIを
を行 な っ て い ます が,デ 8(1)),ま
お きか え る 」 と い う近 似
ー タ 数 が 多 い 場 合 こ の 近 似 の 影 響 は ご く小 さ く(問 題 2の 問
た,デ ー タ を 分 布 表 の 形 に 整 理 す る こ と 自体 が デ ー タ を み る上 で 有 用 な 過
程 で す か ら,こ れ を標 準 的 な 計 算 フ ォ ー ム と し ま し ょ う. な お,こ
の フ ォー ム に よ る 平 均 値,分
散 の 計 算 式 が 次 の よ うに 書 き換 え ら れ る こ と
に 注 意 し ま し ょ う. 平 均 値 の 定 義 式 に お け る ΣXIと ΣNkXk,ΣNK(XK-μ)2と
分 散 の 定 義 式 に お け る Σ(XI-μ)2は,そ
れ ぞれ
書 き換 え ら れ ます(添 字 I を 観 察 単 位 番 号, K を 区 分 番
号 と して い ます)か ら,
(3) とな り ます. また,NK/Nは
相 対 頻 度 で す か らFKと
か く と,
(4) と な り ます.す
な わ ち,計
算 フ ォ ー ム の 度 数 を 「相 対 頻 度 」に お き か え て か ら計 算 す
る の で す. ⑨
「ち ょ う ど20の
場 合 ど ち ら に 入 れ る か 」 と い う質 問 が 出 る で し ょ う.
た と え ば 計 算 例 で10∼19,20∼29,… が,そ
と表 示 し て い れ ば,は
っ き りす る よ う で す
う簡 単 で は あ り ませ ん.「 そ れ で も は っ き りし な い 」こ とが あ るの で す.
ま た,10∼20,20∼30,…
と表 示 し た い こ と も あ り ます.た
を 切 り捨 て る こ と に よ っ て 整 数 化 さ れ て い る 場 合 に は,観
と え ば,観
察値が端数
察 値 の 値 域 は10.000∼
19.999,20.000∼20.999,…
で あ り,そ れ を10∼20,20∼30,…
の よ うに 表示 した も
の と解 釈 で き ます. こ れ に 対 して,端
数 が 四 捨五 入 さ れ て い る場合 に も との数 字 の範 囲 を示 す に は
9.500∼19.499,19.500∼29.499,… 10∼19,20∼29,…
と す る こ と に な り ま す.こ
の 場 合 の 表 示 は
と して 区 別 す る こ とが 考 え られ ます が,9.5∼19.5,19.5∼29.5と
せ よ とい う異 論 が 出 る で し ょ う. 表 現 の 仕 方 で考 え るべ き点 は 端 数 処 理 を した 結 果 で み た 値 域 を 表 示 す る か 端 数 処 理 前 の 値 でみ た 値 域 を表 示 す る か と い う こ と で す.端
数 処 理 が 切 り捨 て の 場 合 と,四 捨 五 入 の 場 合 と を わ け て か く と,
次 の よ うに な りま す.
端数 が切 り捨 ての場合 端 数 処理の結 果 を表示 端 数 処理 前 の 値 を 表 示
10∼19
20∼29 …
10.00∼19.99
この表示 の略 記
20.00∼29.99 …
10∼20
20∼30 …
端 数 が四捨五 入 の場合 端 数処理 の結 果 を表示
10∼19
端数処 理 前の値 を表示
この表示 の略 記
20∼29 …
9.50∼19.49
19.50∼29.49
9.5∼19.5
19.5∼29.5 …
「こ の 表 示 の 略 記 」 と して 示 し た 扱 い が よ い と思 い ます が,無
…
原 則 に 採 用 され て い
る の が 現 実 で す か ら,利 用 す る と き に,適 宜 判 断 す る こ とが 必 要 で す. も と も と端 数 を も た な い 観 察 値 の 場 合 は,選
択 の 余 地 は な く,10∼19,20∼29の
よ うに し ます. ⑩ 計 算 結 果 に お け る端 数 の 復 元 し ょ う.年 齢 は,特
表2.1.2の
そ れ ら を使 っ て 計 算 し た 平 均 値 は,端 年 齢 」の 評 価 で は,こ
ま す.標
す べ き で す.年
わ ば,穴
計 算 機 で は,数
埋 め,す
け低 く な っ て い ま す.「 平 均
齢 に 限 らず,端
準 に 足 り な い と き に は,0 を補 い,そ
の 0は,い
数 を 切 り捨 て て 観 察 さ れ
過 ご さ れ る こ と の 多 い ミス で す.
値 の 長 さ を標 準 の 長 さに そ ろ え て 計 算 し こ ま で 数 値 が あ る もの と し て 計 算 し ま
な わ ち ス ペ ー ス フ ィ ラー と よ び ます.
0が つづ い て い れ ば ス ペ ー ス フ ィ ラ ー と気 づ くで し ょ うが,そ た め,計
た が っ て,
い か え る と,基 礎 デ ー タ で 切 り捨 て ら れ
様 の 注 意 が 必 要 です.見
⑪ ス ペ ー ス フ イ ラ ー
す.こ
数 の 平 均 値0.5だ
の 端 数 を補 正 し て,い
た 端 数 を復 元 して,47.5と た デ ー タ に つ い て,同
例 示 の 基 礎 デ ー タが 年 齢 だ と し ま
に こ と わ ら な い 限 り 「端 数 切 り捨 て 」で 数 え ま す.し
れ を使 っ て 計 算 す る
算 結 果 で は 「0で な い ス ペ ー ス フ ィ ラー 」 と な る の で す.た
計 算 結 果 で は,「 意 味 の な い 数 値 」が つ け 加 わ っ て,一 か の ご と く表 示 さ れ ま す. こ う い う 意 味 の な い 部 分 を 落 と して よ む べ き で す.
とえば平 均 値 の
見 す る とそ こ まで 意 味が あ る
2.2 中位 値 ・四分 位 偏 差 値 によ る 表 現 ①
偏 差 の 大 き さ を表 現 す る指 標 と して,標
合 に もそ れ を使 え ば よ い と は い え ませ ん.特
準 偏 差 が よ く使 わ れ ます が,ど
に,次
ん な場
に 述べ る大 きな欠点 を もってい る
こ と に 注 意 し ま し ょ う. 標 準 偏 差 の 計 算 値 は,平
均 値 ±標 準 偏 差,す
な わ ち,平 均 値 を 基 準 と し て そ の 上 下
に ひ ろ が り幅 をつ け る 形 で 使 い ま す が, 上 へ の ひ ろが り と下 へ の ひ ろ が り と を同 じ値 で 評 価 し て い る こ とに 注 意 し ま し ょ う. こ うす る こ と は,暗
に,デ
ー タ の 分 布 が 左 右 対 称 型 だ と い う仮 定 を お い て い る こ と
を 意 味 し ます. こ の 仮 定 を受 け 入 れ て よ い で し ょ うか.現
実 に 扱 う デ ー タ に お い て は,そ
うい う仮
定 を 受 け 入 れ が た い ケ ー ス が 多 々 あ りま す. ②
賃 金 の デ ー タは,そ
図2.2.1は1984年
う い う ケー ス の典 型例 で す.
賃 金 セ ンサ スの 報告 書か ら引用 した製造 業 の 男 子従 業 者 の賃 金
の 分 布 表 と,そ の 分 布 図 で す. 右 の 方 へ 長 くひ ろ が っ た 「非 対 称 な 形 」に な っ て い ます. 初 任 給 が ほ ぼ そ ろ っ て い た も の が,そ
の 後 の 昇 給 に よ っ て,大
き い方 へ 変 化 す る 度
合 い が 差 を も た らす た め だ … こ う説 明 で き る で し ょ うが,そ
う い う 説 明 を す る しな
い に か か わ ら ず,賃
の 非 対 称 性 を 明 示 しな
金 の 分 布 に 関 す る事 実 を示 す と き に は,こ
け れ ば な り ませ ん.
図2.2.1
賃 金 の分 布 表 と分布 図(1984年,製
造 業,男)
度 数 は,百
分 比 に して あ り ま す.
分 布 図 をか くため で す. 次 節 で 説 明 し ます が か い て み て く だ さい.右 で す が ….
の 図 の よ うに な るは ず
分 布 図 で は こ の 事 実 が よ み とれ ま す が,平
均 値 と標 準 偏 差 を使 っ て 示 し た場 合 に は
こ の 事 実 が よみ とれ な い こ と に な り ます.標
準 偏 差 を偏 差 の 大 小 を表 わ す 指 標 と し て
使 う こ と に 疑 問 を もつ べ き で す.
大 きい方 向で みた偏 差 と,小 さい方 向でみ た偏 差 を 区別 して計 測す るこ とが必要 ③
四 分 位 偏 差 値 は,こ
う い う場 合 に,標
準 偏 差 に か わ る も の と して よ く使 わ れ る
中 位 値 は,平 均 値 に か わ る指 標 で す が,四
分 位 偏 差 値 を使 う場 合 に そ れ と整 合 性 を
「 偏 差 の 指 標 」で す.
もた せ る意 味 で (平均 値,標 と,セ
準 偏 差)の か わ りに(中 位 値,四
分 位 偏 差 値)
ッ トに し て 使 い ます.
こ れ らの 定 義 は,次
の よ うに 「観 察 値 の 大 き さ の 順 位 」に 注 目 し ま す.
デ ー タ を 大 き さの 順 に 並 べ た と き の 1/4番
目の 値 が 第 1四 分 位 値
2/4番
目の 値 が 第 2四 分 位 値,す
3/4番
目の 値 が 第 3四 分 位 値
で す.こ
れ ら をQ1,Q2,Q3と
な わ ち,中 位 値
表 わ し ま し ょ う.こ れ ら を も と に し て
1/4番
目の 値(第 1四 分 位 値)
2/4番
目の 値(第 2四 分 位 値)
3/4番
目の 値(第 3四 分 位 値)
この差が 四分位 偏差値 この差 が 四分位 偏差値
と,2 つ の 四 分 位 偏 差 値 を定 義 し ま す. こ れ ら の 指 標 は,「 デ ー タ を 大 き さ の 順 に 同 数 を 含 む よ う に 4区 分 」 し た と き の 区 切 り値 で す か ら,自 然 な 見 方 に な っ て い ます. な お,2 つ の 四 分 位 偏 差 値 を わ け る 呼 び 名 は 決 め られ て い ませ ん が,2 つ 1組 と し て使 い ます か ら,区 別 す る 必 要 は な い で し ょ う. ◇ 注 (Q3-Q1)/2が
四 分位 偏 差値 と よば れ て い ま した が,こ れ は,標 準 偏 差 σの 簡 易 推
定値 とい う観 点 で した.本 文 で述 べ た四分 位 偏 差 値 は,「 σを使 う こ とに 対 す る代 案 」とい うち が った観 点で 導 入 した もの です.同
じ用 語 で,同
じよ う な量 を使 い ます が,観 点 の ち
が い に注 意 しま し ょ う. ④
次 ペ ー ジ の 図2.2.2は
り,図2.2.3は(中 ま た,そ
位 値,四
分 布 の 情 報 を(平 均 値,標
準 偏 差)で 代 表 し た もの で あ
分 位 偏 差 値)で 代 表 した 場 合 で す.
れ ぞ れ の 情 報 を 図 示 し た もの が,表
分 布 の 非 対 称 性 が 図2.2.2の
の 右 側 の 図 で す.
表 現 で は わ か ら な い の に 対 し,図2.2.3の
表 現 で はそ
の こ とが,2 つ の 四 分 位 偏 差 値 の ち が い と し て 把 握 で き る こ とに 注 意 して くだ さ い. ⑤
表2.2.4は,四
前 処 理 が 必 要 で す.観
分 位 値 の 計 算 例 で す.「 観 察 値 を 大 き さ の 順 に 並 べ る 」と い う 察 値 の 数 が 多 くて こ の 作 業 を避 け た い と き に は,27ペ
ー ジの
図2.2.2
図2.2.3
表2.2.4
平 均 値,標
中位 値,四
準 偏 差 とそ の 図 示
分位 偏 差値 と その 図 示
中位 値,四 分 位値 の 計 算 フ ォー ム(1) デ ー タ数 が 少 な い 場 合 中位 値 は6×(1/2)番
目の 値
す なわ ち 156 第 l四 分 位 値 は6×(1/4)=1.5番 1番 目は 2番 目は
目 の値
128 134中
をとって
1.5番 目は 131 これ が 第 1四 分 位 値 第 3四 分位 値 は6×(3/4)番 目の 値 174と 求 め られ る
⑥ に 示 す 別 法 が あ り ます. 四 分 位 偏 差 値 は,前
述 した よ うに,こ
れ らの 差 と して 計 算 で き ます.
こ の 計 算 フ ォ ー ム で は 「大 き さ の 順 を 0番 か ら つ け て い る 」こ と に 注 意 し て くだ さ い.こ
の た め,6/2す
な わ ち 3番 目の 値 が
「そ れ よ り小 さ い 値 が 3つ,そ
れ よ り大 き い 値 が 3つ 」
だ と い う説 明 に つ な が り ます. 例 示 で は デ ー タ数 が 奇 数 で し た.偶 ば,(最
高 番 号/2)が2.5の
数 の と きに は,た
と え ば デ ー タ数 6だ とす れ
よ う に 「.5」の 端 数 を も ち ま す か ら,3 番 目 の 値 と 4番 目
の 値 の 平 均(一 般 に い え ば 前 後 の 値 の 平 均)を 中位 値 と し ます. 四 分 位 値 の 場 合 も 同 様 で す が,端 そ の 場 合 に は,前 す.た
とえ ば,1.25番
数 が1/4あ
る い は3/4の
場 合 も あ りえ ます.
後 の 値 に 3対 1 ま た は 1対 3の ウ エ イ ト を つ け て 加 重 平 均 し ま 目の値 は
(1番 目 の値 ×3)+(2番 目の 値 ×1)/ 4
表2.2.5
中位 値,四
分 位 値 の計 算 フ ォー ム(2)
デ ー タ数 が 多 い場 合 デー タ を分 布 表 の 形 に 整 理 して フ ォー ム 1 と同様 に 計 算 す る. 値120ま
で で17%
値130ま
で で42%
10の 増 加 ⇔25%の 3.2の 増 加 ⇔8%の 値123.2ま よ って,第
増加 増加
で で25% 1四分 位 値 は123.2
同様に
図2.2.6
中位 値 は,
133.2
第 3四 分 位 値 は,
144.7
比例配分
表 か ら,(120,17%),(130,42%)の
位 置
を結 ぶ 直 線 をか き ます. この 線 上 で点(X,25%)の
X について
とな って い る こ とか ら, X=120+(130-120)×〓
で す. ⑥ デ ー タ数 が 多 い 場 合 に は,計
よ うに,基
礎 デ ー タ を度
数 分 布 表 に 表 わ した 上 で 計 算 し ま す.度 数 の 累 積 値 を求 め て お く と,そ
れが値 域 の上
限 以 下 の デ ー タ数,い
算 フ ォー ム(表2.2.5)の
い か え る と,デ ー タ番 号 に な っ て い る こ と に 注 意 して,フ
ォー
ム の 右 に 付 記 し た 説 明 をみ て くだ さ い. 要 は,図2.2.6に
示 す 比 例 配 分 の 計 算 で す.
◇ 注 1 図2.2.2に
お い て標 準偏 差 のか わ りに(0.674× 標 準偏 差)を 使 うこ とが 考 え られ
ます.「 箱 の 中に観 察 値 の1/2が 入 る」よ うにす る ため の 調整 です.図2.2.3と
比較 できる
図 に な り ます. ◇ 注 2 中位 値,四 分 位値 の計 算 式 に お け る端 数 の 扱 い に つ い て は,い 異 な った案 が 提 唱 され て い ます.3.7節
くつ か の 観 点 か ら
で補 足 します.
2.3 分 布 に よる 表 現 ①
個 別 デ ー タ リス ト 観 察 値 ひ とつ ひ とつ は,観 察 単 位 に 対 応 す る番 号I と
観 察 値XIの が っ て,右
セ ッ トだ と考 え る こ と が で き ま す.し
た
表2.3.1個
別 デー タ リス ト
表 の よ うに 記 号 化 で き ます.
こ れ を,個
別 デ ー タ リス トと よ ぶ こ と に し ま し ょ う.
も ち ろ ん,こ
の 形 式 に リス トさ れ て い て も,ち が っ た 形
式 で リス トさ れ て い て も,あ
る い は,コ
ン ピュ ー タ の 記
憶 装 置 に 記 録 さ れ て い て も,本 質 は 同 じで す か ら,観 察 単 位 ひ と つ ひ とつ に 対 応 す る 情 報 と い う 意 味 で 「個 別 デ ー タ 」と い う 呼 称 を 使 い ま し ょ う. 統 計 的 な 見 方 で は,こ
れ ら ひ とつ ひ とつ の 要 素 に 注 目す るの で は な く,全 体 を ま と
め て 1つ の バ ッ ジ と み な し,バ
ッ ジ と し て の 特 徴 を よ み と る こ と を考 え ま す か ら,な
ん ら か の 処 理 を加 え る こ と に な り ま す が,そ
の た め の 素 材 と し て,「 情 報 価 値 」を
も っ て い る の で す. 個 別 デ ー タ に 処 理 を加 え る こ と に よ っ て,そ
れ が も っ て い る 情 報 を,「 説 明 し う る
形 に し て い く」,そ れ が 統 計 処 理 だ と位 置 づ け られ る の で す.い
い か え る と,
デ ー タが 潜 在 的 に も っ て い る情 報 を 「顕 在 化 す る手 順 」 が 統 計 処 理 だ と い う こ とで す. デ ー タ が も っ て い る情 報 を落 と す こ とな く,表 現 を 簡 単 化 す る … こ の 原 理 を パ ー シ モ ニ イ(parsimony) と よ び ます.た
とえ ば,バ
ロ ス が 大 きす ぎ る,よ
ッ ジ を lつ の 平 均 値 で代 表 す る と簡 単 化 で き るが,情
っ て,標
準 偏 差 を併 用 し よ う,い
が 個 人 差 に 関 す る情 報 の ロ ス は 防 げ る … い く と きの 指 導 原 理 が,パ ②
分 布 表
こ うい う形 で 統 計 処 理 の 手 法 を組 み 立 て て
ー シ モ ニ イ です.
個 別 デ ー タ(た と え ば 試 験 の 成 績)を 整 理 す る た め に,そ
と つ ひ と つ 読 ん で も ら い,90点 て カ ウ ン ト して い く ….こ
台,80点
台,…
図2.3.2慣
計学でいう 「 分 布 表 」を 求 め る 作
業 手 順 に な っ て い るの で す. した が っ て,こ
の 作 業 に よ っ て,分 布 表 と い
う概 念 を 意 識 し て い な くて も,分 布 表 を使 っ た デ ー タ 整 理 を,実 そ う し て,こ
と わ け て,人
践 して い る の で す.
の 形 に 整 理 した 結 果 は,統
計手
法 と して 重 要 な 基 本 概 念 で あ り,デ ー タ の 特 徴 を 把 握 す る 手 段 に な っ て い る の で す. こ う し て 整 理 手 順 は,統
の値 をひ
数 を 「正 」の 字 を 使 っ
う い う作 業 を した 経 験 を 多 くの 人 は も って い る と思 い ま
す. こ れ が,統
報の
く ら か 扱 い が め ん ど うに な る
計 手法 として重要 な
用 さ れ る デー タ 整理 の 方 法
表2.3.3(a)
分 布 表
図2.3.3(b)
分 布 図
注:端 数 を切 り捨 て た 場 合 は,50∼59.99 の よ うに 表 わ し ます.
意 味 を も ち ます か ら,表2.3.3(a)に
示 す フ ォー ム に ま と め ま す.
こ れ が,「 分 布 表 」で す. 度 数 は,相
対 頻 度 す な わ ち 「総 度 数 を100と
す る 比 率 」で表 わ す の が 普 通 で す.
そ の 場 合 を区 別 す る に は 「頻 度 分 布 」 と よ び ます. 累 積 度 数 に つ い て は 後 で 説 明 しま す. ③
分布 図
分 布 表 を 図2.3.3(b)の
よ う に 図 示 し た も の を,分
布 図 とよ び ま
す. 表 で も図 で も 原 理 は 同 じ です が,分 有 効 で す.分
布 の 形 を よみ と り比 較 す る に は,図
を使 う方 が
布 図 で は,
値 域 の 区 切 り幅 に 対 応 す る 幅,度 に と っ た 棒 を列 記 し ます.た
数 に対応 す る高 さ
だ し,度 数 は,値
域 の幅 の 大 小 に 関 係 し ます か ら,値 域
の 幅 が 等 し く な い 値 域 が あ る場 合 に は, あ る標 準 幅 を想 定 し,標 準 幅 あ た りの 度 数 に 換 算 した もの を使 い ます.た 表2.3.4は,こ
と え ば,値
域 の 幅 が 2倍 と な っ て い る箇 所 で は 高 さ を1/2と
う い う調 整 を適 用 し て分 布 図 をか い た例 で す.図2.2.1の
し ます. 右 側 に示
して あ っ た もの で す. 図 の 点 線 は,幅
の ち が い に対 す る 調 整 を し て い な い 場 合 の 棒 で す.説
き足 した も の で す か ら,実 際 に は,か
き ませ ん.
④ 分 布 表 や 分 布 図 を か く と き に は,値
域 の数 を適 当 に 決 め る こ とが 必 要 で す.
分 布 の 形 を よ み と る た め に使 う もの で す か ら,よ をみ て,区 分 数 を増 や し た り,減 図2.3.5は,賃
明の ため に書
み と りや す くな っ て い る か ど うか
ら し た り し て適 当 な 区 分 数 を探 索 し ま し ょ う.
金 の デ ー タ に つ い て 3 とお りの 区分 数 で か い た 分 布 図 で す.
も との デ ー タ は 同 じ で も,区 分 の と りか た に よ っ て,こ え る 図 に な り ま す.区
の よ うに ち が っ た 印 象 を 与
分 数 が 少 な い と,ピ ー クの 位 置 が は っ き りつ か め ませ ん.区
分
数 が 多 す ぎ る と,不 規 則 な 凹 凸 が め だ っ て 形 を つ か み に く くな り ます. 「で は 区 分 数 を い くつ ぐ ら い に す れ ば よ い か 」と い う こ と に な り ます.こ よ う とす る 公 式(ス タ ー ジ ェ ス の 公 式)も あ り ます が,分
れに答え
布 形 に 関 して あ る仮 定 をお
表2.3.4
分 布 図 をか くた め の 計 算 と分 布 図
値域幅の ちが いに対応する調整が必要. 図2.3.5
区 分 数 をか え た 分 布 図の 例
い て 誘 導 さ れ た もの で す か ら,「10前
後 と い う程 度 で,試
し て み る」 とい う方 針 で 十
分 で す. 図1.4.3(13ペ
ー ジ)の 高 年 齢 の 分 布 図 の よ う に,分
布 形 が 双 峰 形 に な っ て い て,
異 質 な デ ー タが 混 在 して い る可 能 性 が あ る と き,区 分 数 が 少 な い と,そ れ を 見 逃 し て し ま い ます.し
た が っ て,こ
う い う事 態 が 予 想 さ れ る と き に は,区
分 数 や 区 切 り方 を
工 夫 し ま し ょ う. ⑤
デ ー タの 区 切 り を 「切 りの よ い 値 に す る 」方 針 を と るの が 普 通 で す が,観
察値
自体 が ラ ウ ン ドされ て い る 場 合 な ど,「 切 りの よ い 値 が 中 心 に な る よ う に す る 」方 針 を と る 方 が よい と され る場 合 も あ りま す.
切 りの よ い 値 を区 切 り値 と し た例 100∼200,200∼300,300∼400,…
切 りの よ い 値 を 中心 と し た例
値 域 の 表 示 に お い て100∼200と
150∼250,250∼350,350∼450,…
せ ず100∼199と
し,ち
明 示 せ よ と い う コ メ ン トが あ るか も しれ ませ ん が,2.1節
ょ う ど200の
場合 の扱 い を
の ⑨ で 説 明 し た よ うに,
種 々 考 え るべ き点 が 関 連 して き ま す. 区 切 り幅 が 等 し く な い と き に は 「 標 準 幅 あ た りの 度 数 に 換 算 」す る こ とが 必 要 だ と 注 意 して お き ま した.統 の が よ くあ りま す.す
計 書 に 掲 載 さ れ て い る分 布 表 に は,こ
う い う調 整 を要 す る も
べ て の 範 囲 を 等 間 隔 に 区 切 ろ う とす る と 区 分 数 が 多 くな る,区
分 数 を一 律 に 減 ら そ う と す る と,ピ ー クの 部 分 の 表 示 が 粗 く な る ….こ
う い う理 由
が あ る の で す. ま た,一 番 小 さい 区 分 の 下 限 あ る い は 一 番 大 き い 区 分 の 上 限 が 明 示 され て い な い 場 合 も あ り ま す.度
数 が 少 な け れ ば それ を ど う想 定 して も 図 に は ひ び き ませ ん が,度
が 多 い と き に は 困 り ま す.こ ⑥
こ れ ま で の 例 示 で は す べ て,観
ま した が,こ
数
の場合 の対 応策 につ い ては後 の節 で考 えます. 察 値 の 値 域 を 「観 察 値 そ の も の 」で 区 切 っ て い
れ 以 外 の 考 え 方 が あ り え ます.
た と え ば,賃
金 の 分 布 の 年 次 変 化 をみ る場 合,経
わ りま す か ら,同
じ10∼20万
られ て い た もの が,低
円 とい っ て も,あ
済成 長 に ともなって貨 幣価値 が か
る時期 に は平 均 的 な所得 階 級 だ とみ
所 得 区 分 とみ られ る こ とに な る で し ょ う.い
い か え る と,名
目
上 の 金 額 で 階 級 わ け す るの で な く,相 対 的 な 位 置 に 注 目 し て 階 級 わ け す る方 が よい … そ う い う場 合 が あ り ます. そ う い う場 合 に 採 用 され るの は,値 上 位1/5,
中 の 上1/5,
の よ うに 区 切 る方 法 で す.こ た い と き に は,同
中 の 下1/5,下
れ を,「 五 分 位 階 級 」 と よ び ます.さ
じ観 点 で10区
表2.3.6
の 大 き さ の 順 に 注 目 して,た
中 の 中1/5,
とえば
位1/5 らに細 か く区分 し
分 し た 「十 分 位 階 級 」が 使 わ れ ます .
家計 調 査 で採 用 さ れ て い る分 布 の 情 報 表 現
表2.3.6は,家 ⑦
計 収 入 の 分 布 に つ い て の 実 例 で す.
累 積 分 布 表,累
積 分布 図
分 布 表,分
布 図 で は,値
域 を 「い くつ か ら い くつ
ま で 」と い う 区 切 り方 を し て値 の 分 布 をみ て い ます が,「 い くつ 以 下 の 範 囲 」と い う 区 切 り方 に 対 応 させ て値 の 分 布 を み る こ と も考 え られ ます.こ
の 見 方 で は,
S1=N1 S2=S1+N1=N1+N2 S3=S2+N2=N1+N2+N3
と度 数 を 累 積 し た もの を 表 示 ま た は 図 示 す る こ と と な るの で,累
積 分 布 表,累
積 分布
図 と よび ます. 表2.3.7は,表2.3.4に
対 応 す る 累 積 分 布 表 と累 積 分 布 図 で す.
累 積 分 布 図 で は,棒
を 列 記 す る 形 で な く,折 れ 線 で 表 わ す の が 普 通 で す.「 値 域 の
上 限 と そ れ ま で の 累 積 度 数 の 関 係 」を み る と い う趣 旨 か ら,棒 横 軸 は,分 す が,縦 す.そ
の 右 肩 を 結 び ます.
布 図 の 場 合 と同 じ く,「 分 布 を み よ う とす る変 数 X 」の 値 を示 して い ま
軸 が 「X ま で の 頻 度 を足 し あ げ て い っ た も の 」で す か ら,右 上 が りに な り ま う し て,X
の 頻 度 が 大 き い と こ ろ で 大 き く増 加 す る,す
な わ ち,傾
斜が急に
な っ て い ます. こ の例 の 場 合,分
布 図 の ピー ク の 位 置 に あ た る10の
付 近 で急 傾斜 に な ってい るこ
とが 確 認 で き る で し ょ う.し か し,「 ど の 辺 の 値 が 多 い か 」を み る に は,分
布 図 の方
が よ み や す く,そ の た め に 累 積 分 布 を 使 う必 要 は あ り ませ ん. 累 積 分 布 は,主
と して 「分 布 の 形 を 扱 う理 論 」で 使 わ れ る もの と 了 解 し て お け ば よ
い もの で す が,分
布 形 の 比 較(第 7章)や 四 分 位 値 の 計 算(2.2節)で,こ
表2.3.7
分 布 図 をか くため の 計 算 と 累積 分 布 図
の 表 現 を使
図2.3.8(a)
デー タ整 理 法
図2.3.8(b)
幹 葉 表 示 の イ メー ジ
い ます. こ こ で は,も ⑧
幹葉 表示
ま す.そ
布 表,分
布 図 に つ い て の考 察 を つ づ け ます.
分 布 表 あ る い は分 布 図 は,デ
ー タ 整 理 の 作 業 用 とい う意 味 が あ り
の こ と を意 識 し て,幹 葉 表 示 とよ ば れ る 「表 示 法 」が 提 唱 さ れ て い ます.
表2.3.2に に,値
とに も ど っ て,分
示 し た デ ー タ整 理 手 順 で は 度 数 を表 示 し ま し たが,図2.3.8(a)の
よう
を記 録 して お く こ とが 考 え ら れ ま す.
まず,デ
ー タ を図2.3.8(a)の
す る と,60台,70台
形 に 整 理 して み ます.
が 最 も 多 い が,80台
も 多 い,そ
さ れ て い る 6デ ー タ 中 3つ が ち ょ う ど60に
の あ た りが 中 心 だ が,60台
な っ て い る の が 気 に な る,こ
と
の よ う に,
分 布 の 形 を 細 か く観 察 で き る こ と に な り ます. こ の 形 に お け る40∼,50∼,60∼,な 察 値45,40,48,な
ど を 幹 に お け る枝 わ か れ の 位 置 とみ な し,観
ど を,そ れ ぞ れ の 枝 に つ い た 葉 だ と み た て て,図2.3.8(b)の
に 表 わ し,こ れ を 「幹 葉 表 示 」(stem and 原 理 は 同 じで す か ら,図2.3.8(a)や
leaf display)と
よう
よ び ます.
次 に 説 明 す る 図2.3.9も,幹
葉表 示 とよ ん で
よ い で し ょ う. ⑨
分 析 過 程 と い う意 味 で は,ま
ず,デ
ー タの 区 切 り幅 の 決 め 方 か ら考 え る こ とが
必 要 で す. 「切 りの よ い 区切 り」で す か ら,ま ず10の が 細 か す ぎ る な ら20の
倍 数 で 区 切 っ て み る,そ
う し て,区
切 り
倍 数 で 表 示 し な お し,区 切 りが 粗 す ぎ る な ら 5の 倍 数 で 表 示
しな お す … こ うい う使 い 方 を 予 想 す る と,分 布 図 と ち が っ て 棒 の 中 に 数 字 を 入 れ て あ る と こ ろ が い き て き ます.す
な わ ち,区
切 り方 を変 更 し た 書 き換 え が 簡 単 に で き ま
す. 幹 葉 表 示 で は,各 枠 外 に お き,枠
棒 の デ ー タ の 共 通 部 分(図2.3.9(a)の
例 で は10の
桁 の 数 字)を
内 に は そ の 後 に つ づ く部 分(こ の 例 で は 1の 桁 の 数 字)だ け を お く表
わ し方 に し ま す. 分 布 図 は,こ の 端 数 部 分 を 無 視 す る こ とに よ って 「 分 布 の 形 を み よ う」 とす る もの だ と解 釈 で き ま す.
図2.3.9(a)
幹 葉 表 示 の 表 現 例(1)
図2.3.9(b)
幹 葉 表示 の 表 現 例(2)
共通 部 分 とそ の 後 の 部 分 を わ け て 表 示.
この 図 で は,横 軸 の値 域 の 表 現 に お い て,「 *」 を0∼9を 代 表 す る 記 号 と し て 使 っ て い ま す が,こ の 幹 葉 表 示 を提 唱 したTukeyは,5 き ざ み に す る場 合 や ,2 き ざみ に す る場 合 に 対 し て,次
図2.3.9(c)は,5
の 記 号 を使 う よ うに 提 案 し て い ます .
き ざ み に し た 例 で す.
図2.3.9(c)
幹 葉 表示 の 表 現例(3)
区 分 6・の と こ ろ で 0が 多 い こ とが 気 に な り ます.こ り,60点
の デ ー タ は 「試 験 の 評 点 で あ
未 満 が 不 合 格 と さ れ る」 もの だ と い う こ と を考 慮 に 入 れ る と,6 ・の う ち の 3
人 を 5 *の と こ ろ に うつ す こ と で,「 分 布 の 真 の 形 」を よみ と る こ と が で き ま す .「 合 格 者 の得 点 分 布 と不 合 格 者 の 得 点 分 布 が わ か れ る」… 考 え ら れ る例 で す ね . 「分 布 の 形 を み る」 と い う 問 題 で は,な す か ら,こ す.
の例 の よ うに,計
ぜ こ うい う形 に な っ た か を 説 明 し た い の で
測 値 が 求 め られ る過 程 な ど を考 慮 に 入 れ る こ とが 必 要 で
⑩
2変 数 の 場 合 の 幹 葉 表 示
こ れ ま で の 幹 葉 表 示 で は,棒
の位 置決 め の ため に
使 うデ ー タ と,棒 の 中 に 表 示 す る デ ー タ は 同 じ もの で し た. こ れ に 対 して,図2.3.9(d)の
よ うに,棒
の位 置 を決 め る た め の デ ー タ X,棒
に 表 示 す る デ ー タ Z を ち が っ た もの に す る こ と も考 え ら れ ま す.例
示 で は,Z
の中 の値
が M ま た は F に 二 分 さ れ る もの と して い ます. この形 の幹葉 表示 に よって X の 変 化 に 対 す る Z の 効 果 を み る こ とが で き ま す.例
示 の 場 合 は,
X の 大 き い部 分 ほ ど,Z
の 区 分 が M の もの が 多 い
こ とが よ み と れ ます. ◇ 注 Z が 2区分 の場 合 に つ い ては,図2.3.9(e)の
図2.3.9(d)
幹 葉 表 示 の 表 現 例(4)
2変 数 の 関 係 を み る 場 合,X し,Z
よ うに 表 わす こ とが 考 え られ ます.
図2.3.9(e)
幹 葉 表 示 の 表 現 例(5)
で位 置 決め
を表 示.
「変 数 X の分 布 をみ る 」もの で は な く,「 X と Z の 関係 を み る 」もの に な っ て い る.
2.4 分布 形 のモ デ ル ①
観 察 値 の 分 布 図 を み る と,「 1つ の ピ ー ク が あ り,そ れ か ら 離 れ る に つ れ て低
くな る」 とい う形 に な って い る こ とが 多 い で し ょ う.し た が っ て,観 け る 細 か い 凹 凸 に と らわ れ ず,な
察 値 の 分布 にお
め らか な カ ー ブ で 表 わ さ れ る分 布 形 を 想 定 して 「 観
察 値 の 分 布 」に 関 す る 一 般 的 な 説 明 を 展 開 で き る よ う に す る … そ の た め に,統
計学
で は,デ ー タの 分 布 形 を
「 現 実 に観 察 され た 分 布 形 」と
「そ の モ デ ル と い うべ き あ る 標 準 的 な 形 」
と を 区別 し ます. た だ し,観 察 値 の 分 布 図 に お い て,棒
の ア タ マ をつ な ぐ 「な め ら か な 線 を書 き 込
む 」 と簡 単 に 扱 え る問 題 で は あ りませ ん, 統 計 学 の論 理 と し て は,
観 察 値 の もつ 偶 然 的 な 変 動 を消 去 し て,
その背 後 に あ るモデル を示す とい う意 図 を も っ て い るの で す か ら,「 なめ らか な 線 を書 き込 む 」こ と を 「モ デ ル を考 え る 方 向 へ 進 む 第 一 歩 」 とみ な す べ き で す.そ
して,モ
デ ル と い う 以 上,「 観 察 値 の
分 布 図 を な め らか な 曲 線 で つ な ぐ」 と い う基 準 だ け で な く,「 ど う い う状 況 下 で こ の 形 に な る こ とが 多 い 」 とい っ た 論 拠 を も ち う る も の を使 うべ き で す. ② ま た,あ
る分 布 形 を採 用 す る理 論 的 根 拠 づ け が あ っ て も,い
る パ ラ メー タ を 含 む の が 普 通 で す.た
くつ か の か わ り う
と え ば,「 分 布 の 位 置 」 と 「分 布 の ひ ろが り幅 」
の ち が い は,「 形 」の ち が い で は な く,パ
ラ メ ー タ(形 を表 わ す 指 標 の 数 値)の ち が い
と して 扱 う の が 普 通 で す. す で に 説 明 し た 平 均 値 は位 置 の 指 標 で あ り,標 準 偏 差 は ひ ろが り幅 の 指 標 で す. た だ し,そ れ らの ち が い で は 説 明 で き な い 部 分 が 残 り ます か ら,位 を そ ろ え た 上 で,分
置 とひ ろ が り幅
布 の 形 を み る(数 理 で は こ うす る こ と が 多 い)か,パ
数 や 選 び 方 な ど を 工 夫 して,パ
ラ メー タ の
ラ メー タ の ち が い と し て 説 明 で き る 範 囲 を ひ ろ げ る
(次 節 で 説 明)こ と を考 え ます.
◆ 分布形の比較(一般) 位 置 の ち が い ひ ろ が り幅 の ち が い
形 の ち が い
形 の ち が い(位 置 と幅 を そ ろ え て) この フ レ ー ム で 「位 置 と幅 を そ ろ え る 」こ とは,変
す な わ ち,偏
数 X を 扱 う と きに,
差 値 に お き か え る こ とを 意 味 し ま す.
こ の お きか え を 「標 準 化 」と よ び ま す. な お,次
項 で 説 明 す る正 規 分 布 は,2 つ の パ ラ メー タ を含 み,そ
と,分 布 の 形 は 確 定 し ます.し と 同 等 とな り ます.い
れ ら の 値 を定 め る
た が っ て,「 形 の 比 較 」は 「2つ の パ ラ メー タ の 比 較 」
いか え る と
モ デ ル の タ イ プ を 「正 規 分 布 」と想 定 で きれ ば, デ ー タに フ ィ ッ トす る よ う に 2つ の パ ラ メー タ を 選 ぶ こ と で,デ
ー タに フ ィ ッ トす る分 布 形 を見 出 す こ とが で き るの で す .
◆ 分布形の比較(正 規分布の場合)
位 置の ちが い ひろが り幅の ちが い
形 の ちが い
特定 の形 に な る(標 準正 規 分布) 正 規 分 布 以 外 の 場 合 も,た
い て い は,位
置 を 示 す パ ラ メー タ,ひ
ろ が り幅 を 示 す パ
ラ メー タ と解 釈 さ れ る パ ラ メー タ を含 ん で い ます か ら,こ れ ら 2つ を 「 分 布 形 を比べ る」問 題 と切 り離 し て 扱 う こ とが で き ます.
こ れ ら の パ ラ メー タ で 決 ま ら な い 部 分 の 比 較 は,こ で形 を比 較 す る の が 普 通 で す が,形
れ ら の パ ラ メ ー タ を そ ろ え た上
の 比 較 は め ん ど うで す か ら,た
と え ば,分
布形の
「左 右 非 対 称 度 」 を 表 わ す パ ラ メ ー タ な ど を 導 入 し て,数 値 の 比 較 と し て 扱 え る 範 囲 を ひ ろ げ る こ と を考 え る の が ひ とつ の 代 案 で す が,問
題 が ひ そ ん で い る の で,3.2節
の ⑤ で 説 明 し ます. ◆ 分 布 形 の 比 較(パ ラ メ ー タ を増 や す扱 い)
位 置 の ち が い ひ ろ が り幅 の ちが い
形 の ちが い
そ の他 の 指 標 で み た ち が い ③
正 規 分布
② で 述 べ た よ う に,分
布 形 の モ デ ル の ひ とつ と し て,正
規 分布
(ま た は ガ ウ ス 分 布)が あ り ます. これ は 同 一 条 件 下 で 観 察 を く りか え して 得 られ た 「多数 の デ ー タの 平 均 値 」 を扱 う と き に 適 合 す る こ とが 多 い こ とか ら,そ
う い う場 面 を 想 定 して 誘 導 され た 理 論 モ デ ル で す.自
デ ー タ を扱 う場 合 に こ の 正 規 分 布 を 想 定 す る こ とが 多 い の は,そ
然科 学 分 野の実 験 う い う理 由 が あ るか
らで す. し か し,非 実 験 デ ー タ を扱 う社 会 科 学 の 分 野 で は,「 同 一 条 件 と い う想 定 は 無 理 」 で あ り,「 正 規 分 布 を 想 定 で き る場 合 は,ほ だ し,そ
の こ と を承 知 の 上 で,ひ
こ の 分 布 形 は,次
と ん ど な い」 こ と に 注 意 し ま し ょ う.た
とつ の 参 考 に す る こ とは あ り え ます.
の 式 で 表 わ さ れ ま す.
こ の 式 に お け るexp(X)は
X が1,2,3,…
か わ る 指 数 関 数 で す が,倍
数10の
と変 化 し た と き1,10,100,…
か わ り に,あ
と等 比 的 に
る 定 数e(2.71828…)を
使 う もの で
の と こ ろ が ピ ー ク に な り,左
右 対称 に な って
す. こ の 形 は,図2.4.1の
よ う に,X=μ
い ま す.
ま た,X=μ
± σの と こ ろ で 変 曲 点 と な って
い ま す. こ の 分 布 に
X を,
と お き か え て 扱 う と(標 準 化 す る と い い ま す), 標 準 化 した 値u の 分 布 形 は
図2.4.1
正 規 分 布
図2.4.2
標 準正 規 分布 と比 較 す るた め の 計 算(男,40∼49歳,1985年)
この 表 か ら
これ を使 っ て偏 差 値 と幅 1あ
統 計 数値 表 を使 って標準 正規 分布 の
平 均 値=135.1
た り換 算 値 を計 算 し,分 布 図
カー ブ を書 き込 ん で 比 較 で き る.
標 準 偏 差=17.0
をか く.
と表 わ さ れ ま す.こ
れ を,標
準 正 規 分 布 と よ び ま す.
正 規 分 布 形 は 2つ の パ ラ メー タ μ,σで 決 ま る形 に な っ て い ま す.そ
う して,こ
れ
らの パ ラ メー タは, μ=∫xf(x)dx,σ2=∫(x-μ)2dx と し て 求 め ら れ ま す.し
た が っ て,モ
デ ルf(X)の
か わ りに観 察 値 の 分 布 を お き,積
分 の か わ りに 和 で お きか え る と μ=Σxf(x),
σ2=Σ (x-μ )2f(x)dx
とな る こ とか ら,こ れ らの パ ラ メー タ が,そ
れ ぞ れ 平 均 値,分
散 に 対 応 して い る こ と
が わ か り ま す. ま た,こ 均 値,標
の こ とか ら,デ ー タ に も とづ く平 均 値,標
準 偏 差 が 得 られ て い る と き,平
準 偏 差 が こ の μ,σ と一 致 す る正 規 分 布 を え が く こ と が で き ま す.ま
た,観
察 値 の 分 布 が 正 規 分 布 に 合 致 し て い る か ど うか を調 べ る こ と も で き ま す. ④
図2.4.2は,こ
の ため の 計 算 例 と,え が か れ た 分 布 比 較 図 で す.
理 論 的 モ デ ル と比 べ る ため に 観 察 値 の 分 布 図 をか く と きに は,デ き か え た 上,区
ー タ を偏 差 値 に お
分 幅 1,す な わ ち偏 差 値 1に 対 応 す る 度 数 に 換 算 し,そ れ を 高 さ とす
る 点 を つ ら ね て 分 布 図 を か き ま す.そ
の 図 に,統
計 数 値 表(後 述 ⑤)を 使 っ て,標
準
正 規 分 布 の カ ー ブ を書 き込 ん で 比 べ て み る の です. こ の 例 で は,「 正 規 分 布 だ と仮 定 で き な い 」 と判 定 で き ま す.も く区切 っ て 分 布 図 をか く と は っ き り し ま す が,後 で,こ
う少 し値 域 を 細 か
で も っ と簡 単 な 方 法 を 説 明 し ます の
れ で や め て お き ま し ょ う.
◇ 注2.3節
の⑤ で 「 分 布 図 を か く と きの 値 域 は切 りの よい 値 で 区 切 れ」と い い ま し た
が,平
均 値 ±K×
標 準 偏 差 (K=0,1,2,…
図2.4.3 統計数 値表の読み方
)の と
こ ろ で 区 切 る の が 有 効 な 代 案 で す. デ ー タ 数 が 多 け れ ば,K=0.0,0.5,1.0,1.5, … で も よ い で し ょ う.い ず れ に し て も,偏
差値
に お き か え て 扱 う こ と と 同 等 で す.
⑤
標 準正 規分 布 に関 す る数値 表
この標
準正 規分布 に関 して は,図 の U におけ る分布 曲線の 高 さ Z=φ(u)
Uαに対 応す る確率 αに対 応す る区切 り値
α=Q(u)
Uα
を求 め る数 値 表 が た い て い の テ キ ス トに 掲 載 され て い ま す.ま
た,こ
れ らを計算 す る
プ ロ グ ラ ム も あ り ま す. 表2.4.4は,そ
の 一 部 で す.
◇ 注 Uα を αパ ー セ ン ト点 と よび ます.棄 却 限 界 とい う呼 び 方 もあ りま す が,第 5章 で 説 明 す る 「 仮 説検 定 」の場 面 の用 語 で あ り,ま た,そ の 場 面 で は種 々 の使 い わ け が 必 要 で す か ら,一 般 に は,パ ー セ ン ト点 とよぶ こ とに しま し ょ う. くわ しい 数 値 は こ れ ら を 使 っ て 求 め るべ き で す が,次
の こ とは 知 っ て お くと よ い で
し ょ う. │U│<1
の 範 囲 に デー タ の 約2/3が
包 含 さ れ る.
│U│<0.674 の 範 囲 に デー タ の約1/2が
包 含 さ れ る.
│U│>2
の 範 囲 に 入 る デ ー タ は ほ ぼ5%
U=0
の と こ ろ で Z は1/√2π す な わ ち ほ ぼ0.40で
表2.4.4
ある
⑥ 正 規 確 率 紙 タ に つ い て,そ
図2.4.5
正規 分 布 に したが うデー
正規確率紙 の使用例
の累積 分布 が直 線 に な る よ うに
目盛 り の と りか た を 定 め た 方 眼 紙 が あ り,正 規 確 率 紙 と よ ば れ て い ます. こ の 正 規 確 率 紙 は,市 販 され て い ます. 実 際 の 観 察 値 に つ い て,そ
れ が正 規 分 布 に し
た が う と仮 定 して よ い か ど うか を 判 定 す る た め に,こ
の 正 規 確 率 紙 を 使 う こ と が で き ま す.
図2.4.5は,図2.4.2の に お き か え た 上),正 の で す.ま
分 布 図 を(累 積 分 布 規 確 率 紙 に プ ロ ッ トし た も
た,表2.4.6は
その た め に必 要 な計
算 で す. こ の デ ー タ で は,
直 線 とな っ て い な い ⇒ 正規分 布 だ といえ ない
と判 定 で き ます. ◇ 注 UEDAに 図2.4.2を
は,こ の 方眼 紙 をプ リン ト出 力 す るプ ログ ラム を用 意 して あ ります.
か くため に 必 要 だ っ た 計 算 と比 べ て,図2.4.5を
プ ロ ッ トす る た め の 計
算 は ず っ と簡 単 で す. こ の 図 の 縦 軸 の 目盛 りは,%
の 値 が き ざ ま れ て い て も,座 標 の 位 置 の 実 寸 は,%
の 値 で な く,そ の % に 対 応 す る 偏 差 値(図 の右 側 の ス ケ ー ル)に な っ て い ます. 第 7章 で,こ ⑦
の こ とに 関 す る 説 明 をつ づ け ます.
正 規 確 率 紙 を使 う だ け な ら,⑥
の 説 明 で 十 分 で し ょ うが,後
の 章 の説 明 に つ
な げ る た め に,「 そ の 仕 組 み 」に つ い て 補 足 して お き ま し ょ う. こ の 図 に プ ロ ッ トす るの は,X
表2.4.6
と P(x<X)の
関 係 で す.し
た が っ て,累
正 規 確 率 紙 に プ ロ ッ トす る ため の計 算
⇒120以
下 の 度 数 が17.0%.
よ って 横 軸120,縦
軸17.0
の と こ ろに 点 を と る. 他 の 箇 所 に つ い て も 同様 に 点 を と り,線 でむ す ぶ.
積 分布 図
図2.4.7
で す.こ
正 規 確 率 紙 の 原理
の 図 上 の 曲 線 は 分 布 の 形 に対 応 し,直 線 に な る と は 限 り ませ ん.正
規分 布 に
した が う場 合 も そ う で す. そ こ で,正
規 分 布 に し た が う場 合 に,そ
れ が 直 線 に な る よ う,目 盛 りの と りか た を
か え た(変 数 変 換 し た値 を 軸 に と る よ うに した)の が,こ こ の 変 換 に よ っ て,縦
の 正 規 確 率 紙 で す.
軸 に とっ た P の 値 が 「 正 規 分 布 が あて は まる とした場 合 の
X(以 下 X*と 表 わ す)」 に お き か え られ た と解 釈 で き ま す. よ っ て,意
味か らい う と
X の観察値 → 累積 頻 度 P → 正 規 分 布 が あ て は ま る と仮 定 し た 場 合 の X* と対 応 づ け られ た こ とに な り ます. い い か え る と,P
に 対 応 す る X と X*の 関 係 を プ ロ ッ トし た 図 に な っ て い ます.
よ っ て,「 X と X*の 関 係 」を よむ こ とが で き ます. ⑧ 変 数変 換
X そ の もの で な く,適 当 な変 換 を加 え た 値 に つ い て,正
を想 定 で き る こ と も あ り ま す.た
と え ば,所
得 X の 分 布 は,Y=logXと
扱 う と,正 規 分 布 と想 定 で き る こ とが あ りま す.た 在す る とみ な さ れ る場 合 な どが,こ 図2.4.8は,観
とえ ば,賃
規分布
変 換 して
金 の よ うに,下
限 が存
れ に あ た りま す.
察 値 の 分 布 を対 数 変 換 し た分 布 図 を か くた め の 計 算 例 と,変 換 前 後
の 分 布 図 で す. 計 算 部 分 に 関 して は,図2.4.2に
示 し た 標 準 化 の た め の 計 算 と ほ ぼ 同 じ で す が,
「 観 察 値 を 対 数 変 換 す る た め の 計 算 」が つ け 加 わ っ て い ます. ⑨
変 数 変 換 は 種 々 の 目的 で 適 用 さ れ ま す が,そ
の ひ と つ と し て,「 分 布 形 を左 右
対 称 な タ イ プ に 変 換 す る 」 とい う場 合 が あ り ま す.た
と え ばY=(XP-a)/bの
形の
図2.4.8
変 換 ルー ル を,P は Y の 平 均 が0,標
分 布 形 の 対数 変 換
を適 当 に 選 ぶ こ とに よ っ て み つ け る 方 法 が 提 唱 さ れ て い ま す(a,b 準 偏 差 が 1に な る よ うに 決 め る).
2.5 平均 値 の 分 布 ①
こ れ ま で の 節 で は,観
察 値 の 分 布 に 注 目 して い ま した.そ
う し て,平
準 偏 差 を 「分 布 形 の 特 徴 を 表 わ す 指 標 」 と して 使 って い ま し た が,ひ
均値 や標
とつ ひ とつ の観
察 単 位 の もつ 個 別 性 を 無 視 し て 「平 均 値 に 注 目す れ ば よ し」 と さ れ る 場 面 も あ りま す. こ こ で は そ の 場 面 に つ い て 考 え ま し ょ う. ②
そ の 場 合 も 「平 均 値 は 観 察 単 位 の も つ 個 別 性 と 無 関 係 だ と は い え な い 」こ とに 図2.5.1
「N 個 の 観 察 値 の 平均 値 」200組 の 分 布 図
注 意 し ま し ょ う. た とえ ば, 「N 個 の 観 察 単 位 に つ い て 調 査 し, そ の 結 果(N 個 の観 察 値)の 平 均 値 X を求 め る」 と い う実 験 を R 回 く りか え して,R
個 の 平 均 値 を求 め た と し ま し ょ う.
現 実 の 場 面 で R 回 く りか え す とい うこ とで は な く,X
の 性 質 を考 え る た め に R 回
く りか え し た と考 え る の で す. R 個 の 平 均 値 は 一 致 す る と は 限 りま せ ん.し
た が っ て,R
個 の 平均 値 のバ ラツ キ
が ど の 程 度 か を評 価 す る こ とが 必 要 と な る で し ょ う. ③
5個(N)の
観 察 値 の 平 均 値 X を200組(R)求
の 平 均 値 の 分 布 図 が,図2.5.1の
a で す.
ま た,図2.5.1の
場 合,図2.5.1の
d はN=40の ④
b はN=10の
場 合(R は い ず れ も200)で
め た と し ま し ょ う.こ れ ら R 組
cはN=20の
場 合,図2.5.1の
す.
これ らの 図 か ら N が か わ っ て も,分 布 図 の位 置 は か わ らな い こ と N が 大 き く な る と分 布 図 の ひ ろ が り幅 が 狭 く な る こ と
が わ か り ま す. こ れ らは,「 N 個 の 観 察 値 の 平 均 値 」の 分 布 図 で す か ら, 平 均 値 をμN,
標 準 偏 差 を σN
と表 わ し ま し ょ う. こ れ らに つ い て,統 計 学 の 数 理 で μN=μ1,
σN2=〓
が 成 り立 つ こ とが 証 明 さ れ て い ます. 例 示 し た 図 に つ い て そ の こ と を確 認 で き ま す.す な わ ち,NσN2を 計 算 す る と,N =5 ,10,20,40に 対 して6749,8480,7152,7277で す.ほ ぼ 一 定 とみ て よ い で し ょ う. ⑤
「ほ ぼ 一 定 」 とい っ た こ とに つ い て,補
足 が 必 要 で し ょ う.
μや σな どの 指 標 値 は 観 察 単位 の 選 び 方 な ど の 影 響 を 受 け ま す か ら,正 確 に 等 し くな る と い う こ と で は な く,「 観 察 単 位 の 選 び 方 な どの 影 響 を 除 去 し た ら等 し くな る」 とい う性 質 を もつ と い う こ と です. 統 計 学 で は,「 観 察 単 位 の選 び 方 を か え て 観 察 す る 」こ と を 何 回 も く りか え し て(③ の 記 号 で い う と R を 大 き く して),得 何 回 も く りか えす こ とに よ っ て,観 こ とか ら,こ
ら れ た 結 果 の 平 均 値 を 「期 待 値 」と よ び ま す.
察 単 位 の 選 び 方 の 影 響 が 消 去 さ れ る と期 待 さ れ る
う よ ぶ もの と理 解 して くだ さ い.
期 待 値 を表 わ す 記 号 E()を E(μn)=μ1,
使 う と,④
E( σn2)=〓
に 示 し た 関 係 式 は,
図2.5.2
平 均 値 の 分 布(正 規 確 率 紙 に プ ロ ッ ト)
と表 わ さ れ ます. こ の 関 係 か ら,観 察 単 位 の 選 び 方 の 影 響 が あ る に し て も,N
が 大 き く な る と,平
均 値 は 一 定 値 に 近 づ くこ とが わ か り ま す. ⑥
ま た,平 均 値 の 分 布 の 形 に つ い て も,N
に よ っ て か わ り ま す が,
N が 大 き くな る と,平 均 値 の 分 布 は 正 規 分 布 に 近 くな る こ と も証 明 され て い ます.中 そ の 証 明 は,数
心 極 限 定 理 と よ ば れ る も の で す.
理 統 計 学 の テ キ ス トを参 照 し て くだ さ い.こ
した 「 正 規 確 率 紙 」を使 っ て 確 認 して お き ま し ょ う.図2.5.2で こ の例 の場 合 N が20の ⑦
実 際 の 問 題 で,②
ん が,平
こ で は,2.4節
で説 明
す.
場 合 で も,「 正 規 分 布 に 十 分 近 い 」こ と が わ か り ます. に 述 べ た よ うな 「く りか え し実 験 」 を行 な え る と は 限 り ませ
均 値 を使 う こ と の 根 拠 は こ れ らの 性 質 を使 っ て理 論 構 成 で き る の で す.た
だ
し,実 際 に 求 め られ るの は 1つ の 平 均 値(期 待 値 で な く,1 つ の 標 本 値)で す か ら 注 意 し ま し ょ う. 第 5章 で 「仮 説 検 定 」の 問 題 を扱 う と き に こ の 性 質 を使 う こ と に な り ま す.
問題 2
【 分 散 の 意 味 と計 算 方 法 】 問 1 (l)プ
ロ グ ラムAOV01Eを
使 っ て,分
散 の 意 味 と計 算 方 法 に 関 す る 説 明 を復
習 せ よ.そ の プ ロ グ ラ ム で 採 用 して い る計 算 手 順 は,2.1節 (2)プ
ロ グ ラムAOV02Eを
説 明 を復 習 せ よ.そ
使 っ て,デ
の どの 式 か.
ー タ数 が 多 い 場 合 の 計 算 方 法 に 関 す る
の プ ロ グ ラ ム で 採 用 し て い る 計 算 手 順 は,2.1節
の ど の式
か. 問 2 こ の テ キ ス トで 示 す 「分 散 計 算 方 式 」に お い て,個
々 の 観 察 値 に 対 応 す る偏 差
を リス トす る形 で 計 算 を進 め た の は なぜ か. 【 計 算】 問 3 (1)次
は,表2.1.1の
基 礎 デー タ で あ る.表2.1.1の
ぬ け て い る箇 所 を補 っ
て 計 算 し,結 果 を確 認 せ よ 34 38 35 42 39 41 42 40 45 40 44 38 (2)プ
ロ グ ラ ムAOV01Aを
ラムAOV01Aの
つ い て,平
均 値 と標 準 偏 差 を計 算 せ よ.
ロ グ ラ ムAOV02Aを
ラムAOV02Aの 注:UEDAに
計 算 を 行 な え.基 礎 デ ー タ は プ ロ グ
例 示 用 と して セ ッ トし て あ る.
問 4 (1)表2.2.1に (2)プ
使 っ て(1)の
使 っ て(1)の
計 算 を行 な え.基 礎 デ ー タ は プ ロ グ
例 示 用 と して セ ッ トし て あ る. セ ッ トされ て い る デ ー タ は,表2.2.1と
小 数 点 の 位 置 が 異 な る が実
質 的 に は同 じ もの で あ る.
コ ン ピュー タ 出力 にお け る数値 表 示 につ い て (1)コ
ン ピ ュ ー タ を使 う と,入
力 し た 数 字 の 精 度 い か ん に か か わ らず,あ
の 桁 数 に の ば し て(意 味 の な い 0 を つ け 加 え て)長
る標 準
い 桁 数 とみ な し て 計 算 す る た
め,「 桁 数 を そ ろ え る た め だ け で 意 味 の な い 数 値 が つ い た 数 」(ス ペ ー ス フ ィ ラ ー と よ び ま す)が 出 力 され ま す.そ (2)し
た が っ て,UEDAの
力 す る の で な く,適 (3)プ
れ を そ の ま ま 答 え と し な い こ と.
プ ロ グ ラ ム で は,必
要 以 上 に長 い桁 数 をそ の ま ま 出
当 な 桁 数 を 想 定 して 出 力 す る よ う に し て い ま す.
ロ グ ラ ム で 想 定 し た 長 さ 以 上 の 結 果 に な っ た 場 合 は,数
け て 表 示 し ま す.前 ま た,1.23E+06の
値 の前に % をつ
の % を 落 と し て よ め ば よ い の で す. 形 式 で 表 示 さ れ る場 合 が あ り ま す.1.23×106の
こ と で す.
(3)表2.4.2に
つ い て,平
均 値 と標 準 偏 差 を計 算 し,表
こ と を確 認 せ よ.基 礎 デ ー タは,フ 問 5 付 表 A に 示 す68世 値,標
ァ イ ルDI10Vを
に 示 す値 が得 られ る
使 う こ と.
帯 の 家 計 収 支 デ ー タの う ち 消 費 支 出 総 額 に つ い て,平
準 偏 差 を 求 め よ.基 礎 デ ー タ はDH10の
均
記 録 形 式 を か え たDH10Vを
使
う こ と. 問 6 (1)問
5 と 同 じデ ー タ に つ い て,
a.分 布 図 に 表 わ せ.た
だ し,デ ー タ の 区 切 り方 は2/4/6/8/10/12/14/16/18
に よ っ て 8区 分 に 指 定 す る こ と b.こ
の 分 布 表 に も とづ い て,平
(2)添
付 プ ロ グ ラ ムAOV01Aを
均 値,標
準 偏 差 を求 め よ.
使 っ て(1)の 計 算 を 行 な え.こ
は ひ と つ ひ と つ の 世 帯 の デ ー タ を 使 う が,デ CVTTBL=…
を挿 入 し て お け ば,そ
ロ グ ラ ムAOV02Aを
のプ ログ ラム
切 り方 を指 定 す る文
れ に 応 じて 分 布 表 の 形 に ま と め た 上,プ
呼 び 出 して 計 算 す る .
デ ー タ フ ァ イ ルDH10Vに る.こ
ー タ に,区
区 切 り 方 指 定 文 を付 加 し た も の がDH10VXで
あ
れ を 使 う こ と.
(3)区 切 り方 を2/3/4/5/6/7/8/9/10/12/14/16/18と 平 均 値,標
プ ロ グ ラ ムDATAEDITを
使 う と,デ ー タ フ ァ イ ル 中 の 区 切 り指 定 文 を お き
か え る こ とが で き る.DH10VX中 ル を 用 意 し て,プ 問 7 (1)問 60).そ
か え る と,分 布 図 お よ び
準 偏 差 は ど うか わ る か.
の 区 切 り方 指 定 文 を お きか え た 作 業 用 フ ァ イ
ロ グ ラムAOV01Aを
使 う こ と.
5 と同 じデ ー タ 中 に他 と著 し く離 れ た 値 を もつ もの が あ る(デ ー タ番 号
れ を除 外 して 平 均 値 分 散 を 計 算 し,結 果 が ど うか わ るか を調 べ よ.
注 :デ ー タ ファ イ ルDH10VCは, DH10Vに 「番 号60の デ ー タ を除 け」 とい う指 定 文 を付 加 した もので あ る.ま ず,こ れ を使 って 計算 せ よ. (2)デ ー タ 中 に 他 と著 し く離 れ た値 を もつ もの を調 べ,そ の 計 算 を行 な え.
れ ら を 除 外 して(1)
注:DH10VC中 の指 定 文DROP=/60/を,番 号 を/で 区 切 っ て列 記す る 形に 書 き 換 えて 計 算 す れ ば よい.こ うい う指 定 文 の お きか え には,問6(3)と 同様 に プ ロ グ ラムDATAEDITを
使 う.
【 計算 方法 】 問 8 (1)表2.1.3に 値XKと
示 した 計 算 フ ォ ー ム 2に お い て は,デ
お きか え て い る が,こ
ー タXIを
各階 級の 中央
の お き か え が どの 程 度 σ2の計 算 結 果 に 影 響 す る
か を評 価 せ よ.付 表 A の デ ー タ を 使 う こ と. ヒン ト:こ の問 題 は,後 の 節 で 「級 内分 散 」につ いて 学 ん だ後 も う一 度 取 り上 げ るが, ここ では,問 5,問 6の結 果 を参 考 に して答 え れば よい . (2)表2.1.3に
示 し た 計 算 フ ォ ー ム 2に お い て は,各
階 級 の 中 央 値XKを
う か わ り に 各 階 級 区 分 で の 平 均 値 を 使 う こ と が 考 え ら れ る.そ
使
う し た 場 合,
フ ォ ー ム 1に よ る計 算 結 果 と一 致 す る か. 問 9 (1)次
に 示 す デ ー タ に つ い て,21ペ
計 算 せ よ.ま
た,19ペ
ー ジ に 示 した 計 算 式(2)を 使 っ て 分 散 を
ー ジ に 示 した(1)式 に よ っ て 計 算 し,結 果 を 比 較 せ よ.
9990,9991,9992,9993,9994,9995,9996,9997,9998,9999 (2)(1)に お け る最 初 の デ ー タ9990を19990と
お き か え て 計 算 して み よ.
(3)(1)に お け る最 初 の デ ー タ9990を29990と
お き か え て 計 算 して み よ.
注:問9に
つ い て は,電 卓 で計 算 す るこ と.
コン ピュー タ で計 算 して,電 卓 に よ る計算 結 果 と比 較 して み る こ とも考 え られ るが,そ の場 合 は,プ ログ ラム が どち らの計 算 式 を使 って い るか を調 べ るこ と. 問10 標 準 偏 差 の 計 算 結 果 は 何 桁 求 め れ ば よ い か.た 偏 差 が12.345678と
出 力 さ れ た と し て,ど
とえ ば 日本 人 成 人 の 身 長 の 標 準
こ まで の数 値 を答 え と して採 用 す る
か. 【中位 値,四
分位偏 差値 】
間11(1)プ
ロ グ ラ ムQ1Q2Q3と
位 値,四
そ れ に セ ッ ト し て あ る例 示 用 デ ー タ を使 っ て,中
分 位 偏 差 値 の 計 算 方 法 を確 認 せ よ.
(2)プ
ロ グ ラ ムQ1Q2Q3Xを
差 値 を計 算 し,図2.2.3に デ ー タ フ ァ イ ルDI10Vを (3)付
b.X3の
デ ー タ の 中 位 値,四
分位 偏
使 う こ と.
表 A に示 す68世
a.中 位 値,四
使 っ て,表2.2.5の
示 す 結 果 が 得 られ る こ と を 確 認 せ よ.基 礎 デ ー タ は
帯 の 家 計 収 支 デ ー タの う ち消 費 支 出 総 額 に つ い て,
分 位 値 を 求 め よ.
分 布 図 を 求 め,そ
れ を 使 っ て 中 位 値,四
分 位 値 を求 め て, a の 結 果
と 比 べ よ. 注:a につ い ては プ ロ グ ラムQ1Q2Q3デ
ー タ フ ァイ ルDH10Vを
使 う. bに つ い て
は,基 礎 デ ー タ に 区切 りを指 定 す る文 を挿 入 した デー タ フ ァ イルDH10VXを 定 してQ1Q2Q3を
使 う と,分 布 表 の 形 に 変 形 した上 でQ1Q2Q3Xを
指
呼 び 出 して
計 算す る. 【 分布 】 問12
プ ロ グ ラ ムBUNPU0を
使 っ て,2.3節
の 説 明 を復 習 せ よ.
【 分 布 とその母数 】 問13(1)プ (2)プ
ロ グ ラ ムXPLOT1に
よ っ て 問6(2)に 答 え よ.
ロ グ ラ ムXPLOT1に
よ っ て 問11(3)bに
注:プ ロ グ ラムXPLOT1を と標 準 偏差,あ
問14 (1)付 1.4.2を
表Lの か け.こ
使 う と,区 切 り値 指 定,分 布 図,そ の 特 性 値(平 均 値
るい は 中位 値 と四分 位 偏差 値)の 計 算 をつづ け て適 用 で き る,
プ ロ グラ ムXPLOT2も はXPLOT1,分
答 え よ.
同 じで あ るが,基 礎 デ ー タ が観 察 単 位 ご との値 の場 合
布 表 の場 合 はXPLOT2と
使 い わけ る こ と.
デ ー タ を 使 っ て 平 均 値 と 標 準 偏 差 を 計 算 し,図1.4.1と の 場 合 は プ ロ グ ラ ムXPLOT2を
(2)(1)と 同 じデ ー タ を使 っ て 中 位 値,四
図
使 う こ と.
分 位 偏 差 値 を 求 め,平
均 値 と標 準 偏
差 の か わ りに こ れ ら を使 っ て,図1.4.1と 注:付 表L(DI10)は,種
図1.4.2に
対 応 す る 図 をか け.
々 の 区 分 ご とに み た 分 布 表 を 1つ の セ ッ トと して 記 録 さ
れ て い るの で,特 定 区分 に つ い て計 算 す るに は,各 区分 で の分 布 表 をわけ て記 録 した形 に変 形 したDI10Vを
使 う こ と.
【 変数 変 換】 注:問15∼17に 問15分
つ い ては,計 算 は 電 卓 で行 ない,グ ラ フは 手書 きす る こ と.
布 形 を標 準 正 規 分 布 と比 較 す る た め の 計 算 が 図2.4.2に
を確 認 し,図2.4.2に 問16(1)問15の
(2)こ 2.4.5が
添 え て あ る 図 を か け.
分 布 図 を 「累 積 分 布 図 」の 形 に 表 わせ. の 累 積 分 布 図 を,市
販 さ れ て い る 正 規 確 率 紙 に プ ロ ッ トす る と,図
得 ら れ る こ と を確 認 せ よ.
注:UEDAの 問17図2.4.8の
よ っ て行 な え る こ と
プ ロ グ ラム 「正規 確 率 紙 」を使 う と正 規 確 率 紙 を 出力 で きる. 計 算 結 果(X
の 分 布 お よ びlogXの
をlogXに
換 算 した 後 の 計 算)を 確 認 せ よ.ま
分 布 図 を か き,変 数 X をlogXと
た,X
お きか え た 場 合 そ の 分
布 が 正 規 分 布 に近 い 形 に な る こ と を確 認 せ よ. 【 統 計 調 査 に お け る分 布 デー タ の 表 現 】 問18分
布 表 形 式 の 統 計 数 字 の 表 わ し方 が どの よ うに な され て い るか を,家 計 調 査 に
お け る 「年 間 収 入 」を例 に と っ て, a.金 額 階 級 の 区 分 が ど うな って い る か.ま
た,そ
の 区 切 り方 の変 遷 を調 べ よ.
b.最 上 位 の 区 分 に 包 含 され る世 帯 数 の 変 化 を調 べ よ. c.金 額 そ の もの で な く,大
き さ の 順 に 注 目 し て 区 切 っ た 五 分 位 階 級,十
分位
階 級 が 何 年 か ら採 用 され て い る か を 調 べ よ. d.a の 形 式 と cの 形 式 の 利 点 ・欠 点 を指 摘 せ よ. プ ロ グ ラ ム と 入 力 デ ー タ の タイ プ AOV01A
個 別 デ ー タ.す な わ ち,観 察 単 位 ひ とつ ひ とつ に つ い て の 観 察 値
Q1Q2Q3 XPLOT1 AOV02A
分 布 表 形 式 の デ ー タ.す な わ ち,い
Q1Q2Q3X XPLOT2
観 察 単位 数 と と もに,値
くつ か の 値 域 区分 に 対 応 す る観 察 単 位 数.
域 区 分 を記 録.
個 別 デ ー タ に 値 域 区 分 の 記 録 を添 え て お くと,第 一 群 の プ ロ グ ラ ム で 分 布 表 を求 め た後,第 群 の プ ロ グ ラ ム に うつ って 計 算 を実 行.
二
3 情 報 の統 計 的表 現(2)
1ッ
トの デ ー タ に つ い て,バ
め に,平
均 値 と 標 準 偏 差 な ど が 慣 用 さ れ て い ま す(3.2)が,よ
表 現 法 と し て,中
ッ ジ と し て の 特 徴 を 表 現 す る(3.1)た り有 効 な
位 値 と四 分 位 値 を べ ー ス と し た 5数 要 約 や ボ ッ ク ス プ
ロ ッ トが あ り ます(3.3)か
ら,こ
れ らの表 現 法 の 位 置 づ け を 説 明 し ます
(3.4). ま た,こ
れ らの 方 法 を分 析 手 段 と して 活 用 で き る こ とを 例 示 し ます
(3.5).
3.1 デ ー タ の バ ッ ジ と して の特 徴 ①
集 団 的 規 則 性 を 検 出 す るた め に は
ら な い が,全
体 を 通 覧 す る と,た
ひ とつ ひ とつ の 値 を み て い た の で は わ か
と え ば,「 こ の く ら い が 標 準 だ 」 と い っ た 形 で,あ
る種 の 「規 則 性 」が 見 出 さ れ る もの で す. 統 計 的 な見 方 で は,こ
の よ う な規 則 性,す
なわ ち
多数 の 観 察 単 位 の観 察 値 を 対 象 と し, そ れ ら を 1つ の バ ッ ジ とみ な した と きに 見 出 さ れ る特 徴 に 注 目 し ます. これ を,「 集 団 的 規 則 性 」と よ び ま す. 前 章 で は,そ
の こ と に 関 連 し て,デ
ー タ の ひ ろ が り幅 に も 注 意 せ よ,そ
の ため に
は,慣
用 さ れ る標 準 偏 差 で な く,四 分 位 偏 差 値 を使 う と よい こ と を指 摘 し ま し た.
②
バ ッ ジ と して の 特 徴 を み る た め に は,こ
の ほ か に も種 々 の 着 眼 点 が あ り ます.
た と え ば, a.ど の く ら い の 値 が 普 通 か b.ど の く ら い の 範 囲 に ひ ろ が っ て い る か c.大 き い 方 へ の ひ ろ が り,小
さい 方 へ の ひ ろ が りは 対 称 か
d.同 一 バ ッ ジ に 属 す る とみ られ な い デ ー タ は な い か デ ー タの 特 徴 を要 約 す る た め に 使 う指 標 は,少
な く と も,こ
うい う点 を識 別 し う る
表 現 法 で な け れ ば な ら な い の で す. こ れ ら の うち a,b に つ い て は 平 均 値 と標 準 偏 差 を使 っ て 計 測 さ れ ま す が,c に つ い て は,前
章 に 述 べ た よ うに,「 中 位 値 と四 分 位 偏 差 値 を使 っ て 計 測 す る こ と を考 え
よ」 と した の で す. a,b,c 以 外 に も注 目 を要 す る点 が あ りま す.そ ③
ア ウ トラ イ ヤ ー
れ が d で す.③
で 説 明 し ます.
基 本 へ も ど っ て,
「1つ の バ ッ ジ とみ な し え な い デ ー タ が 混 入 して い る」 可 能 性 が あ る と き に は,そ
れ を検 出 で き る仕 組 み が 必 要 です.
そ の た め に は,「 他 と飛 び 離 れ た 値 」に 注 目す れ ば よ い で し ょ う.統 計 的 手 法 と し て組み 立 て るには デ ー タ を 大 き さの 順 に 並 べ て,ギ
ャ ップ は な い か
を み る形 に す れ ば よ い の です. 同 一 バ ッ ジ に 含 まれ る と は み な しが た い デ ー タ が 混 在 して い る場 合,そ れ を,ア トラ イヤ ー と よ び ます.ま せ ん.だ
ず そ れ を 識 別 しな い と,バ
か ら まず ア ウ トラ イ ヤ ー を 識 別 し,そ
ウ
ッ ジ と して の 特 徴 を把 握 で き ま
れ 以 外 の 部 分 に 注 目 して バ ッ ジ と して
の 特 徴 を 把 握 す る の で す. ④
た だ し,そ れ が 「 異 常 な デ ー タ 」だ と す る わ け で は あ りませ ん.
「離 れ て い る よ」 と指 摘 す るに と ど め て,そ
れ が 異 常 か ど うか の 判 定 は も っ と考 え
る こ とが 必 要 だ,「 離 れ て い る 」す な わ ち 「異 常 」だ と決 め つ け な い … こ う い う趣 旨 で,「 ア ウ トラ イ ヤ ー 」(外れ 値 と訳 す こ とが 多 い)と い う呼 称 を使 う の で す. ま た,ア
ウ トラ イ ヤ ー が 当 面 の デ ー タ で は 外 れ 値 で あ っ て も,た
起 こ り う る 方 向 を示 唆 して い る か も し れ ま せ ん.特
に,社
とえば それが将 来
会 科 学 で 扱 う デ ー タ で は,
自 然 科 学 の 場 合 の よ う に,条 件 を 制 御 し て 求 め た 実 験 デ ー タ で は あ り ませ ん か ら, 種 々 の 情 報 が 制 御 さ れ ず に 混 在 して い る 可 能 性 が 大 き く,そ の 意 味 で,dirty (日本 語 の 定 訳 は ま だ な い よ うで す)と よ ば れ る の で す が,そ 程 を 経 る こ とに よ っ て,か
data
れ を ク リー ニ ン グ す る過
くさ れ て い た 有 意 な知 見 を検 出 で き るで し ょ う.
した が っ て,「 き れ い な デ ー タ を想 定 した 」数 理 的 な 手 法 を適 用 す る前 に,ま
ず,
ア ウ トラ イ ヤ ー を識 別 す る た め の ス テ ッ プ が 必 要 か つ 有 効 で す. ⑤
以 下 の 数 節 で は,こ
づ け て い き ます が,取 も ち ろ ん,dirtyな
う い う視 点 に た っ て,「 デ ー タ 表 現 」の 種 々 の 方 法 を 位 置
り扱 うデ ー タの 素 性 に 注 意 し ま し ょ う. デ ー タ す な わ ち 低 質, cleanな
デ ー タ す な わ ち 良 質,と
い うこ
と で は な く,デ ー タ を 求 め る対 象 分 野 に お け る 「情 報 を 求 め る 環 境 の ち が い 」な どか ら く る こ と で す.
ク リー ニ ン グ しな い ま ま,平 均 値 の 計 算 な ど の 統 計 処 理 を適 用 す る と,よ い,よ
ごれ た部 分 とそ うで ない部 分 とが混 ざって し ま
ご れ が 拡 散 され て 目立 た な い 結 果 と な り ます .そ
う して,
よ ご れ の 原 因 とな っ た 箇 所 が つ か め な く な る の で す.し
た が っ て,ク
リー ニ ン グ は,
種 々 の分 析 に 先 立 っ て 適 用 す べ き ス テ ッ プ
で す. ◇ 注 1 条 件 を制 御 して観 察 され た 「きれ い な デー タ」に 対 して,条 件 が そ ろ って い る とは い い に くい デー タ を 「よ ごれ た デー タ(dirty data)」 とよび ます. 本 文 に 述 べ た よ うに,デ ー タの質 を評 価 す る もの で は な く,「扱 い に 注 意 せ よ,精 密 な 統 計 手 法 を適 用 す る 前 に ク リー ニ ン グす る ス テ ップ が 必要 だ」 とい う指 摘 か ら生 まれ た 用 語 です. 「汚 染 デ ー タ」と い う訳 を使 った 例 が あ ります.よ ら,ど うで し ょ うか.
くな い イ メー ジ を与 え る語 です か
◇ 注 2 統計 手 法 の 中 に は,「基 礎 デ ー タが 一定 の条 件 下 で得 られ た きれ い な デー タ」で あ る こ と を前 提 として組 み 立 て られ た もの が あ ります.し た が っ て,統 計 手 法 を適 用 す る と きに は,対 象 デ ー タの状 態 とと もに,手 法 の 前 提 を確 認 して か ら使 う よ うに 注意 し ま し ょ う. ◇ 注 3 「 仮 説検 定 法」と よば れ る手 法 が あ り ます(第5章
で概 説)が,こ
れ は,こ こで
い うア ウ トラ イヤ ー検 出 とは ちが い ます.適 用 に あ た っ て, 「 基 礎 デー タが 一定 の条件 下 で得 られ た もの だ とい う仮 定 」 をお け る とは 限 らな いか らです.
3.2 情 報 の 表 現 力 ①
こ れ ま で 説 明 し て き た平 均 値,標 分 布 か ら(平 均 値,標
準 偏 差,分
布 に つ い て,
準 偏 差)が 誘 導 され る が,
それ らで表現 され ない情報 が ある こ と お よ び, 平 均 値 が(平 均 値,標
準 偏 差)の う ちの 一 方 で あ る こ と
から イ.分
布,
ロ.(平
均 値,標
の順 に 情 報 の 表 現 力 が 落 ち る こ とは,明
準 偏 差), ハ.平
し た が っ て,2 つ の 集 団 A,B の デ ー タ を比 べ る場 合,そ た は 分 布 図 に 表 わ して,そ
均値
ら か で す. れ ぞ れ の 情 報 を分 布 表 ま
れ ら を 比 較 す る の が 最 も有 効 で す.(平
均 値,標
準 偏 差)を
求 め て そ れ を比 較 す る扱 い が そ れ に 次 ぎ,平 均 値 を求 め て そ れ を対 比 す るの は 最 も限 定 さ れ た 扱 い に な る の で す.
図3.2.1
情報 の表現力比較
い い か え る と,平 均 値 ど う し を比 べ る と,個 別 変 動 の 大 き さに ち が い が あ っ て も そ れ が 見 逃 さ れ て し ま い,(平 均 値,標
準 偏 差)の 両 面 に 注 目 して 比 べ る と,こ れ ら で 表
現 され な い 「分 布 の 形 」の ち が い が 見 逃 さ れ て し ま うの で す. ② 表 現 力 が 落 ち な い の は,特 た とえ ば,分
別 の 場 合 で す.
布 形 が 正 規 分 布 だ と仮 定 で き れ ば,そ
ま り ます か ら,形 の 比 較 に か え て,(平
均 値,標
の 形 は,平
均 値 と標 準 偏 差 で 決
準 偏 差)の 比 較 で よ い こ と に な り ま
す. し た が っ て,そ
う仮 定 で き る 場 合 は,デ
ー タ の 比 較 は 簡 明 に な り ま す.た
と え ば,
デ ー タ を,実 験 で(結 果 に 影 響 す る条 件 を 制 御 して)求 め る こ とが で き る場 合 は, 「同 じ条 件 で の く りか え し」→ 「正 規 分 布 が 適 合 」 とい う論 拠 で,観 察 値 の 分 布 に つ い て,正
規 分 布 を仮 定 で き る こ とに な りま す.
た だ し,そ の 場 合 も,観 察 値 そ の もの に つ い て は,正 規 分 布 と仮 定 で き る と は 限 り ませ ん. ③ そ れ に し て も,平 均 値 の 比 較 で す ませ て い る例 が 多 い の は,デ
ー タを対 比す る
問 題 を,「 平 均 値 で 表 現 さ れ る 部 分 に 限 定 して 対 比 す る 問 題 」だ と は じめ か ら 限 定 し て い る こ と を 意 味 す るの で す.平 進 で す が,そ
均 値 と標 準 偏 差 の 両 方 に 注 目 して 対 比 す る と一 歩 前
れ で も分 布 の 形 の ち が い が 見 逃 さ れ る で し ょ う.し
た が っ て,
まず,平
均 値 と標 準 偏 差 の 対 比 を行 な い,
次 に,こ
れ ら を そ ろ え た偏 差 値 に つ い て そ の 分 布 形 を 比 べ る
と い う運 び が 考 え られ ま す.
平均 値 の対比 標 準偏差 の対 比
統計 デー タの対比
偏差 値 の分布 の対 比 た だ し,分 布 の 形 を比 べ る こ と は,か
な り面 倒 な こ と で す(前 節 で示 し ま した が).
④ そ こ で,
分 布 形 の 比 較 と(平 均 値,標
準 偏 差)の 比 較 の 間 に
位 置づ け られ る比較手段 を考 え よ う
と い う発 想 が うか ん で き ま す. (平 均 値,標
準 偏 差)に か わ る,も
し くは,こ
れ に つ け 加 え る指 標 を どの よ うに 定 義
す る か を考 え る こ と に な りま す. ⑤ こ の こ と に 関 して,新 し ま す が,こ
こ で は,こ
し い 方 法 が 提 唱 さ れ て い ま す か ら,3.3節
で そ れ を解 説
れ ま で 提 唱 さ れ て き た 方 法 を あ げ て お き ま し ょ う.
分 布 形 を表 わ す 関 数 をf(x)と
すると
平 均 値
μ=Σxf(x)
分 散
σ2=Σ(x-μ)2f(x)
で あ る こ と を指 摘 して お き ま し た.こ れ ら の 比 較 で 十 分 で な い な ら μk=Σ(x-μ)kf(x) と定 義 され る K 次 の モ ー メ ン トを 使 え と い う の が 「統 計 学 の 数 理 」で の 案 で あ り,ま ず,こ
の うち,K=3に
あ た る 「分 布 形 の 歪 み 度 」, K=4に
あ た る 「分 布 形 の 尖 り度 」
を対 比 の 枠 に 加 え る こ とが 考 え られ ます.
平 均値 の対 比 統計 デー タの対 比
標 準偏 差 の対 比 それ以外 の指標 の対 比 歪 み度 の対 比 尖 り度 の対 比 それ以外 の指 標 の対比
歪 み 度,尖
り度 は,そ
れ ぞ れ μ3/σ3,μ4/σ4と し て,単
位 を もたな い指 標 の 形に 定 義
さ れ ま す. 正 規 分 布 の 場 合,歪
み 度 は 0,尖 り度 は 3で す.
◇ 注 1 41ペ ー ジ の ⑨ で述 べ た方 法 を,変 数変 換 法 と して で は な く,そ の 変 換 で 定 め ら れ るP を 「 分 布 形 の 非対 称度 を示 す パ ラ メー タ」だ とみ な す こ とが 考 え られ ます. ◇ 注 2 この 節 で 「 情 報 量 」とい う コ トバ を使 い ま した が,も
との デ ー タで は よみ とれ た
は ず の こ とが よみ とれ な くな る … そ うい う場 合 「 情 報 を失 った こ とに な る」とい う意 味 で 受 け とって くだ さい,統 計 学 で は もっ と立 ち入 っ た概 念 と して定 義 され て い ます が,こ こ で は,上 の理 解 で十 分 です. ◇ 注 3 偏 差値 の分 布 が 「正 規分 布 で表 わ され る」とい うの は,十 分 に 条 件 を制 御 して 求 め られ た きれ い なデー タの場 合 で す.こ の 節 で は, 平 均 値 と標 準 偏 差 の ちが い を除 くと,分 布 の 形 を比べ や す くな る こ と を期 待 して偏 差 値 を使 うので す。 ⑥ こ れ ら の 指 標 は,理 面 で は,μkが る よ うに,デ しま し ょ う.
論 的 な扱 い で採 用 され る方 法 で す.実
際 の デ ー タ を扱 う場
偏 差 の 高 次 の べ き乗 に な っ て い る こ とか ら,表3.2.2の
計算 例 でわ か
ー タ 中 の ア ウ トラ イヤ ー の 影 響 を受 け や す い(問 題 3の 問 1)こ とに 注 意
表3.2.2
高 次 の モー メン トの 計 算
基 礎 デ ー タ は21 ペ ー ジ の 表2.1.2 と 同 じ も の.
こ の 例 で は,歪
み 度 は0.21,尖
り度 は2.23で
置 が 右 寄 りに な っ た 形 に な っ て い ま す が,デ
あ り,正 規 分 布 と比 べ て ピー クの 位
ー タ 7が,他
と著 し く離 れ て お り,こ の
こ とが 大 き く影 響 し て い ま す か ら,分 布 の 形 の 指 標 に な っ て い な い と み るべ き で す. デ ー タ 7を 除 い て 計 算 す る と,歪 み 度 は-0.62,尖
り度 は0.78と
な り,ピ ー ク の
位 置 は 左 寄 りだ とい う結 果 に な り ま す. 分 布 の 歪 み 度 や 尖 り度 を対 比 し たつ も りだ った の が,結 イヤー が存在 してい るため だ った … し た が っ て,次 ⑦(平
均 値,標
果 的 に は,1 つ の ア ウ トラ
そ うい う可 能 性 が 大 き い の で す.
節 で,代 案 を 説 明 し ま す. 準 偏 差)に 注 目 した 比 較 で ほ ぼ 十 分 だ とみ なせ る 場 合 もあ る で し ょ
う.そ の 場 合 に も,そ の こ と を確 認 す る とい う趣 旨 で,ひ て偏 差 値 を計 算 し,図 示 す べ き で す.す
とつ ひ とつ の 観 察 値 に つ い
なわ ち
平均値 μの対 比 標準偏 差 σの対 比
デ ー タ の 対 比
偏差値(X-μ)/σ の検討 とい う運 び を 採 用 し ま す.③
や ⑤ の場 合 と ち が う の は,ひ
とつ ひ とつ の 観 察 値 の 偏
差 値 を み て,「 そ れ ら を 同 一 の バ ッ ジ と み な し て 扱 う こ との 妥 当 性 確 認 」を 対 比 の 枠 組 み の 中 に お い て い る こ と で す.現 わ ね ば な ら な い の だ が,⑥
実 の 問題 で は,こ
の 方 法 に は 問 題 が あ る,よ
の 確 認 を な ん らか の 方 法 で 行 な っ て,そ
れ にか わ る次 節 以下
の 方 法 が 必 要 と な るの で す.
3.3 5数 要 約,ボ ック ス プ ロ ッ ト ① 前 節 の ① で 提 示 し た 「分 布 に よ る表 現 」 と 「平 均 値,標
準 偏 差 に よ る 表 現 」の
間 に位 置 づ け ら れ る 表 現 法 を考 え ま し ょ う.い い か え る と,「 平 均 値,標
準偏 差 に よ
る 表 現 」を 前 提 と して 「そ の 他 の 指 標 に よ る 表 現 」を考 え るか わ りに,前
提 の 方 を考
え な お そ う とい うこ とで す.
図3.3.1
② 2数 要 約
そ の た め に,ま
2数 要 約 とそ の グ ラ フ 表 現
ず(平 均 値,標
準 偏 差)を 図3.3.1の
表 形式 また は
グ ラ フ に 表 わ し,2 数 要 約 と よ ぶ こ と に し ま す. 図3.3.1左
側 の 1段 目 に 3つ の 指 標 値 を 並 べ て あ り ま す が,こ
の う ち 2番 目 が
「デ ー タ を 1つ の 指 標 で 代 表 す る 」た め に 使 う代 表 値(こ の 例 で は 平 均 値 μ)で あ り,1 番 目 と 3番 目の 値 が 「散 布 範 囲 を 示 す 」た め の μ± σ で す. 2段 目は,散
布 範 囲 の 幅 を評 価 す る 指 標 値(こ の 例 で は 標 準 偏 差 σ)で す.
こ れ らの 指 標 値 で 情 報 を要 約 して い るの で す が,基
礎 に な っ て い るの は 2つ の 指 標
(μ,σ)です か ら,2 数 要 約 と よぶ こ とに し ま し ょ う. 右 側 に お い た 「グ ラ フ 表 現 」で は,散 棒 で 示 し て い ま す が,ボ
布 範 囲 を ボ ッ ク ス で示 し,代 表 値 の 位 置 を 縦
ッ ク ス の 幅 は,つ
づ い て 説 明 す る別 の 表 現 法(3 数 要 約)と 関
連 づ け る た め に, μ±cσ, c=0.674 と し て い ます.こ
こ で cは,箱
1/2と な る よ う に定 め ま す.す
の 中 に 入 る デ ー タ数 が,正
規 分 布 を 仮 定 した と き に ,
なわ ち
をみ た す 値 で す. こ の 表 現 に お い て は,散
布 幅 の 評 価 値 が,
大 き い 方 へ の 偏 差,小
さ い 方 へ の 偏 差 に 対 して 同 じだ
とい う仮 定 を お い て 求 め た 値 に な っ て い ます .そ
う し て,そ
の こ と が,「 こ の 表 現 の
適 用 範 囲 を 限 る結 果 に な る」 こ とに 注 意 し ま し ょ う. た と え ば 賃 金 の デ ー タ な ど,対 称 性 を 仮 定 で き な い デ ー タ は,た
く さん あ り ま す,
そ うい うデ ー タ に は 適 用 で きな い の で す. ③ 3数 要 約 平 均値
そ こ で,す μ
で に 述 べ た とお り,中 位 値 と 四分 位 値 を使 っ て
を 中位 値
散 布 範 囲 μ± σ を 四 分 位 値 標 準 偏 差 σ
Q2に Q1とQ3に
を 四 分 位 偏 差 値(Q2-(Q1とQ3-Q2に
お きか え る こ と が 考 え られ ます.そ
う して,2 数 要 約 と 同 じ形 式 で 表 示,ま
たは 図示
した もの を,3 数 要 約 と よぶ こ と と し ます . こ の 場 合,(Q1,Q2,Q3が こ とか ら,グ
観 察 単 位 を そ の 値 の 大 き さ の 順 に 四 分 し た 区 切 り値 で あ る
ラ フ の 箱 の左 外 側,箱
内 の 左 側,箱
1/4ず つ が 含 まれ る こ とに な っ て い ます.
内 の 右 側,箱
の 右 外 側 に ,そ れ ぞ れ
図3.3.2
3数 要 約 とそ の グ ラ フ 表 現
2数 要 約 の グ ラ フ で σにc=0.674を 数 要 約 と 同 様 に1/4ず
乗 じ た の は,正
規 分 布 を 仮 定 し た 場 合 に,3
つ を 含 む よ う に 調 整 し た もの で す.逆
に い う と,3 数 要 約 は,
正 規 分 布 と い う仮 定 を 落 と して,2 数 要 約 を一 般 化 し た 表 現 に な っ て い るの で す. ◇ 注 2数 要 約,3 数 要 約 と い う用 語 は,統 計 学 の 専 門 用 語 と して 定 義 され て い る もの で は な く,説 明 の便 宜 を考 え て使 って い る もの です.こ れ らに対 して,次 項 で説 明す る 5数 要約 は,Tukeyに
よっ て定 義 され た呼称 です.
④ 5数 要 約
3数 要 約 の 基 礎 指 標 3つ に,最
の 指 標 を 使 う こ とが,自
小 値Q0,最
大 値Q4を
加 え た 5つ
然 な拡 張 方 向 で す.
こ れ らの 表 示 形 式 を 5数 要 約 と よ び ま し ょ う. こ の 表 示 で は,散
布 幅 に 関 す る情 報 が 豊 富 に な っ て い ます.す
デ ー タ の1/4を 左 端,中
央 付 近 の 左 側,中
よ うに な っ て い ま す.ま
な わ ち,
カ バ ー す る 範 囲 を,
た,デ
央 付 近 の 右 側,右
ー タ の1/2を
端 の 4か 所 で み る
カ バ ー す る 範 囲 は 3段 目に 表 示 す る よ う
に な っ て い ま す. ま た,グ は,線
ラ フ 表 現 で は,中
で示 して い ます.代
央 部 分 は こ れ ま で と 同 様 に 箱 で 示 し て い ます が,外
表 値 に 近 い 部 分 と離 れ た 部 分 だ か ら,こ
側
の よ うに 表 現 を か
え た の で す. 図3.3.3
5数 要 約 と その グ ラ フ表 現
1/4ず つ 区切 っ た 区 切 り値 1/4を カバ ー す るひ ろが り幅 1/2を カバ ー す る ひ ろが り幅
こ こ ま で 進 め る と,デ ー タ の 分 布 形 に 関 し て,か
な り立 ち 入 っ た 見 方 が で き ます.
す な わ ち,箱
の 左 半 分 の 長 さ と,右 半 分 の 長 さ を比 べ て,対
す.ま
の 長 さ と,外 側 の 線 の 長 さ を 比 べ て,尖
た,箱
こ の 章 の最 初(49ペ
称 形 か ど うかが よめ ま
り度 の 大 小 が よ め る の で す.
ー ジ)に あ げ た 「バ ッ ジ と し て の 特 徴 を み る た め の 着 眼 点 」の ほ
と ん どす べ て を カ バ ー し て い ま す.こ
の こ とか ら,情 報 表 現 力 が 最 も大 き い 「 分布」
に ほ ぼ 匹 敵 す る 表 現 力 を も っ て い る と い え ます. し た が っ て,前
節 に あ げ た 分 布 形 に 関 す る 情 報 表 現 に 関 して,次
の 順 に 「くわ し い
表 現 」に な っ て い るの で す(ボ ッ ク ス プ ロ ッ トに つ い て は ⑤ で 説 明). 統 計 デ ー タの 比 較 に お い て も,く
わ しい 表 現 を採 用 す べ き だ と い う こ とで す.
1数 要約(平 均 値) 2数 要約(平 均値 と標 準偏 差) 分布 形 の情報 表現
3数 要約(中 位値 と四分位 偏差値) 5数要 約(3数要 約 に最大値,最 小値) ボ ッ クスプ ロ ッ ト(ア ウ トライヤー の検 出 手段)
⑤ ボ ッ ク ス プ ロ ッ ト
こ の 5数 要 約 の 図 示 に,次
の よ う な 「ア ウ ト ラ イ ヤ ー 検
出」の た め の 機 能 をつ け た 図 示 法 を 「ボ ッ クス プ ロ ッ ト」 と よん で い ます. こ の 表 現 で は,5 数 要 約 の 図 示 法 に お い て, 線 の 長 さが 箱 の 幅 の1.5倍
をこえ る場合 そ こで打 ち切 って
そ の 範 囲 外 の値 は ひ とつ ひ とつ マ ー クす る もの と し て い ま す(注 1). 箱 の 幅 の1.5倍
と い う 「ア ウ トラ イ ヤ ー 検 出 基 準 」は,Tukeyの
こ の 基 準 値 を フ ェ ン ス(大 き い 方,小 fence)と
よ び ま す.次
提 唱 で す.
さ い方 を区 別 す る と き はupper
fence,lower
の 式 で 表 わ され る こ とに な りま す.
UF=Q3+1.5×(Q3-Q1) LF=Q1-1.5×(Q3-Q1) 図3.3.4は,大
きい 方 で ア ウ トラ イ ヤ ー が 検 出 さ れ,小
さい方で は検 出 され なか っ
た場 合 の 例 で す. そ の 後,他
の研 究 者 に よ っ て い くつ か の 代 案 が 提 唱 さ れ て い ます.ま
の 限 界 値 を併 用 す る 案(注 2)も あ り ま す が,ボ
た,2 と お り
ッ ク ス プ ロ ッ トを 使 う問 題 場 面 で は,
原 案 を か え る こ と も な い と思 い ます. Tukey自
身 は1.5と
し た こ と に つ い て 特 に コ メ ン トし て い ませ ん が,次
了 解 す る こ とが で き ま す. 正 規 分 布 に お け る1%限
界 にほ ぼ対応 す る
この こ と は,正 規 分 布 の 表 を使 っ て 次 の よ うに して 確 認 で き ます. 箱 の 中 に デ ー タ の1/2が
入 る こ と か ら,
図3.3.4
ボ ッ クス プ ロ ッ ト
の よ うに
P(│U│>0.674)=50% す な わ ち,箱
の 左 右 端 は0.674σ,-0.674σ,箱
し た が っ て,線
の 幅 は1.348σ
と な り ます.
の 長 さ の 打 ち 切 り基 準 は
箱 の 幅 の1.5倍 とな り ます か ら,デ
す な わ ち0.674σ+1.5×1.348σ=2.696σ
ー タ が 箱 の 外 に 落 ち る確 率 は,
P(│U│>2.696)=0.69% と な りま す.こ
れ を,ほ
ぼ1%と
表 現 して い る の で す.も
考 え 方 が 出 る か も しれ ませ ん が,そ
う少 し正 確 に し た い と い う
う簡 単 で は あ り ませ ん(注 3,4).
以 上 は 正 規 分 布 を仮 定 した 上 で の 計 算 で あ り,分 布 形 に 関 す る仮 定 を お け な い 場 面 で 使 う こ と を考 え れ ば,正
規 分 布 の 仮 定 の も とで 精 密 化 す る よ り も,分 布 形 に 関 して
よ り広 範 な 場 面 で の 適 用 を 考 え る こ とが 必 要 で す. 次 の 節 で 説 明 し ます. ◇ 注 1 ア ウ トラ イヤー が あ る場 合 の 「フ ェ ンス と線 の 打 ち切 り点 」の 図示 に つ い て
a. 箱 の 幅 の1.5倍 の ところ ま で
b. ア ウ トラ イヤ ー を 除 く最 大 値(最 小 値)の とこ ろ まで
の 両 案 が あ りえ ます.Tukeyの よい と思 い ます.3.5節
原案 は bです が,適 用 場 面 に よっ て は,b よ りも aの 方 が
で 分析 例 を示 した 後 に,そ の理 由 を説 明 し ます(3.6節).
◇ 注 2 箱 の 幅 の1.5倍
と2.5倍 とを併 用せ よ とい う案 です.
◇ 注 3 1.42倍 に とれ ば1%限
界 に対 応 し ます(問 題 3の 問14)が,本
文 に述 べ た よ うに,
切 りの よ い値 を使 お うとい うこ とです. ◇ 注 4 正 規 分 布 とい う仮 定 を おけ な い と きに は,こ の 確 率 は もっ と大 き い値 に な り ま す.し か し,ど ん な場 合 に も,「13.8%を
こ え る こ とは な い」と い え ます(5.3節
で 説 明す
るチ ェ ビ シ ェフ の不 等 式 に よ る).
分 布 形 に 関 す る仮 定 の お き方 に よ って著 し くか わ る こ とに 注意 しま し ょ う.
3.4 5 数 要 約,ボ ック ス プ 口 ッ トの 代 案 ①
前 節 で 説 明 し た 5数 要 約 お よ び ボ ッ ク ス プ ロ ッ トに つ い て は,い
代 案 が あ りま す.こ
の 節 で は,そ
くつ か の 点 で
う い う点 を補 足 し て お き ま す.
ま ず,5 数 要 約 は 「分 布 に 関 す る 情 報 の 要 約 」を 意 図 す る もの で あ り,ボ
ッ ク ス プ ロ ッ トは,そ
れに
「ア ウ トラ イヤ ー の 検 出」機 能 を付 加 した も の で あ る こ と を,は
っ き り区 別 し ま し ょ う.
両 面 の 機 能 を あ わ せ も たせ る に し て も, 表 現 の 仕 方 は,区
別 して 考 え な け れ ば な ら な い
の で す. ②
分 布 形 の 要 約 の た め に最 小 値,最
大 値 を 使 う こ と に 関 す る代 案
分布 形 の要
約 とい う意 味 で は, 最 小 値Q0,最
大 値Q4は,観
察単位 数の 大小 に よってか わ る
こ と か ら 「分 布 形 を み る 指 標 」 と して は 不 適 当 で す .観 察 単 位 数 を 特 定 し て 最 大 値, 最 小 値 に 注 目す る 場 合 が あ る こ と は 事 実 で す が,分 布 の 形 を み る,す 分 の 特 性 をみ る とい う意 味 で は,不
な わ ち,多 数 部
適 当 と い う こ とで す.
③ し た が っ て,分 布 形 の 情 報 を 要 約 す る と い う意 味 で は,3 数 要 約(Q1,Q2,Q3) に も どっ て,そ れ に,「 分 布 形 の 端 の 部 分 を み る た め の 指 標 をつ け 加 え る 」 と こ ろ を 再 考 し ま し ょ う. Tukeyは,中
位 値,四
分 位 値 に つ づ け て 八 分 位 値 を 使 う こ と を 提 唱 して い ま す.
す な わ ち,第
l八 分 位 値E1,7/8に
Q3,E7,Q4)に
よ る 7数 要 約 で す が, Q0, Q4は 上 述 の 理 由 で 除 き,(E1,Q1,Q2,Q3,E7)
あ た る 第 7八 分 位 値E7を
使 っ た(Q0,E1,Q1,Q2,
を 「5数 要 約 の 代 案 」 とみ る こ とが で き ます. Tukeyは,さ
ら に 十 六 分 位 値 を使 う要 約,三
て い ま す が,分
布 の 端 の 方 の 値 は,ア
十 二 分 位 値 を使 う要 約 な ど を 定 義 し
ウ トラ イ ヤ ー で あ る こ とが 多 い の で,八 分 位 値
ま で で 十 分 で し ょ う. ④ も う ひ とつ の代 案 と して,八 す.す
な わ ち,第
1十 分 位 値(D1),第
(D1,Q1,Q2,Q3,D9)に で す.十
分 位 値 は,実
分 位 値 で な く,十 分 位 値 を使 う こ とが 考 え ら れ ま 9十 分 位 値(D9)をQ0,Q4の
か わ りに 使 う
よる情報 要約
際 の 統 計 報 告 書 で は か な り前 か ら採 用 され て い る情 報 表 現 法 で
す. ⑤ また,広
く採 用 され て い る 「十 分 位 階 級 」と の 関 係 を考 慮 し ま し ょ う.
十 分 位 階 級 は,た と え ば 所 得 の 大 き さの 順 に 注 目 し て世 帯 を 同 数 ず つ 含 む よ う に 10区 分 に 区 切 っ た 区 分 で す.こ れ に よ っ て,所 得 階 級 に よ っ て 消 費 構 成 が ど うか わ る か をみ る …
こ うい う場 面 を想 定 して 採 用 され て い る も の で す .
こ の 十 分 位 階 級 の 区 切 り値 をD1,D2,…,D9と Q2,Q3と
表3.4.1の
した が っ て,分
表 わ す と,5 数 要 約 の 基 礎 指 標(Q1,
よ うに 対 応 し て い ます. 布 の 中 央 部 分 に つ い て は 値 域 を 4区 分 に 区 切 っ て 四 分 位 値 を 使 い,
分 布 の 端 の 部 分 に つ い て は,値
域 を10区
分 に 区 切 っ て 十 分 位 値 を 使 う … こ う了 解
で き ま す. ま た,正
規 分 布 を 想 定 し た場 合 に
(D9-Q2)/(Q3-Q2) ≒2 (D1-Q2)/(Q1-Q2)
≒2
表3.4.1
十 分 位 値 との 対 応 づ け
と な って い る こ とか ら,D1,D9に
よ る 細 分 が 自 然 な選 択 だ とい え ます.
⑥ ア ウ トラ イ ヤ ー を識 別 す る基 準 に 関 す る代 案
ア ウ トラ イ ヤ ー を 識 別 す る
フ ェ ン ス に つ い て も,以 下 の よ うな 代 案 が 考 え られ ます. 大 き い 方 ・小 さ い 方 に 対 して 対 称 な 定 義 を使 っ て い る と こ ろ を 問 題 に す るの で す. ひ ろが り幅 の 指 標 と して,非
対 称 性 を考 慮 に 入 れ る た め に 「標 準 偏 差 」の か わ りに,
四 分 位 偏 差 を 使 っ た こ とに と も な っ て, ア ウ トラ イヤ ー 識 別 基 準 も非 対 称 性 を考 慮 に 入 れ る … そ れ が 自 然 で し ょ う. した が っ て,四 分 位 偏 差 を 使 っ て,フ
ェ ン ス の 定 義 式 を次 の よ う に 改 め る こ とに し
ま し ょ う. UF=Q3+3×(Q3-Q2) LF=Q1-3×(Q2-Q1) こ の 代 案 に よ っ た 場 合,正
規分布 を想定 す る と
(UF-Q2)/(Q3-Q2)≒4 (LF-Q2)/(Q1-Q2)
≒4
が 成 り立 っ て い ま す. い い か え る と, UF,D9,Q3とQ2の
距 離 に つ い て4:2:1
(Q3-Q2を
1と して)
LF,D1,Q1とQ2の
距 離 に つ い て4:2:1
(Q2-Q1を
1 と し て)
の 関 係 が 成 り立 っ て い る こ とに な り ま す. 図3.4.2
指 標値 間 の 距 離 と頻 度
こ の こ と を 利 用 し て た とえ ば 歪み 度 の指標
(D9-Q2)/(Q2-D1)
尖 り度 の 指 標
(D9-D1)/(Q3-Q1)
を定 義 で き ま す.こ
あ る い は(Q3-Q2)/(Q2-Q1)
の定 義 に よ れ ば
正 規 分 布 の 場 合,歪
み 度 が 0,尖 り度 が 2
と な りま す. 歪 み 度 の 2つ は,分 布 の 端 の 方 を含 め て み る 場 合,中
央 部 分 で み る 場 合 とわ け て,
使 い わ け で き ます, ⑦ 5数 要 約 の 代 案 と ア ウ ト ラ イ ヤ ー 検 出 基 準 の 代 案 を あ わ せ る と,ボ
ッ クス プ
ロ ッ トを次 の よ う に 表 わ す こ と に な り ます . 図3.4.3
ボ ッ ク ス プ ロ ッ トの 代 案
見 出 し を 「ボ ッ ク ス プ ロ ッ トの 代 案 」 と し て お き ま し た が,「 情 報 の 要 約 」を 意 図 す る部 分 と 「ア ウ トラ イ ヤ ー 検 出 」 を意 図 す る 部 分 が 一 緒 に な っ て い る こ と に 注 意 し ま し ょ う. ⑧ 分 布 形 に 関 す る仮 定 を特 定 し な い た め に こ の 節 の 展 開 を追 っ て い く と, 分 布 形 が 2つ 以 上 の ピー ク を もつ 場 合 に は そ の こ と が か く さ れ る の で,1 つ の ボ ッ クス を か く こ とに 疑 問 が 出 る と思 い ます. 「箱 の とこ ろ に 観 察 値 が 集 中 し て い る 」 とい う 見 方 に 反 す る か ら で す. ピー ク が 2つ 以 上 あ る 場 合 は,ア が,そ
ウ トライヤ ーが 混 在 して い るこ とが 多 いの です
の こ と を 検 出 で き る よ うな 図 示 法 に し て お き た い … そ う考 え る と,図3.4.4
の よ うに 表 わ す こ と が 考 え ら れ ま す . 分 布 の 頻 度 が あ る レベ ル 以 上 の と こ ろ で 値 域 を 区切 り,そ の 範 囲 に 入 る観 察 値 数 が 50%と
な る よ う に し ます.
例 示 の 網 掛 け の 部 分 で す. そ れ を,ボ ま た,同
ッ クス と し ま す.
様 に80%の
値 域 を定 め,そ
こ の 図 示 法 で は,ボ
れ を 線 で つ な ぎ ま す.
ッ クス や 線 が 1
つ の 領 域 に ま と ま る と は 限 り ま せ ん. し た が っ て,ピ
ー ク が 2つ 以 上 の 場 合
を考 慮 に 入 れ た 図 示 法 に な っ て い ます. 形 式上 は ボ ック スプ ロ ッ トと同様 で す が, ボ ック スや 線 を 「 代 表値 か ら の 距 離 」で 定 義 す る の で な く, 「各 値 域 で の 頻 度 」に 注 目 して 定義する こ と に な っ て い ま す.た
と え ば,ボ
ッ
ク ス の 区 切 り点(例 示 で は 4か 所)は, 頻 度 の 等 し い 箇 所 に な っ て い ま す. ピー クが 1つ の 場 合 に お い て も,ボ
ッ
図3.4.4
等 頻 度 原理 に よ る ボ ッ クス プ ロ ッ ト
図3.4.5
分 布 形 の情 報 要 約
ク ス の 区 切 り は,一 般 の ボ ッ ク ス プ ロ ッ トの 場 合 と ちが い ま す. した が っ て,こ
れ を,「 頻 度 原 理 に よ る ボ ッ ク ス プ ロ ッ ト」 と よぶ こ と に し ま す.
⑨ 図3.4.6は,賃 し た も の です.高
金 月額 の 分 布 を年 齢 区 分 別 に 比 較 す る た め に,こ
の 表 現 を適 用
齢 層 で の 分 布 に 2つ の ピー クが 見 出 さ れ る よ うに な っ て い ま す.
⑩ 図3.4.5に,3.3節
お よ び3.4節
に 説 明 し た 種 々 の 表 現 法 を ま とめ て お き ま
す. 情 報 要 約 手 段 と して み る場 合(表 の 上 半)と,ア
ウ トラ イ ヤ ー 検 出 手 段 と し て み る
場 合(表 の 下 半)と を は っ き り と わ け て考 え ま し ょ う. 図3.9.6
賃 金 月額 の 分 布 比 較 こ の 図 を か くに は,X
の 値 域 を区 切 っ て
そ れ ぞ れ の 区 切 りに お け る 分 布 図 の 高 さ (密 度)を 求 め,そ
れ が大 きい ところか ら
順 に ボ ッ ク ス 内 に含 め て い きま す. した が って,ボ
ッ クス を精 密 に か くに は,
値 域 の 区 切 りを細 か くす る こ とが 必 要 で す.い
い か え る と,観 察 値 数 が 十 分 に 多
い場 合 で な い と,精 密 に か け ませ ん.
3.5
分
析
① 図3.5.1は,各
例 都 道 府 県 別 の 「人 口10万
人 あ た り病 床 数(1975年)」
の デー タ
です(基 礎 デ ー タ は付 表 B). こ の デ ー タか ら人 口あ た り病 床 数 の 地 域 分 布 に 関 し て,ど
ん な 状 況 に な って い る か
を 「よ み と っ て 」み ま し ょ う.ど ん な 手 法 で もか ま い ませ ん.わ 的 確 な答 えが 得 られ るな ら,そ れ で よい の です.こ
か りや す い 手 法 で も,
うい う と,か
な りの 人 が 図3.5.2
の よ う な棒 グ ラ フ を か い て み る の で は な い で し ょ うか. ② こ の グ ラ フ か ら, 高 知 県 が他 と著 し く離 れ て い る こ と
東 京 ・大 阪 周 辺 の 値 は 他 と比 べ 低 い こ と
な ど が よ み とれ ま す. こ の よ うに 「 視 覚 に 訴 え て デ ー タ を よ む 」こ と が で き る の が,グ こ の 例 で は,こ
の グ ラ フ で,ま
ラ フ の 効 用 で す.
ず 十 分 に デ ー タ を よ み と る こ とが で き る よ うで す.
し か し,こ の よ う に きれ い に よ み と れ る デ ー タ ば か りで は あ りま せ ん.し て,視
覚 に 頼 らず,「 客 観 的 な手 続 き」 を組 み 立 て て お き,そ
たがっ
れ を適 用 す る こ と も考
え て お くべ き で し ょ う. ③ こ うい う意 味 で,ボ
ッ ク ス プ ロ ッ トを使 うこ とが で き ま す.こ
の 節 で は,そ
の
こ と を例 示 す る と と もに,「 棒 グ ラ フ を か い て み る」 と い う わ か りや す い 手 段 が,自 然 に,ボ
ッ ク ス プ ロ ッ トに つ な が る こ と を示 しつ つ,説
明 をつ づ け ます.
図3.5.1
図3.5.2
基礎 デ ー タ
棒 グ ラ フ(図3.5.2)に
お い て,た
デ ー タの グラ フ 表 現(デ ー タ 番 号 の 順)
と え ば 「棒 の 並 べ 方 」は い ろ い ろ 考 え られ ます が,
大 き さ の順 に 並 べ るの が 有 効 な案 で す.図3.5.3の
よ う に な り ます.
これ でみ る と a. 最 高 の 高 知 県 と そ の 次 の 佐 賀 県 と の ギ ャ ップ が 大 き い b. 「 東 京 周 辺 」 と 「大 阪 周 辺 」と に マ ー ク を つ け る と,そ
れ らが 上 の 方 に か た
ま って い る(若 干 の例 外 は あ るが)こ とか ら,大 都 市 周 辺 とそ れ 以 外 とで ちが う こ とが よ み とれ ま す. し たが っ て,デ ー タ の 表 現 に つ い て,高
知 県 を別 扱 いす る こ と,大 都 市 周 辺 と そ れ
以 外 と をわ け て み る こ とが 示 唆 さ れ ま す. ④
図3.5.2で
同 じ こ とが よみ と れ る に し て も,図3.5.3で
「順 位 」の 情 報 を 「みせ て い る 」
こ とに 注 目 し ま し ょ う,そ の こ とか ら,こ の グ ラ フ の 見 方 を ボ ッ ク ス プ ロ ッ トの 見 方 に つ な げ る こ と が で き ます. 図3.5.3
この 図 で は,ア
デ ー タ の グ ラ フ 表 現(大 き さ の順)
ウ トラ イ ヤー と指 摘 され た 2県 も含 め て い ま す が,ア
ウ トラ イヤ ー を識 別 す る ため の 区切 り線 をひ く こ と も考 え られ ます.
す な わ ち,図3.5.3に
付 記 し た よ うに
最 小 値,第1
四 分 位 値,中
位 値,第
3四 分 位 値,最
大値
を よ み と る こ と が で き ま す か ら,そ れ を 「箱 」 と 「ひ げ 」で か け ば よ い の で す. ま た,ひ
げ の 長 さ が 長 い と き に ア ウ トラ イ ヤ ー の 混 在 を示 唆 し て い る こ とか ら,自
然 な 流 れ と して,ボ
ッ ク ス プ ロ ッ トの 「ヒ ゲ の 打 ち 切 り ル ー ル 」,す な わ ち フ ェ ン ス
を導 入 す る こ と が で き ま す. ◇ 注 ボ ッ クス プ ロ ッ トは,最 初 はBox-Whisker が,い つ か らかBox ⑤ 図3.5.3上 図3.5.4が
で 四 分 位 値 を よ み と っ て,そ
得 ら れ ま す.こ
れ に よ っ て,高 図3.5.4
⑥ 「で は,こ
Plot(箱 ひげ 図)と よ ば れ て い ま した
Plotと よばれ る よ うに なり ま した. れ ら を 「ボ ッ ク ス プ ロ ッ ト」に す る と,
知 県 が ア ウ トラ イ ヤ ー だ と わ か り ます.
ボ ッ ク ス プ ロ ッ ト(1)
れ を除 い て ボ ッ ク ス プ ロ ッ トを か い て み よ う」 と い う こ と に な り ま
す. 図3.5.5で
す.高
知 県 を 除 い た ため ×マ ー ク が 消 え た だ け で な く,右 の ひ げ の 長 さ
が 短 くな りま し た.そ
れ 以 外 の 部 分 は ほ とん ど か わ っ て い ませ ん.い
知 県 を除 い て も,そ れ 以 外 の46県
い か え る と,高
の 要 約 は か え る必 要 が な い,「 よ っ て,高
知 県 を別
に す る こ とは 理 に か な っ て い た 」と確 認 で き ま す. 図3.5.5
ボ ッ ク ス プ ロ ッ ト(2)
た だ し,右 の ひ げ の 部 分 の 長 さ が か わ っ た こ とに 注 意 し ま し ょ う. 分 布 の 形 に つ い て,右 を除 い た 図 で は,そ わ か り ます.非
の 方 へ 広 く尾 を ひ い て い る よ う に み え て い た もの が,高
う で な か っ た,す
な わ ち,左
対 称 度 に 関 す る誤 読 が あ っ た,そ
知県
の 方 に 広 く尾 を ひ く形 だ っ た こ と が れ が,こ
の 図3.5.5で
検 出 された と
い う こ とで す. ⑦ 次 に,「 大 都 市 周 辺 と そ れ 以 外 と で ち が う よ う だ 」 と し た こ との 妥 当 性 を確 認 す る た め に,デ 図3.5.6の
ー タ を 二 分 して ボ ッ ク ス プ ロ ッ トをか い て み ま し ょ う. よ うに な り ます.
こ の 結 果,ボ ます.ま
図3.5.6
ボ ッ ク ス プ ロ ッ ト(3)
図3.5.7
ボ ッ ク ス プ ロ ッ ト(4)
ッ ク ス の 位 置 が ず れ て い る こ と か ら,上 記 の 説 明 の 妥 当 性 が 確 認 さ れ
た,「 沖 縄 県 」が ア ウ トラ イ ヤ ー で あ る こ と が検 出 さ れ ま す.
⑧ 以 上 の 分 析 結 果 を示 す とい う意 味 で は,図3.5.4を 理 由 で,図3.5.6で
図3.5.5に
改め たの と同 じ
指 摘 さ れ た ア ウ トラ イヤ ー を別 に して,図3.5.7を
か いて お くと
よ い で し ょ う. ⑨ こ れ ま で指 摘 した よ う な差 が 検 出 され た ら,そ の差 が ど う 説 明 さ れ る か を 考 え よ う と い う こ とに な りま す.い
ま取 り上 げ て い る 指 標 で は 各 県 の 人 口 数 の ち が い を
「比率 」 を と る こ とに よ って 補 正 して あ り ま す が,同
じ く千 人 で も,高 齢 者 の 多 い 千
人 と高 齢 者 の 少 な い 千 人 と で は ち が うで し ょ う.し た が っ て,こ
の ち が い を考 慮 に 入
れ る こ とで 「 病 床 数 の 差 が 説 明 で き る か 否 か 」を 調 べ るの で す. ま ず,棒
グ ラ フ の 棒 の 配 列 順 を 「高 齢 者 比 率 の 順 」に か え て み ま し ょ う(図
3.5.8). ⑩ 棒 の ア タ マ の 位 置 を み る と,左 上 か ら右 下 方 向 に 並 ぶ 「傾 向 性 」が よ み と れ ま す が,こ
の 傾 向 性 の 存 在 を確 認 す る た め に,ボ
図3.5.9は,こ
ッ ク ス プ ロ ッ トが 有 効 で す.
れ ま で の 分 析 で ア ウ トラ イ ヤ ー だ と指 摘 さ れ た 2県 を 除 く45県
「高 齢 者 比 率 」の 大 き さ の 順 に よ っ て 3区 分 し て,各
を
区 分 ご と に 「ボ ッ ク ス プ ロ ッ ト」
を か い た もの で す . 箱 の位 置 が ず れ て い る こ と(図3.5.7の
場 合 と比 べ る と重 な り部 分 が 大 き い が)か
ら,予 想 さ れ た傾 向 性 の 存 在 が 確 認 され ます. くわ し くみ る と,高 齢 者 比 率 の 大 き さ の 影 響 が 「ボ ッ ク ス の 位 置 」お よ び 「 左側 の ひ げ の 位 置 」の ず れ と して 把 握 で き ま す が,右 側 の ひ げ に 関 し て は こ の 一 般 的傾 向 と 異 な り,高 齢 者 比 率 の 大 き さ に か か わ ら な い様 相 を示 して い ま す.こ
の こ とか ら,人
図3.5.8
デ ー タ の グ ラフ 表 現(説 明 変 数 の 大 き さの 順)
66ペ ー ジ ⑦ に 注 記 した よ うに,大
都 市 周 辺 を除 い た グ ラ フ に す るこ とが 考 え ら れ ます.
口 あ た り病 床 数 が 多 い 地 域 に お け る 地 域 差 に 関 し て は さ ら に 別 の 要 因 が 見 出 され る か も しれ ませ ん. ⑪ こ の 例 で み た よ うに,「 デ ー タ を よ む 手 順 」 を,わ か りや す い 形 に 組 み 立 て る こ とが で き ま す. な じみ の あ る 「 棒 グ ラ フ 」と,分 析 手 順 と し て 合 理 性 を もつ 「ボ ッ ク ス プ ロ ッ ト」 を 使 い わ け る と よ い で し ょ う.
図3.5.9
ボ ッ ク ス プ ロ ッ ト(5)
図3.5.10
ボ ッ ク ス プ ロ ッ ト(6)
前 節 で は ボ ッ クス プ ロ ッ トに 関 して 種 々 の 代 案 が あ る こ とを 示 し ま し た が.実 問題 を扱 う と き に は,デ ら,ま ず は,ボ
際の
ー タの 取 り上 げ 方 に よ る ち が い に 注 目す る こ とが 必 要 で す か
ッ ク ス プ ロ ッ トは 基 本 的 な 表 現 法 を採 用 し ま し ょ う.
◇ 注 「一 連 の分 析 の途 中経 過 を省 略 して結 論 を示 す」 とい う意 味 で は,図3.5.4∼3.5.7 か ら 「高知 県,沖 縄 県,大 都 市 周 辺 の 県,そ の 他 の 県 」に対 応 す る部 分 を選 ん で 図3.5.10 をか くこ とが考 え られ ます. い くつ か の集 団 区分 につ い て そ れ ぞ れ ボ ック スプ ロ ッ トをか き,上 図の よ うに併 記 した 図を「 並 行 ボ ックス プ ロ ッ ト」とよ び ます.
3.6 補足:ボ ッ ク ス プ ロ ッ トにお け る フ ェ ンス の 表 現 ① ボ ッ クス プ ロ ッ トの 図 示 法 に つ い て,3.3節
の 図3.3.4で
は,次
の 扱 い aと扱
い cを採 用 して い ま した. a. ア ウ ト ラ イ ヤ ー が 検 出 さ れ た 場 合,フ 線 を打 ち切 る(そ の 結 果,線
の 端 はUFま
c. ア ウ トラ イ ヤ ー が 検 出 され た 場 合,そ
ェ ン スUFあ
る い はLFの
た はLFの
位 置 に な る).
れ を除 い た 部 分 を 使 っ て,別
と こ ろで
のボック
図3.6.1
ボ ッ ク ス プ ロ ッ トに お け る フ ェ ン ス の 表 現
ス プ ロ ッ トをか く.
こ の 扱 い に 対 して,次
の 扱 い bが 考 え られ ます.
b. ア ウ ト ラ イ ヤ ー が検 出 され た 場 合,そ で線 を 打 ち切 る(そ の 結 果UFま
こ の う ち,b がTukeyの テ キ ス トで は,a
れ を 除 く最 大 値 ま た は 最 小 値 の と こ ろ
た はLFの
原 案 で あ り,ま た,よ
位 置 は 図 示 さ れ な い). り 多 く採 用 さ れ て い ます が,こ
の
を採 用 して い ま す.
② この こ とに つ い て,補
足 し ま し ょ う.
扱 い b を否 定 した わ け で は な く,分 析 の 手 順 を 考 え て
ア ウ トラ イ ヤ ー を 指 摘 す る段 階 だ か ら aの 表 現 を採 用 し た
そ う して, そ れ を 除 い て み た場 合 の 分 布 をみ る た め に cの 表 現 を採 用 した の で す. また, 経 過 は 省 略 して 「最 後 の 結 果 を 1つ の 図 に 示 す 」 と い う こ と な ら,b の 表 現 を採 用 し て よ い で し ょ う. 図 の 形 に こ だ わ らず,場 た だ し,次
面 を考 え て 使 い わ け て く だ さ い
の 注 記 ま で考 え る と,b で な く,本 文 で 採 用 し た aの 表 現 を 採 用 した く
な りま す. ③ b の 表 現 に つ い て は,次
に 注 記 す る問 題 が あ る こ とに 注 意 して くだ さ い.
◇ 注 ア ウ トライヤ ー を除 いた後 の 分布 を示 す とい う意 味 で は,最 大 値 ま た は最 小 値 をお きか え るだ け で は す み ませ ん.す な わ ち,中 位 値 や 四 分 位 値 もか わ る可 能 性 が あ り ます (特にア ウ トライヤ ーが 2つ以上 の場 合)か ら,図 の箱 の部 分 も書 き換 え るこ とが必要 です.
したが って,「 基 準 をこ え る値 以 外 の最 大値,最 小値 を 図示 せ よ」とい う説 明 に 対 応 す る
図3.6.1の(b)は, 基準 値 を こえ る値 以外 の 範 囲 でか い た ボ ッ クス プ ロ ッ トに な って い ない の です. よ って,b を採 用 した場 合, は じめ か ら特 定 デ ー タ を除外 して か いた 図 と, 結 果 的 に 除外 され た状 態 を示 す 図 とが 一 致 しな い
こ とが あ り え ま す. 本 文 で,ま
ず 図3.6.1(a),つ
づ い て 図3,6.1(
c)を示 し た の は こ う い う 理 由 も あ り ま す.
こ の 注 記 が 問 題 に な る よ う な ケ ー ス は 少 な い で し ょ うが,考 点 で す.論
え 方 と し て は,区
別 した い
理 的 に は,「 bの 表 現 を 改 め た cの 表 現 が 考 え ら れ る 」 と い う こ と で す.
3.7 補 足:中 位 値,四 分 位 値 の 計 算 ① 四 分 位 値 や 十 分 位 値 は,す う指 標 に な っ て い ま す.こ 量)と よ び ます.た
べ て,大
き さの 順 に 注 目 して,○
の 見 方 で は,こ
と え ば,第
パ ー セ ン ト目 とい
れ ら を,パ ー セ ン タ イ ル(ま た は 順 位 統 計
1四 分 位 値 は25パ
ー セ ン タ イ ル,第
1十 分 位 値 は10
パー セ ン タイル です. た と え ば 四 分 位 値 の 計 算 で は,実
際 の 観 察 値 の 範 囲 で ち ょ う ど25パ
に あ た る もの が な い と き に は,25パ
ー セ ン タイ ルの 前後 に あ た る観 察 値 を使 って補
間 計 算 を行 な っ て25パ
ー セ ンタ イル
ー セ ン タ イ ル に あ た る値 を求 め ま す.
こ れ が 基 本 の 考 え 方 で す が,細
か く考 え る と い くつ か の 扱 い 方 が あ りえ ま す.
ま ず,観 察 値 の 解 釈 に つ い て,次
の よ う な場 合 が あ り え ます.注
記 す る資 料 で あ げ
て い る ケ ー ス を 整 理 して 表 示 し た もの で す. 表3.7.1
表3.7.1は
四 分位 値 の 解 釈:QIは
何パー センタイルか
四 分 位 値 に つ い て の例 示 で す.
N 分 位 値X0,X1,X2,…,XNに
つ い て 一 般 化 す る と,
解 釈 a で はXIは(I+1)/N分
位 値 にあ た る
解 釈 b で はXIはI/(N-1)分
位 値 にあ た る
解 釈 cで はXIは(I+1)/(N+1)
分位 値 にあ た る
解 釈 dで はXIは(I*2+1)/(N*2+2) とい うこ と で す が,そ
分位値 に あ たる
れ ぞ れ の解 釈 の 根 拠 を考 え て み ま し ょ う.
解 釈 a は,「 観 察 値 に 順 序 づ け す れ ば 足 り る」 とい う範 囲 な ら 自然 で す が,「 小 さ い 方 か らみ た P パ ー セ ン タ イ ル は,大 う対 称 性 を も ち ませ ん.よ こ の 解 釈 b で は,最
っ て,解
き い 方 か らみ た(1-P)パ
ー セ ン タイ ルだ」とい
釈 bが 出 て き ます.
小 値 は 0パ ー セ ン タ イ ル で あ り,最 大 値 は100パ
ル だ とい う こ とに な り ます が,異
論 が あ りえ ます.た
と え ば,観
ーセンタイ
察値 の 範囲 でみ た最
小 値 で あ っ て も,観 察 値 数 を 増 や す と,そ れ よ り小 さ い 値 が 出 現 す る で し ょ う. こ の 見 方 に た つ な ら,解
釈 cあ る い は 解 釈 dが 出 て き ま す.両
端 とそ れ 以外 とを
同 等 に 扱 う と い う意 味 で は,解 釈 c よ り解 釈 dの 方 が 妥 当 で し ょ う. 解 釈 eは,観 察 値 の パ ー セ ン タ イ ル が,母
集 団 の 同 じパ ー セ ン タ イ ル の 不 偏 推 定 値
に な る よ うに 定 め る もの で す が,正 規 分 布 を 仮 定 し て い る の で,こ お くこ と に し ま し ょ う(表3.7.1と
② ど の解 釈 を採 用 す るに して も,こ の 関 係 か ら逆 算 して,た 応 す るXIを
こ で は,考
慮外 に
同 じ形 式 に は か け ませ ん).
求 め る こ と に な り ます.そ
とえ ば 四分 位 値 に 対
の 計 算 で 必 要 と な る補 間 計 算 で の 端 数 処 理 に
つ い て, 扱 い 1:通 常 の 補 間 計 算:(XPに
つ い て 補 間 計 算)
扱 い 2:補 間 計 算 を適 用 せ ず, 四 捨 五 入 に よ っ て 整 数 化 した 順 位 に対 応 す るXIを 扱 い 3:TukeyがDEPTHと
使 う
よ ん だ 考 え 方 に よ っ て,
端 数 が 「.0」ま た は 「.5」の 範 囲 に な る よ うに した 計 算 法 の 扱 い が あ りえ ます. ③ Tukeyの 中 位 値,四
原 案 は,d
を採 用 し た 上 で 端 数 計 算 を簡 単 化 し た 「扱 いd3」 で す が,
分 位 値 … の 場 合 を想 定 し た も の で す か ら,た
とえば 十分位 値 な どを使 う
と き に は 適 用 で き ませ ん. こ の ため,観
察 値 の 範 囲 に 限 っ た 見 方 を 採 用 す る な ら 「扱 いb1」,観
察 値 が サ ンプ
ル だ と い う見 方 を入 れ る な ら 「扱 いd1」 で し ょ う. こ の テ キ ス トで はb1を
採 用 して い ま す.必
ず し も そ れ が ベ ス トだ と い う こ と で は
な く,簡 明 に 説 明 で き る と い う点 を考 え た 選 択 で す. ④ 5数 要 約 や ボ ッ ク ス プ ロ ッ トに つ い て は,本 で き ぬ 重 要 性 を もつ 」概 念 で す か ら,統 が,「 同 じデ ー タ を 使 っ た の に,出 うに,そ
文 で 述 べ た よ う に,「 欠 く こ と の
計 ソ フ トで は た い て い 取 り上 げ られ て い ま す
力 が 異 な る」こ とが あ り ます.①,②
の 定 義 自体 に い くつ か の 代 案 が あ る こ と と,こ
で述 べ た よ
こ に 注 記 した 計 算 方 法 上 の ち
が い が あ る ため で す.
表3.7.2
四分 位 値 の定 義 が ど うな っ て い るか を判 断 す る た め の サ ン プ ル デ ー タ と表
定 義欄 の 記 号 は,71ペ い に 対 応.
ー ジに 説 明 した 「解 釈a,b,c,d」
と72ペ
ー ジに 説 明 した 「扱 い1,2,3」 の ちが
表3.7.3
P パ ー セ ン タ イ ルXPの
Frigge,M.,Hoaglin,D.C.and Iglewicz,B.:Some American Statistician,43(1989).
そ れ ぞ れ の ソ フ トに つ い て,ど
計 算 式 にお け る端 数 処 理
Implementations
of the Box Plot.
の 計 算 方 法 を使 っ て い るか を確 認 す る こ と が 必 要 で
す. 説 明 が つ い て い な い 場 合 は,表3.7.2に
示 す 8種 の サ ンプ ル デ ー タ を使 っ て,四 分
位 値 を計 算 し,そ の 結 果 を 表 に照 ら して どれ に あ た るか を判 断 で き ま す.
問題 3
【 分 布 の 歪 み 度 ・尖 り度 】 問 1 54ペ ー ジ の 表3.2.2に
つ い て,7 番 目の デ ー タ を 除 い て 計 算 し な お して み よ.
【ボ ッ ク ス プ ロ ッ ト】 問 2 UEDAの
プ ロ グ ラ ム の う ちBOXPLOTHに
よ っ て,5 数 要 約 と ボ ッ ク ス プ
ロ ッ トに 関 す る本 文 の 説 明 を復 習 し,次 の 問 い に 答 え よ. a.5 数 要 約 で 使 っ て い る指 標 は? b.ボ
ッ ク ス プ ロ ッ トで,5 数 要 約 図 に付 加 した 機 能 は?
c.ア
ウ トラ イ ヤ ー 検 出 基 準 は?
問 3 BOXPLOT1の
説 明 を よ み,
平 均 値 に よ る情 報 要 約 平 均 値 と標 準 偏 差 に よ る 情 報 要 約 中位 値 と 四分 位 値 に よ る 情 報 要 約 5数 要 約 ボ ックスプ ロッ ト の順 に,ど
ん な 視 点 で こ れ らが 変 更 され て い る か を 説 明 せ よ.
問 4 BOXPLOT2の
説 明 を よ み,賃
金 の 年 齢 別 比 較 の た め に 問 3の 表 現 が そ の 順
に精 密 化 さ れ て い る こ と を確 認 せ よ.こ が,プ
の 章 で 説 明 し て い な い 表 現 法 が あ りま す
ロ グ ラ ム 中 の 説 明 で わ か る と 思 い ます.
問 5 問 3に あ げ た 種 々 の 表 現 法 が3.1節
の ② に あ げ た 「バ ッ ジ と し て の 特 徴 を み
る際 の 着 眼 点 」の どの 範 囲 を カバ ー して い る か を指 摘 せ よ. 間 6 プ ロ グ ラ ムXPLOT1を
使 っ て,付
表 A に 示 した消 費支 出総 額 の デー タの値
の 分 布 を 図 示 せ よ.基 礎 デ ー タ は,プ
ロ グ ラ ム の 例 示 用 デ ー タ と して セ ッ ト して
あ る. a.分 布 図 b.そ の 形 の 特 性 を 表 わ す 指 標 値(平 均 値 と標 準 偏 差) c.ボ
ックスプ ロ ッ ト
【ボ ッ ク ス プ ロ ッ トに よ る比 較 】 問 7 (1)付
表 A に 示 し た 消 費 支 出 総 額 の デ ー タ を,世 帯 人 貝 数 で 3区 分 し,各
分 で の 分 布 に つ い て ボ ッ ク ス プ ロ ッ トを か け.プ セ ッ トし て あ る例 を 使 う こ とが で き る.
ロ グ ラ ムXAPLOTと
区
それに
(2)付
表 A に 示 し た 消 費 支 出 総 額 の デ ー タ を,実 収 入 で 3区分 し,各 区 分 で
の 分 布 につ い て ボ ッ ク ス プ ロ ッ トを か け. 問 8 付 表 A に 示 した 食 費 支 出額 の デ ー タ につ い て,問
6 と 同 じ図 をか け.
問 9 付 表 A に 示 す 食 費 支 出額 と消 費 支 出 総 額 を 使 っ て 食 費 支 出 割 合 を計 算 し,問 6 と 同 じ図 を か け. 注:食 費支 出 割合 の デー タは,プ ロ グ ラムVARCONVを 間10 付 表 C に示 す 賃 金 に 関 す る デ ー タ に つ い て,各 四 分 位 値,第
使 って用 意 す るこ と. 年 齢 区 分 の 情 報 を 中位 値 と 第 1
3四 分 位 値 で 表 し,年 齢 別 に み た 変 化 を 分 析 せ よ.
こ の デ ー タ の よ う に 「分 布 表 の 形 式 に な っ て い る 」場 合 に は プ ロ グ ラ ム XPLOT2を
使 う.付 表 C の デ ー タは 例 示 用 と して セ ッ ト して あ る.
【 分 析例 】 問11 付 表 L に示 す 血 圧 の 分 布 を 示 す デ ー タ フ ァ イ ル(DI10V)に
つ い て,
a. 年 齢 別 平 均 値 を年 齢 別 に 対 比 す る た め に適 当 な 図 をか け. b. 平 均 値 で は 表 わ せ な い個 人 差 の 幅 を示 す た め 標 準 偏 差 を 計 算 し,そ の 結 果 を aの グ ラ フ に つ け 加 え よ. c. 個 人差 の 幅 に 関 し て,大
きい 方 向 へ の ひ ろ が り と小 さ い 方 向 へ の ひ ろ が り
とが 異 な る 可 能 性 が あ る こ と を考 慮 し た 図 に 改 め よ. d. 最 大 値 の か わ りに90%点(大 る 値),最
き さ の 順 が 大 き い 方 か ら10/100番
小 値 の か わ りに10%点(大
目に あ た
き さの 順 が 小 さ い 方 か ら10/100番
目に
あ た る値)を 用 い た 「 疑 似 5点 表 示 」 をか け. 問12 付 表N(フ
ァ イ ルDI40V)は,15歳
を 調 べ た結 果 で あ る.こ
以 上 の 日本 人 に つ い て,身
a. 身 長 の 区分 ご と に(2cm区
切 りに な っ て い る),そ
体 重 の 分 布 に 関 す る 第 1四 分 位 値,中 ラ ムQ1Q2Q3Xと
位 値,第
デ ー タ フ ァ イ ルDI40Vを
列 記 す る こ とが 考 え ら れ るが,そ c. 身 長 ×身 長 ×22(身 長 は m,体 れ と比 べ て20%以
れ ぞれ の 区分 に お け る
3四 分 位 値 を 求 め よ.プ
ログ
使 う こ と.
b. 各 身 長 区 分 ご と に 求 め た 結 果 を 図 示 せ よ.た
と よ び,そ
長 と体 重 の 関 係
れ に も とづ い て,
と え ば,「 疑 似 5点 表 示 」 を
れ 以 外 の 形 式 で も よ い. 重 はkg)と
して 計 算 さ れ る 値 を 「標 準 体 重 」
上 の 場 合 肥 満 傾 向 あ り と指 摘 さ れ る.こ
れ ら
の 値 を b の 図 に 書 き 込 め. 問13 (1) 3.5節
で 説 明 し た 分 析 手 順 で 使 っ た 一 連 の ボ ッ ク ス プ ロ ッ ト(図
3.5.4∼ 図3.5.7を
か け.プ
ロ グ ラ ムBOXPLOT3の
最 初 の 画 面 で例 3 を指 定 す
れ ば よ い. BOXPLOT3を
使 う た め に は,47県
あ る.デ ー タ フ ァ イルDI93Xに
は,こ
を ど う 区 分 す るか を 指 定 す る 文 が 必 要 で れ が つ け 加 え て あ る.
(2) 1985年 分 の デ ー タ に つ い て(1)と 同 じ図 を か け.
1985年 分 の デ ー タ も フ ァ イ ルDI93Xに
記 録 され て い る.
【ボ ッ ク ス プ ロ ッ トの 表 わ し方 】 問14 ボ ッ ク ス プ ロ ッ トに お け る 「ア ウ トラ イヤ ー 検 出 基 準 」に つ い て
a. 58ペ ー ジ に 示 し た0.69%と
い う値 は ど う し て 誘 導 さ れ た もの か を 説 明 せ
b. こ の 値 が1%と
な る よ う に す る に は,基 準1.5を
ど う変 更 す れ ば よ い か.
c. こ の 値 が5%と
な る よ うに す るに は,基
ど う変 更 す れ ば よ い か.
よ.
準1.5を
問15 ボ ッ ク ス プ ロ ッ トの フ ェ ン ス の 定 義 を60ペ U F-Q2,D9-Q2,D3-D2が
ほ ぼ4:2:1に
ー ジ に 示 し た 形 に 改 め た と き,
な っ て い る こ と を 示 せ.た
だ し基礎
デ ー タ の 分 布 が 正 規 分 布 と仮 定 で き る もの とす る. 問16 5点 表 示 あ る い は ボ ッ ク ス プ ロ ッ トに よ る 表 現 が,平
均 値 と標 準 偏 差 に よ る表
現 と比 べ て どん な 点 で す ぐれ て い る か を 指 摘 せ よ. 【統 計 調 査 に お け る分 布 の 表 現 】 問17 賃 金 統 計 に 関 す る報 告 書 を み て,「 賃 金 の 分 布 」 を ど の よ う な 指 標 を使 っ て 表 現 し て い る か を 調 べ よ. 間18 付 表G.2で る が,こ
は,年
間 収 入 の 五 分 位 値 と貯 蓄 現 在 高 の 四 分 位 値 と が 使 わ れ て い
れ ら は,区
分 数 が ち が う こ と 以 外 に,「 使 う 意 図 」の 上 で 相 違 が あ る.
そ の 相 違 点 を指 摘 せ よ.
4 デ ー タ の 対 比
「ボ ッ ク スプ ロッ トの 位 置 が ずれ て い る」とい う こ と を,「 同一 区分 内 で の ひ ろが り と比ぺ て区 分 間の 差 が 大 きい」と了 解 で き ます.こ う了解 す る と,分 散 す な わ ち 「ひ ろが りの 大 き さ を測 る指 標 」とみ て,そ れ が 「区 分 け に よ っ て ど の程 度 減 少 す るか 」に 注 目 して,区 分 け の 有 効 性 を 評価 で き ます. これが,こ の章 で 説 明 す る内 容 の筋 書 きです.
4.1 区分 け する ① デ ータ に も とづ い て説 明 す るた めの論 理
指標 値 X の 大小 を説 明す る,す
な わ ち,大 小 を もた らす 要 因 を探 究 す る た め に 考 察 範 囲(観 察 単 位 の 集 団)を 想 定 す る ⇒ 集 団 を区分 けす る ⇒ 区分間 の差 の大小 をみ る ⇒ 区 分 間 の 差 が 大 きい ほ ど, 区分 け に使 った要 因 が有 力な候 補 と い う過 程 に 沿 っ て デ ー タ を分 析 し て い き ます. ② 区 分 け に使 う要 因 の 選 択 定 さ れ て お ら ず,い
こ の 形 で 分 析 を進 め る最 初 の 段 階 で は,要
因 は特
くつ か の 候 補 が あ るで し ょ う.そ れ らの どれ を使 う と 「実 態 を よ
く説 明 で き るか 」を比 較 検 討 す る こ とが 必 要 で す.た X(=食
費 支 出 額 の 世 帯 間 差 異)に つ い て,
A(=世
帯 人 員 数),B(=世
と えば
帯 収 入 )に よ っ て,
「X の 変 動 が どの 程 度 ま で 説 明 で き る か 」 を調 べ る ため に ボ ッ ク ス プ ロ ッ トをか い た と こ ろ,図4.1.1の
よ う に な っ た と し ま し ょ う(基
礎 デ ー タ は 付 表 A,問 題 3の 問 8参 照). A に つ い て は,、A1=2∼3人,
A2=4人,
A3=5人
以 上, B に つ い て は,B1=50以
図4.1.1
下,B2=50∼100,B3=100以 こ の 例 で は,ボ す.た
2つ の 要 因の 効 果 比 較
上 と区 分 して 比 較 して い ます.
ッ ク ス の 位 置 が ず れ て い る こ と か ら,要
因 A の効 果 が判 断 で き ま
だ し,そ れ ほ ど ク リアー で な い ケ ー ス が あ り ま す か ら,区 分 け し た 場 合 の 「 差
の 有 無 を判 定 す る客 観 的 な 手 順 」を組 み 立 て る こ と を考 え ま し ょ う. これ が,こ
の 節 の テ ー マ です.
③ 分 析 手 法 と して の 構 成
以 上 の よ う な考 え 方 を体 系 づ け る こ と に よ っ て,指
標 値 X の 変 動 を い くつ か の 要 因 に よ る 区 分 と結 び つ け て 説 明 す る … そ れ を分 析 手 段 と して 組 み 立 て る こ と を 考 え て い くの で す. 考 え る べ き 点 は,①
で 述 べ た 「区 分 間 の 差 」あ る い は ② で述 べ た 「 位 置 がずれ て い
る」 と い う記 述 を,客 観 的 な 統 計 手 法 の 中 に と りい れ る こ と で す.す
なわ ち
区分 間の差 ⇒ 位 置 がずれ て いる ⇒ 平均 値 が異 な る ⇒ そ の こ と を考 慮 に 入 れ る と,分 散 が 小 さ くな る こ とに 注 目す る の で す. ④ こ の 章 で は,各
区 分 で の 観 察 値 を代 表 す る値(た
各 区 分 間 の 差 の 有 無 を判 定 す る もの と して い ま す.こ
とえ ば 平 均 値)に 注 目 し て,
の こ とか ら,た
間 で 平 均 値 は 同 じ で も ひ ろ が り幅 が ちが う … そ うい う場 合 に は,差 こ と に な り ます.ま
た,そ
う限 定 して い る た め,前
と え ば,各
区分
あ り とは み な い
章 の よ うに ひ ろ が り幅 の 非 対 称 性
を考 慮 に 入 れ る こ と は し ませ ん. し た が っ て,「 各 区分 の 情 報 比 較 」 を,各 区 分 を代 表 す る 「平 均 値 の 比 較 」 とお きか え て 考 え る こ と に な り ます. ⑤ そ れ に して も,目 標 は,指
標 値 X の 変 動(個 々 の 観 察 単 位 の レ ベ ル で み た 値
の 変 動)を 説 明 す る こ と です か ら,そ れ を 説 明 す る基 準 と して,ど
ん な要 因や 区分 の
仕 方 に よ る平 均 値 が 有 効 か をみ る こ とが 必 要 で す. した が っ て,区
分 の 仕 方 を特 定 して し ま うの で な く,た
区 分 の 仕 方 をか え て み ま し ょ う.ま
た 図4.1.3の
と え ば 図4.1.2の
ま し ょ う. 図4.1.2で
は 図4.1.1で
よ うに,
よ う に 2つ の 要 因 を組 み 合 わ せ て み
3区 分 で あ っ た 要 因 A を 4区 分 に して い ま す.
図4.1.2
区 切 り方 をか え る
図4.1.3
図4.1.4
2つ の要 因 を 組 み 合 わせ る
ヒ ン ジ トレー ス
こ れ に よ る と,「 情 報 を よ り細 か くみ た 」こ と が 「差 が は っ き り し な くな っ た 」 こ と につ な が る よ う に み え ま す.「 細 か くみ た の だ か ら,当 だ」 と い う 疑 問 含 み の 質 問 が 出 る か も しれ ませ ん.こ ジ の 注 1に 用 意 して あ り ます が,そ
然,よ
れ をみ る前 に,4.2節
要 因 B に つ い て も細 か く区 分 で き ます.B 切 り方 を 自 由 に 決 め る こ と が で き ます が,細 基 礎 デ ー タ が 数 量 で あ る こ とか ら,B
え られ ま す.図
ー
の 説 明 を よん で くだ さ い.
が 数 量 デ ー タ で す か ら,区 分 の 数 や 区 か くす る だ け で よ い とは 限 り ませ ん.
が か わ っ た こ と に 対 応 す る,X
「あ る カ ー ブ で 表 わ し う る」 と考 え る な ら,図4.1.4の る ボ ッ クス の位 置 を 線 で つ な い で,BXの
り くわ し くわ か る は ず
の 質 問 に 対 す る 答 え は83ペ
よ うに,B
の変化 を
の各区分に対応す
関係 を 「 傾 向線」として把 握 す るこ とが考
で は,中 位 値 をつ ら ね る線 と 第 1四分 位 値 をつ らね る線,第
値 をつ ら ね る 線 の 3本 組 に し て 使 っ て い ま す.ま
た,傾
3四 分 位
向 を把 握 す る と い う 趣 旨 か
ら,そ
れ ぞ れ の 線 を ス ム ー ジ ン グ して,細
か い 上 が り下 が り を消 し て い ま す.こ
「ヒ ン ジ トレ ー ス 」 と よば れ る表 現 方 法 で す.く
れは
わ し くは 本 シ リー ズ 第 3巻 『 統 計学 の
数 理 』を 参 照 し て くだ さ い. さ ら に,X
に 対 す る A の 影 響 と B の 影 響 とが 「そ れ ぞ れ の 効 果 が 加 わ っ た 形 」で
な く,「 相 乗 効 果 あ る い は 相 殺 効 果 を もつ 形 」に な っ て い る こ とが 考 え ら れ る場 合 に は,図4.1.3の
よ う な 比 較 を す る こ と に な り ま す が,区
分 数 が 大 き くな る ⇒ 各 区 分
に 属 す る デ ー タ数 が 少 な くな る ⇒ そ の こ とか ら傾 向 が 乱 さ れ る,と
い う理 由 で,限
度 が あ り ます. 1つ の 要 因 に つ い て 細 か くみ る 図4.1.4の
場 合 も 同 じ理 由 で,
「細 か く区 分 して み る こ と」に対 す る 「デ ー タ 数 か ら く る 限 度 」 を把 握 す る た め に,次
節 で 述 べ る分 散 に よ る評 価 を併 用 し な け れ ば な ら な い の で す.
4.2 種 々 の 分 散 とその 計 算 ① 前 節 で 述 べ た 分 析 手 段 を 組 み 立 て る た め に は,種
々 の 分 散,す
な わ ち,「 種 々
の 見 方 で 誘 導 さ れ た 説 明 基 準 」か らの 偏 差 を表 わ す 分 散 を使 い ます. こ の 節 の 手 法 で は,デ
ー タ を区 分 し,そ れ ぞ れ の 区 分 ご とに 求 め た 平 均 値 を 基 準 と
して 分 散 を 計 算 し ま す.次 とに よ り,分 散 が37か
の例 示 の よ う に(一 般 に 成 り立 つ こ とで す が),区
ら30に
そ の 減 少 度 が 大 き い の で,そ
減 少 し ます.そ
う し て,平
分 す るこ
均 値 間 の 差 が 大 き い ほ ど,
の 減 少 度 に 注 目 して 「説 明 基 準 の 有 効 度 」を 判 定 で き る
の で す. この 計 算 に お け る左 側 は,第
2章 で 説 明 し た 分 散 の 計 算 と同 じ です.
表4.2.1
基 準 をか え て分 散 を計 算
右 側 が,観
察 単位 が 区 分 さ れ て い る 場 合 の 計 算 で す.こ
コー ドを表 わ す 添 字 K を使 っ て い ます.そ
の こ と に と も な っ て,区
分
う し て,平 均 値 が K の 区 分 ご と に 計 算 さ
れ,分 散 の 計 算 で は K に 応 じた 平 均 値 を 使 う形 に な っ て い ま す. 偏 差 を測 る 基 準 を お きか え て い る 点 以 外 は,基
本 的 に は 同 じ計 算 手 順 で す.た
だ,
計 と平 均 値 の欄 を,全 体 で の 計 ・平 均 値 の 欄 と各 区 分 で の 計 ・平 均 値 の欄 に わ け て い る と こ ろ が ち が うだ け で す. こ の 節 で考 え るの は,偏 ② 分 散 の 定 義
差 を測 る基 準 を お きか え て い る こ と の 意 味 で す.
こ の 節 で は,ま
ず,そ
れ ら の 分 散 の 呼 称 や 定 義 に つ い て,ま
と
め を与 え て お き ま し ょ う. 分 散 は,「 基 準 とみ る値 か ら の 偏 差 」の(一 種 の)平 均 で す.し タ の 偏 差 」の 大 き さの 指 標 で す が,基 れ ます.す
な わ ち,一
た が っ て,「 対 象 デ ー
準 の と りか た に 対 応 し て,種
々の 分散 が 定義 さ
般化 して
σ2=〓1/NΣ(XI-μ)2 と表 わ し,μ す な わ ち 「XIの 変 動 を説 明 す る 基 準 の 選 び 方 」に よ っ て 場 合 わ け す るの です. 表4.2.1の
左 側 す な わ ち 全 体 で の 平 均 値 を 基 準 と し た 分 散 が 「全 分 散 」,右 側,す
な わ ち,各 区 分 ご とに わ け て み た 平 均 値 を 基 準 と した 分 散 が 「級 内 分 散 」で す. 残 差 分 散 に つ い て は,後
の 章 で 説 明 し ます.
表4.2.2
種 々の分散の定義比較
こ の 表 に お け る偏 差 平 方 和 お よ び 分 散 の 記 号 で は,全 内(W)で が,後
体(T)で
の 平 均 値 を基 準 と して い る こ と を示 す た め に,添
の 節 で は,被
③ 偏 差 平 方 和
説 明 変 数,説
の 平 均 値,各
字 T,W
区分
を 使 っ て い ます
明 変 数 の 記 号 を 添 字 とす る 記 号 に 変 更 し ま す.
偏 差 平 方 和 は,「 デ ー タ が もつ 変 動 量 」の 大 小 を 評 価 す る 量 だ
と解 釈 で き ます. そ の デ ー タ を解 析 す れ ば 「そ の 大 き さ に 見 合 っ た だ け の 情 報 が 明 ら か に な る」 と い う意 味 で,情
報 量 と よ ぶ こ と もあ り ます.
し た が っ て,デ 標 で す.分
ー タ解 析,す
散 は,そ
な わ ち デ ー タ の 変 動 を説 明 す る手 続 き と して 重 要 な 指
れ を,デ ー タ1 単 位 あ た りに 換 算 した も の だ と解 釈 で き ます.
◇ 注 情 報 量 とい う用 語 は,統 計 学 では た とえ ば 「 推 定 論 な どの理 論 構 成 」の場 面 で使 わ
れ て い ます が,こ こで は,そ うい う理 論 は と もか く,本 文 で 述 べ た解 釈 か ら そ うよぶ の だ と理 解 して お くと,以 下 の 説 明が わ か りや す い と思 い ます. ④ 計 算 手 順 の 構 成
計 算 は,次
の よ うに 表 形 式 に ま と め て 行 な い ま し ょ う. 注
記 す る よ う に,分 析 上 必 要 とな る 情 報 を 記 録 し て お く よ うに 設 計 して あ るの が 重 要 な 点 で す. こ の フ ォ ー ム に お け る 「ひ とつ ひ とつ の 区 分 で み た 偏 差 」は,後 る こ とが あ るの で,そ
れ を 記 録 し て お き ま す.た
と え ば,分
の段 階 で 必 要 と な
散 に 対 して どの デ ー タ の
偏 差 が どの 程 度 寄 与 して い るか をみ る こ とが で き るか ら で す.
表4.2.3
級 内 分 散 の計 算 フ ォ ー ム
◇ 注 1 分散 の定 義 式 を,次 の よ うに変 形 して適 用 す る方法 もあ りえ ます. ST=ΣX2-T2/N SK=ΣX2-TK2/NK,SW=ΣSK 分 散 を計 算す るだ け な ら どち ら で も同 じこ とで す が,本 文 に 述 べ た 理 由 で,表 記 の フ ォー ムに よ りま し ょ う. ◇ 注 2 右 側 の フォ ー ム で は 各 区分 に 属 す るデ ー タ を わ け て 示 す 形 に して あ りま す が, デ ー タ番 号 順 に示 して お くと,他 種 の分 散 の 計 算 と対 比 で き るな どの 利点 を もち ます . ⑤ 定 義 か ら明 ら か な よ う に(ま た,簡 単 に 証 明 で き る こ と で す が),
全分 散 ≧ 級 内分散
が 成 り立 ち ま す. ⑥ 分 散 の 推 定
な お,分
散 に つ い て は,デ
デ ー タ数 N で な く,自 由 度 で わ れ,と
ー タ に よ る見 積 も り を求 め る場 合,
い う提 唱 もあ り ま す .こ
は 形 式 上 N 組 の 成 分 を もつ が,Σ(X-μK)=0だ
れ は,対
か ら,実 質 上 は(N-K)組
比(X-μK) で あ り,
この 実 質 上 の 組 数(自 由 度 と よ ば れ る)で わ れ と い う説 だ と 了 解 す れ ば よ い の で す.全
分 散 の 場 合 は,区
分 数 1に あ た り ま す か ら,
自 由 度 はN-1で
す.
こ の テ キ ス トで は,第
5章 を 除 い て,こ
の 扱 い を して い ませ ん.し
の 見 積 も り をす べ て デ ー タ 数 N で わ る方 式 で 求 め て い ます.た 点 が い くつ か あ り ます か ら,そ
うい う箇 所 で は,注
⑦ 各 区 分 の 寄 与 率 級 内 偏 差 平 方 和Swを
た が っ て,分
だ し,注
散
意 を要 す る
記 し ます. 計 算 す る過 程 にお い て 求め られ る
SK(各 区 分 ご とに わ け て み た 偏 差 平 方 和)を 記 録 して お く と,区 分 け の 効 果 が どの 区 分 で 大 きか っ た か,あ
る い は,わ
け 方 を か え る とす れ ば,ど
こ を 改 め る か を判 断 す る
参 考 に な り ます. SW=ΣSKと
な っ て い ます か ら, SK/SWに
よ っ て,区
で み た変 動 の何 % に あ た るか を 評 価 で き ます.こ ま た,SKを
分 K で の 変 動 が デ ー タ全 体
の 比 を 「寄 与 率 」 と よ び ます.
そ れ ぞ れ の 区 分 の 観 察 単 位 数 で わ っ た も の を 「各 区 分 で の 分 散 」 と よ び
ま す. な お,分
散 成 分 と い う 呼 称 を 使 うこ と もあ り ます が,正
し くは,偏
差平 方和 の成分
です. ⑧ σK2は,区
分 K に 限 っ て み る もの とす れ ば,そ
級 内 分 散 は,各
の 区 分 で の 全 分 散 です.
区 分 で の 分 散 の 加 重 平 均 に な っ て い ます.す
なわ ち
σ w2=〓
平 均 値 に つ い て も,同 様 な 関 係 μw=〓
が 成 り立 っ て い ま す.し
た が っ て,平 均 値 も分 散 も,各 集 団 区 分 で み た平 均 値,分
の 「 各 区 分 の サ イ ズ を ウ エ イ ト と した 加 重 平 均 」に な っ て い ま す.80ペ
散
ー ジの計 算例
に つ い て 確 認 して くだ さ い. な お,4.1節
の ③ で 「重 な っ て い な い 」→ 「区 分 け が 有 効 で 」 と い う 説 明 の 仕 方 を
して い ます が,こ
の 点 に つ い て は,や や 不 正 確 で す.正
し くは,次
の よ うに い い か え
ま し ょ う. σKの(一 種 の)平 均 に あ た るσwが
σTよ り小 さ くな っ て い れ ば,
区 分 け が 有 効 だ と判 定 され る とい うこ とで す. 「小 さ け れ ば 」 と い う と こ ろ を,ど
の 程 度 小 さ け れ ば よ し と す る か は,も
う少 し説
明 をつ づ け て か ら答 え る こ と に し ま す. ◇ 注 1 「区 分 け が 有効 だ」 とい う こ とは 「 各 区 分 の 平均 値 を 比較 しや す くな る」こ とに つ な が る とは 限 りませ ん,前 節 の 図4.1.3あ
るい は 図4.1.4で
み た よ うに,区 分 数 を 多 くし
す ぎる と,各 区分 での デー タ数 が 少 な くな り,た とえ ば,傾 向 か ら外 れ た値 の 影響 で,区 分別 平 均値 につ いて の傾 向性 を乱 す … こ うい う副 作 用 が あ りう るため です. ◇ 注 2 「サ イ ズ を ウ エ イ トとす る」こ とは 自明 で は あ り ませ ん.た
とえ ば,「 各 区 分 を対
等 に扱 う」とい う意 味 で は,サ イ ズの大 小 を考 慮 せ ず,等 ウ エ イ トで扱 うこ とも考 え られ
ま す. ま た,あ
る 標 準 の ウ エ イ トを 使 っ て 計 算 し な お す べ き場 合 が あ り ま す.こ
つ い て は,第
う い う扱 い に
6章 で 取 り上 げ ま す.
4.3 分 散 分 析 の 考 え 方 ① 要 因 分 析
「デ ー タ の もつ 変 動 の 要 因 を 分 析 す る 」 と い う観 点 で は,分
大 き い と こ ろが,要
注 目箇 所 で す.し
た が っ て,分
散 は,要
散の
注 目箇 所 を発 見 し,分 析
を進 め る手 段 と して 使 わ れ る も の で す. 分 散 の 定 義 式 に お け る平 均 値 な ど は,デ
ー タの 変 動 を説 明 す る た め の 「1つ の 基 準 」
で す か ら,
種 々 の 基 準 を使 っ た 分 散 の 大 き さ を対 比 す る こ と に よ っ て,
各 基 準 の 有 効 度 を評 価 す る
こ とが で き ま す. ま た,分
散 の 「で き る だ け 大 き い 部 分 を 説 明 で き る基 準 」 を見 出 す 手 続 き を 定 式 化
す る こ とに よ っ て,デ こ れ が,以 な お,こ
ー タ主 導 型 の 分 析 を進 め る こ とが で き ま す.
下 に 説 明 す る 「分 散 分 析 の 考 え 方 」で す. こ で 「分 散 分 析 」と よば ず 「∼ の 考 え 方 」 と よ ん だ 理 由 に つ い て は こ の 節 の
終 わ りに 注 記 し ます. 種 々 の 分 散 を計 算 しそ れ ら を対 比 し ま す が,分
散 を 測 る基 準 を 評 価 す る た め に 適 用
す る の で す か ら,そ の 意 図 に 沿 っ て使 い ま し ょ う.ま
た,4.1節
で 述 べ た よ うに,指
標 値 X の 変 動 を 説 明 す る た め に 「種 々 の 基 準 の 有 効 性 を比 較 す る 」こ とが 必 要 と な っ て き ま す. ② 分 析 手 順 の 構 成 と表 示
実 際 の 分 析 手 順 で は,以
た ところ を 「 偏 差 平 方 和 」と お き か え ます.こ
上 の 説明 で 「 分 散 」とい っ
の お き か え は,「 分 散 す な わ ち デ ー タ 1
つ あ た り」に 換 算 せ ず に,「 そ の 分 子 す な わ ち デ ー タ 数 の 大 小 を 考 慮 に 入 れ る 形 」で, デ ー タの 変 動 の 大 き さ を 測 る こ と を意 味 し ます. デ ー タ の 変 動 を 分 析 す る と い う 意 味 で,偏
差 平 方 和 を変動 和 と よぶ こ と もあ りま
す. 分 析 の フ ロー と 変 動 和 の 減 少 は,図4.3.1の 4.2.1の
こ こ で,偏 差 平 方 和 の 記 号 を か え て い ま す.す X やA
よ う に 図 示 す る こ と が で き ま す(表
計 算 例 に 対 応).
を 使 い,分
が って,全
変 動 和 はSXと
る と い う意 味 で,条
な わ ち,添 字 と し て,変
数の記号
散 の 種 別 を表 わ す 添 字 T や W は 使 わ な い もの と し ま す .し し ます.ま
た,「 級 内 」で は,説
件 を 表 わ す 記 号| を 組 み 込 ん で,SX│Aと
し て お り,「 級 間 」で は,
X と A の 関 連 度 に 関 す る 情 報 だ と い う 意 味 で 記 号 × を 組 み 込 ん で,SX×Aと す.
た
明 変 数 の 区 分 を特 定 して み
しま
図4.3.1
分 析 の フ ロ ー と偏 差 平 方 和 の 減 少
こ の お きか え は,次 節 以 降 の 拡 張 に お い て効 用 を発 揮 し ます. ◇ 注 こ こ ま で の段 階 な ら,分 散=偏 差 平 方 和/Nで
す か ら,こ の 図 に お け る 「 偏差平 方
和 」す な わ ち 「 変 動 和 」を 「 分 散 」とお きか え て も同 じです.た だ し,あ との 拡 張 で は そ う で き ない場 合 が あ ります か ら,偏 差 平 方 和 を使 い ます. ③ 基 準 か らの 偏 差 を 表 わ す 全 変 動 和,級
内 変 動 和 に 対 し て,そ
よ び ま す.全
れ らの差 として定
義 さ れ る 量 を,"級
間 変 動 和"と
して 説 明 さ れ,"級
内 変 動 和"に 相 当 す る部 分 が 未 説 明 と して 残 っ た も の と考 え る こ
変 動 和 の 一 部 が 級 ご との 平 均 値 の 差 と
とが で き ま す. デ ー タ の 変 動 の 未 説 明 部 分 が,「 説 明 の 進 行 と と も に 顕 在 化 さ れ て い く」こ と に よ り,減 少 して い き ま す.し 全 変 動 和,級
たが って
内変 動 和 → 情 報 の ス トッ ク
級 間変動 和
→ 情報 の フ ロー
と解 釈 し ま し ょ う. 分 析 す な わ ち デ ー タ の もつ 情 報 を解 き 明 か して い く手順 とい う理 解 で す. ま た,あ
る要 因A に 関 し て 区 分 した 場 合,そ
の 減 少 率 に よ っ て 評 価 す る こ と が で き ます.す
の こ との 効 果 を,情 報 の 未 説 明 部 分 な わ ち,
R2=1-SX│A/SX=SX×A/SX を使 い ま す.こ
れ が,決
定 係 数 で す.
こ れ に つ い て,0≦R2≦1が
成 り立 ち ま す か ら,デ
ー タ の 変 動 の 説 明 に 最 も有 効 な
ら そ の 値 が 1で あ り,デ ー タ の 変 動 の 説 明 に 全 く無 効 な ら そ の 値 が 0 と な る の で す. ④ 以 上 の 分 析 結 果 を,表4.3.2の 示 す の が 慣 習 に な っ て い ます(例
よ う な 一 覧 表(分 散 分 析 表 と よ ぶ)に ま とめ て
:表4.3.3).
⑤ こ の フ ォ ー ム に か わ る もの と し て,各 た,表4.3.4の
区 分 ご とに み た偏 差 平 方 和 と分 散 を 含 め
よ う な 詳 細 フ ォ ー ム を使 う こ と も考 え ら れ ま す(例
:表4.3.5).
表4.3.2
分 散 分 析 表(1 要 因 の場 合 の フ ォ ー ム)
表4.3.3
分 散 分 析 表(計 算例,図4.3.1の
分 散 の 欄 に は,自
場 合)
由度 で な く,デ ー タ数 N で わ っ た もの を お き ます.
た だ し,「 デ ー タに よ る見 積 も り」を与 え る場 面 で は,こ い 方 が あ り え ます.
れ と ち が う扱
分 散 分 析 表 とい う呼 称 は,「 分 散 を 分 析 す る」 もの とい う印 象 を 与 え ま す が,分 散 そ の もの で は な く,デ ー タの個 別 変 動 に 関 して,そ の 変 動 を 説 明 す る要 因 を見 出 す ため の分 析 結 果 を示 す もの に な っ て い ます.し て,「 変 動 要 因 分 析 表」 と よ ぶ べ き もの で す が,慣
たがっ
用 に し た が って,分
散
分 析 表 と よ ん で お き ます.後 の 章(第 5章)で の 分 散 分 析 表 と 区 別 した い と き に は,「 要 因分 析 の た め の 分 散 分 析 表 」 とよぶ こ とに し ます. こ こま で の段 階 な ら,決 定 係 数R2を
分 散 の 比 と して 計 算 して も,偏 差
平 方 和 の 比 と して 計 算 して も同 じ です が,前 差 平 方 和 の 比 と して 定 義 し ます.
表4.3.4
表4.3.5
節 の ⑤ の こ と を考 え て,偏
分 散 分 析 表(1 要 因 の 場 合 の 詳 細 フ ォー ム)
分 散 分析 表(計 算 例,図4.3.1の
場 合)
詳 細 フ ォー ム のポ イ ン トは,偏 差 平 方 和 に つ い て 成 り立 っ て い る 関 係 SX=SX×A+SX│A SX│A=ΣSX│AI に 注 目 して,各
成 分 の 寄 与 度 を 示 す 形 に し て い る こ とで す.
した が って,決 比,す
定 係 数 の 欄 に は,「 区 分 別 平 均 の 差 」の 行 以 外 に も,SX/Nに
対す る
な わ ち,前 節 で 説 明 し た 「寄 与 率 」 を お い て い ます.
ま た,こ
の 詳 細 フ ォ ー ム を使 う と き に は,偏
分 ご とに ち が うの で,そ
差 を 測 る 基 準 値 で あ る 「平 均 値 」が 区
れ ら も表 示 す る よ う に し ま し ょ う.
◇ 注 多 くの テ キ ス トで は,分 散 分 析 を 「実験 デー タ につ い て 区分 別 平均 値 の差 の 有 意 性 を検 定 す る 問題 」に 結 び つ け て説 明 して い ます が,有 意性 検 定 まで 進 め な くて も,こ の 節 で 説 明 した よ うに 「区 分 け す る こ との 有 効 性 を測 る手 段 」と して使 う こ とが で き ま す.こ の テ キ ス トで は こ うい う視 点 で扱 って い ます.ま た,そ の こ とか ら,F 比 を使 わ ず,決 定 係数 を使 うな どの 変 更 を加 え て い ます. こ うい う使 い方 を考 えて 「 分 散 分析 の考 え方 」を採 用 し よ うとい うこ とです.
4.4 分 析 結 果 の 表 示 ① 3.5節 で 取 り上 げ た 「人 口 あ た り病 床 数 の デ ー タ」(付表 B)に つ い て は,「 大 都 市 周 辺 が そ の 他 と ち が っ て い る こ と」が 示 唆 され て い ま す の で,そ
れ を確 認 す る た め
に 分 散 分 析 を適 用 して み ま し ょ う. た だ し,「 ア ウ トラ イ ヤ ー 」 とみ られ る 2県 が あ り ます か ら, 2県 とそ れ 以 外 の45県
とに二分 す る こ と
45県 を 大 都 市 周 辺(10県)と
そ れ 以 外(35県)と
に二分す るこ と
の 2つ の ス テ ッ プ に つ い て,区 分 け す る こ との 効 果 を み る こ と に な り ます.
図4.4.1
分 析 の フ ロー
② こ の フ ロ ー に し た が っ て 分 散 分 析 表 を か く と,次 の 表4.4.2が
得 ら れ ま す.
原 デ ー タ の ま ま で は 桁 数 が 長 く な る の で,単 した が っ て,計
位 を[千]に
か え て 計 算 して い ま す.
算 結 果 も千 を 単 位 とす る値 に な っ て い ます.
県 間 の 差 を表 わ す 「偏 差 平 方 和 」は4856で
す.
ス テ ッ プ 1で ア ウ ト ラ イ ヤ ー 2県 と そ れ 以 外 と に 二 分 す る と,偏 と な り ま す.す
な わ ち1764の
減 少 で,「 情 報 の 約34.3%が
て い た こ とに よ る 」と 説 明 さ れ る こ と を意 味 し ま す.残
差 平 方 和 は3092
ア ウ トラ イ ヤ ー が 混 在 し りの65.7%が45県
間の 差 に
対 応 しま す. 次 に,ス
テ ッ プ 2で,こ
の45県
の 2区 分 間 の 差 と して1102(45県 22.7%)が
を 「大 都 市 周 辺 」 と 「そ れ 以 外 」 と に わ け る と,こ の 範 囲 で み た3092の35.6%,全
体 で み た4856の
説 明 され る こ と が わ か り ます.
こ の 例 で は,ま の 変 動4856の
だ 説 明 さ れ ず に 残 っ て い る 「県 別 差 異 」が1990,す
う ち41.0%と,か
表4.4.2
③ 86ペ ー ジ の 表4.3.4で
体で
人 口 あ た り病 床 数 の 県別 値 の 分 散 分 析 表
示 した よ うに,表
のR2の
欄 で,区
で な く,区 分 内 偏 差 平 方 和 に つ い て も 「全 平 方 和 」に 対 す る 比,す 算 して い ます.上
な わ ち,全
な り大 きい こ とに 注 意 し ま し ょ う.
の 説 明 で わ か る よ うに,分
分 間偏 差平 方 和 だけ なわ ち寄 与率 を計
析 経 過 を 説 明 す るた め に役 立 ち ます.
た と え ば,2 段 階 の 分 析 を 経 て も,区 分 間 の 差 と して 説 明 さ れ ず に 残 っ た 部 分 が 大 き い の で, 区 分 間 の 差 異 と し て 把 握 され る 「傾 向 性 」と と も に, 各 区 分 で の 代 表 値 か らの 偏 差 す な わ ち 「 個 別 性 」に も注 意 す る こ と が 必 要 だ とい う こ とが 示 唆 さ れ ま す. ◇ 注 病 院数 の ちが い に影 響 す る と思 わ れ る 「高齢 者 比 率 」に 注 目 して区 分 してみ よ う … これ は,章 末 の問 題 に して あ ります. 表4.4.3の 分 散 分析 表 が得 られ るこ と を確 認 して くだ さい. それ で も説 明 しきれ な い 「個別 性 」が 大 きい とい う結 果 で す.
表4.4.3
人 口あ た り病 床 数 の 県別 値 の分 散 分析 表(高 齢 者 比 率 で 区 分 〉
図4.4.4
県 別 差 異(全 体 で の 基 準 で み る と)
大都 市圏で低 い
図4.4.5
県 別 差 異(大 都 市 周 辺 と それ 以 外 と を わけ て み る と)
大都 市圏 の中で も中心都 市で高 く周辺地域で低 い この 図 の表 現 で も 傾 向 とし て 説 明 さ れ る 部 分 を見 出す → そ れ ぞれ の部 分 で の 平 均値 を示 す た め に 棒 の 基 線 を複 数 とす る 個 別 性 す な わ ち傾 向 か らの 外 れ を, そ れ ぞれ の 区 分 で の 平均 値 か らの 差 と して 示 す た め に そ れ らの 基 線 を使 う とい う考 え方,す
④ 分 析 の 目的 は,差
な わ ち,分 散 分析 の 考 え方 を採 用 して い ます.
を 説 明 す る こ とで す.し
た が っ て,分
析結 果の プ レゼ ンテー
シ ョ ン とい う意 味 で も,差 異 の 有 無 を 評 価 す るた め の 「 分 散 分 析 表 」だ け で な く, 「見 出 さ れ た 差 」を 説 明 す る 図 お よび 「見 出 さ れ ず に残 っ た 差 」を説 明 す る 図 を 用 意 し ま し ょ う.結 果 の 解 釈 とい う意 味 で は,そ この 例 に つ い て は,図4.4.4と
図4.4.5の
の 方 が 主 役 で す.
よ うに 表 わ し ま し ょ う.
傾 向 性 を棒 の 基 線 の 位 置 傾 向 性 と して 説 明 さ れ ず に 残 っ た個 別 性 を,そ の 基 線 か らの 差 と し て示 して い ま す.「 棒 グ ラ フ 」の 形 を使 っ て い ます が,分 て お り,残 差 を示 す と い う 意 図 を も つ 図 と い う意 味 で,残
散 分析 の考 え方 を入 れ
差 プ ロ ッ トと よび ま しょ
う.図4.4.4が
全 分 散,図4.4.5が
級 内分 散 の 場 合 に 対 応 して い ま す.
棒 は 「県 の 標 準 コー ド」の 順 に 並 べ て あ り ます が,コ よ って つ け られ て お り,た
ー ドが 地 理 的 な 位 置 関 係 に
と え ば 大 都 市 周 辺 が か た ま り ます か ら,図 に 付 記 した よ う
に よむ こ と が で き ま す.
4.5 説 明基 準 の精 密 化 ① 被 説 明 変 数 X に 対 して 2つ の 説 明 要 因 を使 う場 合 に も,4.3節 用 す る こ とが で き ます.す
の 考 え 方 を適
な わ ち,2 段 階 に わ け て
第 一 の 要 因 A で 区 分 す る こ と に よ っ て 説 明 さ れ る変 動,SX×A 第 二 の 要 因 B で細 分 す る こ とに よ っ て 追 加 説 明 さ れ る変 動,SX×B│A を わ け て 評 価 す る こ と が で き ます.そ で 説 明 さ れ る 変 動SX×ABが ② 分 析 過 程 の 表 示
う し て,2 つ の 部 分 を 合 わ せ れ ば,2 つ の 要 因
評 価 さ れ る こ と に な り ます.
分 析 の フ ロー と変 動 和 の 減 少 は,次
の よ うに図示す るこ と
が で き ま す.
図4.5.1
こ の 図 で は,左
分 析 の フ ロー と変 動 の 減 少
の 列 に 「デ ー タ の 区 分 け 」に と も な っ て,変
動 をみ る た め の 規 準 が
細 か く な って い る こ と を示 して い ます. 中 の 列 で は,そ
れ に と もな っ て偏 差 平 方 和 が 減 少 して い くこ と を示 し,右 の 列 は そ
れ ぞ れ の ス テ ップ で の 減 少 度 を示 して い ます. 記 号 は,こ
の フ ロ ー で 示 した よ うに,そ
れ ぞれ の意 味に対 応づ け れば理解 で きるで
し ょ う.添 字 中 に│を 含 む も の は 級 内 変 動 す な わ ち 未 説 明 部 分 で あ り,添 字 中 に ×
表4.5.2
表4.5.3
3番 目の ブ ロ ッ クで は,偏
分散 分 析 表(2 要 因 を 使 っ た場 合)
分 散 分 析 表 …2要 因 の場 合 の 詳 細 フ ォ ー ム
差 平 方 和 が そ の下 に示 す 一 連 の 「区 分 内 で み た偏 差 平 方 和 の 計 」に
な っ て い るの に 対 し て,分 散 は,そ の 下 に 示 す 一 連 の 「区分 内 で み た分 散 の加 重 平 均 」に な って い る こ とに 注 意 し ま し ょ う.そ れ ぞ れ の 区 分 で の デ ー タ数 で わ っ て い る こ とか ら く るの です.
を含 む もの は 級 間 変 動 す な わ ち既 説 明 部 分 で あ る … こ の 理 解 は,特 ③
分 散分 析表
ま た,こ
の 結 果 を,表4.5.2の
よ うに,分
に重要 で す.
散 分析 表 の形 式に ま
とめ る こ と もで き ます. 図4.5.1の
フ ロ ー に 対 応 づ け て あ り ま す.
④ 分 析 の フ ロ ー拡 張
分 析 の フ ロー に お け るSX│AB,す
部 分 と して 残 さ れ た 部 分 に つ い て は,各
な わ ち,最
後に未説明
区 分 内 に 限 定 し て み た 残 差 成 分SX│IJを
表示
し て お く こ と も考 え ら れ ま す.こ は,ど
う し て お け ば,SX│ABを
さ ら に 減 少 させ る た め に
の 区 分 に 注 意 を 向 け れ ば よ い か が わ か りま す.
ま た,SX×B│Aす
な わ ち A の 影 響 を制 御 して X と B の 関 係 をみ る部 分 に つ い て は,
Aの 各 区 分 ご と に み た 内 訳SX×B│Aを
表 示 し て,「 X と B の 関 係 」のAIに
よ るち が
い を み る こ と が で き ます. た だ し,こ れ ら を 1つ の 分 散 分 析 表 に 組 み 込 む と見 に くい の で,表4.5.3の に,表
よう
を 3つ に わけ て 表 示 す る 方 が わ か りや す い で し ょ う.
「こ れ だ け 減 少 して い っ た 」す な わ ち 「説 明 さ れ た 」部 分 と,「 こ れ だ け 残 って い る 」 す な わ ち 「説 明 さ れ ず に 残 っ て い る 」部 分 と を わ け て 示 す 形 に な っ て い る の です.
4.6分
析
例
① 分 析 の 一 例 を あ げ て お き ます. 食 費 支 出 額 X の世 帯 別 デ ー タ の 変 動 を, 世 帯 人 員 数 A と 月収 B とに よ っ て, 「どの よ うに,ま
た ど の 程 度 ま で 」説 明 で き る か
を考 え て み る の です. XABの
デ ー タは,付
世 帯 人 員A
表 A に一 括 して 示 し て あ り ます. は,A1:2∼3人,A2:4
月 収 B は,B1:500以
人,A3:5
人以上
下,B2:500∼1000,B3:1000以
上
と,そ れ ぞ れ 3区 分 に わ け る も の と し ま し ょ う.デ ー タ 数 が68で す る と平 均20と
な り ます.ま
す か ら,3 区 分 に
た,2 つ の 基 準 を組 み 合 わ せ る と 9区 分,1 区 分 あ た り
10以 下 に な り ます か ら,区 分 数 は こ れ 以 上 細 か くは で き ませ ん.3 区 分 の 区 切 り方 は い ろ い ろ考 え られ ま す が,各
区 分 に属 す るデ ー タ の 数 が 均 等 に な る よ う に選 び ま し ょ
う.た だ し,分 析 過 程 で 試 行 錯 誤 を く りか え す こ とに な る の が 普 通 で す か ら,は
じめ
は 「お よ そ の 見 当 で わ け て み る 」こ とで 十 分 で す. 上 記 の 区 分 け を適 用 し た 場 合,フ
ロー チ ャ ー ト(図4.6.1)と
分 散 分 析 表(表4.6.2)
が得 られ ます. 表 の 下 部 2行 が,A
の 他 に B を 取 り上 げ た こ とに よ っ て つ け 加 わ っ た部 分 で す.
ま ず こ れ らか ら,A
だ け で は X の 変 動 の41%し
す.よ
っ て,B
い ます が),両
か 説 明 で き な い こ とが わ か り ま
を考 慮 に 加 え る こ とが 妥 当 だ っ た と い え る の で す が(ま た,そ 方 を使 っ て も X の 変 動 の46%が
し た が っ て,各
う して
説 明 さ れ ず に 残 っ て い ます.
区 分 の 平 均 値 の 比 較 と と も に,各
区 分 内 で の 世 帯 間 差 異 に も注 意 を
払 う こ とが 必 要 です. ② 平 均 値 の 比 較 に つ い て も,種 々 の 区 分 で の 平 均 値 の 相 互 関 係 に 関 す る要 約 説 明 が 必 要 で す.表4.6.3が,各
区 分 の平 均 値 を 比 較 す る た め の 表 と,そ の グ ラ フ で す.
図4.6.1
表4.6.2
食 費 支 出 の 世 帯 人 員 お よ び 月収 別 比較
食 費 支 出 の 世 帯 人 員 お よび 月収 別 比 較(分 散 分 析 表)
表4.6.3
こ の 表 の 「そ の 構 造 」の 欄 に は,各
各 区分 で の平 均 値
区 分 の 平 均 値 を,B
に よ る 区 分 を 統 合 して み た
と き の 平 均 値(A の 各 区 分 に 対 応 す る176.0,208.7,297.9)と,そ と きの 付 加 部 分 とに わ け て示 して あ り ます.ま 線,後
た,表
れ を B で細 分 した
の 右 側 の グ ラ フ で は,前
者 を横
者 を そ の 線 を基 線 とす る上 下 方 向 の 棒 で示 し て あ り ます.
まず こ れ で み る と,A
す な わ ち 世 帯 人 員 の 効 果 は,そ
の 数 に 応 じ て 大 き くな る こ
とが わ か りま す. こ れ に,B
す な わ ち所 得 の 効 果 が,そ
加 さ れ て い ま す.
の 高 低 に 応 じて 正 あ る い は 負 の 値 と し て 付
A↑
⇒X↑
B↑
⇒X↑
た だ し,区 分A3B1で こ の 点 に つ い て,ど
は,こ
の 一 般 的 傾 向 に 合 致 し て い ませ ん.
う考 え るべ き で し ょ うか.ま
ず 考 え ら れ る の は,A3B1の
デー
タ 数 が 少 な い(2 世 帯)か ら,そ の 部 分 は 無 視 し よ う と い う説 で す. しか し,そ
う断 定 す る前 に,各
区 分 に お け る世 帯 間 格 差 を示 す 「分 散 分 析 表 」 をみ
て お き ま し ょ う. 一 般 に 世 帯 間 変 動 は 各 区 分 の 世 帯 数 に 比 例 す る の が 普 通 で す が,A3B1に 世 帯 数 が 2 と少 な い の に か か わ ら ず 変 動 が 大 き い(し た が って,分
つ い て,
散 が 大 き い)こ と
が 目 に つ き ます. し た が っ て,平 A3B1と
均 値 で み た 特 異 の 傾 向 は,
表4.6.4
い う 区分 に 対 応 す る 情 報 で は な く,そ の
区分 内 で の 世 帯 間格 差 あ る い は 他 の世 帯 と異 な っ た 事 情 を もつ ア ウ トラ イ ヤ ー の 存 在 を 示 唆 す る もの と考 え られ ま す. 区 分A1B3に
つ い て も同様 な状 態 が あ る よ う
です. ③ ① で指 摘 さ れ て い る よ う に 世 帯 間 格 差 が 大 き い 問 題 で す か ら,個 々 の 世 帯 の 情 報 (X,A, B) を 図 示 した グ ラ フ を み る と よ い で し ょ う.
図4.6.5
3変 数 の 関係 を示 す グ ラ フ
区分 内変 動 の 成 分
ま た,区
分 の 基 礎 と したA,B
が 数 量 デ ー タ で す か ら,区 分 の 仕 方 を考 え る参 考 に
な り ま す. 3次 元 に な り ま す か ら,2 つ の 情 報 (X,B) を 縦 軸,横 は,そ
軸 に とって 第 三 の 変 数 A
の 区 分 をマ ー クの 種 類 で示 す 形 式 に し ま し ょ う.こ れ が,図4
図 の 左 上 に,X
の 値 が 3 シ グ マ 以 上 離 れ た デ ー タ が あ り ま す.そ
あ り,そ の マ ー ク か らA3で 明 し ます.②
す か ら,こ れ がA3B1で
で 予 想 した と お り,A3B1で
.6.5で す. の 位 置 か らB1,で
の 平 均 値 を 大 き く し た もの と判
の 平 均 値 は 傾 向 を示 す もの で は な く,ア
ウ
トラ イ ヤ ー が 混 在 した た め 離 れ た もの だ と い う こ とが で き ます. な お,図
に 書 き込 ん だ 楕 円 は,そ
の 範 囲 に デ ー タ の ほ ぼ1/2が
入 る こ と を示 す もの
で す. ④ 以 上 か ら,「 ア ウ ト ラ イ ヤ ー を 除 外 し て 分 析 せ よ 」 と い う の が 1つ の 提 唱 で す. た だ し,A3B1ほ
どは っ き り し な い が,A1B3な
どにつ い て も同様 な事 態 が あ りそ
うで す か ら,少 数 の ア ウ トラ イヤ ー の影 響 を 受 け に くい よ う,区 分 数 を 減 ら し て,各 区 分 で の デ ー タ数 が 多 くな る よ うに す る とい う代 案 もあ りえ ま す. ⑤ 図4.6.5に
書 き込 ん で あ る 集 中 楕 円 に よ っ て,A
の各 区分 に 属 す るデ ー タの
散 布範 囲 をみ ると A↑
⇒X↑
楕 円 の 位 置 が 上 に シ フ ト して い る こ とか ら
B↑
⇒X↑
楕 円 の 形 が右 上 が りで あ る こ とか ら
と い う傾 向 が きれ い に よ み とれ ます か ら,区 切 り方 の 工 夫 に よ っ て,こ
の傾 向 を要 約
す る こ とが で き そ うで す. デ ー タの 区 切 り方 をか え て み ま し ょ う.図
で み る よ うに,世
「デ ー タ の 散 布 範 囲 が 右 に ず れ て い る 」こ とが わ か り ま す.A
帯 人 員 の 多 い世 帯 ほ ど す な わ ち世 帯 人 員 と B
す な わ ち 所 得 とが 関 連 性 を も っ て い る た め で す. こ の こ と を考 慮 に 入 れ る と
世 帯 人員 の 多い区分 で は
表4.6.6
A3で
の 収 入 の 効 果 をみ る ため に
各 区 分 で の 平均 値(区 切 り方 を か え た 場 合)
世 帯 人 員 の 少 な い 区 分 で はA1で
の 収 入 の 効 果 をみ る た め に
B の 区 切 り方 をか え る 方 が よ さ そ うで す.B
の 区 分 数 を 2 と し,区 切 り をA の 区 分
ご とに か え て み ま し ょ う. 表4.6.6が
そ の 結 果 で す.
表4.6.2と
比 べ て 明 らか な よ うに,A
果 と な っ て い ます.デ
の 効 果, B の 効 果 が き れ い に よ み と れ る 結
ー タ の 数 が 少 な い,そ
に 応 じて デ ー タの 区 分 け を決 め る,い い ま 扱 っ て い るデ ー タ の 場 合,こ
う し て,世
帯 間 格 差 が 大 きい と い う状 態
わ ば 「ピ ン トあ わせ をす る」 こ とが コ ツ で す. れ 以 上 の 説 明 を試 み る と,「 デ ー タ に よ る 裏 づ け
の 得 ら れ な い過 剰 な 説 明 」に な る で し ょ う.し か し,表4.6.2の
段 階 で 分 析 を 終 え解
釈 を 試 み る と,「 デ ー タ に よ る 裏 づ け が 得 ら れ る こ と を 見 逃 し た 不 十 分 な 説 明 」に な って し ま い ます.
4.7 主 効 果 と 交 互 作 用 効 果 ① 主 効果 と交互 作用 効果 被 説 明 変数 X に対 す る 2つ の 説 明要 因A,B につ い て,右 表の よ うに各要 因の 組 み合 わせ 区分 に対応す る計 数が求 め られ て い る場 合 を 考 え ま し ょ う. こ の 場 合 に は,4.5節
の 分 析 をA,B の 順,B,A
と お りの 方 法 で 適 用 で き ます.そ 差 変 動 和 の 減 少 は,A,B ペ ー ジ)とB,A 図4.7.1の
の順 と2
う し て,分 析 の フ ロー と偏
の 順 に 適 用 した 場 合 の 図4.6.1(93
の 順 に 適 用 し た 場 合 の 図 と を 組 み 合 わ せ て,
よ うに 示 す こ とが で き ます. 図4.7.1
2要 因 を組 み合 わせ た 場 合 の 分 析 フ ロー
ど ち らの 順 に 適 用 して も,最 終 的 に はA,B と と な り,未 説 明 部 分 と して 残 る の はA,B ら,図
は,最
初 わ か れ て,最
の両 方 の組 み合 わせ 区分 を比較 す るこ の 組 み 合 わ せ 区 分 内 変 動SX│ABで
後 に合 流 す る 形 に な り ます.
図 示 さ れ て い る 各 項 の 記 号 お よ び 意 味 は,SX×A×B以 ま す.た
と え ば,分
すか
外 は,4.6節
で説 明 して あ り
析 に よって説 明 され る成分 に関 して
SX×AB=SX×A+SX×B│A
=SX×B+SX×A│B
が 成 り立 っ て お り,こ の こ とは,図
の 2つ の ル ー トに 沿 っ て 見 出 され る 成 分 分 解 に 対
応 して い ま す. ② 新 し く現 わ れ たSX×A×Bに つ い て 説 明 し ま し ょ う. 一 般 に,2 つ の 要 因A,B が X の 変 動 に 関 係 して い る と き,そ れ を A の 主 効 果(B の効 果 を考 慮 外 に お い た と き の A の 効 果) B の 主 効 果(A の効 果 を考 慮 外 に お い た と き の B の 効 果) の ほか に A,B が 共存 し た た め に 生 じ る相 乗 ま た は 相 殺 効 果 に 相 当 す る効 果 が 存 在 す る と考 え る こ とが で き ま す. こ の 効 果 に つ い て は,ま
ず,こ
こ で 使 っ て い る 記 号 に お い てSX×AとSX×A│Bの
が い に 注 意 し ま し ょ う.こ れ ら は,い SX×A―Bの
ち
ず れ も A の効 果 を表 わ し ます が,
存 在 を考 慮 し て い な い た め A の効 果 に B の 効 果 が 混 入 し て お り,
SX×A│B―Bで
区 分 け し て み て い る た め, A 単 独 の 効 果 とみ られ る
もの で す か ら,後 者 で,A
の 主 効 果 を評 価 し,両 者 の 差 と して 交 互 作 用 効 果 を評 価
す るの で す. す なわ ち SX×A×B=SX×A│B-SX×A と定 義 され る項 を,交 互 作 用 と よ ぶ こ と に し ます. ③ 前 節 で取 り上 げ た例 に つ い て,A こ の 節 の 方 法 を適 用 して み ま し ょ う.A,B
と B の 交 互 作 用 も 含 め て 分 析 す る た め に, の 区 切 り方 に つ い て は,ど
のA
につ い て
も同 じわ け 方 を適 用 した 最 初 の 案 に よ る もの と し ます. ま ず,図4.7.2の
よ う に,A,B
の 順 に 適 用 し た 場 合 と, B,A の 順 に 適 用 し た 場
合 の 偏 差 平 方 和 を 求 め ます. こ れ か ら,交 互 作 用 の 大 き さ が SX×A×B=SX×A│B-SX×A=-12105 と評 価 され ます. ま た,表4.7.3の に か き ます.
分 散 分 析 表 に 交 互 作 用 の 項 を含 め た い と きに は,表4.7.4の
よう
図4.7.2
表4.7.3
分 散 分 析 表(2 要 因に よ る区 分 を順 をか え て適 用)
表4.7.4
こ の 例 の 場 合 は,説
2要 因 に よ る分 析 例(フ ロー チ ャー ト)
分 散 分 析 表(交 互 作 用 の 項 を含 め る場 合)
明 さ れ ず に最 後 ま で 残 っ て い る190421と
比 べ て,1 桁 小 さ い
値 で す か ら,こ の 例 で は 交 互 作 用 は 「 考 慮 外 に お い て よ い 」 とい え ま す. ◇ 注
種 々 の 偏 差 平 方 和 を 区 別 す る ため に,「 デー タ の 見 方 を示 す 記 号 を含 む 添 字 」を
使 って い ます.慣 れ な い と面 倒 に み え る記 号 で す が,こ こ まで 進 め ば,理 解 を助 け る 記号 体 系 に な って い る こ とが わか った と思 い ます. ④ 交 互 作 用 を 考 慮 す る 必 要 が な い 場 合 は SX×AB=SX×A+SX×B
と な り ます か ら, A,B の 組 み 合 わせ 表 を つ く る こ と な く, X と A の 組 み 合 わ せ 表 か ら A の 効 果 を把 握 し, X と B の 組 み合 わせ 表 か ら B の効 果 を把 握 し, それ で A,B の 効 果 を把 握 す れ ば 足 り る とい う こ と に な る の です. ⑤ 2つ の要 因 の効 果 比 較 SX×A-SX×B=SX×A│B-SX×B│A が 成 り立 ち ま す.こ
の 関 係 か ら,「 2つ の 要 因 の効 果 の 差 」 を評 価 す る に は
他 方 の 効 果 を無 視 し て 測 っ た 偏 差 平 方 和 の 差 でみ て も 他 方 の 効 果 を補 正 し て 測 っ た 偏 差 平 方 和 の 差 でみ て も 同 じだ とい う こ とに な りま す. ⑥ 補 注:交
互作 用の定 義 につ いて
して 定 義 し ま し たが,具
本 文 で は,交
互 作 用 を,2 つ の 成 分 の 差 と
体 的 な 説 明 に む す び つ け る た め に は,以
下 の よ うに 定 義 し ま
す. 定 義 1:交 互 作 用 1 S(1)X×A×B=Σ ΣNIJ(XIJ-XI-XJ+X)2 定 義 2:交 互 作 用 2 S(2)X×A×B=Σ ΣNIJ(XI-X)(XJ-X)2 第一の定 義 では XIJ-XI=XJ-X が す べ て の(I,J)に つ い て 成 り立 っ て い れ ば 0 と な り,そ
う で な い と き は正 と な り ま
す か ら,2 つ の 要 因 の効 果 に 関 し て, A の 効 果 は,B す な わ ち,加
の 区 分 い か ん に か か わ らず 一 定
法 性 を もつ な ら 0,そ れ か ら 離 れ る に つ れ て 大 き く な る … そ の 程 度 を
計 測 す る もの と解 釈 され ま す. 第二の定 義 では XI-X,XJ-X の符 号が (正,正)ま
た は(負,負)な
ら正
(正,負)ま
た は(負,正)な
ら負
と な り ます か ら,2 つ の 効 果 の 相 乗 性 ・相 殺 性 を 計 測 す る も の と解 釈 さ れ る も の で す. こ れ ら に つ い て, SX×A×B=S(1)X×A×B-2S(2)X×A×B が 成 り立 つ こ と が 証 明 され ます か ら,こ
れ を利 用 して,交
互 作 用 項 を 2つ の 成 分 に 分
解 で き ます. 定 義 上 第 1項 は 0ま た は正 で あ る の に 対 し,第
2項 は正 に も負 に も な り う る もの で
す.交
互 作 用 が 負 に な っ た 場 合 は,こ
負 の 値 を と っ て,第
表4.7.5
の 第 2項 が 大 き い
分散分析表
1項 の 正 値 を 打 ち 消 し た こ と を 意 味
し ます. 右 の 分 散 分 析 表 は,表4.7.4に
この 分解 を追加 した結
果 で す. こ の 分 解 に よ っ て,「 デ ー タの 変 化 に つ い て 立 ち 入 っ た 解 釈 が で き る」可 能 性 が あ り ま す が,注
記 す るよ うな問
題 が ひ そ ん で い ま す か ら,一 般 に は,残
差 をみ る こ とに
と どめ ます. ◇ 注 1 A の効 果 に B の 効 果 が 重 な った と きに それ ぞ れの 効 果 の 和 以 上 に 大 き い 効 果 が 現 わ れ る 場 合 を相 乗 効 果,逆 よ び ます.よ
に 小 さ くな る 場 合 を相 殺 効 果 と
っ て,
相 乗 効 果 の あ る場 合
SX×A>SX×A│B
相 殺 効 果 の あ る場 合 と な り ま す.し
た が っ て,交
た く な り ま す が,2 す か ら,こ
SX×A<SX×A│B 互 作 用 の 符 号 に よ っ て,相
要 因A,B
の テ キ ス トで は,こ
殺 効 果 あ る い は 相 乗 効 果 と解 釈 し
の 組 み 合 わ せ 区 分 に 対 応 す る デ ー タ 数NIJが う い う解 釈 に 立 ち 入 ら ず,分
関 係 して き ま
析 手順 を適 用 して得 られ る 1
成 分 と し て 「交 互 作 用 効 果 」 と い う コ トバ を 使 い ま す. ◇ 注 2 SX×Aは あ り ま す.B て い た 変 動)が
B を,考
慮 に 入 れ て い な い こ と を 明 示 す る た め に,
か け 上 大 き くな っ
交 互 作 用 に あ た る と解 釈 す れ ば よ い の で す.
◇ 注 3 2つ の 要 因 を 使 っ て 説 明 さ れ る 変 動 全 体SX×ABに
つ い て,交
す なわ ち SX×AB=SX×A│B+SX×B│A-SX×A×B と表 わ す こ と が で き ま す.X×A(B),
X×B(A)の
SX×AB=SX×A(B)+SX×B(A)+SX×A×B と な り ま す.
SX×A(B)と か く こ と も
を 考 慮 に 入 れ て い な か っ た た め に 混 同 さ れ て い た 変 動(み
方 を使 う と
互 作 用 項 を 含 め た 形,
問題 4
【 種 々 の分散】 問 1 UEDAの
プ ロ グ ラ ム の う ちAOVO3Eを
し,全 分 散,級
内分 散,級
間 分 散,決
使 っ て,テ
キ ス ト本 文 の 説 明 を復 習
定 係 数 の 定 義 と,分 析 手 段 と し て の 効 用 を
説 明せ よ. 【 分散 の 計算】 注:問
2と問 3は,電 卓 で計 算 す るこ と.
問 2 表4.A.1は,15世
帯 につ い て 調 べ た 「1か 月 あ た り生 計 費 」な どで あ る.こ れ
に つ い て 次 の 各 問 に 答 え よ.計 算 は,表4.2.3の a. 生 計 費(X)の
フ ォー ム に よ っ て 進 め よ.
分 散 を 計 算 せ よ.
b. 職 業 別 に 区 分 し て 扱 う と分 散 は ど うな るか. c. 世 帯 人 員 別 に 区 分 す る と ど うか. d. 職 業 と世 帯 人 員 の 両 方 で 区 分 す る と ど うか. e. 世 帯 人 員(N)と
の 関 係 がX=28+4Nと
f. 世 帯 人 員 と の 関 係 に 関 し て,い
表 わせ る と想 定 す れ ば ど うか.
く と お り か の 直 線 を 想 定 し て,比
よ. 問 3 表4.A.2の
デ ー タ の う ち Y に つ い て, 表4.A.1
モ デ ル デー タ 5
表4.A.2
モ デ ル デ ー タ 6
べ てみ
a.全 分 散 を 計 算せ よ. b.Z
に よ っ て 区 分 け した 場 合 の 級 内 分 散 を 計 算 せ よ.
c.Y,X
の 関 係 を 表 わ す 傾 向 線 を 想 定 し,傾 向 値 を 基 準 と した 残 差 分 散 を計
算 せ よ. d.X
の 値 に よ っ て デ ー タ を 3区 分 して,級
内 分 散 を計 算 せ よ.
e.c に お け る 直 線 の 想 定 を い ろ い ろ か え て,残
差 分 散 を計 算 して み よ.
f.ど ん な 想 定 を し て も,全 分 散 よ り小 さ い は ず で あ る.こ
の こ とを証 明 せ
よ. g.d に お け る 区 分 の 仕 方 を い ろ い ろ か え て,級
内 分 散 を 計 算 し て み よ(区 分
数 は 3 と し て). h.ど ん な 区 分 を し て も,全 分 散 よ り小 さ い は ず で あ る.こ
の こ と を証 明 せ
よ. 【 分 散分 析 】 注:問
4以 下 問 9ま では,プ ロ グ ラ ムAOV04を
使 う こ と(基 礎 デー タは 例 示 用 と し
て セ ッ トさ れて い る). 間 4 付 表 A の う ち 食 費 支 出 額 の デ ー タに つ い て,次 a. 世 帯 人 員 で 3区 分 す る こ とに よ っ て,ど
の 問 い に 答 え よ.
の 程 度,そ
の 変動 が 説 明 さ れ る
か.3 区 分 は,2 人,3 人,4 人 以 上 とす る こ と.ま
た,結
ト(図4.3.1の
ま とめ る こ と.
形 式)お よ び 分 散 分 析 表(表4.3.2)に
果 は フ ロー チ ャ ー
b. 世 帯 人 員 の 区 分 を 2人,3 人,4 人,5 人 以 上 と す る と ど うか.結
果 は,a
と同 じ形 式 に ま とめ る こ と. c. 収 入 総 額 に よ っ て 3区 分 す る と ど う か.区 報 を参 考 に し て,区
分 は,プ
ロ グ ラ ム が 表 示 す る情
切 り値 が 「切 り の よ い 値 」(た と え ば 2,5,10な
る よ う に 定 め る こ と.結 果 は フ ロー チ ャ ー ト(図4.3.1)お (表4.3.2)に
ど)に な
よび分 散 分 析 表
ま とめ る こ と.
d. 収 入 総 額 に よ っ て 3区 分 を,各 に 定 め る と ど うか.結
果 は,c
区 分 に 属 す る世 帯 数 が ほ ぼ 均 等 に な る よ う
と同 じ形 式 に ま とめ る こ と.
e. cお よ び dの 結 果 と し て 得 ら れ た 「 各 区 分 に お け る 分 散 」 を参 考 と し て, 分 散 の 大 き い 部 分 の 区 切 り幅 を狭 く し,分 散 の 小 さ い 部 分 の 区 切 り幅 を 広 く す る こ と を考 え て 区 切 りな お し て 再 計 算 し,結 果 を 比 べ て み よ. 問 5 a. 世 帯 人 員 に よ る 区 分(問4aで 4cで
採 用 し た 区 分)を 収 入 総 額 に よ る 区 分(問
採 用 し た 区 分)で 細 分 し て 分 散 の 変 化 を 調 べ よ.結
チ ャー ト(図4.5.1)お
よ び 分 散 分 析 表(表4.5.2)の
b. 収 入 総 額 に よ る区 分(問4cで
果 は,フ
ロー
形 式 に ま とめ よ.
採 用 し た 区 分)を 世 帯 人 員 に よ る 区分(問4a
で 採 用 し た 区 分)で 細 分 し て 分 散 の 変 化 を 調 べ よ.結
果 は,a
と 同 じ形 式 に
ま とめ よ. c. aお よ び b の 結 果 を,フ
ロー チ ャー ト(図4.7.1)お
よ び 分 散 分 析 表(表
4.7.3)の
形 式 に ま とめ よ.
問 6 付 表 A の うち 雑 費 支 出 額 に つ い て,問
5 と同 じ分 析 を行 な え.
問 7 付 表 A に よ っ て 各 世 帯 の 食 費 支 出 割 合(食 費 支 出 額 /月 収 額)を 計 算 し,そ の 世 帯 間 変 動 に つ い て, a. そ の 変 動 が,世
帯 人 員 で 区 分 け して み る こ とに よ っ て ど の 程 度 説 明 で き る
か を 評 価 せ よ. b. 月 収 額 で 区 分 し て み る こ と に よ っ て ど の程 度 説 明 で き るか を評 価 せ よ. c. 世 帯 人 員,月
収 額 の 両 方 を使 う と ど うか.
結 果 は 問 5 と同 じ形 式 に ま とめ よ.ま
た,月
収 の 効 果 を表 わ す 分 散 が,問
5の
場 合 と比 べ て 小 さ く な っ た 理 由 を 説 明 せ よ. 注:こ の 問題 につ いて は,プ ログ ラムAOV04を
適 用 す る前 に,各 世 帯 の 食 費 支 出割
合 を 計 算 し なけ れ ば な ら な い.そ の た め に,プ ロ グ ラ ムVARCONVを
使 うの だ
が,デ ー タ フ ァ イ ルDH10VYに
それ を使 うた め の 「 変 換 指 定 文 」が付 加 され て い
るの で,そ れ を確 認 し,Escキ
イ をお す と変 換 が実 行 され,結 果 す なわ ち 「食費 支
出割合 」を書 き込 ん だ作 業用 フ ァイ ルworkが
で き る.
問 8 付 表 B に 示 す"人 口 あ た り病 院 ・診 療 所 病 床 数"X で分 析 した が,そ
の 地 域 差 に つ い て,3.5節
の 各 ス テ ップ に お い て 検 出 され た 差 異 の 説 明 力 を 評 価 す る た め
の 分 散 分 析 を行 な え.基 礎 デ ー タ は,フ
ァ イ ルDI93Xに
記録 されて い る
a. 47県 の値 の 差 異 を評 価 す る全 分 散. b. ア ウ トラ イ ヤ ー とみ な さ れ た高 知 県 を除 い た 場 合 の全 分 散. c. 残 りの46県
を 「大 都 市 周 辺 」 と 「そ れ 以 外 」 とに 区 別 した 場 合 の 級 内 分 散.
d. cに よ っ て ア ウ トラ イ ヤ ー とみ な さ れ た 沖 縄 県 を 除 い た 場 合 の 級 内 分 散. e. a∼dの
結 果 を ま とめ た分 散 分 析 表.
f. 高 齢 者 比 率 の 大 き さ に よ っ て 県 を 3区 分 して 比 較 した 場 合 の 級 内 分 散. g. fの 結 果 を示 す 分 散 分 析 表. 注:フ ァ イ ルDI93Xに
は,級 内分 散 計 算 の た め の 区分 の 仕 方 を 区分 番 号 で 記 録 した
変 数 を用 意 して あ る.こ れ を使 うと,AOV04の
計 算 過 程 での 区分 の 仕 方 の 指 定 が
簡 単 に な る(指 定 どお りに使 うとい う確 認 だけ で す む). 全 分 散 の計 算 はAOV01Aで
行 な わ な くて も,AOV04で
級 内 分 散 を計 算 した と
きい っ し ょに 出力 され る. 【 基 礎 デ ー タの 取 り上 げ 方 】 問 9 問3∼8の
問 題 で は,ひ
とつ ひ とつ の 世 帯 の デー タ を利 用 し て い る が,そ
れが
利 用 で き な い 場 合 が あ る. a. た と え ば,家 み て,ど
計 消 費 に 関 す る 重 要 な 情 報 源 で あ る 「家 計 調 査 の 報 告 書 」 を
ん な 形 の 情 報 が 利 用 で き る か を調 べ よ.
b. こ の ほ か に,5 年 ご と に 実 施 さ れ る 「全 国 消 費 実 態 調 査 」が あ る.こ つ い て,利 用 で き る 情 報 を調 べ よ.
れに
c. こ れ ら の 資 料 で 利 用 で き る デ ー タ の 範 囲 で,食 て ど こ ま で 分 析 で き る か.問
費 支 出の世 帯 間変 動 に 関 し
4お よ び 問 5で 計 算 し た 分 散 の う ち,こ
れ らの
資 料 に掲 載 され て い る 情 報 に よ っ て 計 算 で き る も の は どれ で,計 算 で き な い もの は どれ か を示 せ ば よ い.た
だ し,各 変 数 の 区 分 数 お よ び 区 切 り方 は か え
て も よ い もの と す る. 問10 あ る人 が 付 表 A の デ ー タ を使 う分 析(た と え ば 問 4)に お い て,「 奇 数 番 の デ ー タ と偶 数 番 の デ ー タ とに 折 半 し,そ れ ぞ れ に つ い て 同 じ分 析 を く りか え せ 」 と提 唱 し た.こ
の 提 唱 は,ど
うい う意 図 を もつ か.
問11 戦 後 の 暮 ら し と最 近 の 暮 ら し と を 比 べ る た め に,1950年 の デ ー タ を比 べ て み よ う と し て い た ら,あ よ 」 と提 唱 し た.こ
の提 唱 は,ど
と1980年
の 家 計収 支
る 人 が 「1951年 と1981年
も 取 り上 げ
うい う 意 図 を もつ か.
比=
5 有 意 性 の 検 定
この 章で 扱 う 「 仮 説検 定 」の 問題 につ い て,前 章 で扱 っ た 「 分散分析」 と対 比 しつ つ 概 説(5.1と5.2)し た 後,そ の 方 法 の 論 理 構 成 と(5.3, 5.4),そ れ を適 用 す る場合 に前 提 とさ れ る諸 条 件 を説 明 し ます.ま た, 平 均 値 を 比 較 す る 問題 に 限 定 した 場 合 に適 用 で き る 精 密 化 され た 方 法 (5.5,5.6)を
説 明 し ます.
また,分 析 の意 図 やデ ー タを求 め る環 境 条 件 な ど に応 じた 「 分 析 計画 の立 て方 と進 め方 を」説 明 します(5.7).
5.1 有 意 性 の 検定 ① 前 章 の分 散 分 析 表 で 共 通 して い る こ とは 区 分 間 の 差 と して 説 明 さ れ た 「説 明 ず み の 部 分 」 区 分 間 の 差 と して の 説 明 で 「説 明 し残 さ れ た部 分 」 と を わ け る 形 に な っ て い る こ と で す. し た が っ て,「 説 明 ず み と さ れ た部 分 」の 変 動 が 「未 説 明 部 分 」の 変 動 と比 べ て 大 き け れ ば, 「説 明 の た め に 採 用 さ れ た 区 分 」が 有 効 だ っ た と判 定 で き ま す. も し,説 明 し う る要 因 が 残 っ て い な い な ら,未 説 明 部 分 は,各 観 察 単 位 ひ とつ ひ と つ の個 別 性 とみ な さ れ る こ と に な りま す.こ
の よ うな 状 態 に な っ た と き に は,区
分間
の差 の 「 有 意 性 」 を判 定 す る指 標 と して,
区分 間変 動/ ま た は 区分 内変動
比=
区分 間分 散/ 区分 内分 散
を使 う こ とが 考 え られ ます. 第 4章 で 使 っ て い た 決 定 係 数 で は,こ 動 + 区 分 内 変 動 」 と し て い ま し た.変
の比 の 分 母 を 「 全 変 動 」す な わ ち 「区 分 間 変
動 の大 き さ を対 比 す る こ とは共 通 して い ます
比=
が,仮
説 検 定 の 場 合 は 「区 分 内 変 動 」に は 意 味 の あ る差 は 残 っ て い な い(い わ ば 誤 差
と同 様 の 変 動 だ)と み な し う る と想 定 して,そ こ の こ とに と もな っ て,区
の 手 法 を 組 み 立 て ま す.
分 内 変 動 ま た は 区 分 内 分 散 に 対 す る 比 率 を使 う こ と に な
る の で す. ② 説 明 をつ づ け る 前 に 例 示 を挿 入 し て お き ま し ょ う.表5.1.1は,4.6節
に あげ
た 「X の 変 動 を,A,B
に よ って区分 す るこ とに よって
ど の 程 度 ま で 説 明 で き るか 」 を 分 析 す る た め の分 散 分 析 表 の う ち,A
の 効 果 を み る部 分 で す.
変 数 A に よ っ て,X
説 明 され る …
これ に つ づ い て,A
の 変 動 の41%が
を こ え る こ と)を 確 認 し よ う,そ れ が,こ そ の た め に,各 し,表5.1.2の 表5.1.1と
と い う結 論 で し た.
の 各 区 分 で の 平 均 値 が 異 な る こ と(個 人 差 に よ っ て 発 生 す る差 の 章 の 問 題 意 識 で す.
区 分 で の 平 均 値 の 差 を 検 定 す る た め の 指 標 と して 「分 散 比 」を 計 算
形 の 分 散 分 析 表 に 記 録 し ます. 対 比 して,共
通 な と こ ろ,変
この 表 に お け る 比 す な わ ち16.6が が あ る」 と結 論 づ け るの で す が,比
更 さ れ た と こ ろ を確 認 して くだ さ い.
大 き い,よ
っ て,「A に よ る 区 分 別 平 均 値 は 差
の 計 算 で 使 う分 散 に お い て,デ
ー タ 数 N で な く,
デ ー タ数 と異 な る値(見 出 し で 自由 度 と し て あ る)で わ って い る こ と に 注 意 し ま し ょ う. この 変 更 お よ び 「16.6と い う値 が 大 き い 」 とす る根 拠 な ど に つ い て,説
明す る こ と
が 必 要 で す. ③ ① に 示 し た 比 の う ち
区分 間分散/ 区分 内分散 を,後
述 の 理 由 で 「F 比 」 と よ び,記
号 F で 表 わ し ま す.こ
こ で は,「 偏 差 平 方 和 」
の 比 で な く,分 散 の 比 と し ま す. 前 章 ま で の 説 明 で 「変 動 」 と い う コ トバ を使 っ て い ま し た が,変
表5.1.1
分 散 分 析 表for要
因 分 析(表4.3.2の
形 式)
表5.1.2
分 散 分 析 表for仮
説検 定(こ の 章 での 形 状)
動 の 大 きさに 関 し
て,現 象 自体 が もつ 変 動 の 大 き さ と,取
り上 げ た デ ー タ数 の 大 小 とが 重 な っ て い る こ
と に 注 意 し ま し ょ う. 有 意 性 の 検 定 法 を 組 み 立 て る と きに は,デ
ー タ 全 体 が もつ 変 動,す
方 和 で な く,デ ー タ 1つ あ た りに 換 算 して み た 変 動,す
な わ ち,偏 差 平
な わ ち,分 散 を使 い ます .
た だ し,形 式 上 の デ ー タ数 で な く,い わ ば 実 質 上 の デ ー タ数 に あ た る 「自 由 度 」 と よ ば れ る量 で わ る形 に 変 更 し ま す. こ の 自由 度,す
な わ ち,実 質 上 の デ ー タ数 に つ い て は,次
の よ う に理 解 す る こ と が
で き ま す. a. 全 体 で の 変 動 は 「 N 個 の 観 察 値 の 比 較 」だ が,各
観 察 値 の平 均 値 の 平 均 が
「全 体 で み た 平 均 値 だ 」 と い う 条 件 が つ い て い る の で,実
質 上 は 「N-l個
の
観 察 値 の 比 較 だ 」と み る. b. 区 分 内 変 動 は,a
と 同 じ く 「N 個 の 観 察 値 の 比 較 」だ が,偏
して K 組 の 平 均 値 を使 っ て い る の で,実
質 上 は 「N-K個
差 を測 る基 準 と の観 察値 の 比 較
だ 」と み る. c. 区 分 間 変 動 は,「 区 分 数 K に対 応 す る平 均 値 の 比 較 」す な わ ち 「K 個 の 変 数 の 比 較 」だ が,「 各 区 分 別 平 均 値 」の 平 均 が 「全 体 で み た 平 均 値 」 と な る の で, 「実 質 上 はK-1個 ま た,上
だ」 とみ る.
記 の 説 明 中 の cに つ い て は,各
観 察 単 位 の レベ ル で み る の で な く,想 定 さ
れ た 区 分 の レベ ル で み る こ とに す るた め,「 そ の 平 均 サ イ ズN/Kを 正 が は い っ て い ま す.し
か け る」 とい う補
た が って,
(SX×A/N)×(N/K) と し た 上,分
母 の K をK-1と
お き か え た もの と解 釈 す べ き で す .
④ この よ う な 変 更 を加 え た分 散 分 析 表 が,次
の 表5.1.3で
4.3節 の 分 散 分 析 表(for要 因分 析)と 類 似 し て い ま す が,以 が 加 え られ た こ とに な ります.
a. デ ー タ数 N の か わ りに 自由 度dfを
b. 分 散 は,自
c. 決 定 係 数 の か わ りに,F
す. 下 の 3点 で 重 要 な変 更
お く.
由度 で わ っ た も の をお く.
⑤ こ の 変 更 の 意 図 は,c,す
比 を計 算 し て 表 示 して い る. な わ ち F 比 を 使 お う と した こ とに よ る もの で す.
この F 比 は, 区分 間 変 動 が な い と き に,値
表5.1.3
1 とな り
分 散 分 析 表for仮
説検定
区分 間 変 動 が あ る と き に は,1 よ り大 き くな る こ とか ら,そ の 値 が あ る 限 界 値(1 よ り大 きい あ る限 界値)を こ え る か 否 か で 区 分 間 変 動 の 有 意 性(こ の 用 語 の 厳 密 な 説 明 は 後 に し ま す)を 判 定 す る た め に 使 お う と い う も の で す. す な わ ち,こ
う して 求 め た 比
に 注 目 し て, F の 値 が,あ
る 限 界 値 を こ え た 場 合,
観察 単位 間変 動 の範 囲 をこ えて いる と判 定 し, そ うで な い 場 合,判
定 を保 留 す る
とい う 方 法 を 採 用 し ます. この 判 定 基 準 と し て 使 う限 界 値,す
な わ ち,
P(F<Fa)=1-α を み た すFα を 「 有 意 水 準 αの 棄 却 限 界 」 と よ び ます.こ 由 度(K-1,N-K)の
の F 値 の 確 率 分 布 は,「 自
F 分 布 」 と よ ば れ る 分 布 形 で, Fα は,α=5%,l%な
どに つ
い て 計 算 され て お り,統 計 数 値 表 に 掲 載 され て い ま す. ⑥ 表5.1.2の に よ る差 は,誤
例 で は,自
由 度(2,65)の
F 分 布 の1%点
は4.9で
す か ら,要
因A
差 範 囲 を こ え て い る と判 定 され ま す(さ ら に 考 え るべ き 問 題 が 残 っ て
い るの で す が). ⑦ 取 り上 げ て い る例 題 に つ い て は,月 で き ます.次
の 表5.1.4が
こ の 場 合 の F 値 は,1%限 した が って,要
因A
収 B に よ る 区 分 に よ る差 に つ い て も検 討
得 ら れ る は ず で す. 界 を こ え て い ます.
に よ る 差 も,B
⑧ こ の 節 で の 説 明 範 囲 で は,こ
に よ る 差 も有 意 だ と い う結 論 で す.
れ で よ し と し ま し ょ う.
た だ し,さ
らに つ づ け て 考 え るべ き点 が 残 っ て い ます.
第 一 に,こ
の 節 で 使 っ た F 比 に 関 す る判 定 基 準 は,「 X の 確 率 分 布 が 正 規 分 布 だ 」
と仮 定 した 場 合 に つ い て の 計 算 で す か ら,こ の 節 の 方 法 を 実 際 に 適 用 す る に は,そ 仮 定 で き る こ との 確 認 が 必 要 で す.ま
た,5.3節
で 説 明 す る 「こ の 方 法 の 論 理 構 成 」
に つ い て理 解 して お くこ と が 必 要 で す .
表5.1.4
う
要 因 B に 関す る分 散 分 析 表for仮
説検 定
◇ 注 この章 で は,確 率 分 布 とい う コ トバ を無定 義 で 使 い ます が,観 察 値 の 分 布 に対 して 想 定 され る モデ ル だ と解釈 して くだ さい.も う少 し精 密 に い う と, 「 X の観 察 値 を求め る」こ とを 「同一 条件 で く りか え した とき」 に 得 られ るで あ ろ う値 の分 布 とい う意 味 で す. 現 実 には,こ うい う く りか え しが 実 行 され て い る とは 限 ら ない の で,ま た は,観 察 され て い る と して も必 ず し も 「同 一 条件 」 とは い え な い環 境 下 で求 め られ て い る の で,観 察値 の 分布 と,そ のモ デ ル と して 想定 され る分 布(確 率分 布)を 区別 す るの で す. ま た,F
比 の 分 母 に 関 して,問
例 示 の よ う に,変 で示 し た よ う に,A
数 X に 対 して 2つ の 要 因 A,B が 影 響 し て い る と き に,こ
の節
に 関 す る仮 説 検 定 と B に 関 す る 仮 説 検 定 を 別 々 に 切 り離 し て
扱 っ て よ い で し ょ う か.い と し て,A
題 が 残 っ て い ま す.
い か え る と,要
因の 効果 を判 断す る とき使 う F 比 の分 母
に 関 す る 仮 説 検 定 の 場 合 と B に 関 す る仮 説 検 定 の 場 合 と で 異 な る 値 を
使 っ て い る … こ の こ と は,妥 次 の 節 で,説
当 で し ょ うか.
明 し ます.
5.2 F 比 の分 母 の解 釈 に関 す る 注 意 ① 前 節 の 説 明 を要 約 す る と,F
比 を使 う検 定 法 で は
F 比の分 子が大 きい ⇒ 区分 間 変 動 が 大 きい ⇒ 観 察 単位 間 変 動 を 説 明 す る 要 因 と して 有 効 と判 断 せ よ とい う こ と で す が,分 分 母 が 大 き い と き に は,分
母 の大 きさが 問題 に関 与 して きます.
子 が 大 き くて も こ の 比 は 大 き く な り ませ ん.観
察値 に
種 々 の 要 因 が 関 係 して い る と きに は, 「取 り上 げ た要 因 に よ っ て 説 明 さ れ ず に 残 っ た 部 分 」 が 分 母 で す か ら,た
とえ ば さ らに 別 の 要 因 を 追 加 し て分 析 す れ ば,そ
要 因 が 見 出 され,そ
れ を考 慮 に 入 れ て 再 計 算 す る と 「区 分 内 変 動 」が 小 さ くな る 可 能
性 が あ り ま す.し
た が っ て,ま
ず 「そ うい う状 態 に して お く こ と」が,F
提 と な るの で す. そ う い う状 態 に な っ て い な い とす れ ば, 分 母 が 大 きい た め に 検 出 され て い な か っ た 区 分 間 変 動 が, 分 母 が小 さ く な った が ゆ え に, 大 き か っ た と評 価 し な お さ れ る 場 合 が あ り う る の で す. し た が っ て,分
の 中 か ら新 し い
析過程 では
条 件 1 分 母 す な わ ち 区 分 内 変 動 に つ い て
比 を使 う前
こ れ 以 上 小 さ くは な ら な い こ と
そ れ が 難 しけ れ ば,十 分 小 さ い こ と
条 件 2 分 子 す な わ ち 区 分 間 変 動 が 大 きい こ と の 両 方 を確 認 し な け れ ば な ら な い の で す. ◇ 注 デ ー タ を求 め る とき に 条件 1をみ たす よ うにす る こ と で も,す で に得 られ て い る デー タに つ いて,前 章の 分 析 を適 用 して有 意 な差 を除 去 す るこ とで もか まい ませ ん.そ う い う状 況 に な って い る場 合,区 分 内変動 を 「誤差 変 動 」とよび ます. ② こ の こ とか ら, 「 検 証 さ る べ き 差 」が す べ て 「 検 証 で きる とは限 らな い」 こ とに な り ま す.以
下 に 説 明 す る 方 法 を適 用 し て 検 証 さ れ た と き 「有 意 差 あ り」 とい
う言 い 方 が な さ れ ま す が,適
用 す る方 法 や,適
用 場 面 に よ っ て 検 証 で き る範 囲 が か わ
りま す か ら,「 有 意 差 な し」 と な っ た と して も,「 検 証 さ る べ き差 が な い 」わ け で は な く,見 逃 され て い る 可 能 性 が あ る の で す. 「 有 意 性 」と い う用 語 に つ い て,
「 個 別 性 に よ っ て 起 こ る範 囲 を こ え て い る こ と 」
あ るいは 「こ れ 以 上 は 要 因 を追 究 で き な い 状 態 に な って い る こ と」 を指 す も の と説 明 さ れ る こ と も あ り ま す が,こ
の 説 明 に つ い て は,
「 今 採 用 し て い る方 法 で は 」と い う条 件 つ き で す か ら注 意 し ま し ょ う.今 採 用 して い る方 法 で 追 究 で き な くて も,別 の 方 法 で,あ る い は,別
の デ ー タ を使 っ て分 析 す れ ば 原 因 が つ か め る か も しれ ませ ん.
③ こ の 節 で 説 明 す る 手 法 は,第 で,第
一の 条件 が み た され て い る こ と を前提 に した上
二 の 条 件 に 関 して 「数 理 的 な論 法 」を与 え る もの で す.
関 連 す る種 々 の 要 因 を制 御 で き る 問 題 分 野 な ら,第 一 の 条 件 を み た し う る よ うに 計 画 し ま す.そ
う で き な い 問 題 分 野 で は,利
した 上 で,適
当 な 区 分 を見 出 す た め の 試 行 錯 誤 が 必 要 と な る で し ょ う.ま
き る情 報 の 範 囲 で は,F
用 で き る情 報 を 可 能 な 限 り取 り上 げ て 検 討 た,利
用で
比 を使 う方 法 を適 用 で き な い こ と も あ りえ ま す.
④ 前 節 で 取 り上 げ た 例 に つ い て 説 明 を つ づ け ま し ょ う. 変 数 A に よ る 差 と 変 数 B に よ る 差 に つ い て,い が,そ
ず れ も有 意 だ とい う結 果 で し た
れ ぞ れ の 効 果 を別 々 に 扱 う こ とに 疑 問 は な い か … こ う い う 問 題 を提 起 して お
き ま し た. た と え ばA
の 効 果 の 検 定 に 使 っ た F 比 の 分 母 は,変
差 分 散 σ2X│Aで あ り,B
数A
に よ る差 を除 去 した残
の 効 果 が 取 り出 さ れ ず に 残 っ て い る,し
た が っ て,F
比 を,
「誤 差 に 対 す る 倍 率 と は解 釈 で き な い」の で す. そ う解 釈 で き る F 比 に す る に は,B べ き で す.
の 効 果 も除 去 し た残 差 分 散 σ2X│ABを分 母 とす
表5.2.1
2要 因 の場 合 の 分 散 分 析 表for要
因分 析
(要 因 A,B の順 に 取 り上 げ た 場 合)
表5.2.2
2要 因 の 場 合 の分 散 分 析 表for要
因 分析
(要 因 B,A の 順 に取 り上 げ た場 合)
4.6節 で 「X の 変 動 をA,B に よ っ て 区 分 す る こ とに よ っ て どの 程 度 ま で 説 明 で き る か 」を み た 場 合 に も これ ら の 級 内 分 散 を計 算 し,分 散 分 析 表 を 表5.2.1の め て あ りま した.ま
た,変 数 を取 り上 げ る順 をか え る と,表5.2.2の
よ うに ま と
よ うに な りま す.
こ れ ら の 表 に お け る最 後 の 行 の 分 散 が,2 つ の 要 因 の 効 果 を除 去 し た 残 差 分 散 で す.変
数 を取 り上 げ る順 い か ん に か か わ ら ず,2800と
要 因A,B
の 効 果 を 除 去 す れ ば そ れ ら の 組 み 合 わせ 区 分 別 平 均 を基 準 と し た 残 差 は
特 定 の 要 因 を もた な い 「個 別 的 な変 動 」で あ り,A,B す る 」た め の F 比 の 分 母 と して,こ 表5.2.1お
な っ て い ます.
よ び 表5.2.2を
の効 果 す なわ ち 「 傾 向性 を識別
の 分 散 σ2X│ABを使 え と い う こ とで す.
仮 説 検 定 用 に 書 き改 め た もの が,次 ペ ー ジ表5.2.3と
表
5.2.4で す. ま た,表5.2.5の
よ う に,2 つ の 表 を 1つ に ま とめ て お くこ と も考 え ら れ ま す.
2 とお りの 表 を 用 意 し ま し た が,A か.表5.2.3に ます.B
お け る26.4の
の 効 果 を検 定 す る た め の F 比 は ど れ で し ょ う
よ う で も あ り,表5.2.4に
の 効 果 をみ る た め の F 比 は,表5.2.4に
に お け る2.76で
お け る8.18の
お け る10.2で
よ うで もあ り
し ょ うか,表5.2.3
し ょ うか.
こ の こ と に つ い て 説 明 をつ づ け ま し ょ う.表5.2.5は,そ
の た め に 用 意 した もの で
す. 結 論 だ け を い え ば,こ 4行 目 の F 値10.2で 5.2.3,表5.2.4で て 表5.2.5を
の 表 に 示 し た 3行 目 の F 値26.4で
区 分A
の 効 果 を検 定 し,
区 分 B の 効 果 を 検 定 せ よ … こ う い う こ と で す.も
い えば,3 行 目の F 値 を使 え と い う こ と で す.そ
組 み 立 て た の で す か ら,こ
こ で は,表5.2.3,表5.2.4を
との表
れ らを抜 き出 し 考 慮外 にお い
表5.2.3
2要 因 の 場 合 の 分 散 分 析 表for仮
説検 定
(要 因 A,B の順qaに取 り上 げ た 場 合)
「区 分A で の 平 均 値 間 の 差 」は 有 意.A の 差 」は 有 意 で な い.
表5.2.4
の 各 区 分 ご とに み た 「区 分 B で の 平 均 値 間
2要 因 の 場 合 の 分 散 分 析 表for仮
説検定
(要 因 B,A の 順 に 取 り上 げ た場 合)
「区 分 B で の 平 均 値 間 の 差 」は 有 意.B
の 各 区 分 ご とに み た 「区 分A で の 平 均 値 間
の 差 」も有 意.
表5.2.5
2要 因 の場 合 の 分 散分 析 表for仮
説検定
(要 因 A,B の 取 り上 げ 順 をか え た 2つ の 表 を ま とめ た もの)
て け っ こ う で す. 後 の 節(5.6節)で,2
つ の 要 因 の 相 乗 効 果,相
表 に つ い て 言 及 し ます が,こ た め に,表5.2.5の
こ の 扱 い で は,相
殺 効 果 を 取 り上 げ る と き に こ れ らの 乗 効 果,相
殺 効 果 を 取 り上 げ て い な い
範 囲 で み れ ば よい の で す.
F 値 の分 母 は 「分 析 に よ っ て 説 明 さ れ ず に 残 っ た部 分 」の 分 散 を 使 う. 複 数 の 要 因 が 想 定 さ れ る と き に は,そ 表5.2.5で
み れ ば,区 分A
れ ら を 一 緒 に 取 り上 げ る.
間 の 差 も区 分 B 間 の 差 も有 意 で す.
こ の 例 で は 前 節 の 結 論 と一 致 し ま し た が,い
つ もそ うだ とは 限 りませ ん.
上 の ま とめ に 示 した よ うに,2 つ 以 上 の 要 因 が 影 響 して い る と き に は,そ
れ らの影
響 を 除 去 した 残 差 の 分 散 を分 母 に と っ た F 比 を使 い ま し ょ う. そ う しな い と,形 式 的 に 有 意 だ と な っ て も,そ れ が,「 区 分 け に 使 っ た 要 因 の 効 果 だ 」 とい う解 釈 に 結 び つ か な い … 重 要 な 注 意 点 で す. ◇ 注 l 表5.2.3,表5.2.4の 要 因A,要
4行 目の F 値 は,2 つ の要 因 の 交 互 作 用 が 影 響 す る の で,
因B の効 果 を判 定 す るに は不 適 当だ とい うこ とです.交 互 作 用 が 存 在 しな い
と想 定 で きれば,こ れ らを使 う こ と もで きます. ◇ 注 2 表5.2.5の
4行 目に 交互 作 用 に対 応 す る項(偏 差 平 方 和 は-12105)を
考 え られ ます,表4.7.4で 動414684-190421と
説 明 した よ うに170319+66049-12105が
一 致 す るた め,そ
お くこ とが
A,B で 説 明 され た変
うす る の が 自然 で す が,こ こ で は,交 互 作 用 を検
定 の 対象 とす るの が 不適 当(5.7節 参 照)だ とい う理 由 で,こ の 表 に は含 め てい ませ ん.
5.3 帰 謬 法 と仮 説検 定 の論 理 ① 帰謬法
前 節 で例 示 し た手 法 の 論 理 の 運 び 方 につ い て,な
明 しま し ょ う.こ れ が,こ
ぜ そ うす る か を 説
の 節 の テ ー マ で す.
ま ず,論 理 学 の 基 本 に 立 ち も ど り ま し ょ う. 次 の枠 組 み が,帰
謬 法 と よ ば れ る 論 理 の 運 び 方 で す.
◆5.3.1 帰謬法の論理
仮説 帰結
「命題 A が真 」な ら 「命 題 B が 真 で あ る」
事実 結論
しか る に,「 命 題 B は 真 で な い 」こ とが わ か っ た よ っ て,「
命 題 A は 真 で あ る 」こ とは 否 定 さ れ る
検 討 の 対 象 と な っ て い る の は 「命 題 が 真 」 とい う こ と で す か ら,そ れ を 「 仮 説 」とし て い ます.そ
の 仮 説 が,命
果 と な るの で す.ひ
題 B に 関 し て知 りえ た 事 実 に も とづ い て,否
定 さ れ る結
と こ とで い え ば,
仮 説 が 正 し い とす れ ば 起 こ りえ な い こ とが 起 こ っ た か ら,仮
説 を否定 す る
とい うこ とで す. ②
仮 説検 定の論 理
仮 説 検 定 の 論 理 は,こ
の 帰 謬 法 の 論 理 に 可 能 性 の 大 小 を考
慮 に 入 れ た次 の 形 式 を と り ます. ◆5.3.2 仮 説検定 の論理
仮説
「命 題 A が 真 」な ら,
「命 題 Bが真 であ る」可能性 が高 い しか る に,「 命 題 B は真 で な い 」こ とが わ か っ た よ っ て,「
命 題 A は 真 で あ る 」こ とは 否 定 す る
帰結 事実 結論
◆5.3.4で 変更 します. 帰 謬 法 の 論 理 で は,帰
結が 「 仮 説 が 正 し け れ ば あ りえ な い 事 実 」で あ っ た の に 対 し
て,仮
説 検 定 の 論 理 で は,「 仮 説 が 正 しけ れ ば 可 能 性 の 低 い 事 実 」 とお き か え ら れ て
い る … こ こ が 要 注 目点 で す. 可 能 性 が 低 い に して も 「仮 説 が 正 し い と き そ の 帰 結 が 起 こ り う る」 と想 定 し て い る の で す.い
い か え る と,
「起 こ り え な い こ とが 起 こ っ た」 と い う とこ ろ が, 「め っ た に 起 こ ら な い こ とが 起 こ っ た 」 とお き か え られ て い る の で す. ◇ 注 仮 説 検 定 論 で は,上 記 の 論 理 に お け る 「 可 能 性 が 高 い 」とい う とこ ろ を,確 率 を 計 測 す る こ とに よって 客 観化 して い ます.た だ し,確 率 計 算 が で きな くて も,「可 能 性 が 高 い 」と判 断 で きれ ば,そ の 論理 を適用 で き ます. ③ 第 一種 の過 誤
こ の お き か え に よ っ て,可
能 性 が 低 い に して も,「 命 題 A が
真 で あ る の に 命 題 B が 真 で な い 」可 能 性 が あ り う る こ と が 前 提 と さ れ て い ます か ら, 「し か る に 」以 下 の 論 法 を 適 用 す る と 「命 題 A が 真 で あ る 」の に か か わ らず,そ
れ を否 定 す る
と い う 「誤 りを お か す 可 能 性 」 を も っ て い る こ と に 注 意 し て くだ さい. こ の 誤 り を 「第 一 種 の 過 誤 」 と よ び ます. 仮 説検 定 の 論 法 で は,こ
の 誤 りの 可 能 性 を認 め ま す.こ
れ が,帰
謬 法 と大 き くち が
う点 で す.「 誤 り を お か す 可 能 性 が あ る が ゆ え に 何 も い わ な い 」 と い う態 度 で は 前 進 しに くい,よ
っ て,「 誤 りの 可 能 性 を 十 分 低 くお さ え ら れ る な ら,そ
の リス ク を承 知
の う え で 発 言 しよ う」 と い う態 度 を とる の で す. 以 下 で は,こ
の過 誤 の 大 き さ を α と表 わ し ます.た
仮 説 検 定 論 の 用 語 と して は,こ ④
と え ば5%と
の α を 「有 意 水 準 」,1-α
し ます.
を 「信 頼 度 」 と よ び ます.
前 節 の 問 題 に つ い て こ れ を適 用 す る た め, 命 題 A を 「区 分 間 に 差 が な い 」, 命 題 B を 「F<Fα だ 」
とお きか え る と,次 の よ うに な りま す. ◆5.3.3 仮説検定の論理の適用例
仮説
「区 分 間 に 差 が な い 」 と き に 「F<Fα の 確 率 が 1-α % 」 し か る に,「F>Fα
よ っ て,
と な っ た 」
帰結
事実 結論
仮 説 を否 定 す る
す な わ ち,「 区分 間 に 差 が あ る」 とみ る ◆5.3.5で 変 更 します. ⑤ 上 の 論 法 に お け る 事 実 「F>Fα と な っ た 」を 「事 実 R」 と表 わ し,そ の 否 定 す な わ ち 「F<Fα と な っ た 」を 「 事 実 A」 と表 わ し ま し ょ う.ま 対 応 す る結 論 を 「結 論 R」,「結 論 A」 と表 わ しま す.
た,そ
れ ぞれ の事 実 に
R,A を添 え た こ とか ら,事 仮 説 をRejectし(棄
実 と結 論 と の つ な が りに 関 して,事
だ と解 釈 して もか ま い ませ ん.た
だ し,Acceptの
方 は,論
る(棄 却 し な い)の
理 と して 注 意 が 必 要 で す.
この 「事 実 A」は,前 提 か ら普 通 に 起 こ る こ と(確 率 1-α,た し た が っ て,そ
実 R が起 こった ら
却 し),事 実 A が 起 こ っ た ら仮 説 をAcceptす
と え ば95%)で
す.
れ が 起 こ っ た と きに は,前 提 を否 定 す る こ とは で き ませ ん.
しか し,こ の こ とは,前
提 が 正 しい こ との 証 明 に は な っ て い ませ ん.
さ らに 説 明 をつ づ け ます が,ま
ず,仮
説 検 定 の 論 理 の 枠 に 事 実 A に 関 す る部 分 を
追 加 し て お き ま し ょ う.
◆5.3.4 仮 説検定 の論理 「命 題 A が 真 」な ら,
仮説
帰結
「命題 B が真 であ る」可能性 が高 い しか る に,「 命 題 B は 真 で な い 」こ とが わ か っ た よ っ て,仮
や は り,「 命 題 B は 真 で あ る」こ とが わ か っ た よ っ て,仮 また,こ
事実R 結論R
説 は 否 定 され る
事実A 結論A
説 は 否 定 で き な い
れ に ④ と 同 じ命 題 A,命 題 B を あ て はめ る と,次 の よ うに な り ます. ◆5.3.5 仮説検定の論理の適用 「区 分 間 に 差 が な い 」な ら 「F<Fα の確 率 が1-α%」 し か る に,「F>Fα
よ って,仮 や は り,「F<Fα
よ って,仮
と な っ た 」
仮説 帰結 事実 R 結論 R
説 は 否 定 され る だ っ た 」
説 は 否 定 で き な い
事実A 結論A
結 論 A は た い へ ん まわ り くど い 文 に な っ て い ます. 仮 説 を具 体 的 に 特 定 した 書 き方 に す る と, "区 分 間 に差 が な い"と い う仮 説 は 否 定 で き な い と い う三 重 否 定 に な っ て い る の です. こ れ を簡 単 化 す れ ば 「区 分 間 に 差 が あ る とは い え な い 」 とお き か え て よ い の で す が,さ
ら に 「区 分 間 に 差 が な い 」 と お き か え る と,論 理 の 筋
が か わ っ て し ま い ま す. 論 理 に 沿 っ た い い か え をす る と 「"区分 間 に 差 が な い"と い う仮 説 を否 定 で き な い 」 ⇒ 「区 分 間 に 差 が な い とい う仮 説 を否 定 す る 」こ と は で き な い ⇒ 「区 分 間 に 差 が あ る」 と は い え な い
と い い か え る こ とは 可 能 で す が,「 区 分 間 に 差 が な い 」 と い う 断 定 的 言 い 方 は,誘
導
され ませ ん. 「Rejectさ れ な い 」と い う 意 味 で,「Acceptさ
れ る 」の で す が,「Proofは
され て い
な い 」の で す. ⑥
以 上 を ま とめ ま し ょ う.
仮 説検 定 の 論 法 で は,「 区 分 間 に 差 が な い」 と い う こ と を 「 仮 説 」 と よ び ま す.そ して,そ
う
の 論 法 で選 択 され る 帰 結 は
仮 説 が 棄 却 され る(す な わ ち,差 が あ る と結 論 す る) 仮 説 が 棄 却 され な い(す な わ ち,「 差 が あ る とは い え な い 」と結 論 す る) の い ず れ か で す. こ の 判 定 の 基 準 値Fα を 「棄 却 限 界 」と よ び ま す が,棄 の は,こ ⑦
却 と い う語 を採 用 し て い る
の論 法で は 「 仮 説 の 棄 却 」に 関 す る 誤 り を制 御 し て い る た め で す .
第二 種の 過誤
こ の 論 法 の 構 成 に お い て 「仮 説 が 正 し い 」と仮 定 し た 場 合 に
つ い て 確 率 を計 算 し, 「仮 説 が 正 し く な い 」に 該 当 す る事 実 が 起 こ っ た ⇒ 「 仮 説 を 棄 却 し て,差
が あ る とみ る 」確 率 がl-α
「仮 説 が 正 し くな い 」に 該 当す る事 実 が起 こ ら な か っ た ⇒ 「 仮 説 を棄 却 せ ず,差
が あ る と み な い 」確 率 が α
と制 御 し て い ます が,「 仮 説 が 正 し くな い 」場 合 に つ い て は,確
率 を計算 して い な い
こ とに 注 意 し ま し ょ う.「 仮 説 が 正 し く な い 」 と い う場 合 に は 種 々 の ケ ー ス が あ り え ます.そ
う い う 「特 定 さ れ な い状 況 下 で は,確
率 を計 算 で きな い 」の で す.
確 率 が 計 算 で き な い に して も 「 差 が あ る」の に 「 差 が あ る とは み な い 」 とい うの は 誤 りで す.こ
れ を 「第 二 種 の 過 誤 」 と よ び ま す.
これ を制 御 す る に は 「差 が あ る 」 とい う こ と を 「あ る特 定 の 差 が あ る」 とお きか え て 論 理 構 成 を拡 張 す る こ とに な りま す.た
だ し,そ
い る仮 説 に 対 立 す る別 の 仮 説 を想 定 し ます.そ
うい う拡 張 で は,検
の よ うに,問
と に よ っ て理 論 の 組 み 立 て を精 密 化 す る の で す が,こ
討 の対象 として
題 を扱 う場 を 限 定 す る こ
こ で は,ふ
れ な い こ とに し ま
す. ⑧
た だ し,棄 却 限 界 の 決 め 方 に 関 して,片
側 検 定 と両 側 検 定 の 2 とお りが あ る こ
と を 注 意 して お き ま し ょ う. こ れ ま で の 説 明 で は,棄 却 限 界 を P(F<Fα)=α と し て い ま し た が,こ
れ は,F
の値 が
「差 が な け れ ば 1,差 が あ れ ば 1よ り大 き くな る 」 と い う性 格 を もつ 変 数 だ っ た か ら で す. こ れ に 対 して,検
定 の た め に 使 う変 数 T の 値 が
「差 が な け れ ば 0,差 が あ れ ば 0か ら正 ま た は 負 の 方 向 に 離 れ る 」 と い う性 格 を もつ 場 合 に は,一
般 には
P(│T│<Tα/2)=α と し ま す. た だ し,「 正 の 方 向 の 差 だ け を 問 題 に す る」 と限 定 して 扱 う場 合 に は,負
の方向の
差 は 問 題 にせ ず,棄 却 限 界 は P(│T│>Tα)=α と し ま す. こ の 節 の 問 題 で 使 っ て い る F は,あ
との 場 合 で す か ら
P(│F│>Fα)=α い い か え れ ば,「 正 の 方 向 へ の 差 」の 有 無 を 問 題 に す る の だ とい う扱 い を 採 用 す る こ と に な り ます. こ れ らの 扱 い を 区 別 す る た め に,両 側 検 定,片
側 検 定 と い う呼 び 方 が な さ れ ま す.
5.4 ア ウ トラ イ ヤ ー検 出 ① こ の 節 で は,ア
ウ トラ イ ヤ ー 検 出 の 問 題(第 3章)を 考 え,仮
説検 定 の問 題 と
の 類 似 点 と相 違 点 を 説 明 し ま す. ま ず,5.3節
で 示 し た仮 説 検 定 の 論 理 を 再 掲 し ま す.こ
れ を,ア
ウ トライヤー検 出
の 問 題 に 適 用 す る こ と を考 え て み ま し ょ う. ◆5.4.1
仮説検定の論理(◆5.3.2の 再掲)
「命 題 A が 真 」な ら
仮説
「命題 Bが真 で あ る」可能性 が 高 い しか る に,「 命 題 B は 真 で な い 」 こ とが わ か っ た よ って,「 命 題 A は 真 で あ る」こ とは 否 定 さ れ る X に 関 す る 1セ ッ トの 観 察 値 の う ちXKが
帰結 事実 結論
ア ウ トラ イ ヤ ー だ と い う こ とは,XKの
値 が X の 分 布 と して 期 待 さ れ る範 囲 を こ え る こ と を 意 味 し ます.し 平 均 値 が μ0,標 準 偏 差 が σ0だ と し て 偏 差 値T=(X-μ0)/σ0を 値,た
と え ば 3を こ え て い れ ば ア ウ トラ イヤ ー とみ る …
上 記 の 枠 組 み に 対 応 させ る た め に は 命 題 A を,「 X の 平 均 値 が μ0,標 準 偏 差 が σ0であ る」 命 題 B を,「T=(X-μ0)/σ0に
つ い て│T│<Cで
の
れが限界
こ う い う見 方 が で き そ うで
す.
とお き ます.
た が っ て,X
計 算 し,そ
あ る」
◆5.4.2
仮 説検 定 の 論 理 の 適 用
「X の 平 均 値 が μ0,標 準 偏 差 が σ0であ る」が 真 な ら, 「T=(X-μ0)/σ0に
しか るに,│T│>Cだ よ っ て,仮
つ い て│T│<Cで
あ る 」
?結論
説 を否 定 す る.
の 2行 に つ い て,?を
こ の 節 で は,こ
帰結 ?事 実
っ た
こ こ で,下
仮説
◆5.4.3で 変 更 します.
つ け て あ り ます.
こ を考 え るの で す.
C を ど う定 め る か は ② 以 下 で 説 明 し ま す.そ
の 上 で,こ
の節 の 最初 にあ げ た問 題
に つ い て 説 明 し ま す. ②
こ こ で観 察 値X
を T す な わ ち 偏 差 値 に お きか え て い ま す が,こ
れ は,種
々の
問 題 に 適 用 す る と きの 数 理 を 一 般 化 しや す くす る た め の 便 宜 を 考 え た もの で す.検 法 を 適 用 す る た め の指 標 と して 使 う もの で,統 こ の 統 計 量 に つ い て,│T│<Cと を信 頼 区 間 とよ び ま す.仮 入 っ て い な い と き は,仮
い う 範 囲 を使 う こ とに な っ て い ま す が,こ
説 を棄 却 す る 」 もの とい い か え る こ と が で き ま す. 上 で 」 と い う言 い 方 に お きか え る
の 信 頼 区 間 の 限 界 値 C を定 め ま す.
そ の 場 合 の 信 頼 区 間 を 「信 頼 度95%の ③
の範 囲
説 検 定 の 論 理 は,観 察 値 に 対 応 す る偏 差 値 が 「 信 頼 区間 に
ま た,「 ほ ぼ 確 実 」 と した と こ ろ を,「 確 率95%以 た め に,こ
定
計 量 と よ び ます.
信 頼 区 間 」 とよ び ます.
問 題 は こ の C の 定 め 方 で す.
こ の C と し て√20を 使 う こ と が 考 え ら れ ます. こ れ は,T
の 分 布 型 が 「平 均 値 0,標 準 偏 差 1 をみ た す 」ど ん な 型 で あ っ て も成 り
立つ チ ェ ビ シ ェ フ の 不 等 式P(│T│<C)≧1-〓 に お い てC=√20と
お い た も の を使 う こ と を 意 味 し ます.
し た が っ て,「 偏 差 値 の 絶 対 値 が4.47を
こ え た も の を ア ウ トラ イ ヤ ー と み よ う」 と
い う こ と に な り ます. ④
「偏 差 値 が√20を
こ え れ ば 」 と い う基 準 は 広 す ぎ る と感 じ る で し ょ うが,こ
れ
は,分 布 型 に 関 す る仮 定 を お い て い な い た め で す. い い か え る と,分 布 型 に 関 す る仮 定 を お け る な ら,検 定 法 の 組 み 立 て の 根 拠 式 を そ の仮 定 の も と で計 算 し,信 頼 区 間 の 幅 を 狭 くす る こ とが で き ます. た とえ ば,X
の 分 布 が 正 規 分 布 だ とす れ ば
P(│T│<1.96)=95% で す か ら,√20以 ⑤
下 と し た と こ ろ を1.96以
◆5.4.2の?は,こ
の よ うに,基
下 とお きか え る こ とが で き ます.
準 値 が 「X の 分 布 型 に 関 す る仮 定 に よ っ て 大
き くか わ る 」こ とに 関 連 し て い る の で す. 統 計 量 T の 計 算 値 が 基 準 値 を こ え た と き に 採 用 す る こ と と な る結 論 は, ③ の 場 合,分
布 型 い か ん に か か わ ら な い推 論 に な っ て い る こ とか ら
「X の 平 均 値 が μ0で な い こ と」 「X の 標 準 偏 差 が σ0で な い こ と」 の 2つ の 場 合 を含 む こ と に な り ます. こ れ に 対 して, ④ の 場 合 は,正 規 分 布 で あ る と し た 上 で の 推 論 に な っ て い る こ とか ら 「X の 平 均 値 が μ0で な い こ と」 「X の 標 準 偏 差 が σ0でな い こ と」 「X の 分 布 が 正 規 分 布 で な い こ と」 の 3つ の 場 合 を 含 む こ と に な り ます. い い か え る と,形 式 上 「 仮 説 が 棄 却 さ れ る 」と い っ て も,そ の こ との 意 味 が 特 定 さ れ な い ま まに な っ て い る の で す. した が っ て,正
規 分 布 で あ る こ と を十 分 な確 度 で 前 提 で き る な ら ば,◆5.4.2の
理 を ア ウ トラ イ ヤ ー 検 出 に 適 用 で き ます が,ア は,ま
論
ウ ト ラ イ ヤ ー の 検 出 を考 え る 段 階 で
だ 「分 布 型 を想 定 し う る状 態 で は な く,◆5.4.2の
論 法 を適 用 で き る 状 態 で は
な い 」とす べ き で す. ◆5.4.3 仮説検定の論理の適用 「 X の 平 均 値 が μ0,標 準 偏 差 が σ0であ る」が 真 な ら, 「T=(X-μ0)/σ0に
しか る に,│T│>Cだ よ っ て,仮
つ い て│T│<Cで
仮説
帰結 事実
あ る 」
っ た
結論
説 を否 定 す る.
この論理 におけ る C は,X の分布 型いか んに よって大 きくか わるので,正 規分 布を十分な確 度で想定で きる場合以外 は適用 しに くい. ⑥
そ うい う状 態 下 で は2.5節
ヤ ー 検 出 」が,過
で 説 明 し た 「ボ ッ ク ス プ ロ ッ トに よ る ア ウ ト ラ イ
度 に 精 密 化 す る の を避 け る と い う意 味 で,適
した 手 法 だ と い う こ と
で す. ボ ッ クス プ ロ ッ トに お け る フ ェ ン スUF,LFは,偏
差 値 に お きか え る と
UF=2.7,LF=-2.7 で す.し
た が っ て,チ
ェ ビ シ ェ フ の 不 等 式 を適 用 す る と
P(│T│≦2.7)<1-〓 で す か ら,信 頼 度86%の
信 頼 区 間 を使 う こ と だ と解 釈 で き ま す.
正 規 分 布 と仮 定 で き る な ら P(│T│≦2.7)<0.993
で す か ら,信 頼 度99%の この よ うに,ボ で き ま す が,ボ
信 頼 区 間 に 相 当 し ます.
ッ ク ス プ ロ ッ ト と仮 説 検 定 と の 関 係 を 「形 式 上 対 応 させ る 」こ とが ッ ク ス プ ロ ッ トを 適 用 す る場 面 で は,分
布 型 を仮 定 で きな い の で,こ
の 節 で述 べ た 「仮 説 検 定 を厳 密 な 形 で 適 用 す る こ と を考 え な い 」の だ と 了解 し ま し ょ う.し た が っ て,た こ とは,し
とえ ば,ボ
ッ ク ス プ ロ ッ トのUF,LFを
分 布 型 に 応 じて か え る
な い の で す.
◇ 注 1 チ ェ ビ シ ェ フの 不 等 式 は,X
の 分 布 型 い か ん にか か わ ら ず成 立 す る もの で す が,
分布 型 に 関 す る仮 定 をか え て,P(X>K)の
上 限 を評価 す る次 の よ う な不 等 式 が 見 出 され
て い ます. 比 較 の ため に,チ ェ ビ シ ェ フの不 等 式 と正 規 分 布 の 場 合 の 式 も示 し てお き ます.い ず れ も,確 率5%の
場 合を例 示 して あ ります.
分 散 が 存在(そ の範 囲 で は任 意)P[│X│>√20]=5% 単 峰 形(そ の範 囲 で は任 意)P[│X│>√11.2]=5% 左 右 対 称 な単 峰 形(そ の範 囲 で は任 意)P[│X│>√8.89]=5% 正 規 分 布P[│X│>1.96]=5% ◇ 注 2 これ らの不 等 式 か ら,仮 定 を きび し くす れ ば そ れ に 応 じて,不 等式 の 上 限 を狭 く で き るこ とが わ か ります.逆 に い う と,こ の よ う な不 等 式 を精 密 化 し よ う とす る と,き び しい仮 定 をお くこ とが 必 要 だ とい う こ とです.
5.5 平 均 値 に 関す る 仮 説検 定 ①
こ の 節 お よ び次 節 で は,基 礎 デ ー タが 実 験 に よ っ て 求 め られ て い る場 合 を 想 定
し,そ の 場 合 に 適 用 で き る よ う特 殊 化 さ れ た仮 説 検 定 法 を説 明 し ま す. 基礎 デ ー タ の 求 め 方 に 関 して 条 件 が つ くた め,ど ら な い 反 面,条
ん な デ ー タ に も適 用 で き る とは 限
件 をみ た して い る な ら,検 定 方 法 を 精 密 化 で き ま す.
した が っ て,実
験,す
な わ ち,一
定 の 条 件 下 で 観 察 を く りか え し て 観 察 値 を求 め う
る場 面 で適 用 され る こ とが 多 い の に対 して,実 験 しに くい 問 題 分 野,す を制 御 して 観 察 値 を求 め に くい 問 題 分 野 」で は,こ
な わ ち 「条 件
の 節 で 説 明 す る 方 法 を 適 用 しに く
い … こ う い わ れ て い ま す が,「 な ぜ そ う な の か を知 る 」こ と に よ っ て,適
用 で きる範
囲 を み き わ め る こ とが 必 要 で す. ②
ま ず 典 型 的 な 例 を使 っ て 説 明 し ます.
た と え ば 「あ る製 品 の これ ま で の 製 法 で は 平 均 値 が 50,標 て い た が,製
準 偏 差 が 10 だ と み ら れ
法 を 改 善 した た め に 平 均 値 が か わ っ た とみ られ る の で,そ
の こ と を確 認
し た い 」 とい っ た 問 題 を考 え る の で す. ③5.3節
に 示 した 仮 説 検 定 の論 理(◆5.3.2)を
を 扱 うに は,そ
適 用 す る の で す が,例
れ につ いて
命 題 A を,「 X の 平 均 値 が μ0,標 準 偏 差 が σ0であ る」 命 題 B を,「T=(X-μ0)/(σ0/√N)に
つ い て│T│<1.96で
あ る」
示 した問題
とお き ま す.す た だ し,②
な わ ち,◆5.5.1の
よ う な 論 法 を適 用 し ます.
に 述 べ た 理 由 で,こ
て あ り ます.検
れ ま で の 節 で は な か っ た 「前 提 」 を表 の 中 に 明 示 し
定の 対象 とされ る 「 仮 説 」 と,手
法 適 用 に あ た っ て 考 慮 に 入 れ る 「前
提 」 と を わ け て い る の で す. ◆5.5.1平
均値 に関 する仮 説検定(1)
σが既知 と想定 で きる場合 X の 分 布 は 正 規 分 布 で 表 わ され る
前提
「X の 平 均 値 が μ0,標 準 偏 差 が σ0であ る」が 真 な ら,仮 「T=(X-μ0)/(
│T│<1.96で
あ る」が ほ ぼ 確 実
し か る に │T│>1.96だ
よ っ て,仮
説
σ0/√N) に つ い て
っ た
説 を 否 定 す る.
帰結 事実 結論
す な わ ち σ=σ0と 仮 定 して よ い もの とす れ ば, 「平 均 値 が μ0で な い 」 と い う結 論 と な る こ の 節 で 扱 う方 法 に つ い て は,
X の 分 布 に つ い て,正
です か ら,こ
規 分 布 で 表 わ され る とい う前 提 が 必 要
れ を 「前 提 」 と し て 明 示 し た の で す.
仮 説 の欄 に,当
面 の 課 題 と した 「 平 均 値 に 関 す る記 述 」 と適 用 に あ た っ て 考 慮 に 入
れ る 「標 準 偏 差 に 関 す る 記 述 」を列 記 し た こ とに つ い て は,後 こ こ で は,仮
で 注 記 し ます.
説 の 欄 に 列 記 し た こ と の うち,「 平 均 値 に 関 す る 仮 説 」に つ い て 検 定
す る 形 に な っ て い る た め,「 結 論 」の 欄 は,1 行 目 をつ け た 言 い 方 を す る こ と に な っ て い る … こ の こ とに 注 意 して お い て くだ さ い . ④
こ の 節 で は,観
察 値 X の 平 均 値X
に 注 目す る も の と して い ます か ら,統 計 量
T は,観 察 値 の 平 均 値 X を偏 差 値 の 形 に し た もの を採 用 して い ます. 2.6節 で 説 明 し た よ う に,平
均 値 の もつ 変 動 に つ い て は
μX=μX σX=〓
で す か ら,検 定 の た め の 統 計 量 を T=〓
と し ま す. ま た,2.6節
で 述 べ た よ うに,平
均 値 の 変 動 に つ い て は,正
とが 多 い の で,信 頼 区 間 は
P[│T│<1.96]=0.95
を使 う こ と に して い ます(⑧ ⑤
した が っ て,
で は 変 更 し ま す).
規 分 布 を想 定 で きる こ
観 察 値XI(I=1,2,…,N)の
平均 値 X を求 め
偏 差 値 T を計 算 し │T│>1.96な
ら仮 説 を 否 定 す る
も の と す れ ば よ い の で す. こ の 場 合,否
定 され るのは
「μ=μ0で あ り,σ=σ0で で す が,μ=μ0の
数 理 の 枠 内 で は,特 し たが っ て,当 に は,た
あ る」 とい う仮 説
方 が 否 定 さ れ た の か,σ=σ0の
方 が 否 定 さ れ た の か は,仮
説検 定 の
定 さ れ ませ ん.
初 に あ げ た 「平 均 値 の 変 化 を確 認 し よ う」 とい う問 題 に 答 え る ため
と え ば,
観 察 単位 の選 び方 や観察値 の求め 方か ら 標 準 偏 差 は か わ ら な い と仮 定 で き る そ うい え る場 面 で な け れ ば な ら な い の で す.い
い か え る と,
σが 既 知 だ と仮 定 す る の で す.そ
う仮 定 で き る な ら,
「前 提 が 否 定 さ れ た,よ
っ て,平
均値 が か わっ た」
とい う結 論 を 出 す こ とが で き ます. こ れ が,◆5.5.1の ◇ 注
最 後 の 2行 で す.
「あ る製 品 の これ ま での 製 法 で は 平均 値 が50,標
準 偏 差 が10だ 」とみ られ て い た
が,当 面 の 問題 と して は 「平均 値 が50」 とい うこ とを検 討 対 象 と しよ うとい う問題 設 定 で す.そ の場 合,手 法 の 組 み 立 て に お い ては 「 平 均 値 が50」 が 「 仮 説 」で あ り,「標 準 偏 差 が 10だ 」は 前 提 だ … こ う説明 す るこ ともで き ます. 検 定 法 の 数理 に注 目す る な ら,こ の 説 明の 方 が受 け 入 れ や す い で し ょ う. しか し,「 問題 の設 定 」として,平 均値 の ちが い を問 題視 す る場 合 に 標 準 偏 差 を考 慮 外 に お きに くい の で,本 文 に 述 べ た 表 わ し方 を採 用 し ま した.ま た,「 標 準偏 差 を考 慮 に 入 れ る扱 い方 」につ なが ります. ⑥
σ の 推 定 値 を 使 う場 合
「 標 準 偏 差 が こ れ ま で ど お りだ 」 と い い に くい 状 態
下 で 問 題 を扱 う に は,「 標 準 偏 差 は デ ー タ か ら計 算 さ れ る値 を 使 お う」 と考 え る の で す. そ れ な ら,仮 説 の うち,「 標 準 偏 差 が σ0だ」と い う部 分 を 外 す こ とが で き ます.い い か え る と,前 提 が 否 定 さ れ た 場 合,「 平 均 値 が μ0で あ る と は い え な い」 と結 論 づ け る こ とが で き ます. こ の 扱 い 方 を 採 用 す る 場 合,統 とづ く推 定 値 σ2=Σ〓
とお き か え ます.
計 量 T の 定 義 式 に お け る σ0(想定 値)を デ ー タ に も
こ う お きか え た 場 合 の 統 計 量 T に つ い て は,正 もの に な り ます.し
た が っ て,信
規 分 布 で な く,t 分 布 と よ ば れ る
頼 区 間 の 上 限 値1.96は,t
分 布 の 数 値 表 か ら拾 っ
た 値 とお き か え ます. 分 散 の 計 算 式 でN-1で t 分 布 は,自
わ っ て い る の は,こ
の こ と に 関 係 した 措 置 で す.
由度 す な わ ち 「 観 察 単 位-1」
に 関 係 し ます.し
た が っ て,上
限値 は
自由 度 に よ っ て 異 な っ た 値 と な りま す. た とえ ば
です.自
自由 度10の
場 合2.23
自由 度20の
場 合2.09
自由 度50の
場 合2.01
由 度 が 大 き くな る とt 分 布 は 正 規 分 布 と一 致 し ま す か ら,上
限値 は1.96に
近 づ き ます. 以 上 を ま とめ る と,次 の ◆5.5.2の ◆5.5.2平
手 順 と な り ます.
均値 に関す る仮 説検定(2)
分散 を観察値に よって推定す る場合
Xの分布 は正 規 分布 で表 わ され る
前提
標準 偏差 は,観 察 値か ら推定 す る もの とす る 「X の 平 均 値 が μ0」が 真 な ら, T=〓
仮説
につ い て
だ っ た
帰結 事実
説 を否 定 す る.
結論
「│T│<Tα で あ る」が ほ ぼ 確 実 し か る に,│T│>Tα
よ っ て,仮
す な わ ち,「 X の 平 均 値 が μ0」を 否 定 す る ⑦ 例 をあ げ て お き ま し ょ う. 例5.5.1「
ち ょ う ど100グ
導 入 した の で,10回
ラ ム ず つ 包 装 す る よ うに 設 計 さ れ た 自 動 包 装 機 械 を
の テ ス トを 行 な っ て 次 の 結 果 を得 た.こ
れ に も と づ い て,
そ の 機 械 は 設 計 仕 様 ど お りに な っ て い る と い っ て よ い か.」 101.1 解 答例
103.2 表5.5.3に
100.1
μ=100.5,σ=1.42 が 得 ら れ る. 検 定 のため の統 計量 は T=〓 =1 .113
98.4
100.5
101.3
99.3
100.5
98.9
よ っ て 観 察 値 の 平 均 値 と標 準 偏 差 を 計 算 す る と
101.4
こ れ に 対 す る棄 却 限 界 値 は,自 のt 分 布 表 を み る と,2.26で が っ て,仮
由度 9
す.し
表5.5.3
例5.5.1の
ため の計 算
た
説 は 棄 却 さ れ な い とい う結 論
で す. ⑧ こ の 問 題 で は,「 平 均 値 が μ0で な い 」 と い う仮 説 を 問 題 と し て い ま す.す
な わ ち,
「μ0よ り大 き い 場 合 も μ0よ り小 さ い 場 合 も あ り う る 」 と し て検 定 法 を適 用 して い ま す か ら,棄 却 限 界値 を P(│T│>2.26)=0.05 と して 定 め て い ま す. こ れ に 対 し て,た は,棄
と え ば,「 μ0よ り小 さ い 場 合 は あ り え な い 」と仮 定 し う る 場 合 に
却域 を P(│T│>1.83)=0.05
と して 定 め ます.116∼117ペ
ー ジ で 説 明 し た 「片 側 検 定 」を 採 用 す る こ と を 意 味 し ま
す. ◇ 注 l 片 側検 定 では,μ に関 して, H0:μ=μ0に
対 してH1:μ>
を想 定 して,H0かH1か
μ0
を選 択 す る結 果 とな ります.
この見 方 に たつ と,「観 察 値 につ いて,そ れがH0:μ=μAを
もつ A 群 に属 す るか,H1:
μ=μBを もつ B群 に属 す るか を判 定 す る」問題 を扱 う方 法 に つ なが りそ うで す が,こ の種 の 問題 で は,2 つ の 可能 性 を対 等 に扱 う こ とか ら,こ の 節 の仮 説検 定 とい くぶ ん ちが っ た 原理 を適 用 し ます.「 判別 の 問題 」と して論 じられ て い ます. ◇ 注 2 上 記 に お け る対 立仮 説H1を
μ>μ1(μ1> μ0)と想 定 で き る場 合 に つ い て は,仮 説
検 定 の方 法 の枠 内で 扱 うこ とが で き ます.
5.6 平 均 値 の 差 に関 す る仮 説 検 定 ① た と え ば X の 観 察 値 がN1組,Y す.そ
の観 察 値 がN2組
れ をXI(I=1,2,…,N1),YJ(J=1,2,…N2)と
求 め ら れ て い る もの と し ま
表 わ し ま し ょ う.こ
れに もと
づ い て,「 各 観 察 値 の 観 察 条 件 の ち が い が 平 均 値 に 変 化 を もた らす か 否 か 」 を 判 断 す る問 題 を考 え ま し ょ う. す な わ ち,X
の 平 均 値 X と Y の 平 均 値 Y の 差 に つ い て,差
る こ と を考 え るの で す.た
が 0か 否 か を 判 断 す
だ し,XI(I=1,2,…,N1)もYJ(J=1,2,…,N2)も
差 を も っ て い ます か ら,平 均 値 X,Y
を手 が か りに す る に し て も,判
観 察 誤 差 を除 い た と きに み ら れ る平 均 値 μX,μYの 差 で す.
観察誤 断 した い の は,
◆5.6.1
仮 説検 定 の 論理
「命題 A が真 」な ら
仮説
「命題 B が真」がほ ぼ確実
帰結
しか るに 「B が 真 」で な か っ た
事実 結論
よ っ て,前 し た が っ て,仮
提 「 A が 真 」を否 定 す る も の とす る
説検 定 の論理 につ い て
命 題 A を,「 μX-μY=0」
命 題 B を,「T=(X-Y)/σX-Yに
つ い て│T│<1.96」
と お き ま す. す な わ ち,次
の ◆5.6.2の
◆5.6.2
手 順 を 構 成 し ま す.
平 均 値 の 差 に 関 す る仮 説 検 定(1)
σx,σYは 既 知 とす る場 合
X,Y の分布 が正規 分布 で表 わ され る
前提
た だ し,そ れ ぞれ の標準偏 差 は既知 とす る 「μX-μY=0」
仮説
が 真 な ら,
「T=(X-Y)/σX-Yに
│ T│<1.96で
つ い て
よ っ て,仮
量 T は,平
事実 結論
っ た
説 を 否 定 す る.
す な わ ち,「 μX-μY=0」
② こ の 節 で は,観
帰結
あ る」が ほ ぼ 確 実
し か る に│T│>1.96だ
察 値XI,YJの
均 値 の 差X-Yを
を否 定 す る
平 均 値 に 注 目す る も の と して い ま す か ら,統 計
偏 差 値 の 形 に し た も の を 採 用 して い る の で す が,分
散 の 方 に つ い て 注 意 が 必 要 で す. こ こ で は,X
の 分 散 σX2お よ び Y の 分 散 σY2が 既 知 だ と し て い ま す か ら,
σX2=〓,
平均 値 の分散
σY2=〓
σX-Y2=σX2+σY2平
均 値 の差 の分散
と し ます. ③ 一 般 に は σX,σYが 既 知 とは い い に くい の で,そ 5.5節 の 場 合 と 同 様 に,σ が,そ
と して,観
うい う場 合 を考 え ま し ょ う.
察 値 に も とづ く推 定 値 を 使 え ば よ い の で す
の 推 定 値 の 求 め 方 に 関 して,2 つ の 場 合 を わ け て 考 え ま す.
以 下 の ④ と ⑤ で す. ④ 値 は わ か っ て い な い が,等
し い と仮 定 で き る場 合 が あ り え ま す.た
と え ば,条
件(比 較 し よ う とす る条 件 以 外 の 条 件)を そ ろ え て観 察 値 を 求 め て あ る も の とす れ ば, σX2=σY2と 仮 定 し て よ い の で す. そ の 場 合 に は,そ
の 共 通 値 を次 の 式 で 推 定 し ま す.
分散 の推 定 平 均 値 は 異 な るか も しれ な い,よ - X,YJ-Yを
っ て,そ
れ ぞ れ の 平 均 値 X,Y
つ く り,そ れ らの 2乗 和 を X の 分,Y
N1+N2-2で
を 使 っ て 偏 差XI
の 分 を含 め て 計 算 し,自
由度
わ る … こ うい う式 に な っ て い ます.
こ れ を使 っ て,
平 均値 の分 散 平 均値 の差 の分散 と し ま す. ま た,こ
の こ と に と も な い,統
度N1+N2-2のt
計 量 T の 分 布 と し て,正
規 分 布 の か わ り に,自
由
分 布 を使 う こ と に な り ます.
し た が っ て,仮 ◆5.6.3平
説 検 定 の 手 順 は,次
の よ うに お きか え ら れ ま す.
均値 の差 に関す る仮説検定(2)
分散は等 しい と仮定 し観察値 から推 定す る場合
前提
X,Y の分布 が正 規分布 で表 わ され る ただ し,そ れ ぞれ の標 準偏 差 は観察 値か ら推 定す る 「μX-μY=0」
仮説
が 真 な ら,
「T=(X-Y)/σX-Yに
つ いて
帰結
│ T│<Tα であ る」が ほぼ確 実 しか る に│T│>Tα よ って,仮 す な わ ち,「
⑤ σX2=σY2を
μX-μY=0」
を否 定す る
仮定 で きな い とき
定 で き な い と きに は,統
事実 結論
だ っ た
説 を否 定 す る.
◆5.6.3の
計 量 T の 計 算 に お い て,次
フ レー ム に お い て σX2=σY2を 仮 の よ う に,そ
れ ぞ れ を 推 定 して
平 均 す る形 に 改 め ます.
分散 の推 定 平均 値 の分散 平均 値 の差 の分 散 ま た,統 計 量 T の 分 布 は,次 と を 利 用 して 決 め ます.
の 式 で 計 算 さ れ る 自 由 度ν のt 分 布 で 近 似 で き る こ
N1=N2な
らν=N1-1と
措 置 は,N1,N2の
な り ま す.い
い か え る と,上 記 の よ う に 自 由 度 を決 め る
ち が い が もた ら す 影 響 を補 正 す る た め に 必 要 と な る もの と理 解 で き
ます. ◆5.6.4 平均値の差に関す る仮説検定(3) 分散は等 しい と仮定せ ず,観 察値 から推 定す る場合
X,Y の分布 が正 規分 布 で表 わ され る
前提
ただ し,そ れ ぞれの標 準偏 差は観 察値 か ら推 定す る 「μX-μY=0」
仮説
が 真 な ら,
「T=(X-Y)/σX-Yに
つ い て
│T│<Tα で あ る」が ほ ぼ 確 実 しか る に│T│>Tα よ っ て,仮
帰結 事実 結論
だ っ た
説 を否 定 す る.
す な わ ち,「
μX-μY=0」
を否 定 す る
⑥ 例 を あ げ て お き ま し ょ う. 例5.6.1次
の デ ー タ は,20匹
普 通 の 餌 を 与 え,他
方 に は,血
の ラ ッ ト を10匹
ず つ の 2群 に わ け,一
液 中 の 赤 血 球 数 を 減 らす と考 え られ て い る薬 を混
入 し た餌 を 与 え た 場 合 の 血 液1mm3中
の 赤 血 球 数 で あ る.薬 の 効 果 を確 認 せ よ.
対照群 7.97
7.66
7.59
8.44
8.08
8.05
8.35
7.77
7.98
8.11
実験群 8.06
8.09
8.05
8.45
8.51
8.04
8.27
8.15
8.16
8.42
な お,2 群 の わ け 方 は,ラ
方には
ン ダ ム に な さ れ て い る も の と す る.
実 験 の 目 的 と さ れ る 条 件 を与 え る群 を実 験 群,そ
れ と比 較 す る た め の 群 を対 照
群 と よぶ. 解 答例
ま ず,観
察 値 に つ い て 平 均 値 μX,μYと 標 準 偏 差 σX2,σY2を表5.6.5の
よ うに 計 算 す る. 表5.6.5
例5.6.1の
た め の 計 算
μX=8.00,σX=0.27
μY=8.22,σY=0.18
こ れ に よ る と,σX2と
σY2が か な り ち が う よ う だ か ら,⑤
の 方 法 を 適 用 す る.
よ っ て,
σX-Y2=σX2+σY2=0.01074
を 使 っ て,X,Y
の 差 を 検 定 す る ため の 統 計 量
とな る.こ の T の 棄 却 限 界 を求 め る た め に,⑤
よ っ て,T
の 棄 却 限 界 は,自
由 度15.55に
T は
の 後 半 に 示 した 計 算 を行 な う.
対 応 す るt 分 布 表 か ら2.125と
求め ら
れ る. 観 察 値 に も とづ く T の 計 算 値 は こ れ を こ え て い な い か ら,平 均 値 に 差 が あ る とは い え な い. ⑦
別 の 例 を あ げ ま し ょ う. 例5.6.2
次 の デ ー タ は,10地
点 で そ れ ぞ れ 2種 の 稲 を栽 培 し て 収 穫 量 を 比
べ る実 験 を行 な っ た結 果 で あ る.こ れ に よ っ て,2 種 の 稲 の 収 穫 量 に 差 が あ る と い え る か.
稲 の種 類 A 7.97
7.66
7.59
8.44
8.08
8.05
8.35
7.77
7.98
8.15
稲 の種 類 B 8.06
8.09
8.05
8.45
8.51
8.04
8.27
8.15
8.16
8.42
◇ 注
栽 培 地 の 効 果 を 除 去 す る た め に 同 じ地 域 で そ れ ぞ れ 2つ の 稲 を 栽 培 して い る. まず,例5.6.1と
比べ て 「ど こが 同 じで ど こが ち が って い る か」を は っ き り把 握 す
るこ と.観 察 値 の数 値 は 同 じ(仮 想例)に して あ って も,異 な る意 味 を もつ もの に な っ てい るか ら,当 然,扱 い 方 はか え な くて は な りませ ん. こ の例 で の 観 察 値 の 求 め 方 が,「20地
点 を10地
点 ず つ の 2群 に わ け て,一
方 の 群 で種 類 A,他 方 の 群 で 種 類 B を 栽 培 し て い る 」と い う扱 い で は な い こ
表5.6.6
例5.6.2の
た め の 計 算
と に 注 意 す る こ と. 解 答 例 こ の例 で は,各
地 点 で の 2つ の 観 察 値 は 同 じ条 件 を も っ て い るの で,各
地 点 ご と に 得 ら れ た 2つ の デ ー タ の 差ZIに
つ い て,差ZIの
平 均 値 が 0か 否 か
を検 定 す る方 法 に よ る の が 妥 当 で あ る. し た が っ て,各
対 ご と にZ=Y-Xを
計 算 し,そ
の 平 均 値 と標 準 偏 差 を 計 算
す る. μZ=0.220,σZ2=0.0428 が 得 ら れ る.よ
っ て,仮
説 μ=0を
検 定 す るため の統 計量 は
と な る. T に 関 す る棄 却 限 界 は,自
由 度 9のt 分 布 の5%点2.25で
あ り,T
の 観 察値
は こ れ よ り大 きい. よ っ て,「 差 が 0で な い 」 とい う仮 説 は 否 定 さ れ る ◇ 注
この 問 題 で は,対 象 デ ー タ を求 め る と き に 条 件 X を もつ デー タ,条 件 Y を もつ
デー タ を 「 対 とな る よ うに 計 画 」して い る ため,「 各 対 ご とに 求め たX-Yの
平均 値 が 0」
とい う仮 説 を検 定 す る扱 い を採 用 しま した. これ を,仮 説 「 X,Y の平 均 値 の差 が 0」の 検 定 と して扱 うの は,観 察 値 の 構 造 を考 慮 に 入 れ て い な い こ とにな り ます.誤 っ た扱 い とい うべ きで す. ⑧ 観 察 値 の 求 め 方 を さ ら に か え た 例 を あ げ て お き ま し ょ う. 例 5.6.310地
点 で そ れ ぞ れ 4種 の 稲 を 栽 培 し た 結 果 が あ る.こ
れ に も とづ
い て稲 の 種 類 に よ る 差 お よ び 地 点 に よ る 差 を 調 べ よ.た
だ し,A
果 を示 す 稲,B
点 の 効 果 と種 類 の 効 果
地 点 で よ い 結 果 を示 す 稲 … の よ うに,地
地 点 で よ い結
の 間 に 交 互 作 用 が あ り う る こ と を考 え よ. こ の例 で は,例5.6.1あ
る い は 例5.6.2と
ち が っ て,2 つ 以 上 の 平 均 値 を 比 較 す る
形 に な っ て い ま す.し
た が っ て,こ
れ らの例 とちが った 扱 い を考 え る こ とが 必要 で
す. 4.6節 で 説 明 し た よ うに,K 組 ×N観 察 単 位 の デ ー タ に つ い て,平 均 値 に 差 が な い と し て 計 算 し た 全 分 散 と,各 組 ご と に別 々 の 平 均 値 を 使 っ て 計 算 した 級 内 分 散 を 計 算 し,分 散 を 比 較 す る 問 題 に お きか え て 扱 う の が 普 通 で す. ま た,デ
ー タ の 求 め 方 に 関 す る注 意 が 必 要 で す か ら,次 の 節 で 説 明 す る こ とに し ま
し ょ う.
5.7 実 験 計 画 ① 5.6節 で あ げ た 例5.6.1と
例5.6.2で
た.そ
う して,そ
は,た
い へ ん 重 要 な注 意 点 で す.こ
は,観
察 値 の 求 め 方 が ちが って い ま し
の こ とか ら,分 析 の 進 め 方 を か え る こ とに な り ま し た.こ の 節 で は,こ
のこ と
の 点 を 一 般 化 して,
デ ー タの 求 め 方(実 験 計 画)と 分 析 の 仕 方 の 関 係 を 説 明 し ま し ょ う. 「 実 験 計 画 」 とい う表 現 に つ い て は,す
で に 求 め ら れ て い る観 察 値 の 中 か ら,当
面
す る 問 題 を 考 え る た め に 使 うデ ー タ を 選 ぶ 場 合 も含 む も の と解 釈 し て く だ さ い.そ
の
意 味 で は,「 分 析 計 画 」 と表 現 して も よ い で し ょ う が,そ
の 場 合 も,「 観 察 値 が ど う い
う方 法 で 求 め られ て い る か 」 を考 慮 に 入 れ る こ とが 必 要 です. ② 観 察 値 を 求 め る に は, 観 察 単 位 ひ とつ ひ とつ に 「あ る 条 件 を対 応 づ け て 」観 察 し ます. 例5.6.1の
場 合 に つ い て は,次
図5.7.1
例5.6.1の
の よ うに して あ っ た の で す.
場 合 の 実 験 計 画(1 要 因 2水 準 配 置(1))
観 察 単 位 に 番 号 を つ け て あ り ます が,そ そ の 後 のN2個
の 番 号 順 に 「は じめ のN1個
に は 条 件 E を わ りあ て た 」 とい う こ と で は あ り ませ ん.観
果 に 影 響 す る こ とが あ りえ ます か ら,
に は 条 件 C, 察 順序 が結
ど の観 察 単 位 に C を わ りあ て,ど
の 観 察 単 位 に E をわ りあ て るか を
ラ ン ダ ム に 決 め て 観 察 し, 観 察 単位 番 号 は,観
察 後 に つ け か え た もの
と考 え て くだ さ い. 以 下 の 例 で は い ち い ち こ と わ りま せ ん が,こ こ の こ とか ら,観 察 値XIとYJを
の よ うに し て あ り ます.
比 べ る と き,
「わ り あ て られ た 条 件 の ち が い」以 外 の 点 は 条 件 が そ ろ っ て い る もの と仮 定 して よ い こ とに な り ます. ③ 実 験 目的 に 対 応 し て か え るべ き 条 件 を 「実 験 条 件 」 と よ び,そ 「 環 境 条 件 」 と よぶ こ とに し ま し ょ う.②
れ以 外 の条 件 を
で 述 べ た 実 験 計 画 は,
で き る だ け 環 境 条 件 が 同 一 に な る よ うに 観 察 単 位 を 選 ん で 実 験 条 件 を わ りつ け る の だ が, 環 境 条 件 が 全 く同 じ と は 限 ら な い の で,ラ
ンダムに 決め る
こ とに した もの で す. こ の よ うに,環
境 条 件 が 均 等 に な る よ う に(等 質 化)し た と して も残 る 条 件 の ち が
い が 結 果 に か た よ り を もた ら さ な い よ う に す る処 置 を, ラ ン ダ ミゼ ー シ ョ ン と よ び ます(く わ し くは,⑩ ④ 例5.6.2の
で 説 明 し ます).
場 合 の 実 験 計 画 を,図5.7.1と
同 様 に 図 示 して み ま し ょ う.
た だ し,実 験 の 仕 方 に 関 す る 説 明 に 注 意 し て,変 更 す べ き点 が あ り ま す. 図5.7.2
例5.6.2の
場 合 の実 験 計 画(1 要 因 2水 準 配 置(2))
この実験 計 画 では,観 察単位 大 区分 の ちが いは観 察結果 に影 響 を もた らす可 能性 が あるの で, 各 大 区分 ご と に, 実 験 条 件 C に つ い て の観 察 と E に つ い て の 観 察 を 対 に し て 行 な う. と い う 計 画 を採 用 し た の で す(こ の こ とか ら,観 察 単 位 数 に 関 し て はN1=N2と こ と に な り ます).
す る
図5.7.3
例5.6.3の
場合 の 実 験 計 画(2 要 因 組 み 合 わせ 配 置(1))
し た が っ て,
各 大 区分 ご とに 差 を とれ ば, 大 区 分 の ち が い に よ る影 響 を 消 去 し た形 で, 条 件 C と条 件 E の 比 較 が で き る
こ とに な り ま す. な お,小 区 分 に つ い て は,結 果 へ の影 響 が 小 さい とみ て い ます が,小 C,小 区 分 2に 条 件 E と機 械 的 に わ りつ け るの で は あ りませ ん . C か E か を ラ ン ダ ム に わ りつ け て 実 験 し た 後,番 5.6.1の
場 合 との ち が い は,各
⑤ 実 際 の 問 題 で は,条
大 区 分 ご と に,C,E
区 分 1に 条 件
号 を つ け な お し た の で す.例
を 1組 ず つ わ りつ け る こ と で す .
件 が 2区 分 とは 限 りませ ん.ま
た,ち
が っ た種 類 の 条 件 の
組 み 合 わ せ 区 分 を 想 定 して 比 べ た い こ とが あ り ます. そ う い う場 合 の 実 験 計 画 の 立 て 方 は 「実 験 計 画 法 」と して 論 じ ら れ て い ます. こ こ で は,2 系 統 の 条 件 を組 み 合 わせ る場 合 の 基 本 形 だ け を紹 介 して お き ま す. 2系 統 の 条 件 を,Al,A2,…,AK,お
よ び,B1,B2,…,BLと
同様 に 実 験 計 画 を 図 示 し た の が,図5.7.3で
し て,こ
れ まで の例 と
す.
こ の 計 画 に よ っ て 得 ら れ た 「平 均 値 の 比 較 」に よ っ て,2 系 統 の 要 因 A,B の 効 果
をみ るか わ りに, A の 効 果 をみ る た め に,A
の 区 分 別 平 均 値 を 基 準 と した 級 内分 散
B の 効 果 を み る た め に,B
の 区 分 別 平 均 値 を 基 準 と した 級 内 分 散
を 求 め て,「 全 分 散 」 と比 べ る 問 題 と お きか え て 扱 う こ とが で き ま す.す
な わ ち,5.1
節 の 方 法 を適 用 す る の で す. ◇ 注 図5.7.3で
は,種 々 の 平 均値 につ い て,た とえ ばXI0=ΣMIJ/NIの
よ うに 足 しあ げ
の 対象 と した添 字 を 0 とお きか え た 記号 を使 って い ます.す べ て の 添 字 に つ い て 足 しあ げ たX00=Σ
ΣXIJ/Nに つ い て は,X
⑥ 前 節 の 例5.6.3に
とか き ます.
お け る計 画 に よ っ て 次 の 観 察 値 が 得 られ て い る も の と して,
2つ の 要 因 A,B の 効 果 を分 析 し ま し ょ う.
表5.7.4
ま ず,こ
例5.6.3の
観 察 値XIJ
れ ま で の 例 と同 様 に,
全 体 で の 平 均X00そ
れ か らの 偏 差XIJ-X00と
偏 差 平 方 和ST
A の 区分 別 平 均X10そ
れ か らの 偏 差XIJ-XI0と
偏 差 平 方 和SW(A)
B の 区 分 別 平 均X0Jそ
れ か らの 偏 差XIJ-X0Jと
偏 差 平 方 和SW(B)
を 計 算 し ま す.計
算 過 程 と結 果 は,表5.7.5(a)お
よび 図5.7.5(b)の
とお り です.
こ こ で は,一 連 の 観 察 値 を 1列 に 並 べ た 表 形 式 の か わ り に,2 系 統 の 区 分 を 表 側 と 表 頭 に わ け て お い た 表 形 式 に 配 置 し て,偏 差 を配 置 して 示 し,そ れ らの 2乗 和 の 計 算 結 果 を表 の 下 部 に示 して い ま す. ◇ 注 分 散 の計 算 フォー ムは これ ま で とか えて あ ります.す な わ ち,
平均 値 は,基 礎 デ ー タの 表示 の 方 につ け加 え る.
分散 成 分 の計 算 表 は,そ れ ぞれ の成 分 ご とにわ け る.
平均 値 か らの偏 差 は 「 要 因 A に対 応す る行,B に 対 応 す る列 」に 配 置.
偏 差 平 方和 は,各 表 の枠 外 に示 す.
表5.7.5(a)
図5.7.5(b)
偏 差 平 方 和 の 計 算for例5.6.3
分 析 の フ ロ ーfor例5.6.3
表5.7.5(c)
分 散 分 析 表(4.7)節 の 形 式)
⑦ 計 算 結 果 を示 す フ ロ ー チ ャ ー トは,4.7節 果 を表4.7.4の
と同 じ(図4.7.2)で
す か ら,そ
の結
形 式 に ま とめ て み ま し ょ う(後 で 変 更 し ます).
表5.7.5(c)で
す.
こ の 例 の 場 合,A
で 区 分 し,そ れ を B で細 分 した 場 合,
各 細 区 分 と も観 察 値 数 が 1 と な っ て い る こ とに 注 意 し ま し ょ う.B で 区 分 し,そ れ を A で細 分 し た場 合 も同 じ で す . こ の こ とか ら,両 方 の 区 分 別 平 均 値 か ら の 偏 差 は す べ て 0に な り ます.こ ら,フ
ロー チ ャ ー トの 最 後 の 枠 の 数 字 は 0,す な わ ち,SX│AB=0と
こ の こ とに 注 意 して,以
の こ とか
な っ て い ま す.
下 の 説 明 を フ ォ ロ ー して くだ さ い.
◇ 注 この こ とに ともな って, SX×B│A=SX│A,SX×A│B=SX│B とな ります.左 辺 と右 辺 は,全 く意 味の 異 な る分 散 成分 で す が,SX│AB=0と
な って い るこ
とか ら,値 が 等 し くな った の です.い い か え る と,こ れ らは 「 特 別 の 場 合 に成 り立 つ 関 係 で す」か ら,混 乱 を避 け るた め に は,フ ロー チ ャー トの 形 式 に 対 応 づ け て 理 解 す る こ とが 必要 です. こ の 節 で は,仮
説 検 定 を 適 用 し よ う と考 え て い るの で す か ら,第
4章 の 形 式 の 分 散
分 析 表 を仮 説 検 定 用 の 形 式 に 書 き換 え て お き ま し ょ う. 分 散 を 「偏 差 平 方 和 を 自 由 度 で わ っ た 推 定 値 」 と し,検 定 の た め の F 比 を示 す 形 に す る の です. そ う お き か え よ う と し た 場 合,す
で に 注 意 し た 「SX│ABが 0に な っ て い る こ と」が
問 題 に な り ます. こ の 問 題 で は,表5.7.5(a)で 残 差 XIJ-XI0-X0J+X00 の 分 散 が17656と
計 算 さ れ て い ます が,4.7節
互 作 用 の 大 き さ」 と解 釈 す べ き 項 で す.要
で 説 明 し た とお り,こ れ は,本
来 「交
因 A の 効 果 と要 因 B の 効 果 は 除 去 さ れ て
お り,「 そ れ ら を除 去 した と き に 残 っ た 変 動 」で す が,要
因 A と要 因 B との 交 互 作 用
が 除 去 さ れ て い な い の で,2 つ の要 因 の 効 果 を除 去 した 残 差 に な っ て い る と は い え な い の で す.い
い か え る と,検 定 法 を,「 誤 差 の 評 価 値 とみ られ る 分 散 を 分 母 に と っ た
表5.7.5(d)
分 散 分 析 表for例5.6.3
F 比 の 分 母 は 交 互 作 用 の推 定 値 だ が,交 互 作 用 は 存 在 し な い と仮 定 す れ ば,こ
れ
を 誤 差 とみ な し て よ い … よ っ て,そ
れ
を,F
比 の 分 母 とす る.
分 散 比 を 使 う形 」に 組 み 立 て られ な い の です. しか し,こ の 問 題 の 実 験 計 画 で は,SX│ABの
見 積 も り を求 め ら れ ませ ん.
そ う い う計 画 を採 用 した の は, 「交 互 作 用 」は 存 在 しな い と想 定 して よ い と した た め で す.こ
の 想 定 を 入 れ れ ば,
そ れ 以 上 に 残 差 を分 析 で き な い こ とか ら, SX×A×Bを 「 誤 差 」 とみ な す こ とが で き ます. し た が っ て,SX×A×Bを
自 由 度 で わ っ た 値 を 誤 差 分 散 とみ な し て(交 互 作 用 に 対 応
す る 分 散 で な く)F 比 を 求 め る こ と とす る の で す. こ う考 え て 表5.7.5(c)を 以 上 か ら,要
書 き換 え た もの が,表5.7.5(d)で
す.
因 A,要 因 B と も に 有 意 だ と判 定 さ れ ま した.
こ こ で 例5.6.3に
つ い て ま とめ を して お き ま す.
例5.6.3の
実験 計画 の ポ イン ト
観 察 単 位 数 は40 これ に 要 因 A の 4区 分 ×Bの10区
分 を わ りあ て る
同 一 条 件 の 観 察 値 は 1組 ず つ 分
析 2要 因 の 交 互 作 用 は 存 在 し な い と仮 定 す れ ば A の 効 果,B
⑧
の 効 果 を検 定 で き る
交 互 作 用 が 存 在 す る場 合 に は,そ
そ の た め に は,そ
れ を推 定 す る こ とが 必 要 で す.
れ が で き る よ う に,観
察値 の求 め 方 … 実験 計 画 を たて てお き ま
条 件AIとBJの
組 み 合 わ せ に つ い て,そ
れ ぞ れ 2つ 以 上 の 観 察 値 を求 め て お け ば,
基 礎 デ ー タXIJKに
も とづ い て
す.
XIJK-XI00-X0J0+X000 を複 数 求 め られ ます か ら, XIJ0-XI00-X0J0+X000の XIJK-XIJ0の を そ れ ぞ れ 推 定 で き ます.す
平 方 和 と して 交 互 作 用 平 方 和 と して 誤 差 の 大 き さ な わ ち,
交 互 作 用 と,そ れ を 考 慮 に 入 れ た 残 差 を分 離 で き る こ とに な りま す. ⑨
例5.7.1例5.6.3に そ の た め に,要
つ い て 2要 因 の 交 互 作 用 を 検 出 で き る よ うに し た い,
因 B の 区 分 数 を 5に 減 ら して,A
の 4区 分 ×Bの
5区 分 の 組 み
合 わ せ を そ れ ぞ れ 2回 ず つ 観 察 値 を求 め る もの と し て 次 の 結 果 を得 た.こ とづ い て,要
因 A の効 果,要
因 B の効 果,交
表5.7.6
例5.7.1の
例5.7.1の
れに も
互 作 用 の 有 意 性 を検 定 せ よ.
観 察 値XIJK
実験 計画 の ポイ ン ト
観 察 単 位 数 は40 こ れ に 要 因 A の 4区 分 ×Bの
5区 分 を
そ れ ぞ れ 1組 ず つ わ りあ て る 分
析 A の効 果,B
の 効 果 を検 定 で き る
2要 因 の 交 互 作 用 が 存 在 す る場 合 そ れ も検 定 で き る ⑩
こ の 例 の 計 算 手 順 と 結 果 は,次
の 表5.7.7(a),図5.7.7(b)お
よ び 表5.7.7
(c)に 示 して あ り ます. 分 析 手 順 の フ ロ ー を 示 す 図5.7.7(b)を
図5.7.5(b)と
対 照 し て,検
定 のた めに 使 う
F 比 の 分 母 が か わ っ た理 由 を 把 握 し て くだ さ い. 表5.7.7(a)で
は,表5.7.5(a)の
の 平 方 和 を 計 算 し て い ま す.交 は.こ
こ で 計 算 せ ず,他
場 合 に 交 互 作 用 を計 算 し た と こ ろ で,XIJK-XIJ0 互 作 用,す
な わ ちXIJK-XI00-X0J0+X000の
平方和
の 項 の 計 算 結 果 か ら 差 し 引 き 計 算 で 求 め て い ます(表5.7.7
(c)). こ の 例 の 場 合 2つ の 要 因 の効 果 と と も に,そ
れ ら の 交 互 作 用 の 大 き さSX×A×Bが 計
表5.7.7(a)
図5.7.7(b)
偏 差 平 方 和 の 計 算for例5.7.1
分 析 の フ ロ ーfor例5.7.1
表5.7.7(c)
測 され て い ます.い
い か え る と,残
評 価 値 」に な っ て い ま す.し 表5.7.7(c)に
分 散 分 析 表for例5.7.1
差SX│ABは
た が っ て,表
交 互 作 用 の 影 響 も除 去 さ れ た 「誤 差 の
の よ う に F 値 を 計 算 す る こ とに な り ます.
示 す よ う に,「 結 果 と して は,交
互 作 用 は 有 意 で は な か っ た 」の で す
が,「 存 在 す れ ば検 出 で き る分 析 方 法 を適 用 し て 検 出 で き な か っ た」の で す か ら,「 存 在 し て も検 出 で き な い 分 析 方 法 を適 用 して 検 出 で き な か っ た 」こ と と は,ち が い ま す.
5.8 実 験 計 画 にお け る 3 条 件 ①
こ こ で,こ
れ ま で の 節 で取 り上 げ た い くつ か の 実 験 計 画 に 関 して,ま
とめの 説
明 を し ま し ょ う. Fisherの ②
3条 件 と よば れ て い る 「基 本 原 則 」で す.
例5.6.で
も例5.7.1で
も,要
因 A の 効 果 を 推 定 す る た め に 使 え る観 察 値 が
複 数 あ り,要 因 B の 効 果 を推 定 す る た め に 使 え る観 察 値 が 複 数 あ り ま す. こ れ に 対 して,交 例5.6.3で
互 作 用 に つ い て は,例5.7.1の
場 合 複 数 の観 察 値 を使 え ます が,
は 「同 じ条 件 下 で の 観 察 値 が 1つ しか な い た め に」推 定 で き ませ ん.
した が っ て,要
因 の 効 果 を検 定 す る た め に は
同 一 条 件 下 で の観 察 値 を複 数 求 め て お く こ とが 必 要(条 件 1) で す.こ
れ が,実
験 計 画 に お い て,考
慮 に 入 れ る べ き条 件 の ひ とつ で す.
各 条 件 に 対 応 す る く りか え し数 は,例5.7.1で こ れ は,F
は 同 数 に し て あ り ます.
検 定 を適 用 す る た め に 必 要 と さ れ る 前 提 で す が,も
う一 歩 進 め る と,
「 観 察 単 位 数 が 不 ぞ ろ い だ と,観 察 値 そ の もの で の 差 と,観 察 値 数 の 差 に よ る影 響 が 分 離 で き な い 」た め で す. し た が っ て,同 ◇ 注3.5節
一 条 件 下 で の観 察 値 の 数 は そ ろ え て お く方 が よ い の で す.
の分 析 で は,観 察値 を求 め た 後 に,そ の値 を参 照 して要 因 A,要 因 B を 区 分
け し ま した.こ の た め,各 組 み合 わせ 区 分 に 属 す る観 察 値 数 は 同数 とな る とは 限 りませ ん.こ の ち が い が あ る ため,3.5節
の 分 散 分析 表 で は,決 定 係 数 に よ る評 価 に と どめ,F
検 定 まで は進 まない の です. 別 の 言 い方 をす る と,こ の 節 の手 法 で は,想 定 され た区 分 につ いて そ の効 果 を判 定 す る こ と を問 題 に して い る のだ か ら,分 析 の過 程 に入 る前 に定 め て お か ね ば な らな い の です. 区 分 の仕 方 を見 出す こ とを分析 の 目的 とす る場 合 とち が う こ とに注 意 しま し ょ う.
③
ま た,観
察 値 は,ど
の 要 因 が わ り あ て られ た も の も,同 一 条 件(わ
た 要 因 の ち が い 以 外 の 条 件)下 で 求 め るべ き です.こ しか し,実 際 の 観 察 で は,そ 使 う材 料,方
法,実
れ は,当
りあ て られ
然 の こ と で す(条 件 2).
れ を ど こ まで 実 現 で き るか が 問 題 に な りま す.実
験に
験 実 施 の 環 境 な ど,大 小 は と もか く,種 々 の 条 件 が 影 響 して き ま
す. 実 験 に あ た っ て は,で
き る だ け これ らの 条 件 を一 定 に た もつ よ うに し ま す.
そ の よ う に し て も残 っ て い る細 か い相 違 に つ い て は,ラ
ン ダ ム に 選 ぶ こ とに よ っ て
結 果 に 対 す る か た よ っ た 影 響 を 避 け る(条 件 3)… こ れ が,基 こ れ らが,②
に あ げ た 条 件 1と合 わ せ て,Fisherの
本 的 な 考 え 方 で す.
3条 件 と よ ば れ て い ま す.
実 験 計 画 に お い て 考 慮 す べ き 3条 件 1.く
りか え し
要 因 の 効 果 を検 定 す るた め に は 同 一 条 件 下 で の 観 察 値 を複 数 求 め て お く こ とが 必 要. 2.局
所 管理 可 能 な 限 り条 件 を そ ろ え て 観 察 す る.
3.ラ
ン ダ ミゼ ー シ ョ ン
制 御 で き な い 差 異 が か た よ り を もた ら さ な い よ う観 察 対 象
に対 す る実 験 条 件 の わ りあ て を 「ラ ン ダ ム 」に 行 な う.
「 局 所 管理 」に も限 度 が あ り ます か ら,「 ラ ン ダ ミゼ ー シ ョン 」が 必 要 で す.し
か し,
「ラ ン ダ ミゼ ー シ ョ ン」に よ っ て か た よ り をお さ え られ る に し て も,実 際 の 観 察 値 は, か た よ っ た 結 果 に な るの で,観
察 値 の 数 を 増 や す こ と が 必 要 で す.し
し」を 増 や す こ とに よ っ て,「 局 所 管 理 」が 難 し くな る.だ ン 」を適 用 す る …
とい う形 で,3 条 件 を 同 時 に考 慮 して 「 実 験 を計 画 す る」の で す .
④ 観 察 値 を求 め た 後 の 処 理 手 順 は,実 と,実 験 計 画 は,観
か し 「く りか え
か ら,「 ラ ン ダ ミゼ ー シ ョ
験 計 画 に よ っ て 決 ま り ま す.い
察 値 の 求 め 方 を決 め る と と もに,観
いか える
察 結 果 の 処 理 手 順 も決 め る の
です. 「実 験 の 計 画 に 問 題 が あ っ た 」 と後 で 気 づ くこ とが あ る で し ょ う.そ
の 場 合 に,臨
機 応 変 に 扱 い 方 を考 え る こ と は 「避 け るべ き こ と」で す . 「分 析 の過 程 に 入 っ て か ら,判 断 を入 れ る こ と を避 け る 」,す な わ ち,す
べ て を客 観
的 な 手 順 で 進 行 させ る と い う趣 旨 で す. 「観 察 結 果 に も とづ く判 断 を一 切 入 れ る な 」 と ま で は い い ませ ん が,「 や む を え な い 場 合 に 限 っ て 認 め られ る」扱 い だ と心 得 ま し ょ う.乱 用 す る と … た と え ば,自 都 合 の よ い観 察 結 果 を選 ん で 説 明 を組 み 立 て る … こ れ で は,実
説に
証 した こ とに は な り
ませ ん. そ こ ま で は し な くて も,「 結 果 を み て 分 析 方 法 を決 め る 」 と,こ り ます か ら,注 意 せ よ と い うこ と で す.
うな る可 能性 が あ
こ う い う こ とに き び し い 問 題 分 野 で は,実 性 を重 ん じ る た め に,次
験 の 仕 方 と そ の 結 果 の 分 析 に お け る客 観
の よ うな 処 置 が 要 求 され ます.
実 験 と分 析 の 手 順 を あ らか じめ は っ き り決 め て, 「計 画 書 」(プ ロ ト コー ル)を 用 意 して お き, そ れ か ら外 れ た こ とは し な い …
「こ う だ っ た ら こ うす る 」と い う形 の 処 理 も, 計 画 書 に 用 意 して あ っ た 範 囲 に 限 る.
た と えば 薬 品 の効 果 を確 か め る た め の 実 験 で は,こ
の こ とが き び し く要 求 さ れ て い
ます. ⑤
ま た,た
と えば 薬 の 効 果 を 判 定 す る た め に は,薬
そ の もの の 効 果 に よ っ て 治 癒
した 場 合 と,自 然 に 治 癒 し た 場 合 な ど を 識 別 し な け れ ば な ら な い の で,実 験 対 象 者 を 2群 に わ け,一
方 の 群 に は そ の 薬 を投 与 し(実 験 群 と よ ぶ),他
方の群 には そ れ を投 与
しな い(対 照 群 と よ ぶ)状 態 に して 経 過 を観 察 し比 較 し ま す. こ の 場 合,観
察 対 象 者 に は 自分 が ど ち らの ケ ー ス か を知 らせ な い,観
相 手 が ど ち らの ケ ー スか を知 らせ な い … こ うい う状 態 に して,経
察実 施 者に も
過 を観察 す る措 置
を 「ブ ラ イ ン ド化 」 と よ ん で い ま す.「 実 験 群 す な わ ち 効 果 が 認 め られ る は ず,対
照群
す な わ ち効 果 は 認 め られ な い は ず 」 とい う予 断 に 影 響 さ れ な い よ う に す る た め の 措 置 で す.
ブ ラ イ ン ド化
実 験 の 目的 か ら条 件 を か え る場 合 に も そ の ち が い を 秘 匿 す る 形 で観 察 を進 め る. ⑥ 3.5節 の 分 析 で は,結
果 をみ て 分 析 を 進 め る形 式 を採 用 して い る た め 客 観 性 に
欠 け る とい う批 判 が あ り そ う で す が,観
察 値 の もつ 「情 報 を客 観 的 に 拾 い 出 す 」 と い
う原 理(パ ー シ モ ニ イ)に も とづ い て 分 析 手 法 が 組 み 立 て ら れ て い る の で す. こ の 原 理 に も とづ く分 析 手 法 を 「探 索 的 デ ー タ解 析 」と よ ん で い ま す. こ れ に 対 して,こ
の 章 の 分 析 手 法 は,想
定 され た 仮 説 の 検 証 を 目的 とす る場 合 に あ
た り ます か ら,「 検 証 的 デ ー タ解 析 」と よば れ ます. あ らか じめ 計 画 を た て て 観 察 値 を 求 め る 「実 験 」が 可 能 な分 野 で は,探 解 析 の 考 え 方 を採 用 す べ き で す が,利 野 で は,検
索的 デー タ
用 で き る情 報 の 範 囲 で考 え ざ る を え な い 問 題 分
証 的 デ ー タ解 析 の 考 え 方 を採 用 す る こ と に な りま す.
一 般 に は,ま
ず 現 実 を把 握 し,現 実 を 説 明 す る仮 説 を 立 て て,次
否 を検 証 す る と い う運 び 方 で す か ら,探 け る の で す.
に,そ
の仮 説の 当
索 的 手 法 と検 証 的 手 法 を場 面 に 応 じて 使 い わ
探 索 の場面 と検証 の場 面 を区別 す る
◇ 注
デー タの求 め方 も分析 の仕 方 も
場 面に よって使 いわけ るこ とが 必要
探 索 的 デ ー タ 解 析,検
confirmatory
data
analysisと
証 的 デ ー タ解 析 は,そ よ ば れ て い ま す.EDA,
れ ぞ れexploratory CDAが
data
analysis,
そ れ ぞ れの 略称 です .
偏 差,残 差,誤 差 こ れ らの 用 語 は,そ
れ ぞ れ や や ち が っ た ニ ュ ア ン ス で 使 わ れ て い ます.
あ る 基 準 値 か らの 差 を 「偏 差 」 と了 解 し ま し ょ う.「 標 準 偏 差 」の 偏 差 は,こ
う
い う意 味 で す. 基 準 は,デ
ー タ の 変 動 を 説 明 す る た め に 想 定 さ れ,計
想 定 さ れ た 基 準 の 有 効 性 を 計 測 す る た め に,基
測 され ま す.そ
う し て,
準 値 か ら の 差 を み る 場 面 で は,
「基 準 で 説 明 され ず に 残 っ た部 分 」 とい う意 味 で 「残 差 」 と い う呼 び 方 を し ます. 基 準 の 選 び 方 を含 め て考 え る場 面 で の 用 語 で す. 「 誤 差 」と い う用 語 は,実 い う 意 味 で 使 わ れ ます が,制
験 あ るい は観察 に お いて 制御 の 限 界 を こ え る変動 と 御 し きれ ず に残 っ た変 動 す な わ ち 残 差 と 了 解 して よ
い で し ょ う.統 計 手 法 の 組 み 立 て で は,残 差 と誤 差 を使 い わ け す る 必 要 は あ りま せ ん が,仮
説 検 定 の 場 面 で は,「 種 々 の 基 準 に 対 応 す る 残 差 の う ち,最
の 」,す な わ ち,こ
小の も
れ 以 上 は 減 ら し よ うの な い状 態 に な っ た もの を 「誤 差 変 動 」と
み なす と い う形 で 使 い わ け し ます.
問題 5
問 l (1) 5.1∼5.3節
の 例 示 で は,食
費 支 出 X の 変 動 要 因 と し て 世 帯 人 員A
と収
入 B を そ れ ぞ れ 3区 分 し,3 区分 間 の 差 を み る 形 で そ れ ぞ れ の 有 意 性 を 判 定 し た が,分
析 を精 密 化 す る た め に,(a)A
を 4区分 に す る 案,(b)B
を 4区 分 に
す る 案 の い ず れ か 一 方 を 取 り上 げ て,表5.1.2,表5.1.4,表5.2.3,表5.2.4, 表5.2.5を
改 め よ.
(2) A の 効 果 を み る た め の F 比 が 3 と お り(表5.1.2,表5.2.3,表5.2.4) あ る が,そ
れ ぞ れ の 意 味 の ち が い を 説 明 せ よ.
プ ロ グ ラ ムTESTH6を
使 う こ と.こ の 問 題 用 の デ ー タが 例 示 用 と し て 用 意 さ
れ て い る. 問 2 12人 の被 験 者 に 対 して 1週 間 の ダ イ エ ッ ト処 方 を適 用 し た 結 果,次
の体 重 減
少 (ポ ン ド)が 観 察 され た. 3.0
1.4
0.2
-1.2
(1) こ の 結 果 に よ っ て,体
5.3
1.7
3.7
5.9
0.2
3.6 3.7
2.0
重 減 少 が 達 成 さ れ た とい え るか.
(2) 1ポ ン ド以 上 の 体 重 減 少 が 達 成 さ れ た とい え るか. 注:仮 説 検 定法 に関 す る説 明お よび適 用 の た め にプ ロ グラムTESTH1∼TESTH3が 用 意 され て い ます.こ の 問題 では,ま ず,TESTH1を
使 ってみ ま し ょ う.
どの プ ロ グ ラ ム で も,「説 明 を表示 しな が ら進 行 させ ます か」 と表 示 され ます か ら,H
と入 力 して くだ さい.ひ と とお り説 明 が終 わ った ら,使 い方 に応 じて指 定 す
る箇所 が あ ります か ら,そ れ に応 じて入 力 して い くと,計 算 が進 行 し結 果 が 表示 さ れ ます. 問 3 プ ロ グ ラ ムTESTH2,TESTH3も
同様 に 使 え る が,適
ど れ を 使 うか を選 択 す る こ と が 必 要 と な る.そ み,各
プ ロ グ ラ ム の ち が い を 把 握 せ よ.ま
用 す る 場 面 に 応 じ て,
れ ぞれ の プ ログ ラ ム の説 明 を よ
た,5.5節,5.7節
の例 示 につ いて 計
算 で き る こ と を確 認 せ よ. 注:問
3∼問 6で は,ど の プ ロ グ ラム を使 うか を示 し ませ ん か ら,問 題 ご とに 判 断 し
て くだ さ い. 問 4 次 は,あ
る60歳
の 男 性 に つ い て,毎
圧 を 調 べ た 結 果 で あ る. 表5.A.1
日 の 起 床 時 の 血 圧 と,同
じ 日の 夕 刻 の 血
(1) こ れ に よ っ て,起
床 時 と 夕 刻 の 血 圧 に 差 が あ る とい え るか.
同 じ 日に つ い て 起 床 時 の値 と夕 刻 の 値 が 対 に な っ て い る が,そ
の こ と を考 慮 に 入
れ て 例5.6.2の
扱 い をす るか を考
扱 い を す るか,そ
の こ と を考 慮 せ ず 例5.6.1の
え よ. (2) 例5.6.1の
扱 い を し た理 由 ま た は 例5.6.2の
問 5 夏 休 み に 補 習 授 業 を行 な い,そ
扱 い を した 理 由 を 説 明 せ よ.
の 前 後 の 成 績 を 比 べ た結 果 が 次 の 表 で あ る. 表5.A.2
(1) こ れ に よ っ て,補
習 授 業 の 効 果 が あ っ た と い え る か.な
お,補
習前 後 の
問 題 の 難 易 は ほ ぼ 同 じ とい え る もの とす る. (2) 補 習 前 の 成 績 が 下 位 の もの 7人 に つ い て み る と ど うか. (3) 補 習 前 の 成 績 が 上 位 の もの 7人 に つ い て み る と ど うか. (4) 補 習 が 「下 位 の もの を 引 き上 げ る こ と 」が 目的 だ と い う こ と を考 慮 に 入 れ る と(1)(2)(3)を
通 じて ど う い う結 論 を下 す べ きか.
問 6 5.7節 の 例 示(表5.7.4,表5.7.6)に
つ い て は,プ
ロ グ ラ ムTESTH5に
て 計 算 で き る こ と を確 認 せ よ.そ の た め に 必 要 な デ ー タは,例
よっ
示 用 として用意 さ
れ て い る. 注:以 下 の 問 いで は,プ ロ グ ラムTESTH6を
使 い ます が,そ の ため に は,仮 説 検 定
に よ って対 比す る区分 を表 わす 変数 をデ ー タ本 体 と と もに 記録 した デー タセ ッ トを 用 意 して お き ます.た とえ ば,問 7につ い ては デ ー タ フ ァイ ルTESTH_Q7を して くだ さい. 問 7 表5.A.3は,米
の 品種 4種 の 収 穫 量 を,
表5.A.3
ラ ン ダ ム に 選 ん だ 4つ の 圃 場 を使 っ て 調 べ た 結 果 で あ る. こ れ に よ っ て,品
種 に よ る差 の 有 無 を検
定 せ よ. 問 8 4 と お りの 加 工 法 に よ る製 品 の 強 度 を比 較 す る た め,そ て,表5.A.4の
れ ぞ れ 4回 の 実 験 を行 な っ 結 果 を得 た.
こ れ に よ っ て,「 加 工 法 に よ る 差 」が 認 め ら れ る か. な お,実
験 に 用 い る材 料 は,同
じ種 類 の
も の を ラ ン ダ ム に 選 ん で い る も の と す る. ま た,実 験 の 実 施 順 は,結 と仮 定 で き る もの とす る.
果 に影響 しない
表5.A.4
参照
問 9 問 8の 実 験 に お い て,実
験 の 実 施 順 が 影 響 す る と い う指 摘 が あ っ た.こ
の指摘
に 答 え る た め に,「 加 工 法 に よ る差 」 と と もに 「実 施 順 に よ る差 」の 有 無 を 検 定 せ よ.な
お,「 加 工 法 と実 施 順 の 交 互 作 用 は な い 」 と仮 定 で き る もの とす る.
問10 問 9に お い て 「交 互 作 用 な し」 と い う仮 定 を受 け 入 れ に く い の で,実
施 順 に関
して,1 回 目 と 2回 目 の 差,3 回 目 と 4回 目 の 差,5 回 目 と 6回 目 の 差 は な い と み な す と,「 加 工 法 4区 分 」,「実 施 順 3区 分 」,「同 じ条 件 で の く りか え し 2 回」 の 実 験 結 果 と し て 扱 う こ と が で き る.こ
う して,「 加 工 法 に よ る差 」,「実 施 順 に
よ る 差 」,「交 互 作 用 」の 有 無 を検 定 せ よ. 問11 問 8の実 験 計 画 に お い て,表5.A.5の
よ うに 材 料 の 種 類C1,C2を
わ りつ け て
あ っ た も の とす る. こ れ に よ っ て,「 加 工 法 に よ る差 」,「材 料 に よ る差 」,「両 者 の 交 互 作 用 の 有 無 」 を検 定 せ よ.
表5.A.5
ヒン ト:基 礎 デ ー タ を A と Cの 組 み合 わせ 表 の形 に 書 き換 えた上,計 算 す れ ば よ い. 問12 問11に
お い て 実 験 の 実 施 順 は 結 果 に 影 響 しな い も の と仮 定 し た が,小
響 が あ り う る場 合 を考 え て,材
料 の わ りつ け 方 を改 め よ.
ま た,そ れ に と もな っ て,TESTH6を を問12用 問13オ
さい影
使 う ため の デ ー タ フ ァ イルTESTH_Q11
に 改 め よ.
ー ブ ン で 肉 を ロ ー ス トす る た め の 所 要 時 間 X を,次
の 2種 の 条 件 の 組 み 合
わ せ 6 と お りに つ い て 比 較 す る実 験 を行 な っ た. X に 対 す る A,B の 効 果 を 分 析 せ よ. 表5.A.6実
験 条件 の わ りあ て
A1:オ A2:プ
ー ブ ン を プ リ ヒ ー トす る リ ヒー トし な い
B1:生
肉
B2:冷
凍 肉
B3:12時
間 解 凍
B4:24時
間 解 凍
表5.A.7
実 験 結 果for要
因A1
表5.A.8
実 験 結 果for要
因A2
問14 仮 説 検 定 の論 理 に お け る 「前 提 」 と 「仮 説 」の ちが い を 説 明 せ よ. 問15 仮 説 検 定 の論 理 に お い て 「 有 意 差 あ り」 と い う語 を 使 い,「 差 あ り」 と い う語 を 使 わ な い理 由 を説 明せ よ. 問16 仮 説 検 定 に お い て 「 有 意 差 あ り」と 判 定 す る基 準 と し て 統 計 量 の 分 布 の5%点 を使 う こ とが 多 い が,こ
れ に 対 して 「1%点 を 使 う と,よ
り精 密 な 検 定 を行 な っ
た こ と に な る」 と い う言 い 方 は 正 し いか. 正 し い あ る い は 正 し くな い とす る理 由 も,簡
明 に述 べ よ.
問17 仮 説 検 定 を適 用 す る た め の 観 察 値 の 求 め 方 に 関 して, (1)「 ラ ン ダ ミゼ ー シ ョ ン」 が 必 要 と さ れ る理 由 を説 明 せ よ. (2)「 局 所 管 理 」が 必 要 と さ れ る理 由 を 説 明 せ よ. (3)「
く りか え し」 が 必 要 と さ れ る理 由 を説 明 せ よ.
問18 観 察 値 X の 平 均 値 μ に つ い て μ=μ0ま た は μ=μ1の い ず れ か で あ る と想 定 で き る もの とす る.こ
の場合 につ い て P(X<C)=α,P(X>C)=β
を み た す よ う に C お よ び 観 察 値 数 N を 定 め う る こ と を 示 せ.た 布 に つ い て 正 規 分 布N(μ,σ)を 注:こ の場合 は,μ=μ0か
想 定 で き る もの とす る.ま
だ し,X
の分
た,σ は 既 知 とす る.
μ=μ1か を判別 す る問題 として の扱 いに な る.
6混 同要 因へ の対 処
2つ の要 因A,B の 関係 を み よ うと し てい るの だが,デ ー タの上 で はA ,B に第 三 の要 因 C が 関与 して い る た めA,B の 関 係 が 適正 に把 握 で きない … そ うい うと き には,A,B
の 関 係 の 有 意 性 を検 定 した り,説 明
しよ う とす る前 に,ま ず,C の 効 果 を補 正 す る こ とが 必要 で す.こ の 章 で は,そ の た め の方 法 を説 明 しま す.
6.1 混 同要 因 へ の 対 処 ① こ の 章 で は,次
の よ うな問題 を扱 い
表6.1.1
3社 の 給 与 水 準 比 較
ます. 「右 の 表 に よ っ て,甲
社 と乙社 の
給 与 水 準 を比 較 せ よ」 甲社 ・乙 社 の 比 較 だ か ら,そ れ ぞ れ の 社 全 体 の 数 字 す な わ ち26.4,28.3に
注 目 し,
「乙 社 の 方 が 高 い 」と い っ て よ い で し ょ う か.
丙 社 の 数 字 につ い て は 後 述.ミ
問 題 点 を 明 らか に す る ため に,も
う少 し
ス プ リン トで は
あ りませ ん.
つ け 加 え ま し ょ う. 年 齢 区 分 別 に わ け た 数 字 の 方 をみ る と,ど の 年 齢 で も 「甲 社 の 方 が 高 い 」 と い う結 果 に な っ て い ます. 「全 体 で み る と 乙 社 が 高 く,各 区 分 で み る と 甲社 が 高 い 」 と な っ て い る こ と に 注 目 して くだ さ い.こ
の 「一 見 矛 盾 した 結 果 」を ど う理 解 す れ ば よ い の で し ょ うか.
も し年 齢 別 の 数 字 が 集 計 さ れ て い な か っ た とす れ ば,「 乙 社 の 方 が 高 い と い う結 論 が 疑 念 を もた れ る こ と な く信 じ ら れ て し ま う」で し ょ う. そ れ で よ い で し ょ うか.
② 問 題 点
こ の 表 に は 表 示 し て あ り ませ ん が,両
な っ て い る の か を確 認 す る こ とが 必 要 で す.も
社 の従業 者 の年 齢構 成が ど う
し,乙 社 の 年 齢 構 成 が 甲社 と比 べ て 高
くな っ て い た とす れ ば, 高 齢 者(給 与 の 高 い 階 層)が 多 い と い う理 由 で, 同 じ年 齢 層 ど う し を比 べ る と 甲社 の 方 が 高 くて も 全 体 で み た平 均 の 数 字 は,乙
社 の 方 が 高 くな る.
こ う い う こ とが あ りえ ます. 例 示 の 表 の 場 合,両
よ う に な っ て い ま す.こ 6.1.1の
表6.1.2
社 の年 齢構 成 は右 の
3社 の年 齢 構 成
の こ と か ら,表
よ う な 数 字 が 出 て き た の で す.
念 の た め 次 の 計 算 を実 行 して,全
体 でみ
た 平 均 値 が 年 齢 別 の 数 字 の 平 均 値(こ こ で は 年 齢 別 人 数 を考 慮 に 入 れ た 加 重 平 均 値) と し て 求 め ら れ る こ と を確 認 し て く だ さ い.
甲 社:
15.0×40+24.0×20+32.0×20+…=26.4
乙社:
14.2×25+22.2×25+30.0×20+…=28.3
この種 の統 計表 では,全 体 でみ た平均 値 は,内 訳 区分 でみ た値 の単純 な平 均値 に は なって いな いのが普 通 です.す なわ ち
と な っ て い な い の で す. こ の 場 合,甲
社 ・乙 社 の 給 与 の 平 均 値 比 較 を,「 年 齢 別 構 成 の ち が い 」が ゆ が め て い
る わ け で す. ③ こ う い う事 態 は こ の例 に 限 ら ず,よ
くみ ら れ ま す.し
た が っ て,こ
う い う 「ゆ
が み 」を 避 け る 方 法 を 一 般 化 し て 考 え る こ と と しま し ょ う.
比 較 した い 指 標 を X(例 示 で は 給 与 水 準),
比 較 し よ う と す る 区 分 をA1,A2,…
( 例 で は 甲社 ・乙社 )
と し ま し ょ う. "分 析 の 目 的"は,X しか し,X
とA の 関 係 で す.
の 大 小 に 影 響 を も た らす 他 の 要 因 C(例 で は 年 齢)が あ っ て,こ
に 関 し てA1,A2,…
が 等 質 と は い え な い 場 合,X
の 差 は,A
に よ る も の か,C
の要 因 によ
る もの か 判 別 で き ませ ん. こ うい う場 合,C
を 混 同要 因 と よ び ま す.分
析 の 目的 が X とA の 関 係 で あ り,C
は 目的 外 で あ っ て も,そ れ が 重 な っ て 観 察 さ れ る が ゆ え に,"分 を考 慮 に 入 れ な け れ ば な ら な い の で す.
析 手 順 と し て"は,C
被 説明変 数 X の値 の変動 に対 し
⇒ こ れ が 目的
説明 要 因 Aが ど う効 くか を計測 混同要 因 Cも重 なって い る とき C を 無 視 す る と,そ せ ませ ん.な
の 効 果 がA⇒Xの
⇒ こ こ まで含め て分析
効 果 の 中 に 混 じ り こ み,正
ん らか の 対 応 策 が 必 要 で す.④
しい結 論 が 出
以 降 で い くつ か の対 応 策 を説 明 し ま
す. ◇ 注 表6.1.1の 例 示 にお け る丙社 は,ど の 年齢 層 でみ て も甲社 と同 じ給 与水 準 に な って い ま す.し か し,表6.1.2に 示 す よ うに 年 齢 構 成 が 異 な る た め ,全 体 で み る と,26.4, 30.0と ちが っ た数字 に なっ て い ます.
つ ま り,「差 が な いの に差 が つ く られ た 」結 果 に な って い るの で す.
④
混 同 要 因 へ の 対 処 法―
1:区 分 け
混 同 要 因へ の 対 処 の仕 方 に は,2 つ の 方 向 が あ り ます. 第一は 年 齢 構 成 が 異 な るか ら 比 較 で き な い な ら 年 齢 区 分 別 に わ け た 数 字 を使 え(わ け て い な い 数 字 は 使 う な) とい う考 え 方 で す.一 般 化 して い う と,次 の よ うに せ よ と い う こ と で す .
混 同要 因へ の対応― 1 混同要 因 に注 目して,比 較 対 象 を細 区分 して 各細 区分 ご とに比較 す る. こ れ が,基
本 的 な考 え 方 で す.
こ の 方 針 で 分 析 す る に は,A
の 各 区 分 を,C
A の 効 果 を み る ス テ ップ を,C
で 区 分 け した デ ー タ を使 い ま す.
の各 区分 ご とに わけ て適 用 す るこ とに な りますか
ら, C の 構 成 比 が A の 各 区 分 で 異 な る と して も, そ れ は,比
較 に関与 しない
こ と とな り ます. A と C の 組 み 合 わ せ 区 分 別 に X の 情 報 が 得 ら れ る な ら ば,こ い で す. 冒 頭 に あ げ た 例 で は,甲 社 の 方 が 高 い とい っ て よ い の で す.年
れ が 最 も簡 明 な 扱
齢 構 成 の ちが い の 影
響 を受 け て い る 「 全 体 で み た 数 字 」は無 視 して よ い の で す .誤 解 の 因 に な るか ら,「 全 体 で み た 数 字 は 表 示 す る な」 と い う意 見 も 出 る で し ょ う. ⑤ た だ し,こ つ た め に は,多
の 方 法 で は デ ー タ を 2つ の 要 因 に よ っ て 細 分 す る た め,精
度 をた も
くの デ ー タ を要 す る こ とに な りま す .
デ ー タ数 が 少 な い と き に は,細
分 す る こ とに よ っ て 「推 定 値 の ゆ が み を補 正 す る こ
と」 と,「 各 区 分 で の 評 価 値 の 精 度 を た もつ こ と」 とが トレ ー ドオ フ の 関 係 に な りま す
か ら,別 の 対 処 法(6.3節
で 説 明)を 考 え ね ば な ら な い の です.
◇ 注 「ゆ がみ 」とい う コ トバ を 「か た よ り」とちが う意 味 で 使 っ て い ます.か た よ り とお きか え て も意 味 が通 じます が,か た よ り とい う語 は,観 察値 と期 待 値(同 じ条 件 で く りか え し観 察 した ときに期 待 され る平均 値)と の差 と定 義 され て い ます.こ こ で い う 「ゆ が み 」 は,差 を もた らす 要 因 が存 在 して い る の に,そ れ に 気づ か ず に平 均 を求 め た こ とに よ って 起 きる もの です か ら,こ の テ キス トでは,用 語 をか え ま した.
6.2 直接 法 に よる 標 準 化 ① 混同要 因 への対 処法― 2:標 準化 混 同要 因へ 対処 す る第二 の考 え方は 年 齢構成 が ちが って 比較 で きな いの な ら 年 齢構成 が そ ろった とした と きの数 字 を計算 しよ う とい う考 え方 です.一 般化 してい うと 混 同要 因へ の対 応―2 混 同要 因の影 響 を補正 した平均値 を求 め, そ れにつ いて分析 す る. と い う こ とで す が,補
正 の 仕 方 が 問 題 で,い
くつ か の 方 法 が あ り ま す.
こ の 節 と次 節 で 2つ の 方 法 を説 明 し ます. ② 直 接 法 に よ る標 準 化
そ の 1つ が,以
下 に 述 べ る"直 接 法 に よ る 標 準 化"で
す. A の 区 分AIに
対 応 す る X は,そ
の 区 分 に 属 す る 人 々 の 値 の 平 均 値XIで
す が,
混 同要 因 C を考 慮 に 入 れ ね ば な らな い 状 況 下 で は, XIが
「C に よ る 細 区 分CIJに
お け る平 均 値XIJ」 の
平 均値 で あ るこ と を考 慮 に 入 れ る こ とが 必 要 で す. す な わ ち, XI=ΣNIJXIJ/NI で す か ら,XIの
差 異 につ い て
XIJの 差 異
XIの
NIJの 差異
差異
と,意 味 の ち が う2 と お りの 差 異 が 混 同 さ れ て い る こ と に な り ます.し
た が っ て,
あ る標 準 の ウ エ イ トN0Jを 想 定 し,上 の 加 重 平 均 を計 算 し な お す とい う方 式 で,対
比 で き る よ う に,平
均 値 を補 正 し ます.す
XI*=ΣN0JXIJ/N0
を対 比 の た め の 指 標 と して 使 う こ と に す る の で す.
な わ ち,
この計 算 では XIJの 差異 XI*の
NIJの差異 とい う扱 い と な りま す.NIJの こ れ を"標 準 化 平 均 値"と 比 に 使 え ませ ん か ら,"粗
差異
差 異 が 影 響 し な い よ う に す る と い う こ とで す . よ び ま す.こ
平 均 値"と
れ を 使 うべ き状 況 下 で は,XIは,適
よ び ま す.そ
う して,そ
切 な対
れ を補 正 す る 手 順 を,
標 準 化 と よ び ま す. ◇ 注 加 重平 均 と ウエ イ ト に使 うウエ イ トWKの
区 分 K の 情 報XKの
加 重 平 均X=ΣWKXKを
求め るとき
選 び方 に つ い ては,次 の よ う な場 合 が あ ります.
a. た とえば標 本 調 査 の 結 果 が年 齢 別 に求 め られ て い るが,調 査 対 象 者 の 年 齢 別 構 成 が 一 般 の年 齢 別構 成 と異 な るた め ,そ れ に見 合 う推 計 値 に す るた め に,ウ エ イ トをつ け る場合.
b.2 つ の集 団 の情 報 を比べ る場 合,そ れ ぞれ の 構 成(た とえ ば年 齢 別 構 成)が 異 な るこ との影 響 を避け るため に,あ る標 準構 成 を想 定 して,そ れ をウエ イ トとす る場 合 .
c.あ る意 図 を もって 定め た ウ エ イ ト(た と えば,こ
うあ るべ きだ と い う 目標値)を 使 う
場 合. ③ 表6.1.1の
例 示 に お け る丙 社 を(実 在 の 企 業 で は な く),甲 社 並 み の 給 与 水 準,
乙社 並 み の 年 齢 構 成 を もつ 仮 想 企 業 だ と み ま し ょ う.す
る と,甲 社 ・乙 社 の 給 与水 準
を 比 べ る た め に は,実 在 の 甲 社 の か わ りに仮 想 し た 丙 社 を使 う … そ れ が,こ
の節 の
標 準 化 の 考 え 方 だ と い う こ とが で き ま す. た だ し,標 準 の 年 齢 構 成 は,任
意 の 年 齢 構 成 で か ま い ませ ん.こ
れ を 「標 準 」 とす
る とい う観 点 で 決 め て よ い の で す. ④ XIJの
か わ りに,あ
る標 準 区 分(I=1)に
お け るX1Jに
対 す る相対 比
YIJ=XIJ/X1J を使 う場 合 も同 じ考 え 方 で,ど
の 区 分AIに
も共 通 す る ウ エ イ トW0Jに
よった加 重 平
均 YI*=ΣW0JYIJ を 求 め て 比 較 し ます. Y が 物 価,AIが
年 次 区 分 だ と す れ ば,品
目CJの
価 格XIJを
ウ エ イ トW0J(年
次
区 分 に 関 係 し な い ウエ イ ト)に よ っ た 物 価 指 数 を 求 め て 年 次 比 較 を す る 場 合 に あ た り ます.ま
た,AIが
地 域 区 分 だ とす れ ば 地 域 差 指 数 に あ た りま す.
Y が 死 亡 率,AIが
地 域 区 分 だ とす れ ば,年
齢 区 分CJご
とにみ た死亡 率 の加 重 平
均(あ る標 準 の 年 齢 構 成 を想 定 し た加 重 平 均)を 求 め て 比 較 す る場 合 に あ た り ます. こ の よ うに,指
数 と よ ば れ て い る 指 標 は,こ
の 節 で 述 べ た 標 準 化 の 方 法 を適 用 した
もの に な っ て い ます. ⑤ こ の 節 の 方 法 で は,C→Xの ま す が,C→Xの
効 果 そ の も の は,陽
効 果 が X の 比 較 に 影 響 し な い よ うに な っ て い な 形 で は み て い ませ ん.そ
れ が 目的外 だか ら
そ う した の で あ り,不 要 な C を表 面 化 せ ず,簡 これ が,こ
明 に 議 論 で き る こ とに な り ます.
の 方 法 の 利 点 で す.
しか し,A→Xの
効 果 が C の 区 分 ご と に 著 し くち が う な ら,C→Xの
効 果分 析
を 目的 外 に お くこ と 自体 が 不 適 切 だ と い う こ とに な りま す か ら,前 節 の 方 法 で こ の 点 を検 討 す べ き で す. この 前 提 を み た し て い る か ど う か は っ き り しな い と き に も,前
節 の 方 法 に よ る方 が
よ い で し ょ う. こ う い う点 の 検 討 を す ま し て か ら そ れ が 妥 当 と み ら れ る場 合 に,A→Xの
関係 を
要 約 す る た め に こ の 節 の 方 法 を 使 う … こ う考 え るべ き で す. ⑥ 計 算 手 順
表6.2,1,表6.2.2は,直
接 法 に よ る 標 準 化 平 均 値 の 計 算 手順 と
そ の例 示 で す. 表6.2.1
直 接 法 に よ る標 準 化 平 均 値 の計 算 フ ォ ー ム
表6.2.2
直接 法 に よ る標 準 化 平 均 値 の 計算 例
次 の 節 で 述 べ る 間 接 法 と比 較 す る た め に,使
わ な い 箇 所 も設 欄 し,使 わ な い数 字 を
括 弧 書 き して あ り ます. 例 示 に お け るA1,A2に に よ り,(27.1,26.1)に
お け る粗 平 均 値(26.4,28.3)が,混
C の 各 区 分 別 の 数 字 に つ い て は,ど A1で
同 効果 を補 正す る こ と
な り ま し た.大 小 関 係 が 逆 転 し て い ま す.
の 平 均 値>A2で
の 区分 で も
の平均値
と な っ て い る こ とか ら,混 同 効 果,す た標 準 化 平 均 値 は,当 A1で
な わ ち,C
の 区分 別 構 成 比 の ちが い を補 正 し
然
の 平 均 値>A2で
の平均 値
A1 で の 平 均 値<A2で
の平均値
とな る の で す. 粗 平均値 が
だ っ た の は,C
の 区 分 別 構 成 比 の ち が い に よ る も の だ っ た の で す.
⑦ 多 くの 統 計 資料 に掲 載 さ れ て い る平 均 値 は,そ 応 す る値 に な っ て い ます.し
た が っ て,比
れ ぞれの集 団 区分 での構 成 に対
較 す るに は,構
標 準 化 平 均 値 を 計 算 し なけ れ ば な ら な い の が 普 通 です.そ 均 値 が 掲 載 され て い る場 合 も あ り ます.た め に は,雇
成 比 の ち が い に 注 意 して, う い う標 準 化 の な され た 平
とえば賃金 水準 の企業 間格差 を比較 す るた
用 者 の 年 齢 構 成 の 影 響 を補 正 し た デ ー タ を 使 うべ き場 合 が あ り ます か ら標
準 化 平 均 値 の 計 算 が 必 要 とな り ます. ま た,時
系 列 デ ー タ の 場 合,標
い ます.構
成 比 自体 も変 化 し ま す か ら,5 年 ご と に 更 新 し,標 準 化 平 均 を 計 算 し な お
す の が 慣 習 に な っ て い ます.こ
準 とみ ら れ る構 成 比 を 使 った 「指 数 」で 表 わ さ れ て
の 場 合 も,た
と え ば 特 定 の 年 齢 階 層 での 生 計 に 焦 点 を
あ て て 分 析 す る た め に 「当該 階 層 で の 構 成 比 」を ウ エ イ ト とす る指 数 に お き か え る と い う意 味 で 「標 準 化 平 均 値 」 を計 算 し な お す こ と も考 え られ ま す .
6.3 間接 法 によ る標 準 化 ① こ の 節 の 方 法 も,前 節 と同 じ く
比 較 し よ う とす る区 分AIの
構 成NIJ(混
同 要 因 C の 区 分 別 構 成)が 異 な っ て い る の で
各 区 分 に 対 応 す る 平 均 値XIを
比較 で きない
そ の 数 字 を補 正 して 比 較 で き る よ うに し よ う と い う問 題 を扱 う もの で す が,次
の 形 の"間 接 法"と
よば れ る方 法 を採 用 し ま す.
混 同要 因へ の対応― 3 粗 平均 値 に補正 率 を乗 ず る こ とに よって 混 同要 因の効 果 を補 正 す る 前 項 の 方 法 で は,こ
の 問 題 に 対 して,結
が)C に よ る 細 分 を行 な い,各
そ れ が 可 能 な ら よ い の です が,た あ りま す.ま て,各
た,細
使 っ て い ま す.
と え ば デ ー タ数 が 少 な くて,細
分 で きない こ とが
分 され た デ ー タ が 集 計 さ れ て い な い 場 合 が あ り ま す.し
細 区 分 に 対 応 す る 数 字XIJを
こ の た め,こ
果 と し て は 必 要 で な い(経 過 と し て は 使 う
細 区 分 に 対 応 す る数 字XIJを
使 わ な い でXIを
の 節 の 方 法 が 必 要 と さ れ る の で す.
補 正 す る 方 法 が 必 要 で す.
たが っ
② こ の 方 法 の 要 点 は a. C → X の 効 果 を補 正 す る補 正 率 を 求 め, そ れ を,粗 平 均 値 邸 に 乗 じ る方 針 を と る形 に な っ て い る こ と, お よび b. 補 正 率 を求 め る た め に,要 こ と(し た が っ て,ACの
因 C に よる区分 の な され て い な い デー タ を使 う 組 み 合 わ せ 区 分 に 対 応 す るXIJを
で 区 分 し た デ ー タX0Jを
使 わ ず,C
だけ
使 う こ と)
で あ り,次 の よ うに 数 式 表 現 で き ま す. X0=ΣN0JX0J/N0に N0Jの か わ りにNIJを X0(I) NIJ をN0Jに
=ΣNIJX0J/NIを
求め る と
お き か え た こ との 影 響 をX0/X0(I)で 評 価 で き る
よ っ て,C=X0/X0(I) XI×Cと ③ 計 算 手 順
お いて
使 った
を補 正 率 と し して補正 す る
この 間 接 法 に よ る計 算 手 順(表6.3.1)と
計 算 例(表6.3.2)を,説
明 し ま す. 前 節 の 表(表6.2.1,表6.2.2)と
比 較 す る た め に,使
わ な い 箇 所 も設 欄 して,括
弧
書 き で示 して あ り ま す. a. あ る標 準 的 な 給 与 水 準 を想 定 し ます(基 礎 デ ー タ の 2欄 目X0J,こ 区 分 0,す な わ ち,甲 社 ・乙 社 の 平 均 を採 用 して い るが,そ
の例 では
れ 以 外 で も よ い).
b. こ の 区 分 1す な わ ち 甲社 が,「 そ の 年 齢 構 成 」N1Jの も と で こ の 「 標 準 賃金水 準 」X0Jを 適 用 し た ら,平 均 賃 金 は25.6に
表6.3.1
な る.
間 接 法 に よ る標 準 化 平 均値 の 計 算 フ ォー ム
表6.3.2
間接 法 に よ る標 準 化 平 均 値 の 計 算 例
c. い い か え る と,年 齢 構 成 を か え た(標 準 の 構 成N0Jか え た)こ とに よ る変 化 が26.9→25.6で し た が っ て,構 る.逆
成 をN0Jか
に い う と,構
らN1Jに
成 をN1Jか
ら 甲 社 の 構 成N1Jに
か
あ る. か え た こ と に よ る影 響 は25.6/26.9で
らN0Jに
あ
か え た こ と に よ る 補 正 率 は26.9/
25.6で あ る. d. 次 に 甲 社 に つ い て み る.た ら,そ
の 年 齢 構 成N1JがN0Jに
e. よ っ て,甲
社 の 平 均 賃 金X1(甲
年 齢 構 成N1JをN0Jに
だ し,年 齢 構 成 に よ る影 響 を 消 去 し た い の だ か か わ っ た 場 合 を考 え る. 社 の 年 齢 構 成N1Jの
か え る た め に,補
も とで の 平 均)に 対 し て,
正 率26.9/25.6を
適 用 して
X1*=26.4×26.9/25.6
とす る. f.こ れ が 甲社 の 値 の 補 正 値 で あ る. g.乙 社 に つ い て も同 様 に X2*=28.3×26.9/29.1 こ うい う手順 に な っ て い ます. ④ こ の 例 の 場 合,
間 接 法 に よ る 補 正 結 果 は(27.7,26.2)
直 接 法 に よ る 補 正 結 果 は(27.7,26.1)
とほ ぼ 一 致 して い ます. し た が っ て,結
果 と し て は ど ち らで も よ い こ とに な り ます が,間
接 法 で は,計
算例
中 の 括 弧 書 き した 数 字 が 使 わ れ て い な い こ と を確 認 し ま し ょ う.各 企 業 の 雇 用 者 の 年 齢別 賃 金 の 情 報 は 使 っ て い な い … 細 か い 数 字 を 使 っ て い な い の で す.日
本 の全 企業
で み た 年 齢 別 賃 金 は 統 計 書 に は 掲 載 さ れ て い ます が,企 業 別 に は 区 分 さ れ て い な い … そ うだ として も ,各 企 業 の 雇 用 者 の 年 齢 構 成 の 情 報 さ え あ れ ば,粗 平 均 を,比 較 可 能 な 数 字 に 補 正 で き る の です.
この 点 が,こ
の 節 の 方 法 の 利 点 で す.
6.4 指 数 にお ける標 準 化 ① こ の 章 で 説 明 して い る標 準 化 は,種
々 の 分 野 で 常 用 され て い ます が,分
に 異 な る 用 語 が 使 わ れ て い る こ と も あ っ て,共 れ て い な い よ う で す.こ
の 節 で は,物
野ごと
通 す る 手 法 と して の 位 置 づ け が 意 識 さ
価 指 数 の 分 野 を例 に と っ て,標
準化 の手 法一般
との 対 応 関 係 を示 し て お き ま し ょ う. ② 対 比 す る 区 分 が 時 点 で あ る 場 合 を考 え ま し ょ う.こ れ ま で の 節 の 記 号 で い え ば,XI(Iは
区 分 番 号)の 比 較 で す が,時
使 い,XTと
か くこ と に し ま し ょ う.
こ の場 合 も,XTを
点 区 分 の 場 合 で す か ら,I の か わ り に T を
比 較 す るた め に,混
同要 因の 影響 を補 正 しなけ れば な ら ない こ
とが あ り ま す. た とえ ば 物 価 指 数(総 合)XTは,種 標 で あ っ て,品
目J の 価 格XTJの
々 の 品 目別 物 価 の 動 き を 総 合 し て み る た め の 指 加 重平均
XT=ΣWTJXTJ と して 計 測 し ま す.た ウ エ イ トWTJの
だ し,こ の 形 のXTで
は,各
変 化 と が 重 な る た め に,変
品 目 レベ ル で の 物 価XTJの
化 が み られ て も,そ
変化 と
れ を物価 の変 動 だ と
解 釈 で き ませ ん. こ の た め,た
とえ ば,ウ
エ イ トWTJを
い い か え る と,直 接 法 に よ っ て,ウ
特 定 時 点 の 状 態W0Jに
固定 し て 計 算 し ます.
エ イ トの 変 化 の 影 響 を補 正 す る形
XT*=ΣW0JXTJ を使 うの で す. 指 数 で す か ら,XT*/X0と ま す が,要
し,こ れ を 「ラ ス パ イ レ ス 方 式 」の 物 価 指 数 と よ ん で い
は,
基 準 時 点 の ウ エ イ トを 使 っ た 加 重 平 均 です. ③ こ の 他,「 パ ー シ ェ 方 式 」の 物 価 指 数 と よば れ る も の が あ りま す.こ
れ は,
比 較 時 点 の ウ エ イ トを 使 っ た 加 重 平 均 だ と説 明 さ れ て い ま す が,こ こ の 節 で は,こ
ち ら は,補
れ らの 指 数 算 式 が,こ
足 し な い とわ か りに くい で し ょ う. の 章 で 取 り上 げ た 2つ の 標 準 化 方 式 に 対 応 し
て い る こ と を 説 明 し ま す. ④ ラ ス パ イ レス 方 式 の 指 数ILは,WTJ,XTJな
ど を使 っ て
基 準 時 の ウ エ イ ト,比 較 時 の 平 均 価 格 基 準 時 の ウ エ イ ト,基 準 時 の 平 均 価 格 と表 わせ ます. これ に 対 して,パ
ー シ ェ方 式 に よ る指数IPは
比 較 時 の ウ エ イ ト,比 較 時 の 平 均 価 格 比 較 時 の ウ エ イ ト,基 準 時 の 平 均 価 格 と定 義 さ れ て い ます. こ れ ら の 定 義 式 を 次 の よ うに 書 き換 え て み ま し ょ う.
そ れ ぞ れ 右 辺 の 第 1項 は,物
価XTJの
平 均 値 を 比 較 す る 指 数 の 形 で す が,WTJの
変 化 が 重 な っ て い ま す か ら,そ の 影 響 を補 正 し た い の で す.し
た が っ て,第
2項 が 補
正 係 数 だ と解 釈 で き ます. そ の 上 で,第 接 法,間
2項 を6.2節,6.4節
の 計 算 フ ォー ム と計 算 例 と対 照 し て み れ ば,直
接 法 に お け る 補 正 係 数 に あ た る こ とが わ か り ます.
し た が っ て, ラ スパ イ レ ス 指 数 は, 直 接 法 に よ っ て ウ エ イ トの 影 響 を 補 正 し た価 格 水 準 指 数 であ り パ ー シ ェ 指 数 は, 間 接 法 に よ っ て ウ エ イ トの 影 響 を補 正 した 価 格 水 準 指 数 だ と解 釈 で き ま す. ⑤ この よ う に,物
価 指 数 論 とい う限 られ た 分 野 の 概 念 が,多
「 標 準 化 の 考 え 方 」に よ っ て,理
解 で き る の で す.
くの 分 野 に 共 通 す る
表6.4.1
本章の要約
問題 6
問 1 プ ロ グ ラ ムXACOMPは,テ
キ ス ト本 文 とほ ぼ 同 じ順 序 に,同
て 説 明 す る 形 に な っ て い る.ま 表6.2.2,表6.3.2の
ず こ れ に よ っ て,本
じ例 示 を 使 っ
文 の 説 明 を 復 習 せ よ.ま
た,
計 算 を確 認 せ よ.
注:以 下 の 問題 中の 計 算 に この プ ロ グ ラム を使 う とき に は,適 用 す る手 法(直 接 法 か 間 接 法 か)を 指 定 す る とそれ ぞ れ に対 応す る 入力 画 面 が 表 示 され ます か ら,画 面 の ガ イ ド(入力 位 置 を示 す カー ソル)に し たが って 入 力 して い き ます.た だ し,計 算 自体 は 簡単 で あ り,電 卓 で も可 能 です. 問 2 表6.2.2の
計 算 を 「区 分 1で の年 齢 構 成 」 を標 準 とみ な す 形 に 改 め よ.
問 3 表6.3.2の
計 算 を 「区 分 1で の年 齢 別 平 均 給 与 」を 標 準 とみ な す 形 に 改 め よ.
問 4 (1) 物 価 指 数(総 合)は,さ の 加 重 平 均 で あ る が,各
ま ざ ま な 品 目 に つ い て 調 べ た 価 格 指 数(個 別 指 数)
品 目の 購 入 量 の 変 化 を考 慮 せ ず に(特 定 年 次 の 状 態 が そ
の ま まつ づ く と仮 定 して)計 算 して い る.そ
れ は な ぜ か.
(2) そ こ で 仮 定 さ れ て い る購 入 量(ウ エ イ ト)は,個
々 の世 帯 の 属 性 に よ っ て
区 別 せ ず,1 つ の 共 通 な ウエ イ トを 想 定 し て い る.そ の こ とか ら くる 「利 用 上 の 注 意 点 」 を指 摘 せ よ. 問 5 (1) 付 表I.1の
デ ー タ を使 っ て,総 合 指 数 が 各 費 目 区 分 の 指 数 の 加 重 平 均 に
な っ て い る こ と を確 認 せ よ. (2) 特 定 の属 性 を もつ 世 帯(た と えば 世 帯 主 の 年 齢 が45∼49歳
の世 帯)で の 購
入 量 を ウ エ イ ト と して 計 算 しな お して み よ. (3)(2)で
行 な っ た再 計 算 の 意 義 を説 明 せ よ.
問 6 (1) 付 表I.1の
デ ー タ の うち1985年
分 の 総 合 指 数 に つ い て,付
表I.2に
示す
表I.2に
示す
1985年 分 の ウ エ イ トを使 っ て 計 算 しな お せ. 注:こ の 計 算 に よって,ウ エ イ トを変 更 した こ との 影 響 を評 価 で き る. (2) 付 表I.1の
デ ー タ の うち1986年
分 の 総 合 指 数 に つ い て,付
1985 年 分 の ウ エ イ トを使 って 計 算 しな お せ. 問 7 (1) 付 表 Jの デ ー タ を使 っ て,2 つ の 地 域 の 死 亡 率 を 比 較 せ よ. な お,比
率 も平 均 値 の 一 種 と み な す こ とが で き るか ら,本 文 に あ げ た 方 法 を そ の
ま ま使 う こ とが で き る.た だ し,粗 平 均 値,標 率,標
準 化 平 均 値 と い うか わ り に,粗
比
準 化 比 率 と い う呼 称 に お きか え る こ と.
(2) 付 表 Jの 情 報 の うち 地 域 A,B に つ い て は,年
齢区分 別 の数 字 が使 えな い
もの と し て扱 え. 問 8 (1) 表6.A.1(a)の
形 式 の 情 報 に よ っ て,賃
す 指 数(大 企 業 を100と 計 算 に は,付
金 水 準 の 企 業 規 模 間 格 差 を表 わ
した 指 数)を 計 算 せ よ.
表D.1に
含 ま れ る デ ー タ の う ち,表6.A.1(a)に
該 当 す る部 分
を使 う もの とす る. (2)(1)の
結 果 に よ っ て 賃 金 格 差 が 計 測 さ れ る か.計
測 の仕 方 の ど こに 問題 が
あ る か. (3) 表6.A.1(c)の
形 の 集 計 表 に よ っ て,大
従 業 者 の 年 齢 構 成 を 比 べ て み よ.も とが 必 要 で あ る.ど
企 業,小
企業 におけ る
の よ う な 形 で考 慮 に 入 れ る か. 表6.A.1(b)
表6.A.1(a)
(4) 表6.A.1(b)の 計 算 に は,付
企 業,中
しそ れ に 差 が あ る と,そ れ を考 慮 に 入 れ る こ
情 報 を使 っ て,賃
表D.1に
表6.A.1(c)
金 の 企 業 間 格 差 を表 わ す 指 数 を求 め よ.
含 ま れ る デ ー タ の う ち,表6.A.1(b)あ
る い は 表6.A.1
(c)に 該 当 す る も の を使 う もの とす る.
(5) 表6.A.1(b)の
情 報 の う ち 網 掛 け の 部 分 が 利 用 で き な い もの と す れ ば,
ど うす る か.表6.A.1(c)は,利 計 算 に は,付
表D.1に
用 で き る もの とす る. 含 ま れ る デ ー タ の う ち,表6.A.1(b)お
よ び 表6.A.1
(c) に該 当 す る もの を使 う も の と す る.
問 9 (1) 付 表D.1,付 円)か ら26.40(千
表D.2に
よ る と,大
企 業 の 平 均 賃 金 が10年
間 に14.75(千
円)に か わ っ て い る とい う数 字 に な っ て い る が,年
齢構 成 もか
な りか わ っ て い る よ う で あ る. 年 齢 構 成 の 影 響 を補 正(直 接 法 に よ っ て)し た数 字 を求 め て 比 較 せ よ. 年 齢 構 成 の 影 響 を 間 接 法 に よ っ て 補 正 し た 数 字 を求 め て 比 較 せ よ. 問10(1)表6.A.2は,女 る.こ
性 の 死 亡 率 を未 婚 者 と有 配 偶 者 とに わ け て み た 数 字 で あ
の 数 字 をみ て,"死
亡 率 が 高 く な る か ら結 婚 しな い"と い う 人 は い な い だ
ろ う.そ れ に し て も,死 亡 率 に 差 が あ る か ど うか 気 に な る だ ろ うか ら,合 理 的 な,そ
う して 比 較 可 能 な数 字 を 求 め よ(付 表 K の 数 表6.A.2
字 を 利 用 す る こ と). (2) 付 表 K で は,死
別,離
別 の 区 分 も掲 載 さ れ
て い る. こ れ ら に つ い て も,(1)と
同 様 の 計 算 を 適 用 して
配偶 関係別死亡率
み よ. (3) これ らの 計 算 に お い て,デ
ー タ の 構 造 に 関 連 して 注 意 を要 す る 点 が あ る.
そ れ を指 摘 せ よ. ヒン ト:未 婚 か ら有 配偶,有 配偶 か ら死別 ・離 別 へ と状 態 が か わ る こ と,そ う して, この 状 態変 化 が 「どん な年 齢 層 で発 生 す るか 」が,結 果 の読 み 方 に 関連 して きます. 問11 (1)第
1章 9ペ ー ジ の グ ラ フ 「歩 く こ と は 健 康 に よ い 」で は,付
字 の う ち 年 齢 で 区 分 して い な い数 字 をそ の ま ま 使 っ て い る.表 ×年 齢 別 人 数 」の 情 報 を使 っ て,年
表M.1の
数
に あ る 「歩 く距 離
齢 の 影 響 を 補 正 し た 上 で 「歩 く距 離 と血 圧 の
関 係 」を 示 す グ ラ フ を か け. (2) 同 じ報 告 書 に は,年 わ け て,平
齢40歳
台,50歳
均 血 圧 を求 め た付 表M.2が
台 だ け を取 り上 げ て,歩
掲 載 され て い る.こ
く距 離 別 に
れ を使 う こ と と,(1)
で 計 算 し た数 字 を使 う こ との 利 点 ・欠 点 を指 摘 せ よ. (3) 付 表M.1に
示 す 女 子 の 場 合 の 数 字 に つ い て,問10(1)と
同 じ分 析 を 行 な
え. 問12 物 価 指 数 の 算 式 に お い て QIT =〓,
PIT=〓, とお き,PIT,QITの れ もUI0を IL,パ
UI0=WI0XI0
平 均 値 をPT,QT,標
準 偏 差 を σP,σQ,相 関 係 数 を ρPQ(い ず
ウ エ イ ト とす る もの)と す る と,ラ
ー シ ェ 方 式 に よ る 物 価 指 数IPに
ス パ イ レ ス方 式 に よ る物価 指 数
対 し て 次 の 関 係 式 が 成 り立 つ こ と を証 明
せ よ(ボ ル トキ ー ヴ ィ ッ チ の 関 係 と よ ば れ る).
注:物 価 指 数 の 場 合 P が価 格 で Q が購 入 量 です か ら,「価 格 が上 が った ものの 購 入 量 が 減 る」とい う消 費行 動 が 予 想 され る で し ょ う.そ の 場 合,ρ<0.し IL>IPが
たが って,
成 り立 ちます.
物 価 指 数 以 外 の場 合 に つ い て も,こ の 関 係 に よ って,直 接 法 に よ る標 準 化 平 均 値,間 接 法 に よ る標 準化 平均 値 の 大小 関係 につ い て,言 及 で きる場 合 が あ るで し ょ う. 問13 物 価 指 数 の 計 算 に お い て は,西
暦 年 数 の 1の 桁 が 0 ま た は 5の 年 に ウ エ イ トが
更 新 さ れ る.し た が っ て,0 ま た は 5の年 の デ ー タ だ け を み る と,同 イ トと価 格 の 情 報 とが 対 に な っ て い る こ と と な る.こ て,ラ
じ年 の ウ エ
れ ら の 年 の 情 報 を利 用 し
ス パ イ レ ス 方 式 に よ る 指 数 と パ ー シ ェ 方 式 と を 計 算 し,比 較 して み よ.
IL<IPが
成 り立 っ て い る か.
7 分 布 形 の 比 較
2つ の区 分 の情 報 を比べ る と き,そ れ ぞれ の 情 報 の 特 性 を表 わ す 平 均 値 を 比 べ る の で な く,分 布 形 その も の を比 べ た い こ とが あ り ます,ま た,平 均 値 を比 べ る場 合 で も,分 布 形 に関 して あ る仮 定 が 必 要 で あ り, それ を適 用 す る前 に,観 察 値の 分 布 形が その仮 定 と合 致 して い るか否 か を調 べ た い こ とが あ ります.こ の 章 で は,こ うい う 「 分 布 形 を比 較 す る 問 題 」を解 説 します.
7.0 分 布 形 の 比 較 ① 第 2章 で は,変
数 X の 分 布 形 の 表 わ し方,分
規 分 布 」に つ い て 説 明 した 後,2.4節
で は,変
布 形 の 特 別 な モ デ ル で あ る 「正
数 X の 分 布 形 が 「正 規 分 布 」 とみ なせ
るか ど うか を 判 定 す る 方 法 を い くつ か 説 明 し ま し た. しか し,分 布 形 の モ デ ル は,正 重 要 です.一
規 分 布 だ け で は あ り ませ ん.た
とえ ば,一
様 に な る よ う に 「分 布 を制 御 す る」場 合 が 多 い か らで す .た
様分 布 も
とえば 公共
施 設 は ど の 地 域 に も一 様 に 配 置 す べ きだ と され ます か ら,実 際 に そ う な っ て い る か を 判 定 す る 手 法 が 必 要 で す. 分 布 形 が 一 様 分 布 か 否 か を 判 断 す る 手段 と し て は,ロ ー レ ン ツ カ ー ブ が 慣 用 さ れ て い ま す.こ れ に つ い て,7.2節 で 説 明 し ます .ま た,適 用 上 の 注 意 に 言 及 し ま す. ② 正 規 分 布 あ る い は 一 様 分 布 以 外 の場 合 に つ い て は,ど うす る の で し ょ うか. こ の 章 で は,分 布 形 を特 定 せ ず,2 組 の観 察 値 の 分 布 形 を 比 較 す る手 段 を組 み 立 た て う る こ と を 説 明 し ま す. 「デ ー タの 累積 分 布 」 と 「想 定 さ れ る モ デ ル(確 率 分 布)の 累 積 分 布 」 と を比 べ て み れ ば よ い … 理 論 と して は そ れ で す む の で す が,「 比 べ る 手 法 」は,そ せ ん.正 規 確 率 紙 や ロー レ ン ツ カ ー ブ は,想 直 線 に な る 」…
う簡 単 で は あ りま
定 されて い るモ デル に 「 合 致 して い れ ば
この こ とか ら,適 用 しや す い 方 法 に な って い ます .
正 規 分 布 あ る い は 一 様 分 布 以 外 の 場 合 に つ い て も,同 様 に 適 用 で き な い か … そ の
観 点 で,正
規 確 率 紙 を 使 う方 法 を 一 般 化 し た 「P-Pプ
ロ ッ ト」 と よ ば れ る 方 法 が 提 唱 さ れ て い る こ と を7.2節 とロ ー レ ン ツ カ ー ブ の 関係 を7.3節 ③ ま た,よ
ロ ッ ト」あ る い は 「Q-Qプ で 説 明 し,つ づ け て,そ
れ ら
で 説 明 し ま す.
く知 ら れ て い る適 合 度 検 定(カ イ 2乗 検 定)に つ い て,適
用上 の 注意
点 を 説 明 し ます(7.4節). ④ こ れ ら の 手 法 は,い
ず れ も 「分 布 形 の 比 較 」 を扱 うの に もか か わ ら ず,そ
の 相 互 関 係 に 関 す る解 説 は 多 く な い よ う で す.こ に 必 要 だ と思 い ます か ら,こ
7.1
の 章 を 設 け ま し た.
口ー レン ツ カー ブ とジ ニ 係 数
① た とえ ば あ る商 品 を 生 産 し て い る メー カー が 5社 あ っ て,そ 表7.1.1の
れ ら
れ ちの 手 法 を適 正 に 使 い わ け る た め
よ う に な っ て い る と き,ト
ップ の 1社 が50%,上
れぞ れの生 産量 が
位 2社 ま で で80%の
シ ェ ア ー を しめ て い る こ とが わ か り ます. こ の よ うな 見 方 は,種
々 の 問 題 分 野 で慣 用 され て い ます が,デ
説 明 す る た め の 一 般 的 手 法 と して,広 し た が っ て,順
を追 って,こ
② ロー レ ン ツ カ ー ブ
ー タの分布 につ いて
く使 い う る もの で す.
れ を一 般 化 す る形 で 説 明 し て い き ます.
例 示 した よ うに 「 上 位 ○ 社 で X の 合 計 の △%を
て い る 」と い う見 方 を 採 用 す る の で す か ら,横
しめ
軸 に ○ す な わ ち X の 大 き さ の 順 位,
縦 軸 に △ す な わ ち X の 累 積 百 分 比 を と っ た グ ラ フ を か い て お け ば よ い こ とに な り ま す.し
た が っ て, 基 礎 デ ー タ を大 き さ の 順 に 並 べ て リス ト し 値 X の 累 積 を求 め る 合 計 が100に
そ の 上 で,グ
な る よ う調 整 す る
ラ フ をか く と い う手 順 を 経 る の で す.
こ の グ ラ フ の 折 れ 線 ま た は そ れ をス ム ー ジ ン グ した カ ー ブ を,「 ロ ー レ ン ツ カー ブ 」 表7.1.1
集中度の見方
図7.1.2
ロー レ ン ツ カー ブ
と よ び ます.
値 の大 きさの順 に並べ
… 50 …1
企 業 数 を カ ウ ン トす る ま た,値
も 累積 して お く
… 50
30
10
5
2
3
4
5 横 軸
90 95
100 縦 軸
80
5
これ を プ ロ ッ ト こ の 書 き方 を す る と,ロ ー レ ン ツ カ ー ブ は,上
に 凸 な折 れ 線 に な り ます.
大 き い 方 か らの 順 位 で な く,小 さ い 方 か らの 順 位 を 使 う と,下
に 凸な折 れ線 に な り
ま す. 特 別 の 場 合 で す が,一
様 分 布,す
な わ ち,す べ て が 同 じ値 を もつ 場 合 は,直
り ま す(一 様 分 布 と い う表 現 に は 問 題 が あ り ます.次
線 とな
ペ ー ジの コ ラ ム を 参 照 し て くだ
さ い). ③ デ ー タ 数 が 多 い 場 合 に は,す
べ て の デ ー タ を 大 き さの 順 に 並 べ る か わ りに分 布
表 を使 っ て 求 め る こ と が で き ます.⑤
で 説 明 し ます が,先
に 計 算 結 果 を例 示 し て お
き ま し ょ う. ④ 図7.1.3は,図2.3.4に X.4)を
分 布 図 の 形 で 示 した 「賃 金 月 額 」(基 礎 デ ー タ は 付 表
ロー レ ン ツ カ ー ブ の 形 に 表 わ した もの で す .
ま た,図7.1.4は,X=「
K 県 の 市 町 村 別 病 床 数 」の 分 布 を ロ ー レ ン ツ カー ブ に 表
わ した もの で す. い ず れ も ⑤ で 例 示 す る 手 順 で か か れ る もの で す が,図7.1.4の るべ き問 題 が 残 っ て い ま す.そ
の 点 に つ い て は,7.4節
方 に つ い て は考 え
で 説 明 し ま す.
⑤ こ れ ま で の 説 明 で これ らの 図 を か け る と思 い ます が,デ
ー タ数 が 多 い 場 合 な ど
に つ い て 注 意 が 必 要 で す. 表7.1.5は,図7.1.3を
か くた め に 必 要 な 計 算 手 順 を例 示 し た も の で す.表
の後 に
つ け た[計 算 手 順 の 説 明]を 参 照 して くだ さ い. ◇ 注 図7.1.4で は,観 察 単 位 が 「市町 村 」で あ り,指 標 は 「 各 市 町 村 の病 床 数 」です.こ の
図7.1.3
ロ ー レ ンツ カー ブ の例
賃金 月額
図7.1.4
ロー レ ン ツ カー ブ の例
市町村の病床数
場 合,「 市 町村 のサ イ ズが 著 し くちが う こ と」を考 慮 に入 れ る 必要 は な い か,考 慮 に入 れ る と,ど うい う形 で扱 うか … これ が,残 され た 問題 で す.
以 上 の 計 算 過 程 に,「 大 き さ の 順 」お よ び 「 観 察 値 の 累 積 値 」を 百 分 比 に お き か え る た め の 計 算 が つ け加 わ っ て い ま す.大
き さ の順 を 「デ ー タ数 で カ ウ ン ト して 何 番 目 ま
で 」 とい う 説 明 の 仕 方 をす るか,「 大 き い 方 か ら何 % ま で 」 とい う 説 明 の仕 方 を す る か に よ っ て 選 択 す れ ば よ い こ と で す. 表7.1.5
ロ ー レ ンツ カー ブ をか くため の 計 算
[計算 手順 の 説 明] デ ー タ を分布 表 の 形 に整 理 す る. 観察 値 は(各 値 域 内 で の差 は 無視 され るが)大 き さの順 に並 べ られ る. 累積 度 数 をカ ウ ン トす る.… … 例 示 の 1番 目の ブ ロッ ク そ れが 各 区切 りの上 限値 の 「大 き さの順 」で あ る. 各 区切 り内 の観 察値 を 中央値 とお きか え て,観 察値 の合 計 を計 算す る. 「 観 察 値 の 累積 値 」を カ ウ ン トす る.… … 例 示 の 2番 目の ブ ロ ッ ク 「 大 き さの順 」を横 軸,「 観察 値 の 累 積値 」を縦 軸 に とって グ ラフ をか く.
一様 分布 「変 数 X の 値 がA<X<Bの
範 囲 で 均 等 に 出 現 す る」 とみ られ る と き に X の
分 布 を 「一 様 分 布 」 と よ び ま す が,ロ
ー レ ン ツカー ブ を適 用 す る問 題 分 野 で は
「す べ て の 観 察 単 位 が 同 じ値 を も つ 」 と き に,均
等 に 分 布 して い る,す
「 一 様 に 分 布 し て い る 」 とい う言 い 方 が な され ます.観
な わ ち,
察値 が あ る特 定 値 を もつ
と想 定 して い る の で 「一 様 分 布 」 と い う表 現 は 不 適 当 で す が,一
様 分布 に おけ る
幅 が 0に な っ た 極 限 の 場 合 だ と解 釈 して よ い で し ょ う. こ の 節 は ロ ー レ ン ツ カ ー ブ を統 計 手 法 の ひ とつ と位 置 づ け て 説 明 し て い ます か ら,必 要 な場 合 に は 「幅 0の一 様 分 布 」と い う呼 び 方 を し ます.
表 に は,さ
ら に,ジ
い ます か ら,そ
ニ 係 数(後 述)を 計 算 す る部 分(3 番 目 の ブ ロ ッ ク)が つ づ い て
の 部 分 に つ い て は 次 項 で 説 明 し ま す.
⑥ ジ ニ 係 数(GINI係 ロ ー レ ン ツ カ ー ブ は,直
数)
も しす べ て の 観 察 単 位 が 同 じ値 を もつ と す れ ば,
線 に な りま す.し
た が っ て,図7.1.6に
示 す よ う に,実
際の
ロ ー レ ン ツ カ ー ブ と直 線 で か こ ま れ た 弓 形 の 部 分 の 面 積 の 大 小 は,
観察 単位 の もつ値 の不 平 等度 図7.1.6
を表 わす指標 だ と解釈 され ます.
ジ ニ係 数
この こ とか ら, ジ ニ 係 数=
弓形 の部分 の面積/ 三角 形 の面積
と定 義 し ま し ょ う. こ の 定 義 か ら,ジ ニ 係 数 の 値 は,0 と 1の 間 と な りま す. ⑦ ジ ニ 係 数 の 計 算
表7.1.5の
計 算 例 で は,
1番 目の ブ ロ ッ ク で
度 数 の 累 積(順 位),
2番 目の ブ ロ ッ ク で
値 の 累積
を求 め て い ま す. こ れ ら を使 っ て か い た ロ ー レ ン ツ カ ー ブ の 左 端 の 部 分 を 拡 大 し た も の が,図7.1.7 で す.こ
の 図 の 弓 形 の 部 分 の 面 積 を計 算 す る過 程 を,図
の 右 側 に 示 して あ り ま す.こ
れ が,図7.1.5の 3番 目の ブ ロ ッ ク の 「超 過 部 分 の 面 積 」 の 欄 で す. ⑧ 例1987年
の 労 働 白 書 に は,「 所 得 階 層 別 に み た 世 帯 あ た り貯 蓄 保 有 高 の 格
差 を み る 」 と い う 問 題 意 識 で,ジ
図7.1.7
ニ 係 数 の 推 移 を 示 す 図7.1.8を
ジニ 係 数 の 計算 に 関 す る説 明 図
掲 載 し,「 縮 小 を つ
図7.1.8
所 得 階 級 別 に み た貯 蓄 保 有 高 に関 す る ジ ニ係 数 の 推 移
づ け て い た 格 差 が 拡 大 す る方 向 に転 じた 」 と説 明 して い ます. こ の 図 に 掲 載 され て い る ジ ニ 係 数 は,図7.1.5に
例 示 した 計 算 手 順 を 「 貯 蓄保 有高
の 分 布 の デ ー タ」に 適 用 す れ ば よ い … 基 本 的 に は そ う です が,実 と問 題 が か くれ て い ます.7.4節
お よ び7.5節
際 に 計 算 して み る
で 説 明 を つ づ け ま す.
見 出 しの 「所 得 階 級 別 に み た … 」 と い う句 に 注 意 し て お い て くだ さ い.
7.2 分 布 形 表現 手段 と しての 口ー レン ツカ ー ブ の 位 置 づ け ① 第 2章 で は,変
数 X の 分 布 形 を表 わ す た め に
「分 布 図 」 「累 積 分 布 図 」 を使 うこ と を 説 明 し ま し た. また,こ
の 章 で は,前
節 で,一
様 分 布 との 適 合 度 をみ る た め に
「ロー レ ン ツ カ ー ブ 」 が 使 わ れ る こ と を説 明 し ま した. こ の 節 で は,こ れ ら の 関 係 を体 系 づ け て 説 明 し ま し ょ う. ② 分 布 の 表 現 法 と して の 位 置 づ け
ロー レ ン ツ カー ブ は,分
布 の 表現 法 として
周 知 の 「分 布 図 」,「累 積 分 布 図 」 と並 ぶ もの と位 置 づ け る こ と が で き ま す.ま の こ と を 説 明 し ま し ょ う. 変 数 X の 分 布 を み る と き に,次
の よ う な 見 方 が あ りえ ます.
ず,そ
a. X の 各 値 域 に 包 含 さ れ る観 察 単位 数 の 大 小 を み る 見 方 b. X 以 下 の 値 を もつ 観 察 単 位 数 は ○%だ c. 小 さ い 方 か ら○%の
と い う見 方
観 察 単 位 の もつ 値 は,X
以 下 だ とい う
見方 d. 小 さ い 方 か ら○%の ○%だ
観 察 単 位 の も つ 値 の 合 計 は,総 合 計 の
と い う見 方
分 布 は aの 見 方 累 積 分 布 は bの 見 方,い
い か え れ ば,c の 見 方
ロー レ ン ツ カー ブ は d の 見 方 に 対 応 し て い ます. 統 計 学 で は そ れ ぞ れ の 表 現 法 を 定 義 して い ま す が,そ
れ を,図7.2.1(a)の
よ うに
並 べ て み ま し ょ う. 各 図 の 対 応 関 係 の 説 明 と その 数 式 表 現 を付 記 して あ りま す が,要
は,
分 布図 の斜 線の部 分の 面積 P と X の 関係 → 累積 分布 図 累積 分布 図 の斜線 の部分 の面 積 S と P の 関係 → ロー レ ン ツ カー ブ とな っ て い る こ とで す. こ の こ と か ら, 分 布 図 は aの 見 方 累 積 分 布 図 は b ま た は cの 見 方 ロー レ ン ツ カ ー ブ は dの 見 方 図7.2.1(a)
斜 線 の 面積Xf(X)の
P(X)を
f(X)
求 めXP(X)を
分布 の 表 現 法 の 関 係
か わ りに 斜 線 の 面 積XP(X)の 図 示
S(P)を
P(X)=∫f(X)dX
求 めS(P)Pを
か わ りに 図 示
S(P)=∫X(P)dP
累積 分 布 関 数P(X)は 単 調 増 加 関 数 です.そ の 逆 関数X(P)も P に 関 し て単 調 増 加 関 数 で す か ら,そ れ を積 分 し たS(P)は,P に 関 して 下 に 凸 な単 調 増加 関 数.
に 対 応 す る こ とが 確 認 で き ま す. ③ こ れ ら の 表 現 は い ず れ も 「分 布 形 の 表 現 法 」で す が,観 「あ る 標 準 形 」が 想 定 さ れ て い る と き,そ
察 値 の 分 布 に 対 して
の 分 布 形 と合 致 す るか 否 か を み る た め に 使
う こ とが 考 え ら れ ま す. 簡 単 に 考 え れ ば,観
察 値 の 分 布 と想 定 され る 標 準 の 分 布 形 を 同 じ形 式 で 書 い て 比較
す れ ば よ い の で す が,比 い は,こ
べ や す さ を考 え る と,こ
れ ら の 表 現 法 の どれ を使 うか,あ
る
れ ら の 表 現 法 を変 形 して 使 うか が 問 題 と な りま す .
④ 口 ー レ ン ツ カ ー ブ は,一 様 分 布 との 適 合 度 を み る た め に使 わ れ て い た 前 節 で 述 べ た とお り,ロ ー レ ン ツ カ ー ブ は,一 れ て い た もの で す が,一 一 様 分 布,す
様 分 布 との 適 合 度 を み る た め に 使 わ
様 分 布 とい う コ トバ の 受 け と り方 に 注 意 し ま し ょ う.
な わ ち,
あ る範 囲 の X が 一 定 の 出 現 確 率 を もつ と い う意 味 で 使 わ れ る場 合 と, す べ て の 観 察 単 位 が 同 じ値 を もつ とい う意 味 で 使 わ れ る場 合 が あ る の で す. 分 布 形 が 範 囲ABで
一 様 分 布 な ら,累 積 分 布 はX=Aか
図7.2.1(b)
範 囲ABで
一様分 布の場合
図7.2.1(c)
範 囲ABが
0に な っ た場 合
らX=Bの
範 囲 で右 上 が
りの 直 線,ロ
ー レ ン ツ カ ー ブ は(0,0)と(1,1)を
一 様 分 布 の 散 布 幅 が 0に な っ た極 限,す 場 合 に は,累
結 ぶ 二 次 曲 線 と な りま す.
な わ ち,す べ て の観 察 単 位 が 同 じ値 を も つ
積 分 布 は 図 の よ う な ス テ ッ プ 関 数,ロ
ー レ ン ツ カ ー ブ は(0,0)と(1,1)
を結 ぶ 直 線 に な りま す. ⑤
ロ ー レ ン ツ カ ー ブ は,分
通 常 は,図7.2.1(c)の わ れ て い ます が,ま
布 形 を 比 較 す る 手 段 と して 使 う こ と も で き る
場 合 の 一 様 分 布 との 比 較 手 段 と し て ロー レ ン ツ カ ー ブ が 使
ず,分
布 形 の 表 現 や 比 較 の 手 段 と して は,他
の 表 現 と並 べ う る こ
とに 注 意 し ま し ょ う. あ る標 準 形 と比 べ る た め に は,観 応 す る(S*,P)を
察 値 の 分 布 形 に 対 応 す る(S,P)と
標 準分 布 に対
1枚 の 図 に 重 ね て 比 較 す る の で す.
標 準 分 布 が 一 様 分 布,特
に,幅
が0の
で,比 較 しや す い と い う こ と で す が,そ
一 様 分 布 の 場 合,比
較 の 相 手 が 直 線 に な るの
う で な い 場 合 に も,
標 準 とみ ら れ る グ ル ー プ で の 累積 分 布 が 直 線 と な る よ うに 変 数 を変 換 して お く な ら, 一 様 分 布 と比 較 す る問 題 に お き か え て 扱 う こ とが で き ま す. こ の こ とを 示 す た め に 例 示 を挿 入 して お き ま し ょ う. ⑥
正 規 分 布 の 適 合 度 を み る た め に ロ ー レ ン ツ カ ー ブ を使 う
⇔ 一 様 分 布 とス テ ロ タ イ プ に 考 え るの で な く,た
ロー レ ン ツ カ ー ブ
と え ば 正 規 分 布 との 適 合 度 を み る
ため に 使 う こ と もで き ま す. 次 の 例 は,こ 例7.2.1
の こ と を 示 す もの で す. あ る変 数 に つ い て,観
のk×10パ
察 値 を偏 差 値 に お きか え た 上,「 標 準 正 規 分 布
ー セ ン タ イ ル 」(k=1,2,…,9),す
なわ ち
1.28 0.84 0.52 0.25 0.00 -0.25
-0.52
-0.84
-1.28
で 区 切 っ た 「十 分 位 階 級 区 分 」別 に 度 数 を カ ウ ン ト し た 結 果 が 次 の 表 の よ う に 得 ら れ て い る. こ れ に よ っ て,観
察 値 の 分 布 に 対 す るモ デ ル と して 正 規 分 布 を 想 定 で き る か 否
か を 調 べ よ.
十 分 位 階 級 区 分 観 察値 数
区 切 りは,標
準 正 規 分 布 のk×10パ
階 級 区 分 1 度数
ー セ ン タ イル に よ る
2 3 4 5 6 7 8 9 10
2 12 10 9 9 4 5 5 5
7
ヒ ン ト:こ の 表 の 階 級 区 分 が 「 正 規 分 布 の パ ー セ ン タイ ル に関 して 等 間 隔 」に な って い ます か ら,正 規 分 布 が適 合 す るか否 か とい う問題 を,こ の 表 の度 数 分 布 が一 様 か 否か とい う問題 に お きか えて 扱 えば よい の です. ま ず ロ ー レ ン ツ カ ー ブ を か く た め に,累
積 分 布 P を 計 算 し ま す(表7.2.2の4列
目). つづ い て,図7.2.1(b)の
S で 示 した 部 分 の 面 積 を求 め,そ
し ます(表7.2.2の8列 こ れ ら を 縦 軸,横 7.2.3の
れ を累積 百 分比 の形 に
目). 軸 に と っ て 図 示 す る と,ロ ー レ ン ツ カー ブ が 得 ら れ ま す.図
実 線 で す.
表7.2.2
1∼2列:基
礎 デー タ,3∼4列:累
X は値 域 の 中 央 値,S
図7.2.3
S(P),S*(P)
ロー レ ン ツ カー ブ を か くた め の 計 算
積 分 布 P の 計 算,5∼8列:S(P)の
計 算,
はX×F.
観 察 値 に対 す るP,S(P)と, モ デ ル に 対 す るP,S*(P)の
の 差 は 大 き い.よ
って,十
図7.2.4
図7.2.3の
別 表 現
図
分
図7.2.3の
縦 軸 の き ざみ√Pに
位 階 級 別 度 数 の 分 布 は,一 様 とは い え な い. い い か え る と,基 礎 デー タの 分 布 は正 規 分 布
図 示 す る と,図7.2.4の
だ とは い え な い.
な る.
よ うに,モ
変 換 して デ ル と合
致 す る か 否 か を直 線 と比 較 す れ ば よ い こ とに
図 に は, 値 域1∼10で
一 様 と想 定 し た と き の ロー レ ン ツ カ ー ブ(放 物 線S(P)=P2),
す べ て が 同 じ値 を もつ と想 定 し た と き の ロー レ ン ツ カ ー ブ(対 角 線S(P)
=P)
を あ わ せ て 示 して あ り ま す. た だ し,こ の 問 題 で 比 較 す る の は
観 察値 につ い て計算 した実線 と 値 域1∼10で
で す か ら,こ
一 様 と想 定 し た と きの 放 物 線
の 図 の 縦 軸 の ス ケ ー ル を か え て,図7.2.3の
放 物 線 が 直 線 に な る よ うに
し た 図 を か い て お く方 が よ い で し ょ う. 図7.2.4で
す.
累 積 分 布 図 に お い て 縦 軸 を変 換 し て,正
規 分 布 が 適 合 す る と きに 直 線 に な る よ う に
し た 「正 規 確 率 紙 」を 使 うの と同 様 の 考 え方 で す. ⑦
他 の表 現法 との関 係
ロ ー レ ン ツ カ ー ブ で は,観
察 値 の 分 布 を表 わ す 線 と,
モ デ ル と して 想 定 さ れ る 直 線 との へ だ た りを ジ ニ 係 数 で 測 って い ま す. 図7.2.3に
お け る 実 線(観 察 値 に 対 応)と 対 角 線(均 等 分 布)と の 差 に つ い て こ の ジ
二 係 数 を計 算 で き ます が,こ
の 問 題 で 比 較 し た い の は,実
線(観 察 値 に 対 応)と 放 物
線(一 様 分 布)で す. こ の 差 に つ い て は,線
が 交 差 し ます か ら,ジ
差 を 評 価 す る 指 標 を 使 う な ら,カ
二係 数 は 適 用 で き ませ ん.
イ 2乗 統 計 量 が 代 案 で し ょ う(7.4節
で考 え ま
す). しか し,基 本 的 に は 「線 と線 の 比 較 」で す か ら 1つ の 数 値 で 評 価 す る こ と を考 え る よ り も,線 の ど の あ た りで くい ちが っ て お り,ど の あ た りで合 致 し て い る か を み るべ きで す. 例 示 の 場 合,P
の 小 さ い 部 分 で く い ち が っ て い る こ と か ら,正 規 分 布 の ピ ー ク が
い くぶ ん 左 に うつ っ た 形,た
と え ば 「対 数 正 規 分 布 」に近 い こ と が 示 唆 さ れ ま す.
し た が っ て,「 線 と線 の 比 較 」 を簡 明 に す る た め に,「 標 準 と み られ る線 が 直 線 に な る よ うに 変 換 して そ れ と比 較 した 」こ とが ポ イ ン トで す. この 問 題 で は,偏
差 値 に よ る 階 級 区 分 の 区分 番 号 に お きか え る,す
に 変 換 す る こ と に よ って,も
な わ ち ラ ン ク値
と の 数 値 が 正 規 分 布 ⇔ 変 換 値 が 一 様 分 布 とお き か え て
扱 う,そ の 場 合 の ロー レ ン ツ カ ー ブ が 放 物 線 に な る,ス
ケー ル をか えた図 で は直 線に
な る … こ うい う 2段 階 の 変 換 を 適 用 し て い る の で す. た だ し,そ
う した い な ら他 の 表 現,た
と え ば 累 積 分 布 図 で も同 じ考 え 方 を適 用 で き
ま す か ら,そ れ ら の 表 現 に か え て ロ ー レ ン ツ カ ー ブ を採 用 す る こ との 利 点 を考 え る こ とが 必 要 です. こ の こ とに つ い て は,次
節 で 「累 積 分 布 図 」の 表 現 法 を 取 り上 げ ます.
7.3 累 積 分布 図 の 表現 法 ①
正 規 確 率 紙 は,累
積分 布 図
2.4節 で は,正
規 確 率 紙,す
な わ ち,累
積 分布
図7.3.1
図7.3.2
正 規確率紙の説 明図
累積 分 布 比較 の た め の 図 示(1)
図(の 軸 を 「モ デ ル が 正 規 分 布 の 場 合 に 直 線 とな る よ う に 」き ざ ん だ もの)だ と い う こ と を説 明 し ま した.図7.3.1は この 文 に お け る 「 」 と()は
そ こで使 った 説明 図の再 掲 です. 以 下 の 説 明 を 展 開 す る た め に つ け た もの で す.
「正 規 確 率 紙 」の 説 明 とい う範 囲 で い え ば こ れ で よ い の で す が,そ の 中 に 位 置 づ け る こ と を考 え る の で す . そ の 場 合 に,()の
中 を 落 と し て,正
れ を,統
計 手法
規 確 率 紙 す な わ ち 累 積 分 布 図 だ と い う こ と,
そ して,()の
中 に 記 し た よ う に特 殊 化 さ れ た もの だ と い う こ とに 注 意 し ま し ょ う.
② ま ず,な
ぜ そ う い う特 殊 化 を行 な っ た の で し ょ うか.ま
つ つ 正 規 確 率 紙 の 説 明 を復 習 して み ま し ょ う.
ず,図7.3.2を
参照 し
a.横 軸 に X,縦 た も の,す
軸 にP(x<X)す
な わ ち,観
b.縦 軸 にP*(x<X),す
な わ ち X 以 下 の デー タの比 率 をプ ロ ッ トし
察 値 の 累 積 分 布 図 で す. な わ ち 「分 布 形 が 標 準 正 規 分 布 だ と 想 定 さ れ る と した
と き に 」計 算 さ れ る想 定 値 の 累 積 分 布 図 です. c.2 つ の 図 を重 ね 書 き し た も の で す.P 域 は0∼1で
と P*は 意 味 の ち が う もの で す が,値
す か ら,こ の よ う に重 ね る こ と が で き ま す.
こ の 図 に お い て,2 つ の 線 が 一 致 す る か 否 か を み て,観
察 値 の 分布 が 想定
と合 致 し て い る か 否 か を判 断 で き ます. d.横 軸 に X,縦
軸 に X*( 図 c 中 に 示 した も の )を 図 示 し た も の で す.
この 形 に す れ ば,「 X X*の 関 係 が 直 線 か 否 か 」 をみ て,観
察値 の分 布 が想
定 と合 致 して い る か 否 か を判 断 で き ます. ③Q-Qプ
ロッ 卜
以 上 の 説 明 に お け る 「分 布 形 が 標 準 正 規 分 布 だ と 想 定 さ れ
る と きに 」 と し た と こ ろ を,「 分 布 形 が 想 定 さ れ る標 準 モ デ ル だ と した と き に 」 とお き か え て,よ
み な お して くだ さ い.論
した が っ て,図 こ の 図 をQ-Qプ ④
旨 は 一 切 か え る こ と な く通 じ ま す.
の d を分 布 形 比 較 の 手 段 と位 置づ け る こ とが で き ま す. ロ ッ ト とよ び ます.
正 規 確 率 紙 をQ-Qプ
ロ ッ ト用 の 方 眼 紙 と み な す こ と が で き る
a の 縦 軸 を P か ら Q*に お き か え た もの に な っ て い ます.し 眼 紙 と して は,縦
示 に 使 う方
軸 に P を よ む た め の き ざ み と Q*を よ む た め の き ざ み の 両 方 を 用
意 し て お くこ と が で き ま す.そ
う し て,P
の き ざ み が 等 間 隔 だ っ た も の を,Q*の
ざみ が 等 間 隔 に な る よ う に,き
ざ み なお す こ とが で き ます.し
の 方 が 「分 布 形 の 比 較 手 段 と し て 便 利 」で す か ら,図 こ の 項 の 説 明 は 考 慮 外 に お い て,次 ⑤
図 d は,図
た が っ て,図
か し,図
き
c よ り も図 d
dの 表 現 を使 う もの と す れ ば,
の ⑤ の よ うに い え る こ とに な りま す.
X と X*の 関 係 を図 示 し たQ-Qプ
ロ ッ ト を 「分 布 形 の 比 較 手 段 」 と位 置 づ け
る こ と が で き ます. X*軸 の き ざ み を と る た め に,モ 使 う こ と に な りま す が,そ
デ ル と して 想 定 され た 「累 積 分 布 」の 数 式 表 現 を
れ が 図 b の よ う に 図 示 さ れ て い る と す れ ば,図
c中に示
し た 作 図 に よ っ て よ み と っ て 図 示 す る こ と も で き ます. 観 察 値 の 累 積 分 布 の モ デ ル と し て 「別 の 観 察 値 の 累 積 分 布 」を 想 定 して 比 較 す る こ と も考 え られ ます.た
と え ば,肥
満 度 の 高 い 人 々 の 血 圧 分 布 を健 康 者 の 血 圧 分 布 と比
べ る と い っ た 問 題 で す. ⑥P-Pプ
ロ ッ ト も考 え ら れ る
図7.3.2の
c を 図7.3.3の
cの よ う に お きか
え る こ と も考 え られ ます. こ うす る と,「 観 察 値 の 累 積 比 率 P」と,あ る累 積 比 率 P*」の 関 係 を示 す 図 に な りま す. こ れ をP-Pプ
ロ ッ トと よ び ま す.
この図 につ いて も
る モデ ル を想 定 した と きに 「 期 待 され
観 察 値 の 累 積 分 布 と, そ の モ デ ル と して 想 定 さ れ る 累 積 分 布 との 関 係 を 縦 軸 横 軸 に と っ て 図 示 した もの と了 解 し, そ れ が 直 線 に な るか 否 か に よ っ て 図7.3.3
図7.3.4
累 積 分 布 とQ-Qプロ
累積 分 布 比 較 の た め の 図 示 (2 )
ット
図7.3.5 累 積 分 布 とP-Pプ
ロッ ト
モ デ ル と合 致 す るか 否 か を
判 断す る
とい う使 い 方 が で き ます. ⑦
以 上 の 説 明 の ま と め と して,図7.3.4と
累 積 分 布 ⇒Q-Qプ て くだ さ い.Q-Qプ ⑧Q-Qプ
図7.3.5を
示 し て お き ま す.
ロ ッ ト の 関 係 と,累 積 分 布 ⇒P-Pプ ロ ッ ト とP-Pプ
ロ ッ トとP-Pプ
ロ ッ トの ち が い
な ん ら か の ち が い が あ る は ず で す.ち
ロ ッ ト の 関係 を把握 し
ロ ッ トの 関 係 に つ い て は,説
明 を つ づ け ま す.
ど ち ら も 同 じ よ うに 使 え ます が,
が い を み る た め に,同
じデ ー タ に つ い て 両 方 の
図 をか い て み ま し ょ う. 図7.3.6と
図7.3.7は,同
じ デ ー タ(38ペ
の適 合 度 を み る た め に か い たQ-Qプ
図7.3.6 Q-Qプ
ー ジ の 図2.4.2)に
ロ ッ ト とP-Pプ
ロ ット
つ い て,正
規分布 と
ロ ッ トで す.
図7.3.7
P-Pプ
ロ ッ ト
ど ち ら で み て も正 規 分 布 が 適 合 して い な い と い え ます が,2 つ の 図 は,か
な りち が
う印 象 を与 え ま す. 図7.3.4お
よ び 図7.3.5の
上 下 の 図 を 比 べ る と,
Q-Qプ
ロ ッ トで は,累
P-Pプ
ロ ッ トで は,累 積 分 布 の 傾 斜 の 大 き い 部 分 を ひ ろ げ て プ ロ ッ トす る
積 分 布 の 傾 斜 の 小 さ い 部 分 を ひ ろ げ て プ ロ ッ トし
結 果 に な っ て い る こ と に 注 意 し ま し ょ う. こ の た め に,え
が か れ た 線 で み る と,
Q-Qプ
ロ ッ トは 分 布 の 端 の 部 分 で の 適 合 度 が 大 き く影 響 す る
P-Pプ
ロ ッ トは 分 布 の 中 央 部 分 で の 適 合 度 が 大 き く影 響 す る
こ と に な り ます. こ れ が,ち
が っ た 印 象 を 与 え た 理 由 で す.
し た が っ て,分
布 の 中 央 部 で の 適 合 度 を重 くみ るか,端
るか を 考 え て ど ち らの 表 現 を採 用 す る か を決 め ま し ょ う.
の 部 分 で の 適 合 度 を重 くみ
表7.3.8
P-Pプ
ロ ッ トの ため の 計 算 とQ-Qプ
ロ ッ トの た め の 計 算
列 1∼2 基 礎 デ ー タ.こ れ につ い て平 均 値 と標 準 偏 差 を 計 算 列 3 頻 度 の 累 積.観
察 値 の大 き さ につ け た順 位 に相 当
列 4 X を偏 差 値x にお き か え る … こ こ まで は 共 通 列 5 X の偏 差 値x に対 応 す るP*=P(x)を 列 6 P に 対 応 す るx*:P=P(x*)を
正 規 分 布 の 表 か ら求 め る
正 規 分 布 の 表 か ら求 め る
列 7 x*を 基礎 デ ー タの ス ケ ー ル で表 わ す P-Pプ ロ ッ トは,列 5の 数 値 と列 3の数 値 を プ ロ ッ ト→ 図7.3.5 Q-Qプ
ロ ッ トは,列
6の 数 値 と列 4の 数 値 を プ ロ ッ ト → 図7.3.4
ま た は 列 1の 数 値 と列 7の数 値 を プ ロ ッ ト
⑨
「適 合 度 を み る 」 とい う問 題 は,「 形 を 比 べ る」こ と に な り ます か ら, 形 の ど の 部 分 に 注 目 す る か に よ っ て,判
定が か わ る
の は 当 然 で す. Q-Qプ
ロ ッ トに よ る比 較 とP-Pプ
るの は 当 然 の こ とで あ り,ど
ロ ッ トに よ る 比 較 で 結 論 が か わ る 可 能 性 が あ
ち ら を使 うか は,数 理 の 枠 内 で 答 え を期 待 す べ き こ とで
は あ り ませ ん, 要 す る に,1 つ の 指 標 値 を使 っ て 測 れ る とは い え な い 問 題 で す.だ
か ら,図
を使 う
ま た,「 適 合 して い る 」あ る い は 「適 合 して い な い 」 とわ り き っ た 答 え は,で
きない
の で す.
の で す.だ
か ら,比 較 の 観 点 や,使
え る デ ー タ に 応 じて,比
較 の仕 方 を選択 すべ きで
す. こ れ ら の こ とに 関 連 し た い くつ か の 注 意 点 を,7.4節 ⑩
で 説 明 し ま す.
こ れ ら の 図 を か く ため の 計 算 例 を あ げ て お き ま し ょ う.
こ れ ま で に 説 明 し た とお り,「 正 規 分 布 か 否 か を み る 」場 合 に 限 ら ず 適 用 で き る も の で す が,例
示 で は,そ
上 の 表7.3.8は,P-Pプ 計 算 例 で す.両 す.相
の 場 合 を 取 り上 げ て い ます. ロ ッ トを か くた め の 計 算 と, Q-Qプ
ロ ッ トを か くた め の
者 の 相 違 点 を 把 握 で き る よ うに 対 比 し た 計 算 フ ォ ー ム に し て あ り ま
違 点 は,列
5と列 6で す.
⑪ ロー レ ン ツ カ ー ブ とS-Sプ
ロ ッ ト
累 積 分 布 図 に お け る 2本 の 線 の 差 を X
図7.3.9
と X*に
累 積 分 布 とS-Sプ
ロ ッ ト
よ っ て 測 るQ-Qプ
ロ ッ ト,P
も う ひ と つ の 代 案 と し て,図7.3.9の さ い 方 か ら P%ま
図7.3.10
累積 分 布 と ロー レ ンツ カ ー ブ
と P*に よ っ て 測 るP-Pプ よ う に,P
ロ ッ トに 対 す る
ま で の 面 積 す な わ ち 「X の 値 を小
で の 観 察 単 位 に つ い て 累 積 し た値 」(こ れ を S と表 わ す)で 測 る こ
とが 考 え られ ます. S の 定 義 か ら,こ れ が,ロ
ー レンツ カー ブの縦軸 に とった値 に なって い るこ とに注
意 して くだ さ い. し た が っ て,P
に 対 応 す る S と S*を 求 め,
S と P の 関 係(図 の 太 線)お よ び が,ロ
S*と P の 関 係(図 の 細 線)を1枚
ま た,図7.3.9の
よ うに
S と S*の 関 係 を プ ロ ッ ト した もの
をS-Sプ
ロ ッ トと よ ぶ こ とに し ます.
⑫S-Sプ P-Pプ
の 図 に プ ロ ッ トし た も の
ー レ ン ツ カー ブ だ と理 解 で き ます(図7.3.10).
ロ ッ トは,累
積 分 布 の 形 を 比 べ る と い う 目 的 に 対 し てQ-Qプ
ロ ッ ト,
ロ ッ トと 同 等 性 を も っ て お り,「 分 布 形 の 差 を 図 の S で 測 る 」 と こ ろ が ち が う
の で す.そ
の 限 りで は,Q-Qプ
ロ ッ ト, P-Pプ
ロ ッ トの ほ か に こ れ を 使 う必 要 は な
い で し ょ う. た だ し,図
の S は,ロ
え ま し ょ う. ロー レ ンツカー ブ は
ー レ ン ツ カー ブ で 使 わ れ て い ま す か ら,そ れ との 関 係 を 考
モ デ ル と して 想 定 さ れ た 分 布 が 一 様 分 布 な ら, P,S(P)の
関 係 が 二 次 曲 線(幅0の
場 合 に は 直 線)
に な り ま す か ら,観 察 値 の 分 布 と一 様 分 布 を 比 較 す る た め に 使 う こ とが で き ま す.一 般 に は,幅0の
場 合 を想 定 し て そ れ と比 べ る た め に 使 わ れ て い ま す が,幅
0以 外 の場
合 に も適 用 で き る こ とに 注 意 し ま し ょ う. ま た,2 つ の ロ ー レ ン ツ カー ブP-SとP-S*を
重 ね て 示 す か わ り に,S-S*を
縦
軸 横 軸 に とっ て, モ デ ル に合 致 す る か 否 か ⇔ 直 線 か 否 か とい う見 方 が で き る よ う に す る と い う 意 味 でS-Sプ す が,モ
ロ ッ ト を使 う こ とが 考 え ら れ ま
デ ル と し て 一 様 分 布 を 想 定 した 場 合 は そ れ との 差 を ジ 二 係 数 で 測 れ る こ と を
考 慮 に 入 れ る と,2 つ の ロー レ ン ツ カ ー ブP-SとP-S*を
重 ね る表 わ し方 の ほ うが
よ い と い え る で し ょ う. ⑬
ロ ー レ ン ツ カ ー ブ は 「一 様 分 布 と比 較 す る 手 段 」 と位 置 づ け ら れ て い ます が,
よ り広 い場 面 で 使 う こ とが 考 え られ ま す. す な わ ち, 累 積 分 布 曲 線 を か く と き,モ デ ル と想 定 され る分 布 形 に 対 応 す る 累 積 分 布 が 直 線 に な る よ う に変 換 して お く な ら,そ の 図 の 上 で 計 算 し た 面 積 S を使 っ て P とS(P)の に か く と,同
関係 をロー レン ツ カーブ
じ見 方 を適 用 で き る の で す.
い い か え る と,「 想 定 され た モ デ ル を一 様 分 布 に 対 応 させ る 変 換 ル ー ル を適 用 して, 観 察 値 を変 換 し,変 換 値 が 一 様 分 布 に な っ て い る か 否 か で,モ る こ とが で き る 」こ と を意 味 し ます.
図7.4.1
7.4 適 合 度 の 検 定 ①
分 布 形 を 比 べ る方 法 と して,よ
く使 わ れ て い る
の は,「 適 合 度 検 定 」 と よ ば れ て い る もの で す. こ の 方 法 で は,観
察 さ れ た 分 布 形P(X)と,そ
対 す る モ デ ル と して 想 定 さ れ て い る分 布 形P*(X)
れに を比
べ るた め に,
X の 値 域 を い くつ か に 区 分 し
各 値域 ご とに〓 こ れ らの2乗
和X2=ΣZI2を
を求 め 計算 す る
の で す. こ れ を,カ
イ 2乗 統 計 量 と よ び ます.
各 値 域 ご と に 計 算 され るZIは,当
デ ル との へ だ た りを み
該 値域 に属 す る度
分 布形の比較
〓
数NIの
割 合 を 表 わ す 比 率PI=NI/Nに
を,PIの
標 準 偏 差√PI*/Nで
つ い て,想
定 さ れ るPI*か
ら の 偏 差PI-PI*
わ っ た形 で す.
こ れ で 各 値 域 で の 適 合 度 を 測 り,全 体 で み た 適 合 度 を み る た め に,そ をつ くっ た もの …
れ ら の2 乗 和
こ う解 釈 で き ます.
実 際 の 計 算 で は,こ
れ を変 形 した 式 NI=NPI ,NI*=NPI*
,
を使 って 計 算 し ます が,も
との 式 で み る よ うに,各
値 域 で の 偏 差 を対 等 に 扱 っ て(ウ
エ イ トを つ け ず に)総 合 した 形 に な っ て い る こ とに 注 意 し ま し ょ う. こ の こ とか ら,N そ う して,そ
が 大 きい 場 合,ZIの
の こ と か ら,χ2の
分 布 が 正 規 分 布 と な る と 期 待 で き る こ と,
分 布 が,自
由 度K-1の
カ イ2 乗 分 布 と よ ば れ る も
の に な る こ と が 証 明 さ れ る の で す. ◇ 注 こ の こ とは,「 各値 域 での偏 差 を対 等 に扱 え」とい う こ とで は あ り ませ ん.
「分布 形 を比べ て適 合 度 をみ る」 とい う問題 を取 り上 げ る と きに,中 央 部分 を重 視 した い 場 合 もあ れば,端 の部 分 を重視 した い場 合 もあ る で しょ う.ま た,現 実 の デー タで は,端 の 部 分 に はア ウ トラ イヤー が 混在 してい る可 能性 が 高 い の で,そ の 部 分 の ウ エ イ トを下 げ た い場合 や,そ の部 分 を除 いて み た い場 合 な どが あ る で し ょ う.こ うい う点へ の対 応 につ いて は,後 述 します.
②
上 記 の 定 義 か ら,す べ て の 値 域 でPIがPI*に
に近 い値 を も ち ます.こ
の こ と を利 用 し て,分
検 定 す る こ とが で き ます.す
近 い な ら,カ
イ2 乗 統 計 量 は0
布 形P(X)がP*(X)
に近 い か否 か を
なわ ち
「す べ て の 値 域 に お い てPI=PI*」
が 真 な ら
帰結 事実 結論
P(χ2Cだ
っ た
よ っ て,仮 こ こ で 使 っ た 統 計 量χ2は,上
仮説
説 は 棄 却 され る
に 述 べ た と お り,「 自 由 度K-1の
よ ば れ る 分 布 を も ち ます か ら,そ の 分 布 の 統 計 数 値 表 を み て,棄
カ イ2 乗 分 布 」 と 却 限 界 C を定 め る
こ とが で き ます. こ の 統 計 量χ2を 使 っ て適 合 度 を検 定 す る方 法 は,カ ③
こ の 方 法 は,本
P(X)とP*(X)を
来,特
イ2 乗 検 定 と よば れ て い ます.
定 区 分 に 対 応 す る構 成 比 を 比 較 す る 方 法 で あ り,分 布 形
比 較 す る 問 題 に 適 用 す る と きに は,
値 域 を設 定 す る 想 定 さ れ た 分 布 形 に 対 応 す る(PI*)を
計算 す る
と い う過 程 が つ け加 わ って く る こ と に 注 意 し ま し ょ う. こ の 場 合,値 が 必 要 で す.
域 は,「 分 布 の 形 を 把 握 す る た め に 必 要 な 数 と区 切 り方 」に す る こ と
ま た,「 分 布 の 形 を 比 べ る」 と き に は,位 論 ず る も の と して,そ
置 の ちが い,ひ
ろ が り幅 の ち が い は 別 に
れ らの ちが い を 調 整 し た 上 で(い い か え る と,偏 差 値 に お きか
え て)分 布 形 を 比 べ る の が 普 通 で す.
位 置の 比較 ひ ろ が り幅 の 比 較 … こ れ ら は別 に行 な う もの と し,
分 布 形の 比較
偏 差値 の比較 そ うせ ず に 比 べ た 場 合,た
… こ こ に 注 目す る
と え ば,「 分 布 形 は 同 じ で 位 置 が シ フ ト した だ け 」で も,
分 布 形 が 異 な る と結 論 して し ま うこ と に な り ます. 「分 布 形 」を比 べ る 問 題 を 「 選 ん だ値域 にお け る比率」を比べ る問題 と して扱 うこ と に な る の で,値 域 の 選 び 方 を考 え な け れ ば な り ませ ん. 区 切 り方 を 自 由 に 決 め う る な ら,た ろ で 区 切 る(14区
と え ば,偏
差 値 が/3/2.5/2/1.5/…/3/の
分 に な る)と か,/3/2/1/0/1/2/3/の
と よ い で し ょ う,自 由 に 決 め う る の で す が,決
とこ
と こ ろ で 区 切 る(7 区 分 に な る)
め 方 に よ っ て,x2の
値 が か わ る の で,
特 に 理 由 が な け れ ば 標 準 を採 用 し よ う とい う趣 旨 で す. た だ し,そ
の た め に は,ひ
が 利 用 で き ず,分
とつ ひ とつ の 観 察 値 が 必 要 で す.ひ
採 用 して い る 区切 り方 を,そ
の ま ま,採 用 せ ざ る を え ませ ん.そ
に お きか え て 使 う こ と に な り ます.
表7.4.2 適 合 度 検 定 の ため の計 算例
列 1∼3 基 礎 デー タ.こ
れ に も とづ い て 平均 値 と標 準 偏 差 を計 算.
平 均=126,標 準 偏 差=15.8 列 4 値 域 の 区切 り値 を偏差 値 に お きか え る.
標準正規分布 が適合 する とした場合 に各値 域に入 る 「比率 」.
列 5
標 準 正 規 分 布 の数 値 表 を 使 っ て 求 め る. 列 6∼7 期 待 度 数N×P*,度 列 8
と つ ひ とつ の 観 察 値
布 表 の 形 に ま とめ た情 報 しか 利 用 で き な い と きに は,そ
(N-N*)2/N.そ
数 の差N-N*. の 合 計 が,適
合 度 をみ る ため の 統 計 量x2.
の分 布表 で
の 区 切 り値 を 偏 差 値
利 用 で き る分 布 表 の 区 切 り方 が 適 正 で な い(た と え ば 最 上 位 の 区 切 りに 度 数 が 集 中 して い る)と き に は,適 ④
例 と し て2.4節
2.4.2)に
つ い て,こ
正 な 結 果 が 得 ら れ な い こ とに な り ます . で 「 正 規 確 率 紙 を 使 っ て 正 規 分 布 の 適 合 性 」 を み た 例(図
の 節 の 方 法 を適 用 して み ま し ょ う.
得 ら れ たχ2は1204で
あ り,統 計 数 値 表 で み た 棄 却 限 界 値 は9.5で
す か ら,
「正 規 分 布 が 適 合 す る 」 とい う仮 説 は 棄 却 さ れ る と い う結 果 で す. ⑤
こ の 方 法 は よ く使 わ れ て い ます が,次
の 点 に 注 意 し ま し ょ う.
値 域 の 区 切 り方 が 結 果 に 影 響 す る 値 域 の どの あ た りで 適 合 し,ど の あ た りで 適 合 して い な い か を判 断 で き な い こ の こ とか ら,す で に指 摘 した よ うに,で
きれ ば 値 域 の 区切 り方 を標 準 化 し た い の で す .
ま た,「χ2の 内 訳 を 表 示 し て お き,適 合 し て い な い」箇 所 を 見 わ け る こ と が で き る よ う な 計 算 フ ォー ム を採 用 し た の で す. 基 本 的 に は,χ2の
計 算 値 だ け で適 合 度 を み る の で な く,「PIとPI*の
差 を み る」 と
い う問 題 意 識 に た ち も ど っ て 考 え ま し ょ う.そ の 意 味 で は,「 正 規 確 率 紙 へ プ ロ ッ ト す る」方 法,あ
る い は,前
節 で あ げ たP-Pプ
ロ ッ トの よ うな 図 示 に よ る 方 法 の 方 が
す ぐれ て い る とい え ます. 上 の 計 算 例 の 中 に 求 め ら れ て い る P と P*を 縦 軸,横 P-Pプ
ロ ッ トを え が く こ と が で き ま す.ま
X*を 使 っ てQ-Qプ ⑥
た,比
軸 に と っ て プ ロ ッ トす る と
率 P に 対 応 す る X*を 求 め,X
,
ロ ッ トを え が く こ と も で き ます.
こ の 節 の 方 法 は,観
察 値 の 分 布 を 「想 定 さ れ る モ デ ル 」 と比 較 す る 問 題 に 限 ら
ず,「 観 察 さ れ た 分 布 の う ち 標 準 とみ ら れ る もの 」 と比 較 す る問 題 に も適 用 で き ま す . こ の 方 が,適
用 場 面 が 広 い で し ょ う.
た とえ ば,変
数 X の 分 布 を年 齢 別 に わ け て み た と き,分 布 が か わ る か 否 か を確 認 表7.4.3
血 圧 の分 布 形 の 男 女 差(年 齢40歳
台,1975年)
し た い … そ の た め に,「 全 体 で み た と き の 分 布 と比 べ る」 と い う問 題 で す が,「 各 区 分 で み た 分 布 が 全 体 で み た 分 布 と一 致 す る 」 とい う仮 説 を検 定 す る形 で 扱 う こ とが で き ま す. 表7.4.3の
よ うに,全
体 で み た と き の 分 布 と一 致 す る と仮 定 した と き に期 待 され る
度 数 を 計 算 し,「 そ れ と観 察 度 数 との 偏 差 」を も と に してχ2値 を計 算 し て,「 分 布 が か わ ら な い 」 と い う仮 説 を検 定 す るの で す. 棄 却 限 界 は,カ
イ 2乗 分 布 の 統 計 数 値 表 か ら求 め る の で す が,自
由 度は
(分布 を み る た め の値 域 の 区 分 数-1)×(比 較 区 分 数-1) と し ます. χ2=47.2で
す.棄
され ます.計
算表 の 「 適 合度 」の 欄 でχ2の 内 訳 が よみ とれ ます か ら,寄
却 限 界値 は,16.9で
す か ら,血
所 に つ い て D の 符 号 を み る と,血 圧120以
圧 の 分 布 は 男 女 で 異 な る と判 定 与の大 きい箇
下 で は 女 が 多 く,血 圧140台,150台
で
は 男 が 多 い こ とが わ か り ます. こ こ で は,「 平 均 値 あ る い は標 準 偏 差 の ち が い を含 め た 比 較 」を して い ま す.し が っ て,こ
こ で 見 出 さ れ た 差 が,た
しれ ませ ん.た
とえ ば,偏
う.そ の 場 合,値
差 値 に お き か え た 上 で,男
女 別 比 較 を して み るべ き で し ょ
域 区 分 が ち が うこ と に な る の で,こ
章 末 の 問 題 の うち,問
た
とえ ば 「平 均 値 の ち が い 」 と して 説 明 さ れ るか も
こ で 示 した 扱 い は で き ませ ん.
6で す.
7.5 ロー レン ツ カー ブ に お け る観 察 単 位 の サ イ ズ 差 の扱 い ①7.1節
で,「 K 県 の 市 町 村 別 病 床 数 」の 分 布 に 関 す る ロー レ ン ツ カ ー ブ を 示 し
ま し た(図7.5.1,図7.1.4の ま し た.こ
こ で,そ
再 掲)が,考
の 後 をつ づ け ま し ょ う.
図 に 付 記 し て あ る よ う に,ジ 大 き い 値 で す.こ
え る べ き問 題 が 残 っ て い る と注 意 して お き 図7.5.1 ロー レ ンツ カー ブ の 例
二 係 数 は0.74と
い う
の こ とか ら,「 病 床 数 が 一 様 に 配 置
さ れ て い る と は い え な い 」… そ う 解 釈 し て よ い で し ょ うか.こ
うい う問 題 で す.
一 様 と い う語 の 解 釈 が 問 題 で す.ま
た,そ
の 語 の解
釈 に 応 じ て ロー レ ン ツ カー ブ の 書 き 方 や 指 標 の選 び 方 を か え る こ とが 必 要 で す. ②
問 題 点 を 説 明 す る た め に,ま
ず,ロ
カー ブ の 誘 導 手 順 を要 約 して お き ま し ょ う.
ーレ ンツ
市町村の病 床数
◆ ロ ー レ ンツ カー ブの 書 き方 A
観 察 単位(e)を 観 察値 の大 きさ(X)の 順 に並 べ その順 位(= 観 察単 位数 の 累積)を 横軸 に と り X の 累積値 を縦 軸 に とって 図示 こ こ で, 観 察 単 位 を大 き さ の 順 に 並 べ る と き, そ れ ぞ れ を 1と カ ウ ン ト して い ます か ら,そ の 順 位 =観 察 単 位 数 の 累 積 と解 釈 で き る こ と に な り ます. ま た,こ
の こ とか ら,ロ
察 単 位 が ○%の
ー レ ン ツ カ ー ブ が 直 線 に な っ た と き,「 順 位 ○%ま
で の観
値 を もつ 」す な わ ち 「X の 分 布 が 一 様 だ 」と い う解 釈 が 誘 導 さ れ るの
で す. 図7.5.1の
場 合 は,各
市 町 村 を ひ とつ ひ とつ の 観 察 単 位 と み て い ま す か ら,観 察 単
位 の 大 き さ が 異 な り ます.こ
の こ と を考 え に 入 れ る こ とが 必 要 で す.
各 観 察 単 位 を そ れ ぞ れ 1つ の 単 位 と し て 扱 っ た場 合,「 ジ 二 係 数 が 小 さ い,よ っ て 一 様 に 分 布 して い る 」 とい う結 論 は ,「 観 察 単 位 の サ イ ズ い か ん に か か わ ら ず,同 じ 数 だ 」 と い う こ と で す が,こ
れ を 「一 様 だ 」と い う解 釈 に つ な ぐ と,異
論 が出 るで
し ょ う. 「ジ 二 係 数 が 大 き い,よ
っ て,一
様 に 分 布 して い る と は い え な い 」 と い う結 論 に 対
し て は,「 各 市 町 村 の サ イ ズ差 が 考 慮 さ れ て い な い … 大 き い 市 町 村 で 多 く,小
さい
市 町 村 で は 少 な い の は 当 然 だ 」 と批 判 さ れ る で し ょ う. 問 題 と さ れ て い る の は,た か 」を み る こ と で す か ら,こ す.一
と え ば 「人 口 あ た りで み て 公 平 に 配 置 さ れ て い る か 否 の 図 で は,問
題 意 識 に答 え た こ とに な って い な い の で
様 とい う コ トバ を使 う と き に は,こ
う い う問 題 意 識 を もち こ む こ と が 必 要 と さ
れ る の で す. ③ よ っ て,観
察 単 位 の サ イ ズ差 を考 慮 に 入 れ る こ とに し ま し ょ う.
まず 考 え られ る の は,「 人 口 あ た りで み て一 様 か 否 か をみ よ 」 と い う な ら,
基 礎 デ ー タ X を サ イ ズ S で わ っ てY=X/Sと
お き か え,
Y に つ い て の ロー レ ン ツ カ ー ブ をか く こ とで し ょ う. 上 掲 の 書 き方 A に お け る指 標 X の か わ りにX/Sを が,書
き 方 B で す.
使 う も の とす る の で す.こ
れ
図7.5.2
人 口あ た り比 率 に して 扱 う
図7.5.3
観 察 単 位 の サ イ ズ差 を考 慮
◆ ロー レ ンツ カー ブの 書 き 方 B
観察 単位(e)を 指標Y=X/Sの
大 きさの 順 に並べ
その順位(= 観 察 単位 数の 累積)を 横 軸 に と り Y の累積値 を縦軸 に とって図示 こ の 案 に 沿 っ て か く と,図7.5.2が ほ ぼ 直 線 に な っ て い ます.ジ れ ば,ほ
小 さ い 値 で す か ら,人
口あ た りでみ
ぼ 一 様 に 配 置 され て い る と判 定 で き ま す.
こ れ で よ さ そ うで す が,別 ④
得 られ ま す.
ニ 係 数 も0.392と
の 書 き方 が 考 え ら れ ま す.
次 の 書 き方 C で す. ◆ ロー レンツカーブの書 き方 C 観 察 単 位(e)を 指 標Y=X/Sの
大 きさの順 に並 べ
S の 値 を 累 積 した 値 を横 軸 に と り Y の 累積 値 を縦 軸 に と っ て 図 示 「観 察 単 位 数 の 累 積 」の と こ ろ を,「 観 察 単 位 の サ イ ズ S の 累 積 」 とお きか え て い る こ と が こ の 案 の 意 義 で す.こ 「S で み て ○%の
の お きか え に よ っ て
範 囲 に X の △%が
集 中 して いる」
とい う見 方 に,自
然 な 形 で 対 応 す る 表 わ し方 に な っ て い ま す.
図7.5.3が,こ
の 書 き方 に よ っ た ロー レ ン ツ カ ー ブ で す.
⑤
こ の よ うに 3 とお りの 書 き方 に よ っ て,著
し く ち が う図 に な る とす れ ば,当
然
どれ が 妥 当 か を考 え る こ とが 必 要 で す. 3 とお りの 扱 い 方 の ちが い は す で に 表 示 し て あ り ます が,ち に 焦 点 を あ て れ ば,次 説 明 図 で は,各
ペ ー ジの 図7.5.4で
市 町 村 の 情 報 を(X,S)を
が った図 に な る とこ ろ
説 明 で き ま す. 成 分 とす るベ ク トル で 表 わ し て い ます.
図7.5.4
観 察 単 位 の サ イ ズ差 へ の 対 応
まず, こ れ ら の ベ ク トル を X/Sす
な わ ち,ベ
ク トル の 方 向 角 の順 に
加 え て 得 ら れ る折 れ 線 が ロ ー レ ン ツ カ ー ブ だ と理 解 で き る こ と に 注 意 し ま し ょ う. た だ し, 各 観 察 単位 の 情 報X/S(ベ
ク トル の 長 さ)に つ い て,ち
が った扱 い
を して い ます. す な わ ち, 書 き方 C で は,(X,S)の
情報 をその ままの形 で扱 ってい る
書 き方 B で は,S = 一 定 の 断 面 の とこ ろ まで ベ ク トル を伸 縮 して い る 書 き方 A で は,S = 一 定 の 断 面 へ 射 影 した 形 で 扱 っ て い る の で す. よって
観 察 単 位 の サ イ ズ 差 を 考 慮 せ ず に 扱 う
書 き方 A
観 察 単 位 の サ イ ズ 差 を 補 正 し た指 標 を 使 う
観 察 単 位 は サ イ ズ 差 を考 慮 せ ず,そ
れ ぞ れ 1つ と扱 う
書 き方 B
観 察 単 位 は サ イ ズ 差 に応 じた ウ エ イ トを 考 慮 し て 扱 う
書 き方 C
とい う使 い わ け をせ よ と い う こ と に な りま す. 「一 様 分 布 か 否 か をみ る 」に して も,
「 一 様 とい う こ との 意 味 」 を考 え る こ とが 必 要 で あ る こ と,特 に, サ イ ズ の 異 な る観 察 単位 の 情 報 を 扱 う と き に, 手 法 の 選 択 を 誤 る と,誤 読 の お そ れ が あ る こ と に 注 意 し ま し ょ う. ⑥
前 項 に お け る サ イ ズ の か わ りに,X
の 大小 を説明 す る変数 Z を使 っ て同 じよ
うに ロ ー レ ン ツ カ ー ブ をか くこ と が 考 え ら れ ます. 説 明変数 Z の大 きさの順 に 被 説 明 変 数 X の 値 を 累 積 して み る こ の 形 で か い た ロー レ ン ツ カ ー ブ が 直 線 に な る こ と は, 比 率X/Zが
一定だ
とい うこ とで す. し た が っ て,ロ に つ い て は,無
ー レ ン ツ カー ブ を こ うい う場 面 で 使 う こ とが で き ま す が,ジ
条 件 に 使 う こ と は で き ま せ ん.保
留 条 件 が つ き ま す.す
が Z に 対 して 単 調 増 加(ま た は 減 少)し て い る と い う条 件 で す.こ い な い と き は,ロ
ニ係 数
な わ ち,X
の 条 件 を み た して
ー レ ン ツ カ ー ブ が 対 角 線 と 交 わ る ケ ー ス が あ り う る か ら で す.
7.6 基 礎 デ ー タ の 表 現 に 関 す る問 題 ①
図7.1.8で
例 示 し た 「貯 蓄 保 有 高 の ジ ニ 係 数 」の 推 移 に お い て,基 礎 デ ー タ の
選 択 に つ い て考 え る べ き点 が あ る … こ の 節 で は,利
と指 摘 して あ り ま した.
用 で き る(利 用 で き そ う な)デ ー タ を あ げ て,ど
れが 採 用 され て い
る か を探 りつ つ,基 礎 デ ー タ の 選 択 が 結 果 に 大 き くひ び く こ と を指 摘 し ま す. ②
各 世 帯 の 貯 蓄 保 有 高 以 下(貯 蓄 保 有 高 を X と表 わ す)の 分 布 を表 わ す 統 計 表 と
い う と,次 の 表7.6.1が
典 型 で す.
こ れ に も とづ い て ロー レ ン ツ カ ー ブ と ジ ニ 係 数 を 求 め る に は,7.1節
に示 した計 算
フ ォ ー ム を適 用 す れ ば よ い の で す. た だ し,上 位 の 階 級 区分 の 幅 が 広 く,区 間 の上 限 が 明 示 され て い ませ ん. そ の こ とか ら,各 区 分 の 代 表 値 を ど う想 定 す るか が 問 題 に な り ま す.特
に,年
次変
化 を 調 べ よ う とす る と, 年 々 最 上 位 の 世 帯 数 が 多 く な る こ と そ の た め,あ
る年 次 に,区
切 り方 が 改 定 され る こ と
か ら,計 算 結 果 に 段 差 が 現 わ れ ま す(図7.6.3の
実 線).
「区 切 り方 を 改 定 し な け れ ば な ら な い, しか し,改 定 す る と そ の こ と が 結 果 に ひ び く」 とい う こ とで す. ③
区 切 り方 を 表7.6.2の
形 式 に し た 統 計 表 が あ り ます.第
3章 で 述 べ た 5数 要 約
表7.6.1
統 計 調査 に お け る 分 布 の 表 現(1)
表7.6.2
統 計 調 査 に おけ る分 布 の 表 現(2)
図7.6.3
図7.1.8に
関 す る別 デー タ に よ る計 算 結 果
の 形 で 表 現 し た も の です. 階 級 区 分 の 区 切 り方 が 実 額 で な く,ラ
ン ク区 分 に よ って い る た め,年
次に かか わ ら
な い 区 切 り方 に な っ て い るの で す. 区 切 り数 が 少 な く,区 切 り幅 が 広 い た め,各 が 残 っ て い ます が,計 図7.6.3で
は,破
区 分 の 代 表 を想 定 しに くい と い う問 題
算 結 果 に 段 差 を生 じ る とい う問 題 は 避 け られ ます.
線 で示 して あ り ます.破
線 の な い 部 分 は,こ
の形 の統 計表 が集 計
さ れ て い な か っ た 部 分 で す. ラ ン ク区 分 を も っ と細 か くす れ ば,代 表 値 の 想 定 が しや す くな りま す が,貯 蓄 保 有 高 に つ い て は,こ
の 形 式 の 統 計 表 が 集 計 さ れ て い る の は,1978年
以 降 です.
◇ 注 た とえ ば,コ ン ピュー タ用 のデ ー タベ ー ス に収録 す る とき,こ の よ うな 区切 り方 の 変 更 に関 す る情報 が 記録 され て い る とは 限 りませ ん. また,基 本 的 な問 題 と して,「 区 切 り方 が 不 適 当 で あ っ て利 用 しに くい 」こ と もあ りま す.
表7.6.4
④
図7.1.8で
統 計 調 査 に おけ る分 布 の 表現(3)
扱 っ た数 字 は,表7.6.1,表7.6.2の
ど ち ら と も合 致 して い ませ ん.
図 の 見 出 し に あ る 「所 得 階 級 で み た 」 とい う 句 は,「 貯 蓄 保 有 高 の 分 布 」の デ ー タ に 問 題 が あ る が ゆ え に,表7.6.4の
デ ー タ を代 用 し た こ と を示 して い る の で す.
キ イ ワ ー ド 「年 収 五 分 位 階 級 」,「貯 蓄 保 有 高 」の 両 方 で 検 索 す る と,表7.6.4の
形
の 統 計 表 が み つ か る で し ょ う(大 き い統 計 表 の 一 部 に な っ て い ます). こ の 表 は貯 蓄 高 X の 分 布 を み る た め に 用 意 さ れ た 表 で す が,階
級 区分 の 基礎 デ ー
タが X で な く,年 収(以 下 こ れ を Z と す る)に な っ て い ます.し や 表7.6.2の
よ うに X そ の もの の 分 布 に つ い て 計 算 した ジ ニ 係 数 と ち が う値 に な り
ます が,7.5節
で 述 べ た よ う に,X
の 変 化 を 説 明 す る Z を使 っ て
Z の 低 い 方 か ら世 帯 を並 べ,X 形 の ジ ニ 係 数 だ と理 解 す れ ば,こ ま た,こ
た が っ て,表7.6.1
の シェアー の変化 をみ る
れ を使 う こ とが で き ます.
の 形 の 統 計 表 を 使 う な ら,階 級 区 分 内 の 世 帯 で み た 平 均 値 が 集 計 され て い
ます か ら,各
区 分 の 代 表 値 を 想 定 し な く て す み ま す.し
た が っ て,年
々 の 推 移 を,
「 計 算 手 順 で の 想 定 」に 影 響 さ れ な い 形 で 把 握 で き る こ とに な りま す. も ち ろ ん,結
果 に 段 差 が 発 生 す る こ とは あ り ませ ん.
⑤
こ の 節 の 例 示 で み た よ うに,利
す.ひ
とつ ひ とつ の 観 察 単 位 の情 報 が 使 え る な ら,こ
用 で き る統 計 表 の 形 式 に 注 意 す る こ と が 必 要 で
が,統
計 調 査 の 場 合 は,「 統 計 表 の 形 に 集 計 され た 結 果 」の 範 囲 で 使 う こ と に な り ま
す.ま
た,こ
うい う 問 題 は 起 こ ら な い の で す
の 節 で例 示 し た 注 意 が 必 要 とな る の で す.
統 計学 で扱 う数 は,具体 的な 意味 を もつ数 的情報 統 計 学 で 扱 う数 は,数 す.そ
学 的 な 扱 い をす るに して も,数 学 で 扱 う数 とは ち が い ま
れ ぞれ の 数 字 は あ る 情 報 を表 わ し て い ま す.そ
う し て,そ
れ が もつ 意 味 を
拾 い 出 す こ と を考 え て い る の で す. 当 然,そ
の 定 義,そ
の 求 め 方 を考 慮 に 入 れ た 扱 い 方 を考 え る こ とが 必 要 で す,
一 定 の 条 件 下 で く りか え し観 察 さ れ た 「き れ い な デ ー タ 」ば か りで は な く,そ れ ぞ れ 異 な っ た 条 件 下 で 観 察 され た 「よ ご れ た デ ー タ」を 対 象 と し な け れ ば な ら ず,「 き れ い な デ ー タ を 想 定 し た き れ い な 方 法 」を適 用 で き る と は 限 り ま せ ん. し た が っ て,ま 必 要 で す.統
ず,「 デ ー タ を き れ い に す る 」た め の ス テ ッ プ を 適 用 す る こ と が
計 学 を 適 用 す る と きに,注
意 すべ き こ とで す.
問題7
【ロー レ ン ツ カー ブ と ジ ニ 係 数 】 問 1 (1)次
は,わ
1996∼98年 l998年
が 国 に お け るパ ソ コ ン 販 売 台 数 を98年
の 上 位 7社 に 注 目 し て,
に つ い て 調 べ た 結 果 で あ る. に お け る各 社 の シ ェ ア ー を 示 す ロー レ ン ツ カ ー ブ を か き,ジ
ニ係 数 を
計 算 せ よ. 表7.A.1
(2)1996年
に お け る各 社 の シ ェ ア ー を 示 す ロ ー レ ン ツ カ ー ブ を か き,ジ ニ 係
数 を 計 算 せ よ.こ で は,1998年
の 場 合,上
位 7社 の 範 囲 が か わ る可 能 性 が あ るが,こ
に お け る上 位 7社 に つ い て み る もの と し て い る.1996年
のデー タ の結 果 と
1998年 の 結 果 を 比 べ る と き,こ の こ と が ど う影 響 す る か を 指 摘 せ よ. 問 2 (1)次 で あ る.こ
は,各
県 の 県 内 総 生 産 額(単 位:百
億 円)を 上 位10県
れ(以 下 X と表 わ す)に つ い て,経
に つ い て み た もの
済 活動 の地 域別 構 成 の変化 をみ る
もの とす る. 表7.A.2
a.こ の10県
の 範 囲 で み た ロ ー レ ン ツ カ ー ブ と ジニ 係 数 を各 年 次 ご と に 求 め,
比 較 せ よ. b.順 位 の 入 れ か わ っ た 県 が あ る が,そ の 順 位 を 使 っ て 計 算 す る と,1990年 c.10年
の こ と を無 視 し,1980年
における X
の結 果 は ど うか わ る か.
間 の変 化 率 を計 算 し,こ れ を 比 べ て 「変 化 の 大 きか っ た 県,小
さか っ
た 県 」を調 べ て み よ. (2)(1)に あ げ た10県 を行 な っ て み よ.た
以 外 の37県
だ し,37県
を 「そ の 他 」と み な し て,(1)の
b,cの 計 算
の 値 ひ とつ ひ とつ の ちが い は 考 慮 し な い もの と
す る.い
い か え れ ば,順
県 が37あ
位11以
降 に 同 じ値(37県
の 合 計 値 の1/37の
値)を も つ
る もの と して 計 算 す れ ば よ い.
(3)(1)に あ げ た10県
以 外 の 値 を適 当 な 資 料 か ら拾 っ て,(2)に 示 し た 簡 単 化
を行 な わ ず に 計 算 す る と,結 果 は ど うか わ る か. 間 3 (1)付
表X.4に
つ い て ジ ニ 係 数 を 計 算 し,テ
キ ス トの 本 文(表7.1.5)に
示 し
た 値 が 得 られ る こ と を確 認 せ よ. (1)の 計 算 を プ ロ グ ラ ムBUNPU2に て セ ッ トし て あ る が,テ
よ っ て 行 な え.基
礎 デー タ は例 示 用 と し
キ ス トの 説 明例 2(大 き い 方 か ら 累 積)と 表 示 され て い る
分 を 使 うこ と. 注:大
きい方 か ら累積 す る表 現 が ロー レン ツ カー ブ での 慣 習 で あ るが,累 積 分 布 図 な
ど と合 わせ るため には,小 さい 方か ら累積 す る表 現 を採 用 す る方 が よい だ ろ う. 【 分布 の表 現】 問 4 (1)付
表X.4に
つ い て,分 布 図,累
積 分 布 図,ロ
ー レ ン ツ カ ー ブ をか け.
ま た,累 積 分 布 図 に つ い て は,正 規 分 布 と比 較 す る た め のQ-Qプ はP-Pプ
ロ ッ トを か け.す べ て,プ
(2)付 表X.4の 問 5 (1)付
ロ グ ラ ムBUNPU2を
デ ー タ を対 数 変 換 し た もの に つ い て,(1)と
表 A の う ち収 入 総 額 に つ い て,分
ブ をか け.ま
た,累
布 図,累
積 分 布 図 に つ い て は,正
ロ ッ トあ る い はP-Pプ
ロ ッ ト をか け.こ
ロ ッ トあ る い
使 うこ とが で き る. 同 じ 図 をか け.
積 分 布 図,ロ
の 場 合,基
礎 デ ー タ が 観 察 単 位 ご との
デ ー タ だ か ら,分 布 表 を求 め る過 程 を含 む プ ロ グ ラ ムBUNPU1と 方 指 定 文 を付 加 し た デ ー タ フ ァ イ ルDH10VXを 注:BUNPU1の
使 う こ と.
使 うこ ともで きます.
(2)(1)で 取 り上 げ た 収 入 総 額 を 対 数 変 換 し た値 に つ い て,付 累 積 分 布 図,ロ
ー レ ン ツ カー ブ をか け.ま
と比 較 す る た め のQ-Qプ (3)付
値 域の 区切 り
処理 手順 を 「 正 規 分布 と比 較 す る場 面 に特 化 した もの」がBUNPU4
です.こ の 問題 に 限 れ ばBUNPU4を
7.2.1に
ー レンツ カー
規 分 布 と 比 較 す る た め のQ-Qプ
た,累
ロ ッ トあ る い はP-Pプ
表 A の う ち収 入 総 額 に つ い て,標
表 A の 分 布 図,
積 分 布 図 に つ い て は,正
規分布
ロ ッ トを か け.
準 化 し,デ ー タ を 本 文7.2節
の例
示 し た 区 切 り値 に よ っ て ラ ン ク値 に 変 換 し,そ の ラ ン ク値 に つ い て,(1)
と 同 じ 図 を か け.プ PROBIT変
ロ グ ラ ムBUNPU1に
含 まれ る変 数 変 換 機 能 の う ち
換 を 指 定 す る と,こ の 変 換 が 実 行 さ れ る.
注:こ の 問 い の ロー レ ンツ カー ブが,本 文7.2節 の例 題 の図7.2.3で 問 6 図7.4.3で
男女 の 血 圧 の 分 布 を比 べ て い るが,こ
差 の 比 較 は別 に行 な う もの と す れ ば,偏 考 え ら れ る.こ
れ に つ い て,平
あ る. 均 値 と標 準 偏
差 値 に 注 目 して 分 布 形 を 比 較 す る こ とが
の 考 え 方 で 比 較 し て み よ.
【 基礎 デー タの扱 い方 】 問 7 a.付 表B.2は
各 県別に みた 「 一 般 病 院 ・診 療 所 病 床 数 」で あ る.こ
異 を み る た め に,ロ
ー レ ン ツ カ ー ブ をか き,ジ ニ 係 数 を計 算 せ よ.
の 県別 差
b.付 表B.4は,付
表B.2の
れ に つ い て,ロ
デ ー タ を 人 口 あ た りに 換 算 し た もの で あ る.こ
ー レ ン ツ カ ー ブ を か き,ジ
c.a の 結 果 と b の 結 果 の ちが い は,ど d.各
県 の 人 口数(付 表B.5)を
サ イ ズ とみ な し て,表7.1.3に
ロ ー レ ン ツ カ ー ブ をか き,ジ
示 した方 法 で
ニ 係 数 を求 め よ.
e.b の 結 果 と dの 結 果 の ち が い は,ど 注:プ ロ グ ラムLAURENTZを
ニ 係 数 を計 算 せ よ.
う解 釈 す べ き か.
う解 釈 す べ きか.
用 意 して あ り ます.ま た,こ の 問題 用 の デ ー タの う
ち1975年 分 が例 示 用 と して 用意 され て い ます. 【 順 位 統計 量に よ るジニ係数 計 算】 問 8 (1)5 点 表 示 の 基 礎 数Q0,Q1,Q2,Q3,Q4を
使 っ て ジ ニ 係 数 を計 算 す る式
ジ ニ 係 数=〓 を 導 け. ヒ ン ト:説 (2)五 て,ジ
明 図7.1.7をQ0,Q1,Q2,Q3,Q4で
書 き 表 わ せ ば よ い.
分 位 階 級 の 区 切 り 値Q0,Q1,Q2,Q3,Q4,Q5(す
な わ ち 五 分 位 値)を
使 っ
ニ 係 数 を 求 め る 計 算 式 を 導 け.
(3)K
分 位 値Q0,Q1,Q2,…,QKを
使 う 場 合 に 一 般 化 す る と,次
の よ うに な る
こ と を示 せ
ジニ 係 数=〓 問 9 (1)付
表E.1は,家
計 調 査 の 年 間 収 入 の 階 級 別 世 帯 数 の デ ー タ で あ る.こ
れ
を使 って 年 収 分 布 の ロー レ ン ツ カ ー ブ をか き,ジ ニ 係 数 を 計 算 せ よ. (2)付
表E.2は,年
間 収 入 の 五 分 位 階 級 区 分 の 区 切 り値 で あ る.こ
て ロ ー レ ン ツ カー ブ を か き,ジ ニ 係 数 を計 算 せ よ.た
だ し,Q0は
れ を使 っ
0,Q5はQ4×
2と み なす もの とす る. (3)付
表E.3は,年
間 収 入 の 五 分 位 階 級 区 分 ご と に み た 平 均 値 で あ る.こ
を使 っ て ロ ー レ ン ツ カ ー ブ をか き,ジ
れ
ニ係 数 を計 算 せ よ.
ヒ ン ト:各 階 級 ご との 平均 値 ×世 帯 数 が,そ の 階級 の世 帯 の合 計値 に あ た る こ とを 利 用 す る方 法 と,各 階 級 に おけ る平均 値 を その階 級 に おけ る中位 値 だ とみ なす 方 法 が 考 え られ る. (4)年
間収 入 十 分 位 階 級 区 分 の 区 切 り値 を 使 っ て,問
た だ し,最 下 位,最 が 高 い の で,こ
8(3)の計 算 を行 な え.
上 位 の 区 分 は 特 別 の 事 情 を もつ デ ー タ が 混 在 して い る 可 能 性
れ ら を 除 い た 8区 分 を 八 分 位 階 級 とみ て 計 算 す る もの とす る.
【ロ ー レ ン ツ カ ー ブ の 定 義 に 関 す る問 題 】 問10 (1)付
表G.1の
年 収 区 分 計 の デ ー タ を 使 っ て ジ ニ 係 数 を 計 算 し,本
文の 図
7.6.3に 示 し た結 果 が 得 られ るか. (2)付
表G.2の
年 収 区 分 計 の デ ー タ を使 っ て ジニ 係 数 を計 算 し,(1)の 結 果 と
比 較 せ よ. (3)本 文 の 図7.1.8は,家 有 額 の デ ー タ(付 表G.2)を
計調 査 の年 間収 入五 分位 階級 に お け る平 均貯 蓄 保 使 っ て,貯
蓄 保 有 額 の ジ ニ 係 数 を求 め て そ の 年 次 推
移 を示 し た も の で あ る.図 示 した 結 果 が 得 ら れ る こ とを 確 認 せ よ. 注:年 間 収 入 に よっ て順 位づ け して,そ の 順 に 累積 した貯 蓄 保 有 高 に つ い て の ロー レ ン ツ カー ブ をか く形 に な る.テ キス ト本 文 の 説明 を参 照せ よ. 問11 変 数 X の 分 布 が 「 指 数 分 布 」す な わ ち 次 の 式 で表 わ さ れ る もの とす る. f(X)=λe-λX こ の 分 布 に つ い て,
累積分 布が その逆 関数 が ロ ー レ ン ツ カ ー ブ が
で表 わ さ れ る こ と を示 せ. 注:こ の問題 の よ うに,X S(P)が
の値 の上 限 が な い場 合 に は,P⇒1の
と きX(P)あ
るいは
∞ に な るため,ジ ニ係 数 が求 め られ な い(0に なる).
したが って,ジ ニ係 数 は,観 察 単位 数 が 有 限 で あ って,指 標値 の 上 限 を特 定 で き る場 合 に限 っ て適 用 すべ きで あ る.
また,観 察 単位 数 が有 限 であ って も,値 が 0に 近 い観 察 単 位 数 が 多い と き に は, そ の部 分 の影 響 で,観 察値 の値 が 大 きい部 分 の状 態 を反 映 しない結 果 に な る.
付録 A
図表番号
図 ・表 ・例 題 の 資 料 源
図表 名 人口密度 の比較
1975年 国勢 調 査
図1.3.2(a)
歩 くこ とは健 康 に よ い
1991年4月30日
図1.3.2(b)
図1.3.2(a)中
1989年 国民 栄 養 調 査
図1.4.1 図1.4.2
の グ ラ フ
血圧の年齢別変 化(1) 血圧 の年齢別変 化(2)
表名 FilelD
資料源
図1.3.1
朝 日新 聞
付表 M DI50 付表 L DI10 1985年 国 民栄 養 の 現状 付表 L DI10 1983年 賃 金 構 造 基 本調 査 付表 C DE01 DA01 人口動態統計 1985年 国民 栄 養 の 現状
図1.4.4
賃 金の年齢別 推移 出生率 の推移
図1.A.1
週 休 2 日制 普 及率(1)
図1.A.2
週 休 2 日制 普 及 率(2)
表2.1.1
平 均 値,標
モ デ ル例 1
付 表X.1
表2.1.2
平均値,標 準偏 差の計算例
モ デ ル例 2
付 表X.2
表2.1.3
平均 値,標
仮 想例
図2.2.1
賃 金の分布 表 と分布 図
図2.2.2
平均 値,標
図2.2.3 表2.2.4
図1.4.3
準偏 差 の 計 算 フ ォー ム 1と ∼ 準偏 差 の 計 算 フ ォー ム 2 と∼
賃金労働時間制度総合調査
モ デ ル 例 4 モ デ ル例 3
付 表X.4 XX0l 付 表X.3 XX0l
中位値,四 分位 偏差 とその図示
モ デ ル例 3
付 表X.3 XX0l
中位 値,四
分位 値 の 計 算 フ ォー ム(l)
仮 想例
表2.2.5
中位 値,四
分位 値 の 計 算 フ ォー ム(2)
図2.3.2
慣 用 さ れ る デ ー タ整 理 の 方 法
表2,3.3(a)
分布表 分布図をか くための計算 と分布図
図2.3.4 図2.3.5 表2.3.6 図2.3.7 図2.3.8(a) 図2.3.9
準偏 差 とそ の 図 示
モ デ ル例 3
付 表X.3 XX01
仮 想例 仮 想例 付 表X.4 XX01
モ デ ル例 4
仮 想例 区分数 をかえた分布図の例 家計調査 で採用 されてい る分布の情報 表現 家計調査年報 モ デ ル 例 4 分布図をか くための計算 と累積分布 図 デ ー タ 整理 法 仮 想例 仮 想例 幹葉表示 の表現例
付表 E DK10 付 表X.4 XX0l
付 表 L DI10 付 表 L DI10 付 表 L DI10 付 表X.4 XX0l
モ デ ル 例 3
図2.4.5
標準正規 分布 と比較す るための計算 正規確率 紙の使用例
表2.4.6
正 規確 率 紙 に プ ロ ッ トす る ため の 計 算
モ デ ル 例 3 モ デ ル例 3
図2.4.8
分布形の対数変換
モ デ ル 例 4
図2.5.1
「N 個 の観 察値 の 平 均 値 」200組 の 分 布 図
1985年 賃 金構 造 基 本 調査*
DE13
図2.5.2
平均値 の分布
1985年 賃 金 構 造 基 本 調 査*
DE13
表3.2.2
高 次 の モ ー メ ン トの 計 算
図3.4.6
賃金月額の分布比較
仮想例 賃金構造基本調査
付表 C DE03
県別病床 数の地域差
社会生活統計指標
付表 B DI91
ボ ッ クス プ ロ ッ トに お け る フ ェ ン ス の 表 現 社会生活統計指標
付表 B DI91
図2.4.2
図3.5.1 ∼ 図3
.5,10
図3.6.1
図4.1.1
2つの要因の効果 比較
図4.1.2
区切 り方 を か え る
図4.1.3
2つ の 要 因 を組 み合 わせ る
図4.1.4
ヒ ン ジ ト レ ー ス
家計調査 モデルデー タ 家 計調査モデルデー タ 家 計 調 査 モ デ ル デ ー タ
付表 A DH10 付表 A DH10 付表 A DH10 付表 A DH10
表4.2.1
基準をかえて分散 を計算
家 計 調査 モ デ ル デ ー タ モ デ ル 例 2
図4.3.1
分 析 の フ ロー と偏 差 平 方 和 の減 少
モ デ ル例 2
付 表X.2
表4.3.3
モ デ ル例 2
付 表X.2
表4.3.5
分散分析 表(計算例) 分散分析 表(計算例)
モ デ ル例 2
付 表X.2
図4.4.1
分 析 の フ ロ ー
表4.4.2
人 口あた り病床 数の県別値の分散分析表 人口あた り病 床数の県別値 の分散分析表
社会生 活統 計指標 社会生 活統 計指標 社会生 活統 計指標
付表 B DI91 付表 B DI91 付表 B DI91
(病床数の)県別 差異
社会生 活統計指 標
付表 B DI91
食 費支 出の世 帯人貝お よび月収別比較
家計調査 モデルデー タ
付表 A DH10
2要 因によ る分析例 分散分析表 分散分析表 分散分析表
家計調査 モデルデー タ 家計調査 モデルデー タ 家計調査 モデルデー タ 家計調査 モデルデー タ
付表 A DH10 付表 A DH10 付表 A DH10 付表 A DH10
表4.A.1
モデ ル デ ー タ 5
モデ ル例 5
表4.A.2
モ デ ル デ ー タ 6
モデ ル 例 6
付 表X.5 XX01 付 表X.6 XX0l
分散分析表
家計調査 モデ ルデー タ
付 表 A DH10
2要 因の場合 の分散分析 表
家計調査 モデ ルデー タ
付 表 A DH10
◆5.6.9
平均値に関す る仮説検定 平均値の差 に関 する仮 説検定(1) 平均値の差に関す る仮 説検 定(2) 2つ の要因 の効 果分析
表4.4.3 図4.4.4 ∼4
.4.5
図4.6.1 ∼4
.6.6
図4.7.2 図4.7.3 図4.7.4 表4.7.5
表5.1,1
付 表X.2
∼5.1.4
表5.2.1 ∼5
.2.5
表5.7.4
例5.6.3の
例5.7.1
2つの要因の効果分析
表5.7.6
例5.7.1の
表5.7.7
偏差平方和の計算
仮想例 仮想例 仮想例 仮想例 仮想例 仮 想例 仮想例 仮 想例
問 題 5用 の デ ー タ
仮想例
3社 の給与水準 比較 3社の年齢構成
モ デ ル例 7
付 表X.7
モ デ ル例 7
付 表X.7
モ デ ル例 7
付 表X.7
表6.3.2
直接 法によ る標準化平均値 の計算例 間接 法に よる標準化平均値 の計 算例
モ デ ル例 7
付表X.7
表7.1.1
集 中度の見方
図7.1.2
ロ ー レ ン ツ カ ー ブ
仮想例 仮 想例
図7.1.3
ロー レ ン ツ カ ー ブ の 例(賃 金 月 額)
モ デ ル例 4
図7.1.4
ロー レ ン ツ カ ー ブ の 例(市 町 村 の病 床数)
1990年 地域医療施 設基礎調査
例5.5.1 ◆5.6.2 ◆5.6.3
表5.A.1
観 察 値Xu 観 察 値XIJK
∼5.A.8
表6.1.1 表6.1.2 表6.2.2
表7.1.5
ロー レ ン ツ カ ー ブ をか くため の 計 算
モ デ ル例 4
図7.1.8
所得階級別 にみた∼ ジニ係数の推移
図7.2.2
ロー レ ン ツ カ ー ブ をか くため の 計 算
貯蓄動 向調査報告 家計調査 モデル例
付 表X.4 XX0l DI80 付 表X.4 XXOl 付 表G.1 DK20
付表 A XX0l
モデ ル に対
観 察 値 に 対 す る P,S(P)と,
図7.2.3 ∼ 7.2.4
す る P,S*(P)の
図?.3.3
累積分布 比較の ための図示(1) 累積分布 比較の ための図示(2)
仮想例 仮 想例
図7.3.6
Q-Qプ
ロ ッ トの 例
モ デ ル例 3
図7.3.7
P-Pプ
ロ ッ トの 例
モ デ ル例 3
表7.3.8
P-Pプ
ロ ッ トの ため の 計 算 と∼
モ デ ル例 3
図7.3.9
累積 分 布 とS-Sプ
図7.3.10
累積 分 布 とロー レ ン ツカ ー ブ
モ デ ル例 3
図7.4.1
分布形 の比較 適合度検定 のための計算例 血圧 の分布形 の男女差
仮 想例
図7.3.2
図7.4.2 図7.4.3 図7.5.1
図7.5.2
図7.5.3
図7.5.4
図7.6.1 図7.6.2 図7.6.3 図7.6.4
付 表 A XX0l
家計調査 モデル例
図
付 表 L DI10 付 表 L DI10 付 表 L DI10 付 表 L DI10 付 表 L DI10
モ デ ル例 3
ロ ッ ト
1985年 国 民栄 養 の現 状 1985年 国 民栄 養 の現 状
付 表 L DI10 付 表 L DI10
1990年 地域 医療施 設基礎
DI80
人 口 あ た り比率 に して 扱 う
調査 1990年 地域 医療施設 基礎
DI80
観察単位 のサ イズ差 を考慮
調査 1990年 地域 医療施設 基礎
DI80
市町 村 別 病 床 数 の 分 布 に 関 す る ロー レ ン ツ カー ブ
調査 1990年 地域 医療施 設基礎 観察単位 のサイズ差への対応 調査 貯 蓄動 向調査 報告 統 計調査 におけ る分布の表現(1) 貯 蓄動 向調査 報告 統 計調査 におけ る分布の表現(2) 図7.1.8に 関す る別 デ ー タに よ る計 算 結 果 貯 蓄動 向調査報告 貯 蓄動 向調査報告 統 計調査 におけ る分布の表現(3)
表7.A.1
日 経 パ ソ コ ン1999年
表7.A.2
県民経 済計算
DI80 付 表F.1 付 表F.2 付 表G.2 付 表G.2
7 月12日
デ ー タ を使 って い な い図 あ る い は表 は,こ の 表 に は含 め て い な い.
資料源 表名
基礎 デ ー タが 掲 載 さ れ て い る 資 料 名,す
べ て 国 の 統 計 調 査 な どの 報 告 書.
基 礎 デ ー タ また は そ の参 考 デ ー タ を付 録 B に掲 載 して い る場 合,そ の 表 名.
フ ァ イル 名 添 付 し たデ ー タベ ー ス に収 録 して い る場 合 その フ ァ イ ル名. 付 録 B に 掲 載 し た範 囲 以 上 の デー タ をフ ァイ ル に 収 録 して あ る場 合 も あ る. 基 礎 デ ー タ を分 析 用 に編 成 した フ ァ イル もあ る.そ れ に つ い て は 検 索 プ ロ グ ラ ムTBL SRCHを 使 っ て 調 べ る こ と. *報 告 書 に掲 載 さ れ て い る 分 布 表 に 合 致 す る よ う に 「 個 別 観 察 単位 の 値 を ジ ェ ネ レー ト」 した もの で あ る.
付 録 B● 付 表 図 ・表 ・問題 の基 礎 デ ー タ
付 表X.1 仮 想例(1) 付 表X.2 仮 想例(2) 付 表X.3 仮 想 例(3)(40歳 付 表X.4 仮 想 例(4)(賃
台 男 性 の 血 圧) 金 月額)
付 表X.5
仮 想例(5)(世 帯の生 計 費)
付 表X.6
仮 想 例(6)(食
付 表X.7
仮 想例(7)
費 支 出)
付 表 A 家 計収支 の モデ ルデー タ 付 表 B 医療 施 設数の 県別 比較(1975年) 付 表 C 年齢 お よび平 均 月間所定 内給 与階級 別労働 者数(製 造 業 ・1983年) 付 表 D 企 業 規 模 別 平 均 賃 金 の 比 較(製 造 業 ・男 ・1975年 お よ び1985年) 付表E
勤 労 者 世 帯 の 年 間 収 入(E.1分
付表F
勤 労 者 世 帯 の 貯 蓄 現 在 高(F.1分
布/E.2五
分 位 値/E.3五
布/F.2分
分 位 階 級 別 平 均 値)
布 特 性 値)
付 表 G 勤 労者世 帯 の所得 階 級別 貯 蓄現在 高(G.1分 布/G.2分 布 特性 値) 付表 H 勤 労者世 帯 の年 齢階級別 貯 蓄現在 高(H.1分 付 表 I
布/H.2分 布 特性 値)
消 費者物 価指 数 の推移(年 平 均値)
付 表 J 死亡 率 の地域 別 比較(説 明用仮 想 デー タ) 付 表 K 死 亡 率 の 配 偶 関 係 別 比 較(女 ・1985年) 付 表 L 血 圧 値 の 分 布(性 ・年 齢 別 ・1985年) 付 表M
歩行 距離 と血圧 の 関係
付 表 N 身 長 ・体 重 の ク ロ ス 表(男 ・1980年) 付 表 O 県民経 済 計算 * そ れ ぞ れ の 表 に 記 した 資料 か ら の 引用 です.数
字 の定 義 な ど に つ い て は,そ
れ ぞ れ の 資 料 を参
照 して くだ さい. * 刊 行 機 関 の 組 織 名 は,省
庁 再 編 前 の 呼 称 を使 っ て い ます.
* 数 字 の 表 示 桁 数 な ど をか え た もの も あ ります 。 * 数 字 は,そ
れ ぞ れ に 付 記 した フ ァ イル 名 で,UEDAの
* フ ァ イ ル に は,表
デ ー タベ ー ス に収 録 さ れ て い ます .
示 し た範 囲 以 外 の 数 字 を掲 載 して い る場 合 もあ り ます .
* 表 に 付 記 した フ ァ イル 以 外 に,分
析 用 の フ ァ イル を用 意 し て あ る 場合 もあ り ます .
付 表X.1
付 表X.2
付 表X.5
付 表X.3
付 表X.6
付 表X.7
付 表X.4
付 表 A 家 計 収 支 の モ デル デ ー タ
(百 円/月)X1:世
帯 人員 X2:収
入 総 額 X3:支
出総 額 X4:
消 費支出総額 X5:食 費支 出
X6:被 服 費 X7:住 居費 X8:光 熱 費 X9:雑 費 [フ ァイ ルDH10]
付 表 B 医療 施 設 数 の 県 別 比 較(1975年) 付 表B.1
付 表B.2
付 表B.3
付 表B.4
一 般 病 院 ・診療 所 数
一般 病 院 ・診療 所 病 床 数
人 口10万
人 口10万
人 あ た り一般 病 院 ・診 療 所 数
人 あ た り一 般 病 院 ・診 療 所 病 床 数
付 表B.5
付 表B.6 65歳
人 口総 数(千 人)
以 上 人 口 比率
社 会 生 活 統 計 指 標(総 務 庁 統 計 局)
[フ ァ イ ルDI91]
付 表 C 年 齢 お よび 平 均 月 間 所 定 内 給 与 階 級 別 労 働 者 数(製 造 業,男 女 計,1983年)
賃 金 セ ン サ ス 報 告 書(労 働 省) [フ ァ イ ルDE03]
付 表 D 企 業 規模 別 平 均 賃 金 の比 較(製 造 業,男) 付 表D.1
1975年
付 表D.2
1985年
賃 金 セ ンサ ス報 告 書(労 働 省) [フ ァ イ ルDE70]
付 表 E 勤 労 者世 帯 の 年 間 収 入 付表E.1 階級区分別世帯分布
付 表E.2 分布特 性…五分位値(五 分位 階級の区切 り値)
付表E.3 五分位階級別平均値
家 計 調査 年 報(総 務 庁 統 計局) [フ ァ イ ルDK10,DK11b,DK12]
付 表 F 勤 労 者世 帯 の 貯蓄 現在 高 付 表F.1
付 表F.2
階級別世帯 数分布
分 布 特 性 値 … 中位 値,四
分位値 な ど
貯 蓄 動 向調 査 報 告(総 務 庁 統 計 局) [フ ァ イ ルDK20,DK21]
付 表 G 勤 労者 世 帯 の 所 得 階 級 別貯 蓄現 在 高(1993年) 付 表G.1階
付 表G.2
級別世帯数分布
分 布 特 性値 … 中 位 値,四
分位 値 な ど(1993)
貯 蓄 動 向調 査 報 告(総 務 庁 統 計 局) [フ ァ イ ルDK20_1,DK21_1]
付 表 H 勤 労 者世 帯の 年 齢 階 級 別 貯 蓄 現 在 高(1993年) 付表H.1 階級別世帯数分布
付 表H.2
分 布 特性 値 … 中位 値,四
分位値 など
貯 蓄動 向調 査 報 告(総 務 庁 統 計 局) [フ ァ イ ルDK20_2,DK21_2]
付 表 I 年 平 均 物価 指 数の 推 移 付 表I.1 1980年 基 準 指 数(全 国)
*持 ち家の帰属 家賃 を除 く総合 消費者物価 指数統計年報(総 務庁統計局) [ファイルDU10] 付 表I.2
1985年 基 準 指 数(全 国)
*持 ち家の帰属家賃 を除 く総合 消 費者物価指数 統計年報(総 務庁統計局) [ファイルDU11]
付 表 J 死 亡 率 の地 域 別 比 較
N:人
口数(千 人),D:死
亡 数(人) 説 明 用 の 仮 想 デー タ [フ ァ イ ル 未 登 録]
付 表 K 死 亡 率 の 配 偶 関係 別 比 較(女,1985年)
人 口動態調査報告(厚 生省) [フ ァ イル 未 登 録]
付 表 L 血 圧 値 の分 布(性,年
齢 別,1985年)
国民栄養調査or国
民栄養 の現状(厚 生省) [フ ァ イ ルDI10]
付 表 M 歩行 距 離 と血圧 の関 係 付 表M.1
注:括 弧書 きは,平 均 値計算に使われ た対象者数 国 民 栄 養 調査(厚 生 省,1989年) [フ ァ イ ルDI 50]
付 表M.2
国 民栄 養 調 査(厚 生 省,1989年) [フ ァ イ ル 未 登録]
付 表 N 身 長 と体 重 の ク ロ ス 表(15歳
以 上,男,1980年)
国民栄養調査(厚 生省) [フ ァ イ ルDI40]
付表 0 県民経済計算 付 表0.1
県 内 総 生 産,1990年(億
付 表0.2
県 民所 得,1990年(百
円)
億 円)
付 表0.3
県 民 1人 あた り県 民所 得,1990年(千
円)
付 表0.4
県民 1人 あ た り県 民 所 得,1980年(千
円)
付 表0.5
県 民 1人 あ た り県 民 所 得,1970年(千
円)
社会生活統計指標(総務庁 統計局) [フ ァ イルDL40]
付 録 C● 統 計 ソ フ トUEDA
①
まず 明 らか な こ とは 統 計 手 法 を 適 用 す る た め に は,コ
だ と い う こ と で す.計
ン ピ ュー タ が 必 要
算 機 な し で は 実 行 で き な い複 雑 な 計 算,何
か え し て 最 適 解 を見 出 す た め の く りか え し計 算,多 機 能 な ど,コ も,コ
回 も試 行 錯 誤 を く り
種 多 様 な デ ー タ を管 理 し利 用 す る
ン ピ ュ ー タ が 果 た す 役 割 は 大 き い の で す.ま
た,統
計 学の 学習 にお いて
ン ピ ュ ー タの 利 用 を視 点 に 入 れ て 進 め る こ とが 必 要 で す.
した が っ て,こ
の シ リー ズ に つ い て も,各 テ キ ス トで 説 明 した 手 法 を適 用 す る た め
に 必 要 な プ ロ グ ラ ム を用 意 し て あ り ます. ②
た だ し, 「そ れ が あ れ ば 何 で も で き る 」 とい うわ け で は な い
こ とに 注 意 し ま し ょ う. 道 具 と い う意 味 で は,「 使 い や す い も の で あ れ 」 と期 待 さ れ ま す.当 が,広
然 の要 求 です
範 囲 の 手 法 や 選 択 機 能 が あ り ます か ら,当 面 して い る 問 題 に 対 し て, 「ど の 手 法 を選 ぶ か,ど
の 機 能 を指 定 す るか 」
と い う 「コ ン ピ ュー タ に は 任 せ ら れ な い 」ス テ ップ が あ り ま す.そ
こ が 難 し く,学 習
と経 験 が 必 要 で す.「 誰 で も で き ます 」 と気 軽 に 使 え る もの で は あ り ませ ん.「 統 計 学 を知 ら な くて も使 え る 」よ うに は で き ませ ん.こ ③
れ が 本 質 で す.
この ため 「 統 計 パ ッ ケ ー ジ 」は,「 知 っ て い る 人 で な い と使 え な い 」 と い う側 面
を も っ て い る の で す が,そ え ま し ょ う.た
う い う側 面 を考 慮 に 入 れ て 使 い や す くす る … こ れ は,考
と え ば,「 使 い 方 の ガ イ ドを お り こ ん だ ソ フ ト」に す る こ と を考 え る
の で す. 特 に,学
習 用 の テ キ ス トで は
「学 習 用 とい う側 面 を考 慮 に 入 れ た 設 計 が 必 要 」 で す. UEDAは,こ
の こ と を考 慮 に 入 れ た 「 学 習 用 の ソ フ ト」で す.
UEDAは,著
者 の 名 前 で あ る と と もに,Utility
for Educating
称 で す. ④
教 育 用 とい う こ と を意 図 し て, ○ 手 法 の 説 明 を画 面 上 に 展 開 す る ソ フ ト ○ 処 理 の 過 程 を説 明 つ きで 示 す ソ フ ト
Data
Analysisの
略
○ 典 型 的 な 使 い 方 を体 験 で き る よ うに 組 み 立 て た ソフ ト を,学 習 の 順 を 追 っ て 使 え る よ う に な っ て い ま す.た
と え ば 「回 帰 分 析 」の プ ロ グ ラ
ム が い くつ か に わ け て あ る の も,こ の こ と を考 え た た め で す.は ム で は,何
選 択 で き る よ うに す る … ⑤
じめ に 使 うプ ロ グ ラ
で もで き る よ うに せ ず 基 本 的 な機 能 に 限 定 し て お く,次 に 進 む と,機 こ うい う設 計 に して あ る の で す.
学 習 と い う 意 味 で は,そ
とが 必 要 です.し
能を
の た め に 適 した 「デ ー タ」 を使 え る よ う に して お く こ
た が っ て,UEDAに
は,デ
ー タ を 入 力 す る機 能 だ け で な く,
学 習 用 とい うこ と を 考 え て 選 ん だ デ ー タ フ ァ イ ル を収 録 し た 「デ ー タベ ー ス」が 用 意 さ れ て い る の で す.収
録 され た デ ー タは 必 ず し も最 新 の 情 報 で は あ り ませ ん .そ れ を使 っ た 場 合
に,「 学 習 の 観 点 で有 効 な 結 果 が 得 ら れ る」 こ と を優 先 して 選 択 し て い る の で す. ⑥
以 上 の よ う な 意 味 で,UEDAは,テ
キ ス トと一 体 を な す 「学 習 用 シ ス テ ム 」だ
と位 置づ け るべ き もの です. ⑦
こ の シ ス テ ム は,10年
して い た もの のWindows版
ほ ど 前 にDOS版 で す.い
と し て 開 発 し,朝 倉 書 店 を 通 じて 市 販
くつ か の 大 学 や 社 会 人 を 対 象 と す る 研 修 で の 利
用 経 験 を考 慮 に 入 れ て,手 法 の 選 択 や 画 面 上 で の 説 明 の 展 開 を工 夫 す る な ど,大 幅 に 改 定 した の が,本 ⑧
シ リー ズ で 扱 うVersion
次 は,UEDAを
6で す(第 9巻 に 添 付).
使 う と き に 最 初 に 現 わ れ る メ ニ ュ ー 画 面 で す.こ
の シ リー ズ
の す べ て の テ キ ス トに 対 応 す る 内容 に な っ て い る の で す . くわ し い 内 容 お よ び 使 い 方 は 第 9巻 『統 計 ソ フ トUEDAの
使 い 方 』 を参 照 し て く
だ さ い. UEDAの
メ ニ ュ ー画 面
Utilityfor Educating 1… デ ー タの 統 計 的 表 現(基 本) 2… デ ー タの 統 計 的 表 現(分 布)
注:プ
Data Analysis 8… 多 次 元 デ ー タ 解 析 9… 地 域 メ ッ シ ュ デ ー タ
3… 分 散 分 析 と仮 説 検 定
10… ア ン ケ ー ト処 理
4… 2変 数 の 関 係
11… 統 計 グ ラ フ と 統 計 地 図
5… 回 帰 分 析
12… デ ー タ ベ ー ス
6… 時 系 列 分 析
13… 共 通 ル ー テ ィ ン
7… 構 成 比 の 比 較 ・分 析
14…GUIDE
ロ グ ラム は,富 士 通 のBASIC言
語 コ ンパ イ ラーF‐BASIC97を
た プ ロ グ ラム の 実 行 時 に 必 要 な モ ジ ュー ル は,添 Windowsは,95,98,NT,2000の
付 され てい ます.
い ず れ で も動 き ます .
使 って 開 発 し ま した .開 発 し
索引
く りか え し 140
同 じ条件 下 での 6
ア 行
ク リ ー ニ ン グ 51 ア ウ ト ラ イ ヤ ー 50
cleanな
ア ウ ト ラ イ ヤ ー 検 出 基 準 61
区 分 け 77,149
一 様 分 布 162
傾 向 性 6,88
,165
―と の 適 合 度 169
デ ー タ 50
決定 係 数 91 検 証 的 デ ー タ解 析 141
ウ エ イ ト 151 交 互 作 用 96,99 S‐Sプ
ロ ッ ト 177
F比 106
誤 差 13,142 5数 要 約 56,58 個 性 14
力 行
個 別 性 4,88 個 別 デ ー タ 4
加 重 平均 151
混 同 要 因 147
仮 説 検 定 の論 理 113 仮 説 の 棄却 116
サ 行
片 側 検 定 117 観 察 単 位 2,4 ―のサ イ ズ差 183
サ イズ 効果 8 残 差 142
観 察 値 4,5
残 差 分 散 81
間接 法 に よ る標 準 化 153
3数 要約 55
幹 葉 表 示 33 指 数 にお け る標 準化 156 棄 却 限 界 116
実 験 群 141
期 待 値 43
実 験 計 画 130
帰 謬 法 113
実 験 デ ー タ 5
Q‐Qプ
ジニ 係 数 166
ロ ッ ト 174
級 内 分 散 81 局 所 管 理 5,140
四分 位 値 25 ―の計 算 26,71
四 分位 偏 差 値 25
統 計 調査 にお け る分 布 の 表現 188
集 団 2
統 計 的 比較 2
集 団 的規 則 性 49
統 計 デ ー タ 2 ―の対 比 52
集 中楕 円 95 自由度 107
等 質 化 2,131
主 効果 96
尖 り度 53
情 報 の ス トック 85
度 数 分布 表 21
情 報 の表 現 力 51 情 報 の フ ロー 85
ナ 行
情報 表 現 手段 14 シ ンプ ソ ンのパ ラ ドックス 11
2数 要 約 55
信頼 区間 118
ハ 行 ス ペ ー ス フ イ ラ ー 23 箱 ひ げ 図 66
正規 確 率紙 40
パ ー シ ェ 方 式 156
正規 分 布 36
パ ー シ モ ニ イ 28
―の適 合 度 170 全分 散 81
外 れ 値 50 パ ー セ ン タ イ ル 71 反復 5
相 殺 効 果 100 相 乗 効 果 100
P-Pプ
ロ ッ ト 174
歪 み 度 53
タ 行
標 準 化 36,150
間接 法 に よ る― 153 第 一 種 の 過 誤 114 対 照 群 141 第 二 種 の 過 誤 116 dirtyな デ ー タ 50 探 索 的 デ ー タ解 析 141
指 数 にお け る― 156 直 接 法 に よ る― 150 標 準 偏 差 19 ―の計 算 20 頻 度 原理 63 頻 度 分布 29
チ ェ ビシ ェ フの不 等式 118,120 中位 値 25 ―の 計算 26,71 調査 単 位 4 直接 法 に よる標 準化 150
Fisherの
3条 件 140
フ ェ ン ス 57,69 ブ ラ イ ン ド化 141 プ ロ トコ ー ル 141 分 散 15,19
適合 度 の 検定 179
分 散 分 析 84 分 散 分 析 表 91
統計 手 法 の論 理 2
―for仮 説 検 定 106
―for要 因分 析 106
ボ ッ ク ス プ ロ ッ ト 57,58,66
分 析 結 果 の表 示 87 分 析 手順 の構 成 84
ヤ 行
分 析 手順 の表 示 84 分 析 の フ ロー 90 分 布 形 35 ―の比 較 36
有 意 性 110 ―の 検 定 105 ゆ が み 8,150
―を比 較 す る手 段 170 分 布 図 13,29
要 因 分 析 84
分 布 の位 置 36 分 布 の ひ ろが り幅 36
ラ 行
分 布 表 28 ラ ス パ イ レ ス 方 式 156
平均 値 4
ラ ン ダ ミ ゼ ー シ ョ ン 131,140
―に関 す る仮 説 検定 120 ―の 計 算 20
両 側 検 定 117
―の 差 に 関す る仮 説検 定 124 ―の 分 布 42 並 行 ボ ックス プ ロ ッ ト 69 偏 差 11,142
累 積 分 布 図 32 ―の 表 現 法 172 累 積 分 布 表 32
偏 差平 方 和 81 変 数変 換 41
ロ ー レ ン ッ カ ー ブ 162,167,177 ―の 書 き 方 184
/
著者略歴 上
田
尚
一(う
え だ ・し ょういち)
1927年 広 島県 に生 まれ る 1950年 東京大 学第 一工学 部応 用数学科 卒業 総 務庁統 計局,厚 生省,外 務 省,統 計研修 所 な どにて 統 計 ・電子計 算機 関係 の職務 に従事 1982年 龍谷大学 経済 学部 教授 主 著 『パ ソ コ ンで 学 ぶ デ ー タ解 析 の 方 法 』Ⅰ,Ⅱ(朝
倉 書 店,1990,1991)
『統 計 デ ー タ の 見 方 ・使 い 方 』(朝 倉 書 店,1981)
講座〈情 報 をよむ統計学 〉1
統 計学 の 基 礎 2002年9月20日
定 価は カバー に表 示
初 版第 1刷
著
者 上
田
尚
一
発行者 朝
倉
邦
造
株式
発行所 会社 朝
倉
書
店
東 京 都 新 宿 区 新 小 川 町6‐29 郵 便 番 号 162‐8707 電
話
03 (3260)
0141
FAX03(3260)0180
〈検 印 省 略 〉 〓 2002〈
ISBN
http://www.asakura.co.jp
無 断 複 写 ・転 載 を 禁 ず 〉
4‐254‐12771‐5
C3341
平 河工業社 ・渡辺製 本
Printed inJapan
元統数研 林 知 己夫 著
21世 紀 の新 しい 科 学 「デ ー タの 科 学 」の 思 想 と こ こ
シ リー ズ〈デ ー タの 科 学〉 1
ろ と方 法 を 第 一 人 者 が 明快 に 語 る。 〔内容 〕科 学 方 法 論 と して の デ ー タの 科 学 / デ ー タ を と る こ と― 計 画 と実 施 / デ ー タ を分 析 す るこ と― 質 の 検 討 ・
デ
ー
タ
12724‐3 C3341
の
A5判
科
学
144頁 本 体2600円
簡 単 な統 計 量分 析 か ら デー タの構 造 発 見 へ
東洋英和大 林 文 ・帝京大 山 岡和 枝 著 シ リー ズ 〈デ ー タ の 科 学 〉2
調査
の
実
際
良 い デー タ を ど う集 め る か?不 完全 な デ ー タか ら 何 が わ か る か?デ ー タの 本 質 を捉 え る方 法 を解 説 〔内容 〕〈デ ー タの 獲 得 〉ど う調査 す るか / 質 問 票 / 精 度 。 〈デ ー タか ら 情 報 を読 み と る〉デ ー タの 特 性 に 基 づ い た解 析 / デ ー タ構 造 か らの 情 報 把 握 / 他
る
複雑 なシステムに対 し,複 数 のアプ ローチ を用い て生の デー タ を収集 ・ 分析 ・解釈す る方法 を解 説。 〔 内容 〕 紙 リサ イ クル社会/ 背景/文 献調査 /世界 の リサ イクル/ 業界紙に見 る/ 関係 者/資源回収 と消費/消 費者 と製紙産業/静脈 を担 う主体 /他
る
個 と集団 とは ?意識 とは ?複雑 な現 象の様 々な構 造 をデー タ分析 に よって明 らかにする方法 を解説 〔 内容〕国際比較調 査/標本抽 出/調査 の実 施/調 査票の翻訳 ・ 再翻 訳/分析 の実際(方法,社 会 調査 の危機,「計量的文明論 」 他)/調査票の洗練/他
―不完全 なデー タか ら何 を読み とるか― A5判
12725‐1 C3341
232頁 本 体3500円
日大 羽 生 和紀 ・東大 岸 野 洋 久 著 シ リー ズ 〈デ ー タ の科 学 〉3
複
雑
現
象
を
量
―紙 リサ イ クル 社 会 の 調 査― 12727‐8C 3341 A5判 176頁 本体2800円 統数研 吉 野 諒 三 著 シ リー ズ 〈デー タ の科 学 〉4
心
を
測
―個 と集 団の 意 識 の科 学― 12728‐6 C3341 A5判 168頁 本体2800円
ひ け る ・読 め る ・わ か る― 。 統 計 学 の 基 本 的事 項302項 目 を具 体 的 な数 値 例 を用 い,か つ 可能 な か
長崎 シーボル ト大 武 藤 眞介 著
統 計 解 析 ハ ン ドブ ッ ク 12061‐3 C3041
A5判
ぎ り予 備 知 識 を 必 要 と し な い で理 解 で き る よ うや さ し く解 説 。 全 項 目が 見 開 き 2ペ ー ジ読 み切 りの か た ちで 必 要 に応 じて ど こか ら で も読 め る よ うに ま とめ られ て い る の も特 徴 。実 用 的 な統 計 の 事 典 。 〔内 容 〕記 述 統 計(35項)/ 確 率(37項)/ 統 計 理 論 (10項)/ 検 定 ・推 定 の 実 際(112項)/ ノ ンパ ラ メ ト リ ッ ク検 定(39項)/ 多変 量 解 析(47項)/ 数 学 的予
648頁 本 体22000円
備 知 識 ・統 計 数 値 表(28項)。
柳 井 晴 夫 ・岡 太 彬 訓 ・繁 桝 算 男 ・ 高 木廣 文 ・岩 崎 学 編
多変 量解 析 実例 ハ ン ドブ ック 12147‐4 C3041
B.S.エ
統
A5判
ヴ ェ リッ ト著
916頁 本 体30000円
統 計 を使 うす べ て の ユ ー ザ ー に 向 け た「役 に 立 つ 」 用 語 辞 典 。 医 学 統 計 か ら社 会 調 査 ま で,理 論 ・応 用 の全 領 域 に わ た る約3000項 目 を,わ か りや す く
前統数研 清 水 良一 訳
計
科
12149‐0 C3541
A5判
学
辞
536頁 本 体12000円
多変量解析は,現 象を分析 す るツー ルと して広 く 用い られてい る。本 書はで きるだけ 多 くの具体的 事例 を紹介 ・解説 し,多 変量解析のユーザー のた めに「 様々 な手法 をい ろいろ な分 野で どの よ うに 使 った らよいか」につい て具体 的な指針を示 す。 〔内容〕【 分野 】 心理/教育 /家政/環境/経済 ・経 営 /政 治/ 情報 /生物 / 医学/ 工 学/農学 /他 【 手法】 相 関 ・回帰 ・判別 ・因子 ・主成分分析/ ク ラスター ・ロジスティ ック分 析/数量化/共分散 構造分析 /項 目反応理論/ 多次元尺度構成法/他
典
簡 潔 に解 説 す る。100人 を越 え る統 計 学 者 の 簡 潔 な 評 伝 も収 載。 理 解 を助 け る種 々 の グ ラ フ も充 実 。 [項 目例]赤 池 の 情 報 量 規 準 / 鞍 点 法 /EBM/ イ ェ イ ツ/ 一 様 分 布 / 移 動 平 均 / 因 子 分 析 / ウ ィル コ ク ソ ン の 符 号 付 き順 位 検 定 / 後 ろ 向 き研 究 / SPSS/
F検 定 / 円 グ ラ フ/ オ フ セ ッ ト/ カ イ 2
乗 統 計 量 / 乖 離 度 / カ オ ス/ 確 率 化 検 定 / 偏 り他 上 記価 格(税 別)は2002年8月
現在