講座 情 報 をよむ統計学 7
クラスター分 析 上 田尚一 著
朝倉書店
講座 「情 報 をよ む統 計 学」 刊 行の辞 情 報 の 流 通 ル ー トが 多様 化 し,ア
情報 化社 会 への
対応
な り ま し ...
43 downloads
603 Views
30MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
講座 情 報 をよむ統計学 7
クラスター分 析 上 田尚一 著
朝倉書店
講座 「情 報 をよ む統 計 学」 刊 行の辞 情 報 の 流 通 ル ー トが 多様 化 し,ア
情報 化社 会 への
対応
な り ま し た.誰
な っ た … こ の こ と は歓 迎 して よ い で し ょ う.た 情 報 か ら 玉 を選 び,そ は,玉
ク セ ス しや す く
もが 簡 単 に 情 報 を利 用 で き る よ うに だ し,玉 石 混 交 状 態 の
の 意 味 を正 し くよ み と る 能 力 が 必 要 で す.現
と石 を 識 別 せ ず に 誤 用 し て い る,あ
る い は,意
実に
図 を カ ム フ ラー
ジ ュ し た 情 報 に 誘 導 さ れ る結 果 に な っ て い る … そ う い うお そ れ が あ る よ うで す. 特 に,数
字 で 表 わ さ れ た 情 報 に つ い て は,数 値 で 表 現 され て い る と い
う だ け で,正 確 な 情 報 だ と思 い 込 ん で し ま う 人 が み ら れ る よ う です ね. ど う い う観 点 で,ど
情報 の よみ か き 能 力が必 要
ん な 方 法 で 計 測 した の か を考
え ず に,結 果 と して 数 字 に な っ た 部 分 だ け を み て い
る と,「 簡 単 に ア ク セ ス で き る」 こ と か ら 「簡 単 に 使 え る」 と勘 違 い し て,イ
ー ジィに考 え て しま う …
こ うい う危 険 な 側 面 が あ る こ とに 注 意
し ま し ょ う. 数 値 を 求 め る 手 続 き を 考 え る と,「 た ま た ま そ う な っ た の だ 」 と い う 以 上 に ふ み こ ん だ 言 い方 は で き な い こ とが あ り ます.ま 正 し い と して も,そ
た,そ
の数 字 が
の 数 字 が 「一 般 化 で き る 傾 向 性 と解 釈 で き る場 合 」
と,「 調 査 し た そ の ケ ー ス に 関 す る こ とだ と い う 以 上 に は 一 般 化 で き な い 場 合 」 と を,識 別 し な け れ ば な ら な い の で す. こ うい う 「情 報 の よ み か き 能 力 」を もつ こ と が 必
その基 礎 をなす 統計 学
要 で す.ま
た,情
報 の う ち 数 値 部 分 を 扱 う に は,
「統 計 的 な 見 方 」 と 「それ に 立 脚 した 統 計 手 法 」 を学 ぶ こ とが 必 要 で す. こ の 講 座 は,こ
う い う観 点 で 統 計 学 を学 ん で い た だ くこ とを 期 待 し て
ま とめ た もの で す. 当 面 す る問 題 分 野 に よ っ て,扱
う デ ー タ も,必 要 と さ れ る手 法 も ちが
い ま す か ら,そ の こ と を考 慮 に 入 れ る …
しか し,で
き る だ け 広 く,体
系 づ け て 説 明 す る … こ の 相 反 す る条 件 を み た す た め に,い 冊 に わ け て い ます.
くつ か の 分
ま え が き
この テ キ ス ト の構成
クラ ス ター 分 析 は,多 次 元 デ ー タ解 析 に 属 す る高 レ ベ ル の 手 法 と受 け と ら れ て い ま す が,た
とえ ば 「わ け て み る」な ど
日常性 の あ る 手法 で あ り,計 測 さ れ た 基 礎 デ ー タ を 「そ れ ぞ れ の 意 味 を 考 え て タ イ プ わ け す る」と い う意 味 で,方 法 論 と して 重 要 な 機 能 を も つ 方 法 で す か ら,広
く使 っ て ほ しい もの で す.
この 手 法 の 数 理 を展 開す るた め に は,若 干 の数 学 的 な 予備 知 識 が 必 要 だ と さ れ て い ま したが,そ
れ を適 用 す る ため の計 算 を コ ン ピ ュ ー タ に まかせ る こ とに
す れ ば,数 学 的 な 展 開 を 避 け て 学 び,種 々 の 問 題 に適 用 で き ま す.し
たが っ
て,数 学 的 な予 備 知 識 を前 提 とす る こ とな く,そ の 使 い方 を解 説 し た テ キス ト が た くさん 出版 さ れ て い ま す. しか し,や さ し く学 ぶ こ とが で き る よ うに な っ た … とい うわ け で は あ り ま せ ん.「 数 学 的 な 骨 組 み 」が ど う な って い る か を知 ら な くて は 適 正 に 使 え ませ ん.ま た,ど
ん な 問 題 に有 効 か , あ る い は,有 効 な使 い 方 をす る に は どん な 注
意 が 必 要 か…
こ うい う点 を十 分 に 解 説 した テ キ ス トを使 っ て学 ば な い と,コ
ン ピュ ー タか ら出 た 出 力 を正 し くよめ ませ ん. この テ キ ス トは,こ
こ を 重視 し た構 成 に組 み 立 て て あ り ます.
まず,「 区 分 け の 進 め 方 」に 関 して 典 型 的 な場 面 を順 序 づ け て 「そ の 論 理 構 成 」を説 明 し(第 1章),そ
れ を 「分 散 分 析 」の 考 え 方 を拡 張 して い く も の と 了
解 で き る こ とを説 明 し(第 2章),典 型 的 な適 用 例 を使 っ て,そ
の適用 にあ たっ
て考 え るべ き点 を 説 明 しま す(第 3章). 次 に,基 礎 デー タ が 質 的 デ ー タ で あ る場 合 に つ い て,構
成 比,特
化 係数 を
使 っ て 比 較 し,情 報 量 を使 って 区 分 け の 有 効 性 を評 価 す る形 で,数 量 デ ー タ と 同様 な 扱 い が で き る こ とを 説 明 し(第 4章),典 型 的 な適 用 例 を使 っ て,そ の 適 用 に あ た って 考 え るべ き点 を説 明 し ます(第 5章). 第 6章 以 下 は,ク
ラ ス ター 分 析 の 適 用 に関 す る トピ ッ クス です.
区 分 数 を特 定 しな い 形 で い わ ば 分 類 体 系 を 求 め る こ と を考 え た 適 用(第6 章),複 数 の 基礎 デー タ を結 合 して 使 う場 合(第 7章),年 合(第 8章),地 この テ キ ス ト の説明方法 す が,そ
次 変 化 を考 察 す る場
域変 化 を考 察 す る場合(第 9章)を 取 り上 げ ます. この テ キ ス トで は,実 際 の 問 題 解 決 に 直 結 す る よ う に,適 当 な 実例 を取 り上 げ て 説 明 して い ます.数 理 を解 説 す るの で
の 数 理 が な ぜ 必 要 とな るの か , そ う して,数 理 で ど こ ま で対 応 で き,
ど こ に 限 界 が あ るの か … そ こ を は っ き りさせ る ため に選 ん だ 実例 です. 実 際 の 問 題 を 扱 い ます か ら,コ ン ピ ュー タ を使 う こ と を前 提 と し て い ま す. ま た,手 法 を学 習す るた め に も,実 例 を扱 う体 験 を もつ こ とが 必要 で す. 学 習 を助 け る ソ フ トつ き
こ の シ リー ズ で は,そ 『統 計 ソ フ トUEDAの
うい う学 習 を助 け るた め に,第
9巻
使 い 方 』に デ ー タ解 析 学 習 用 と して 筆
者 が 開 発 した 統 計 ソ フ トUEDA(Windows版CD-ROM)を
添 付 し,そ の解 説
を用 意 して あ ります. 分 析 を実 行 す る ため の プ ロ グ ラム ば か りで な く,手 法 の 意 味 や 使 い 方 の 説 明 を 画 面 上 に 展 開 す るプ ロ グ ラ ムや,適
当 な 実 例 用 の デ ー タ をお さめ た デー タ
ベ ー ス も含 まれ て い ます . こ れ ら を使 って,
テ キ ス ト本 文 を よむ
→ 説 明 用 プ ロ グ ラム を使 って 理 解 を確 認 す る
→ 分 析 用 プ ロ グ ラ ム を使 って テ キ ス トの 問 題 を解 い て み る
→ 手 法 を活 用 す る力 をつ け る
→… と い う 学 び 方 を サ ポ ー トす る 「学 習 シ ス テ ム 」に な っ て い る の で す. こ の テ キ ス ト と一 体 を な す も の と し て,利
用 し て い た だ く こ と を期 待 し て い
ま す. 2002年12月 上 田 尚 一
次
目
l. 区 分 け の 論 理 1.1 他 と離 れ た 値 は わ け て 扱 う
l
1.2 デ ー タ の属 性 を 考 慮 に 入 れ る 1.3 変 数 の 追 加 あ る い は細 分
9
1.4 デ ー タ の 扱 い 方 を考 え る
12
1.5 ク ラ ス ター 分 析 に よ る区 分 け 1.6 ク ラ ス タ ー 分 析 問
題1
5
13
21
23
2. デ ー タ の 区 分 け と 分 散 分 析 2.1 平 均 値 と分 散 2.2 多 次 元 化 問
題
2
25
25 29
35
3. ク ラ ス タ ー 分 析(l)−
数量 デー タ を扱 う場 合
3.1 ク ラ ス ター 分 析 の 数 理(1) 3.2 食 生 活 の 地 域 差
41
3.3 ク ラ ス ター 数 の 決 め 方
47
3.4 ク ラ ス ター 分 析 の 種 々 の 方 法 問
題
3
49
52
4. 構 成 比 の 比 較
54
4.1 構 成 比 と特 化 係 数
54
4.2 分 析 手 段 と して の構 成 ・運 用 4.3 情
報
量
61
4.4 デ ー タ 分 解 と情 報 量 分 解 問
題
4
37
37
73
65
58
1
5. ク ラ ス タ ー 分 析(2)―
質 的 デ ー タ を 扱 う場 合
5.1 ク ラ ス ター 分 析 の 数 理(2) 5.2 例−
5.4 例 − 問
75
人づ きあ いに関 す る意識
5.3 複 数 の デ ー タ の 結 合 −
題
75
82
質 的 デ ー タの 場 合
86
食 生 活 の 地 域 差(構 成 比 で 表 わ して 比 較)
90
5 93
6. 階 層 的 手 法
95
6.1 ク ラ ス ター 分 析 − 6.2 階 層 的 手 法 の 出 力
階層 的手 法
6.3 合 併 許 容 条 件 を つ け る場 合 6.4 例 − 問
題
95
97 102
階 層 的 手 法 の 断 面 と して 得 られ る ク ラ ス ター
103
6 107
7. 基 礎 デ ー タ の 結 合 7.1 変 数 の 結 合
109 109
7.2 同 じ変 数 に つ い て 条 件 をか え て 観 察 した 結 果 の 結 合 7.3 説 明 変 数 をつ け 加 え る
7.4 説 明 用 の 観 察 単 位 をつ け 加 え る 問
題
114
119 123
7 127
8. 時 間 的 変 化 の 分 析
128
8.1 各 年 次 ご とに ク ラ ス タ リ ン グ
128
8.2 ク ラ ス ター 区 分 を 固定 して,指
標 値 の 変 化 をみ る
8.3 ク ラ ス ター 区 分 を 固定 す る こ との 妥 当 性 評 価 8.4 指 標 値 の 変 化 を み る た め の ク ラ ス タ ー 区分 問
題
143
9.1 表 現 単 位 の サ イ ズ の 選 び 方 9.2 補 足:レ ベ ル レー ト図
143
147
9.3 東 京 都 西 部 に お け る 人 口 推 移(1)
150
9.4 東 京 都 西 部 に お け る 人 口 推 移(2)
156
9.5 ク ラ ス ター 分 析 の 適 用 意 図 題
137
8 141
9. 地 域 デ ー タ の 分 析
問
131
135
9 163
160
10.
複 数 の観 点 で 区 分
166
10.1 種 々 の 観 点 で 区 分 す べ き 問 題 の 典 型 例 10.2 分 散 の ちが い の 影 響
10.3 階 層 構 造 を 考 慮 に 入 れ る 問 題10
付
録
166
170 173
178
179
A. 分 析 例 と そ の 基 礎 デ ー タ
179
B. 図 ・表 ・問題 の 基 礎 デ ー タ C. プ ロ グ ラ ム の 使 い 方
180
189
C.1 プ ロ グ ラ ムCLASS
189
C.2 プ ロ グ ラ ムCLUST
193
C .3 プ ロ グ ラ ムMCLUST
196
C.4 地 域 メ ッ シ ュ 統 計 に 関 す る デ ー タペ ー ス D. 統 計 ソ フ トUEDA
索
引
◎
スポ ッ 卜
200
202
204
EDAとCDA Kullbackの
16 情報 量
単 調 な階層構 造
63
100
《シ リー ズ構 成 》 1. 統 計 学 の 基 礎
どん な場 面 で も必 要 な基本概 念.
2. 統 計 学 の 論 理
種 々 の 手 法 を広 く取 り上 げ る.
3. 統 計 学 の 数 理
よ く使 わ れ る 手 法 を くわ し く説 明.
4. 統 計 グ ラ フ
情 報 を 表 現 し,説 明 す る ため に.
5. 統 計 の 誤 用 ・活 用
気づ か ないで 誤用 して い ませ んか.
6. 質 的 デ ー タ の 解 析
意 識調 査 な どの数字 を扱 うために.
7. ク ラ ス ター 分 析
多次 元 デー タ解析 とよばれ る
8. 主 成 分 分 析
手 法 の う ち よ く使 わ れ る も の.
9. 統 計 ソ フ トUEDAの
使 い 方
1∼8に
共 通 で す.
こ の 講座 に 関 す る ホ ー ム ペ ー ジ を 開 設 し ま し た. http://www9.ocn.ne.jp/ uueeddaa で す.今
の ところ
1. 各 テ キ ス トの 概 要 説 明
2. 正誤 表
3. ソ フ トUEDAの
使 用環 境に 関す る注意
4. Windows
使 う場 合 に 必 要 なINSTALLプ
5. 自 由 に ダ ウ ン ロ ー ドで き る い くつ か の サ ン プ ル プ ロ グ ラ ム
XPを
が 掲 載 さ れ て い ます.参
照 して くだ さ い.
ロ グラム
1 区 分 け の 論 理
この テ キ ス トで 取リ 上 げ るの は,観 察単 位 につ い て求 め られ てい る観 察値 を参 照 して,そ れ らをい くつ かの グ ル ー プに 区分 けす る ため の 手 法 です. この 章 で は,こ うい う問 題 を扱 うため に慣 用 され てい る手 順 を示 した 後,ク ラス タ ー分析 とよば れ る 手法 が,こ の 問 題 に対 して ど んな 効 用 を 果 たす か を概 説 し ます.
1.1 他 と離 れ た値 はわ け て扱 う ① ま ず 表1.1.1を が,た
と え ば1番
み て くだ さ い.こ
れ が 何 の デ ー タか は しば ら く伏 せ て お き ます
目 の デ ー タ が 他 と 著 し く離 れ て い る よ うに み え ます.も
ら,こ れ を 他 と一 緒 に 扱 うの で な く,わ け て 扱 うべ きだ…
しそ うな
こ うい う問 題 提 起 が あ り
え ま す. こ う い う問 題 提 起 に こ た え る た め に 使 わ れ る 手 法 を考 え て い き ま し ょ う.こ は,説
明 の 関 係 で 簡 単 化 して あ り ます.実
多 く,取
際 の 問 題 で は,た
り上 げ る変 数 も 1つ とは 限 り ませ ん が,こ
の例
とえ ば デ ー タ数 が も っ と
こ で は こ の 例 を使 っ て,提
起 した
問 題 を どの よ う に 扱 うの か , そ の 進 め 方 を概 説 して お き ま し ょ う. ② 例 1 表1.1.1の観 大 の1400が,他
察 値 は60か
ら1400と
広 い 範 囲 に 散 布 して い ま す が,最
と著 し く離 れ て い る こ と を 問 題 視 して い る の で す. 表1.1.1
あ る変 数X
の値 の分 布−(例1)
観 察 値 の 分 布 を み る た め に,図1.1.2の
よ う に 表 わ し ます が,こ
の例 の よ うに 他 と
著 し く離 れ た値 が 含 ま れ て い る と き,そ の こ と を 指 摘 す る手 法 と し て慣 用 され る ボ ッ ク ス プ ロ ッ トの 形 式 に 表 わ した もの が 図1.1.3で
す.
デ ー タ が 集 中 して い る 部 分(図 の ボ ッ ク ス の 部 分)か ら 「あ る 限 度 以 上 離 れ た も の 」 は 「 外 れ 値 と み な せ 」 とい う趣 旨 の 図 で す. こ れ に よ っ て,最 そ の 次 の値600も
大 の1400だ
図1.1.2
け で な く,
X の 分 布(例 1)
外 れ 値 だ と指 摘 さ れ て い
ます. ◇ 注 1 ボ ッ ク ス プ ロ ッ トに つ い て は,本 シ リー ズ 第 1巻 『 統 計 学 の 基礎 』を参 照 して くだ さい. ◇ 注 2 ボ ック ス プ ロ ッ トの か わ りに 平 均 値 と標 準 偏 差 を 使 って 図1.1.4の
よ うに 図
示 す る と,右 端 の デ ー タ は,標 準 偏 差 の 4 倍 以 上 離 れ て い る こ とが わ か りま す.そ の こ とを理 由 に して,わ け て 扱 え とい え ます.
図1.1.3
例 1の 分 布 の ボ ッ ク ス プ ロ ッ ト
た だ し,分 布 の 型 が 非 対 称 で す か ら,平 均 値,標 準偏 差 の か わ りに 中位 値,四
分位偏
差値 を使 う方が よい の です. 図1.1.4
ば,他
図1.1.3の
代案
平 均 値 と標 準 偏 差
③ こ れ だ け は っ き り と わ か れ て い れ の デ ー タ と区 分 し て 扱 え と い っ て よ
い で し ょ う. しか し, 図1.1.5
他 と離 れ て い な くて も,
「わ け て 扱 うべ き場 合 が あ り う る 」
X の 分 布(例 2)
こ とに 注 意 し ま し ょ う. ④ 例 2 図1.1.5の X の 値 を47の
例 は,あ
る変 数
観 察 単 位 に つ い て 求 め た結
果 で す. こ の 例 の 場 合,他
の 値 と 離 れ て い る とみ
られ る値 は あ り ませ ん.ボ (図1.1.6)に
よ っ て,そ
ックスプ ロッ ト
の こ とが 確 認 さ れ
ま す. しか し,別
の 変 数 Y と組 み 合 わ せ て み
る と,図1.1.7の
よ うに な り,
関 係 が 他 と異 な る 」 とみ
「X,Yの られ る
図1.1.6
例 2の 分 布 の ボ ッ クス プ ロ ッ ト
図1.1.7 例 2の X を別 の変 数Y
と組 み合 わせ て み た 図
一 群 の デ ー タ が 図 の 上 部 に 見 出 さ れ ます . ⑤ こ れ らの 例 に お け る 「わ か れ て い る」 とい う指 摘 は,デ
ー タの分 布 状 況 に も と
づ くも の で す. くわ し くい う と,
変 数 値 が わ か れ て い る こ と に 注 目 し て,
観 察 単 位 をわ け て い る
こ とに 注 意 し ま し ょ う. も っ ぱ ら観 察 単 位 の 定 義 に も とづ い て(観 察 値 を参 照 す る こ と な く),そ れ を わ け る こ と も考 え ら れ ます が,こ
こ で は,概
念 規 定 に も とづ い て わ け る の で な く,
「デ ー タ を参 考 に し て わ け る」,ま た は,「 わ け る た め の ヒ ン トを得 る 」
こ とを 考 え て い るの で す. した が っ て,そ
れ ぞ れ の デ ー タ の 属 性 を考 慮 に 入 れ て,「 こ うい う こ と で わ か れ た
の だ 」 と い う説 明 が 必 要 で す.ま
た,そ
う い う 説 明 が で き て は じめ て,
「わ か れ た こ とが わ か っ た 」と 主 張 で き る
こ と に な り ます. ⑥ 図1.1.7は,X,Y
の 値 の 分 布 状 況 を 示 して い ます.
統 計 学 の 数 理 で い う(2 次 元 の)「分 布 図 」だ とい うの は,こ は な いの で す が,し
用 語 は と も か く,(X,Y)の も ち ろ ん,一
こ では 必 ず し も適 当 で
ば ら くそ う よん で お き ま し ょ う. 値 は,左
下 か ら 右 上 の 方 向 に 散 布 し て い る よ う で す.
線 に の っ て い る わ け で は あ り ませ ん が,
「X が 大 き くな る と Y が 大 き く な る 」 とい う傾 向 性
が み られ ます. こ う い う傾 向 は,相 関 係 数 ρ を 使 っ て い う と
図1.1.8
デ ー タの 存 在 範 囲 を示 す 集 中 楕 円(例 2)
ρ>0だ と い う こ とで す. ◇ 注 これ に 対 して,右 上 の い くつか の デー タは他 とちが うよ うだ … そ う判 断 して これ ら を除 く と,多 数 部 分 での傾 向 は右 下 が りの よ うです.相 関係 数 は 負 に な るで し ょ う. 統 計 学 の 数 理 で は,2 変 数(X,Y)の
関 係 を表 わ す 分 布 型 を
X の 平 均 値 と標 準 偏 差
μκ,σx
Y の 平 均 値 と標 準 偏 差
μγ,σy
X,Y の 相 関 係 数
ρ
を使 っ て 表 現 で き る … こ う教 え て い ます. しか し,こ れ ら の 母 数 を使 うこ と は,
(X,Y)の
分 布 模 様 を 図1.1.8の
よ う な楕 円 で 表 現 す る
こ と を意 味 す るの で す(8 ペ ー ジ の 注 参 照). こ の 形 は,(X,Y)の
分 布 に関 し て 対 称 性(平 均 値 の位 置 に 関 し て 点 対 称)を もつ こ
とを 意 味 し て い ま す. 実 際 に そ う な っ て い る とは い え な い に して も,実 際 の デ ー タ の 分 布 に 関 す る モ デ ル と して こ う い う形 を想 定 で き る … こ う い う説 明 も受 け 入 れ に くい の で す. した が っ て,こ
う い う楕 円 を 使 う前 に,デ
た と え ば 「ρ>0だ 」 と い う こ と も,次
ー タの 分 布 模 様 を み る こ とが 必要 で す.
の よ う に み て い く と,受
け 入 れ に くいの で
す. 右 上 に い くつ か の デ ー タが 一 団 を な し て い る よ うで す.そ もの と して そ れ 以 外 の 部 分 を み る と),ρ は,負 した が っ て,ρ の 値 を論 ず る 前 に,ま
れ ら を 除 く と(別 に み る
に な る で し ょ う.
ず,す べ て を 1つ の バ ッ ジ と して 扱 う こ と に
つ い て,そ
の 妥 当性 を検 討 し な け れ ば な ら な い の で す.
◇ 注 数 理 的 な モ デル は,観 察 値 が 「同一 条 件 下 で の く りか え し観 察 値 」,い い か え る と, 「ラ ンダ ム な くりか え し観 察値 」だ とみ な され る場 合 に 有効 な概 念 で す.
実 際 のデ ー タは そ うい えな い場 合 が 多 い こ とに注 意 し ま し ょ う.た とえば,ひ つ あ る個 性 を もっ て お り,そ の ちが いに応 じて,い う場 合 です.こ の テ キ ス トで 扱 うの は,そ
とつ ひ と
くつ か の部 分 に わか れ て い る,そ う い
うい うデー タです.
1.2 デ ー タ の 属 性 を 考 慮 に入 れ る ① 前 節 の 表1.1.1で 院 ・診 療 所 数(1970年
取 り上 げ た 変 数 X は,東
京23区
の 「人 口10万
人 あ た り病
値)」 で し た.
そ の 値 の 大 小 に は,各
区 の 位 置 が 関 係 し て い る で し ょ う か ら,各
区 の位 置 に X の
値 を図 示 し ま し ょ う(図1.2.1). 図 に付 記 した よ う に,値
を 5段 階 に 区 切 っ て 図 示 し て い ま す.
他 と離 れ て大 き い 値 を も っ て い た の は都 心 の 千 代 田 区(区 分 5)で し た.ま の 図1.1.3で
た,前
節
外 れ 値 と指 摘 され た の は 千 代 田 区 と 中 央 区(区 分 4)で し た.
こ れ らの 地 域 を と り ま く形 で,値
の 大 き い 地 域 が つ な が っ て い ます.
し た が っ て,千 代 田 区 ・中 央 区 と特 定 し た 説 明 で な く,都 心 地 区 の 特 徴 と し て の 説 明 を考 え よ とい うこ とに な りま す. ま た,そ
の 周 辺 地 区 に つ い て も,山
の 手 地 区 か ら西 へ と値 の 大 き い 地 域 が 見 出せ ま
す. 地 域 デ ー タ に つ い て は,こ
の よ うに
地 図 形 式 に して 分 布 を み る
図1.2.1
地 域 区分 は地 図 で表 示(例 1)
の が 有 効 で す. 個 々 の 地 点(例 1で は 区)の 情 報 を 基 礎 に す る に し て も,そ
の 区 切 りに か か わ ら な
い形 で 「 特 徴 を示 す た め に 適 し た 大 き い 地 域 区 分 が 見 出 さ れ る 」た め で す. ② 次 に,前
節 の 図1.1.7を
み ま し ょ う.
こ の 例 で 取 り上 げ た 2つ の 変 数 X,Y は,各
県 の 1世 帯 あ た り平 均 食 費 支 出 額 の う
ち
Y=肉,
X=魚
で した. 基 礎 デ ー タ は,付
表 B に 示 した 調 査 の,1970年
調査 時 の 値 で す.
◇ 注 1 この テ キ ス トの 説 明 で 使 う例 は,す べ てUEDAの 再 現 で きま す.基 礎 デ ー タ もUEDAの
プ ロ グ ラ ム を使 って 計 算 し,
デー タベ ー ス に 収録 され て い ま す.ま た,各 章 の
問題 を順 に解 い てい くこ とに よ って,確 認 で き ます. ◇ 注 2 UEDAの プ ログ ラム お よ び デー タベ ー ス に つ い て は,本 シ リー ズ第 9巻 『 統計ソ フ トUEDAの 使 い方 』を参照 して くだ さい. ③ こ れ ら 2変 数 の 関 係 を プ ロ ッ ト した の が 前 節 の 図1.1.7で,こ
の 図 の 上 で,
右 上 に い くつ か の デ ー タが 一 団 をな して お り, 他 と 区 分 され る よ う だ とい う こ とで し た. し か し,そ れ だ け で は 「そ う な っ て い る」 と い う だ け で す.当
然,「 そ れ は ど こ だ」
とい う問 い に 答 え る こ とが 必 要 で す. ④ そ の た め に は,す
べ て の デ ー タ を 同 じマ ー ク とす る の で は な く,
図1.2.2
観 察 単 位 のIDを
表 示(例 2)
各 県 の 位 置 を表 わす ため に使 っ た記 号 は,付
表 B に示 す 県
番 号 の か わ りにA,B, C,…,Z,a,b,c,…,uと
し て い ま す.
ひ とつ ひ とつ の デ ー タ を参 照 で き る よ うな マ ー ク を使 い ま し ょ う. 図1.2.2は,図1.1.7の
各 点 の 位 置 に 「県 の 番 号 順 に A,B,C,…,Z,a,b,c,…,uと
わ りあ て た 記 号 」を 使 っ て い ます. 右 上 の 一 団 は 滋 賀 県(Y),京
都 府(Z),大
阪 府(a),奈 良 県(c),和 歌 山 県(d)で す.
そ こ ま で わ か る と,「 関 西 は 肉 を よ く食 べ るか ら ね 」 と,デ ー タ の 分 布 を 裏 づ け る 説 明 が 得 られ るで し ょ う. ⑤ 「食 生 活 に 関 す る 地 域 特 性 だ 」 とい うこ とで す か ら,
県 に よ る 区 切 りの 上 位 区 分 に あ た る 「地 域 区 分 」
に 注 目 して 比 較 す る こ と も考 え られ ます. した が っ て,図1.2.3の
よ うに 「地 域 区 分 」の 番 号 を 示 す こ と も考 え られ ま す.
こ れ か ら,図 の 右 上 の 一 団 は,
近 畿 圏 の 各 県 で あ り,
肉 の 支 出 が 著 し く多 い とい う特 徴 を もつ こ と
が わ か り ます. ま た,右
下 の一 団 は
東北地 方 の各 県 であ り
魚 の 支 出 が 多 い とい う特 徴 を もつ こ と
が わ か り ます. ⑥ こ の よ うに,い
くつ か の 県 を含 む 地 域 区 分 に よ っ て,デ
ー タ の 特 徴 を説 明 で き
る と予 想 され る な ら,図 に ひ とつ ひ とつ の 県 名 を示 す か わ り に,同
図1.2.3
地域 区分 の番 号 を 表 示
1:北 海 道 ・東 北, 2 :関 東,3 : 中 部,4: 四 国,6 :九 州
じ特 徴 を も つ 地 域
近 畿,5:
中 国 ・
図1.2.4
各 区 分 に 包 含 され る範 囲 を 図示
区 分 の 番 号 を 図 示 す る 方 が わ か りや す い で し ょ う. ま た,各
区分 に 包 含 され る 地 点 の 範 囲 を 図1.2.4の
よ う に楕 円 で か こ ん で お く と よ
い で し ょ う. ⑦ こ の よ う に 表 現 す れ ば,
い くつ か の 観 察 単 位 か ら な る ク ラ ス ター が 存 在 し,
変 数 値 で み た ク ラ ス タ ー の特 性 を把 握 す る
こ と が で き る で し ょ う. こ の 節 で は,図
を使 っ て こ うい う ク ラ ス タ ー を 把 握 し ま し た. 変 数 が 3つ 以 上 に な
る と,「 図 を使 っ て 」 とい う と こ ろ を変 更 す る こ と が 必 要 で す が,手 わ り ませ ん.こ
続 きの論 理 は か
の手続 きを
ク ラ ス ター 分 析 と よば れ る手 法 に 組 み 立 て う る
の で す. 次 節 以 降 で デ ー タの 取 り上 げ 方 な ど に つ い て例 示 し た 後,次
章 以下 で クラス ター分
析 の 手 法 を 説 明 し ます. ◇ 注 図1.1.8や
図1.2.4の 楕 円 は
と表 わ され ます.正 規 分布 を想 定 で き る場 合,こ れ は,分 布 密 度 の等 しい 点 をつ な ぐ等 高 線 に あ た る もの に なっ て い ます.右 辺 の C をC=0.693と デ ー タ の50%を
占め る範 囲に な り ます.一 般 に はC=1と
です(水 野 欽 司,多 変 量 デー タ解 析 講 義,朝 倉 書 店,1996,付
お きか え る と,そ の楕 円 が し ます が,そ の 場 合 は63.2% 録 2参 照).
こ こ では正 規 分 布 を想 定 して い るわ け で は あ りませ んか ら,デ ー タの 存在 範 囲 を 「 ほぼ この あ た りだ 」とい うこ とを示 す グ ラフ として 受 け とって くだ さい.
1.3 変 数 の 追 加 あ る い は 細分 ① 前 節 で,変 数 や 観 察 単 位 の 属 性 を考 慮 に 入 れ る こ と に よ っ て,デ
ー タの分布 に
つ い て 説 明 で き る こ と を指 摘 しま し た. さ らに,区 と,よ
分 の ちが い を
区 分 け に 使 っ た 変 数 だ け で な く, そ の 変 数 値 の ち が い に 関 係 す る とみ ら れ る別 の 変 数 を考 慮 に 入 れ る りよ く説 明 で き る可 能 性 が あ り ます.
ま た,
区分 けに使 った変数 を
い くつ か に 細 分 し た もの と し て 定 義 さ れ る変 数 を 使 う
こ と も,有 効 で し ょ う. こ の 節 で は,こ を追 加 す る,あ
れ ま で と同 じ例 に つ い て,そ る い は,使
う い う可 能 性 を 検 討 す る た め に,変
数
っ た 変 数 を細 分 し て み ま し ょ う.
② 前 節 の 例 1で は,図1.2.1で
病院 ・ 診療所 数 の地 域差 につ いて 「 都 心 と周 辺 」あ
る い は 「山 の 手 と そ の 他 」で ち が うこ とが わ か り ま し た が,病 き い 総 合 病 院 と,診 療 所,す
院,す
な わ ち規 模 の 大
な わ ち 家 庭 医 と で 地 域 分 布 が 異 な る可 能 性 が あ りま す か
ら,そ れ を わ け て み る と よい で し ょ う. ③ 図1.3.1は,Y(=
病 院 数)とX(=
診 療 所 数)の 関 係 を プ ロ ッ ト し た も の で
す. 図1.2.1と
同 じ よ うに 地 図 形 式 に して 比 較 す る と確 認 で き る よ う で す が,地
で 表 現 で き る の は 1つ の 変 数 値 で す か ら,図1.3.1の 図1.3.1
Y(= 病 院 数)とX(=
形 式 を採 用 す るの で す. 診 療 所 数)の 関 係
図形 式
図 中 の 区 分 番 号 は,図1.2.1で は,こ
用 い た 区 分 番 号 で す が,値
が 著 し く離 れ た 千 代 田 区
の 図 で は範 囲 外 に な って い ま す.
こ の 図 の 横 軸 方 向 の 散 布 を み る と,X き る よ う です 。 こ れ に 対 し て,縦
の 分 布 が ほ ぼ 前 節 ど お りの 区分 け で 説 明 で
軸 方 向 の 散 布 を み る と,Y
の 差 を 説 明 す る た め に,
少 し区 分 け を か え る方 が よ い よ うで す. い い か え る と,2 つ の 変 数 に 注 目 して 区 分 け を考 え る と,前 節 と ちが っ た結 果 に な る で し ょ う. た と え ば,図1.3.1に 区23)を
お け る 区 分 4の デ ー タ の う ち左 下 に 位 置 す る2 つ(区20と
区 分 3に うつ す 方 が よ い よ うで す.
た だ し,そ
こ ま で 精 密 に 考 え る に は,図
をみ て わ け る の で は な く,客 観 的 な 手 順 で
わ け る こ とが 必 要 で す か ら,後 の 節 で 扱 うこ と に し ます. ④ 前 節 の も う ひ とつ の 例(例 2)で は,2つ 検 出 し ま し た が,肉
の 変 数 X,Y の 関 係 を み て,地
域差 を
と魚 の 選 好 は 「食 生 活 の パ ター ンの ひ とつ の 側 面 」で は あ っ て も
全 部 で は あ り ませ ん か ら,他 の 費 目で の 地 域 差 も一 緒 に み る 方 が よ い で し ょ う. 基 礎 デ ー タ は12区
分 に な っ て い ま す か ら,そ れ ら の 変 数 の す べ て を 考 慮 に 入 れ て
地 域 差 を み る … た だ し,そ こ ま で 進 む の は 次 章 以 下 の こ と と し,こ こ で は,野
菜 を
追 加 して 3変 数 と して み ま し ょ う. ⑤ 「2変 数 → 3変 数 」 とい う変 更 は,「 図 示 で き る → 図 示 で き な い」 と い う ち が い を も た ら し ます. 変 数 の 関 係 をみ る論 理 はか わ らな い に して も,図 示 で き る とい う大 き い 利 点 が 失 わ れ る こ と に な る の で す が,特 た と え ば,X,Y,Z
別 の 場 合 に は そ れ を避 け る 図 示 法 が あ りま す.
の 相 対 的 大 小 を み る,い
い か え る と,X+Y+Zが
一定 とい
う条 件 をつ け て 扱 う場 合 です. ⑥ (X,Y,Z)の
位 置 を 平 面 上 の 点 に対 応 させ る 「 三 角 図 表 」が 使 え るの で す.
こ の 図 表 でX,Y,Z
の 値 を表 現 す る原 理 を 図1.3.2を
使 っ て 説 明 して お き ま し ょ
う. ⑦ 正 三 角 形 の 各 辺 に,図1.3.2(a)の ら100%ま
で の 目盛 りを 刻 み ます.た
図1.3.2
よ う に,そ
れ ぞ れ P,Q,R に 対 応 す る 0か
だ し,図 の よ うに
三 角 図 表 の 原理 図
図1.3.3
基礎 デ ー タの 分 布
図1.3.5
図1.3.4
区 分番 号 を 表示
(P,Q,R)に
の 角 度 をつ け て か い て お く
方 向 へ 向 か っ て60度
対 応 す る点 を と る に は,そ
で す.
れ ぞ れ に 対 応 す る位 置 上 に 点 を と り,そ の
点 か ら,区 切 り線 の 方 向 に 線 を の ば し ま す.図1.3.2(b)の 場 合3 本 の 線 は,一 そ の 点 が,構
よ う に す るの で す.こ
の
点 で 交 わ る は ず で す.
成 比(P,Q,R)を
表 わ す 点 です.
こ の 作 図 の 手 順 を逆 に た ど る と,各 点 に 対 応 す る(P,Q,R)の ます.図1.3.2(c)に
表示
図1.3.6 各 区分 の デ ー タの 存 在 範 囲
刻 み 位 置 を示 す 区 切 り線 を60度 の が ポ イ ン トで す.0 か ら100の
観 察 単 位IDを
は,P
値 を よ む こ とが で き
の 値 を よ む た め の 補 助 線 を 書 き込 ん で あ り ま す.実
線で
す. Q の 値 を よ む た め の 線,R
の 値 を よ む た め の 線 も,同 様 に 書 き 込 め ます.
◇ 注 破 線 は あ る特 別 なよ み 方 をす る場合 に 対応 しま す.本 シ リー ズ 第6 巻 『 質 的 デー タ の 解 析 』を参 照 して くだ さい.
⑧ 前 節 の 例 に つ い て 図1.1.?お
よ び 図1.2.2∼1.2.4に
Z ← 野 菜)を つ け 加 え た
場 合 の 図 を三 角 図 表 を使 っ て か い た もの が,図1.3.3∼1.3.6で こ れ らに よ っ て,次 a.図1.3.3に
よ っ て 対 象 と す る47単
位 の デ ー タ の 分 布 を み る.
そ の 図 が 示 す 分 布 を み る と,全 部 の デ ー タ を1つ
b.図1.3.4の
す.
の 順 に 考 察 を 進 め て い け るの で す.
の バ ッ ジ と は み に くい.
よ う に ひ とつ ひ とつ の 観 察 単 位 のIDを
示 し て,別
区分 と して扱
うべ き ク ラ ス ター を 識 別 す る.
c.図1.3.5の
よ うに,い
くつ か の 観 察 単 位 を ま とめ る上 位 区 分 に 注 目す る.
d.図1.3.6の
よ うに 各 区 分 の デ ー タ の 存 在 範 囲 を図 示 す る.
→ デ ー タの 分 布 に 関 す る 説 明 を誘 導 で き る そ うして
区分1
区分2,3東
東 北地 方 日本
肉 が 少 な い,魚
がやや 多い
肉がや や少 ない
区分4
近 畿地 方
肉 が 多 い,野
区分5,6
近 畿 以西
肉がや や 多 い
菜 が少 な い
と い う地 域 区 分 と,そ れ ぞ れ の 特 徴 が 説 明 で き ま す. 1.1節 で得 ら れ た 説 明 と対 照 し て,野 菜 の デ ー タ を つ け 加 え た こ と に よ っ て,ど
う
か わ っ た か をみ て くだ さ い.
1.4
デ ー タ の扱 い 方 を考 え る
① こ れ ま で の 各 節 の 説 明 を こ こ で総 括 して お き ま し ょ う. 重 要 な こ と は,「 区 分 け を見 出 す た め に 参 照 す るデ ー タの 扱 い方 」で す. ② 食 生 活 の パ タ ー ン の 地 域 差 をみ る問 題 に つ い て,次
扱 い A: 変 数Xの
扱 い B: 変 数XとYの
扱 いC:
扱 いD:変
の 扱 い 方 を して き ま し た.
分 布 を 参 照 し て 区 分 け す る. 関 係 に 注 目 して 区 分 け す る.
さ らに 変 数 を増 や す(例 で は3つ
と し ま した が).
数 の 間 に 「あ る制 約 条 件 」(例 で はX+Y+Z=1)を
想 定 して
扱 う. デ ー タ の 散 布 状 況 を み て 他 と離 れ て い れ ば,そ る」の で す が,1つ
の こ と を 理 由 と し て 「区 分 け で き
の 変 数 で み た と き に わ か れ て い な くて も,他
た 形 で 散 布 状 況 を み る と わ か れ て い る 可 能 性 が あ り ます.し いB,扱
いC,の
の 変 数 と組 み 合 わせ
た が っ て,扱
いA,扱
順 に 区 分 け の参 考 とす る変 数 の 数 を増 や す 方 向 に進 む こ とに な り ま
す. た だ し,区 分 け の 仕 方 を くわ し くす る とい う意 味 で は,異
な った見 方 に対応 す る変
数 を選 ぶ と よ い で し ょ う. ③ 同 じ変 数 群 を 参 照 す る に して も,扱
いCに
対 す る扱 いDの
よ う に,異
なっ た
扱 い 方 が 考 え ら れ ます.例
示 で は,各
で 扱 い D を採 用 し ま した.当
然,ち
変 数 の 相 対 比 に 注 目 して 区 分 け す る と い う理 由 が っ た 結 果 に な り ます か ら,
区 分 け の 基 準 を ど う考 え る か に 応 じて,扱
い 方 を選 択 す べ き で す.
④ 扱 い D に つ い て は,「 形 式 的 に 」い う と,基 礎 変 数 が 3つ で あ っ て も,扱
い D
で は 制 約 条 件 が 成 り立 っ て い る た め に 基 礎 変 数 が 2つ の 場 合 と 同 様 に 扱 え る こ と に な っ て い ま す.一
般 化 して い え ば,変
数 間 に 制 約 条 件 が 存 在 す る こ と を考 慮 に 入 れ る
と 「変 数 の 数 を減 らせ る」 とい う こ とで す. ま た,変 数 の 数 を減 ら して も,「 情 報 の ロ ス は な い 」と い う こ と で す. ⑤ ④ の指 摘 は,「 情 報 の ロ ス は な い 」と い っ た と こ ろ を 「情 報 の ロ ス は 少 な い 」 とお きか え て考 え よ う とい う ア イ デ ア に つ な が り ます.す
な わち
情 報 の ロ ス が 少 な い こ と を確 認 で き れ ば, 情 報 を少 数 の 次 元 に 縮 約 し て 扱 う こ とが で き る と い う こ と で す. こ の テ キ ス トで 扱 う ク ラ ス ター 分 析 は,こ
の こ とに 注 目 して 組 み 立 て られ た 手 法 で
す. ⑥ 一 般 化 し て い う と, X,Y,Z
な ど を 同 列 に 並 ぶ 1セ ッ トの 情 報 と して 扱 お う と し て い る の だ が,
そ れ らが もつ 相 互 関 係 を 考 慮 す る と, そ れ ら を 少 数 の 変 数U,V
な ど に 組 み 替 え て 扱 う こ とが で き る の で,
そ の よ うに 扱 う. こ の 扱 い 方 の うち,基 礎 変 数 を 少 数 の 変 数 に 組 み 替 え る と こ ろ を扱 う の が 主 成 分 分 析(本 シ リー ズ 第 8巻 『主 成 分 分 析 』で 説 明)で あ り,そ
う した 上 で,ク
ラ ス ター 分 析
を適 用 し よ う とす るの で す. ⑦ い ず れ に して も,デ ー タの 分 布 を参 照 して 区 分 け をす る の で す か ら,変 数 の 選 び 方 い か ん に よ っ て 結 果 が か わ る の は 当 然 で す. 「変 数 の 選 び 方 」に よ っ て 区 分 け の 観 点 を定 め,そ を参 照 して 区分 け して み る … そ の 上,区 価 し て,寄
の 観 点 で で き る だ け 多 くの 変 数
分 け の 結 果 に ど の程 度 寄 与 し て い る か を 評
与 度 の 大 き い変 数 に しぼ っ て い く … こ う い う試 行 錯 誤 を 進 め て い くこ と
を考 え れ ば よ い で し ょ う.
1.5 ク ラ スタ ー分 析 に よ る 区分 け ① こ の 節 で は ク ラ ス タ ー 分 析 を適 用 して み ま し ょ う.そ の 数 理 を含 め た くわ しい 説 明 は 後 に し ます が,そ す.
れ を適 用 し た 結 果 を よ む こ と は こ れ ま で の 例 とほ ぼ 同 じ で
した が って,こ
れ ま で の 結 果 と ク ラ ス タ ー 分 析 の 結 果 を 比べ れ ば,ク
ラ スター分析
の 効 用 が わ か る と思 い ま す. 比 較 す る た め,例2を
取 り上 げ,前
節 で 示 し た 扱 いB,扱
いC,扱
いD を 適 用 し
て み ま し ょ う. ② 変 数X,Y
を 使 う場 合(扱 いB)
ま ず 扱 いB,す
な わ ち,魚
と 肉 の 支 出 額X,Y
に 注 目 し て,県 別 デ ー タ を比 較 す る
場 合 に つ い て ク ラ ス タ ー 分 析 を適 用 した 結 果 をみ ま し ょ う. こ れ ま で は,県
別 の 上 位 区 分 と して 慣 用 さ れ て い る地 域 区 分 別 に ま とめ て み る こ と
に よ っ て 地 域 差 を み ま し た が,こ
こ で は,慣 用 の 区 分 に と ら わ れ ず,デ
も とつ い て 区分 け し て み よ う とす る の で す.以
下 で は,こ
ー タの 分 布 に
の 観 点 で ま とめ られ た 区 分
を ク ラ ス ター と よ ぶ こ と に し ま す. 1.1節 で は慣 用 の 地 域 区 分 に つ い て,変 数 値X,Y 地 域1と
地 域4と
地 域2,地
の 値 をみ る と
が 他 と異 な る値 を も っ て い た の に 対 して,
域3,地
域5,地
域6は,X, Y
の値 の 分 布 が 重 な っ て い る
と い う結 果 で した. した が っ て,差
を 説 明 す る とい う観 点 で い え ぱ,地
域1,地
域4,そ
の他 の地 域 に
対 応 す る 3つ の ク ラ ス タ ー が 見 出 さ れ た とい う こ と で す. い い か え る と,6区 は,そ
分 に 区分 け す る も の とす れ ば,地
れ ら を ま とめ た 上 で,別
域2,地
域3,地
の 区 分 の仕 方 を考 え る方 が よ い …
域5,地
域6
と評 価 さ れ ます.
③ 区 分 を導 入 す る と きに, 「慣 用 さ れ て い る地 域 区 分 を使 う」 とい う方 針 「デ ー タ の 分 布 を み て 決 め る」 とい う 方 針 が い ず れ も あ り え ます が,1.1節
の 扱 い で は,前
者 の観 点 で の 区 分 の 妥 当性 を後 者 の
観 点 で評 価 した の だ とい う こ とが で き ます. ④ こ れ に対 して, 「デ ー タの 分 布 をみ て 決 め る」方 針 に徹 し て そ の 観 点 で の ク ラ ス タ ー を 見 出 す(慣 用 の 区 分 との 関 係 を み る に し て も後 の こ と とす る)こ と とす る な ら,ク ク ラ ス ター 分 析 は,こ
ラ ス ター 分 析 を適 用 す る こ とに な り ます.
う い う観 点 で 適 用 す る の が 普 通 で す.以
下 で は ④ の方 法 を
ク ラ ス ター 分 析 と よぶ こ と に し ま す. 図1.5.1(a)が
変 数X,Y
に っ い て,ク
ラ ス タ ー 分 析 を適 用 した 場 合 の 結 果 で す.
こ れ ま で の 結 果 と比 較 す る た め,図1.2.4と の こ と を考 え て,表1.5.1(b)
同 じ形 式 で 結 果 を示 し て い ます が,後
に ク ラ ス ター 分 析 の プ ロ グ ラ ム で 採 用 され る 出 力 形 式
で 各 ク ラ ス ター の 構 成 と特 徴 を示 して あ り ま す. メ ンバ ー 表 は 各 ク ラ ス ター に 包 含 さ れ る観 察 単 位 番 号(例 で は 県 番 号)を 示 し て い ます. ク ラ ス ター 特 性 表 は,各
ク ラ ス ター の 特 性 を 「メ ン バ ー の もつ 観 察 値 の 平 均 値 」に
図1.5.1(a)
表1.5.1(b)
X,Y の 分 布 に も とづ く クス ラ ス ター
つ い て,全
各 ク ラ ス ター の特 性 お よ び構 成 メ ン バ ー
体 でみ た平均値 よ り
++:
大 き い, +: や や 大 き い, ・:平 均 並 み, − :や や 小 さ い, −−:小
さい と 5段 階 評 価 し た結 果 を示 して い ます. ◇ 注 5段 階 の 区 切 り方 は次 の よ うに し て い ま す が,場 合 に よ って か え る こ とが あ り ま す.
++: 1以上, +:0.5∼1,
・:-0.5∼0.5,−:-1∼-0.5,−
こ の 結 果 を慣 用 の 地 域 区 分 と 比 べ る と次 の よ うに な っ て い ます.
地 域特 性 を説明 す る とい う問題 意識 でい うと,
−:−1以 下
特 性 の ちが い の は っ き り し な か っ た 地 域 区 分 1,2,3 が 組 み 替 え られ て そ の 地 域 差 に 関 し て よ り くわ し い 説 明 が 得 ら れ た とい う結 果 で す. ⑤ 変 数 X,Y,Z
を使 う場 合
次 に 扱 い C,す な わ ち 「2変 数(X,Y)→ て,ク
3変 数(X, Y,Z)」
を使 った場 合 につ い
ラ ス ター 分 析 を適 用 して み ま し ょ う.
そ の 結 果 が 図1.5.2(a)∼(c)で
す.こ
の 場 合,X, Y, Z の 関 係 を 1枚 の 図 に お さ め
られ な い の で, X,Y を 横 軸,縦
軸 に とっ た図
Z,Y を横 軸,縦
軸に とった図
X,Z を横 軸,縦
軸に とった図
に わ け て い るの で す. 3つ の 図 を 1セ ッ ト と して X,Y,Z の 関 係 を よ む の で す が,各 を 手 が か り に で き ま す か ら,た
とえ ば 区 分 4は,X
が 負,Y
区 分 の 位 置 は楕 円
が 負,Z
が ほ ぼ 0と よ
め る で し ょ う. ⑥ 各 ク ラ ス ター の 位 置 と メ ン バ ー 構 成 は,表1.5.2(d)の で す.X,Y,Z
よ うに 表 わ す の が 普 通
の 位 置 は 「+」,「−」の マ ー クで 表 示 して い ま す が,各
特 性 を 比 較 す る た め に は,こ
ク ラ ス ター の
の 方 が 簡 明 で す.
扱 い B の 場 合,す
な わ ち(X,Y)だ
け を使 っ た 場 合 と比 べ ま し ょ う.
そ の た め に は,ま
ず,図1.5.1(a),図1.5.2(a)に
よ っ て,そ
れ ぞれ の場合 の ク ラ
EDAとCDA 問 題 の 扱 い 方 と して a. 「こ の よ うに 説 明 さ れ る は ず だ 」と い う仮 説 が あ っ て,そ
の仮 説 の 当否
を デ ー タ に よ っ て 検 証 し よ う とす る場 合 b. 「こ の よ うな 問 題 を 考 え よ う」 と い う 問 題 意 識 を も っ て,そ
の 問題 に関
連 す るデ ー タ を集 め て,デ ー タ か ら よ み とれ る こ と を要 約 し て い こ う と す る場合 が あ る こ とに 注 意 し ま し ょ う. aの 観 点 で 組 み 立 て ら れ た 手 法 を 「 検 証 的 デ ー タ 解 析 」(confirmatory analysis;CDA),b (exploratory
data
analysis;EDA)と
問 題 解 決 手 段 と して は,ま
ず,現
よ び ます. 状 を把 握 す る た め にEDAを
説 明 す る 仮 説 を た て う る 段 階 に な っ た ら,CDAを む の が 普 通 で す.
data
の 観 点 で 組 み 立 て ら れ た 手 法 を 「探 索 的 デ ー タ 解 析 」
適用す る …
適 用 し,問 題 を こ う い う順 をふ
ス タ ー の対 応 関 係 をみ ます. 例 2の 場 合 に は,次
の よ うに 対 応 し て い る こ とが わ か り
ま す.
ク ラ ス ター の 番 号 は,こ
う い う対 応 関 係 を み た 上 で 適 宜 つ け か え ます.
こ こ で は コ ン ピュ ー タ 出 力 を そ の ま ま 表 記 して い ます が,コ は 「た ま た ま そ う な っ た に 過 ぎ な い 」 もの で す か ら,説
ン ピュー タ出力 の番 号
明 しや す い 順 に つけ か え るべ
き もの で す. 例 示 で は 各 ク ラ ス タ ー の 特 性 を対 比 して 似 た も の をつ な ぎ ま した が,メ
ンバー 構成
を対 比 して つ な ぐ こ と も で き ま す.ど
ち らの 観 点 で つ な い で も 同 じに な る とは 限 り ま
せ ん か ら,説 明 の 進 め 方 を考 え て,ど
ち ら を採 用 す る か を決 め ま し ょ う.
⑦ こ の ま とめ に よ って,変
数 「Z を加 え た ら こ うな っ た 」 と い う こ と だ け で な く
Z を加 え た こ とに よ っ て 変 化 し な い 部 分 は … Z を加 え た こ とに よ っ て 変 化 し た部 分 は … と い う説 明 が で き ます か ら 変 数 Z をつ け 加 え た こ との 効 果 を 評 価 で き ます. い い か え る と,こ
う い う評 価 を下 す こ とに よ っ て,機
図1.5.2(a) X,Y
X,Y,Z
械 的 に 変 数 を増 や す の で な
の 分 布
の分 布 に よる ク ラス ター 区 分
X
図1.5.2(b) Z,Y
の 分 布
,Y,Z の分 布 に よ る クラ ス ター 区 分
図1.5.2(c) X,Z ,Y,Z
表1.5.2(d) X,Y,Z
の 分 布X
の 分 布 に よ る ク ラ ス ター 区 分
の分 布 に よ る ク ラ ス ター 区 分 の特 性 お よ び構 成 メ ンバ ー
く,有 効 な 変 数 を増 や す … こ う い う扱 い を 考 え う る こ と に な り ま す. ⑧ 変 数 の数 を さ ら に増 や す 場 合 に は,そ
れ ら の 相 互 関 係 を考 慮 し て 概 念 整 理 を す
る手 順 を 組 み 込 み ま す. 第 3章 で 説 明 し ま す が,次
の 扱 い D は,変
数 の 間 に あ る 条 件 が 成 り立 っ て い る こ
とを 利 用 す る場 合 の ひ と つ の モ デ ル で す. ⑨ 変 数 X,Y,Z こ れ は,X,Y,Z
をX+Y+Z=1と
い う条 件 つ き で 扱 っ た場 合
を構 成 比 の 形 に して 扱 っ た場 合 で す.
こ の 場 合 の 結 果 が 図1.5.3(a)で
す.
こ の 図 も 「ク ラ ス タ ー の 特 性 を 比 較 す る」た め に 使 う の で す が,変 た 場 合 に も,P+Q+R=1と
数 が 3つ に な っ
い う 条 件 を み た し て い る た め に,X,Y,Z
の位 置 を 1
点 で 表 現 で き ま す. し た が っ て,図1.5.2の
よ うに 3枚 セ ッ トに しな くて す む の で す.
扱 い C を 扱 い D に 変 更 した こ と に よ る変 化 を み ま し ょ う. 表1.5.3(b)と
表1.5.2(d)を
対 比 して メ ン バ ー 構 成 を み る と,ク
ラ ス ター 区分 が
次 の よ うに 対 応 して い る こ とが わ か りま す.
図1.5,3(a)
X,Y,Z の 分布
ク ラ ス ター 区 分 は扱 いD の 場 合
表1.5.3(b)
扱 い D の 場 合 の ク ラ ス ター 特 性 お よ び構 成 メ ンバ ー
X,Y,Z
を使 っ た場 合
⑩ こ の 比 較 は,ど X+Y+Zが
同 左,た
ち ら も 3変 数Q1,Q2,Q3の
だ しX+Y+Z=1と
して 扱 う
関 係 をみ た も の で す が,
一定
とい う条 件 を 入 れ た こ とに よ る ちが い を 表 わ し て い る の で す. こ の こ とか ら,た
と え ば 「す べ て が 多 い 」地 域 と 「す べ て が 少 な い 」地 域 とが 区 別 さ
れ な い 結 果 と な る こ と に 注 意 し ま し ょ う. こ の こ と を 念 頭 に お い て 比 較 表 を み る と, 「す べ て が 多 い」 ク ラ ス ター 5 と 「す べ て が 平 均 並 み だ が Z が 少 な い 」 ク ラ ス ター 3が 相 対 比 と して は 同 じに な り, 相 対 比 の 細 か い ちが い に よ って 3区 分 に組 み 替 え られ た こ と, 「す べ て が 少 な い 」ク ラ ス ター 4 と 「す べ て が 平 均 並 み 」の ク ラス タ ー 1とが 相 対 比 と して は 同 じに な り 1つ の 区 分 に な っ た こ と を よ み と る こ とが で き ま す. こ の 場 合,基
礎 デ ー タ は 同 じで も扱 い 方 を か え た こ と に よ っ て,結
果が かわ った の
で す. ⑪ な お 構 成 比 で み る と い う扱 い に つ い て 調 査 対 象 の 人 数 を カ ウ ン トし た表 に つ い て 人 数 の 構 成 比 の 形 に して 扱 っ た場 合(質 的 デ ー タ の 場 合) と 各 観 察 単 位 に つ い て 数 量 で 評 価 され て い るデ ー タ に つ い て 数 量 評 価 値 の 相 対 比 の 形 に し て 扱 っ た 場 合(数 量 デ ー タ) と を 区 別 す る こ と が 必 要 で す. こ の 節 で例 示 し た の は,数
量 デ ー タ を相 対 比 と して 扱 っ た 場 合 で す.
1.6 ク ラ ス ター 分 析 ① 前 節 で 例 示 し た ク ラ ス ター 分 析 に つ い て は,次 が,ま
ず こ こ で,そ
章 以 下 で く わ し く説 明 し ま す
の あ ら ま しを 示 して お き ま し ょ う.
② 各 観 察 単 位J に 対 し て 1セ ッ トの 変 数(X1J,X2J,…,XKJ)
が 求 め ら れ て い る場
合,
a. 観 察 値 が 類 似 して い る観 察 単 位 を ま と め て,少
数 の 区 分(ク ラ ス ター)に 集
約 す る こ と を 考 え る. b.
こ の 集 約 の 有 効 性 は,「 集 約 に よ る情 報 ロ ス」の 少 な さ で評 価 され る.
c. 情 報 ロ ス が 最 小 とな る集 約 法 を見 出 す 手 順 を組 み 立 て る. … こ の 手 順 を 受 け も つ の が ク ラ ス タ ー 分 析 です . ③ た だ し,変 数 の タ イ プ に よ っ て 数 量 デ ー タ … 数 量 で 計 測 さ れ る 変 数 の 場 合 質 的 デ ー タ … あ る項 目の 回 答 区 分 に 該 当 す る観 察 単 位 数 の 場 合 が 区 別 さ れ ま す が, 数 量 デ ー タ を,1 セ ッ トの 変 数 値 の 相 対 比 と して 扱 う場 合 は,質
的 デ ー タ と類 似 し た 扱 い を す る こ とに な り ま す.
④ ク ラ ス ター 分 析 に よ っ て な さ れ る こ とは,い よ い で し ょ うが,区
わ ば,観
察 単位 の 集 約 だ と い っ て
分 け の 参 考 に 使 う変 数 の 方 を集 約 す る こ と も考 え ら れ ます.
た だ し,変 数 の 集 約 に 関 して は 1セ ッ トと して 扱 う変 数 の 数 を減 らす 形 で の 集 約 だ け で は な く, そ れ ら をΣC1X1の
形 で 結 合 した 指 標 を使 う もの と し て
少 数 の 指 標 で要 約 す る こ と を考 え る
の が 普 通 で す.こ 法 で す が,情
れ は,主 成 分 分 析 と よば れ る 手 法 で す.ク
ラ ス タ ー 分 析 と異 な る 手
報 の 要 約 と い う 問題 意 識 で は 「同 じ 問 題 意 識 を も つ 手 法 」で あ っ て,双
方 を組 み 合 わ せ て 使 うこ と も考 え られ ます. ⑤ ク ラ ス タ ー 分 析 の 結 果 と し て 定 ま る ク ラ ス ター 区 分 は,②
に 述ベ た意 味 でべ
ス トな 区 分 で す が,「 参 照 と し た デ ー タの 範 囲 で の ベ ス ト」で す か ら,そ れ る に は,デ
ー タ の 求 め 方 な ど を 含 め て,ク
す る こ とが 必 要 で す.た
れ を受 け 入
ラ ス ター 分 析 の 適 用 の 仕 方 を 適 正 に 計 画
とえ ば,
で き るだ け 多 くの 変 数 を参 照 して ク ラ ス ター 分 析 を適 用 して
広 い 範 囲 で の ベ ス トを追 求 し た 上,
各 変 数 の 効 果 の 大 小 を把 握 し,
「情 報 量 の 減 少 」だ け で な く 「説 明 の 簡 明 性 」 も あ わ せ て 考 え る こ と
あ るいは
観 察単位 をか えて分析 を く りか え し,
見出 され た クラス ター 区分 の普 遍性 を確 認す るこ と
な どの対応 が考 え られ ます.
問題 につ い て (1) 問題 の 中 に は,UEDAの
プ ロ グ ラム を使 って,テ キ ス ト本 文 で の 説 明 を確
認 す る ため の 問題 や,テ キ ス トで使 っ た説 明 例 を コ ン ピュー タ上 で再 現 す る も の な どが 含 まれ てい ます.
したが って,UEDAの
プ ロ グ ラム を使 うこ と を想 定 して い ます.
(2) UEDAの 使 い方 につ い て は,本 シ リー ズの 第 9巻 『 統 計 ソ フ トUEDAの 使 い方 』を参 照 して くだ さい.ま た,本 書 の 主 題 で あ る クラ ス ター分 析 に 関 す る プ ロ グラ ムの使 い方 につ い ては,本 書 の付録 C に説 明 して あ ります. (3) 問 題文 中で プ ログ ラム ○○ とい う場 合,UEDAの
プ ロ グラム を指 し ます.
問 題 で使 うデー タに つ い て,付 表○ ○ とい う場 合,本 書の 付 録 B に掲 載 され て い る表 を指 します. (4) 多 くの デー タは,UEDAの
デー タベ ー ス 中 に 収 録 さ れ て い ます.そ の フ ァ
イ ル名 は,そ れ ぞ れの付 表 に付 記 され て い ます が,そ れ を その ま ま使 うの で な く,い くつ か の キ イ ワー ドを付 加 した もの を使 う こ とが あ ります か ら,問 題 文 中 に示 す フ ァ イル名 を指定 して くだ さ い. (5) プ ロ グラ ム 中の 説明 文 や処 理 手順 の展 開 が,本 文 で の 説明 とい くぶ ん ち が っ て い る こと が あ り ます が,判 断 で きる範 囲 の ち が いで す. (6) コン ピュー タで 出力 され る結 果 の桁 数 な どが 本文 中に表 示 され る もの とち が うこ とが あ ります.
● 問題 1●
問 1 問2∼5で
は,プ
ロ グ ラ ムXYPLOT1を
い 方 』 の6.5節 XYPLOT1を
指 定 し,用
問 2 図1.1.7を
「XYPLOTの
使 う.第
ー タ と し てDK51Vを
ー タ フ ァ イ ル の 内 容 を 表 示 し つ つ,そ
に セ ッ ト し た 後,プ
ロ グ ラ ム に よ る 処 理 に 入 り ま す.
Y す な わ ち 縦 軸 に と る 変 数 と し て 「肉 」
X す な わ ち横 軸 に と る 変 数 と して 「魚 」 を 指 定 す る と,図1.1.7が
画 面 に は,つ は,Enterキ
問 3 図1.1.8を
指 定 し ま す.
れ を プ ロ グ ラム で 使 え る よ う
デ ー タ フ ァ イ ル に 含 まれ て い る デ ー タ セ ッ ト名 が 表 示 さ れ ま す か ら
使
ニュー で プ ロ グ ラム
か け.
す る と,デ
『統 計 ソ フ トUEDAの
た,メ
意 さ れ て い る 説 明 文 を よ め.
注 :プ ロ グ ラ ム と し てXYPLOT1,デ
9巻
使 い 方 」 を よ め.ま
注:問
え が か れ ま す.確
認 し て くだ さ い.
づ い て 種 々 の 機 能 を 指 定 す る よ う に な っ て い ま す が,こ
イ を お し,表
の 問題 で
示 さ れ る メ ニ ュ ー で 「終 わ る 」 を指 定 し て くだ さ い.
か け. 2 と同 様 に 進 め て,図1.1.7の
画 面 でEnterキ
イ を お し て メ ニ ュ ー を表 示 さ
せ ま す.
補 助 線 … T
マ ー ク方 式 … M
こ の メ ニ ュ ー の 「T
ス ケ ー ル 変 更 … S
( 補 助 線 )」 を指 定 す る と(T
た め の 補 助 線 の 種 類 を指 定 す る サ ブ メ ニ ュ ー が 現 わ れ ま す.そ を指 定 す る と,図1.1.8が 問 4 図1.2.2を
え が か れ ま す.
(マ ー ク 方 式 )」 を 指 定 す る と,グ
マ ー ク に 関 す る 種 々 の 機 能 を 指 定 で き ま す. 「2 る 」 と指 定 す る と,図1.2.2が
え が か れ ま す.
か くた め の マ ー クは,デ
ー タ フ ァ イル の 中の 文
OBSID=/ABCDEF… に よ っ て 指 定 さ れ て い ま す. プ ロ グ ラ ムDATAEDITを
使 う と,デ
ー タ フ ァ イ ル 中 の 指 定 文 を加 除 で き ま
す.
ラ フの
用 意 して あ る マー ク で 表 示 す
か け.
注 :図1.2.2を
ラフ を よ む
の 中 の 「集 中 楕 円 」
か け.
注 :問 3 で 表 示 さ せ た メ ニ ュ ー で,「 M
問 5 図1.2.3を
終わ り … E
と入 力 す る と),グ
こ の 問 題 の た め に は,こ OBSID=/1111112…
のOBSID文
を
と お き か え る の で す.く
わ し くい う と,こ
の 文 が 頭 に 「引 用 符 を つ め た 形 」 で 記
録 さ れ て い ます か ら,「 引 用 符 を 削 除 」 し て そ の 文 を 有 効 と し,
OBSID=/ABCDEF… を 削 除 し ま す.
Escキ
イ を お す と,変
更 され たデ ー タ フ ァ イル が作 業 用 フ ァ イル と して 記 録 さ
れ ま す.
そ の 上 で,プ 1.2.3が 問 6 図1.2.4を
ロ グ ラ ムXYPLOT1デ
ー タ と し てWORKを
指 定 す る と,図
え が か れ ま す. か け.
注 :こ の 図 を か く に は,ブ こ とが 必 要 で す.ま
ロ ッ ク区 分 を 表 わ す 番 号 を 「変 数 の ひ と つ と し て 与 え る 」
た,縦
軸 に と る 変 数Y,横
区 分 を 指 定 す る 変 数 Z を 使 い ま す か ら,プ
軸 に と る 変 数 X の 他 に,デ ロ グ ラ ム はXYZPLOTを
ータ
指 定 しま
す. Y
と し て 肉,X と,図1.2.4の
域 区 分1」
を指 定 す る
な り ま す.
か け.
注 :こ の 図 を か く に は,プ ま す.デ
と し て 「ダ ミー 変 数for地
そ の 画 面 で 「補 助 線 」の う ち の 「集 中 楕 円 」 を 指 定 す る と,図1.2.4に
問 7 図1.3.6を
と して 魚,Z
デ ー タ部 分 が え が か れ ま す.
ー タ は1978年
以 上 を指 定 す る と,デ P,Q,R
と も0か
ロ グ ラ ムPQRPLOTと,デ
ー タ フ ァ イ ルDM21を
使 い
分 で す. ー タ の プ ロ ッ ト範 囲 を指 定 す る 画 面 に な り ま す.普
ら100%の
範 囲 と し ま す が,デ
通は
ー タの 散 布 範 囲 が 狭 い と きに は
そ の 部 分 を 拡 大 で き ま す.
実 際 の デ ー タ の 範 囲 が 表 示 さ れ て い ま す か ら,そ P の 下 限 を25,Q
の 下 限 を15,R
の 下 限 を25と
れ を 参 考 に し て,た
指 定 し ま し ょ う.上
と え ば, 限 の 方 は,
下 限 の 指 定 に 応 じ て 自 動 的 に か わ りま す.
範 囲 を 指 定 す る と,図1.3.5が
ま た,表
え が か れ ます.
示 さ れ て い る メ ニ ュ ー に は あ り ませ ん が,D
が 書 き 足 さ れ,図1.3.6に れ て い ませ ん が,こ
な り ま す(未
の 問 い に は 使 え ま す).
デ ー タの 存 在 範 囲 20< P<52 16< Q <40 24< R<53 PLOTす る範 囲 P 下 限 0
と 入 力 す る と,集
中楕 円
公 開 の機 能 で す か ら メニ ュー に は 表 示 さ
上 限 100
Q 下 限 0 上 限 100 R 下 限 0 上 限 100 この 範囲 で よい で す か …Y/N
2 デ ー タの 区分 け と 分散 分 析
い くつ か の観 察 単 位 に つ い てあ る変数 値 が 求 め られ て い る と き,そ の 値 が ど んな 観察 単 位 で 大 き く,ど ん な観 察 単位 で 小 さい,と い う形 で説 明 す る ため に 「 観 察単 位 を 区分 け」す る場 合,そ の説 明 の 有 効 性 を判 定 す る ため に,分 散 分 析 を使 う こ とが で き ます. この 章 で は,ま ず,こ の こ とを説 明 します.
2.1 平 均 値 と分 散 ① 次 ペ ー ジ の 表2.1.1は,東 較 した も の で す.第
京23区
の 「人 口10万
1章 で 取 り上 げ た例 1で す.こ
人 あ た り病 院 ・ 診 療 所 数 」 を比
の 値 の 分 布 に つ い て,ど
ん な地 域
で 大 き く,ど ん な地 域 で 少 な い か を説 明 す る問 題 を 考 え て み ま し ょ う. ② 表 に 付 記 し た よ う に,23区 る と,最 低62,最
高1370と
全 体 で み た 平 均 値 は201.5で
大 き く変 動 し て い ます.標
こ れ だ け ち が っ て い る の で す か ら,こ の 状 態 を 「 東 京23区
い う わ け に は い き ませ ん.だ
す が,各
準 偏 差 は242で
区の 値 をみ
す.
は … だ」 とひ と こ とで
か ら,地 域 差 に 関 し て,「 こ の 地 域 で は …,こ
の地 域 で
は … 」 と い う形 で 言及 す る こ と を考 え る の で す. そ こ で ク ラ ス ター 分 析 を 考 え る と い う こ とで す.そ 順 を追 っ て解 説 し ま す が,こ
の 節 で は,ま
ず,デ
の 手 法 の 数 理 を,以
下 の 章 で,
ー タ の 区 分 け の 有 効性 を測 る指 標 と
し て 分 散 を使 う こ と を 説 明 し ま す. ③ 表2.1.1の
は じめ の 部 分 で X が 大 き い こ とか ら,都 心 あ る い は 交 通 の 便 利 な
と こ ろ に 病 院 が 集 中 して い る よ うに み え ま す が,そ
う い う解 説 が 妥 当 だ と主 張 す る た
め に は,客
1章 で は ボ ッ ク ス プ ロ ッ ト を使 っ
て,こ
観 的 な 手 順 を 経 る こ とが 必 要 で す.第
の う ち最 初 の 2つ の 区 は 他 と異 な る と判 定 し ま した が,そ
お け る変 動 に つ い て も,そ
う い う外 れ 値 以 外 に
の 大 小 を計 測 す る こ と が 必 要 で す.
そ こ で,「 地 域 差 を み る た め に い くつ か の 区 分 に わ け て み よ う」 と い う こ とに な り
表2.1.1 全 体 で の平 均 値 を基 準 と した 分散
表2.1.2
各 区 分 で の 平 均 値 を基 準 と し た分 散
DXの 列 での計欄 は,2 乗和 平均欄 は,分 散 を記録 #は区の番号,対 応す る区名 は,付 表 Aを参照
ま す. 表2.1.2の2列
目 に 示 す 地 域 区 分 は,各
区 の 地 理 的 な位 置 関 係 を み て 想 定 した 区 分
で す.「 こ の 区 分 に よ っ て わ け て み よ う」 と提 唱 して い る もの と し ま す. そ こ で,表 2.1.2で は,こ
の わ け 方 を 採 用 し た 場 合 に つ い て,こ
計 算 し て い ま す.
の 区 分 ご とに,平
均 値 と分 散 を
図2.1.3
各 区 分 の値 の分 布
標 準 偏 差 の2 倍 の 幅 を つ け た こ とに つ い て,観 察 値 の 分 布 形 に あ る仮 定 をお い て精 密 化 す る こ と が考 え ら れ ま す が,こ は,分
倍 とい うの は,ひ
また,全
の テ キ ス トで の 問 題 で
布 形 に つ い て 仮 定 を お け る とは 考 え られ ませ ん. した が っ て,2 とつ の 目安 と受 け と って くだ さい.
体 を通 して み た 分 散 も計 算 し て い ま す が,表2.1.2の
分 に お け る平 均 値 を 基 準 と して い ます か ら,そ の 値 は1359.50で
場 合,そ
合 の 値75234.50と
れ ぞれの 区
あ り,表2.1.1の
場
比 べ て小 さい 値 に な っ て い ます.
④ 図2.1.3は,各
区 分 の 値 を 比 較 す るた め,そ
れ ぞ れ の 区 分 で の 平 均 値 と,そ の
上 下 に 標 準 偏 差 の2 倍 の 幅 を つ け た 形 で 図 示 し た もの で す. こ の 図 に よ って,地
域差を
各 区 分 の 平 均 値 の 位 置 の ちが い 〓
区分 間差異
標 準 偏 差 の 幅 の 大 小 〓
同一 区分 内での 差異
と,わ け て よ む こ とが で き ま す. この例 につ いて い う と
区 分3 は 他 と離 れ て 大 き い 値 を もっ て い る こ と
区 分4 と 区分5 の 差 は 標 準 偏 差 の 幅 を こ え て い な い こ と
が わ か りま す. ⑤ こ の 判 定 で は 「図 に お け る線 の 位 置 が 離 れ て い る こ と」に 注 目 し ま し た が,数 理 と して は,線 ま た,区
の 長 さ,す
な わ ち標 準 偏 差 の か わ りに,「 分 散 」 を使 い ま す.
分1 と 区 分2 の 差,区
分1 と 区 分3 の 差,…
い くか わ りに(そ う い う見 方 は後 に し ま す),こ
の よ うに ぺ ア ー ご と に み て
れ ら の 差 の 平 均 で み る も の と し て,
「 各 区 分 で の 平 均 値 を 基 準 と して 測 った 場 合 」の 偏 差
に 注 目 し,そ れ を 分 散 に お きか え た
級 内 分 散 = 各 区 分 で の 平 均 値 を 基 準 と した 分 散
を 使 い ます. こ れ と,
「区 分 け せ ず,全
体 で の 平 均 値 を基 準 と し て測 っ た場 合 」の 偏 差
に対応 す る
全 分 散 =全 体 で の 平 均 値 を 基 準 と した 分 散
を 比 較 し ます.
区 分 け す る こ とに よ っ て,標
図2.1.4分
準 偏 差 を 測 る基 準 を く
散 分 析 の フ ロー
わ し く し た の で す か ら,
級 内 分 散 は 全 分 散 よ り小 さ くな る
の で す.し
た が って,そ
の減少 率 に あた る
全 分散 一級 内分 散 /全 分 散
決 定係数 = を使 っ て,区
分 け の 効 果 を 評 価 す る の です.
⑥ 図2.1.4は,こ
れ ら を使 っ た 説 明 の 経 過 を 示 す
フ ロ ー チ ャー トで す. 図 の 左 側 が,区
分 け す る こ と に よ っ て 「説 明 さ れ ず に 残 っ た 変 動 」を 表 わ し,図 の
右 側 に 取 り 出 す 形 に 示 し た の が 「説 明 さ れ た 変 動 」に あ た る こ とに 注 意 して くだ さ い. 区 分 け に よ っ て 「未 説 明 部 分 が 減 少 す る」「説 明 され た の は こ れ だ け だ 」 と右 側 に 取 り出 して い る … こ うよ め ば よ い の で す. ど れ だ け が 説 明 さ れ た か を 示 す 項 を 級 間 分 散 と よび ま す.す
なわ ち
級 間 分 散 =全 分 散 一 級 内分 散
で す. ⑦ 以 下 で は,次
の 記 号 を使 い ま す.
全偏差平方和
全分散
級 内偏差 平 方和
級 内分 散
級 間偏 差平 方 和
級間分 散
(1)
た だ し,こ の テ キ ス トの 後 半 で は,区 分 け に使 っ た 変 数 を記 号 中 に 含 め た い の で, 表2,1.5
分 散 分 析 表 で は,分 散a2の く,自 由 度 で わ った値Vを
分散分析表
推 定 値 と して,N=デ
ま た,決 定 係 数 の か わ りに,仮 し か し,こ
ー タ数 で な
お くこ とが あ ります. 説検 定 用 のF値
を お き ます 。
こ で は検 定 を考 え ませ ん か ら(考 え られ ませ ん か
ら),表 示 の よ う な表 わ し方 と し ます.
ST,VTの
SW,VWの
SB,VBの
か わ りにSX, VX か わ りにSX│A,VX│A か わ りにSX×A, VX×A
とい う表 現 を採 用 し ます. ⑧ 図2.1.4に
示 し た 情 報 は,表2.1.5上
分 散 分 析 表 と よ ば れ て い る もの で す.そ
段 の よ うに 表 示 で き ま す. の う ちT,B,Wの
行 の 数 字 が 図2.1.4の
3つ の 分 散 で す. こ の 表 で は,そ
の 下 段 に,各
区 分 で の 分 散 を表 示 して い ます.表2.1.2で
計 算 され
て い る もの で す. こ れ に よ っ て,未 が で き ま す.区
説 明 の 分 散 が どの 区 分 で 大 き く,ど の 区 分 で 小 さ い か をみ る こ と
分 の 仕 方 を 改 め る とす れ ば,ど
こ を細 分 す べ きか 把 握 で き ます.
◇ 注 こ の例 で は外 れ 値 2つ を含 め た全 分散 を使 っ て分 散分 析 表 に して あ り ます が,そ れ らを除 く として い る のだ か ら,全 分 散 は そ れ ら を除 い て計 算せ よ とい う考 え方 も あ りえ ま す.
2.2 多 次 元 化 ① 「区 分 す る 」 とい う 問 題 を扱 う と き に は,区 考 とす る こ と に な る で し ょ う.し
た が っ て,前
分 を決 め る た め に 複 数 の 情 報 を参
節 の分 散 分 析 を そ の よ う な 場 合 に も対
応 で き る よ うに 改 め る こ と が 必 要 で す. ② 形 式 的 に い え ば,各
観 察 単位 に つ い て 変 数X1,X2,X3,…
が 求 め られ て い る と
き,各 変 数 に つ い て 「全 分 散 」,「級 内 分 散 」を求 め,
Σ 各 変 数 の 全 分 散-Σ 各 変 数 の 級 内分 散/ Σ各 変数 の全 分 散
に よ っ て,区
分 の効果 を測 る …
こ うす れ ば よ い とみ ら れ ます.
「各 変 数 の 級 内分 散 の 和 」 と し た と こ ろ を 「各 変 数 の 級 内 分 散 の 平 均 」 とお きか え て 考 え れ ば,「 区 分 け の 参 考 とす る各 変 数 の 効 果 の 平 均 」で 測 る の だ と解 釈 して よ い で し ょ う. ③ ク ラ ス ター 分 析 の 適 用 例 で は,特
に こ と わ っ て い な い 場 合 が 多 い の で す が,た
い て い は こ の 扱 い を して い る よ う で す. ◇ 注 分 散 ・共分 散 行 列 の 対角 要 素 の 和 を トレー ス とよ び ます.本 文 の 説 明 は,1 変 数 の 場 合 「分 散」に 注 目 した と ころ を,2 変 数 以上 の 場合,分 散 ・共 分 散行 列 の トレー ス を使 え とい うこ とです. ④ こ の こ とは 自明 で は あ り ませ ん が,こ
の 点 に つ い て 議 論 を進 め る 前 に,ま
ず,
例 を 取 り上 げ て み ま し ょ う. 表2.2.1は,前
節 の 表2.1.1で
一 括 さ れ て い た 「U=病
院 数 」 と 「V=診
療 所数 」と
表2.2.1
分 散 ・共分 散(各 区 分 で の 平 均 値 を基 準)
をわ け た もの で す. 規 模 の 大 き い病 院 の 地 域 分 布 と,日 常 受 診 す る診 療 所 の 地 域 分 布 は 異 な る だ ろ うか ら,こ れ ら を わ け て み よ う と い う 問 題 意 識 で す. ⑤ 表2,2.1は,こ
れ ら の 基 礎 デ ー タ につ い て 平 均 値,分
散 を計 算 した も の で す が,
2つ の 変 数 を 同 時 に 扱 お う と して い るの で す か ら,そ れ らの 共 分 散 も 計 算 し ます.
U に つ い て は Vに つ い て は
平 均 値 =8.70,標
準 偏 差 =2.28
平 均 値 =192.79,標
準 偏 差=35.23
で あ り, U ,V の 相 関 係 数 は
0.46
とい う結 果 で す. ⑥ 地 域 区 分 は 前 節 と 同 じ 5区分 だ と し て,こ ま し ょ う.そ の た め に,次
表2.2.2(a)
表2.2.2(b) V
表2.2.2(c)
れ ら の 区 分 で の U,V の ち が い をみ
の 3つ の 分 散 分 析 表 を用 意 し ま す. U でみ た場合 の分 散分析 表 でみ た場合 の分 散分析 表 U,V の 両 方 で み た場 合 の 分 散 分 析 表
で す. こ こ で 取 り上 げ た 地 域 区 分 に つ い て 決 定 係 数 を み る と
U は
95.58%
Vは
98.22%
とな っ て い ま す. V
の 方 がU
よ り区 分 間 差 異 を説 明 で き る
と い う結 果 で す.
表2.2.2(a)
変数 U の分散分析表
表2.2.2(b)
変 数V
表2.2.2(c)
の分 散 分 析 表
変 数 U,V の 分散 分析 表
近 隣 の 居 住 者 の 家 庭 医 とい う役 割 を も つ が ゆ え に ど こ に も一 様 に 分 布 し て い る こ と か ら,地 域 差 が 少 な い … こ う理 解 で き る 結 果 で し ょ うか. U,V の 両 方 を 考 慮 に 入 れ て 区 分 し よ う … そ うい う扱 い を し た 場 合 に は,当
然,
決 定 係 数 は これ ら の値 の 間 に 入 りま す. そ の 扱 い を し た場 合 の 決 定 係 数 は 表2.2.2(c)で う結 果 で す.間
に あ る こ とは 事 実 で す が,V
計 算 さ れ て い ま す.98.216%と
を 使 っ た 場 合 の 値98.220%の
い
方 に近 い
値 で す. ⑦ こ こ で考 え な け れ ば な ら な い 問 題 が う か ん で き ま す.④
に 提 起 して お い た 問
題 で す. 例 示 の 問 題 の 場 合,U
は,平
均 で い っV
の 約1/20の
計 数 だ か ら,U
の ちが い
は 結 果 に ひ び か な い … 当 然 そ う な るの だ と解 釈 で き ます. しか し,そ
う な る … そ う な る よ う な 扱 い を した … そ れ で よ い で し ょ うか.
わ け る ため に 2つ の 変 数 を 取 り上 げ た の は なぜ か
を考 え ま し ょ う. た と えば 次 の 2つ の 見 方 が あ りえ ます. 見 方 1 取 り上 げ た 変 数 を対 等 に 扱 う
「2つ の 観 点 で わ け よ」 とい うの は,2 つ の 変 数 を 対 等 に 扱 お う と い う こ と を 想 定 し て い る,そ
れ な ら,U
で の 地 域 差 とV で の 地 域 差 の 双 方 を 同 じウ エ イ トを
表2.2.3(a)
変 数U
を標 準 化 し た場 合 の分 散 分析 表
表2.2.3(b)
変 数V
を標 準 化 し た場 合 の分 散 分析 表
表2.2.3(c)
変 数 U,V を標 準 化 した場 合 の分 散 分析 表
使 っ て 区 分 け す べ き だ … 例 示 で 提 起 さ れ て い る 区 分 け で は,U 軽 く扱 わ れ た 結 果 に な っ て い る の で,適
での ちが い が
当 な 区 分 け とは い え な い ….
見 方 2 そ れ ぞ れ の 変 数 の 寄 与 度 に 応 じて ウ エ イ トづ け 「 2つ の 変 数 は あ る 1つ の 上 位 概 念 の 下 位 概 念 」 と して 列 記 され た も の だ,そ の 一 方 が 区分 けに効 き ,他 方 が 効 か な い … 例 示 の 場 合,U で の 決 定 係 数 とV で の 決 定 係 数 の ち が い は,そ 結 果 に な っ て い る,ま
う い う状 態 に な っ て い る とい う実 態 を適 正 に 評 価 した
た,両
方 を 使 っ た 場 合 の 効 果 は,効
果 の 大 き いV
の決 定
係 数 に 近 い 値 に な っ て い る … い ず れ も 当 然 な 結 果 で あ る. ⑧ こ れ らの 意 見 は,区
分 け の 問題 の 扱 い 方 の ち が い で す.統
計 的手 法 の数理 で は
な く,問 題 の 扱 い 方 と して 外 的 に 与 え ら れ る こ と で す. こ れ ま で の 例 示 で は 見 方 2に 対 応 す る 結 果 を与 え る も の に な っ て い ま す. 見 方 1 を採 用 し よ う とい う こ と な ら,各 変 数 の 平 均 値 の ち が い と標 準 偏 差 の ち が い を 除去 した 上 で,区
分 け に 使 え ば よ い の で す. い い か え れ ば,そ
れ ぞ れ の 変 数 を標 準
化 して 扱 うの で す. こ の 扱 い を し た 場 合 の 結 果 は,表2.2.3で
す.決
定 係 数 はU
だ け を使 っ た 場 合 と
Vだ け を 使 っ た 場 合 の 中 間 に な りま す. ⑨ 基 本 的 に は 「問 題 の 扱 い 方 」 と し て 外 的 に 決 め る こ とだ と し て 2つ の 扱 い を対 比 し ま した が,い
ず れ に して も
○ ○ を使 っ て 区 分 け した とい う 形 式 的 な 説 明
か ら,
区 分 け に 使 っ た 変 数 の もつ 意 味 を考 え た 説 明
に 進 み ま す か ら,
説 明 変 数 の 選 び方 を考 え る こ と
が 基 本 です. 見 方 1 を採 用 す る とい う こ とな ら,そ
れ ぞ れ の 変 数 を 相 互 に 異 な る次 元 か ら選 ぶ よ
う に す べ き で す. 見 方 2を 採 用 す る とい うこ と な ら,変 数 は そ れ ぞ れ の 意 味 を考 え た 説 明 に 適 し た も の を選 択 す べ き で す. ま た,使
っ た 変 数 の 相 互 関 係(統 計 的 に は 相 関 関 係)を 区 分 け の 手 法 の 中 に ど う取
り入 れ るか が 問 題 と な りま す. 表2.2.1で
2変 数 の 相 互 関 係 を示 す 共 分 散 を計 算 し て あ り ます が,そ
れ に つ づ く分
散 分 析 表 で は,
共 分 散 を 取 り上 げ ず,分
散 だ け を取 り上 げ て い る
の で す. それ で よ い の で し ょ うか.ク
ラ ス タ ー 分 析 の 手 法 は,そ
うい う扱 い を採 用 す る もの
と し て 組 み 立 て ら れ て い ま す か ら,そ れ を機 械 的 に 適 用 す る と,相 互 関 係 を考 慮 外 に お く結 果 に な っ て し ま い ま す.
多 面 的 な 見 方 を要 す る問 題 を 扱 う場 合,こ す.後
の 節 で 説 明 し ます が,た
の こ とへ の 対 処 を考 え る こ と が 必 要 で
とえば
主 成 分 分 析 に よ っ て 整 理 した 指 標 を 区 分 に 使 う
とい う扱 い が 考 え ら れ ます.
● 問題 2●
問 1 次 の 表 に 示 す 変 数 X が12の
観 察 単 位 に つ い て 求 め ら れ て い る.観 察 単 位 を A
に 示 す よ うに 3区 分 す る こ と に よ っ て,こ か を評 価 せ よ.た
の X の 変 動 の どの 程 度 が 説 明 で き る
だ し,次 のa,b,c の 順 に 進 め る こ と.
表2.A.1
世 帯 人貝 別 消 費 支 出 額 に 関 す る仮 想 デ ー タ
a. こ の よ う な 問 題 を 扱 う た め に 級 内 分 散 が 使 わ れ る こ と を 説 明 す る プ ロ グ ラ ム と し てAOV03Hが
用 意 さ れ て い る.こ
の プ ロ グ ラ ム を 指 定 して,
画 面 上 に 展 開 さ れ る 説 明 を確 認 せ よ. b. AOV03Hに
よ る説 明 に つ づ い て,そ
きで 表 示 す る プ ロ グ ラムAOV03Aが こ れ に よ っ て,次
こで展 開 され て計算 手順 を説 明 ぬ
よ び 出 され る.
の 出 力 が 得 ら れ る こ と を確 認 せ よ. 表2.A.2
c. こ の 出 力 を 使 って,A
に よ る 区 分 け の 効 果 を 説 明 す る た め に 図2.1.3
の 形 式 の グ ラ フ を か け. 問 2 (1) A0VO4は,AOV03で
説 明 し た 手 法 を実 際 の 問 題 に適 用 す る と き に 使 うプ
ロ グ ラム で あ る.こ
れ を 使 っ て,表2.1.1お
よ び 表2.1.2に
示 す 情 報 が得 られ
る こ と を確 認せ よ.
注 :基礎 デ ー タは,デ ー タ フ ァ イル としてDI70に
記録 され てい ます.
この デ ー タ フ ァイ ル に はい くつ か の 変 数 が 記録 され て い ます か ら,ま ず,そ の どれ を使 うか を指 定 します . 次 は その ための 画 面 です.
1 人 口数 2 人 口あ た リ病 院数 3 人 口あ たリ診 療所 数 4 人 口あ た リ病 院診 療 所 数 5 地 域 区分 l 6 地 域 区分 2 X と して使 う変 数 を指 定(番 号 を入 力)
X す な わ ち分 析 対 象 と して 4,A す な わ ち説 明 要 因 と して 6を指 定 す る と説 明 要 因 を 2つ 指定 す る こ とが で き ますが,こ の 問題 で は 1つ とし ます.
表2.1.1お
よび 表2.1.2が
得 られ る は ず で す が,画 面 の 進 行 に 注 意 す る こ と.
この プ ロ グラ ム の 出力 は,テ キ ス トの 説 明 あ る いは 表 示 とち が う順 序 に 表 示 され ます が,実 質 的に は 同 じ情 報 が得 られ ます.
(2) 地 域 区 分 1を指 定 し て(1)と 同 じ計 算 を行 な い,ど
ち らの区 分 が有効 か を
判 定 せ よ. 問 3 ( 1) 問 2 と同 じ手 順 で,表2.2.2(a),表2.2.2(b)の 認せ よ.た
情 報 が得 られ る こ とを確
だ し,分 析 対 象 変 数 と して 2あ る い は 3 を指 定 す る.
(2) 表2.2.2(c)は,表2.2.2(a)と
表2.2.2(b)か
ら計 算 で き る こ と を 確 認 せ
よ.
(3) 表2.2.2(c)が
表2.1.5と
(4) 表2.2.3(a),表2.2.3(b),表2.2.3(c)は,そ 2.2.2(b),表2.2.2(c)か
異 な る の は なぜ か.
ら 計 算 で き る.ど
れ ぞ れ 表2.2.2(a),表 う い う計 算 を す れ ば よ い か.
3 ク ラ ス タ ー 分 析(1) ―数 量 デ ー タ を扱 う場 合
こ の節 で は,数 量 デ ー タ を使 っ て ク ラス タ ー区分 を見 出 す場 合 につ い て,そ の手 法の 数理 を説 明 し ます. さ まざ まなの 手 法 が提 唱 され てい ます が,こ こで 説 明 す る の は 「非 階 層 的手 法 」と よば れ る タイ プ の 手法 で す.
3.1 ク ラ ス ター 分 析 の 数 理(1) ① 前 章 で 説 明 し た よ うに,い か に 区分 した 場 合,そ そ れ な ら,何
くつ か の 変 数 を 手 が か りに し て,観 察 対 象 を い くつ
の 区 分 の 有 効 性 を級 内分 散 で 評 価 で き ます.
とお りか の 区 分 法 に つ い て,級
よ い … コ ン ピ ュ ー タ を使 う な ら,あ
内 分 散 を比 較 し て よ い案 を採 用 す れ ば
ら ゆ る可 能 性 に つ い て 計 算 し比 較 す れ ば ベ ス ト
な 区 切 り方 が み つ か る は ず だ … こ の 発 想 で よ い の で す が,「 あ ら ゆ る 可 能 性 」 と 簡 単 に い う な と,待
っ た が か か る の で す. た と え ば 前 章 で例 示 に 使 っ た 「23区 分 の デ ー
タ を 6つ の ク ラ ス ター に 区 分 す る」問 題 の 場 合,あ り,コ
ン ピュ ー タ で 対 処 で き ま す が,「47区
に は5.19×1023と
な り,と
ら ゆ る ケ ー ス は9.99×1014と
な
分 の デ ー タ を 6区 分 にせ よ」 と い う 場 合
うて い 対 処 で き ませ ん.そ
こ で,た
とえば 計 算 して み る
ま で もな く有 効 性 が 低 い とわ か るケ ー ス を 除 く な ど の 処 置 を 入 れ て,計
算手 数 を減 ら
す 工 夫 が 必 要 と な っ て き ます. ② ま た,変 数 の 選 び 方 や 扱 い 方 な ど,種 々 の 選 択 に対 応 す る よ う に 変 形 さ れ た 手 法 が 何 とお り も,提 唱 さ れ て い ま す.し に して も,さ
た が っ て,ク
ラ ス タ ー 分 析 と総 称 さ れ て い る
ま ざ ま な 方 法 が あ り,場 合 に 応 じて 使 い わ け よ とい わ れ て い ま す.
しか し,こ の テ キ ス トで は
同 じデ ー タ を使 っ た場 合 に,使
っ た 手 法 の ち が い に よ っ て結 果 が か わ る
の は(手 法 の 研 究 な ら と もか く),問 題 を扱 う立 場 で は 好 ま しい こ とで は な い の で,基 本 的 な い くつ か の 手 法 に 限 っ て 説 明 す る こ と と し ます.
③ 広 く採 用 さ れ る の は
「1つ の 案 を よ りよ い もの に 改 善 す る 手順 」を 組 み 立 て,
逐 次 近 似 計 算 に よ っ て ベ ス トな もの を見 出 す
手 法 で す. こ の 章 で 説 明 す る方 法 で は,
「ク ラ ス タ ー 数 を い くつ に す るか をあ らか じめ 指 定 」 して, そ の数 に す る こ と,と い う条 件 下 で ベ ス トな もの を 見 出 す
形 で 適 用 す る もの で,非
階 層 的 手 法 と よ ば れ て い る もの です.
◇ 注 「 最 初 に 想定 す る区分 に よ って 異 な る解 に な って し ま う可能 性 」が あ りえ ます か ら, 特 に デー タ数 が 多 い と きに は,注 意 す る こ とが必 要 です. ④ こ の 逐 次 近 似 計 算 の 手 順 を 示 して お き ま し ょ う. 観 察 単 位 数 を N,ク
ラ ス ター 数 を G と しま す.
各 観 察 単 位 ご と に 変 数 X の 値 が 観 察 され て い る もの と し,そ れ をX1(K)と ま し ょ う.下 つ きの 添 字 Iは 観 察 単 位 番 号,上 さ れ る ク ラ ス タ ー 番 号 と し ま す.K
つ きの 添 字(K)は,観
は 最 終 的 に は 決 ま り ま す が,計
ます か ら,こ れ も添 字 と し て い ます.括
弧 書 き した の は,デ
表 わ し
察 単位 が包 含 算過 程 でか わ り
ー タそ の ものの属 性 では
な く計 算 過 程 に か か わ る も の で す か ら他 と 区 別 す る ため で す. ま た,級
で す.こ
内偏 差 平 方 和 をSW,各
こ で,各
区分 で の 平 方 和 をSKと
クラ ス ター の 観 察 単 位 数 をNK,そ
し ます.す
なわ ち
れ ら の 平 均 値 をMkと
表 わ して
い ます. ⑤ 各 観 察 単 位 に 対 して あ る ク ラ ス ター 区 分 K が 対 応 づ け られ て い る も の と し ま す.そ
の 状 態 で, あ る観 察 単 位 R が ク ラ ス ター K に 属 して い るが こ れ を ク ラ ス タ ー L に うつ し た もの と し た場 合 のSw*,SK*,SL*
をみ ま し ょ う.次 の 式 で 計 算 され ます. まず 平 均 値 は
(1)
とか わ り ま す. ま た,偏 差 平 方 和 は
(2) とか わ り ます. よ っ て,こ
の 組 み 替 え に よ る偏 差 平 方 和 の 減 少 は
(3)
で す. よ っ て,組
み 替 え 先L
と し て,「 こ の 変 化(減 少)が 最 も 大 き くな る と こ ろ 」 を採 用
す れ ば よ い こ と に な り ま す.た
だ し,第 一 項 はL の 選 択 に 関 係 し な い 項 で す か ら,
「第 二 項 が 最 小 な と こ ろ を 採 用 せ よ」 とい い か え る こ とが で き ます. た だ し,そ の 最 小 値 が 第 一 項 よ り大 き い な ら,組 み 替 え に よ る減 少 が 負 に な り,組 み 替 え に よ っ て 偏 差 平 方 和 が 大 き くな る,よ
っ て,組
み替 えは しな い とい うこ とで
す. ⑥ ⑤ の 手 順 を 各 観 察 単 位 に つ い て 順 次 適 用 し て い き,ど の 観 察 単 位 に つ い て も 「 組 み 替 え は し な い」 と い う状 態 に 達 し た ら,そ
の と き の 区 分 が ベ ス トな 区 分 だ と い
う こ とに な り ま す. ◇ 注 1 変 数 が 2つ 以 上 の 場 合 も,変 数 に 関 す る添 字 と それ に 関す る Σ を お くだ け で, 同 じよ うに 扱 うこ とが で き ます. ◇ 注 2 N/(N−1)やN/(N+1)の
項 を除 い て考 えれ ば,(3)式 は (4)
とな ります か ら,「最 も距 離 の近 い 区分L を選 べ 」とい うこ とに な ります. 分 散 基 準 を使 った場 合,N
の影 響 が あ るの で,必 ず し も 「最 も距 離 の 近 い 区 分 」が 選 ば
れ る とは 限 ら ない の です. ◇ 注 3 ⊿Swが 等 しい 区分 が 2つ 以 上 あ っ た と きど ち ら を採 用 す るか を考 え るこ とが必 要 で すが,本 文 の 方 法 では,こ の 問題 を無視 して い ます. ◇ 注 4 あ る ク ラス ター の メンバ ー 数 が1 の 場 合 に は,そ れ を他 に うつ す こ とは しませ ん (クラ ス ター 数 が 少 な くな るの を認 め ない とい う こ とです).
⑦ 簡 単 な例 につ いて この手順 を適用 した結 果 を示 して お き ます. 図3.1.1は,8
つ の 観 察 単位 に つ い て 変
数 U,V を求 め た結 果 で す.こ
の 分 布 を参
照 し て,3 つ の ク ラ ス タ ー 区 分 を求 め て み ま し ょ う. 仮 にABCABCABと
区 分 け す る と,各
区 分 で の 偏 差 平 方 和 は28.00,13.33, 1.00,全
体 で は42.33と
分 で は,た は,ま
な り ま す.こ
の区
と え ば A の メ ン バ ー1,4,7
と ま っ て い る と は い え ず,当
然,改
図3.1.1
基礎 デ ー タ
善 が 必 要 で す. ク ラ ス ター 分 析 の 手 順 を 適 用 し ま し よ う.す し,区 分 A か ら B へ うつ す と,各 で み る と35.50と
る と,ま ず,観
察 単 位 1に つ い て検 討
区 分 で の 偏 差 平 方 和 は20.50,14.00,1.00,全
減 少 す る こ と が わ か り ま す.次
か ら区 分 C へ うつ す … 表3.1.2は,こ
に,観
体
察 単 位 2に つ い て,区
分B
う い う経 過 を ま とめ た もの で す.
1巡 し て も途 中 で メ ン バ ー の 入 れ か わ りが あ りま し た か ら,観 察 単 位 1に も ど っ て 検 討 をつ づ け ます. 2巡 目 で 観 察 単 位 3を 入 れ か え た 後 は,「 入 れ か え な し」が つ づ き ます.そ
の状態 が
3巡 目の 観 察 単 位 3の と こ ろ ま で つ づ い て い ます か ら,そ れ 以 上 は か わ り ませ ん.す な わ ち,逐
次 近 似 計 算 が 終 了 す る の です.
観 察 単 位(1,2,6,8),(3,5,7),(4)と 図3.1.3は
わ け よ,と
い う結 果 で す.
こ の 進 行 の 最 終 結 果 を示 し ます.
⑧ この 計 算 例 で は 変 数 U,V を そ の ま ま の 形 で 扱 っ て い ます が,前 うに,2 つ の 変 数 の 分 散 が 異 な る こ との 影 響 を 除 去 す る た め に,そ
章 で述べ たよ
れ ぞ れ を偏 差 値 に
お きか え た もの を 使 っ て み ま し ょ う. 表3.1.4が
その 場 合 の 計 算 経 過 で す.
ク ラ ス ター 構 成 は(1,3,6,8),(2,4),(5,7)と
な りま す.こ
3.1.5で す.
表3.1.2
逐 次 近似 計 算 の 進 行(1)
各 変 数 の分 散 の ち が い を調 整 しな い場 合
の 結 果 を示 し た の が 図
図3.1.3 ク ラ ス ター 分析 の 結 果(1)
図3.1.5
分 散 の ちが い を 調 整 しな い 場 合
ク ラス ター 分 析 の 結 果(2)
分 散 の ち が い を 調 整 し た場 合
表3.1.4 逐 次近似計算の進行(2) 各変数の分散 のちがい を調整 した場合
表3.1.2の 数V
場 合 の 結 果 と の ちが い は,図3.1.3と
図3.1.5を
の ウ エ イ トを大 き く し た こ と に な って い る こ とか ら,こ
対 比 し て く だ さ い.変 の ちが い を説 明 で きま
す.
3.2 食 生 活 の 地 域差 ① こ れ ま で の 章 に ひ きつ づ い て,食
生 活 の 地 域 差 をみ る 問 題(例 2)を 扱 い ま す.
こ れ ま で は 説 明 の 関 係 で 変 数 の 数 を しぼ って い ま した が,こ
こ で は,調
査 され て い
る12区
分 別 の 支 出 額 を参 照 す る こ とに し ま す.魚
の 地 域 差 が あ り う るの で,は
対 肉 と い う ち が い の 他 に も,種 々
じめ か ら限 定 せ ず に,広
く探 索 して い こ う と い う趣 旨 で
す. ② ク ラ ス ター 分 析 の 手 順 と し て は,前 こ れ に はUEDAに
節 で 説 明 し た 非 階 層 的 手 法 を適 用 し ま す.
用 意 さ れ て い る プ ロ グ ラ ムCLASSを
使 う こ とが で き ます.ま
た,
基 礎 デ ー タ は,デ
ー タベ ー ス に 含 まれ て い る フ ァ イ ルDK51Xで
図3.2.1は,変
数 の 扱 い を 「標 準 化 し な い 」,ク ラ ス タ ー 数 を 5 と指 定 し た 場 合 の
す.
出 力 で す. ◇ 注 プ ロ グラ ムの 使 い方 につ い て は,章 末 の 問題 を参 照 して くだ さい. クラス ター分析 の 「 計 算 結 果 」だ け で な く,わ け ら れ た 結 果 を解 釈 す る た め に 必 要 な 「ク ラ ス タ ー 特 性 表 」な ど も出 力 され て い ま す,
図3.2.1
クラ ス ター 分 析 の 出 力(例 2)
変 数 の 扱 いは 「標 準 化 しな い」 と指 定 した場 合
順 を追 っ て み て い き ま し ょ う. ③ 5番 目の ブ ロ ッ ク 「メ ン バ ー 表 」は,各 を示 し て い ま す.こ
の 例 の 場 合 は,県
い る も の で す).付
クラス ター に 包含 さ れ る観 察 単位 番 号
番 号 です(標 準 の コ ー ド番 号 と して 決 め られ て
表 B に 示 す 基 礎 デ ー タ に こ の コー ドを つ け て あ り ます か ら,参 照
し て くだ さ い. 6番 目 の 「単 位 対 ク ラ ス ター 対 応 表 」も メ ンバ ー 表 と 実 質 的 に は 同 じ も の で す が, 観 察 単 位 の 方 か ら所 属 ク ラ ス ター 番 号 を よ む 形 に し た もの で す.ク 果 を他 の プ ロ グ ラ ム で 使 う場 合 に こ れ を参 照 し ます か ら,プ
ラ ス ター 分 析 の 結
リン トす る と と も に作 業
用 フ ァ イ ル に も 出 力 さ れ ます. こ の よ う に わ か れ た と い う結 果 で す が,当
然,わ
け られ た 各 区 分 の 特 徴 を み る こ と
が 必 要 で す. 出力 の最初 の ブ ロ ックが 「 各 ク ラ ス ター に お け る平 均 値 」で あ り,次 の ブ ロ ッ クが 「各 変 数 の 平 均 値,標
準 偏 差 を そ ろ え た 偏 差 値 」です.
◇ 注 基 礎 デ ー タ の段 階 で標 準 化 した場 合 だ け で な く,基 礎 デ ー タ で は分 散 の ちが い を考 慮 に 入 れ て ク ラス ター を見 出 した場 合 も,ク ラス ター の 特 徴 に つ いて は,偏 差 値 で 示 す よ うに な って い ます. ま た,そ
こ の 偏 差 値 の 大 小 を 一 覧 で き る よ う に,5 段 階
の次 の 「 パ タ ー ン 図 」は,
評価値 に お きか えた結 果 です. この出 力で は ++: 1以 上
(1.5以
上)
+:0.5∼1
(0.5∼1.5)
・:−0
(−0.5∼0.5)
.5∼0.5
−:−0.5∼−1
−−:−1以 下 と し て い ま す.括
(−0.5∼−1.5) (−1.5以
下)
弧 書 き が 標 準 で す が,標
準 以 外 の 区切 り値 を 指 定 で き る よ うに な っ
て い ま す. 計 算 結 果 と して は,も
う ひ とつ,「 分 散 分 析 表 」が あ り ま す.
観 察 単 位 を 区 分 せ ず に 全 体 を 一 括 した と き の 「全 偏 差 平 方 和 」(こ の 例 で は429.66) と,区 分 け して 各 区 分 の 平 均 値 を 基 準 と し て 計 測 し た と き の 「級 内 偏 差 平 方 和 」(こ の 例 で は176.21)お
よ び そ れ ら の 差,す
な わ ち,こ
の 区 分 け に よ っ て 説 明 さ れ る変 動 の
大 き さ を 表 わ す 「級 間 偏 差 平 方 和 」(この 例 で は253.45)で 決 定 係 数 は,そ ◇ 注 図3.2.1中
す.
の 割 合 を示 す もの で す. の分 散 分析 表 の 見 出 し 「クブ ン ジ ョ ウホ ウ リ ョウ Rsq」 の うち,「 情
報 量 」は この 例 の場 合 につ いて は 「 偏 差 平方 和 」です が,後 で取 り上 げ る質 的 デ ー タ の場 合 も同 じ見 出 しに す るた め,区 分 け に よって 説 明 され る 「情 報 の 量」と,意 味 を 表 わ す 表 現 と しま した.
図3.2.2
図3.2.1に
図3.2.3
よ る地 域 区 分
④ 以 上 が プ ロ グ ラ ムCLASSの
出 力 で す が,地
図3.2.4に
よ る地域 区 分
域 デ ー タ で す か ら,こ
の結 果 を 地
図 上 に 表 示 した もの を用 意 して お く と よ い で し ょ う. 図3.2.2は,CLASSで す.UEDAの
出 力 さ れ た ク ラ ス ター 区 分 に よ って 模 様 わ け し た も の で
プ ロ グ ラ ムSTATMAPYを
ク ラ ス ター3,2,1,4,5で
す(図3.2.3に
⑤ こ れ らの 出 力 に よ っ て,各
使 っ て 出 力 で き ま す.模
様 の 濃 淡 順 に,
つ い て は 後 で 説 明).
ク ラ ス ター に 属 す る メ ン バ ー の 地 理 的 位 置 と,各 変
数 値 で み た 特 性 を 次 の よ う に よむ こ とが で き ます. ク ラ ス タ ー1: 地 域 と して は ま と ま っ て い な い が, 魚 ・肉の 支 出 が 多 い. ク ラ ス タ ー2:
関 東 か ら中 部 に わ た る 地 域 で, 魚 ・肉の 支 出 が 少 な く,調 理 食 品 ・外 食 の 支 出 が 多 い.
ク ラ ス タ ー3: 東 京 ・神 奈 川 お よ び 京 阪 神 を 中 心 とす る一 帯 で, ほ とん ど す べ て の 品 目で 支 出 が 多 い. ク ラ ス タ ー4:
中 国 ・四 国 ・九 州 に わ た る 地 域 で, ほ とん ど す べ て の 品 目で 支 出 が 少 な い.
ク ラ ス タ ー5: 北 海 道 ・東 北 ・北 陸 で, ほ とん どす べ て の 品 目で の 支 出 が 平 均 的. ⑥ 次 に,各 図3.2.4で
変 数 を標 準 化 して 扱 っ た 場 合 の 出 力 も示 して お き ま し ょ う.
す.前
掲 の 図3.2.3は,こ
⑦ こ の 出 力 も図3.2.1と 方 を か え た 場 合 は,そ こ と が 必 要 で す.
の 場 合 の ク ラ ス タ ー 構 成 で す.
同 様 に よ む こ とが で き ま す が,こ
の よ うに 各 変 数 の 扱 い
の 結 果 を比 較 し て,「 扱 い 方 を か え た こ とに よ る変 化 」を み る
図3.2.4
ク ラ ス タ ー分 析 の 出 力
変 数 の 扱 い は 「標 準 化 す る」 と指 定 し た場 合
表3.2.5は,図3.2.1の
場 合 の ク ラ ス タ ー 区 分 と図3.2.4の
場 合 の ク ラ ス ター 区 分
と を 比 べ た もの で す. 図3.2.2お
よ び 図3.2.3の
が い を くわ し くみ る に は,こ
よ う に地 図 形 式 で も比 較 で き ます が,構
成 メンバー の ち
うい う表 が 必 要 で す.
細 か い 出 入 りは あ る もの の,2 と お り の 分 析 結 果 は よ く合 っ て い る とい う 印 象 で す.た
だ し,も
ま ず,区
う少 し細 か くみ ま し ょ う.
分 け の効 率 は,図3.2.1の
場 合 は59%,図3.2.4の
場 合 は51%で
す.
標 準 化 せ ず に 使 う と,
→ 地 域 差 に 大 き い 関 係 を も つ =分 散 が 大 き い
→ そ の ち が い を消 去 し た 形 で 扱 う と,区 分 け の 効 果 が 平 均 化 さ れ て 低 くな る
こ う 了 解 で き ます.
表3.2.5
対 応 関 係 は,ク 二 重 線 は,大
ク ラ ス タ ー構 成 対 比 表
ラ ス ター メ ン バ ー をみ て 判 定. 多数 の メ ンバ ー が 共通 して い る場 合,単
線 は,一 部 の メ ン バ ー が
共 通 して い る場 合 を示 す.
区 分 け の 効 果 に 関 す る限 りで は 図3.2.1の
方 が よ い とい うこ と で す が,地
域差 へ の
寄 与 は小 さ くて も 「異 な っ た観 点 で の 地 域 差 を 見 出 し う る 」 とい う観 点 で は,決 数 の 差 が こ の程 度 な ら 図3.2.4を 図3.2.1で
は15県
採 用 しよ う とい う考 え 方 も あ りえ ます.
が 大 き く ま と ま っ て い た ク ラ ス ター 4が,図3.2.4で
の ク ラ ス タ ー に 分 割 さ れ た 結 果 に な っ て い る(表3.2.5の こ と も,同
は,2つ
メ ン バ ー 構 成 対 比 表 参 照)
じ理 由 で し ょ う.
⑧ こ こ に示 した メ ンバ ー 構 成 対 比 表 は,そ くこ とが で き ます が,実
れ ぞ れ の 出 力 の メ ンバ ー 表 を使 っ て か
際 に か くに は か な りめ ん ど う な 試行 錯 誤 を要 す る で し ょ う.
ク ラ ス ター の 番 号 は,計算
手 順 で 便 宜 的 に つ け ら れ た もの で す.し
お りの 計 算 結 果 を対 比 し よ う とす る と き,同 で は 5番,他
定係
た が っ て,2 と
じ ク ラ ス ター と解 釈 され る もの が,一
方
方 で は 2番 の よ うに ち が っ た番 号 に な っ て い る こ とが あ り ま す.
そ う い う も の は,番
号 をつ け か え て お か な い と比 較 し に くい … そ うす る た め に も
この 対 比 表 が 役 立 つ の で す. UEDAの す が,そ
プ ロ グ ラ ムCLASSの
中 に も,番 号 を つ け か え る 機 能 を用 意 し て あ り ま
れ は 1つ の 表 の 範 囲 内 で の つ け か え で す.
2つ 以 上 の 出 力 を比 較 す るに は,そ 「メ ン バ ー の 対 応 関 係 に よ っ て,ほ
れ ぞ れ の 出 力 を み て,決
め る こ とに な り ます .
ぼ 同 じ もの は 同 じ番 号 に す る」だ け で な く,各
ク ラ ス タ ー の 特 性 に 注 目 して 「説 明 しや す い順 序 に 番 号 をつ け る」た め に も参 考 と で き ま す. こ の 例 で は 「構 成 メ ン バ ー の 対 応 関 係 」 を み て こ の 表 を ま とめ ま した が,「 特 性 表 で の 対 応 関 係 」 を み て ま とめ る こ と も あ り え ます.
3.3 ク ラス タ ー数 の決 め 方 ① 前 節 の 例 で は,ク
ラ ス タ ー 数 を 5つ と し て 扱 い ま し た が,問
題 意 識 と して は 5
図3.3.1 図3.2.1と同 じ扱いで区分数 6と指定 した場合(例 2)
図3.3.2
図3.2.1と
同 じ扱 い で 区 分 数 7と指 定 した場 合(例
2)
つ とす る こ とに 必 然 性 は あ り ませ ん.6 つ で も 7つ で も よ い の で す. 要 は,食
生 活の
地 域 差 を 説 明 す る た め に ふ さ わ しい 数 を選 べ ば よ い の で す(図3.3.1,図3.3.2). 区 分 数 を 多 くす れ ば そ れ に 応 じて くわ し く説 明 さ れ る は ず で す が,要
点 を簡明 に説
明 す る とい う観 点 も入 れ ま し ょ う. た だ し,こ
うい う観 点 で 区 分 数 を決 め る 方 法 に 関 して は,数 理 的 な 決 め 手 は あ り ま
せ ん. 後 の 章 で 説 明 す る 「階 層 的 手 法 」で は 区 分 数 を 決 め ず に 適 用 で き ま す が,一
般 に は,
い く とお りか の 区 分 数 に つ い て 前 節 の 方 法 を適 用 し て,
区 分 け の 結 果 を説 明 しや す い もの を選 ぶ
の が 基 本 的 な 対 処 策 で す. ② ひ きつ づ い て 前 節 の 例 を 扱 い ま し ょ う. 区 分 数 を 6つ に し た 場 合,7 つ に し た 場 合 の 結 果 は,前 表3.3.3は,こ
れ らの 結 果 と前 節 の 図3.2.1に
表3.3.3
こ の 比 較 表 で は,3
ペ ー ジの よ うに な り ます.
示 す 結 果 に つ い て,ク
ラス ター構成
区 分 数 をか え た 場 合 の ク ラス ター 構成 比 較
とお りの 扱 い の 結 果 を比 較 しや す い よ う に,ク
ラ ス ター 番 号 をつ け か
え て あ りま す. ク ラ ス タ ー 区 分 を結 ぶ 線 は,共
通 す る メ ンバ ー 数 の 大 小 に よ って か えて あ ります.
を 比 較 し た もの で す. ③ 区 分 数 を 5か ら 6に 増 や し た場 合,
区 分 2が,区
分 2 と区 分3に
分 離 して い る
区 分 6 と区 分 7が,1 つ の 区 分 6 に 統 合 され て い る
こ れ に よ り 5つ の ク ラ ス タ ー が,4 つ に再 編 成 さ れ て い る が,
そ の 他 に 1つ の メ ンバ ー だ け の ク ラ ス タ ー が 2つ 出 現 し て い る
と い う結 果 で す. 区 分 数 を 6か ら 7に 増 や し た場 合 に つ い て は,
区 分 2を受 け 入 れ た 区 分 3が,そ
れ を も との 区 分 2に も どす と と も に,区
分
3 と区 分 4に 分 割 さ れ て い る
統 合 さ れ た 区 分 6は,ほ
1つ の メ ンバ ー か ら な る ク ラ ス タ ー は,そ
ぼ 同 じ形 で残 っ て い る の ま ま残 っ て い る
と い う結 果 で す. ④ 総 括 的 に い う と,区 分 6の 場 合 の 結 果 は 区 分 数 を 増 や し た こ と に よ っ て 「た ま た ま一 緒 に な っ た 」が,も です.し
う 「1区 分 増 や す と元 の 状 態 に も ど っ た 」 と解 釈 で き る よ う
た が っ て,区 分 数 5の 場 合 を採 用 す るか , 2区 分 増 や し た 区 分 数 7の 場 合 を
採 用 す るか の 選 択 と な るで し ょ う. 決 定 係 数 に つ い て は,当 61%,65%で
然 区 分 数 を 増 や す に つ れ て よ く な っ て い ま す が,59%,
あ り,5 区 分 → 6区 分 の 増 加 は わ ず か です. こ の こ と も,6 区 分 の 場 合
は 経 過 的 な結 果 だ と した こ とに 対 応 して い ます. 独 立 した ク ラ ス ター に な っ た 地 域 は 沖 縄 と和 歌 山 で す が,「 他 と一 緒 に は で き な い 個 性 を もつ 」 と して 受 け 入 れ るか, 調 査 結 果 の もつ 誤 差 の 影 響 に よ る偶 然 的 な 結 果 と み るか は 検 討 し ま し ょ う. た とえ ば 他 の 年 次 の デ ー タ を使 っ て,こ
れ らの ク ラ ス ター 区 分 が 再 現 す るか 否 か を
み る と よ い で し ょ う. ⑤ ク ラ ス ター 分 析 を適 用 す る場 合,こ 「解 釈 を確 認 す る た め の 分 析 」は,必 後 の 章 で,い
う い う 「わ け ら れ た 結 果 の 解 釈 」あ る い は
要 不 可 欠 で す.
くつ か の 実 例 を取 り上 げ て,こ
の こ と を例 示 し ま す.
3.4 ク ラ ス ター 分 析 の 種 々 の 方 法 ① ク ラ ス ター 分 析 とい うの は,種
々 の 手 法 の 総 称 で す.
こ の テ キ ス トで は,「 非 階 層 的 手 法 」(3.2節)と そ れ ぞ れ の 代 表 的 な 手 法 を解 説 して い ます が,い
「階 層 的 手 法 」(第 6章)に わ け て, ず れ につ い て も,
(1) 観 察 単 位 間 の 距 離 や ク ラ ス タ ー 間 の 距 離 の 与 え 方
(2) ク ラ ス タ ー 代 表 点 の 与 え 方
と,
(3) 逐 次 近 似 計 算 の 進 め 方 に 関 して,種
々 の 代 案 が 提 唱 さ れ て い ます.
こ の テ キ ス トで は,こ
れ らの 代 案 に 関 す る くわ し い解 説 は し ませ ん が,こ
こで それ
らの 概 要 を 述 べ て お き ま し ょ う. ② まず,(1),(2)に つ い て は,2 つ の ク ラス タ ー(A,Bと
ク ラス タ ーA
と ク ラ ス タ ーB
A の メ ンバ ーAIと
す る)間 の 距 離 に つ い て
の 距 離 を DAB
B の メ ンバ ーBJの
距 離 DU
と して DAB=min(DIJ)
と定 義 す る 「最 短 距 離 法 」
DAB=max(DIJ)
と定 義 す る 「最 遠 距 離 法 」
DAB=│DIJ│の DAB=各
平 均 値 と定 義 す る 「平 均 距 離 法 」 ク ラ ス ター の 重 心 の 位 置 間 の 距 離 と定 義 す る 「重 心 間 距 離 法 」
な ど が あ り ま す. ③ ま た,③
に つ い て は,
(A) 1つ の 観 察 単 位 に つ い て そ の 所 属 を 変 更 し た場 合 の 級 内 分 散 変 化 を 計 算 し, そ の 減 少 が 最 も 大 きい ク ラ ス ター に 移 動 す る.
(B) 1つ の 観 察 単 位 に つ い て す べ て の ク ラ ス タ ー と の 距 離 を 計 算 し,そ
の観 察
単 位 と最 も近 い ク ラ ス タ ー に移 動 す る.
(a) す べ て の 観 察 単位 とす べ て の ク ラ ス タ ー の 組 み 合 わ せ に つ い て 級 内 分 散 変 化 を計 算 し,そ
の 減 少 が 最 も 大 き い ク ラ ス タ ー に 移 動 す る.
(b) す べ て の 観 察 一 単位 とす べ て の ク ラ ス タ ー の 組 み 合 わ せ に つ い て 距 離 を 計 算 し,そ
れ が 最 も近 い 観 察 単 位 と ク ラ ス タ ー に つ い て移 動 す る.
な どの 扱 い が あ りえ ま す. ④ 3.2節 に 説 明 し た 方 法 で は(A)を 採 用 し て い ま す. こ の 場 合 に は 距 離 の 定 義 を
数 量 デ ー タの 場 合 に は 「差 の 2乗 の 平 均 の 平 方 根 」
質 的 デ ー タの 場 合 に は 「特 化 係 数 の 対 数 の 平 均 値 」
とす る こ とに な り ます. こ れ に対 して(a)の よ うに 「定 義 さ れ た 距 離 に 注 目 し て 最 も近 い と こ ろ に 組 み 替 え る」 もの とす る と,距 離 の 定 義,ク
ラス ター代表 点 の定義 が 問題 と して浮 か び上 が っ
て き ます. ま た,ク
ラス ター の位 置 は 「 重 心,す
な わ ち各 メ ン バ ー の 位 置 の 平 均 」を 使 う こ と
に な り ます. 以 上 の 説 明 に お い て 「距 離 」 と い う表 現 を 使 っ て い ま す が,ク (メ ンバ ー 数)が 関 係 して き ま す(3.2節
ラ ス ター の サ イ ズ
参 照)か ら,正 確 に い う と,距 離 で は な く 「分
散 の 変 化 」 を基 準 と して い る の で す. ⑤ また,(B)や(b)を
採 用 した場合
最 終 的 に 決 ま っ た 区 分 け の 有 効 性 を測 る 指
標 を ど う定 義 す るか が 問 題 に な っ て き ま す.そ
の 段 階 に 対 す る数 理 と し て 「級 内 分
散 」を も ち だ す こ と に な る の で す が,
ク ラ ス ター 構 成 手順 で の 論 理 と の 関 係 を 考 え る
と,必 ず し も 自 明 で は あ り ませ ん. 級 内 分 散 を も ち だ す な ら,は
じめ か ら,「 そ れ を最 小 に す る 」 と い う 観 点 で ク ラ ス
ター 構 成 手 順 を組 み 立 て る べ き で し ょ う. こ うい う考 え方 で,こ
の テ キ ス トで は(A)を 採 用 して い ま す.
⑥ 手 法 の 選 択 以 上 に 重要 な こ とは, 基 礎 デー タの 選 び 方 で す. こ の 章 で例 示 し た よ う に 参 考 と す る変 数 の 選 び 方 や 扱 い方 に よ っ て 結 果 が か わ っ て き ます. ⑦ これ は,ク
ラ ス ター 分 析 の 手 法 を採 用 す る と き に 考 え るべ き重 要 な 点 で す.
「基礎 デ ー タ の 選 び 方 に よ っ て もか わ り,
手 法 の選 び 方 に よ っ て も か わ る」 とい うの で は,
得 ら れ た 結 果 の 解 釈(当 然,各
ク ラ ス タ ー の 特 性 の ち が い に 注 目 し た 解 釈 〉を考 え る
と きに,
分析 対象 デー タに よるちが い と
手 法 によ るちが い とを識別せ よ
とい う難 題 が か らん で くる こ とに な りま す. し た が っ て,そ
う い う難 題 を避 け る た め に は
「手 法 の 選 び 方 」は 慣 用 さ れ て い る代 表 的 な 手 法 に 限 り,
「基礎 デ ー タ の選 び 方 を 工 夫 し て,状
態 を 説 明 しや す い 区 分 を 見 出 す 」…
そ うい う使 い 方 を し ま し ょ う. そ う徹 底 す る な ら ( A)の 扱 い だ け で 十 分 で す. そ れ 以 外 の 手 法 は,そ
れ を 採 用 す る 必 然 性 の あ る 場 合 に 限 り ま し ょ う.
● 問題 3●
問 1 次 の 表 は,図3.1.1の
基 礎 デ ー タ で あ る.
こ れ を 使 っ て,表3.1.2の
計 算 手 順 を確 認 せ よ. 表3.A.1
問 2 次 の 表 は,図3.1,1の
図3.1.1の
基礎 デ ー タ
基 礎 デ ー タ に お い て 分 散 の ち が い を 調 整 し た も の で あ る.
こ れ を使 っ て,表3.1.4の
計 算 手順 を確 認 せ よ. 表3.A.2
問 3 プ ロ グ ラ ムCLASSHは,表3.1.2あ
表3.1.4の
基礎 デ ー タ
る い は 表3.1.4の
計 算 手順 を画面 上 に示
す も の で あ る.
こ の プ ロ グ ラ ム に は,表3.A.1,表3.A.2の
デ ー タ が そ れ ぞ れ 例2,例
3と
して セ ッ ト して あ る.
プ ロ グ ラム を 呼 び 出 して,
デ ー タ と し て例 2あ る い は例 3,
手 法 と し て 観 察 単 位 数 の ち が い を考 慮 に 入 れ る
と指 定 す る と,表3.1.2お
よ び 表3.1.4の
計 算 手 順 が 進 行 す る こ と を確 認 せ よ.
偏 差 平 方 和 の か わ りに 分 散 が 表 示 さ れ る,区 分 A,区 分 B,区 分 C,別 の 計 数 は 表 示 され な い と い う ち が い が あ る が,実
質 は 同 じで あ る.
問 4 問 3に お い て,
手 法 と し て観 察 単 位 数 の ち が い を 考 慮 に 入 れ な い と指 定 して,計
算 手 順 を進 め,問
問 5 プ ロ グ ラ ムCLASSは,こ
3の 結 果 と比 較 せ よ.
の章 で説 明 し た ク ラ ス タ ー 分 析 の プ ロ グ ラ ム で あ る.
付 録 C の C.1節 に 示 す 使 い 方 説 明 に 沿 っ て,そ 問 6 デ ー タ フ ァ イ ルDK51Xを
の 使 い 方 を 把 握 せ よ.
指 定 して プ ロ グ ラ ムCLASSを
使 う と,図3.2.1が
得 られ る こ と を確 認 せ よ.
プ ロ グ ラ ム の 進 行 に お い て い くつ か の 選 択 肢 が あ るが,こ 指 定 す る こ と(後 の 章 で こ れ らの 選 択 肢 を使 う).
こ で は 次 の よ うに
デ ー タ の タ イ プ
数 量 デー タ
デ ー タ の 扱 い
標 準化 しない
区分数
5
逐 次近似 の初 期値
標準
パ タ ー ン 表 示 の 区 切 り値
標 準 どお り
問 7 問 6 と 同 様 に プ ロ グ ラ ムCLASSと
デ ー タ ファ イ ルDK51Xを
使 う と,図
3.2.4が 得 ら れ る こ と を確 認 せ よ.
こ の 場 合 に は 選 択 肢 を次 の よ う に 指 定 す る こ と. デ ー タの タ イ プ
数 量デー タ
デ ー タ の 扱 い
標 準化 す る
区分数 逐次近似の初期値
5
パ タ ー ン 表 示 の 区 切 り値
標 準 どお り
問 8 図3.2.4と
標準
同 し扱 い で 区 分 数 6 と指 定 し た 場 合 に つ い て,図3.3.1に
あたる出
力 を 求 め よ. 問 9 図3.2.4と
同 じ扱 い で 区 分 数 7 と指 定 した 場 合 に つ い て,図3.3.2に
あ た る出
力 を 求 め よ. 間10 図3.2.4の
結 果 と,問
8の 結 果 お よ び 問 9の 結 果 を 比 較 し て,区
場 合 の ク ラ ス ター 構 成 を 表3.3.3の
形 の 表 に ま とめ よ.
分 数 をか え た
4 構 成 比 の 比 較
対 象 デ ー タが構 成 比 の形 で 表 わ され てい る場 合 に も前 章 の クラ ス ター 分 析 を適 用 で きます.そ の こ とを第 5章 で説 明 し ますが,そ の前 に,質 的デ ー タにつ い て も,そ の 表 現 や対 比 の 手順 を,第
2章 と同様 な 分 散分
析(そ の論 理)の 形 に 組み 立 て うる こ と を説 明 し ます. 比 較 のた め に 「特化 係 数 」,差 の大 き さ を評 価 す るた め に 「情 報 量」を 使 うこ とが ポ イ ン トで す.
4.1 構 成 比 と特 化 係 数 ① この 章 で は,表4.1.1(例 こ の よ う な デ ー タ は,各 が 普 通 で す が(表4.1.2),比
9)の よ うな カ テ ゴ リカ ル デ ー タ の 扱 い を考 え ま す.
区 分 の 対 象 者 数 が ち が っ て い ます か ら,構 成 比 で表 わ す の 較 し よ う とす る情 報(例 示 で は,生
値(例 示 で は 4つ)で 表 現 さ れ て い る こ と に 注 意 し ま し ょ う.す
きが い観)が
1組 の 数
な わ ち,各
区分 に対
応 す る複 数 の 数 値 を 1つ の デ ー タ(変 数)と し て 扱 う の で す. こ の こ とに と もな っ て, 多次 元 的 な 扱 い が 必 要 と な って く るの で す. 例 示 は,意
識 調 査 の 結 果 表 現 で す が,「 人 の 情 報 を 人 数 で 表 現 」 した もの とみ れ ば,
広 く類 例 を 見 出 す こ とが で き ます.ま
た,「 世 帯 の 情 報 を 世 帯 数 で 表 現 」す る 場 合,
「地 点 の 情 報 を 地 点 数 で 表 現 」す る 場 合 な ど も,同
じ扱 い に な り ます.
し た が っ て,観
察 単 位 の 情 報 を カ テ ゴ リカ ル デ ー タ と して 把 握 した 場 合 の 扱 い と し
て,構
い 適 用 場 面 を もつ 表 現 法 に な っ て い ます.
成 比 は,広
表4.1.1
基 礎 デー タ(例 9)
表4.1.2
構 成 比
◇ 注 1組 の 数値 の一 部 分(た とえば仕 事 に 対 応す る数 字)だ け に 注 目す る と簡 単 に 扱 え る 場合 もあ ります が,一 般 に は,そ うは い え ませ ん.「他 の 区 分 と対 比 して 1つ の 区分 を選 ぶ 」形 で調 査 した 答 え です か ら,「 どん な区 分 を対 比 し たの か 」が わ か る形 で 分 析 す るの が 基 本 です. ② こ の よ う な 情 報 を,い
くつ か の 集 団 区 分 に つ い て 求 め,対
比 し ます.そ
うし
て,
各 集 団 区 分 が 他 と比 べ て
どん な 特 徴 を も っ て い る か を 調 べ る
あ る い は,
類 似 し た特 徴,相
集 団 区 分 を見 出 す た め に,
違 した特徴 をもつ
こ う い う分 析 を 行 な うこ とに な り ます. そ の た め の 分 析 手 順 を 「客 観 的 な手 法 」 と し て 組 み 立 て る の が,こ 最 初 に あ げ た 表4.1.1は,表4.1.3の 観 は,年
う ち 年 齢30∼34の
齢 と と も に ど う変 化 し て い くで し ょ うか.そ
の 章 の 主 題 です.
部 分 で す.人
の生 きが い
れ を こ の デ ー タ か ら よみ と る の
で す. ③ 2つ の 項 目 区 分 が 問 題 に 入 っ て い ま す. 1つ は,生
きが い 観 の 区 分 で,そ
れ を構 成 比 の 形 で 表 現 して い ます.そ
て 分 析 しよ う とす る も の で す か ら,説 明 さ れ るべ き変 数,す も う 1つ は,年
齢 区 分 で す.被
れ に注 目 し
な わ ち 被 説 明変 数 で す.
説 明 変 数 の 変 化 を み る た め に 取 り上 げ た もの で す か
ら,説 明 の 手 段 と して 使 う変 数,す
な わ ち 説 明 変 数 で す.
以 下 の 説 明 で 記 号 を使 う と き は,被 て 使 う項 目 は B と 表 わ し ます.た
説 明 変 数 と して 使 う 項 目 はA,説
明変 数 と し
だ し,先 へ 進 む と こ の 原 則 に よ ら な い 場 合 もあ り
ます. ④ 分 析 の 基 礎 デ ー タ は,A 計 表 」で す.こ
(= 生 き が い 観)と B(= 年 齢)と を組 み 合 わ せ た 「集
れ に も とづ い て,ま
表4.1.3
ず 最 初 に行 な う こ と は,構
成 比 の 計 算 で す. 各 区
比 較 の ため の 基礎 デー タ(例 9)
こ こ で は,付
表 Eの一
部 を 取 り上 げ て い ます.
分 の サ イ ズ(対 象 者 数)の ちが い を補 正 す る た め に,100人 で す.そ
れ が,表4.1.4で
ま た,各
表 の 表 頭,表
記 号 は,項
側 区 分 を表4.1.4の
目に 対 応 す る 部 分 と,そ
明変 数 の 区 分 がAIで,説
あ た りの計 数 に 換 算 す る の
す. よ うな 記 号 で 表 現 し ます.
の 区 分 に 対 応 す る添 字 か ら な っ て い ます.被
明 変 数 の 区 分 がBJで
す.し
説
た が っ て,
構 成 比 はAl、 に つ い て(表 で い う と横 方 向 に)計 算
し ま す. ⑤ 比 べ る の は 各 集 団 区 分 で す が,(B1,B2),(B1,B3),…,(B5,B6)と,ペ に み て い くか わ り に,ど
れ か 1つ の 区 分 を"標 準 とみ て",そ
アー ご と
れ と 比 べ て い く方 が 簡
明 で す. どれ か 1つ を標 準 とみ る 必 然 性 が な け れ ば,考 の 値 を求 め て,そ
察 す る集 団 全 体 を ま とめ て み た と き
れ を標 準 と し ま す.
い ず れ に せ よ,標 準 を 1つ に 固 定 す る と,
"各 集 団 で の 構 成 比"を,"標
ほ ぼ 標 準 並 み か,標
準 の 構 成 比"と 比 べ て
準 よ り大 か,標
準 よ り小 か
を判 別 す れ ば よ い こ と に な り ます. ま た,"各
集 団 で の構 成 比"が"標
準 の 構 成 比"の 何 倍 か , あ る い は,何
分 の 1か を
計 算 して お く と,こ の 判 断 を客 観 的 に 下 せ る こ と に な り ます. こ の 倍 率,す
な わ ち,"構
成 比 の 相 対 比"を 特 化 係 数 と よ び ま す.
こ れ に よ っ て,
特化 係数 が ほぼ 1
→ ほぼ標 準並 み
と よむ わ け で す.例
1よ り大
示 し た デ ー タの 場 合,表4.1.5の
こ の 特 化 係 数 は,各
準 以 下 と い う こ と を1/2以
よ うに な り ます.
構 成比の比較
準 以 上 と い う こ と を た と え ば 2倍 以
下 とお き か え て よん だ 結 果 を,表4.1.6の
示 して お くこ とが 考 え ちれ ます.分
表4.1.4
→ 標 準 よ り小
集 団 の 特 徴 を摘 出 す る た め の ス テ ッ プ と して 計 算 し た も の で す
か ら,特 徴 を わ か りや す く示 す と い う趣 旨 で,標 上,標
1 よ り小
→ 標 準 よ り大
よ うに 図
析 の 経 過 と し て特 化 係 数 の 表 を つ く るの は 当 然 で
表4.1.5
特化係 数
表4.1.6
す が,結
特 徴パ
ター ン
果 は こ うだ と要 約 し,要 点 を 印 象 づ け る た め に 図 表 化 す る の で す.
こ の 表 で は,大
き い 方 を"大 き い","や
や 大 き い"に,小
さ い 方 を"小 さ い","や
や 小 さ い"に そ れ ぞ れ 二 分 し,表 に 付 記 した 5区 分 の マ ー ク を 使 っ て い ます. こ の 記 号 は,こ 工 夫 して,"デ
の 章 全 体 を通 じて 使 い ます が,区
切 り値 の 方 は,問
ー タ が 示 す 特 徴 が よみ と れ る よ う"に 定 め ま す.な
の 形 の 指 標 で す か ら,大
題 に 応 じて 適 宜
お,特
き い 方 の 区 切 り と小 さ い 方 の 区 切 り を"何 倍,何
化係数が比 分 の 1"と
い う 形 で対 応 す る よ うに と りま す. ⑥ 以 上 で 述 べ て き た手 続 き,す
な わ ち,
基 礎 デ ー タ → 構 成 比 → 特 化 係 数 → パ ター ン表 示
と情 報 を整 理 し て い くプ ロ セ ス に よ っ て
"デ ー タ が 示 す 特 徴 を見 出 して い く"
の が 質 的 デ ー タ の 分 析 手 法 の 骨 組 み で す.以 助 手 段 を つ け 加 え て,分
下 の 各 節 で,こ
の 骨 組 み に い くつ か の 補
析 手 法 と して 使 い や す い シ ス テ ム に ま とめ 上 げ て い く こ と を
考 え ま し ょ う. ⑦ 後 の 説 明 で 必 要 に な り ます か ら,以 上 の プ ロ セ ス に 対 応 す る数 学 的 な 記 号 表 現 を 定 義 し て お き ま し ょ う. 基 礎 デ ー タ は,Nuと 添 字 に つ い て は,意 I は,被 J
は,対
表 わ し ます. 味 を もた せ ます . す な わ ち,
説 明 変 数 と して 扱 う項 目の 区 分 比 す る 集 団 区 分,す
に 対 応 す る も の と し ます.ま し ます.し
た,K
な わ ち 説 明 変 数 と して 扱 う区 分 が 調 査 事 項 の 区 分 数,L
た が っ て,I は 1か らK,J
分 析 の 過 程 に お い て"計"が
必 要 で す.計
を 0 とお き か え た 記 号 で 表 わ し ます.す
で す.た
は,足
し あ げ の 対 象 と され る 区 分 の 添 字
な わ ち,
だ し,す べ て の 添 字 が 0の と き は 添 字 を略 し て,N
構 成 比は
が集 団 区分 の 区分 数 と
は 1か らL ま でか わ る も の と し ま す.
とか き ま す.
と表 わ し,特 化 係 数 は
と表 わ します. 特化 係数 をN で表現 す る と
と な ります. NI0N0J/Nは,"調
査 事 項 A の 区 分 け と 集 団 区 分 の 基 礎 項 目B の 区 分 け が 独 立",
す な わ ち,PI/J=PI し た が っ て,特
for all Jであ る と し た と きの"NIJの
期 待 値"に な っ て い ま す.
化 係 数PI×Jは,
"NIJの 観 察 値 と期 待 値 の 相 対 比"
だ と解 釈 す る こ と も で き ま す. 以 上 の 記 号 体 系 は,ひ
とつ ひ とつ の 区 分 に 対 応 す る デ ー タ を 指 す も の で す が,1つ
の 調 査 事 項 に 対 す る 反 応 を 表 わ す1 セ ッ トの デ ー タ(情 報)に 対 応 す る 記 号 体 系 も 必 要 で す. そ の レベ ル で の 記 号 体 系 で は,区
分 ひ とつ ひ とつ に 対応 す る 添 字 の か わ りに,区
分
け の 基 礎 事 項 に 対 応 す る 記 号 を添 字 と し て
PA:
PA/B:PAを,B
調 査 事 項A
PA×B:
に よ る区 分 に対 応 す る構 成 比 に よ る 区 分(部 分 集 団)ご とに 求 め た もの
A, B の 関係 を表 わす表 の特 化係 数
と表 わ し ま す. こ の 表 記 法 で は,基
礎 デ ー タNIJをNABと
か くこ とに な り ます.
4.2 分 析 手 段 と して の 構成 ・運 用 ① 4.1節 で述 べ た 手 順 をふ りか え っ て み ま し ょ う. そ の 手順 の 中 に何 点 か 自 由 裁 量 の 余 地 が あ り ま し た.そ
こ の 裁 量 い か ん に よって,
デ ー タ の 特 徴 を"よ りよ く表 現 で き る"の で は な い か … こ うい う問 題 意 識 で す. 自 由裁 量 で き る 点 と して,次
の 3点 が あ り ます.
(1) パ タ ー ン 表 示 に お け る特 化 係 数 の 区切 り値
(2) 区 分 の 並 べ 方
(3) 区 分 数
こ れ ら に つ い て,順 明 し ます が,こ
次 み て い き ま し ょ う.前
節 の 例(簡 単 化 して あ る)を 使 っ て 説
う い う代 案 もあ る と い う 説 明 だ と 了解 して くだ さ い.も
多 い デ ー タ を使 う とこ うい う代 案 の 効 用 が わ か るの で す が,ま
ず は,手
っ と区分数 の 法の 説 明です
か ら …. ◇ 注 こ こ では,"最 初 に 取 り上 げ た デ ー タの範 囲 で"と い う前提 で 考 え ます.別 の デ ー タ をつ け 加 え る と,そ れに 応 じて よ り多 くの こ と を説 明 で き るよ うに な ります が,そ う い う扱 いに つ い ては,後 の節 で考 え ます. ② 4.1節 の 表4.1.6で は,特
化 係 数 を(2.0,1.5,1/1.5,1/2.0)で
階 評 価 値 に お き か え ま し た が,こ
れ を 7段 階 に し た ら ど うか,ま
区 切 っ て 5段 た,同
じ く 5段 階 で
も,区 切 り値 を か え た ら ど うか … 試 して み ま し ょ う. 表4.2.1は,1.25と1/1.25を 表4.1.6で
区 切 り値 に 追 加 し て,7 段 階 で 表 現 し た もの で す.
は は っ き り し て い な か っ た"区 分A1に
び 上 が っ て き ま す . そ の 点 で は プ ラ ス で す が,も
対 す る 反 応"の と も と24区
ち が い が,浮
か
分 し か な い 情 報 を 7段
階 に 区 切 る の で す か ら,全 体 と して の パ タ ー ン は よみ に く く な り ます. 表4.2.2は,5
段 階 の ま ま 区 切 りを(1.5,1.25,1/1.25,1/1.5)と
区 分 数 は 表4.1.6と
か え た場 合 で す.
同 じ で す か ら,そ れ と比 べ て み ま し ょ う.
5段 階 の 各 々 に 属 す る セ ル 数 を カ ウ ン トす る と,
(1,5,10,2,6)だっ た もの が
(6,3,6,1,8)と な っ て お り,
両 極 端 を 強 調 した パ タ ー ン 表 示
に な っ て い ます. し た が っ て,"両
極 端 に わ か れ る"と い う説 明 が ふ さ わ し い か,"徐
い う説 明 が ふ さ わ しい か を 判 断 し て,ど 以 上 の 説 明 に 対 し て,"こ し か し,"分
々 に か わ る"と
ち らの 表 現 を と る か を決 め るの で す .
うせ よ"と い う指 針 が ほ し い と思 う 人 が あ る で し ょ う.
析 の 最 初 の 段 階 で 決 め て し ま う"こ とは 避 け る べ きで す.
"デ ー タ の パ タ ー ン を浮 か び 上 が らせ る"と い う基 本 方 針 で,ケ
ー ス ・バ イ ・ケ ー ス
に 判 断 し ま し ょ う. ③ 次 に,区 表4.1.4の
分 の 並 べ 方 をみ ま し ょ う.
例 に お け る B は,年
表4.2.1
齢 区 分 で す か ら,意 味 の 上 で の 順 序 を も ち ま す.
区切 り数 を増 や す と
特 化 係 数 の 区 切 りを 2.0,1.5,1.25,1/1.25,1/1.5,1/2 で 7区 分 に し た 場 合
表4.2.2 区切 り方 をか え る と
特化 係数 の区切 りを 1.5,1.25,1/1.25, に した場合
1/1.5で
5区 分
表4.2.3
した が っ て,順 こ れ に 対 し,A
区 分 を並 べ か え る と
表4.2.4
区分 を プー ル す る と
序 を並 べ か え るの は 不 自然 で す. の 方 は,定
義 上"A1,A2, A3, A4の
順 に 並 べ る べ き だ"と い う 必 然
性 は あ りま せ ん. し た が っ て,デ ー タ の 側 か ら み て"パ ター ン が は っ き りす る な ら,そ
の 順 に"並 べ
な お す こ と を考 え て よい わ け で す. こ の例 で は,表4.2.3の
よ うにA2, A1を
入 れ か え て,
A2, A1, A3, A4と
方 が,パ
タ ー ン を簡 明 に 表 現 で き る よ うで す.
"B がB1,B2,…,B6と
する
うつ る に つ れ てA がA2, A1, A3, A4と
が は っ き り と よみ とれ ます.年
齢 と と も に,余
て い き,「 生 きが い は 」 と い う問 い に,そ こ の 例 の よ う に考 え れ ば,カ
うつ っ て い く",様
子
暇 ・仕 事 ・家 庭 ・子 供 と関 心 事 が うつ っ
れ が 反 映 して い る も の と説 明 で き ます 。
テ ゴ リー 区 分 に 対 して,
"デ ー タの 側 か ら順 序 を 見 出 し た" とい うこ とが で き ま す. こ の 観 点 に た っ て さ ら に 洗 練 さ れ た 手 法(数 量 化 の 方 法 と よ ば れ る)が い くつ か あ り ます.第8
章 で 取 り上 げ ます.
④ も う ひ とつ は 区 分 数 で す.例
示 の デ ー タ で は,A
に つ い て は 区 分 の 意 味 か ら,
す な わ ち,そ れ が"家 庭"で あ り"子 供"で あ る こ とか ら,A3,A4が
近 く,こ れ ら を 1
つ に 集 約 す る こ とが 考 え られ ます. デ ー タの パ ター ン で み て も,A3, A4,は 似 て い ま す. ま た,B
に つ い て は,デ
味 の 上 か ら も"中 年 層"と
ー タが 示 す パ ター ン の 方 か らB4, B5が 近 い よ う で す.意 し て1つ
に ま とめ て よ い と思 わ れ ま す.
こ の よ うに,
"デ ー タ の 意 味"と"デ
類 似 し た 区 分 を集 約 して い け ば,
ー タ が 示 す パ ター ン"の 両 面 か ら考 え て,
デ ー タの 表 現 を簡 明 化 で き る こ とが 多 い
の で す. 例 示 の場 合 は も と も と4×6と
い う小 さ い 表 で す か ら そ れ 以 上 集 約 す る 必 要 は あ り
ませ ん が,規
模 の 大 き い 表 が 提 示 さ れ た 場 合,こ
が 有 効 で あ り,ま た,必
の 考 え 方 で 情 報 を集 約 して い くこ と
要 で す.
も ち ろ ん,集 約 して"せ っ か くの 情 報 が よ め な く な る"こ と の な い よ う,デ ー タ の パ タ ー ン に 注 意 しつ つ,集
約 の 仕 方 を決 め な け れ ば な り ませ ん.し
情 報 ロ ス を最 小 限 に お さ えつ つ,情
た が っ て,
報 表 現 を縮 約 す る
こ と を考 え る の で す. こ れ を,パ ー シ モ ニ ィ(parsimony)の
原 理 と よ び ます.統
計 的 手法 を組 み 立 て る
と きの 重 要 な 原 理 の1 つ です. こ う い う手 法 を組 み 立 て る こ と を,次
の 節 で 情 報 量 とい う概 念 を導 入 し た 上,ひ
き
つ づ い て 考え で い き ます.
4. 3 情
報 量
① 前 節 で 述 べ た 構 成 比,特 づ け る た め に は,デ ま た,ど て,そ
化 係 数,特
徴 摘 出 と進 め る過 程 を分 析 手 順 と し て 位 置
ー タ の も つ 誤 差 あ る い は 不 規 則 な変 動 へ の 配 慮 が 必 要 で す.
の 程 度 ま で 大 きい 変 動 を摘 出 し,ど の 程 度 以 下 の変 動 を割 愛 す るか を決 め
れ に 応 じた 精 密 さ で 手 順 を 進 め う る こ と も必 要 で す.
② カ テ ゴ リカ ル デ ー タの 解 析 で は,こ ます.数
の よ うな 考 察 の た め に 「情 報 量 」が 使 わ れ
量 デ ー タ の 場 合 の 分 散 に あ た る機 能 を 果 た す わ け です.
ま ず,こ
の 情 報 量 の 定 義 を 与 え ま し ょ う.
特 化 係 数 が1 に近 い
特 化 係 数 が1 と離 れ て い る ⇔ A とB の 間 に 特 記 す べ き関 連 が あ る
こ とか ら,A,B
の 関 連 の 大 小 を"特 化 係 数 と1 との 差"に
考 え ら れ ま す.し
⇔ A と B の 間 に 特 記 す るほ どの 関 連 が な い
よって評 価 で き る もの と
た が っ て,
情 報 量 は,"特
化 係 数 と1 との 差"と 了解 で き る指 標
と し て 定 義 す べ き で す. そ の場 合,ま
ず 第 一 に,A,B
の 関 連 表 の す べ て の セ ル に 注 目 し て 考 え るべ き 指 標
で す か ら,特
化 係 数 と1 との 偏 差(セ ル の 数 だ け あ る)の 平 均 の 形 で 定 義 す る と よ い
で し ょ う,た
だ し,基 礎 デ ー タ が"集 計 デ ー タ"で あ っ て,セ
す か ら,NIJを ま た,第
ル ご とにN
が ちが い ま
ウ エ イ トと して 使 っ た加 重 平 均 と し ます.
二 に,特
化 係 数 が 比 の 形 の 指 標 で あ る こ と か ら,"対
数 変 換 し た 値"で
み
た差 を使 う方 が 自然 で す. ③ し たが っ て,A
とB の 「関 連 の 大 き さ を測 る 情 報 量 」を
と定 義 し ます. 考 え方 は,分 散 の 定 義 と同 じ で す.
IA×Bが 分 散 に, IA×Bが 偏 差 平 方 和 に あ た り ま
す.単
に 情 報 量 と い う と きは,デ
ー タ全 体 と して の 量 を み る とい う趣 旨 で,偏
差 平方
和 に あ た るIA×Bを 指 し ます. IA×B≧0が 成 り立 ち ま す.等
式 が 成 り立 つ の は特 別 の と きで す.
こ の 定 義 に お け る 対 数 と して は,自
然 対 数 を使 い ま す.ま
る計 算 値 を 2倍 し た も の を使 い ま す.す
た,便 宜 上,こ
の式 に よ
な わ ち, (1)
と し ます.こ
れ に よ る計 算 値 の 単 位 を ニ ッ トと よ び ま す.
◇ 注 コン ピ ュー タの分 野 では,2 を底 とす る対 数 を使 い ます. その と きの 単 位 が ビ ッ ト で す.1
ニ ッ ト =1.386ビ
ッ ト と な り ま す.
④ 特 化係数 の宗誰 式 をN で表 わす と,
で す が,こ
れを
とか け る こ と に 注 意 し ま し ょ う. 第 一 項IAがB
で 区 分 け さ れ て い な い状 態 で の 情 報 量,第
され た 後 で の 情 報 量 で す.こ
れ らが 図4.3.1の
二 項IA│Bが, B
で 区分 け
左 側 で あ り,そ の 差 と して 取 り出 され
たIA×Bが 区 分 け の 効 果 を表 わ す 情 報 量 と解 釈 で き る か ら で す. IA×Bは,ま
た
とか く こ とが で き ま す.こ
の 式 は,基 礎 デ ー タの 表 の
各 セ ル(計 の セ ル も含 む)のN
の 値 をN ⇒2NlogNと
+ ま た は −の 符 号 をつ け て 合 算 す る形
に な っ て い ま す.
図4.3.1
ま た,NI0N0J/Nは,A,B と き のNIJの E(NIJ)と
が 独 立 だ と仮 定 し た
期 待 値 と 解 釈 さ れ る 量 で す.こ
れ を
お く と,情 報 量 の定 義 式 は,
と表 わ す こ とが で き ま す.NIJを 布,E(NIJ)を,分
観察 され た頻度 分
布 に 関す るモ デ ル を想 定 した と
き の期 待 値 とみ れ ば,数
量 デ ー タの 構 成 比 の 場 合 も
変 換 し,
区分 け に よ る情 報 量 の 変化
含 ん だ 一 般 の 定 義 と な り ま す. た だ し,分 析 手 順 と し て は,定
義 式 の 形 で 各 セ ル ご と に2NIJlogPI×Jを
表 示 す る 方 が よ い で し ょ う.各 セ ル の 値(絶 対 値)が,"デ IA×Bに 対 し て,そ
の セ ル で の 差PI×Jが
計 算 し,
ー タ全 体 と し て み た 情 報 量
どれ だ け 寄 与 して い る か"を 判 断 で き る か ら
です. ⑤ 4.1節 に あ げ た 例(表4.1.3)に 情 報 量 は,IA×B=519.7ニ IA×B=519.7/1430=0.363で
つ い て,情
報 量 計 算 表 を 示 して お き ま し ょ う.
ッ ト と評 価 さ れ て い ま す.デ す.数
ー タ1 つ あ た り に す る と,
量 デ ー タ の 場 合 の 相 関 係 数 に あ た る 量 が√0.363=
0.60で あ り(第8 巻 『主 成 分 分 析 』を 参 照),A
とB の 関 連 度 は た い へ ん 大 き い と い
う こ とが で き ます. 表4.1.4の
区 分A3,A4お
計 算 す る と,情 報 量=384.3ニ
よ びB4,B5を
プ ー ル した 場 合(表4.2.4)に
ッ トが 得 ら れ ま す.こ
の 減 少135.4ニ
つ い て 同様 に ッ トが,区
分 を
プ ー ル した ため の ロ ス で す. こ の 例 に 限 らず,
"区 分 を集 約 す る と情 報 量 が 減 少 し,区 分 を細 分 す る と情 報 量 が 増 加 す る"
こ とが 証 明 さ れ ます . ま た,種
々 の 区 分 集 約 法 に つ い て ,集 約 に よ る情 報 量 ロ ス を計 算 し,ロ
な い集 約 法 を見 出 す こ とが で き ま す.し 表4.3.2
Kullbackの
た が っ て,こ
ス の最 も少
の 章 の 分 析 手 法 の 数 理 を組 み 立
情報量の計算
情報 量
デ ー タX の 分 布 関 数 と し て 2つ の 可 能 性f1,f2が 考 え ら れ る 場 合,f1/f2を 度 比 と よ び,f2に た,f1を
仮 説,f2を
尤
対 し てf1を 識 別 す る こ と の 有 効 性 の 尺 度 と 解 釈 さ れ ま す.ま 観 察 値 の 分 布 と す れ ば,「 仮 説 の 妥 当 性 を判 断 す る た め に 観
察 値 が も た らす 情 報 」の 大 き さ を 測 る 指 標 と解 釈 さ れ ます. ま た,こ
の 指 標(そ の 対 数 を と っ た もの)の 期 待 値 を平 均 情 報 量 と よ び ます.
こ れ を 多 項 分 布 の 場 合 に 適 用 す る と,本 文 に 述 べ た 情 報 量 の 定 義 とな り ます.
て る こ とが で き ま す. ⑥ 表4.3.2に
求 め た 情 報 量520ニ
ッ トに つ い て,そ
い とみ る か , そ の 判 定 基 準 が 必 要 で す,そ な い(あ る と して も,ラ
れ を大 き い とみ るか 大 き くな
の た め に は,A ,Bの 間 に 実 質 上 の 関 係 が
ン ダ ム と み られ る程 度 の小 さ い 関 連 しか な い)と し た 場 合 に
期 待 さ れ るIA×Bの 値 を 計 算 して お き,そ れ と対 比 す る形 で 評 価 し ま す.こ つ い て の"数 理 的 に き ち ん と し た 説 明"は,専
の こ とに
門 書 に ゆ ず り ます.
結 論 だ け を い う と,A ,Bの 間 に ラ ン ダ ム な 関 係 し か な い と し た 場 合 のIA×Bの 値 は,x2分
布 と よ ば れ る確 率 分 布 で 表 わ さ れ る こ とが 証 明 さ れ ます.し
計 数 値 表 に掲 載 さ れ て い るx2分
布 の 表 を利 用 し て,実
た が っ て,統
際 の デ ー タ で 計 算 さ れ たIA×B
の値 が"ラ ン ダ ム とみ ら れ る 範 囲 を こ え る程 度 か 否 か"を 判 定 で き ま す. も う一 段 細 か くい う と,A ,B の 区 分 数 い か ん が 関 係 を も ち,
(Aの
区 分 数-1)× (Bの 区 分 数-1 )
に 対 応 す るX2分 A のK
区 分,B
布 を 参 照 し ま す.「 区 分 数 」で な く 「区 分 数− 1」 と な っ て い るの は, のL 区 分 の う ち1 つ の 度 数 が,"度
数 の 計 が 一 定"と
い う条 件 か ら
自動 的 に 決 ま っ て しま う こ と に 対 応 し ます. (A の 区 分 数-1)× (Bの 区 分数-1)を 度 は(4-1)(6-1)=15で 図4.3.3は
自 由 度 と よ ん で い ま す.例
示 の 場 合,自
述 の 判 定 に 使 う数 値 は,図
の25.0に
由
す,
こ の 場 合 のX2分
布 で す.前
あたる
数 値 で す. こ の 限 界値 は,統
計 数 値 表 か ら拾 うこ と が で き ます.
こ の値 に も とづ い て,ま
れ な ケ ー ス(5%以
と し た場 合 に 起 こ り う る 値 は,25.0以
下 の 可 能 性)を 無 視 す る と,ラ ン ダ ム だ
下 だ とみ て よ い こ とが わ か り ます.
実 際 の デー タ で 計 算 し た値 は520で,こ
の25.0す な わ ち,"ラ
に期 待 され る範 囲"を は るか に こ え て い ます.し
た が っ て,ラ
ンダ ムだ とした とき
ン ダ ム とは い え な い値
だ とみ るべ き で す. い い か え る と,何
か
"説 明 さ れ る べ き差"(有 意 差 とい い ます)を 含 ん で い る
と結 論 す るの で す . そ う して,そ
の 差 を 説 明 す る た め に,特 化 係 数 を 計 算 し,パ
ン 図 をか くな ど の 解 析 を行 な うの で す. こ こ で 採 用 し た 推 論 の 論 理 は,有
意性検 定 とよ
ば れ て い ます が,帰
なわ ち
謬 法 の 形 式,す
A が 真 な ら B が 真,し
な い,よ
か るに B は真 で
っ てA は 真 で な い
に な っ て い ま す. こ の 論 理 に お け る 命 題A,B
を具 体 的 に か く
と,次 の とお り で す.
「ラ ン ダ ム で あ る」が 真 な ら,「IA×Bの 値
図4.3.3 X2分
布
ター
は25.0以
下 」が 真 で あ る,
し か る に,「IA×Bの 値 は25.0以
よ って,「 ラ ン ダ ム で あ る」は,真
下 」は 真 で な い, で な い.
た だ し,最 初 の 命 題 が"絶 対 に正 しい 命 題"で な く,"ま る命 題"で あ る こ と に 注 意 し て く だ さ い.こ
れ に は 正 し くな い こ と が あ
の 点 で は,帰
謬 法 の拡 張 に な って い ま
す. 統 計 学 で こ の 推 論 を採 用 す る と き に は,"ま トロー ル して 適 用 す る の が 普 通 で す.ま ば 可 能 性1%と
す る と,"説
れ"と い う条 件 を"可 能 性5%"と
れ とい う条 件 を も っ と き び し く と り,た
明 さ るべ き 差"が あ る の に,"ラ
コン とえ
ン ダ ム だ"と 結 論 す る と
い う誤 りが 多 くな り ます. 逆 に,ま き差"だ
れ と い う 条 件 を も っ と あ ま く と る と"ラ ン ダ ム に 近 い 差"を"説
と指 摘 す る可 能 性 が 高 くな り ます.こ
だ か ら,5%を
れ も,好
明 さ るべ
ま し い こ とで は あ り ま せ ん.
使 う の が 慣 習 とな っ て い るの で す.
4.4 デ ー タ分 解 と情 報 量 分解 ① この 節 で は,い こ れ を,デ
くつ か の 区 分 を合 併 し て,基 礎 デ ー タ の 表 現 を簡 単 化 す る …
ー タ解 析 の 手 順 と し て ど の よ うに 進 め て い け ば よ い か を,い
くつ か の 典 型
的 な タ イプ に わ け て考 え ま し ょ う. 区 分 を縮 約 して い く と き,縮 約 の 仕 方 は,各
a. 定 義 上 の 遠 近
b. デ ー タ が 示 す パ タ ー ン で み た 遠 近
区分の
の 両 面 を,後 先 は と もか く,考 慮 に 入 れ な け れ ば な り ませ ん.前
者 を 配 慮 す る こ とに
よ っ て,
"デ ー タ の 意 味 の よ み 方"に つ い て の 妥 当 性
が確 保 され,後
者 を 配 慮 す るこ とに よ って,
"デ ー タ が 示 す 事 実 の よ み 方"に つ い て の 妥 当 性
が確 保 さ れ るの で す. デ ー タ解 析 の 手 法 と し て,こ
れ は,た
い へ ん 重 要 な 点 で す 。 こ うい う考 察 を体 系 的
に 進 め う る よ うに,分
析 手 順 を シ ス テ ム 化 す る こ とが 必 要 で す.
② 一 例 と し て,次
の 表4.4.1(例10)を
こ の例 の 場 合,表
頭 の 7区 分 は,意
分 析 す る場 合 を考 え ま し ょ う.
味 上 完 全 に 並 列 す る もの で な く,表 に 付 記 した
区 分 の 定 義 に 示 す よ う に,(1)回 答 あ り ・な しの 区 分,(2)賛 否 区 分,(3.1)賛 分,(3.2)反
成理 由区
対 理 由 区 分 と,3 段 階 の 階 層 構 造 を も っ て い ま す.
分 析 に お い て は,当 ③ 表4.4.1の
然 こ の 階 層 構 造 を考 慮 に 入 れ るべ き で す.
デ ー タ は,こ
表 に 分 解 さ れ て い ま す.
の 階 層 構 造 に 対 応 し て,表4.4.2の
よ うに 4つ の 成 分
表4.4.1
こ こ で,表4.4.1に
世 論 調査 の デー タ(仮 想 例 −
例10)
は な か っ た 計(中 間 計)の 数 字 をつ け 加 え て い ま す が,そ
れ は,
新 し い 情 報 で は な い こ とに 注 意 して くだ さ い. こ れ ら 4つ の 成 分 表 は,そ
れ ら を 1セ ッ トと して 扱 え ば,
も と の 表 の 情 報 を"も れ な く",ま
"重 複 す る こ と な く"表 現 し な お し た もの
た,
に な っ て い ます . どん な 方 法 で も よ い で す か ら,確 認 し て くだ さ い.そ の 意 味 で,
原 デー タ=Σ 各成 分表
と 「加 法 的 に 分 解 さ れ る」 と い う こ とが で き ま す . ④ デ ー タの 表 現 に こ うい う加 法 的 分 解 を考 え る こ とが で き る とす れ ば,デ
ー タの
もつ 情 報 量 に つ い て も,加 法 的 分 解
原 デ ー タの 情 報 量 = Σ 各 成 分 表 の 情 報 量
が 成 り立 つ こ と を要 請 す る の は 自然 で す. 自由 度 に つ い て も,加 法 的 分 解 が 成 り立 ち ま す. 各 部 分 表 に つ い て 情 報 量 を計 算 す る と,表4.4.3が 情 報 量 の 定 義 と して,前
節 のIA×Bを 採 用 す る と,こ
り立 つ こ とが 簡 単 に 証 明 で き ま す.例
の 4区 分 間 の 差 に つ い て,
回 答 率 に 差 が あ る こ と,
賛 否 パ ター ン に 差 が あ る こ と,
れ ら に つ い て加 法 的 関 係 が 成
示 に つ い て も,表
す. こ れ に よ っ て,B
得 られ ます.
の と お り,そ
うな ってい ま
表4.4.2
基礎 デ ー タの 分 解
表4.4.3
賛 成 理 由 に 差 が あ る こ と,
反 対 理 由 に つ い て は 差 が 小 さい こ と,
情 報 量 分解
が わ か り ます . ま た,表4.4.2の
部 分 表 D の 部 分 を無 視 し て も
情 報 量 の ロ ス は3%に
過 ぎ な い こ と もわ か りま す.
⑤ こ の例 で み た よ う に,
基礎 デ ー タ の 分 解 と,情 報 量 の 分 解 と を対 応づ けて 論 じうる こ と
な ど か ら,こ
の 節 の 冒 頭 に あ げ た"分 析 手 法 の 体 系 化"が 実 現 で き る の で す.
⑥ 情 報 量 を,分 散 の 定 義 に な ら っ て,
"特 化 係 数PI×Jと
1との 偏 差 の 2乗 和"
と定 義 す る こ と も考 え られ ます.こ
が 導 か れ ます.こ
れ は,分
布 の あ て は ま り を検 討 す る 問 題 で よ く使 わ れ るX2統
と よ ばれ る も の に 一 致 し ま す.ま した が っ て,本
の 形 で 定 義 し(X2と す る)そ れ を書 き換 え る と
た,N
が 大 き い と き に は,X2〓IA×Bで
文 で 扱 っ て い る問 題 に 対 し て,こ
のX2統
計量
す.
計量 を適用 す るこ とも で
き ます. 入 門 レ ベ ル の テキ ス トと の つ な が り を考 え て,そ
う す る の が 一 案 で す が,X2を
う と,こ
こで述 べ た
"基 礎 デ ー タ の 分 解"に 対 応 す る"情 報 量 分 解 の 加 法 性"
が,等
式 と し て は 成 り立 た ず,近
似 的 な 関 係 に な っ て し ま い ます.し
た が っ て,こ
使
の
節 に 示 す 分 析 ま で進 む と き は,情
報 量 の 定 義 は,IA×Bに
⑦ 情 報 量 の 分 解 は,表4.4.1の
形 式 に 限ら ず,さ
よ るべ き です. ま ざ ま な形 式 で 進 め る こ とが で
き ま す. 代 表 的 な 例 を あ げ て お き ま し ょ う. 例 9
表4.4.4は,指標
A の構 成 比 を,B,C
比 す る 形 式 に な っ て い ま す.こ こ れ をA,B,C
の 組 み 合 わ せ 区 分 別 に つ くっ て 対
れ を,表A×BCと
か く こ と に し ま し ょ う.な
お,
の三 重 組 み 合 わ せ 表 とみ る の は 不 適 当 で す.
A が 対 比 の た め に 注 目す る指 標 区 分 で あ り,BCが,
A につ い てみ られ る差 を説
明 す る た め に 取 り上 げ た対 比 区 分 で す. し た が っ て,"分 A×BCだ
析 上 の 視 点"に 即 し て い う と,A
と(B,C)の 二 重 組 み 合 わ せ 表
と み るべ き も の で す.
◇ 注 ク ロ ス表 の記 号A×BCに
お け るBCも,形
式 的には B と Cの クロス表で すか
ら,全 体 と してはA,B,C の3 変 数 の三 重 組 み合 わせ 表 に な って い ます.し たが って,記 号A×B×Cを
使 うこ とも考 え られ ます.た だ し,変 数 の扱 い方 が,A×BCだ
とい うこ
とを表 現 す る ため,本 文 に述 べ た 記号 を使 い ます. そ の 枠 組 み で 分 析 を進 め る に は,対
比 区 分BCに
つ い て,た
第 一 レベ ル :B に よ る 区 分……
B1に お け る第 二 レベ ル C に よ る 区分 … … 表A×C│B1
B2に
とわ け て,差
とえば
表A×B
お け る第 二 レベ ル C に よ る区 分 … … 表A×C│B2 の 所 在 を つ め て い く,こ
うい う過 程 を採 用 すべ き で す.
こ の よ う な観 点 で,
表A×BCを,部
分 表A×B, A×C│B1,A×C│B2,…,A×C│BJに 表4.4.4
3要 因 組 み 合 わせ 表 の例(例
分解 す る
9) A 生 きが い 観 は A1: 子 供 A2: 家 庭 A3: 生 活 A4: レ ジヤ ー A5: 仕 事 B 男女 別 B1: 男 B2: 女 C 年 齢 区分 C1:15∼19 C2:20∼24 C3:25∼29 C4:30∼34 C5:35∼39 C6:40∼44
こ と が で き ま す.部
分 表 の 記 号 の う ち,A×C│BJは,BJの
範 囲 に 限定 して, A, C
の 関 係 をみ る 表 とい う意 味 で す. こ れ らの 部 分 表 に つ い て,情 で,表
報 の 重 複,脱
漏 の な い 分 解 に な って い る と い う意 味
の分 解 式
が 成 り立 ち,ま
た,そ
れ に 対 応 して,情
報 量 の分解 式 (1)
が 成 り立 ち ま す . 例 示 の デ ー タ で は,
と な っ て い ま す. 表4.4.4の
場 合,BCが
順 を 入 れ か え て,C
B, C の 完 全 な 組 み 合 わ せ に な っ て い ま す か ら, B, C の
の 方 を 第 一 レベ ル 扱 い に す る こ と が で き ま す.こ
の 扱 い で は,
表 形式 お よび 情報 量の分 解式 は
(2)
とな り ます. 表4.4.5が,こ
の分 析 に 関 す る ま とめ で す.
⑧ も うひ とつ 例 を あ げ ま し ょ う(例 3). 次 ペ ー ジ の 表4.4.6は,NHKの
県 民 意 識 調 査 に お け る 「各 地 の 人 々 の 人 づ き あ い
表4.4.5
表A×BCの
成 分分解
に 関 す る評 価 」の 調 査 結 果 の 一 部 で す.こ
こ で 省 略 した 部 分 に つ い て は 付 録 を参 照 し
て くだ さ い. 東 京 と大 阪 とを 比 べ る と, O O
「日 ご ろ つ きあ っ て い る親 戚 の 多 さ 」に は 大 差 が な い の に 対 して O 「 隣 近 所 の 人 との つ き あ い 」に つ い て は,大
阪が 多 く
「仕 事 関 係 の 人 と仕 事 以 外 の こ と で の つ きあ い 」に つ い て は,東
京が多い
よ う で す. とか く比 較 さ れ る こ との 多 い 東 京 と大 阪 で す が,こ ひ ろ げ て 解 釈 す る こ とは 妥 当 で し ょ うか.ま
た,差
の ち が い を 関 東 と関 西 との 差 と
が あ る とい っ て も,東
京 ・大 阪 と
そ れ 以 外 の 差 も大 き く,「 人づ きあ い に 関 す る 地 域 差 」を み る と い う意 味 で は 東 京 ・大 阪 に 限 定 す る こ と は 適 当 で は あ り ま せ ん. そ うか と い っ て,47県
の ひ とつ ひ とつ に つ い て み て い くの は,芸
の な い 扱 い で す.
ど うい う地 域 で ど う だ と,要 約 し た 説 明 を 与 え るの が 目的 です か ら,ク
ラ ス ター 分 析
の 出 番 で す. こ れ ま で の 例 と 比 べ る と,形
式 は 最 も単 純 なA×Bで
表4.4.6
血縁, 地 縁, 職 縁(例
す が,B
の 区分数 が 多い表
3)
望 ま しい の は何 で も相 談 で き るつ き あ い
A1
望 ま しい の は お互 い の こ とに 深 入 り し な いつ き あ い
A2
日 ご ろつ き あ っ て い る親戚 は 多い
A3
は い
親戚に は信頼 できる人が多い
A5
は い A6
いい え
隣 近 所 の 人 との つ き あ い は 多 い
A7
は い
A8
いい え
隣近所には信頼で きる人が多い
A9
は い
A10 い い え
仕 事 関 係 の 人 とは 仕 事 以外 で もっ きあ う こ と が 多 い
A11 は い
A12 い い え
A4
仕 事 関 係 で つ きあ って い る 人 に は 信 頼 で き る人 が 多 い A13 は い A14
い いえ
い いえ
です.そ
こ で,な
ん らか の 観 点 で そ れ を集 約 し た い とい うこ と で す.い
B の 区 分 の い くつ か を ま と め て,上
い か え る と,
位 区分 C を 設定 す る こ と
を考 え る の で す. 注 こ の表 に お い て は変 数 A の 方 が,い
くつ か の 質 問 に 対 す る回 答 区分 を列 記 した 形
に な って い ます が,そ れ ぞ れの 回 答 区分 に 対 す る数 字 を変数 と して扱 えば,A×Bの
形の
表 と な る とい う こ とです. 回答 区 分 に 対 応 す る変 数 の上 位 に 「質 問 項 目で 規 定 され る概 念」が あ る わ け で す が,そ の こ と を ど う扱 うか は,こ こ では ふ れ ませ ん. 区 分 に 定 義 上 の 階 層 構 造 が あ る場 合 は,表4.4.1と こ れ に 対 して,各
同 じ扱 い に な り ます.
区分 は 定 義 上 同 一 レベ ル に 並 ぶ も の で あ り,概 念 的 に は 上 位 区 分
を設 定 で き な い 場 合 が あ り ます が,そ
の 場 合 に も,デ ー タ の パ タ ー ン をみ て,た
とえ
ば, "相 互 に 類 似 す る区 分 を ま とめ る" とい う観 点 で 扱 うこ とが で き ます . こ の 形 の 分 解 は,例10と い る例10の
同 じ よ うに み え ま す が,区
場 合 と ちが って,こ
分 の仕 方 が論 理 的 に決 まって
の例 で は,
"区 分 の 仕 方 を デ ー タの 側 か ら見 出 す"
こ とに な りま す.し
た が っ て,種
々 の 集 約 法 に つ い て 情 報 量 を計 算 し,ロ ス の 少 な い
もの を見 出 す と い う試 行 錯 誤 を経 る こ とが 必 要 で す.
⑨ どん な方法 に よるにせ よ,B の上 位 区分 C が設定 された とすれ ば,分 解
が 成 り立 ち ます. し た が っ て,"類
似 し た も の を ま とめ る"と い う方 針 は,こ
の分解 式 の
"右 辺 の 第 二 項∑IA×B|Ckが小 さ くな る よ う に"
とい う量 的 な判 断 基 準 に お き か え る こ とが で き ます.こ か ら,縮 約 と よ ぶ こ と が あ りま す. そ う し て,
表4.4.7
表A×Bの
縮約
う い う意 図 を 入 れ た 集 約 で す
に よ っ て,集 約 の 有 効 性 を 評 価 で き ます. あ らゆ る組 み 合 わ せ を逐 一 チ ェ ッ ク して い け ば,
"R2が 最 大 に な る組 み 合 わ せ を見 出 す こ と"
が 可 能 で す. た だ し,そ れ を遂 行 し よ う と した 場 合,計 て も 実 行 で き な い ほ ど)の で,そ ます が,い
くつ か の 手 法 が 開 発 され て お り,ク
実 際 の 問 題 で は,あ
算 量 が 大 き く な る(コ ン ピ ュ ー タ を 使 っ
れ を減 ら す 工 夫 が 必 要 に な る な ど,問 題 が 残 っ て い
"い くつ か の 有 力 な候 補 に しぼ っ て,そ
こ と で,十
ラ ス タ ー 分 析 と総 称 され て い ます.
らゆ る ケ ー ス を あ た ら な くて も, の 中 で ベ ス トな もの を採 用 す る"
分 で す.
採 用 した 集 約 法 の 有 効 度 は,R2で 近 け れ ば,ま
た は,達
評 価 さ れ る わ け で す か ら,こ
し う る最 大 限 に 近 い と判 断 で き れ ば,よ
の 値 が 十 分 に 1に
し とす る の で す.
問題 4
問 1 プ ロ グ ラ ムCTA01Eは,構 て,分
成 比 の ち が い を 把 握 す る た め に,特
化 係 数 を使 っ
析 手順 を 進 め う る こ と を 説 明 す る プ ロ グ ラ ム で あ る.こ れ に よ っ て,4.1
節 の 説 明 を 復 習せ よ. こ の プ ロ グ ラ ム を 呼 び 出 し,そ ば,後
の 冒 頭 で 「テ キ ス トで 使 っ た 例 」を 指 定 す れ
は,自 動 的 に 進 行 す る .
問 2 次 の 表 に 示 す デ ー タ に つ い て,A
の 構 成 比 が B の 区 分 に よ っ て ど う ち が うか
を調 べ よ. CTA01Aと
そ れ に セ ッ トして あ る例 示 用 デ ー タ を 使 う と,構 成 比 と特 化 係 数
の 計 算 お よ び そ れ らの 図 示 を,CTA01Eで こ の 表 は,付
表4.A.1
間 3 プ ロ グ ラムCTA02Eは,4.3節
ラ ム で あ る.そ ま た,説
の テー マ であ る情報 量 につ い て説 明す るプ ロ グ
明 文 の 最 後 に,例
問 4 プ ロ グ ラ ムCTA02Eを 量 を計 算 し,表4.4.3に
問 5 表4.4.4に
住 民の 職 種 構 成
の 説 明 を よ め.
の 数 値 を入 力 し て,情
に 使 うに は,説
説 明 した順 に進 め る こ とが で き る.
表 F の 一 部 で あ る.
を 指 定 し て 計 算 す る よ う に な っ て い る.表4.1.3
報 量384.3が
得 られ る こ と を確 認 せ よ.
使 っ て,表4.4.2の
A, B, C, D につ い て そ れ ぞ れ の 情 報
示 す よ う に 分 解 で き る こ と を確 認 せ よ.こ
う い う計 算
明 文 を よ む こ と をバ イパ スす れ ば よ い.
つ い て,CTA02Eを
こ と を確 認 せ よ.
適 用 して,69ペ
ー ジに示 す情報 量分 解 が で き る
問 6 構 成 比,特 化 係 数 に よ る 分 析 に お い て,構
グ ラ ム がCTA03で
あ り,そ の 使 い 方 を例 示 す る プ ロ グ ラ ム がCTA03Eで
る.CTA03Eを
4.A.1で
使 っ て,そ
つ い て,構
数,お
析 表 を求 め よ.
の ま とめ 方 を採 用 し た 場 合 の 結 果(構 成 比,特
化係
よ び そ れ ら の グ ラ フ)お よ び そ の ま とめ 方 の 有 効 度 を 評 価 す る 情 報 量 分
プ ロ グ ラ ムCTA03と
問 8 表4.A.1は,付
そ れ に セ ッ ト して あ る例 示 用 デ ー タ を使 う こ と.
表 F の 一 部 で あ る.し た が っ て,そ
じ分 析 を行 な え.
そ の場 合,基
あ
意 し て あ る 例 題 は,表
成 比 の 類 似 し た 区 分 を 集 約 して 6区分 に ま と め る も の と
し て ま とめ 方 を想 定 し,そ
の 使 い 方 を 把 握 せ よ.用
あ る.
問 7 表4.A.1に
成 比 の 類 似 し た 区 分 を 集 約 し てA,
B の 関 係 を簡 明 に 表 現 す る こ とが 考 え られ る.そ の た め の 手 順 を ま とめ た プ ロ
礎 デ ー タ(区 の 数)が 多 い の で,コ
の 全 部 を使 っ て,問
7 と同
ン ピュー タの 画面 の上 で 区分
の仕 方 を 指 定 す る の は め ん ど う で あ る.そ れ を避 け る た め に,次
の順 に進 め る
こ と.
a. プ ロ グ ラ ムCTA01Aを
使 っ て,構
成 比 あ る い は特 化 係 数 の グ ラ フ を プ
リ ン トす る. 必
b. そ れ を み て,区
分 集 約 の 仕 方 を想 定 す る.
要 とあ れ ば,代 c. プ ロ グ ラ ムCTA04を
案 も い くつ か 想 定 し て お く. 使 っ て,そ
の プ ロ グ ラ ム の は じめ に 現 わ れ る 「ま
とめ 方 指 定 画 面 」で b で 想 定 した ま とめ 方 を キ イ操 作 で 指 定 す る. d. そ れ ぞ れ の ま とめ 方 に つ い て の 計 算 が 次 々 と行 な わ れ る.
5 ク ラ ス タ ー 分 析(2) ―質 的 デ ー タ を扱 う場 合
第 3章 で説 明 した ク ラス ター分 析 は,質 的 デ ー タを扱 う場 合 に も同様 に適 用 で きる こ と を説 明 します. ただ し,デ ー タの 取 り上 げ 方 あ るい は 結果 の よみ方 につ い て は,デ ー タの タイ プ の ちが い に 関 して 注意 す べ き点が あ り ます.
5.1 ク ラ ス タ ー分 析 の数 理(2) ① まず 第 3章 の 説 明 の 要 点 を ま とめ て お き ま し ょ う. N 個 の 観 察 単 位 に つ い て,そ
れ ぞ れ K 組 の 変 数 値(K 次 元 の デ ー タ)が 求 め ら れ
て い る と き,近 い デ ー タ を もつ 観 察 単 位 は 同一 区 分 に,離 の 区分 に な る よ う に 区 分 け を 定 め る 方 法 を,一 般 に,ク ク ラ ス ター 分 析 を 適 用 す る と き,区 分 数 を特 定 して,そ う ち,最
も よ い も の を見 出 そ う とす る 場 合 の 手 法 を,非
こ の 説 明 に お け る近 い,離 義 す るか な ど に よ っ て,さ
の 区 分 数 に な る 区 切 り方 の
階 層 的 手 法 とよ び ます.
よ び,最
も よ い とい う こ と を ど う定
ま ざ ま な 手 法 に わ か れ て い ます が,代
に 説 明 す る"K-means法"で ② K一means法
れ た と い う こ と,お
れ た 値 を もつ 観 察 単 位 は 別 ラ ス タ ー 分 析 と よ び ます.
表 的 な 手 法 は,以
下
す.
で 採 用 さ れ て い る 距 離 あ る い は 区 分 け の よ さの 定 義 は,基
タが 数 量 デ ー タ の 場 合 は 級 間 分 散,カ
礎 デー
テ ゴ リカ ル デ ー タ の 場 合 は 情 報 量 に 注 目 し ま
す. ③ ク ラ ス ター 間 の 距 離 を測 る と き,ク
ラ ス タ ー を代 表 す る位 置 と して 重 心,す
わ ち,包 含 さ れ る 各 観 察 単 位 の 値 の 平 均 値 を 使 い,代 距 離 と す る の がK-means法 これ に 対 して,ク て 考 え,そ
で す.こ
な
表値 間の 距離 をク ラス ター間 の
の テ キ ス トで は,こ
れ を説 明 し ま す.
ラ ス タ ー A の 各 メ ンバ ー と ク ラ ス ター B の 各 メ ン バ ー を 対 に し
れ らの う ち 最 も近 い 対 間 の 距 離(メ ン バ ー 間 の 距 離)を も っ て ク ラ ス タ ー
間 の 距 離 とす る方 法 な ど,い
くつ か の 案 が あ りま す.
図5.1.1
クラ ス ター わ け の 原 理
距 離 と して ユ ー ク リッ ド距 離,ク
ラ ス ター 代 表 点 と して 重 心 を使 う場 合
基礎 デ ー タ
代 表 点 か らの 距 離 は 7
区分 して そ れ ぞ れ代
X,Y の 観 察 値 7組 と
点 分 の 合 計 で …102
表 点 を定 め る と…19
代 表 点(5,5)
ま た,そ
れ らの い ず れ に よ るに して も,距 離 の 定 義 の仕 方 に い くつ か の 案 が あ りま
す. ④ 数 量 デ ー タの 場 合 は,ユ
ー ク リッ ド距 離 す な わ ち 次 に 定 義 す る 形 の 距 離 を使 い
ま した.
こ れ に 対 して,カ
テ ゴ リ カ ル デ ー タ の 場 合 は,距
の が あ り ませ ん が,前
章 で 説 明 した よ うに,特
離 の 定 義 に 関 して 多 数 説 を なす も
化 係 数 に も とづ く次 の 定 義 を採 用 し ま
し た.
⑤ こ の 節 で は,こ
れ ら 2つ の ケ ー ス の 対 応 関 係 を示 す た め に,双
方 に 共 通 す る概
念 を 同 じ記 号 で 表 わ す こ と を考 え ま し ょ う. そ の た め に,デ
ー タ数,そ
の 合 計,平 均 値 また は構 成 比 に 対 し て,次
こ と と し ます. 数 量 デ ー タの 場 合
デー タ全体 で み る場合 ク ラ ス ター 区 分 ご と に み る場 合
個 々の観 察 単位 につ いて み る場合 質 的デ ー タの場合 デー タ全 体 でみ る場合 ク ラス ター 区分 ご とに み る場 合 個 々の観 察単位 につ いてみ る場 合
の 記 号 を使 う
注 1 添 字 は,K
が 辺数,J が クラ ス ター 区分,I が観 察 単位 に対 応.
注 2 数 量 デ ー タの場 合NJI=1が
普通 だ が,質 的 デー タの場 合 と対 応 づ け るため に,こ
う表 わ し て お く.
⑥ こ れ ら を使 っ て,ま
ず,数
量 デ ー タの 場 合 の 偏 差 平 方 和 を 次 の よ うに 書 き換 え
ま す.
質 的 デ ー タ の 場 合 の 偏 差 平 方 和(情 報 量)も,同
様 な 形 に か く こ とが で き ま す.
こ こ で,
数 量 デー タの場 合 は 質的 デー タの場 合 は と お く と,ど ち ら の 場 合 の 偏 差 平 方 和 も,
と表 わ す こ とが で き ます.ま
で す.記
号 は,数
間偏 差 平 方 和SB=ST‐Swは
量 デ ー タ の 場 合 に あ わ せ て あ り ます .
こ れ に よ っ て,関 も,カ
た,級
数 F(X,Y)の
定 義 が ち が う点 を 別 に す れ ば,数
テ ゴ リカ ル デ ー タ の 場 合 も,同
こ の 関 係 式 を使 っ て,数
量 デー タの場 合
じ形 に な っ て い る こ とが 確 認 され ま し た,
量 デ ー タ の場 合 は偏 差 平 方 和,質
的 デ ー タの 場 合 は 情 報 量
を 距 離 と して 採 用 す る と,分 散 分 析 の観 点 で統 一 し て 説 明 で き る こ とに な り ます. ク ラ ス ター は,
級 内 偏 差 平 方 和(情 報 量)SBを
最 大化 す る
よ う に構 成 し ます. STは 一 定 だ か ら,"決 で き ま す.し
定 係 数R2=SB/STを
たが っ て,多
決 定 係 数 に よ っ て,分
を 測 る こ とが で き ま す.
最 大 化 す る こ と"と い い か え る こ と が
くの 手 法 と同 様 に, 析 の 有 効 性(こ の 場 合 は,ク
ラス タ リングの有 効 性〉
この最 大化 を達 成す るには,観 察単位1を 区分aか 化⊿SBが
で 表 わ され る こ と を利 用 し て,⊿SBが 移 動 を 実 行 す る,そ
う して,移
らbへ うつ した場合 のSBの 変
最 大 の1,α, bを 求 め て,そ
動 後 の Ⅳ,Tを
れ が 正 な ら,そ
の
求 め る … こ の ス テ ッ プ を く りか え す
形 の 逐 次 近 似 計 算 を 採 用 す る こ とが で き ます. 上 掲 の 距 離 を 採 用 し た場 合,こ ⑦ 次 に,こ 表5.1.2に
の 逐 次 近 似 計 算 に よ っ て解 が ユ ニ ー ク に定 ま ります.
の 逐 次 近 似 計 算 の 例 を示 して お き ま し ょ う.
示 す10の
区 分BJで
の観 察 値 筋
の 構 成 比 を 参 照 し て,3つ
の クラ ス
ター 区 分 を見 出 す も の と し ます.
表5.1.2
仮 想 例
こ の 例 の 場 合 の 計 算 手 順 は,表5.1.3の
よ うに 進 行 し ま す.
区 分B1,B2,,B3,…
ま とめ る も の とす る と,級 間 偏 差 平 方 和 は
55,25と
, B10を1231231231と
な り ま す.も
の 余 地 が あ り ま す,ま を調 べ る と,3に
ち ろ ん,こ ずB1を1の
ま まに す る か,2あ
る い は3に
う つ した ら ど うか
うつ す 場 合 に 級 間 偏 差 平 方 和 の 増 加 が 最 も大 き い の で,1331231231
と改 め る こ とに し ま す.以 に,3331321231と
れ は,「 仮 に そ う した ら」 とい うこ と で す か ら,改 善
下,表
に 示 す 順 に 検 討 を つ づ け て い く と,16ス
ま とめ れ ば 級 間 偏 差 平 方 和 が279.04と
な い こ と が わ か り ます.
テ ップ 後
な り,そ れ 以 上 は 改 善 で き
よ っ て,こ
れ が,最
適 な ク ラ ス ター 区 分 で す.
⑧ こ の 例 に つ い て,扱 表5.1.2に
い 方 を か え る こ とが 考 え ら れ ま す.
お け る 区 分A1,A2, A3が
れ あ る項 目 に 対 してYesと
1つ の 質 問 に 対 す る 回 答 区 分 で な く,そ
回 答 し た 人 の 数 を 示 す もの と し ま し ょ う.質
表5.1.3
れぞ
問 した 対 象
逐 次近似計算の経過例
(1) 逐 次 近 次 計 算 の 初 期 値 と,そ の 区 分 に 対 す る級 内変 動 (2) デ ー タ 1を 区 分 1か ら 2へ うつ した 場 合 の 級 内変 動 の 変 化 が15.59
デ ー タ 1を 区 分 1か ら 3へ うつ した 場 合 の 級 内変 動 の 変 化 が20.27
この 変 化 の大 きい 移 動1→3を
(3) デ ー タ 3は,ど (4) デ ー タ10ま
実行
ち らに うつ して も級 内 変 動 の 変 化 は 負,よ
っ て 移 動 しな い
で検 討 した ら,そ の と きの状 態 と級 内 変 動 を表 示 して,2 巡 目に 入 る
(5) 2巡 目の 途 中 だ が,「 移 動 し な い」 とい う結 果 が10デ れ 以 上 っ づ け て も変化 しな い.よ
っ て,最
ー タに っ い て つ づ い た ら そ
後 の 状 態 を表 示 して,計
算 を終 了
者 数 は い ず れ も120人 こ の 場 合,表5.1.4の
と し ます. よ うに,Yesと
表5.1.4
答 え な か っ た 人 の 数 を つ け 加 え る と,3 種 類
仮想例の変形
表5.1.5 逐 次近似計算の経過例
の 構 成 比 を 列 記 した 表 だ と み る こ とが で き ま す. 表 の 構 成 が ち が い ま す が,ク 表5.1.5が
ラ ス タ ー 分 析 の 手 順 は 同 じで す.
こ の 例 に つ い て の 逐 次 近 似 計 算 の 進 行 例 で す.
ク ラ ス タ ー 区 分 は3331322231と ⑨
表5.1.4の
せ よ と い う結 果 で す.
計 欄 を 除 き,各 項 目 のYesの
同 じ に な り ま す.し
計 数 だ け を 表 示 す る と,表5.1.2と
か し,デ ー タ の 構 造 が ち が い ま す.
そ の ちが い を 意 識 せ ず,表5.1.2と
同 じ扱 い を す る と,誤 っ た 結 果(3331321231)
に な っ て し ま い ま す. 手 法 を 適 用 す る と き に,デ
ー タ の 構 造 を 考 え て,そ
れ に適 した使 い方 を しま しょ
う. これ は,そ
う い う誤 用 の 例 です.
⑩
ク ラ ス タ ー 分 析 の 数 理 は,質
が,具
体 的 な 問 題 に 数 理 を適 用 す る と き に は,デ
的 デ ー タ の 場 合 も数 量 デ ー タ の 場 合 も 同 じで す
れ ば な ら な い 注 意 点 が い くつ か あ りま す.ま タ 構 造 の ち が い に 応 じて,適
ー タの ち が い に 関 係 し て 区 別 し な け
た,質
的 デ ー タ の 場 合 に 限 って も,デ ー
用 の 仕 方 をか え るべ き場 合 が あ りま す.
⑪ カ テ ゴ リ カ ル デ ー タ は
「調 査 事 項(ア イ テ ム)」 と
そ の 「回 答 区 分(カ テ ゴ リー)」に 対 応 す る観 察 値
に な っ て い ま す.デ
ー タの 意 味 か ら い う と,1 つ の ア イ テ ム に 対 応 す る複 数 の カ テ ゴ
リー 区 分 に 対 す る観 察 値 を 1つ の セ ッ トと して 扱 うべ きで す が,形
式 的 に は,各
カテ
ゴ リー 区 分 に 対 す る観 察 値 を そ れ ぞれ 1つ の 変 数 と し て 扱 っ て い ま す. 一 般 に は そ の こ と を意 識 す る 必 要 は な い の で す が,複 イ テ ム)を 扱 う と きに,注
数 の 変 数(質 的 デ ー タ で は ア
意 を要 す る 点 が 出 て き ます.
数 量 デ ー タ の 場 合 に つ い て,3.2節
で 注 意 し た よ うに,
そ れ ぞ れ の 変 数 の 分 散 の ちが い を そ の ま ま の 形 で 使 うか ,
そ れ と も,分 散 を そ ろ え て 使 うか
とい う選 択 肢 が あ り ま す . 質 的 デ ー タ の 場 合 に も,ア
イ テ ム に よ っ て 対 象 者 数 が ち が う場 合(比 率 の 分 母 が ち
が う場 合),
対 象 者 数 の ちが い を その ま ま の 形 で 使 うか ,
そ れ と も,そ
の ち が い を そ ろ え て 使 うか
と い う選 択 肢 が あ り ます(5.2節
と5.3節
で こ の ち が い を例 示).
ま た,
回答 を,重 複 を 許 す 形 で求 め て い る 場 合 の 扱 い
に つ い て も 同 様 な 選 択 肢 が あ りえ ま す.⑨
で 説 明 し た 形 で,そ
れ ぞれ の 回答 肢 を項
目 とみ な し,「 そ れ を あ げ たか ・あ げ な い か 」 を カ テ ゴ リー 区 分 と し て 扱 うの が ひ とつ の 方 法 で す が,「 計 が 一 定 」 と い う 条 件 を も た な い の で,各
項 目をあ げ た 人の 割合 と
して,数
量 デ ー タ と して 分 析 す る こ と も考 え ら れ ます.
数 量 デ ー タ で あ っ て も,い
くつ か の 変 数 値 の 合 計 を考 慮 に 入 れ て,そ
成 比 扱 い す る こ とが 考 え ら れ ま す.そ
の場 合,構
れ に 対 す る構
成 比 の 形 を と っ て い る こ とか ら質 的
変 数 と 同 じ扱 い に す る こ と も,基 礎 デ ー タの 性 質 に 注 目 して 数 量 デ ー タ 扱 い に す る こ と も考 え ら れ ます(5.4節
で こ れ らの 扱 い に つ い て例 示).
⑫ 数 量 デー タ の 場 合,観
察 値 は個 々 の 観 察 単 位(ひ と りひ と りの 個 人,ひ
とつ の 企 業 な ど)に 対 応 す る 情 報 だ と し て 説 明 し,質 的 デ ー タ の 場 合 は,い 観 察 単 位 か ら な る集 団 に 対 応 す る 情 報 だ と して 説 明 し て き ま した が,こ
とつ ひ くつ か の
の ちが い は,
必 然 性 は あ り ませ ん. 数 量 デ ー タ を い くつ か の 観 察 単 位 を もつ 集 団 区 分 別 に 集 計 して得 ら れ る平 均 値 に お きか え て扱 う こ と も考 え られ ま す. 質 的 デー タ を,ひ
とつ ひ とつ の 観 察 単 位 の 情 報 の 形 で 扱 う こ と も考 え ら れ る の で
す. ⑬ そ の 意 味 で は 同 じ で す が,質
的 デ ー タ の 場 合 「構 成 比 の 形 に 表 現 しな い と 対 比
しに くい 」こ と か ら,個 別 デ ー タ の レベ ル で 扱 う よ り も 「集 団 区 分 別 の 集 計 デ ー タ 」 の 形 で 扱 う こ と が 多 い の で す. し た が っ て,
個 別 デー タ → 集 計 →
集 団 区 分 に 対 応 す るデ ー タ →
ク ラス ター 分 析
とい う過 程 を 経 ま す. した が っ て,集
計 さ れ て い る集 団 区 分 の 上 位 概 念 に あ た る 区 分 を 見 出 す 形 で 情 報 の
縮 約 を考 え る か , そ れ と も,概 念 的 な 上 位 区 分 と い う こ とに こ だ わ らず も っ ぱ ら デ ー タ の特 性 の 類 似 性 を考 え て 情 報 の 縮 約 を考 え る か とい う選 択 肢 が 必 要 で す. ⑭ 数 量 デ ー タ を集 団 区 分 に 対 応 す る集 計 値 に お きか え た 場 合 に つ い て も,同 様 で す.
5.2 例 ―
人 づ き あ い に関 す る 意 識
① 4.4節 で 取 り上 げ た 「人 づ き あ い に 関 す る 意 識」の 地 域 差 を み る 問 題(例 つ い て,ク
3)に
ラ ス ター 分 析 を適 用 し て み ま し ょ う.
基 礎 デ ー タ は,質 的 デ ー タ で す が,
7つ の 質 問 に対 す る 回 答 を列 記 し た形
に な っ て い ます . どの 質 問 も
す べ て の 対 象 者 に質 問 さ れ る 形 に な っ て お り,
回 答 肢 が 「は い 」,「い い え 」の い ず れ か を選 択
させ て い ます. 「は い 」の 数 と 「い い え 」の 数 が 対 象 者 数 で あ る とす れ ば,そ
の 一 方 だ け を 取 り上 げ
る こ とに して よ い で し ょ う(後 で こ の 扱 い に 関 す る 問 題 点 に ふ れ ま す)が,「 い 」 と 「無 回 答 」が 若 干 あ り ます か ら,こ
わ か らな
こでは
「は い 」の 数 と 「い い え 」の 数 を み る
もの と し て,延 べ14区 こ の14区
分 の デ ー タ を 扱 う こ とに し ま す.
分 の デ ー タ を参 照 して,そ
の ちが い に よ っ て47県
を タイプ わけす るこ と
を考 え るの で す. こ の こ と は,「 そ れ ぞ れ の 項 目 の 回 答 数 の 計 」が 項 目に よ っ て ち が う こ と を 意 味 し ます.こ
の 節 で は,こ
の こ と を考 慮 に 入 れ ず に 扱 い ま す(次 節 で こ の 扱 い に 関 す る 代
案 を示 し ま す). ② 次 の 図5.2.1が 内 容 に 入 る前 に,ま
そ の 出 力 で す. ず,数
量 デ ー タ の 場 合 の 出 力 形 式(た と え ば 図3.2.1)と
み ま し ょ う.
図5.2.1
プ ロ グ ラムCLASSの
出力
比べて
扱 うデ ー タ の ち が い に 対 応 して,「 平 均 値 」,「偏 差 値 」の とこ ろが 「 構 成 比 」,「特 化 係 数 」に か わ っ て い ま す が,「 平 均 値 」,「構 成 比 」が 情 報 を表 現 す る 指 標 で あ り,「 偏 差値 」,「特 化 係 数 」が そ の 差 異 を よ む た め の 指 標 で あ る こ と を考 え れ ば,同
じ出力形
式 だ と了解 で き ま す. し たが っ て,差
異 を よむ ため の ク ラ ス ター 特 性 表 は,同
じ よ う に よむ こ とが で き ま
す. ③ 図5.2.1に
よ っ て 結 果 を み て い き ま し ょ う.
こ の 例 で は,特 化 係 数 が 1に 近 い と こ ろ が 多 い こ とに 注 目 し ま し ょ う.標 おけ るマ ー ク 区 切 りで は ほ とん どす べ て の 箇 所 が 「・ 」 と な るの で,ク を識 別 で き ませ ん.こ 1.1以 上:
の た め,区
切 り をか え て
+, 0.9以 下:
と し て い ま す か ら,「+」
−
や 「-」 の 箇 所 が 現 わ れ て い ま す が,「 差 の 少 な い 箇 所 」で あ
る こ とに は か わ りあ りませ ん.し
た が って,結
果 の 解 釈 も控 え め に し ま し ょ う.
は っ き り と し て い るの は ク ラ ス ター 区 分 3,ク ラ ス ター 区 分 4で+マ ク ラ ス タ ー 区 分 6で―
ー クが 多 く,
マ ー クが 多い
こ と で す. 調 査 項 目 と回 答 区 分 に お きか え て い う と,ク Q3…C1:つ
Q4…C1:信
ラ ス ター 3は
きあ っ て い る親 戚 は 多 い
C2:
・
少 ない
+
頼 で きる人は 多い
C2
・
少ない
十
とい う 「 親 戚 づ き あ い の希 薄 さ」 を示 す 地 域 で す. ク ラ ス タ ー 4 もQ3,Q4の
Q3…C1:つ
部 分 は,
き あ っ て い る親 戚 は 多 い
C2: Q4…C1:信
頼 で きる人 は多 い
C2:
Q5…C1:近
・
少 ない
Q6…C1:信
少 ない 頼 で きる人は 多 い
C2:
+
らに
所づ きあい は多 い
C2:
・
少 な い +
と同 じパ タ ー ン に な っ て い ま す が,さ
準出 力に
ラス ターの特 徴
少ない
+
+
とい う 「近 所 づ き あ い の 希 薄 さ 」も み ら れ る地 域 です. 各 ク ラ ス タ ー に 包 含 され る地 域 を み る と,
ク ラ ス タ ー 4は,埼
玉 ・東 京 ・神 奈 川 ・愛 知 ・大 阪
ク ラ ス ター 3は,千
葉 ・滋 賀 ・京都 ・兵 庫
と,大 都 市 とそ の 周 辺 で あ り,上 記 の 特 徴 と符 合 して い る とい っ て よ い で し ょ う. こ れ 以 外 の 特 徴 は よ み と り に く い よ う で す.③ に 近 い の で,解
に 注 意 し た よ うに,特
化 係数 が 1
釈 は こ こ ま で に し て お き ま し ょ う.
④ た だ し,こ の 種 の デ ー タ の よ み 方 に 関 す る 一 般 的 な 注 意 点 を 説 明 し て お き ま し ょ う. こ の 回 答 パ タ ー ン に つ い て 説 明 を 加 え る と き,「 … で す か 」に 対 す る 答 え 「No」 の 解 釈 に は 注 意 を 要 し ます. た と え ば,項
目 2の カ テ ゴ リー 2は,「 親 戚 づ き あ い は 多 い か 」 と い う問 い に 対 し
て 「No」 と答 え た ケ ー ス で す が,こ か え て よ い と は 限 り ま せ ん.た
れは 「 親 戚 づ き あ い が 少 な い 」こ と を示 す と よ み
と え ば,こ
れ まで 多か った 状 態 が か わ った た め に
「No」 と答 え た の だ と も解 釈 で き ま す. ま た,次
の 「 信 頼 で き る 人 は 多 い で す か」 と い う 問 い に 「No」 と答 え た 人 が 多 く
な っ て い る こ と と あ わ せ て 解 釈 す る と,「 つ き あ っ て い るの に 信 頼 して い な い 」 と い う の は 受 け 入 れ に くい で し ょ う.つ い 」で あ っ て,信
き あ い が 多 い と い っ て も 「し き た り上 の つ き あ
頼 して い る わ け で は な く,あ
は な い 」 とい う意 味 で 「No」 と な っ た …
ら た め て 聞 か れ る と 「そ う い う わ け で
こ う解 釈 で き そ うで す.
「… で す か 」に 対 す る 答 え 「Yes」 の 方 で は こ うい う潜 在 意 識 が 引 き 出 さ れ ず,答
え
「No」 の 方 で差 が 認 め られ る と い う結 果 に な っ て い る の で し ょ う. ク ラ ス タ ー 区分 別 に み る と,ク
ラ ス ター 3は,親
を も っ て い るが ゆ え に,(・,+,・,+)
戚 づ きあ い に 関 して こ う い う意 識
の 形 に な っ た の で あ り,ク
ラ ス ター 4は,親
戚
づ き あ い に 関 して も近 所 づ き あ い に 関 して も こ うい う意 識 を も っ て い る が ゆ え に(-, +,-,+)
の 形 に な っ た の で し ょ う.
こ うい う状 態 に な っ て い るの は,東
京 ・大 阪 お よ び そ の 周 辺 で す.
た だ し,千 葉 ・滋 賀 ・京 都 ・兵 庫 が,「 近 所 づ き あ い に つ い て は こ の パ タ ー ン に な っ て い な い ク ラ ス タ ー 3」に 含 ま れ て い ます. し た が っ て,東
京 と大 阪 の ち が い で は な く,大 都 市 お よ び そ の 周 辺 の 特 徴 に よ っ て
2つ の ク ラ ス ター が 形 成 さ れ た とい う結 果 で す. こ れ らの ク ラ ス ター 以 外 に つ い て は,ク
ラ ス タ ー の 特 徴 を 説 明 し に くい よ う で す.
特 化 係 数 が 1に 近 い と こ ろ を 細 か く区 切 って マ ー キ ン グ し た こ と も あ り ま す が,基 的 に は 回 答 が わ か れ に くい 質 問 に な っ て い る こ と も あ り ま す.た て い る 人 が 多 い,当
本
と え ば,「 つ き あ っ
然 信 頼 で き る 人 が 多 い 」 とか 「つ き あ うの が 当 然 だ か ら つ き あ っ
て い る」 と い う状 態 の 地 域 の 人 々 に と っ て は,「 当 然 の こ と を あ ら た ま っ て 聞 か れ て い る」の で,大
きい地 域 差 は 出 な い …
こ う解 釈 す る と,ク
「わ ず か な 差 に よ っ て わ か れ た の で あ り,と
ラ ス ター 1,2,5 な どは
りた て て 差 を 論 ず る こ とは な い 」 と し て
よ い で し ょ う. ⑤ こ の よ う に 考 え る と,例 る よ り も,
3の 問 題 に つ い て は,全
国47県
と比較 範 囲 を ひ ろげ
こ う い うこ とが 意 識 さ れ て い る東 京 ・大 阪 周 辺 に 注 目 し て,
その範 囲 で分析 す るこ と
が 妥 当 で し ょ う.さ
ら に,
都 市 化 に よ っ て そ うい う変 化 が 起 き た の な ら,
県 内 で の 地 域 差 を 細 か くみ る た め に 地 域 区 分 を細 分 す る
とか,
年 齢 区分別 に わけ てみ る
な ど を考 え る と よ い で し ょ う. ⑥ 現 象 を説 明 す る た め に 異 な っ た様 相 を識 別 す る に は,基 礎 デ ー タ の 選 び 方 が 重 要 で あ り,そ れ を よ く考 え て 「分 析 計 画 を た て る こ と」が 重 要 だ …
こ の 例 を 取 り上
げて いい たか った こ とです.
5.3 複 数 の デ ー タ の 結 合―
質 的 デ ー タ の場 合
① 前 節 で は 「人づ き あ い に 関 す る意 識 」に 関 す る 7つ の 質 問 項 目 の 情 報 を,各
項
目 の 回答 区 分 を列 記 す る形 で扱 い ま した. こ の 節 で は,こ
の 扱 い に 対 す る代 案 を考 え ま し ょ う.
簡 単化 したモ デル でい うと
の 形 の 2つ の 情 報 を 5.2 節 の 扱 い
の 形 に 結 合 し て 扱 っ て い た の で す. し た が っ て,「NAを
除 く」 とい う措 置 と,そ の た め に 各 項 目の 回 答 数 の 計 が 異 な
る結 果 と な っ た も の を 「計 の ち が い を考 慮 せ ず に 合 算 す る」 と い う措 置 と を採 用 し た こ と に な る の で す. ② 「計 の ち が い を考 慮 し な い 」扱 い を採 用 す る と,そ
れ ぞ れ の 「計 の 数 の 大 小 に
よ っ て 区 分 け に 対 す る寄 与 が 異 な る」こ と に な り ます . し た が っ て,各
項 目 を 対 等 に 扱 う とい う観 点 で は,「 そ れ ぞ れ の 項 目 ご との 計 をそ
ろ え た 上 で 合 算 す る」こ とが 考 え ら れ ま す.す うに す るの で す.
な わ ち,5.2節
の扱 い をか えて 次 の よ
③ 次 は,こ
の 扱 い を した 上 で クラ ス ター 分 析 を適 用 し た結 果 です(図5.3.1).
④ 度 数 の 欄 に お い て,「 同 一 項 目 の 2つ の 区 分 の 度 数 の 計 」が ど の 項 目 で も同 じ に な っ て い る こ とを 確 認 し て くだ さ い.し
た が っ て,延
べ 回答 数 は,各
項 目の 回答数
(=対 象 者 数)× 項 目数 と な り ます. 構 成 比 は,回
答 延 べ 数 に 対 す る比 と して 計 算 され ます.回
は あ りま せ ん が,そ
答 者 数 に 対 す る構 成 比 で
れ に 比 例 して い ます か ら,特 化 係 数 に した 場 合 に は,回
答者数 に
対 す る構 成 比 に つ い て 計 算 し た 特 化 係 数 と一 致 し ま す. ⑤ 誘 導 さ れ た ク ラ ス ター 区 分 の構 成 を前 節 の 場 合 と比 べ る と,表5.3.2の
図5.3.1
プ ロ グ ラ ムCLASSの
出 力(質 的 デ ー タ の場 合)
よ うに
表5.3.2
2つ の 扱 い方 に よ る ク ラ ス ター の 構 成 比較
表5.3.3
2つ の 扱 い方 に よ る ク ラ ス ター の特 性 比 較
な っ て い ま す.
4番 目 の ブ ロ ッ ク に示 す よ うに,
図5.2.1の
区 分 1,図5.3.1の
図5.2.1の
区 分 5,図5.3.1の
の 間 に 若 干 の 出 入 りが あ る もの の,よ ま た,各
区分 6 区分 4 く合 致 して い る と い う結 果 で す.
区 分 の 特 性 に つ い て も,表5.3.3の
よ う に よ く合 致 して い ま す が,上
掲の
メ ン バ ー の 出 入 りが,「 職 場 の 人 間 関 係 」に 関 す る ち が い に よ っ て 起 こ っ て い る こ と に 注 目 し ま し ょ う.NAが
多 い の で,図5.2.1の
扱 い と図5.3.1の
扱 い で ちが い が 出
るべ き 項 目 で す.予
想 ど お り,2 つ の 扱 い の ち が い が 起 きて い る も の と 了 解 で き ま
す, ⑥ そ れ に し て も,大
きな ち が い が 出 な か っ た の は,②
に 示 した モ デ ル で い う と,
比 較 範 囲 か ら外 したNAの 数 が 少 な か っ た た め で し ょ う. 一 般 に は ,「NAを 落 と し た こ との 影 響 」 と 「各 項 目 の 対 象 者 数 が 異 な る こ と の 影 響 」が 重 な っ て,2
とお り の 扱 い の 結 果 が ち が っ て くる の で,ど
ち らの 扱 い を採 用 す
る か を考 え る こ とが 必 要 で す. ⑦ こ れ ら以 外 の 場 合 もあ り え ます か ら,そ れ ら を含 め て,考
え られ る扱 い方 を あ
げ て お き ま し ょ う(表5.3.4). 扱 い A は,ど 項 目 と も,同 す.し
の 項 目 に つ い て も,3 つ の カ テ ゴ リー の デ ー タ を 使 う場 合 で す.各
じ対 象 者 に つ い て 調 査 して い る もの とす れ ば,計
の数 字 は 同 じにな りま
た が っ て,2 つ の 項 目 の 情 報 を,対 等 に 結 合 した こ とに な っ て い ま す.
扱 い D で は,3 つ の カ テ ゴ リー の う ちNAを 項 目に お け る 回 答 者 数T1,T2が 扱 い B で は,NAを
除 く 2区 分 を 使 っ て い ま す か ら,各
異 な る こ と に な り ます.こ
れ が5.2節
除 く と い う 点 で は 扱 い C と 同 じ で す が,各
計 が 共 通 の 値 T に な る よ う換 算 して い ます.こ
れ が,5.3節
の 扱 い で す.
項 目の 回 答 者 数 の
の 扱 い で す.
扱 い C は,B と同 じデ ー タ を 取 り上 げ て い ます が, X11+X12やX21+X22が T と 一 致 し な い こ と に 対 す る調 整 を しな い 場 合 で す .こ の 扱 い で は,計 と 内 訳 の 差 と して NAの
情 報 を 間 接 的 に 使 っ た こ とに な りま す が,ク
で は 使 わ れ ませ ん.い NAの
い か え る と,NAの
ラ ス ター 区 分 を決 め る た め の 比 較
情 報 を 落 と し た 扱 い D ま た は 扱 い B と,
情 報 を考 慮 に 入 れ た 扱 い A の 中 間 に あ た る 扱 い で す.
こ の よ う な 扱 い 方 が あ り う る の で す が NAを
無 視 で き な い と判 断 さ れ る場 合 は,扱
NAを
無 視 で き る と判 断 さ れ る場 合 は,扱
を使 う,た
い A
い D
だ し,そ の 扱 い を した 場 合,T1, T2の ち が い が 結 果 に ひ び くこ と を避 け る
た め に(各 項 目 を対 等 に 扱 う た め に)扱 い B を 使 う こ と を 考 え る …
こ う 了解 しま
し ょ う.
表5.3.4
各 項 目の 回 答 がYes,No,NAに を 区 別 して い るが,各 *:補
3区 分 さ れ て い る と き,各 区分 の 扱 い 方 に 関 して 4とお り
区 分 の デ ー タ の 扱 い 方 を 次 の 記 号 で 表 記 して い る.():使
正 を加 えて い る.
わ な い,
⑧ NAと
し た と こ ろ が 「ど ち ら と も い え な い 」 と い う 「Yes, Noに
あ る と き に は,扱
い A で し ょ う が,両
並 ぶ 区 分 」で
極 端 の 答 え を 対 比 す る と い う意 味 で,扱
い D
や B を適 用 す る こ と も考 え られ ます.
5.4 例―
食 生 活の 地 域 差(構 成 比 で 表 わ して 比較)
① こ れ ま で何 回 か 取 り上 げ て い る例(例
2)で す が,こ
こ で は,3.2節
と 同 じ12
費 目の 支 出 金 額 の デ ー タ に つ い て,「 食 費 支 出 総 額 に 対 す る構 成 比 」の 形 に し て,そ の ち が い を説 明 す る ク ラ ス ター を求 め て み ま し ょ う. そ の 結 果 は5.2節
の例 と同 じ形 式 で 出 力 さ れ ま す(以 下 で は C 扱 い と 略 称)が,こ
こ で は そ れ を 省 略 し て,得
られ た ク ラ ス タ ー 構 成 を3.2節
の 扱 い を し た場 合(以 下 で
は Q 扱 い と略 称)と 比 べ て み ま し ょ う(図5.4.1). ② ど ち ら も 5区 分 と して ク ラス タ ー を 求 め て い ま す が,メ
ンバー構 成 に よって対
応づ け て み る と, Q 扱 い の 場 合 の クラ ス ター 1は,C
扱 い で は ク ラ ス タ ー 2に 対 応
して い ま す が, Q 扱 い の 場 合の クラ ス ター 5 と 2が,C Q 扱 い の 場 合 の クラ ス ター 3 と 4が,C
図5.4.1
扱 い で は 1つ に ま と ま っ て お り, 扱 い で は 3つ に 組 み 替 え ら れ る
食 費 支 出パ ター ン の 地 域 比 較
Q 扱 い を した場 合(左 側)と
C 扱 い し た場 合(右 側)の 比較
形 に な っ て い ます. ③ こ う い う組 み 替 え が ど う し て起 こ っ た か を み る た め に,ク
ラ ス ター 分 析 が 出 力
し た ク ラ ス タ ー 特 性 パ ター ン を 図 中 に 示 して あ りま す. こ の ち が い を考 慮 に 入 れ ま し ょ う. ま ず,2 つ が 3つ に 組 み 替 え られ た とこ ろ を み る と
パ タ ー ン が 著 し く ちが う 「ク ラ ス ター 3」 と
「ク ラ ス ター 4あ る い は 1」に 分 割 さ れ て い る
と い う結 果 で す. こ れ は,C 扱 い で は 構 成 比 の 形 に して い る ため,
す べ て の 費 目で 大 き い値 を 示 す パ ター ン(ク ラ ス タ ー 3)と す べ て の 費 目で 小 さ い値 を示 す パ ター ン(ク ラ ス ター 4)と す べ て の 費 目が 平 均 並 み の 値 を示 す パ ター ン(ク ラ ス タ ー 1)と
が わ か れ た の で す. い い か え る と, 支 出全 体 の 規 模 の ちが い を考 慮 し な い 形 に し て 扱 っ た た め, そ の ちが い が効 い て わ か れ て い た も の が 1つ に ま と ま り, 構 成 比 の ち が い の 方 で わ け られ た と い う こ と で す.C
扱 い した場 合 の 結 果 を み る と,こ れ ら の3つ
の ク ラ ス タ ー は,変
数 3(肉)と 変 数 9(加工 食 品)で の 差 に よ っ て 三 分 さ れ て い る こ とが わ か りま す. Q 扱 い で は,変
数 9が+,12(外
食)が+と
い うちが いに よって 二分 され て いた 2
つ の ク ラ ス タ ー は,C 扱 い の 場 合 に は 1つ に ま と ま っ て い ま す.こ (=収 入 総 額)と の 関 係 で わ か れ て い た も の が,ど
れ は,支
出総額
ち ら も構 成 比 で み る と値 が 小 さ い た
め に わ か れ な くな っ た の で し ょ う. ④ 以 上 を ま とめ る と,2 とお りの 扱 い に よ っ て 結 果 が ち が っ て くる が,各
変数 を
そ れ ぞ れ 切 り離 して 扱 っ た 場 合 に は 値 の 小 さ い変 数 が 効 き,「 加 工 食 品や 外 食 へ の 依 存 度 の ち が い 」が 見 出 され た,こ
れ に 対 して,各
変数 の相 対 比 として扱 った場 合に は
値 の 大 き い 変 数 が 効 き,「 肉 と魚 へ の 支 出性 向 」が 見 出 さ れ た と い うこ とで す. ⑤ こ の こ とは,「 食 費 支 出 の 構 成 比 」 と 「全 体 と して の 支 出 規 模 」の 両 面 を み よ, と い う こ と で す. ⑥ そ こ で,次
の よ う な分 析 計 画 が 考 え られ ます.
区 分 け の 参 考 とす る変 数 と して 支 出 総 額 T と12区 こ の 場 合XI
とT の 変 数 の タ イ プ が 異 な る,そ
る で し ょ うが,質
分 別 構 成 比XI(I=1,…
,12)と を一 緒 に 使 う れ で よい のか とい う問題 提 起 が あ
的デー タの場合 の構成 比 とちが って
も と も と数 量 デ ー タ で あ る もの を,ト ー タ ル に 対 す る 相 対 比 で み る
とい う意 味 で の 構 成 比 に つ い て は,
数 量 デ ー タ と して 扱 っ て もか ま わ な い の で す. い い か え る と,構 成 比 は 値 域 が 0,1の 範 囲 に 限 定 さ れ て い る と い う意 味 で C 扱 い す る とい う扱 い方 と 0,1 に 近 い 値 を重 視 せ ず そ の 中 間 の 値 に 注 目す る とい う意 味 で Q 扱 い す る とい う扱 い 方 を選 択 す る の だ と了 解 で き ます .
問題 5
問 1 プ ロ グ ラムCLASSH2は
質 的 デ ー タ に つ い て 種 々 の 扱 い 方 を適 用 して 結 果 を 比
較 す る プ ロ グ ラ ム で あ る.こ
れ を指 定 す る と,次 の メ ニ ュ ー が 表 示 さ れ る.
扱 い方
1… 標 準
2… 対 象 者 区 分 の サ イ ズ 差 調 整
3…MA扱
い
9…逐 次 近 似 計 算 の初 期 値 指 定 こ こ で 1を指 定 し て,表5.1.2に 出 す 経 過 が 表5.1.3の
基礎 デ ー タ は,プ
問 2 表5.1.4は て,各
示 す デ ー タ に 対 し て 最 適 な ク ラ ス ター を 見
よ う に 進 む こ と を確 認 せ よ. ロ グ ラ ム の 中 に セ ッ トさ れ て い る.
表5.1.2の
3カ テ ゴ リー の 数 字 がMAの
形 で求 め ら れ た場 合 に お い
カ テ ゴ リー を あ げ た 人 の数, あ げ な か っ た 人 の 数 を列 記 す る 形 に 表 わ し
た もの で あ る.こ
の 扱 い を し た 場 合 の ク ラ ス タ ー 分 析 の 経 過 が 表5.1.5の
に 進 行 す る こ と を 確 認 せ よ.問
よう
1 と 同 じ プ ロ グ ラ ム が 1,2,3,9 の順 に進 行 す
る. 問 3 表5.A.1は,本
文 の 表5.1.2に
お け る観 察 単 位 数 が 区 分 に よ っ て 異 な る こ と に
よる影響 を消去す るために 「 観 察 単 位 数100あ
た りに 換 算 」 し た もの で あ る.問
1の プ ロ グ ラ ム で 方 法 2を 適 用 し た場 合 の 経 過 を み る こ と が で き る.問 い を 適 用 し た 場 合 と ど うか わ るか. 表5.A.1
表5.1.2に
お け るN
の ち が い を調 整
1の 扱
問 4 プ ロ グ ラ ムCLASSH2で
9 を指 定 す る と,逐 次 近 似 計 算 の 初 期 値 を ラ ン ダ ム に
決 め て 問 1の 計 算 を行 な う.こ
れ に よ っ て,途
中 の 経 過 が ち が う に し て も同 じ
結 果 が得 られ る こ と を確 認 せ よ.
注:一 般 にそ うな る とい うわ け で は あ りませ ん.こ の例 程 度 の小 さい デー タな ら多
分 か わ る こ とは な い … こ う了解 して くだ さい. 注:こ の例 で は,途 中 の経 過 が か わ って も,同 じ結 果 とな ります.た だ し,出 力 さ れ る クラ ス ター番 号 は 適宜 つ け なお した上 比較 す るこ と.
問 5 プ ロ グ ラ ムCLASSと
デ ー タ フ ァ イ ルOHSUMI9を
セ ッ ト 2(表5.1.2と と を確 認 せ よ.ま
た,こ
問 6 プ ロ グ ラ ムCLASSを タ は,デ
指 定 し,そ
同 じ もの)を 使 う と,表5.1.3の
の 中 の デー タ
結 果 が 得 ら れ る.こ
の こ
れ が 問 1の 結 果 と一 致 す る こ と を確 認 せ よ.
使 っ て,図5.2.1が
ー タ フ ァ イ ルDN70に
得 ら れ る こ と を 確 認 せ よ.基 礎 デ ー
記録 され て い る.
問 7 図5.2.1の
基 礎 デ ー タ の う ち 「近 所 づ き あ い 」に 関 す る 部 分 だ け を 取 り上 げ て,
同 じ方 法 で 分 析 して,結
図5.2.1と
こ の 基 礎 デ ー タ は,プ
果 を 比 較 せ よ.
ロ グ ラ ムVARCONVを
使 っ て 用 意 す る こ と.
○プ ロ グ ラ ムVARCONVを
○ デ ー タ フ ァ イ ルDN10を
○ よ み こ まれ た デ ー タ セ ッ トに 変 数 の 加 除 を指 定 す る 文
呼 び 出 して,「 変 数 の 加 除 」を 指 定 す る. 指 定 す る.
SELDATA=/XXXXXX00000000/
を 書 き込 む.
〇Escキ
イ をお す と,指 定 に 応 じて 選 択 さ れ た 変 数 値 を作 業 用 フ ァ イ ル WORK.DATが
用 意 さ れ る.
問 8 図5.2.1の
基 礎 デ ー タ の う ち 「親 戚 づ き あ い」に 関 す る部 分 だ け を取 り上 げ て,
同 じ方 法 で分 析 し て,問
図5.2.1と
こ の 基 礎 デ ー タ も,問
7 と 同 じ手 順 で 用 意 す る こ と.た だ し,変 数 の 加 除 指
定 文 はSELDATA=/000000XXXXXXXX/と
問 9 (1)図5.2.1の
と図5.3.1に
の ② に 示 す 形 に 編 成 替 え し た もの が デ ー
記 録 さ れ て い る.プ
ロ グ ラ ムCLASSで
これ を指 定 す る
示 す 結 果 が 得 ら れ る こ と を確 認せ よ.
(2)図5.2.1の 求 め よ.こ
す る.
基 礎 デ ー タ を5.3節
タ フ ァ イ ルDN70Xに
7の 結 果 と比 較 せ よ.
結 果 と図5.3.1の
表5,3.3を
ロ グ ラ ム の 中 で は で きな い の で,手
作 業 を す る こ と.
問10 問 7の 結 果 と 問 8の 結 果 を 比 較 す る た め に,表5.3.2,表5.3.3と
同様 な表 を
つ くれ.
れ ら の 図 は,プ
結 果 を 比 較 す る た め の 表5.3.2と
6 階 層 的 手 法
この章 で は,ま ず,ク ラ ス ター 分 析 の手 法 の うち階 層 的手 法 の 数理 を 説 明 し ます.ま た,す で に説 明 した 非 階層 的 手 法 との 関 係 を考 えて どの よ うに使 い わ け す るか をい くつか の 例 を取 り上 げ て説 明 し ます .
6.1 ク ラ スタ ー 分 析― ① こ の 章 で は,3.4節
階層的手法
で 述 べ た ク ラ ス タ ー 分 析 の 手 法 の う ち,階
層的 手 法に つ い
て 説 明 し ます. ② N 個 の 観 察 単 位 に つ い て,そ
れ ぞ れ K 組 の 変 数 値(K 次 元 の デ ー タ)が 求 め
られ て い る と き, "近 い デ ー タ を もつ 観 察 単 位 は 同 一 区 分 に
,
離 れ た デ ー タ を もつ 観 察 単位 は 別 の 区 分 に な る よ う 区 分 け を定 め る" 方 法 を一 般 に ク ラ ス タ ー 分 析 と よ び ま す が,そ ず,2 区 分,3 区 分,4 区 分,… の 分 類 系 統 樹 の よ うな 形 の),"分
と逐 次,区
れ を 適 用 す る と き,区
分 数 を特 定 せ
分 数 を増 や し て い く形 で(た と え ば,生
類 体 系"を 見 出 そ う とす る 場 合 の 手 法 を,階
物
層的手
法 と よ ん で い ます. ま た,逐
次 区 分 数 を減 らす 形 に 組 み 立 て る こ と も で き ます(こ れ が 普 通 です).
す な わ ち,
最 初 の N 観 察 単 位 N 区 分 の 状 態 か ら は じめ て,
最 も類 似 度 の 高 い 区 分 対 か ら順 に 合 併 す る手 順
を 適 用 し て い くの です. い ず れ に して も 区分 数 を 特 定 し な い,し 下 位 区 分 は,そ
か し,ど
の区 分数 につ いて も
の 上 位 区 分 を分 割 した 形 の 枝 わ か れ の体 系
を な す 「分 類 体 系 」が 得 ら れ る こ と に な り ます. こ の 形 の 分 類 体 系 が確 立 で き た とす れ ば,区
分 数 を 特 定 し た 見 方 を特 別 な ケ ー ス と
して 含 む こ とに な り ま す.そ 手 法 だ とい え ます が,現 め られ た と して も),適
の 意 味 で は,非
階 層 的 手 法 を含 んだ広い 観 点 に た つ 分析
実 の 問 題 に 対 し て,そ
こ ま で 精 密 な 分 類 体 系 を(計 算 上 は 求
用 で き るか ど う か を考 え る こ とが 必 要 で す.
ま た,「 枝 わ か れ の 形 式 」 とい う こ と が 条 件 とな っ て,そ
の 条 件 を考 慮 し な い 扱 い
を し た場 合 のベ ス トな 区 分 け を 見 逃 す とい う可 能 性 が あ り ま す. し た が っ て,非
階 層 的 手 法 を 適 用 す る か , 階 層 的 手 法 を適 用 す る か は,よ
く考 え て
決 め ま し ょ う. ③ 階 層 的 な 分 類 体 系 を期 待 し な い に し て も, 区 分 数 を特 定 しが た い 場 合 に,ま 区 分 数 と 情 報 量 の 関 係 を み て,区 … そ の た め に 使 う こ と も考 え られ ます .
ず 階 層 的 手 法 を適 用 し て 分 数 を決 め る 参 考 とす る,
こ う い う使 い 方 を考 え る 場 合 に も,階 層 的 手 法 と非 階 層 的 手 法 の 関 係 に 関 して い く つ か の 注 意 点 が あ り ま す か ら,次 節 以 下 で 補 足 し ます. ④ 階 層 的 手 法 に 限 っ て も種 々 の 手 法 が 提 唱 さ れ て い ます.た
と え ば,
ク ラ ス タ ー 間 の 距 離 や , ク ラ ス ター を 集 約 す る こ とに よ っ て 生 じ る情 報 量 ロ ス の 定 義 につ い て,種
々 の 案 が あ り う る か ら で す.
⑤ しか し,こ の テ キ ス トで は,非
階 層 的 手 法 の と こ ろ で 説 明 し た理 由 で,
クラス ター間 の距 離 は そ れ ぞ れ の メ ンバ ー の 重 心 間 の 距 離 を 分 散 で測 る も の とす る方 法 を採 用 して い ま す. ⑥ こ の 基 準 を採 用 す る と,分 散 分 析 の 論 理 を適 用 で き る こ と に な り ま す. す な わ ち, 数 量 デー タに つ いて は
級 間 偏 差 平 方 和
カ テ ゴ リカ ル デ ー タ に つ い て は をSBと
表 わ す と,単 位 対(I,J)を
級間情報 量
プ ー ル した 場 合 の ロ ス が,
数 量 デー タ: 質 的 デー タ: 表6.1.1
この 節 で使 う記 号
図6.1.2
階 層 的 手 法 の進 行
STEP
1:Aと
STEP
2:次 に B と H. A,F の 距離 と B, H の 距離 が 同 じ とき の 扱 い が 問 題 とな る.
F の 距離 が最 も近 い の で,ま
ず そ れ らが統 合 され る,
STEP
3:次 に C と E.こ こ まで 進 む と上 記 の 問題 は 解 消.
STEP
4:次 は A と B.
STEP
5:次は
C と G.A,C
い る の で,各
の 方 が 距 離 と して は 近 い が,正
で 表 わ さ れ る こ と を利 用 し て い ま す.こ して い く … こ れ が,"Ward法"と こ こ で,使
確 に は,距
離 で は な く分 散 を使 っ て
区分 の メ ンバ ー 数 が関 係 して くる.
の⊿SBが
最 小 な 対(I,J)を 見 出 し て プ ー ル
よ ば れ て い る も の で す.
っ た 記 号 の う ち 関 数F(X,Y)は,数
量 デー タの場合 の 級 間偏 差 平 方和
と質 的 デ ー タの 場 合 の 級 間 情 報 量 とが 同 じ意 味 で 使 わ れ る こ と か ら,同 た め に使 っ た もの で す.こ ⑦ 3.1節
れ に よ っ て,対
じ表 現 に す る
応 関 係 を把 握 して くだ さ い .
と 同 じ例 に つ い て 階 層 的 手 法 を 適 用 し,区 分 が 逐 次 集 約 さ れ て い くプ ロ
セ ス を図6.1.2に
示 して お き ま し ょ う.
6.2 階層 的手 法 の 出 力 ① こ の 節 で は,階
層 的 手 法 の プ ロ グ ラ ム の 出 力 に つ い て 説 明 し ます.
② 表6.2.1は,東
京23区
の 居 住 者 の 職 種 構 成 を比 較 した もの で す(例 1).
こ の デ ー タ に 注 目 して 階 層 的 手 法 を適 用 して,職
種構 成 の地域 差 を調べ てみ ま し ょ
う. ③ UEDAに
は,階 層 的 手 法 の プ ロ グ ラムCLUSTを
用 意 して あ り ます.こ
れ は,
表6.2.1
東 京23区
の 居 住 者 の職 種 構 成
基 礎 デ ー タ が 数 量 の 場 合 に も,質 こ こ で は,表6.2.1の
表6.2.2
出 力(逐 次 集 約 の 過 程)
的 デ ー タの 場 合 に も使 え ま す.
デ ー タ を構 成 比 の 形 に し て 扱 う もの と し ま す.表6.2.2は,
そ の 場 合 の 出 力 で す. ④ まず 最 初 の ス テ ッ プ で は,最 合 す る と級 内 分 散 が0.173減 と99.94%に
あ り,こ れ を 1つ に 統
初 の分 散 に対 す る比率 でい う
な る こ と を示 して い ます.
次 の ス テ ップ で は,(8,18)が 以 下,ロ
も近 い ペ ア ー が(21,22)で
少 す る こ と,そ の 結 果,最
近 く,0.186の
減 少 で99.88%に
ス が 少 な い 対 か ら順 に プ ー ル さ れ て い き,ス
る)で 級 間 情 報 量 が 最 初 の95%と 情 報 量 の ロ ス5%を
な っ て い ま す.
テ ップ14(区
分 数 は 9に な
な っ て い ま す.
認 め る こ とに よ っ て,区
分 数 を 9区 分 に 集 約 で き る と い う こ と
で す. ⑤ 最 後 ま で つづ け て 区 分 数 が 1に な る と,表6.2.2の ます.ま
た,そ
の 結 果 を 図6.2.3の
結 果 が プ リン トア ウ トされ
よ うに 図 示 し ま す.
こ の 図 は,
最 初 す べ て の 単 位 が 別 区 分(図 で は 別 の 線)で あ っ た も の が,
図6.2.3
デ ン ドロ グ ラ ム(逐 次 集 約 過 程 を示 す 樹 状 図)
図6.2.4
デ ン ドロ グ ラ ム を編 集 した もの
図 の 目盛 りは,1−R2の 対 数 を と って い ます が,こ ロス の 小 さ い部 分 を よ みや す くす るた め の 一 案 で す. DENDROを 使 う と,こ の 図 の よ うに,ス の編 集 が 可 能 で す.
れ は,本
質 的 な 点 で は あ り ませ ん.情
報量
ケ ー ル をか え た り,基 礎 デ ー タ の 表 示 順 を か え るな ど
次 々 と集 約 さ れ て い く(図 で は 1つ の 線 に ま とめ られ て い く)経 過 を示 す 樹 木 の形 式 で す が,樹
木 の枝 わ か れ の 位 置 に よ っ て
級 間 情 報 量SEが
減 少 して い く様 子(横 軸 の 目盛 りで)が よみ とれ る
よ う に な っ て い ま す. ま た,図
の 断 面 を指 定 し て,そ
の と き,各 区 分 に 包 含 さ れ る メ ン バ ー 名 を よ む こ と
もで き ます, こ の 形 式 の 図 を樹 状 図(デ ン ドロ グ ラ ム)と よ ん で い ます.階
層 的 手 法 は,こ
の分
類 体 系 図 を 求 め る 手 法 だ と い う こ とが で き ま す. デ ン ドロ グ ラ ム は,こ 約 され る た め に,そ
の 例 の よ うに,情
報 量 ロ ス の小 さ い と こ ろ で 多 数 の 区 分 が 集
の 部 分 の 細 か い 差 が 識 別 しに く くな り ます.し
分 を よ み や す くす るた め に は,ス る と よ い で し ょ う.UEDAに,こ
た が って,そ
ケ ー ル の 刻 み 方 をか え て,図6.2.4の
の部
よ うに 図示 す
の よ う な 編 集 を行 な うプ ロ グ ラ ム を 用 意 し て あ り
ます. ⑥ 集 約 は 最 後 に 1区 分 に な る ま で つづ き ます が,途 ラ ス タ ー に つ い て,そ は,非
中 の 段 階 で,そ
の段 階 での ク
の メ ン バ ー 構 成 や 指 標 値 を 出 力 す る こ とが で き ま す.こ
の出力
階 層 的 手 法 の 場 合 と 同 じ形 式 で す.
⑦ 補
足
階 層 的 手 法 を大 規 模 な デ ー タ に 適 用 す る と きに は 計 算 に 要 す る 時 間
が 問 題 と な りま す.デ
ン ドロ グ ラ ム を み て わ か る よ う に,そ
の 手 順 の 最 初 の 段 階(そ
れ が 時 間 の か か る 部 分)で の 「合 併 に と も な う情 報 量 ロ ス は 小 さ い 」の で,そ
の部 分
で の 扱 い 方 を 単 純 化 し て 計 算 所 要 時 間 を短 縮 で き る … こ う い う機 能 を 採 用 で き る で し ょ う. た と え ば,
単調な階層構造 図6.2.4の
デ ン ドロ グ ラ ム は,区
負)と い う条 件 を み た して い ま す.し
分 数 を 減 らす こ とに よ る 情 報 量 ロ ス が 正(非 た が っ て,こ
れ に よ っ て 定 ま る分 類 体 系 は
「単 調 な 階 層 構 造 」を も っ て い ます. こ の こ とは,こ
の 例 に 限 ら ず 一 般 に い え る こ とで す .
ク ラ ス タ ー 分 析 の 専 門 書 を み る と,ク ラ ス タ ー 間 の 距 離 や 合 併 手 順 の 組 み 立 て 方 を か え た 種 々 の 手 法 が 提 唱 さ れ て い ま す(3.4節
参 照)が,「
こ う い う階 層 構 造
を もつ 結 果 を与 え る 」こ と を条 件 とす る範 囲 で の 提 唱 で す. し た が っ て,デ
ン ドロ グ ラ ム の 形 に つ い て は,た
こ と は あ り ませ ん が,右
寄 りに な る もの,あ
とえ ば 分 岐 の位 置 が 逆 転 す る
る い は 左 寄 りに な る も の … な ど の
ち が いが あ り,そ の 形 に よ っ て種 々 の 手 法 の 特 性 が 論 じ ら れ て い ます.
最 初 の 段 階 で は,情 0.1%以
報 量 ロスが
下 の 対 は,す
べ て,合 併
図 6.2.5
階 層的手法の 断面におけ る クラス ター構成
しでしまう とい うオプ シ ョンです . こ の オ プ シ ョ ン を適 用 して い る 間 に 合 併 さ れ て 新 し くで き た単 位 に つ い て は,そ
れ
と の 距 離 を チ ェ ッ ク し な い こ とに な りま す か ら,「 距 離 の 近 い 順 に 合 併 し て い く」 と い うル ー ル に 反 す る状 態 が 起 こ り う る の で す が,こ
の オ プ シ ョン に お け る閾 値 を小 さ
く とれ ば,合
併 手 順 の 先 の 方 に は 影 響 しな
い で し ょ う. 次 ペ ー ジの 表6.2.6は,表6.2.1の タ に つ い て,閾
デー
値 を 1と して こ の オ プ シ ョ
ン を適 用 し た 場 合 の 逐 次 合 併 の 経 過 で す. 例 示 の よ うに,加
速 オプ シ ョンの適用 に
よ り変 化 す る 部 分 は,そ
の こ とが 直 接 ひ び
く ス テ ップ(例 示 で は ス テ ップ 9 ま で)ま で で な く,そ の 後 に も影 響 し ます(例 示 で は,ス
テ ップ17ま
で)か ら,計
算 手順 を
か え た こ とに よ る 影 響 を避 け る に は,注
目
し よ う と思 う 区 分 数 の 部 分 に 影 響 が 及 ば な い よ う に,閾 値 を小 さ く し ま し ょ う.例 示 で 採 用 した 閾 値 は,手
法 の 説 明 で す か ら大
き く と っ た の で す. ど の 程 度 に す る か は 個 々 の ケ ー ス ご とに 試 して み るべ き で す が,0.1%を
標準 とし
て い ます.
ク ラ ス ター 数 の 決 定
実 際 の 問 題 を扱 う と きに は 「クラ ス ター 数 を い くつ に す るか 」
を考 え る必 要 が あ ります.非 階 層的 手 法 は,あ る クラ ス ター数 に す るこ と を前 提 と して 組 み 立 て られ て い ます.階 層 的 手法 で は ク ラ ス ター 数 に関 す る前 提 をお き ませ ん が,そ れ をい くつ に す るか とい う問 に は 答 え を出 しませ ん.い ず れ に して も,「 ク ラ ス ター 数 」 につ い て は,数 理 の枠 外 の 問題 とな り,分 析 者 の判 断 をまつ こ とに な ります.
表6.2.6
加 速 オ プ シ ョ ン を適 用 した場 合
LOSSの
LOSSの
閾 値 を 1 と して加 速 オプ シ ョン を適 用
POOLさ
大 き さの 順 に れ る とは 限 らな い
… こ こ ま でが ,加 速OPTION 閾値 以 下 の 対 が な くな っ たの で 以 下 は .LOSSの
大 き さの 順 にPOOL
た だ し,加 速 オプ シ ョン適 用 の 関係 で,表6.2.2と
… 以 降 は
異 な る こ とが あ る
,表6.2.2と
同 じ
6.3 合 併許 容 条 件 を つ ける 場 合 ① こ の 節 で 例 示 し た 地 域 区 分 デ ー タ を 扱 う と き に,「 ク ラ ス ター は 地 理 的 に 連 続 した 領 域 に した い」 と い っ た 条 件 が 要 求 さ れ る こ とが あ る で し ょ う. 階 層 的 手 法 で は,一
対 ず つ 合 併 を 進 め て い き ま す か ら,合 併 を実 行 す る前 に そ の 対
の合 併 が 「条 件 を み た し て い るか 」を チ ェ ッ ク す れ ば,こ
の 条 件 をみ た す 範 囲 で の ベ
ス トな解 を 得 る こ とが で き ます. ② 表6.2.1の
デ ー タ に こ の 条 件 を つ け て 進 行 させ,区
タ ー 区 分 を み る と,表6.3.1の
分 数 8の 断 面 で の ク ラ ス
左 側 の よ うに な っ て い ます . さ らに つ づ け る と,右 側
に示 す 順 に 合 併 され て い き ます. 同 じデ ー タ に つ い て 条 件 を つ け ず に 進 行 させ た 場 合 の 表6.3.2と
比べ て み ま しょ
う. 隣 接 条 件 を つ け た こ と に よ っ て,9,11(品 が 別 区 分 に な っ た こ と,20(練
川 区,大田
馬 区)が10,12(目
黒 区,世
区)と17,19(北
区,板
橋 区)
田 谷 区)と 離 れ て14,15(中
野 区,杉 並 区)の 方 へ つ い た … こ う い う ち が い が 起 き た の で す.
表6.3.1
隣接 条件をつけた場合
区 分 数 8の 段 階,区
6.4 例―
隣接条件 をつけ ない場合
区分数8の段階,区 分 数 5までの変化
階層 的手 法 の 断面 と して得 られ るク ラ スタ ー
① 3.3節 で は,食
生 活 の 地 域 差 を み る 問 題(例 2)に つ い て ク ラ ス タ ー 数 を定 める
方 法 を 説 明 し ま した が,そ て お き ま し た.こ
表6.3.2
分 数 5まで の 変 化
の 別 法 と して 階 層 的 手 法 を使 う こ とが 考 え ら れ る と指 摘し
の 節 で は,こ
の 方 法 を適 用 して み ま し ょ う.
② 階 層 的 手 法 に よ っ て,表6.4.1の
よ う に,「 ク ラ ス ター 数 を少 な くす る に つれ
て 区 分 内 分 散 が ど うか わ るか 」を 示 す 表 が 出 力 さ れ ま す か ら,た
情 報 量 の ロ ス を10%に
ス テ ップ26(区
と え ば,
お さ え た い な ら,
分 数 は21)と
して み よ
とい っ た ガ イ ドが 得 ら れ ます. 21区 分 で は ま だ 多 す ぎ る,も い と す る な ら,た
と え ば,も
バ ー す る ス テ ッ プ35,区 …
っ と 簡 明 な 形 に した 表6.4.1
と の 情 報 の80%をカ
分 数 で は12と
し て み よう
こ の よ うに 考 え る こ とが で き ま す .
③ ま だ 多 い 感 じ で す が,ま
ず こ の 区 分 で ク ラス
タ ー の メ ン バ ー 構 成 や 特 性 を み た 上 で,場 ば,さ
合 に よれ
ら に減 らす こ と を考 え る こ とに し ま し ょ う.
④ 区 分 数12の
と こ ろ の ク ラ ス ター に つ い て,そ
れ ぞ れ の ク ラ ス ター の メ ンバ ー 構 成 と変 数 値 で み た特 性 を示 し た の が,表6.4.2で
す.
出 力 は ク ラ ス タ ー の 番 号 順 で す が,表6.4.2で
は,
後 の こ と を考 え て 並 べ か え て い ます. ま ず こ の 出 力 に よ って 大 き な傾 向 をみ て お き ま し ょ う. メ ンバ ー 表 を み る と,ほ ぼ
ク ラ ス タ ー1,2,16
東 北 ・北 陸
ク ラ ス タ ー8,11
関 東 ・東 海
階層的手法に よる逐 次合併の結果
ク ラ ス ター13
東 京 ・神 奈 川 ・愛 知 ・兵 庫
ク ラ ス ター25
滋 賀 ・京 都 ・大 阪
ク ラ ス ター29以
下
中 国・ 四 国・ 九 州
と な っ て い ます.
次 に変数値 の特 徴 をみ る と 魚(変 数 2),肉(変 数 3)に つ い て,東 野 菜(変 数 5)につ い て,東
北 ・北 陸 で 魚,大 都 市 周 辺 で 肉
北 ・北 陸 で +,中
加 工 食 品(変 数 9),外 食(変 数12)に
国 ・四 国 ・九 州 で −
つ い て,大
都 市周辺 で +
とい う対 応 に な っ て い ます. こ の よ う に お お まか な 傾 向 を よ み とれ ます.細 う で す が,こ
部 に つ い て 説 明 しつ く し て い な い よ
こ に 要 約 し た レベ ル ま で の 説 明 で よ し とす る な ら,も
う少 し 区 分 数 を 減
ら して よ い で し ょ う. ⑤ そ こ で,表6.4.1の ク ラ ス タ ー13と15,そ
ス テ ップ36以
降 をみ る と,ま ず ク ラ ス ター 2 と16,次
の 次 に29と30,…
と減 ち して い くこ とが 考 え られ ま す.
に
こ の 順 に み て い き ま し ょ う. ク ラ ス ター 2 と16に は 似 て い る と み て,合
つ い て は,特
性 パ ター ン は 変 数 1で や や ち が い ますが, ま ず
併 して よい で し ょ う.
次 は ク ラ ス ター13と25だ
とい う こ と です が,「 東 京 ・神 奈 川 と京 都 ・大 阪 を ま とめ
る の は ど うか な」 と い う コ メ ン トが 出 る で し ょ う. 変 数 値 の パ ター ン で み る と,「 肉, 加 工 食 品 」 と い う特 徴 が + か ++ か とい う差 が み られ ま す.合 併 す る と,こ の 差 が 消 さ れ,「 肉,加
工 食 品 」が 多 い とい う言 い 方 に な る の で す.
次 は ク ラ ス ター29と30で
す が,パ
す る こ とに は 異 論 が 出 る で し ょ う.ク
表6.4.2
タ ー ン が か な りち が い ます か ら,こ れ ち を合 併 ラ ス ター 分 析 の 数 理 で は,「 パ タ ー ン の ち が い 」
ク ラ ス タ ー 数12の
段 階 の状 況
と と もに 「メ ンバ ー 数 の 大 小 」が 影 響 す る形 に 組 み 立 て られ て お り,「 パ タ ー ン の ち が い が 大 き い ク ラ ス タ ー 」が 「メ ンバ ー 数 が 少 な い た め に 」先 に 合 併 さ れ る こ とが あ り う る の で す(次 ペ ー ジ 注 1). 次 の ク ラ ス タ ー33と47の
合 併 に つ い て は,「47(=
沖 縄)が 他 と ち が う」 と い う 問
題 を特 に 取 り上 げ る な ら別 で す が,「 全 国 で み た 地 域 差 を み る こ と に す る な ら,こ
の
程 度 の ち が い は 考 慮 外 に す る 」 と して よ い で し ょ う. こ う し て,情
報 量70%の
⑥ 次 の 表6.4.3は,こ
と こ ろ(区 分 数 で は 8区 分)ま で縮 約 す る こ と が で き ま す. う して 8区分 に 集 約 し た場 合 の 結 果 で す.
◇ 注 8区 分 とは じめ か ら特 定 す る こ と を避 け て,幾 分 多 い 区分 数 を想 定 し,デ ー タ を み なが ら,縮 約 を進め たの です. ⑦
⑤ の よ う な 扱 い 方 に つ い て は, 「 8 ク ラ ス ター とす る 」と い う こ と な ら,そ
の 数 を指 定 して
非 階 層 的 手 法 を適 用 せ よ
表6.4.3
図6.4.4
表6.4.2ク
ラス ター 数 8の段 階 の 状 況
階 層 的 手 法 と非 階 層 的 手 法 の 結 果 の 比 較
とい う指 摘 が 出 て く る で し ょ う. 同 じ区 分 数 に す る な ら,非 階 層 的 手 法 に よ る方 が 情 報 量 ロ ス の 少 な い 区 分 が 得 ら れ ます. 図6.4.4は,階
層 的 手 法 に よ って 得 ら れ た8 ク ラ ス ター と非 階 層 的 手 法 で 得 ら れ た
8ク ラ ス ター の構 成 を比 較 した も の で す. メ ンバ ー17,22,30,32,33を ⑧ こ の よ うに,種
除 く42県
は す べ て,図 示 の よ うに 対 応 して い ま す.
々 の 扱 い を し て 比 べ る こ と に よ っ て,扱
い 方 を か え て も常 に 見
出 さ れ る 区 分 と,扱 い 方 に よ っ て か わ る区 分 を 識 別 で き る こ と に 注 目 し ま し ょ う. 区 分 数 は い くつ,適 にせ ず,こ
用 す る 方 法 は 非 階 層 的 手 法 の よ うに 特 定 した 計 算 だ け で 終 わ り
こに 例 示 し た よ う に,何
とお りか の 計 算 結 果 を比 較 して み る こ との 効 用 で
す(注2). 注1 ク ラス ター 分 析 の 基 準 を 「メンバ ー 数 の 大 小 の影 響 を避 け る」形 に改 め る こ と も 考 え られ ます.そ の場 合,ク ラ ス ター 間 の距 離 の 測 り方 をか え るの が普 通 です が,そ こ ま で ひ ろげ る とさ ま ざま な選 択肢 が 登 場 し,ど の 基準 を採 用 す るか を判 断 す るの が 難 し くな ります.し た が って,こ の テ キ ス トで は,ク ラス ター 間 の 距 離 を分 散 で測 る場 合 に 限定 し て 説明 して い ます. 注2 「主観 的 な判 断 を一切 入れ るな」 とい うこ とで は あ りませ ん.た だ し,そ れ を入 れ す ぎない よ うに 注 意 しま しょ う.ま た,「 い ろい ろ と試 して み る」こ とにつ い て も,「思 わ し くない結 果 だか ら別 の 方 法 を適 用 して み よ う」とい う態度 につ いて も分 析 の 客 観 性 を乱 す お それ が あ り ます.何 とお りか の 扱 い をす る場合 に は,な ぜ そ うす るか を 「事 前 に 分 析 計 画 の 中 に入 れ てお く」こ とに し ま し ょう.
問題 6
問 1
プ ロ グ ラ ムCLUSTHは
階 層 的 ク ラ ス ター 分 析 に お け る 入 力 デ ー タ の 扱 い に つ
い て 4 とお りの 扱 い を 比 較 す る プ ロ グ ラ ム で あ り,そ の 最 初 に,「 扱 い 方 」を指 定 す る よ う に な っ て い る.
入 力デー タの分散 の ちが いにつ いて
2 X, Y の 分 散 が 異 な る例,問
3 X, Y の 分 散 を そ ろ え た 例,問
題 3の 問1 と同 じ例 題 3の 問 2 と同 じ例
観 察 単 位 数 の 相 違 に つ い て 1 観 察 単 位 数 の ち が い を 考 慮 に 入 れ る 2 観 察 単 位 数 の ち が い を考 慮 に 入 れ な い
(1) 扱 い 方21(分 と,表6.1.1に
散 の ち が い を 考 慮,観
察 単 位 数 の ち が い を 考 慮)を 指 定 す る
示 す 経 過 で 逐 次 合 併 さ れ て い く こ と を確 認 せ よ.
(2) 扱 い 方22(分
散 の ち が い を 考 慮,観
察 単 位 数 の ち が い を 調 整)を 指 定 す る
と,逐 次 近 似 計 算 の 経 過 は ど うか わ る か.か (3) 扱 い 方31(分
散 の ち が い を 調 整,観
わ ら な い こ と も あ り う る.
察 単 位 数 の ち が い を 考 慮)を 指 定 す る
と,逐 次 近 似 計 算 の 経 過 は ど うか わ る か.か (4) 扱 い 方32(分
散 の ち が い を 調 整,観
わ ら な い こ と も あ り う る.
察 単 位 数 の ち が い を 調 整)を 指 定 す る
と,逐 次 近 似 計 算 の 経 過 は ど うか わ る か.か 問 2 プ ロ グ ラ ムCLUSTの
使 い 方 を付 録C.2の
問 3 プ ロ グ ラ ムCLUSTで
は,区
わ ら な い こ と も あ り う る. 説 明 に し た が っ て動 か し て み よ.
分 集 約 ル ー ル に 関 して 次 の オ プ シ ョン を 指 定 で き
る よ う に な っ て い る.
処 理 の 進 行(問1 の 扱 い方21を
採 用 した 場 合 に つ い て の 選 択 肢)
MODE 1標
準
MODE
2距
離 が 閾 値 以 下 の ペ ア ー をminimum判
MODE
3プ
ー ル す るペ ア ー を指 定
MODE
4合
併 許 容 条 件 を指 定 して そ れ をみ た す 範 囲 で プ ー ル
表6.2.1に と,表6.2.2の
MODE指
示 す デ ー タ(フ ァ イ ル 名 はDG11)に
つ い て 標 準 モ ー ド を適 用 す る
経 過 で 逐 次 集 約 が 進 行 す る こ と を確 認 せ よ. 定 以 外 に もい くつ か の オ プ シ ョ ン を指 定 で き る が,こ
ら を指 定 せ ず,表6.2.2が 4 表6.2.2に
定 を省 略 して プ ー ル
得 られ る ま で,Enterキ
こ で は,そ
れ
イ で 進 行 させ る こ と.問
示 す逐 次 集 約 の 過 程 が 最 後 ま で 進 行 し た 後,デ
ン ドロ グ ラ ム を か く
と指 定 す る と,図6.2.3が 問 5 図6.2.3が
得 ら れ る こ と を確 認 せ よ.
得 ら れ た と き,DENDROを
編 集 す る と指 定 す る と,ま ず 標 準 形 式
(表6.2.2と
そ の メニ ュ ー で ス ケ ー ル 変 換 を 指 定 す る と,図6.2.3が
ほ ぼ 同 じ 形 式)で 表 示 し た 上,編
集 機 能 の メ ニ ュ ー が 表 示 さ れ る. 得 られ る こ とを確 認せ
よ. 問6(1) 問2 の 逐 次 集 約 の 過 程 に お い て,区
分 数 が8 の 段 階 で 中 間 結 果 出 力 を 指 定
す る と,そ の と き の ク ラ ス タ ー 区 分 に つ い て,そ
れ ぞれの 特性 表 お よび構 成 メ
ン バ ー 表 を 出 力 で き る. 表6.3.2の
左 側 が 得 ら れ る こ とを確 認 せ よ.
(2) 区分 数 5の 断 面 に つ い て,表6.3.2の
問7(1) プ ロ グ ラ ムCLUSTで,
6.2.6の
経 過 に よ って,逐
右 側 が 得 ちれ る こ と を確 認 せ よ.
MODE 2(加
速 オ プ シ ョ ン)を 指 定 す る と,表
次 集 約 が 進 行 す る こ と を確 認 せ よ.
た だ し,加 速 オプ シ ョ ン適 用 に お け る 閾 値 を1 と指 定 す る こ と. (2)(1)で,閾
値 を0.5と
指 定 し て み よ.こ
の 指 定 で は,加
用 し た こ と に よ る 変 化 は 最 初 の 3ス テ ップ だ け だ か ら,実
速 オプ シ ョン を適 質 上 「結 果 に 影 響 し
な い 」こ とが わ か る. 問8 プ ロ グ ラ ムCLUSTで,MODE 4(合 の 過 程 に よ っ て,逐
併 許 容 条 件 指 定)を 指 定 す る と,表6.3.1
次 集 約 が 進 行 し,区 分 数8 の 段 階 で は 表6.3.1の
分 数 5の 段 階 で は 表6.3.1の
右 側 の 結 果 が 得 られ る こ と を確 認 せ よ.
こ の モー ドを 適 用 す る た め に は,「 合 併 許 容 条 件 を 指 定 す る フ ァ イ ル 」を 用 意 す る こ とが 必 要 だ が,こ
の 問 い の た め に は,¥UEDA¥PROG¥MAPCONST
の 中 に あ る合 併 許 容.LSTを¥UEDA¥WORKに
左 側,区
ま た,プ
ロ グ ラ ムCLUSTで
は,付
転 記 して お くこ と. 録C.2の
図C.2.2の
画面で
特 別 モ ー ド… … X に 対 して X を 入 力 し た 後,図C.2.3の 問9(1) 表6.2.1は1960年
画 面 で は,標
準 モ ー ドを指 定 す る.
の デ ー タ で あ る.対 象 年 次 を か え た と き,表6.2.2の
経 過 が ど うか わ る か を み た い.
そ の ため に は,デ
ま ず,そ
ー タ フ ァ イ ルDX11を
使 う.
の フ ァ イ ル 中 の デ ー タセ ッ ト1965年
分 を指 定 して,表6.2.2と
ほぼ
同 じ結 果 が 得 られ る こ と を確 認 せ よ.
注:年 次別 比 較 をす るため に職 種 区分 の 仕 方 をか えて あ るた め,一 致 しな い部 分 が 出て きます.
(2)1970年
の デ ー タ に つ い て 同 じ処 理 を適 用 し て,1965年
の場 合 と ど うか わ
るか を調 べ よ. (3)1975年
の デ ー タ に つ い て 同 じ処 理 を適 用 し て,1965年
る か を 調 べ よ.
の場 合 と ど うか わ
7 基 礎 デ ー タの 結 合
クラ ス タ ー分 析 を適 用 す る と きに は,「 どん な 方 法 で わ け る か 」,「ど ん な デ ー タ を参 照 してわ け るか 」の 両面 を考 え ます が,実 際 の 問 題 場 面 で は,得
られ た ク ラ ス ター の ちが い に つ い て 「 何が 効いてわか れた の
か 」を説 明 したい の です か ら,参 照 す る 「 デ ー タ の取 り上 げ 方 」が 重 要 で す. この 章 で は,複 数 の デ ー タ に よ るわけ 方 を考 え る とい う方 向 に つい て 説明 します.
7.1 変 数 の 結 合 ① 同 じ観 察 単位 系 列 C に 対 応 す る デ ー タ A とデ ー タ B が あ っ た と き A
を使 っ て 区 分 け した 結 果G1と
B
を使 っ て 区 分 け し た 結 果G2が
異 なる
の は 当 然 で す. そ の ち が い を 「A,Bの 効 き 方 が ちが う た め だ 」 とい う だ け で な く 「効 き方 の ち が い が,区
分 け に ど う影 響 して い る か を把 握 す る」
こ とまで進 むた めに は
「A,B の 両 方 を 使 っ て 区 分 け し,
そ の 結 果 G に つ い てA,B
の差 をみ る」
こ とが 考 え られ ます. そ れ ぞ れ を 別 々 に 使 っ た 場 合 の 決 定 係 数 を 比 較 す れ ば,A,B
の 両 方 を使 っ た こ と
の 効 果 を 判 断 で き ます が,
「わ け る」 と い う こ と は 「多 面 的 な 観 点 を 入 れ て わ け る」
の が 普通 で す か ら,
複 数 の 観 点 に対 応 す る変 数 を同 時 に取 り上 げ た 場 面 に お け る
そ れ ぞ れ の 効 果 を比 較 す る な ど,効 果 の 態 様 に 注 目 し た 説 明 ま で進 め た い の で す.
Aに よる区分
Bに よる区分
A,Bに
よる区分
注 :基礎デー タの区分Cは 共通 だ とします.
② こ れ ま で 「食 費 支 出 額 を参 照 して 」食 生 活 の 地 域 差 を み て き ま し た が,食
の選
好 は 「好 み 」が か か わ っ て き ます か ら,
食 物 の 好 み に 関 す る 意 識 調 査 の 結 果 を参 考 に す る
こ と も考 え られ ます. NHKが1968年
と1996年
に行 な っ た全 国 県 民 意 識 調 査 で は,次
の 調 査 項 目 を取 り
上 げ て い ま す.
「次 に 食 物 の 好 み に つ い て うか が い ます.
肉,魚,野
以 下 で は,こ ま た,こ
菜 の う ち どれ が 好 き で す か 」
れ を デ ー タA(例5)と
よぶ こ と に し ます.
れ ま で も取 り上 げ て い た 食 費 支 出 額 区 分 の デ ー タ(肉,魚,野
をデ ー タB(例2)と こ こ で は,こ
菜 の 部 分)
し ます.
れ ら を別 々 に,ま
た は,一
緒 に 使 っ て ク ラ ス タ ー 分 析 を適 用 した 結 果
を比 べ て み ま し ょ う. ③ ま ず,
そ れ ぞ れ の デ ー タ で 区 分 け した 結 果 を組 み 合 わ せ て み る
こ とに し ま し ょ う. こ の 考 え 方 な ら,ク
ラ ス タ ー 分 析 の 部 分 に 関 して は,こ
れ ま で と 同 じ扱 い が で き ま
す.
表7.1,1 デー タBに よ るクラス タリング
表7.1.2
表7.1.3 A
注:各
デー タA に よ る クラ ス タ リ ング
に よ る 区分 と B に よ る 区分 の組 み合 わせ
セ ル に お い た数 字 は 県 番 号,た
表7.1.1は
デ ー タ B,表7.1.2は
と え ば付 表 B を参 照 して くだ さ い.
デ ー タ A に よ っ て 得 ら れ た ク ラ ス ター 区 分 で
す. デ ー タ B は,構 成 比 の 形 に し て 扱 っ て い ま す.後 ます か ら,ど
で デ ー タ A と 組 み 合 わせ て 扱 い
ち ら も 同 じ扱 い 方 に す る た め で す.
④ 以 上 が コ ン ピ ュ ー タ 出 力 で す.こ
れ は,そ
れ ぞ れ の デ ー タ に 対 応 し て い ます か
ら,結 果 を 比 較 しや す い形 に ま とめ な お し ま し ょ う. そ の 場 合,各
ク ラ ス ター の 特 性 が 次 の よ う に対 応 して い る こ と に 注 目 し ま し ょ う.
区 分A4⇔
区 分B1⇔
肉が 多い
区 分A2⇔
区 分B3⇔
魚 が 多い
区 分A1⇔
区 分B2⇔
平均 的
区 分A3⇔
区 分B4⇔
野菜 が 多い
し た が っ て,区
分 は こ の 順 に 配 列 す る こ とに し ま し ょ う.
⑤ 基 礎 デ ー タA,B が 異 な る た め,そ き ます.そ
れ ぞ れ に よ る ク ラ ス ター 区 分 は,ち
の ち が い を くわ し くみ る た め に,各
県 がA
で は ど の 区 分 に,B
が って
では どの
区 分 に 入 っ て い る か を 表 に ま とめ て み ま し ょ う. 表7.1.3で まず,デ
す. ー タ A でみ た特性 区分 とデー タ B でみ た特性 区分 とが一 致 して い る と こ
ろ をみ ま し ょ う. ど ち らの デ ー タ で も 「肉 が 多 い 」 と区 分 さ れ て い る 「A4,B1」 の セ ル に は
京 都 ・大 阪 ・兵 庫 な ど が ま と ま っ て い ま す. ど ち らの デ ー タ で も 「野 菜 が 多 い 」と 区分 さ れ て い る 「A3, B4」 の セ ル に は
福 島 ・栃 木 ・群 馬 と福 井 ・岐 阜 ・長 野 な ど
が ま と ま って い ま す. ど ち ら の デ ー タ で も 「魚 が 多 い 」 と区 分 され て い る 「A2,B3」 の セ ル に は 青 森 ・岩 手 ・宮 城 ・秋 田 と富 山 ・石 川 が ま と ま っ て い ま す. デ ー タA で み た 特 性 が 「平 均 的 」の 区 分A3に
つ い ては
デ ー タ B で み た 特 性 で は 「肉 」と な って い る B1
神 奈 川 ・滋 賀 ・広 島 ・徳 島 ・福 岡 ・大 分 ・熊 本
と デ ー タ B で み た 特 性 で は 「野 莱 」と な っ て い るB4 埼 玉 ・千 葉 ・愛 知 ・鳥 取 とに わ か れ て い ます. こ ん な と こ ろ が 「デー タ で み られ る大 きい 傾 向 」で す. も う一 歩 解 釈 を 進 め る と
○ 肉 に 対 す る支 出 が 特 に 多 い 都 市 部 で は,意
識 として もそれが 好 き
○ 肉 に 対 す る 支 出 が や や 多 い 程 度 の とこ ろ(中 国 ・四 国 ・九 州)は,意
識 として そ
れ が 好 きだ と い う答 え が 多 い わ け で は な い
○内 陸 部,野
菜 の 産 地,そ
れ が 好 き,実 際 の 支 出 で は 野 菜 が 多 い とは 限 ら な い
○臨 海 部,魚
の 水 揚 げ 地,そ
れ が 好 き,実 際 の 支 出 で は 魚 が 多 い とは 限 ら な い
と言 え そ うで す. 結 果 的 に 「意 識 面 の デ ー タ 」に よ る 区分 と 「実 際 の 支 出 」に よ る 区 分 が 一 致 して い る と こ ろ が 多 い に して も,デ ー タの タ イプ と し て は 基 本 的 に 異 な る も の で す. デ ー タB は 「県 民 意 識 調 査 」の 枠 組 み に 組 み 込 ま れ た 一 連 の 質 問 項 目 の1 つ で す か ち,そ
の 前 ま で の 質 問 の 流 れ か ら, 「好 き で 食 べ て い る も の 」 とい う意 識 で 答 え た もの ば か りで は な く,
「○ ○ が お い し い と こ ろ だ 」 と い う意 識 で の 答 え に な っ て お り,
実 際 の 支 出 を 反 映 す る とは い え な い …
こ うみ る べ きで す. 上 の ま とめ は,こ
う了 解 す れ ば 納 得 で き る で し ょ う.
注1 「 住 ん で い る と ころ の生 活環 境 の 評価 」,「各県 に つ い て好 きな 点 」に関 す る質 問 の 次 に この 質 問 に うつ って い ます か ら,こ の よ う な答 え に な っ て い る 可 能 性 が あ りそ う で す. 注2 対 象年 次 は1978年 う大 き くな か っ た時期 で す.
です か ら,「ダ イエ ッ ト→ 肉 よ り野 菜 」とい う意 識 は,ま だ そ
注3 デー タ A につ い て は,「 好 き だ」→ 「 産 地 だ か ら」→ 「安 い 」→ 「た く さ ん 食 べ て も支 出 は少 な い」こ とに な る こ とが 「意識 面 での プ ラス が 支 出 面 で の プ ラス に な る とは限 らな い」 … この こ と も,2 つ の デ ー タに よる区 分 が対 応 しな い理 由 の ひ とつ です. ⑥ デ ー タの タ イ プ が 異 な る,し か し,あ …そ う い うデ ー タ の 扱 い 方 と し て,こ
る種 の 対 応 関 係 が 存 在 す る と考 え ら れ る
れ ま で に 適 用 し た 分 析 方 法 を考 え な お し てみ
まし ょ う. た と えば,2 つ の 変 数 を組 み 合 わ せ た も の を参 照 して 区 分 け し て み る の で す. こ れ ま で の 方 法 で も2 種 の デ ー タ を組 み 合 わ せ て 扱 っ て い ま し た が 区 分 け し て か ら組 み 合 わ せ る の で は な く, 組 み 合 わ せ た もの を 使 っ て 区分 け す る のです.い
いか える と
結 果 を 組 み 合 わせ る の で は な く, 基 礎 デ ー タ を組 み 合 わ せ る
の で す. ⑦ 表7.1.4は,こ
の 扱 い を し た場 合 の 結 果 で す.
こ の 場 合, デー タA
と デ ー タ B の 計 測 単位 の ち が い が 影 響 す る こ と を避 け る
ため の 調 整 が 必 要 で す が,こ
こ で は,A
は そ の 部 分 で の 構 成 比, B は そ の 部 分 での
構成 比 に した 上 で 結 合 す る こ と で,影 響 を避 け て い ま す. 注 この例 で A も B も数 量扱 いす る こ と も考 え られ ます.構 成 比 の 形 で計 測 さ れ て い るB につ い て も,そ の 各 カ テ ゴ リー の 計 数 を ひ とつ ひ とつ,別 の 変 数,す
な わ ち数 量
デ ー タ扱 い す るの で す.
た だ し,分 散 の 大 きい変 数 が クラ ス ター 決 定 に 大 き くひ び く結 果 とな りま す か ら,数 量 デ ー タの場 合 は分 散 をそ ろ え て扱 い ます.
特 性 表 を み る と,ク
A1,A2,A3の
ラ ス タ ー1 と6 を 別 に して, 部 分 とB1,B2,B3の
部 分 が ほ ぼ 同 じパ タ ー ン を示 して い る
こ とが わ か り ます.
表7.1.4
デ ー タA,B
に よ る クラ ス タ リン グ
支 出 金 額 で み て も,意 識 の 面 で み て も,肉 は 肉,魚
は 魚,野
菜 は 野 菜 と対 応 し て い
るの で す. ⑧ こ の 例 で み られ た 関 係 を一 般 化 して い う と ち が っ た観 点 で 計 測 して い る デ ー タA,デ
ー タB で あ って も,
そ の カ テ ゴ リー 同 士 に 対 応 関 係 が あ る場 合, A,B を別 々 に 扱 うか わ りに,組
み 合 わ せ て 扱 え ば,
そ れ らの 対 応 関 係 に よ っ て 説 明 され る 区 分 が は っ き り と見 出 さ れ る と予 想 さ れ ます.⑦ こ れ が,⑧
で 述 べ た ま と め は,⑧
の 扱 い を す る と こ の よ うに か わ る の で す.
の 扱 い の効 用 で す.
も ち ろ ん,A とえ ば,A,B
に よ る 区 分 と B に よ る 区 分 と が い つ も対 応 す る と は 限 り ませ ん.た を別 々 に 扱 うか わ りに 組 み 合 わ せ て 扱 え ば,そ
場 合 と 比 べ て,結
れ ぞれ を別 々に 扱 った
果 が 大 き くか わ る こ と もあ る で し ょ う.
そ の 場 合 に は,
A に よ る 区 分 の効 果 と B に よ る 区分 の 効 果 が 相 互 に影 響 し あ っ て い る状 態 を把 握 で き る
こ と に な る で し ょ う.た た」 こ とが,A た め に,A
と え ば 「Aだ け で 区 分 し て そ の 差 はA に よ る と説 明 し て い
, Bを 組 み 合 わ せ て 扱 っ た 場 合 「B の 大 小 がA
に差 を もた ら してい た
に よ る差 と み ら れ て い た もの は B に よ る 差 と説 明 され る」 と い う こ と も
あ りえ ま す. そ う い う場 合 も含 め て
2つ の 情 報 を 組 み 合 わ せ て 分 析 す る場 合 に は 分 析 手 法 に 入 力 す る 前 の段 階 で 結 合 す る
の が 基 本 で す.
7.2 同 じ変 数 につ いて 条 件 を か え て観 察 した結 果 の 結 合 ① 前 節 で は,関
連 は あ る もの の 定 義 の 異 な っ た デ ー タ A,デ
ー タ B を扱 い ま し
た が,こ
の 節 で は,
同 じデ ー タ につ い て た と え ば 年 次 を か え て 観 察 し た結 果 を 扱 う場 合
を 取 り上 げ ま し ょ う. ② 例 示 と して は,前 と1996年
節 で 取 り上 げ た 「食 物 の 好 み 」に 関 す る県 別 デ ー タが1978年
に つ い て 求 め られ て い ま す か ら,こ れ ち を み て,「 食 物 の 好 み 」に 関 す る地
域 差 が こ の 期 間 に ど うか わ っ た か を み る 問 題 を取 り上 げ ま す.表7.2.3で
す.
注 この 節 の 説明 で は,前 半(④ まで)の 分 析 の結 論 を後 半(⑤ 以 降)で 否 定 す るこ とに な り ま す.順 さ い.
を 追 っ て よみ,前
半 の 結 論 誘 導 の 過 程 の ど こ に 問 題 が あ る か を 把 握 し て くだ
③ 計 算 は,前
節 と 全 く同 様 に進 め ら れ ま す か ら,そ
デ ー タ A が1978年 表7.2.1お
値(前
よ び 表7.2.2に
節 のA
と 同 じ も の),デ
お け る 特 性 に つ い て は,1
計 数 の 値 を 書 き 込 ん で あ り ま す(地
の 結 果 を 示 し ま し ょ う.
ー タ B が1996年
値 で す.
に 近 い 箇 所 が 多 い の で,特
化
域 差 が 少 な い こ と に 対 応 し た 措 置 で す).
この特性 に 注 目す る と
A4(0.9,1.2,0.9)
⇔
B4(0.9,1.2,0.9)
Al(1.3,0.8,0.8)
⇔
B1(1.1,1.0,0.9)
と 対 応 し て い る よ う で す.残
りの 部 分 に つ い て も
A3(1.0,1.0,1.0)
⇔
B3(0.9,1.0,1.1)
A2(0.9,0.8,1.2)
⇔
B2(1.0,0.8,1.2)
表7.2.1
デー タA に よ る ク ラ ス タ リ ン グ(1978年)
表7.2.2 デ ー タ B に よ る ク ラ ス タ リン グ(1996年)
注:表7.2.1と
表7.2.2は,プ
ロ グ ラム の 出力 に つ い て,構 成 メ ンバ ー の 対 応 関 係 を み て 区 分 番 号
を つけ か え た もの で す.
表7.2.3 区 分 A と区分 B の 組 み 合 わせ
と対 応 し て い る と み て よ い で し ょ う. こ の 関 係 は,各
区分 の 特 性 を み て 対 応 づ け て い ます か ら,メ ン バ ー 構 成 で も対 応 し
て い る か 否 か を 調 べ て み ま し ょ う. 2つ の デ ー タ に よ る区 分 を組 み 合 わ せ て,各 名 を示 し た の が,前 ④ まずA1に
ペ ー ジ の 表7.2.3で
組 み合 わせ 区分 に包含 され る メンバ ー
す.
注 目 して ど う変 化 した か をみ る と
A1 →B1: 0.9)と
A1の6/7がB1に
い う 状 態 で す か ら,こ
うつ っ て い る の 範 囲 で は,「
(1 .3,0.8,0.8)→
(1.1,1.0,
肉 が 好 き」 と い う状 態 が つ づ い
てい る と み て よ い で し ょ う. ま た,A4に
つ いて は A4 →B4:
A4の7/13がB4に
うつ っ て い る
(0 .9,1.2,0.9)→
(0.9,1.2,0.9)
A4→B1: A4の3/13がB1に
うつ り
(0.9,1.2,0.9)→
(1.1,1.0,0.9)
A4 →B3:
う つ っ て い る (0 .9,1.2,0.9)→
が A4の3/13がB3に
状 態 で す か ら,「 魚 が 好 き」 と い う状 態 が か わ ら な い と こ ろ,か
(0.9,1.0, 1.1)
わ った とこ ろが あ い
半 ば とい う こ とで す. A2,A3に つ い て は A2→B2:
A2の5/12がB2
(0.9,0.8,1.2)→
(1.0,0.8,1,2)
A2→B1:
A2の2/12がB1
(0.9,0.8,1.2)→
(1.1,1.0,0.9)
A2→B3:
A2の5/12がB3
(0.9,0.8,1.2)→
(0.9,1・0,1.1)
A3→B3:
A3の3/15がB3
(1.0,1.0,1.0)→
(0.9,1.0,1.1)
A3の8/15がB1
(1.0,1.0,1.0)→
(1.1,1.0,0.9)
A3の3/15がB2
(1.0,1.0,1.0)→
(1.0,0.8,1.2)
A3→B1: A3→B2:
とい う変 化 で あ り,特 性 の 一 致 し た 区 分 と対 応 し て い る と こ ろ(下 線 を つ け た 地 区) よ り,特 性 の 異 な っ た 区分 と対 応 して い る と こ ろ(下 線 以 外 の 地 区)の 方 が 多 い と い う状 態 に な っ て い ま す. そ の 意 味 で は,2 つ の 年 次 の 間 で か わ って い る の で す が,付
記 し た特 化 係 数 の 変 化
を み る と,
特 化 係 数 が(1,1,1)に近 い と こ ろ で の 変 化 が 大 多数 で あ る
こ と に 注 目 し ま し ょ う. これは
「1978年 と比 べ る と,1996年
で は 地 域 差 が 小 さ くな っ て い る 」(?)
こ と を 示 して い る の で す. 20年 も の 期 間 を経 て い る の で す か ら か わ るの は 当 然 で し ょ うが,地
域差が小 さ く
な る方 向 に 変 化 し て い る こ と が探 知 さ れ た の で す. た だ し,「?」
を つ け て い る と こ ろ に 注 意 し て くだ さ い.さ
らに考 察 をつづ け ま
し ょ う. ⑤ 「地 域 差 が 小 さ く な っ て い る 」 とい う記 述 は,そ
れ を誘 導 した数 理 手続 きで い
う と,「 特 化 係 数 で み た 差 が 小 さ くな っ て い る 」 とい う こ とで す か ら,「1978年
での全
国 平 均 に 対 す る 相 対 比 」が 離 れ て い た 状 態 か ら 「1996年 で の 全 国 平 均 に 対 す る相 対 比 」に 近 い 状 態 に か わ っ た こ と を意 味 し ま す. い い か え れ ば,
年 次 に よ っ て ち が う値 を分 母 と した 相 対 比
に つ い て 言 及 して い るの で す.い
わ ゆ る 「相 対 評 価 」値 を 比 較 し て い る の で す.
例 示 の場合
1978年
の 全 国 平 均 は
0.36,0.28,0.37
1996年 の 全 国 平 均 は
0.27,0.39,0.34
で す か ら,分 母 も大 き くか わ っ て い ます. し た が っ て,こ
の例 で は,
す べ て の 県 で か わ っ て い るが, 「 一 様 に 変 化 して い るの で,相
対 評 価 で は そ れ が 消 去 さ れ,
変 化 の 仕 方 が 一 様 だ と い う結 論 が 見 出 さ れ て い る」 の で す. ⑥ こ の よ う な相 対 比 較 で な く,絶 対 評 価 で み た い な ら 分母 を 「 年 次 に よ っ て か え な い 」形 で 扱 う こ とに す れ ば よ い の で す. 一 般 化 して い え ば7.1節
に 示 した 変 数 の 結 合 に 関 し て,表7.2.4の
よ うに,
異 な る年 次 の デ ー タ を観 察 単 位 方 向 に 結 合 す る 扱 い を採 用 せ よ とい う こ と で す. こ の 表 の 記 号 で は,2 種 の デ ー タA,B
が 同 一 変 数 に つ い て 条 件 を か え て観 察 さ れ
た もの に あ た る 場 合 を 想 定 して い ま す か ら,ど R1,R2と
表 わ し て い ま す.例
ち ら もA と 表 わ し,条 件 の ち が い を
示 で は 「年 次 」です が,そ
表7.2.4
変数方 向へ の結合
変 数 の 結 合―2
れ以 外 は
とお りの 扱 い
観察単位方 向への結合
表7.2.5
観 察 単 位 方 向 に 結 合 して ク ラ ス タ リン グ し た場 合
同 じ条 件 下 で の く りか え しに な っ て い る と い う意 味 でRepeat す な わ ち R と表 わ し て い る の で す. この 記号 でい うと
C とR×Aの
R×CとA
組 み 合 わ せ 表 と し て 扱 うの が 「変 数 方 向へ の 結 合 」 の 組 み 合 わ せ 表 と し て 扱 うの が 「 観 察 単位方 向へ の結 合 」
で す. ⑦ 表7.2.5が,観
察 単位 方 向 に 結 合 し た場 合 の 結 果 で す.
こ の 表 の メ ンバ ー 表 で は,年 は,各
次 区 分 も観 察 単 位 区 分 とみ な し て い ま す か ら,表
ク ラ ス タ ー ご と に 上 下 2段 に わ け て あ り.上 段 に1978年
に は1996年
の 場 合 の 所 属 を示 して い ます.た
ター 1,1996年
と え ば,県
の 場 合 の 所 属,下
6の 所 属 は1978年
で 段
は クラス
は ク ラ ス ター 6で す.
こ の 表 に お い て,2 つ の 年 次 の 所 属 区 分 に 注 目 して 同 じ動 き を し た 部 分 を 取 り上 げ る と,次 の よ うに 6区 分 に な っ て い ま す.
注 上 記38県 以 外 の 9県 に つ い ては 次 の よ うに な っ てい ます. from
1 to 4 が
2 県, from
2 to 6 が
1 県, from
4 to 6 が 2 県
from
5 to 2 が
2 県, from
5 to 3 が
1 県, from
5 to 5 が
1県
図7.2.6 2つ の 年 次 の 間 で み られ る変 化 の 方 向
図7.2.7
見 出 され た 変化 の ま とめ
こ の 図 で い う と,右 下 か ら左 上 へ の 変 化 が魚 の 増加 で あ り,右 か ら左 へ の 変 化 が 肉 の 減 少 で す.よ
っ て,「 ク ラ ス ター 区 分 6以 外 は,い
ず
れ も こ れ ら の 変 化 」を 示 して い る こ と,「 ク ラ ス ター 区 分 6は,こ
れ ら と少 しち が っ た 動 き」
を示 して い るこ とが よ み とれ ます.
括 弧 は,そ
れ ぞ れ の 区分 に お け る1978年
して い ます が,こ
の 節 の 扱 い で は,分
こ れ に よ っ て,た
値 で み た 特 性 と1996年
値 でみ た特性 を示
母 は 両 年 次 に 共 通 す る値 で す .
とえば
区 分 1か ら 区 分 2に 変 化 県 が10県
あ り,
(++,−,−)か
か わ って い る
ら(・,+,−)へ
とい う こ とで す. 他 の部 分 につ いて もみて い くと こ れ らの 変 化 に 関 して,「 肉 か ら 魚 へ の 変 化 」が 共 通 に 見 出 さ れ て い る こ とが 注 目 さ れ ま す. こ う い う変 化 の 方 向 を み る た め に は,基 礎 デ ー タ が 3区 分 で す か ら,1.3節 に,三
角 図 表 に 表 わ す とわ か りや す くな り ます.図7.2.6で
こ れ か ら よ み とれ る変 化 の 方 向 を,図7.2.7の こ の 説 明 は1978年
→1996年
と同 様
す.
よ うに ま とめ る こ とが で き ます.
に つ い て み ら れ た 傾 向 で す が,そ
の範 囲 をこ え た期
間 で の 変 化 の 道 筋 を示 唆 して い る … こ う一 般 化 で き そ うで す.
7.3 説 明 変 数 を つ け加 え る ① ク ラ ス ター 分 析 を適 用 す る と き,計 算 に よ っ て 得 ら れ た 区 分 の特 性 を説 明 す る ス テ ップ が 必 要 で す が,こ
の ス テ ッ プ は 機 械 的 に で き る こ とで は あ り ませ ん .
しか し,問 題 を取 り上 げ る 以 上 「な ん ら か の 予 想 を も っ て い る」は ず で す.
そ こ で,予
想 さ れ る 説 明 要 因 を い わ ば 説 明 変 数 と して デ ー タ セ ッ トの 中 に 入 れ て お
けば
そ の 値 を み る こ とに よ っ て,
各 ク ラ ス タ ー 区 分 の 特 徴 を解 釈 しや す くな る
で し ょ う. この 節 は,そ
う い う扱 い の 適 用 例 を あ げ て お き ま し ょ う.
② 食 費 支 出 の 地 域 差 を み る 問 題 で は,「 食 に 対 す る選 好 」に 注 目 す る こ と に な り ます が,「 支 出 に ま わ す 枠,す そ こ で,費
な わ ち収 入 の 大 小 」が 影 響 し て い る 可 能 性 が あ りま す.
目 別 支 出 と と も に,「 食 費 支 出 総 額 」 と 「収 入 総 額 」 を 取 り上 げ て み ま
し ょ う. 収 入 を 「食 費 」 と 「そ れ 以 外 の 支 出 」に ど う 配 分 す る か とい う観 点 も あ り え ます が, 「家 計 の ゆ と りの 度 合 い 」が,い
ま問 題 に して い る 「食 費 の 費 目別 支 出 」に ど う 影 響 す
るか を み る … そ の た め の 「説 明 変 数 」 と して 扱 お う とい うの で す.
この 節 の 分 析 で の 実 験 計 画
aの 部分 に注 目.a の部 分 に よ る クラ ス ター 区分 を説 明す る ため に bの部 分 をつ け加 える.
bの 部分 は数 量 デー タ なの で,そ れ ぞ れ の変数 の効 き方 を同 じにす る ため に aの 部 分 を数 量 デ ー タ扱 いに し,分 散 をそ ろえ て使 う.
◇ 注 :X,,X2,…,X12,を 質 的 デ ー タ扱 いす るこ と も考 え られ るが,そ の場 合Y1,Y2は デー タ扱 いで き な い の で,た
とえ ば,こ れ らの 変 数 は ク ラ ス ター 分 析 と離 して,ク
質的 ラス
ター 区分 別 平均 値 を計 算 す る. ③ こ の 場 合,収
入 や 食 費 支 出 総 額 は 「そ の 大 き さ を み る」形 で 使 い ま す.こ
対 して 「費 目別 支 出額 」は,そ した が っ て,こ
れに
れ らの 相 対 的 大 小 をみ る形 で 使 うの が 普 通 で す.
れ ら の デ ー タ を 結 合 して 扱 う と き に は
収 入 や 食 費 支 出 総 額 は,数
費 目別 支 出 額 は,質
量デ ー タ
的 デー タ
と して 結 合 す るの が 自然 です が,
タ イ プ の ち が うデ ー タ を 結 合 し よ う とす る と,
「そ れ ぞ れ の 単 位 の と りか た に よ っ て そ れ ぞ れ の 効 き方 が 異 な る」
な どの 扱 い に く さ が 生 じ ます か ら,こ
こ で は,
両 者 と も数 量:デー タ 扱 い し,
各 変 数 が 区 分 け に対 して 「同 等 に 効 く よ うに 」
標 準化 して 扱 う こ と と し ま す. も ち ろ ん,「 同 等 に 効 くよ う に 」扱 う こ と は 「結 果 と して 同 等 に 効 く」 とい う こ と で
は あ り ませ ん.
扱 い 方 を 同等 に して お け ば, 実 質 と し て も っ て い る効 き方 の ち が い を把 握 で き る
と い う こ とで す. ④ 次 の 表7.3.1と
表7.3.2が
ク ラ ス タ ー 分 析 の 出 力 で す.
こ の 分 析 結 果(以 下 扱 い A と よ び ま す.上
表7.3.1
明 変 数 をつ け加
説 明 変 数 を付 加 し て分 析 した 場合 とそ う しな い 場 合
の結 果比較―
表7.3.2
段 に 表 示)と と も に,説
メンバー構成
説 明変 数 を 付 加 して 分 析 した 場合 と そ う しな い 場 合 の 結 果 比較
―各 区分 の特性
え た こ との 効 果 を み る た め に,費 す.下
目別 支 出 だ け を 使 った 場 合(以 下 扱 い B と よ び ま
段 に表 示)と 比 較 す る形 に して あ り ま す.
扱 い A で は,沖
縄 県 が そ れ 1つ で 1ク ラ ス ター と な っ て い る の で,扱
い B で は,
ク ラス ター 数 を 5 と指 定 して い ま す. ク ラ ス ター 区 分 の 番 号 は,そ
れ ぞ れ の 扱 い で の 「平 均 収 入 」の 順 に つ け て あ り ま す.
⑤ ま ず 構 成 メ ン バ ー 表 を み る と,2 とお りの 扱 い の 結 果 は,よ す.収
く一 致 し て い ま
入 をつ け 加 え て も,支 出 構 成 だ け で 見 出 さ れ た 区 分 が再 現 さ れ て い る と い う こ
とで す. この こ と は,ク
ラ ス タ ー 特 性 表 で,
結 果 的 に,区
分 1が 「収 入 の 大 き い 区 分 」に な って い る が,
区分 け に は 「支 出 構 成 」に 関 す る変 数 が12だ
か ら,そ
の方 が効 い て
「区 分 1の よ うな 支 出 構 成 」を もつ 地 域 が ま と ま っ た, そ の 部 分 は 「収 入 が 高 い」 と い う結 果 に な っ て い る, と解 釈 で き る こ と を 意 味 し ま す. た だ し,支
出構 成 の 細 か い レベ ル で の 差 に つ い て は,収
入 をつ け 加 え た こ とが 結 果
に ひ び い て い る 可 能 性 が あ り ます. た とえ ば,メ
ンバ ー 構 成 の 出 入 りの 多 か っ た 区分 4 と区 分 5で は,扱
い での差 とち
が っ た 変 数 で わ け な お さ れ た 結 果 に な っ て い る よ う で す. す な わ ち,扱
い Bで は現 われ なか った
変 数 7(調味 料),変
が,区
数 9(調理 ず み 食 品)
分 4,区 分 5 をわ け る 形 に な っ て い ま す.
これ は
「 収 入 の 大 小 」→ 「共 稼 ぎの 多 少 」→ 「調 理 ず み 食 品 か 自家 調 理 か 」
とい うつ な が りが 効 い て い る もの と考 え ら れ ます. ⑥ 以 上 の こ と を,こ ○X1,X2,…,X12に Y1,Y2を
つ け 加 え て もほ ぼ 同 様 に 認 め ら れ る.
よ っ て,X1,X2,…,X12に
Y1,Y2の
よ る ク ラ ス ター 区 分 の 説 明 に
情 報 を使 う こ とが で き る.
○X1,X2,…,X12に
Y1,Y2を
こ で 採 用 し た分 析 計 画 の観 点 で ま とめ る と よ る ク ラ ス ター 区 分 は
よる クラス ター区分 の細 かい点 で は
つ け 加 え た こ とに よ る変 化 が 認 め られ る.
よ っ て,X1,X2,…,X12の ,Y2を
分 析 をY1
つ け 加 え る 形 に 改 め る こ とが で き る.
と い う こ とで す.い
い か え る と,分 析 にY1,Y2を
つ け 加 え る こ と に よ っ て,こ
の両
面 が 期 待 され るの で す. こ の 例 で は,結
果 と し て 第 一 点 が 大 きか っ た の で す が,扱
点 の 方 が 大 き い こ と も あ りえ ま す.
う問 題 に よ っ て は,第
二
7.4 説明 用 の 観 察 単 位 を つ け 加 え る ① ク ラ ス ター 分 析 の 結 果 の 説 明 を助 け る た め に,前 が,観
節 では変数 をつ け加 え ま した
察 単 位 をつ け 加 え る こ と も考 え ら れ ま す.
こ の 節 で は,そ
の 一 例 を あ げ ま し ょ う.
こ れ ま で と同 様 に,食
生 活 の 地 域 差 を み る 問 題(例 2)です が,ク
ち れ た地 域 区 分 に つ い て,そ め に,た
ラス ター分 析 で得
れ が 「ど う い う ま と ま り」に な っ て い る か を 説 明 す る た
と え ば 「東 北 地 方 」,「九 州 地 方 」 と い っ た 「慣 用 さ れ て い る地 域 区 分 」を使 う こ とが で き る とす れ ば, わ か りや す くな る
で し ょ う. も ち ろ ん,実
際 に そ う い う地 域 区 分 が そ れ ぞ れ 1つ の ク ラ ス ター 区 分 と し て ま と ま
る と は限 りませ ん か ら,
「そ うい う区 分 を採 用 す る」 と い う こ とで は な く,
「そ うい う区 分 と ど う対 応 す る か 」を 把 握 し よ う
と い う趣 旨 で す. ② そ の た め に は,ク
ラ ス タ ー 分 析 の 計 算 プ ロ グ ラ ムへ の 入 力 デ ー タの 中 に,
「説 明 用 の 区 分 」に対 応 す る デ ー タ を含 め て お く の で す. 例 示 の 場 合,47県
別 デ ー タ に,次
そ れ ぞ れ の 地 方 に は,括
の6 地 方 の デ ー タ を つ け 加 え て み ま し ょ う.
弧 内 の 県 を含 め る もの と し ます.
48:北
海 道 ・東 北 地 方 … … 7県(1/2/3/4/5/6/7)
49:関
東 地 方……7県(8/9/10/11/12/13/14)
50:中
部 地 方……10県(15/16/17/18/19/20/21/22/23/24)
51:近
畿 地 方……
52:中
国 ・四 国 地 方 … … … 9県(31/32/33/34/35/36/37/38/39)
53:九
6県(25/26/27/28/29/30)
州 ・沖 縄 地 方 … … … 8県(40/41/42/43/44/45/46/47)
注 慣 用 とい い ま した が,必 ず し もこの 区 切 り方 ばか りとは 限 りませ ん. ③ 7.3節 の ま とめ ⑥ と対 比 す る 形 で い う と,こ の 節 の 分 析 で は
O観 察 単位 区A1,A2,…,A47に 説 明 用 の 区 分B1,B2,…,B6を
よ っ て,A1,A2,…,A47に B1,B2,…,B6の
よ る ク ラ ス ター 区 分 は つ け 加 え て も ほ ぼ 同 様 に 認 め られ る. よ る ク ラ ス タ ー 区分 の 説 明 に
情 報 を使 う こ と が で き る
と い う効 果 を期 待 して い る の で す. ④ コ ン ピ ュ ー タの 出 力 で は,こ
れ らの 地 方 区 分 に 対 して48以
下 の番 号 を使 って
い ます が,説
明 文 の 中 で は,123456
と表 わ す こ とに し ます.
⑤ 表7.4.1は, 食 費 支 出12区 の デ ー タに 対 して,階
分 ×(47県+6地
方 区 分)
層 的 手 法 を適 用 した 場
表7.4.1
合 の 最 初 の 数 ス テ ッ プ で す. ス テ ッ プ1∼4で,4
つ の 地 方 区分 が そ れ
ぞ れ の 地 方 に 属 す る県 と合 併 さ れ て い ま す. す な わ ち,ス
テ ップ1 で 大 分 県 と 九 州,ス
テ ップ2 で 岩 手 県 と東 北 地 方,ス 岡 山 県 と中 国 ・四 国 地 方,ス
テ ップ 3で
テ ッ プ4 で 千 葉
県 と関 東 地 方 と,地 方 区 分 と そ れ に 含 まれ る 県 との 合 併 に な っ て い ます. 中 部 地 方 に つ い て は,ス に 現 わ れ て い ます が,合 す.最 初 に,他
テ ッ プ9 で表 の 中
併 の 相 手 は 島根 県 で
の 地 方 区 分 の メ ンバ ー と合 併
さ れ た と い う結 果 で す. 近 畿 地 方 に つ い て は,こ 囲 で は,ま
こに表示 された範
だ どこ と も合 併 さ れ て い ませ ん.
ス テ ッ プ21以
降 の 経 過 は,デ
ン ドロ グ ラ
ム の 形 で 示 し て い ま す(図7.4.2). 近 畿 地 方 に つ い て は こ れ で み る と,ス プ19で
滋 賀 県 と合 併 さ れ,ス
テッ
テ ッ プ38で
図7.4.2
京
ス テ ッ プ21以
降 の デ ン ドロ グ ラ ム
逐 次合 併 の経 過
都 府 ・大 阪 府(こ れ らは ス テ ップ12で 合 併 さ れ て い ま す.他
合 併 さ れ て い る)と,い
ず れ も近 畿 地 方 の 県 と
の 地 方 の 県 と の合 併 は 起 こ っ て い ま せ ん.
⑥ こ う い う経 過 を み る と,中 部 地 方 とい う く く り方 に は,「 食生 活 の 地 域 差 を み る 」と い う 目的 に 対 し て は 適 当 で な い こ と を 示 唆 し て い ま す.日 の 数 県,太
平 洋 側 の 数 県 か ら な る 地 方 区 分 で す か ら,そ
本 海 側 の 数 県,内
陸
うな る も の と 予 想 され る結 果
で す. ⑦ そ れ 以 外 の 区 分 に つ い て は,早 い と い う言 い 方 は,大
い 段 階 で 一 緒 に な っ た とか,一
緒に な るのが遅
き な 意 味 を も ち ませ ん.
ま と ま りの よ さ に つ い て 言 及 す る に は,あ
る段 階 で 区 切 っ て,そ
の段 階 での クラス
ター 区 分 とそ の メ ンバ ー 構 成 をみ るべ き で す. 15区 分(情 報 量 で は94%)ま 性 値 を示 し た も の が,表7.4.3で こ の 段 階 で,各
で 集約 した 段 階 で,各
ク ラ ス ター の構 成 メ ン バ ー と特
す.
地 方 区 分 と 同 じ区 分 に そ の 地 方 の何 県 が 含 ま れ て い る か を カ ウ ン ト
す る と,次 の よ うに な っ て い ます. 1
7県 中 4県,2
7県 中 2県,3
4
6県 中 3県,5
9 県 中 4県,6 8
こ の 段 階 で は,ど
10県 中 0県, 県 中 5県.
の 地 方 区 分 と も一 緒 に な っ て い な い 県 が あ りま す か ら,こ
で 「地 方 区 分 で み るの は 効 果 な し」 とい うわ け で は あ りませ ん が,中 う ま とめ に 問 題 あ り とい う こ とは で き ま す. さ らに 合 併 を進 め て み ま し ょ う. 9区 分(情 報 量70%)に
表7.4.3
す る と,表7.4.4の
区 分 数15(ス
よ うに な り ます.
テ ップ32)の
段 階 で の ク ラ ス ター 構 成
の数字
部 地 方(3)と
い
表7.4.4 区 分 数 9の 段 階 で の クラ ス ター構 成
こ の 段 階 で は 1 7県 中 4県,2 46県 中 3県,5
7県 中 2県,310県 9県 中 6県,6
中 3県, 8県 中 6県.
とな り ます. こ こ で は,中
部 地 方 と四 国 ・九 州 地 方 が 同 一 区 分 に な って い ます . した が って,両
地 方 を 区 別 し な い こ と とす れ ば 35 19県 中 9県 と い う こ と で す. した が っ て,慣
用 の 区 分 は,6
北 海 道 ・東 北 地 方 は 別 と して,食
み る た め の 区 分 と し て は 有 効 で な い とみ るべ き で す.分
生 活 の地域 差 を
析 手 順 と して 「そ うい う判 定
の た め に 有 効 だ っ た」が,「 結 果 と し て は 有 効 で なか っ た 」と い う こ と で す. ⑧ こ の 問 題 に 限 らず,地
方 区 分 を 設 定 す る と き 「大 都 市 圏 」,「そ の 周 辺 」と い っ
た 区分 が 有 効 な 場 合 が 多い もの で す. 慣 用 の 区 分 に こ だ わ らず, 問 題 ご とに,適
した 区 分 け を 見 出 して 使 う
よ う に し ま し ょ う. こ れ は,ク
ラ ス ター 分 析 を 使 っ て 求 め るか,概
本 的 な 考 え 方 で す.
念 規 定 と し て 定 め るか を 問 わ ず,基
問題 7
問 l プ ロ グ ラ ムCLASSを,付 を使 う が,ま
ず,そ
問 2 (1) 表7.1.1を る の で,プ
録 C を参 照 し て 使 っ て み よ.以
下 の 問 題 でCLASS
の 基 本 的 な機 能 を把 握 して お こ う と い う趣 旨 で あ る .
再 現 せ よ.基 礎 デ ー タ は デ ー タ フ ァ イ ルDK51Sに
ロ グ ラ ムCLASSと
デ ー タ フ ァ イ ルDK15Sを
含 まれ て い
指 定 し,デ ー タ の 扱
い を C,区 分 数 を 4 と指 定 す る こ と.
(2) 表7.1.2を
再 現 せ よ.基 礎 デ ー タ は デ ー タ フ ァ イ ルDM20に
デ ー タ セ ッ トの う ち1978年
分 を 指 定 す る こ と.デ
含 まれ て い る
ー タ の 扱 い は C,区 分 数 は 4
と指 定 す る こ と.
(3) 表7.1.4を
再 現 せ よ.こ
を 使 うが,そ
の 表 で は,(1)と(2)の
基 礎 デ ー タ を結 合 し た もの
う し た も の を デ ー タ フ ァ イ ルDM20Yに
記 録 して あ る の で,そ
れ
を指 定 す る こ と. 問 3 (1) 表7.2.1,表7.2.2,表7.2.5を
再 現 せ よ.
こ れ ら の 表 の 基 礎 デ ー タ は す べ て,デ
ー タ フ ァ イ ルDM20に
記録 され て い
る. (2) 表7.2.1お して,7.2節 問 4 表7.2.5の
よ び 表7.2.2を
ク ラ ス ター 数 6,表7.2.5を
計 算 で は,2 つ の 年 次 の デ ー タ を観 察 単 位 方 向 に 結 合 し た が,変
方 向 に 結 合 す る こ と も考 え られ る.デ ー タ フ ァ イ ルDM20に セ ッ ト を用 意 して あ るの で,そ 問 5 (1) 表7.3.1お
よ び 表7.3.2の
こ の 表 の 計 算 で はDK51X中 を使 う が,そ の で,そ
数
は そ う したデー タ
れ に ク ラ ス ター 分 析 を適 用 し て み よ . 扱 い A の 部 分 を再 現 せ よ. の デ ー タ セ ッ トに 変 数Y1,Y2を
う し た デ ー タ セ ッ トが デ ー タ フ ァ イ ルDK51Pに
つ け加 え た もの 記録 され て い る
れ を 指 定 す る こ と.
(2) 表7.3.1お
よ び 表7.3.2の
デ ー タ フ ァ イ ルDK51Pに 問 6 (1) 表7.4.1,図7.4.2,表7.4.3を こ の 場 合,県 ルDK51Xに
ク ラ ス ター 数 8 と
で得 られ た結 果 を くわ し くす る こ と を試 み よ .
扱 い B の 部 分 を再 現 せ よ.
は こ の た め の デ ー タ セ ッ ト も記 録 さ れ て い る. 再 現 せ よ.
別 デ ー タ と地 域 区 分 別 デ ー タ を結 合 し て 使 うが,デ
ー タ ファ イ
そ う し た デ ー タセ ッ トが 記 録 され て い る.
(2) こ の 場 合(1)で 使 っ た デ ー タ セ ッ トに つ い て,地
域 区 分別 平 均値 の 部 分 の
変 数 値 の 小 数 点 の位 置 をず ら し た もの を用 意 して そ れ を 使 う こ と.
8 時間的変化 の分析
ク ラ ス ター分 析 に よっ て対 象 デ ー タを 区分 け す る,そ うす る こ とに よ って,現 象 の 変化 を 説 明 す る … この 節 で は,そ こ まで視 点 を ひ ろ げ, その なが れ の 中で ク ラス タ ー分析 を どの よ うに適 用 す るか を考 え ま しょ う.
8.1 各 年 次 ごと にク ラス タ リ ング ① 表8.1.1の れ て い ます.こ
よ う に 東 京23区 れ に も とづ い て,居
の 居 住 者 の職 種 構 成 の デ ー タが 5年 ご と に 調 査 さ 住 者 の 職 種 構 成 が い つ,ど
の ようにか わ ったか を
み る こ と に し ま し ょ う. 居 住 者 の 構 成 に 応 じた 地 域 区 分 を 見 出 す … こ こ は ク ラ ス ター 分 析 で 扱 う問 題 で す が,「 見 出 さ れ た 区 分 の 情 報 を使 っ て,変
化 を 説 明 す る 」と こ ろ ま で 視 点 を ひ ろ げ て
考 え ま し ょ う. ② まず,各
年 の 情 報 を切 り離 して,そ
た結 果 を比 べ て み ま し ょ う.さ
表8.1.1
東 京23区
職 種 構 成 …A:管 務 職,C:販 ビス職.
れ ぞ れ の 年 ご と に ク ラ ス ター 分 析 を適 用 し
らに 深 く考 え る に して も,ま ず 最 初 に,こ
の 居 住 者 構 成 の 変 化(例 4)
理 的 職 種,専
売 的 職 種,D:生
門技 術 職 種,B:事 産 的 職 種,E:サ
ー
の比較 を し
図8.1.2
各 年 次 ご とに ク ラ ス タ リン グ
区分1 足 立 ・葛 飾 ・ 江 戸川
区分 2 江 東 ・隅 田 ・ 荒川 区 分3 品 川 ・大 田 ・ 北 ・板 橋
区 分4 千代 田 ・ 中央 ・台 東 区分 5 港 ・新 宿 ・文 京 ・ 目黒 ・渋 谷 ・豊島
区 分6 世 田谷 ・中 野 ・ 杉 並 ・練 馬
分散分析表
各 区 分 ご とに,そ
の 区 分 に お け る 「職 種 構 成 」 と,そ れ に 包含 さ れ る メン バ ー 名 を示 す.
職 種 構 成 は,5 つ の 区 分 別 構 成 比 に つ い て,23区 *:多
い,+:や
や 多い,・:
表 の 下 部 に示 す分 散 分析 表 は,各
や 少 な い,=:
少 ない
年 次 に お け る 「全 分 散 」「級 内 分 散 」「級 間 分 散 」で あ る.
て お く と よ い で し ょ う.図8.1.2は,そ この 図 に お け る地 域 区 分 は,そ
平 均 で み た 構 成 比 と比 べ て
平 均 並 み,−:や
の 結 果 を ま とめ た も の です.
れ ぞ れ 他 の 年 次 と関 係 な く定 め られ た もの で す が,
構 成 メ ン バ ー を対 照 して 「主 な 対 応 関 係 」 を見 出 し て,対
応 す る とみ られ る 区 分 を矢
印 で 結 ん で い ます. 1 メ ン バ ー の み の 動 き は 図 示 して い ませ ん. こ う し て,ク
ラ ス ター 構 成 の 変 化 をみ る と,こ の 例 で は
1970年 に,区
1970年
分1 と区 分2 とが1 つ に な っ た
に,区 分3 が2 つ に わ か れ た が,こ
れ は1975年
に は も とに も ど っ た
区分 6に つ い て は,1970年
以 降 に わ か れ た 区 分 を 6,7と す る と
4→5,5→6,6→7の
方 向 へ 移 動 し た メ ンバ ー が み られ る
こ とが わ か り ます.
1960∼1965年
の 間 は ほ とん ど か わ っ て い な い の に
1965∼1970年
に は,か
な りの 変 化 が あ っ た
と総 括 し て よ い で し ょ う. ③ こ こ まで の 説 明 に は,問
題 点 が ひ そ ん で い ます.そ
れ は…
デ ー タの 時 間 的 変 化 を分 析 す る と き,
対 象 デ ー タ の 区 分 をか え る と
区 分 をか え た こ とに よ る変 化(小 さ い に して もあ り う る)と 指 標 値 の 変 化 とが 混 在 す る
こ と で す. 構 成 変 化 が この 例 示 程 度 な らそ の こ と を無 視 し て よ い で し ょ うが, 比 較 の 論 理 と し て は,大
きい 問 題 点
で す. ④ 変 化 の 説 明 を簡 単 化 す る た め に は, 区 分 の 仕 方 は,固 定 して お く こ とが 考 え られ ま す. た と え ば 地 域 を 区 分 し,各 区 分 ご とに 異 な る施 策 を適 用 し て そ の 結 果 を観 察 す る と い った 使 い 方 をす る と き に も 「あ る 期 間 中 は 区 分 を 固 定 して お く」べ き で し ょ う.こ の例 で は,そ
うい う扱 い を適 用 で き ます か ら,次 節 で 説 明 し ま す.
⑤ こ の こ とに 関 連 し て,図8.1.2に
示 す 「区 分 特 性 」の よ み 方 を,復
ま し ょ う.
ク ラ ス ター 区分 を 見 出 す た め に 使 う場 合 と 「年 次 変 化 をみ る」た め に 使 う場 合 と をわ け て 考 え る
こ とが 必 要 で す. ま ず,表8.1.3の
例 示 を み て くだ さい. 表8.1.3
各 区 分 の 特 性 を構 成 比 で比 較―比較
1
習 して お き
表8.1.4
注:こ
うい う計 算 が で き るが,使
各 区 分 の特 性 を構 成 比 で 比 較―
比較 2
う の は 疑 問.
年 次 変 化 を み る た め に,特 化 係 数 す な わ ち 「各 区 分 で の 構 成 比 」の 「 標 準 の 構 成 比 」に 対 す る相 対 比 を使 っ て い る こ とに 注 意 し ま し ょ う. 図8.1.2で に,各
は,各
年 次 ご とに わ け て 扱 っ て い ま し たか ら,標 準 の 構 成 比 は,必
然的
年 次 の デ ー タ全 体 で み た 構 成 比 が 使 わ れ て い ます.
その ため に使 った特化 係数 を 「 特 性 値(構 成 比)」の 変 化 を み る た め に 使 う と, 年 次 の 異 な る値 を比 較 す る と き, デ ー タ全 体 で み られ る年 次 変 化 は 比 較 の 枠 外 に お か れ る こ とに な りま す. い い か え る と, デ ー タ全 体 で み られ る年 次 変 化 と比 べ て, それ 以上 かそ れ以下 か をみ る こ とに な りま す. 構 成 比 そ の も の の 変 化 を み る に は,特
化 係数 の計 算 にお け る 「 標 準 の 構 成 比 」 を,
年 次 に か か わ ら な い 値 とす れ ば よ い … す な わ ち,表8.1.4の す が,比
較 し よ う とす る区 分 の 構 成 が か わ っ て い るの で,形
よ うにすれ ば よい の で 式 的 に そ う い う計 算 を し
て も,解 釈 困 難 な結 果 に な り ます. ⑥ そ こ で,④
に述べ た ように
あ る 時 点 で 求 め た 「ク ラ ス タ ー を 固定 し て,そ
の特性 値 の変化 をみ る」
と い う扱 い が 必 要 と な っ て く るの で す. そ の た め に は,ク
ラ ス ター 区 分 を 見 出 す た め に 使 う特 化 係 数 と,結 果 を 比 較 す る た
め に 使 う特 化 係 数 と を,以 下 の 節 で は 区 別 して 考 え ま す.
8.2 ク ラス ター 区 分 を 固 定 して,指 標 値 の 変 化 を み る ①
前 節 の 表8.1.3お
よ び 表8.1.4を
「メ ン バ ー 構 成 を 初 年 時 の ま ま に した 区 分 」に つ い て 計 算 し な お す こ とが で き ます. こ の 再 計 算 は,ク
ラ ス ター 分 析 の 計 算 で は あ り ませ ん.
特 定 さ れ た 区 分 に つ い て の 構 成 比 の 計 算 と, そ の変 化 を み る た め の 特 化 係 数 の 計 算
です. し た が っ て,特
化 係 数 の分 母 に使 う 「 全 体 で の 構 成 比 」と し て,表8.2.1の
各 年 次 の値 を使 う こ と も,表8.2.2の 表8.1.4に
対 応 す る も の が 表8.2.2で
よ うに
よ う に,初 年 時 の値 を使 う こ と も で き ます. す が,表8.2.2の
場 合 は 構 成 メ ン バ ー が どの
年 次 も 同 じ で す か ら,初 年 時 の値 を 使 っ て 計 算 し た特 化 係 数 を使 う こ と も考 え ら れ る の で す. 表8.2.1で
も,表8.2.2で
も
ク ラ ス タ ー 区 分 を 固 定 し て,指 標 値 の 変 化 をみ る こ とが で き る の で す が,
構 成 比 の 変 化 をみ る た め に 使 う 「 標 準 の 構 成 比 」の 選 び 方 が ち が う
の で す. ② 例 示 した 特 化 係 数 の 計 算 をす べ て の 区 分 に つ い て 実 行 して み ま し ょ う. 表8.2.1
各 区 分 の 特 性 を構 成 比 で比 較―
比較 3
表8.2.2
各 区 分 の 特 性 を構 成 比 で比 較―
比較 4
表8.2.3
注:こ
各区分の年次別構成比
表8.2.4
特 化 係 数―
各 年 次 の構 成 比 に 対 す る比 と して 計 算(比 較 3)
表8.2.5
特 化 係 数―
年 次 平 均 構 成 比 に 対 す る比 と して計 算(比 較 4)
れ ま で 「初 年 時 」と し て い た と こ ろ を 「年 次 平 均 」と変 更 して い ま す.こ
れ は,論
旨の本質 に
か か わ ら な い変 更 です.
表8.2.3が
各 区 分 の 年 次 別 構 成 比 で あ リ,そ れ を,特 化 係 数 に した もの が 比 較 3の
場 合 は 表8.2.4で
あ り,比 較 4の 場 合 は 表8.2.5で
す.
③ こ れ に よ っ て 「 構 成 比 の 変 化 」 を よ む の で す が,構
成 比 そ の も の は,ど
ち らの
扱 い をす るに して も同 じ情 報 で す. した が って,た
と え ば 図8.2.6の
よ うな 「 帯 グ ラ フ 」に し て 比 較 す れ ば よ い の で す
が, い くつ か の 区 分 に お け る 構 成 比 を比 較 し よ う とす る と き
図8.2.6
構成 比の比較図
あ る 「標 準 の 構 成 比 」を 想 定 し た 特 化 係 数 を使 う こ と と した 場 合 に, 標 準 の 選 び 方 と して 2 とお りの 扱 い が,考
え られ る
こ と と な る の で す. ④ こ の 例 示 を 一 般 化 す る と,次 の 扱 い A と扱 い B に あ た りま す. 扱 い A で は,各
区分 での構 成比 の変化 を
全体 でみた構 成比 の変化 以上 に大 きいか否 か をみ る形 扱 い B で は,各
区分 で の構 成 比 の 変 化 を
全 体 で み た 初 年 時 の 構 成 比(年 次 に 関 係 し な い 値)と 比 べ る 形 に な って い る こ とか ら,次
の 表 の よ う に ま とめ る こ と が で き ます.
特化係 数 で比較 す る場 合の 2つ の扱 い 扱 い A(比 較 3)
扱 い B(比 較 4)
特化係数 各 区分 でみ た年 次別構 成 比 /全 体 で みた年 次 別 構成比
年次比 較 に影響 す る要 因は
各 区分 でみ た年次 別構 成比 /全体 で みた年 次平 均構 成比
注
分 子 の年 次変化 と
分子 の年 次変 化
分母 の年次 変化 比較 の意味 全 体 でみ た変化 を前提 と した
年 次変 化 と区 分 間 変 化 を あ わ せた 絶対 評価
相対評価
1 比 較 1も扱 い A と同 じで あ る が,比 較 区 分(ク ラ ス ター 区分)が 年 ご と に異 な る の で,指 標値 の年 次 変 化 を よみ に くい. 注 2 3区 分 の 構 成 比 な ら,図8.2.6の 例 は 5区 分 で す が,区
分 を1+2,3+5,4
か わ りに 三 角 図 表 を使 う こ と が で き ま す.こ
の
と お き か え て 三 角 図 表 に し た も の が 図8.2.7で
す.
これ に よ って,年 次 変 化 の万 向 をみ るこ とが で き ます. そ れ が グ ラ フの 効 用 です が,こ の 節 で 問題 に して い る よ うに 2とお りの見 方 が考 え られ る場 合,こ の 見 方 の ちが い は グ ラ フに して も よみや す くな る わ け で は あ りませ ん.だ か ら,2 とお りの 見 方 に対 応 す る特 化 係 数 を計算 して お き,見 方 に応 じた よみ方 を誘 導す るの です. 図8.2.7
構 成 比 の 比 較 図(3 区 分 の場 合)
8.3 ク ラ ス タ ー 区 分 を 固定 す る こ との 妥 当 性 評価 ① 時 間 的 変 化 を 分 析 し よ う とす る 場 合,前
節 で例 示 した よ う に,ク
をか え な い 形 で 扱 う こ とが 考 え られ ます. その 扱 い で は,た
とえば
初 年 時 の デ ー タ だ け に つ い て ク ラ ス タ ー 分 析 を適 用 し そ の 後 の デ ー タ につ い て は,指 標 値 の 計算 の み を 行 な う こ とに な り ます. こ の た め に 「比 較 の 論 理 が 簡 明 に な っ て い る」の で す が,
ラス ター 区分
指 標 値 の 変 化 が 著 し い場 合, 初 年 時 に 求 め た ク ラ ス ター 区分 の 有 効 度 が 年 々 落 ち て い く と い う問 題 が あ り ます. ② した が っ て,そ
の こ と をチ ェ ッ クす る た め の 参 考 と し て,
後 の 年 次 に つ い て も ク ラ ス ター 分 析 を適 用 して お く こ とが 考 え ら れ ま す. た だ し,区 分 す る こ とが 目的 で は な く,使 め です.ク
っ て い る区 分 の 有 効 性 をチ ェ ッ クす る た
ラ ス タ ー 分 析 を適 用 す る意 図 の ち が い に 注 意 し ま し ょ う.
③ ク ラ ス ター 区 分 の 有 効 性 を 評 価 す る た め に は,分 表8.3.1と
表8.3.2は,各
散 分 析 表 を使 い ます.
年 次 ご と に ク ラ ス タ ー 分 析 を適 用 し て ク ラ ス ター 区 分 を
更 新 し た場 合 と,初 年 時 に求 め た ク ラ ス ター 区 分 を 固 定 した 場 合 に つ い て の 分 散 分 析 表 です. 全 分 散 は,こ
の 例 で は 年 々 小 さ くな っ て お り,職 種 区 分 別 構 成 が 均 等 化 す る 方 向 に
変 化 して い る こ と を示 し ます. 級 間 分 散 も小 さ くな っ て い ます が,全
分 散 に 対 す る 比 は1960,1965,1970年
につ
い て は ほ ぼ 一 定 して お り, 均 等 化 の 傾 向 が ど の 地 域 も一 様 で あ る こ とを 示 し て い ま す. 1975年
に つ い て は こ の 状 況 が か わ り,地 域 に よ る ち が い が 大 き くな っ て い ます.
こ こ ま で が,表8.3.1か 表8.3.2に
ら よめ る こ とで す .
つ い て は,
区 分 の 仕 方 を 固 定 して い る こ とか ら 級 内 分 散 が 大 き く な る と い う 「数 理 上 の 効 果 」が つ け 加 わ っ て い ま す. こ れ が 2つ の 表 の 数 字 の 乖 離 に な っ て い る の で す. 1975年
に は こ の 乖 離 が 急 増 し て お り,区 分 の 更 新 を考 え るべ き 時 期 だ と示 唆 し て 表8.3.1
表8.3.2
各 年 次 ご とに 区 分 を更 新 した場 合
初 年 次 に 求 め た 区分 を 固 定 した 場 合
表8.3.3
級内分散の内訳
い ま す. ④ ク ラ ス ター 区 分 を 固 定 して い る表8.3.2に ち,各
つ い て は,級
内 分 散 の 内 訳,す
ク ラ ス ター 区 分 ご と に わ け て み た 分 散 を求 め て お け ば,こ
なわ
の 乖 離 が どの 区 分 で
起 こ っ て い るか を把 握 で き ま す. この例 につ い ては 1975年
で 大 き くな っ て い る の は,区 分 2で の 変 化 に よ る
とみ られ る よ う で す.
8.4 指 標 植 の 変 化 を み るた め の ク ラ ス タ ー区 分 ① 「 観 察 単 位A ×指 標 区 分B 」の ク ロ ス表 が い くつ か の 年 次 区分 C ご と に 求 め ら れ て い る場 合,表8.4.1の
よ うに
「年 次 区 分 別 デ ー タ を観 察 単 位 方 向 に 結 合 して ク ラ ス タ ー 分 析 を 適 用 す る」 と,指 標 値(構 成 比)の ち が い をみ る た め の 特 化 係 数 は,ど
の年 次 に も共 通 な値 に な
りま す か ら,
表8.4.1
構 成 比 に よ る 年 次 比 較 と, 特 化 係 数 に よ る年 次 比 較 が 同 等
で す. し た が っ て,変
化 の 見 方 と し て は,扱
い B と 同 等 で す.初 ろ を,複
年 時 の値 と した と こ
数 年 次 の平 均 で み た値 とお きか
え る こ と に な り ま す が,こ
れ は本 質 的 な
ちが い で は あ り ませ ん. ② た だ し,ク
ラ ス タ ー 区 分 は,観
察
単 位 の 区 分 で は な く, 「各 年 次 の 観 察 単 位 を 別 々 の 観 察 単 位 と み な し て,そ
れ ら を 区分
年 次 別 デ ー タ を観 察 単 位 方 向 に結 合
す る」
こ と に な り ます か ら, 「同 じ観 察 単 位 が 年 に よ っ て 異 な る ク ラ ス タ ー に 区 分 され る こ とが あ り う る」 の で す.い
い か え る と,
「所 属 区 分 の変 化 」に よ って 状 態の変 化 をみ るこ とに なる の で す. 前 節 で考 え た 「 所 属 区 分 の 変 化 」 と 「指 標 値 の 変 化 」 を識 別 す る とい っ た 問 題 は 生 じ ませ ん . そ の 点 で は 簡 明 な 扱 い に な り ます. しか し,指 標 値 の 変 化 を み る(量 的 な 扱 い を す る)か わ りに,所 て カ テ ゴ リー 扱 い をす る こ とに な り ま す.い じ区 分,す
い か え る と,あ
属 区 分 の変 化 と し
る閾 値 を こ え る まで は 同
な わ ち 変 化 な し とみ な し,閾 値 を こ え た と きに 区 分 が か わ る,す
なわ ち変
化 が 起 こ っ た とみ な す … こ う い う扱 い を す る こ とに な り ます. 注 閾値(し きい値)は,た
とえ ば,現 象 が あ る 限度 ま で は抑 制 され て い る が,限 度 を
こえ ると抑 制 が効 か な くな って,突 然,動
き出 したか の よ うに み え る … そ うい う場 合 に
使 わ れ る用 語 です. し た が っ て,状
態 の変化 を
量 的 な変 化 と して 把 握 で き る と予 想 さ れ る な ら, 指 標 値 の 変 化 で み る こ と を考 え る 質 的 な変 化 と し て 把 握 す る 方 が 妥 当 だ と予 想 さ れ る な ら …
所 属 カ テ ゴ リー 区 分 の変 化 で み る こ と を考 え る この よ うに 使 い わ け を す べ きで す .
た だ し,複 数 の 指 標 を使 っ て変 化 をみ る場 合 に は,そ
れ ぞれの変 数 の変化 が 一様 で
は あ り ませ ん か ら,
そ れ ら の 変 数 を総 合 し て み た と きの 変 化 は, 変 化 の 態 様 を カ テ ゴ リー わ け し て,カ
テ ゴ リー 間 の 移 動 で み る 扱 い
を採 用 す る の が 普 通 で し ょ う. ③ 図8.4.2は,そ 形 式 は,前
の 扱 い を した 場 合 の 結 果 で す.
節 の 図8.1.2と
あ わせ て あ り ます が,基
礎 デ ー タの 扱 い が 異 な る こ と に
注 意 し て 比 較 し ま し ょ う. 図8.4.2の
場 合,
同 一 行 に 並 べ た1 セ ッ トの 枠 が,
ク ラ ス ター 分 析 で 出 力 さ れ た1 つ の ク ラ ス タ ー
に 対 応 し ます. い い か え る と,ク
ラ ス タ ー 分 析 で 見 出 され た構 成 メ ン バ ー を 「年 に よ っ て 表 示 位 置
図8.4.2
4年 分 の デー タ を 観 察 単位 方 向 に 結 合 して 分析 した 場 合
各 年 次 ご とに わ け て,そ ます が,解
れ ぞれ の 枠 内に 示 した 地 区 の 平 均 でみ た特 性 値 を 計 算 で き
釈 しに くい 値 で す か ら,計 算 して い ませ ん.
をか え て 図 示 して い る 」の で す . この こ とか ら,あ
る年 に つ い て は 所 属 メ ンバ ー の な
い ク ラ ス ター もあ りえ ます. ま た,ク か ら,種
ラ ス タ ー の特 性 は,そ
の ク ラ ス ター に 属 す る 観 察 値 の 平 均 で み た 情 報 で す
々 の 年 次 の 情 報 が 反 映 した もの に な っ て い ます.
④ 全 体 を 通 覧 す る と 1960年
か ら1965年
に か け て は ほ とん どか わ っ て い な い こ と
1965年
か ら1970年
に か け て 大 き くか わ っ て い る こ と
が わ か り ます. し た が っ て,1965年
か ら1970年
部 分 を 拾 い 上 げ て み ま し ょ う.
に か け て の 変 化 を み る た め に,そ
の間 に変 化 した
O
区 分1(7,8,18,21,22,23)
→
区 分2(7,8,18,21,22,23)
O
= = ・ * =
・ ・ + −
区 分2(9,11,17,19)
→ 区 分4(9
,17)
区 分4(3,4,5,13,16) →
区 分5(1
,2,3,4,13,16) * + +
→ 区 分6(5
= *
* + ・ − −
区 分7(10,12,14,20)
* * ・ = ・
,10,12,14,15)
これ らの 変 化 に お い て 共 通 す る の は, 特 性 区 分 の 第4 項 「工 場 労 働 者 」が 少 な くな っ て い る こ と 特 性 区 分 の 第1 項,第2
項 「ホ ワ イ トカ ラ ー 」が 多 くな っ て い る こ と
特 性 区 分 の 第5 項 「サ ー ビ ス 職 」が 多 くな っ て い る こ と
で す. 土 地 価 格 の 高 騰 → 工 場 の 地 方 移 転 → 跡 地 を 利 用 した 高 層 住 宅,と
い っ た流れ に対
応 して い る とみ る こ と が で き る で し ょ う. ⑤ こ の よ うに,表
示 され た 情 報 を よみ ま した が,厳
密 に い う と,
「変 化 し た」 と い う用 語 は 「あ る 閾 値 を こ え た 変 化 が 認 め られ た 」 と い う意 味 で あ る こ と に 注 意 し ま し ょ う.②
== ・・ ・ ++ _ ・ = O ・ ・ ・ − * ・ ・ ・ − + O
で 説 明 し た こ とで す.
問題 8
問 1 プ ロ グ ラ ムCLASSを
使 っ て,図8.1.2を
再 現 せ よ.デ ー タ タ イ プ は C,ク ラ
ス ター 区 分 は 6 とす る. 基 礎 デ ー タ は,各
年 次 分 と も,デ ー タ フ ァ イ ルDG10Xに
そ れ ぞ れ の 年 次 分 の 出 力 を こ の 図 の 形 に ま とめ る に は,ク を参 照 して,ク
含 ま れ て い る. ラ ス ター メ ン バ ー
ラ ス ター 番 号 をつ け な お す こ と.
問 2 問 1につ い て,ク
ラ ス ター 区 分 が 与 え ら れ て い る もの とす れ ば,ク
性 に 関 す る情 報 は,プ
ロ グ ラ ムCTAO3(ま
た はCTAO3X)を
ラ スター 特
使 っ て計算 で き る
こ と を確 認 せ よ. CTAO3の 問 3 (1)プ
使 い 方 は,問 題 5を 参 照 す る こ と.
ロ グ ラ ムCLASSデ
年 分 の 結 果 を再 現 せ よ.結
ー タ フ ァ イ ルDG10Xを 果 は,プ
使 っ て 図8.1.2の
う ち1960
リ ン ト出 力 し て お くこ と(後 の 問 い で 使 い
ま す). 注:問3∼5の
は じめ の部 分 は問 1の 出 力 と して 得 られ て い ます が,あ との 部 分 は,
それ らの出 力 を使 って 計 算 すべ き場 合,あ
る い は,プ ロ グラ ム の適 用 や デー タの
選 び 方 をか え て再 計 算 すべ き場合 が あ ります.そ (2) 1965年
うい う場 合 をみ きわめ る こ と.
分 に つ い て,(1)と 同 じ計 算 を行 な え.
(3) 表8.1.3の
う ち1960年
お よ び1965年
分 の 情 報 を こ れ ら の 出 力 を使 っ て 計
う ち1960年
お よ び1965年
分 の 情 報 を こ れ ら の 出 力 を 使 って 計
う ち1960年
お よ び1965年
分 の情 報 をこれ らの出 力 を使 って 計
うち1960年
お よ び1965年
分 の 情 報 を こ れ らの 出 力 を 使 っ て 計
算 せ よ. (4) 表8.1.4の 算 せ よ. (5) 表8.2.1の 算 せ よ. (6) 表8.2.2の 算 せ よ. 問 4 表8.2.3,表8.2.4を ば,各
再 現 せ よ.問3(5),(6)と
同 じ計 算 だ が,次
の 手順 に よ れ
区 分 の 値 を一 括 し て 計 算 で き る.
(1) 1960年 の デ ー タ に つ い て プ ロ グ ラ ムCLASSを
適 用 して ク ラ ス ター 区 分 を
求 め る. (2) 各 年 次 の デ ー タ に つ い て,(1)で 求 め た ク ラ ス ター 区 分 別 に 集 約 し た と き
の構 成 比,特
化 係 数 を,プ
問 5 表8.2.3,表8.2.5を
ロ グ ラ ムCTAO3を
再 現 せ よ.問
(2) に つ い て は,各
4 と 同 様 の 手 順 を 適 用 す れ ば よ い の だ が,
年 次 の デ ー タ を 観 察 単 位 方 向 に 結 合 し た デ ー タ セ ッ トを使 う
こ と.こ の デ ー タ セ ッ トは,デ 問 6 表8.3.3の
使 っ て 計 算 す る.
ー タ フ ァ イ ルDG10Xに
記 録 さ れ て い る.
情 報 が 問 4の(2)で 得 られ て い る こ と を確 認 せ よ.
問 7 図8.4.2の 情 報 を再 現 せ よ. 「各 年 次 の デ ー タ を 観 察 単位 方 向 に 結 合 し た デ ー タ セ ッ ト」(問 5で 使 っ た も の)に つ い て ク ラ ス タ ー 分 析 を適 用 す れ ば よ い. こ の場 合 の 出 力 で は,た 1970年 分 は47,1975年
と え ば 区 の 番 号 が,1960年
分 は70の
よ う に23を
分 は 1,1965年
分 は24,
加 えた 形 に なっ て い るの で 注 意
す る こ と. 問 8 (1) 表8.4.1と
同 じ考 え 方 の 分 析 を1960年
と1965年
の 範 囲 に つ い て 行 な え.
(2) 表8.4.1と
同 じ考 え 方 の 分 析 を1965年
と1970年
の 範 囲 に つ い て 行 な え.
(3) 表8.4.1と
同 じ考 え方 の 分 析 を1970年
と1975年
の 範 囲 に つ い て 行 な え.
(4) 対 象 期 間 を こ の よ う に わ け て 分 析 す る こ と に よ っ て,ど され るか.
う い う効 果 が 期 待
9 地 域 デ ー タの 分 析
地 域 区分 に対応 す るデ ー タを扱 う場 合 には,そ れ を表 現 す る 地域 区 分 の 選 び 方が 問 題 に な ります.た とえば,あ る現象 の 地 域 的変 化 を説 明 す る場 合 に,そ の こと を ど うい う形で 考 慮 に入 れ るか … … こ の章 で は,ク ラス タ ー分 析 を適 用す る場合 に つい て,こ の こ とを考 え ま しょ う.
9.1 表現 単 位 の サ イ ズ の 選 び 方 ① こ の 章 で は,東
京 都 周 辺 に お け る 人 口 増 加 の 様 子 を 調 べ る問 題 を例 に と っ て 説
明 し ま す か ら,ま ず,市
区 町 村 別 「人 口密 度 」 を示 す 図 を あ げ て お き ま し ょ う.
人 口密 度 に す る の は,人
口 の 地 域 分 布 を表 現 す る ため に 使 う 単位
図9.1.1
市 区 町 村 区分 で み た 人 口分 布
… 市 区町 村 のサ
イ ズ(面 積)が 異 な る こ とか ら,そ の ち が い を 補 正 す る た め で す.い
い か え れ ば,「 広
い 市 区 町 村 ほ ど 人 口数 も大 き くな る」 とい う当 然 の傾 向 を除 去 し た 上 で 比 較 し よ う と い う こ と で す. 前 ペ ー ジ の 図9.1.1を
み て くだ さ い.
「都 心 か ら離 れ る に つ れ て 人 口 密 度 が 低 くな る」傾 向 が は っ き り と よ み と れ ます. ま た,同
じ 図 を 年 次 を か え て か き,比 較 す る と 「ど ん な と こ ろ で 人 口増 加 現 象 が 起
こ っ て い る か 」を み る こ とが で き るで し ょ う. ② 人 口 増 加 現 象 を起 こ す 地 域 が 年 々 都 心 か ら 遠 い 位 置 に ひ ろ が っ て い る こ と か ら,こ の 図 の よ う な 人 口 分 布 に な るの で し ょ う. そ の こ と を確 認 す る た め に,東 km,20∼30
km,30∼40
km,50
京 都 心 を 中 心 と す る 距 離 が10km以 km以
遠 の 距 離 帯 区 分 を想 定 して,そ
帯 に お け る 人 ロ 数 の 推 移 を示 し た も の が,図9.1.2で
す.対
内,10∼20 れぞ れの距 離
象 期 間 は,1950年
か ら
1980年 の 5年 間 隔 で す. ③ こ の 図 で は,横
軸 に 各 年 の 人 口,縦 軸 に 年 間 の 変 化 を と っ て い ます.
こ の 形 式 の 図 を,レ ベ ル レー ト図 と よ び ます.レ と,レ ー トす な わ ち 「あ る 期 間 中 の 変 化 」 を縦 軸,横
ベ ル す な わ ち 「あ る 時 点 の 状 態 」 軸 に と っ た 図 で,現
象 の時 間 的
推 移 を分 析 す る と き に こ の 図 を使 う と,時 間 的 変 化 の 種 々 の タ イ プ を 識 別 す る た め に 役 立 つ 表 現 法 で す. こ の レベ ル レー ト図 上 の 点 の 位 置 に 関 し て,図9.1.3に 頭 に お け ば,図9.1.2上
の 動 き に つ い て,次
示 す よ うに よめ る こ と を 念
の よ うな 説 明 を 導 く こ とが で き ま す.
距 離 帯 3お よ び 4を み る と,推 移 説 明 図 の 状 態 aか ら b を 経 て cに 遷 移 し よ う と して い ま す.距 状 態a→b→cで
離 帯 2で は,状
態 bか ら cに 遷 移 し て い ま す.ま
す.
図9.1.2
距 離 帯 区 分別 に み た 人 口推 移
た,距
離 帯 5で は,
最 も都 心 に 近 い 区 分 で はd→aと
な って い る よ うで
図9.1.3
レベ ル レー ト図 の よみ方
す. した が っ て,
一 般 にa→b→c→dと
い う
状 態 遷 移 を た ど っ て い るが, 都 心 に 近 い 距 離 帯 ほ ど先 行 して い る と説 明 で き ます. レベ ル レー ト図 の 形 式 を 採 用 した の は,成
長 経 路 が,
こ の 図 上 で 直 線 あ る い は放 物 線 で 表 わ され る こ とが 多 い の で,同
じ条 件 下 で の 推 移 と,条 件 が か わ っ た た め の 変 化 を識 別 で き る と予 想 さ れ る
た め で す(9.2節
参 照).
④ 「 都 心 か ら離 れ る に つ れ て 人 口 密 度 が 低 く な る 」傾 向 に つ い て 以 上 の 図 で 把 握 で き ま した が,さ
ら に 見 方 を細 か く し よ う とす る と,た
と え ば,「 駅 か ら 離 れ る ほ ど
低 く な る 」 とい う傾 向 が あ る の で は な い か … こ う問 い か け が 出 て く る で し ょ う. こ れ ま で の 表 現 で は,「 そ こ ま で は わ か ら な い 」 と い わ ざ る を え ませ ん.市
区 町村
区 分 の デー タ を扱 っ て い る た め で す. 地 域 デ ー タ と して よ く使 わ れ る の は,県 政 区 画 で あ る こ とか ら,そ と に な る の です が,そ
別 デ ー タや 市 町 村 デ ー タ で す.そ
の 区 分 別 に 集 計 さ れ た デ ー タ が 多 い の で,よ
れ らが 行
く使 わ れ る こ
れ ら を使 う こ と に は 重 要 な 問題 点 が 含 まれ て い る の で す.
市 区 町 村 とい う大 き い 区 切 りに 対 応 す るデ ー タ を使 っ て い る こ とか ら く る 限 界 で す か ら,も
っ と小 さ い 地 域 区 分 に 対 応 す る デ ー タ を検 索 して み る の で す .
⑤ 1km×1kmの
区 切 り に 対 応 す る統 計 デ ー タ が 「地 域 メ ッ シ ュ 統 計 」 と い う名
で 公 表 され て い ます.そ こ こ で は,そ
し ょ う.図9.1.4で 図9.1.1と
の 内容 に つ い て は,次
節 を参 照 して くだ さ い.
の 中 の 人 口数 の デ ー タ を,図9.1.1と
同 じ範 囲 に つ い て 図 示 して み ま
す.
比 べ て は るか に 情 報 表 現 が ゆ た か に な っ て い ます.た
と え ば,都
心か ら
離 れ る に つ れ て 人 口密 度 が 低 く な る とい う大 き い傾 向 だ け で な く,国 鉄 私 鉄 の 沿 線 沿 い に 高 密 度 地 域 が 伸 び て い る こ と,そ
の 前 線 か ら離 れ た と こ ろ に 点 状 に 高 密 度 地 点 が
存 在 す る こ とが よ み とれ ま す . ま た,こ
れ に つ い て,図9.1.5の
よ う に 「等 高 線 」を 書 き込 ん で お け ば,そ
の線の
位 置 の 変 化 と して 人 口 の 推 移 を 説 明 で き ます . ⑥ こ れ ら の 図 に よ って 人 口 現 象 に つ い て 細 か く観 察 で き る こ と が,小
さい 区分 の
デ ー タ を使 っ た こ との 効 果 で す . 逆 に い う と,図9.1.1は,大
き い 区 分 の デ ー タ を使 っ た こ とに よ る 「表 現 精 度 の 限
界 を も っ て い る 」の で す. ま た,精
度 だ け で な く,「 歪 ん だ 表 現 に な っ て い る 」こ とに 注 意 し ま し ょ う.
「駅 の 近 辺 の 高 密 度 状 態 は 実 態 よ り も小 さ い 値 に な る 」,「駅 か ら 離 れ た 地 域 の 低 密
図9.1.4
地 域 メ ッ シ ュ統 計 に よ る表 現
図9.1.5
人 口密 度 の 等 高 線 表 示
度 状 態 は 実 態 よ り も大 きい 値 に な る 」と い う 「表 現 精 度 の 低 下 は,サ 区 町 村 ほ ど著 しい 」の で,地
イズ の大 きい市
域 全 体 の 傾 向 をみ る と き に 「表 現 精 度 の ち が い に と も な
うゆ が み 」が 発 生 して い る の で す. ⑦ 距 離 帯 別 に み た 図9.1.2に
つ い て も,そ れ が 市 区 町 村 の デ ー タ を使 っ て い る こ
とに 注 意 し ま し ょ う.そ れ ぞ れ の 市 区 町 村 の デ ー タ を 「市 区 町 村 を単 位 と して どれ か 1つ の 距 離 帯 に 対 応 させ て い る」の で,上 10km区
述 した 表 現 の ゆ が み が ひ そ ん で い る の で す.
分 で み て い る の で そ の ゆ が み は 目立 ち ませ ん が,距
れ が 問題 とな っ て き ます.し な い の で す.
た が っ て,そ
離 帯 を細 か くす る と,そ
れ 以 上 に 細 か い 地 域 区 分 に 関 して 言 及 で き
⑧ 地 域 デ ー タ を扱 う と きに は, 都 心 か ら離 れ るに つ れ て … 駅 の近 辺 では …
と い う地 理 的 な 連 続 性 を も つ 現 象 と
とい う ス ポ ッ ト的 な現 象 が 重 な っ て い る
こ と を 適 切 に 表 現 す る こ とが 必 要 で す. 連 続 性 を もつ 現 象 を表 現 す る に は そ れ に適 した 大 き さの 区 分 で 表 現 し,ス
ポ ッ ト的
な現 象 を表現 す るに は それ に適 した小 さ さの 区分 で 表現 す る … 地域 メッ シュ統 計 は,そ
う い う 区 分 を 見 出 す た め の 素 材 と して 重 要 な情 報 源 で す.こ
で あ る ク ラ ス タ ー 分 析 は,普
の テ キ ス トの 主 題
通
基 礎 デ ー タが あ る適 当 な サ イ ズ の 区 切 りで 表 現 さ れ て い る も の と し て 着 目 して い る情 報 の 類 似 して い る 区 分 を ま と め る とい う観 点 で 使 わ れ ます が,そ
れだけ で な く
基 礎 デ ー タ を情 報 表 現 に 適 した サ イ ズの 区 分 に ま とめ る とい う観 点 で も使 わ れ ます.9.3節 で,情
で 地 域 メ ッシ ュ 統 計 に つ い て 説 明 した 後,9.4節
報 表 現 単 位 を 見 出 す こ と を 目的 と し た ク ラ ス ター 分 析 適 用 例 を 説 明 し ま す.
⑨ また,現
象 の 変 化 を 説 明 す るた め に は,基 礎 デ ー タ を,レ
に 対 応 す る よ う に プ ロ ッ ト した 上,そ
集 約 す る形 で ク ラ ス タ ー 分 析 を適 用 す る と い う扱 い 方 も9.4節 ク ラ ス ター 分 析,す
ベ ル レ ー ト図 上 の 点
の 平 面 上 で の 距 離 に 注 目 し て,距
離 の近 い点 を
で 説 明 し ます.
な わ ち 距 離 の 近 い 観 察 単 位 を ク ラ ス タ ー に ま とめ る … 数 理 と
して は こ う い う 説 明 で よ い の で す が,
現 象 の 変 化 が あ る 平 面 上 の 動 き と して 表 現 で き る と き に は そ の 平 面 上 で の 距 離 を使 え
と い う の が 「ク ラ ス タ ー 分 析 適 用 に 関 す る 重 要 な考 え 方 」で す.
9.2 補 足:レ ベ ル レー ト図 ① 現 象 の 時 間 的 推 移 に は 種 々 の 型 が あ り ま す が,よ 9.2.1の
よ う に,急
激 な 増 加 が 次 第 に ゆ る や か に な り,あ
くみ ら れ る 型 と し て,図 る限 界 値 に 近 づ く カ ー プ を
示 す ケ ー ス が あ り ます. こ の 例 の よ うに 「時 間 的 推 移 の 型 が 直 線 で な い 」 と い う こ とは, 値 が 大 き い と こ ろ で の変 化 と値 が小 さ い と こ ろ で の 変 化 とが 異 な る こ と を意 味 し ます. 同 じ こ とで す が, 値 の レベ ル が 大 き く な っ て,あ 値 の 変 化 が 小 さ くな る と い う言 い 方 に して も よ い で し ょ う.
る 限 度 に 近 づ く と,
図9.2.1
レベ ル レー ト図 の 例(1)
図9.2.2
レべ ル レー ト図 の 例(2)
一 般 化 す る と
,変 数X(t)の 値 に つ い て, "こ の レベ ル に な って い る"と い う観 点 で の 計 測 値(レ ベ ル 値)
と "レ ベ ル の 変 化 が 大 き い
,小
さ い"と い う観 点 で の 計 測 値(レ ー ト値)
との 2 とお りの 計 測 値 を組 み 合 わ せ て 説 明 す る こ と を 意 味 し ま す. ② 後 者 に つ い て は,変
化 量 で み る こ と も変 化 率 で考 え る こ と も で き ま す.ど
ち ら
を 使 うか は 問 題 ご とに 考 え る も の と し,「 レー ト」 と い う 言 葉 で 一 般 化 し て お き ま し ょ う. 記 号 で表 現 す る と
変 化 量= 変 化率= で す が,そ
れ ぞ れDX, RXと
略 記 す る こ と に し ま し ょ う.
③ レベ ル と レー トを わ け る こ とは,例
示 の 問 題 に 限 ら ず,現
象 の 実 態 に か か わる
説 明 を す る と きに 有 効 で す. 普 及 率(レ ベ ル)ア ップ に 関 係 す る要 因 と,そ た らす 要 因 は,同
じで は あ り ませ ん.し
の 普 及 率 の 変 化(レ ー ト)に 影 響 をも
た が っ て,推
移 を 説 明 す る に は,両
面 を わけ
て 考 え ね ば な り ませ ん. 図9.2.1の
よ う に 上 限 が 存 在 す る と予 想 さ れ る カ ー ブ に つ い て は,レ
るに つ れ て,レ い て は,レ う.し
ー トが 減 少 す るで し ょ う.図9.2.2の
ベ ル が 上 昇す
よ うに循 環 性 を示 す カ ー ブ につ
ベ ル を あ る範 囲 に お さめ る要 因 が 働 い て レー トを か え る こ とに な る で しょ
たが っ て, レベ ル と レー トと を わ け て み る と と もに, レベ ル と レー トとの 間 に 存 在 す る相 互 関 係 を考 慮 に 入 れ る
こ とが 必 要 で す.
図9。2.3
レ ベ ル レ ー ト図(図9.2.1に
④ そ こ で,変
数X(t)の
レ ベ ル 値X(t)を
レ ー ト値DX(t)ま
対 応)図9.2.4
推 移 をX-T平
レ ベ ル レ ー ト 図(図9.2.2に
対 応)
面 上 に プ ロ ッ トす る か わ りに,
横軸に た はRX(t)を
縦 軸 に とった 図
を か い て み ま し ょ う. これ を 「レベ ル レ ー ト図 」 と よ び ます. レー ト値 と してDXを レベ ル レー ト図(X,DX),レ
使 っ た 場 合 とRXを 使 っ た 場 合 と を 区 別 し た い と き に は, ベ ル レ ー ト図(X,RX)と よ ぶ こ とに し ま し ょ う.
図9.2.3は,図9.2.1を
レベ ル レ ー ト図(X,DX)に
こ の グ ラ フ 上 で み た 推 移 曲 線 は,放
お き か え た もの で す.
物 線 と想 定 して よ い よ う で す.
⑤ ま た,
レベ ル レ ー ト図 上 で の 推 移 と,
XTプ
ロ ッ ト上 で の 推 移 曲 線 の 形
に 関 す る対 応 関 係 を表 わ す モ デ ル を想 定 で き ま す. た とえ ば レベ ル レー ト図(X,DX)上
の
は,XTプ
直 線 DX=β(X一 α) ロ ッ ト上 の 指 数 曲 線 に 対 応 して い る こ と,
(1)
二 次曲線
(2)
は,図9.2.1の (1)式 が1つ
DX=β(K-X)(X-L)
よ う な 成 長 曲 線 に 対 応 す るモ デ ル に な っ て い る の で す . の 漸 近 線 を もつ の に 対 し て,(2)式
は2つ
の 漸 近 線 を もつ 曲 線 に な っ て
い ま す. 前 節 で例 示 し た 図9.2.1の
場 合 は,こ
の モ デ ル で 表 わ さ れ る よ う で す,こ
移 曲 線 を ロ ジ ス テ ィ ッ ク カ ー ブ と よ び ま す.こ よ っ て 次 の 式 で 表 わ さ れ る こ と が わ か り ま す.
の カ ー ブ は,(2)式
の形 の推
を 積 分 す る こ とに
こ れ につ い て は,本
シ リー ズ 第2巻
『 統 計 学 の 論 理 』で くわ し く解 説 して あ り ます.
9.3 東 京 都西 部 にお ける 人 口推 移(1) ① 問 題 意 識
9.1節 の 図9.1.4に
示 し た よ う に,地 域 メ ッ シ ュ統 計 を使 っ て 東
京 都 西 部 の 人 口 分 布 を み る と,都 心 か らの 距 離 に 応 じた 変 化 と と も に,人
口集 中地 点
が 散 在 して い ま す. ま た,大
き い 地 域 区 分 に つ い て 人 口 の 年 次 推 移 をみ る と,図9。1.2で
都 心 か ら の 距 離 に 応 じて ち が う も の の,そ
み る よ う に,
の 推 移 を表 わ す カ ー ブ は 並 行 して い る よ う
で す. ② こ の 節 で は,図9.1.4で
扱 っ た 小 地 域 区 分(東 京 西 部 の144地
年 次 変 化 を み る こ と に しま し ょ う.た
だ し,人
対 象 とす る地 域 は下 に 示 す とお りで す.中 で す が,そ
の 北 側 に3本
点)に つ い て,
口 の か わ りに 「住 宅 数 」 を使 い ま す.
央 線 沿 い に,荻
窪 か ら立 川 に わ た る 範 囲
の 私 鉄 が 都 心 か ら放 射 状 に 伸 び て い る … こ れ らの 線 と関 係 この節 で対象 とす る地域範囲
して 人 口推 移 を み て い き ま し ょ う. 大 き い 区 分 で み る と図9.2.1と
同 様 の 推 移 を示 して い る が,小
そ の 推 移 とは 異 な っ た 変 化 を示 して い る と予 想 さ れ る,そ 条 件 と ど う関 係 し て い る か が わ か る 図 に 改 め た い …
さ い地 点 で み る と,
う して そ れ が 各 地 点 の 立 地
そ うい う問 題 意 識 で す.
い い か え る と, 図9.2.1と
同 様 の傾 向 線 上 の 動 き を示 す 地 点 と
そ の 傾 向 線 か ら シ フ トす る形 の 変 化 を 示 す 地 点 を 識 別 す る こ と を考 え るの で す. ③ 考 え方 X1,期
「人 口 X の 地 域 区 分 別 デ ー タ 」を あ る期 間 に つ い て 求 め た期 首 値 を
末 値 をX2と
られ ます が,そ
す る と,(X1,X2)に
つ い て ク ラ ス タ ー 分 析 を適 用 す る こ とが 考 え
の 扱 い よ り も,そ の 動 きに 関 し て 予 想 さ れ て い る
傾 向 線 に 沿 っ た 位 置 を表 わ す X
傾 向 線 か らの シ フ トを表 わ すDX
の 形 に 組 み 替 え て,(X,DX)に
つ い て の 地 域 差 を み る形 に し て 扱 う 方 が よ い で し ょ
う. い い か え る と,(X,DX)面
上 で の 点 の 位 置 に 関 し て ク ラ ス ター わ け を す る と い う
こ と で す. ④ ク ラ ス タ ー 分 析 を す る,し (X,DX)平
な い に か か わ ら ず,
面 に 点 を と り,そ れ ぞ れ の 点 の 位 置 の 変 化 を 図示 す れ ば
「傾 向 性 と個 別 性 と を わ け て 示 せ る」 … 考 え 方 は こ うい う こ とで す . そ の とお りだ が,そ
うい う 図 をか い た 後 で,図
示 さ れ た結 果 の 説 明 を考 え る と,
変 化 の 類 型 に 対 応 す る よ う に 点 の数 を 減 ら し て お き た い の で す. そ う して お け ば,(X,DX)上
の 点 を 地 図 上 の 点 に 対 応 づ け て,「 こ の 地 点 で は こ う
だ 」 と説 明 しや す くな るか らで す ・ そ れ を考 え た 「 情 報 要 約 手 段 」 と し て,(X,DX)に
対 し て ク ラ ス タ ー 分 析(こ こ で
は 非 階 層 的 手 法)を 適 用 す る の です. ⑤ 指 標 値 の 選 択 X と レー ト値DXに 図9.3.1で
し た が っ て,手
順 と し て は,ま
わ け て レベ ル レー ト図(X, DX)を
ず 基礎 デー タ X を レベ ル値 か い て お き ま し ょ う.こ れ が
す.
後 の 説 明 で 参 照 し ま す か ら,レ ー トを 変 化 率RXで 図(X,RX)(図9.3.2)も
表 わ し た 場 合 の レベ ル レー ト
示 して お き ます.
ど ち らの 場 合 も,変 化 をみ る期 間 が 5年 と長 い の で,差
を 「前 の 年 次 と の 差 」を み
るか,「 後 の年 次 との 差 」 をみ る か で ち が っ て く る で し ょ う. 普 通 は, 扱 い A:
レー トを み る期 間 の期 末 で の レベ ル を み る,す な わ ち
レベ ル 値 を X2 レー ト値 を DX=X2-X1
または
とす る の が 普 通 で す が, 扱 い B: レ ー トを み る期 間 の 中 央 で の レベ ル をみ る,す
なわ ち
レベ ル 値 を レ ー ト値 を DX=X2-X1,
または
とす る こ とが 考 え られ ま す.「 レ ベ ル 値 を み る時 点 」 と「 レー トを み る期 間 の中央 」 と を合 わ せ る とい う意 図 で す. こ の 他 に もい くつ か の 代 案 が 考 え られ ます.た
と えば
扱 い C: レベ ル を み る 時 点 を 中心 と し, そ の 前 の 期 間 で の レー ト とそ の 後 の 期 間 で の レー トを み る,す
なわ ち
レベ ル値 を X2 レ ー ト値 を DXl=X2-Xl
と DX2=X3-X2 と
また は とす る こ と も考 え られ ま す. レー トを測 る期 間 が 長 い の で,時
点 の 前 の 期 間 で み た レー トと,時 点 の 後 の 期 間 で
み た レー トを 区 別 し よ う と い う趣 旨 で す. 以 下 で は,こ
の 扱 い C を 採 用 し ます.
⑥ 手 法 の 選 択
ク ラ ス タ ー 分 析 で は こ の 図 の144個
タ ー に わ け よ う とす る の で す が,注
の 点 を い くつ か の ク ラ ス
意 を要 す るの は
「ク ラ ス タ ー 分 析 の 基 礎 デ ー タ で の 遠 近 」す な わ ち(X,DX)平 と 「観 察 単 位 の 位 置 属 性 で の 遠 近 」す な わ ち地 図 上 で の 距 離 と を 区 別 し な け れ ば な ら な い こ とで す.
面 上 での 距離
ク ラ ス タ ー 分 析 で(X,DX)平 え る と,地
面 上 で の 距 離 に 注 目す る に して も,結 果 の 説 明 を考
図 上 で の 位 置 関 係 を なん ら か の 方 法 で 考 慮 に 入 れ る こ と を考 え るの で す.
こ れ が こ の 章 の 問 題 で 新 し い 点 で す . こ の 節 と次 の 節 に わ け て 説 明 し ます が, ク ラ ス タ ー 分 析 を 適 用 す る と き に は,観 結 果 を み る段 階 で,考
察 単 位 の 位 置 を考 慮 せ ず
慮に 入 れ る … この 節
ク ラ ス ター 分 析 を適 用 す る と き に,観
察 単 位 の 位 置 を考 慮 す る … 次 節
で 説 明 す る もの と し ます. ⑦ 結 果
この節 で は
「ク ラ ス ター 分 析 は(X,DX)平
面 で,
地 図 上 で の 説 明 は その 結 果 を み る ス テ ップ で 」 と わ り き っ た 扱 い を適 用 して み ま し ょ う. こ う い う 扱 い な ら,ク
ラ ス ター 分 析 の部 分 は こ れ ま で の 各 章 と同 じ形 で 進 め る こ と
が で き ま す. 表9.3.3は, レベ ル 値 と して1945年
値 X
レー ト値 と して1940∼1945年
の 変 化DX1お
よ び1945∼1950年
こ れ ま で と同 様 な 出 力 形 式 に な っ て い ます が,こ
の 出力につ い ては
を使 っ た 場 合 の 出 力 で す.
O 特 性 が,1 つ の 変 数 X の 推 移 の経 路 を, レベ ル 値 と レー ト値 に わ け て 計 測 した 値 に な っ て い る こ と O 観 察 単 位 が 地 理 的 な 位 置 に 対 応 し て い る こ と に 注 意 して よ む こ とが 必 要 で す. した が っ て,ま
ず,こ
の 表9.3.3を
⑧ 第 一 点 に つ い て は,た
よ み や す い 形 に 図 示 し ま し ょ う.
とえ ば
表9.3.3
ク ラス ター 分 析 の 出 力
の 変 化DX2
ク ラ ス タ ー1 は 指 標 1,2,3 す なわ ち 変 数 X,DX1,DX2の
い ず れ も大 き い値 だ
クラス ター 5は 変 数 X は 平 均 並 み だ が,変 と い う こ と です が,そ
DX1,DX2の
数DX1,DX2は
大 きい値 だ
れ ら は 相 互 に 関 連 し た動 き を示 す 変 数 値 で す か ら, 大 小 が X の 大 小 に対 応 す る か 否 か
を よ む こ とが 必 要 で す. こ の 例 の 場 合 は,ク く,ク
ラ ス ター1 は,X
ラ ス ター 5 で は,X
が 大 き い の で そ れ な りにDX1,DX2も
が 小 さ い の にDX1,DX2が
大 き
大 きい … こ うい うよ み 方 を
す る こ と を 意 味 し ま す. ク ラ ス タ ー 分 析 に使 っ た 入 力 デ ー タに つ い て の レベ ル レ ー ト図 が 図9.3.1の な っ て い ま す か ら,ク
ク ラ ス タ ー 分 析 の出 力 に つ い て か い た レベ ル レー ト図 が,次 レー ト値 を対 象 時 点 の 前 で み た場 合 と,後
の 図9.3.4で
こ れ か ら, 1940∼1945年
に お け る変 化 の 著 しか っ た 区 分 は 6で あ り
1945∼1950年
に お け る 変 化 の 著 しか っ た 区 分 は 5 と 3で あ る
こ とが わ か りま す. につ いて
区 分1,2,4,8,10を 結 ぶ 線 が 一 般 的 な 推 移 に 対 応 して い る と み れ ば,
図9.3.4
す.
でみ た 場 合 と を わ け ま す か ら,図
に わ け て あ り ます.
ま た,1940∼1945年
よ うに
ラ ス タ ー 分 析 の 出 力 も 同様 な分 布 に な る と予 想 さ れ ま す.
ク ラ ス タ ー 区 分 の レベ ル レー ト図(10区
分)
は 2つ
図9.3.5
ク ラ ス タ ー 区 分 の 位 置 表 示(10区
分)
X の大 小 を模 様 の 濃 淡 で表 示 ク ラ ス タ ー1,2,(3,4,5),(6,7,8),(9,10)の
5区分
DXの 大 小 を 枠 の 線 で 表 示
太 線:6,
太 線:5,細
細 線:5,7,9 線:3
for 40∼45 for 95∼50
区 分 5,7,9 は この 推 移 と比 べ て い くぶ ん上 に シ フ トし て い る
と よ む こ と も で き そ うで す. ⑨ 次 に,各
ク ラ ス ター 区 分 の 位 置 を み ま し ょ う,
分 析 の 基 礎 デ ー タが12×12の して い ます が,た
区分 に 対 応 して い ま す か ら,表9.3.3で
と え ば ク ラ ス ター6に
対 応 す る位 置 は 「ど こ と ど こか 」を み る に は,
そ れ が 1か 所 に ま と ま っ て い な い の で,探 そ こ で,た
と え ば 図9.3.5の
もそ の形 に
す こ とが 必 要 と な り ま す.
よ うに 図 示 して お くの で す.
地 理 的 な位 置 と し て は1 か 所 に ま と ま っ て い な い,し
か し,指 標 値 の 区 分 と し て は
同 一 区分 に ま と ま って い る … た とえ ば 「大 規 模 な 団 地 開 発 な ど に よ っ て 増 加 し た 地 域 は ス ポ ッ ト的 に 出 現 す る 」こ とか ら,そ
う な る で し ょ う.
地 理 的 に も連 続 し た 区 分 に な る … た と え ば 「人 口密 度 の 大 小 は 地 域 的 に 連 続 し た 形 に な る 」で し ょ うか ら,そ し た が っ て,後 指 標X
う な る で し ょ う.
者 につ い て は, の 大 小 に 対 応 す る ゾ ー ン を模 様 の 濃 淡,
指 標DX1,ま
た はDX2の
で 示 す こ と に して い ます. こ れ が,図9.3.5の
表 現 で す.
大 小 に 対 応 す る地 点 を枠(線 の 種 類 で 2段 階)
9.4 東 京 都 西 部 にお ける 人 口推 移(2) ① 分 析 を 精 密 化 す る に は 9.3.4,図9.3.5)に
よ っ て,対
で き た よ うで す が,も
前 節 の 分 析 結 果(表9.3.3)お
よ び そ の 図 示(図
象 地 域 の 人 口推 移 に 関 し て 妥 当 な説 明 を 与 え る こ とが
う一 段,精
密 化 す る た め に,ク
ラ ス ター 区 分 数 を 増 や す こ と を
考 え ま し ょ う. そ の た め に は,前
節 の 扱 い を そ の ま ま,ク
ラ ス ター 区 分 数 を か え て 適 用 す れ ば よ い
と い え る で し ょ うか. この 問 題 に お い て は 点 的 な現 象(局 地 的 に み られ る 人 口増 加 地 点)と 面 的 な現 象(都 心 か ら離 れ る につ れ て 人 口密 度 が 徐 々 に 低 くな る傾 向)が 共 存 して い ます. そ の うち 前 者 に つ い て は 地 理 的 な 位 置 と切 り離 して デ ー タ 空 間 の 上 で 細 か く ( 細か す ぎ る と誤 差 が 大 き く な る に し て も そ の 限 度 内 で)区 分 す る こ と で よ い で し ょ うが, 後 者 に つ い て は,デ
ー タ 空 間 の上 で 細 か くす る こ と が 地 理 的 な位 置 と して の ま と ま り
を見 出 す こ とに 直 結 す る とは 限 ら な い の で す.地 な ん らか の 形 で,そ
理 的 な 連 続 性 を もつ 現 象 で す か ら,
の 変 化 を くわ し くみ る た め に は
デ ー タ空 間 で の 距 離 で の 指 標 値 の 差 を 測 る に し て も 実 空 間 で の 距 離 の 遠 近 を考 慮 に 入 れ て 区分 を定 め る とい う扱 い を考 え る こ とが 必 要 とな る の です. ② 方 法 の 選 択
こ の 考 え方 を と りい れ る ひ とつ の 方 法 は,階
層 的 手 法 を採 用 し
て, デ ー タ 空 間 で 区 分 集 約 をつ づ け て い く過 程 を 実 空 間 で の 連 続 性 を 条 件 と し て付 加 して 適 用 す る こ と で す. 結 果 的 に は 実 空 間 を い くつ か の 「連 続 性 を も った 部 分 空 間 に 分 割 す る」 こ と に な り ます.そ
う い う分 割 を 見 出 す た め に 「デ ー タ 空 間 で の 距 離 を 基 準 」 と し て 使 う とい う
こ とで す. ③ 地 理 的 な 接 続 性 を考 慮 に 入 れ て 分 析 の 結 果 で す が,144の
次 の 図9.4.1は,こ
地 点 の デ ー タ を 集 約 して44の
の 扱 い を した 場 合
ク ラ ス ター 区 分 に して い ま す.
ク ラ ス タ ー 数 を 前 節 の 場 合 と比 べ て 多 く し た の は, 現 象 を精 密 に み る た め と い う理 由 だ け で な く 値 が 同 じ で も地 理 的 に 離 れ て い る場 合 そ れ ら が 別 区 分 と さ れ る こ と か ら 区分 数 が 多 くな る とい う理 由 が 重 な っ て い る の で す. ④ 地 域 メ ッ シ ュ 統 計 を 対 象 と す る ク ラ ス ター 分 析 プロ グ ラ ムMCLUSTで
は,
図9.4.1
図9.4.2
メ ッ シ ュデ ー タ用 ク ラ ス ター 分 析 の 出 力 表
メ ッ シ ュ デ ー タ用 ク ラス ター 分 析 の 出力 図
こ う い う条 件 つ き で 扱 え る よ うに な っ て い ま す . こ の プ ロ グ ラ ム の 出 力 は,基 ら,各 区 分 の 位 置 に
礎 デ ー タ が12×12の
ク ラ ス ター 番 号 3つ の 指 標 値(ク ラ ス ター 区分 で の 平 均 値)
地 域 区分 に対 応 して い る こ とか
を 記 録 す る 形 式 に して あ りま す. これ は 計 算 プ ロ グ ラ ム の 出 力 の 詳 細 を示 す も の で す か ら,結 果 を よむ た め に は,そ の た め の 図 も 出 力 さ れ ま す. まず,こ
の 図 の12×12の
る た め に,図9.4.2が 図9.4.1に
区 分(基 礎 デ ー タ の 区 分)が ど う ま とめ られ て い る か を み
出 力 さ れ ます.
お い て 同 一 ク ラ ス ター に 区分 さ れ て い る地 点 を 線 で か こ み,そ
ター の 特 性 を 5段 階 の 評 価 値 に お きか え て 図 示 し た も の で す. ⑤ こ れ らの 図 で は, 各 クラス ターの位 置 の情報 と 図9.4.3
クラ ス ター 区分 の レベ ル レ ー ト図(44区
分)
の クラス
ク ラ ス タ ー 特 性 の 情 報 と を組 み 合 わせ て み る 形 式 に な っ て い ます. そ う い う意 味 で 採 用 さ れ る 形 式 で す が,各 め に は,こ
れ ま で と 同 様 に,レ
図9.4.3で
す.前
ク ラ ス タ ー 区 分 の 特 性 を くわ し くみ る た
ベ ル レー ト図 をか き ま し ょ う.
節 の 図9.3.4と
同 じ形 式 で あ り,取
り上 げ た 2つ の 指 標 値 の 「レ
ベ ル レー ト図 上 で の 動 き」に 対 応 して 「 現 象 の 推 移 を よ む 」こ とが で き るの で す . 2枚 セ ッ トに な っ て お り,上 は1940∼1945年,下
は1945∼1950年
の動 きに対応 し
て い ます. ⑥ 先 に,1945∼1950年
の 図 をみ ま し ょ う.
左 下 か ら右 上 方 向 に 並 ぶ 傾 向 性 が よみ とれ ま す が,そ DX1が
大 き い,す
な わ ち1945∼1950年
が 検 出 され て い ます.ま
れ か ら 外 れ た 点 も あ りま す.
に 著 し く増 加 した 地 域 と して,地
た,69,79,125,90,142に
点75と
8
つ い て も,傾 向 を こ え た 増 加 を 示
して い ます. 1940∼1945年
に つ い て も 「左 下 か ら右 上 方 向 に 並 ぶ 傾 向 性 」は 同 じで す が,著
増 加 した133,143の 1940∼1945年
他 に,多
しく
くの 区 分 で 傾 向 を こ え た 増 加 を 示 して い ま す.
には 人 口急 増地 点 が 人 口密度 の少 ない地 域 に ひ ろ が って きた の に対
し て,1945∼1950年
に は,人
口 密 度 の 高 い 地 域 に お い て ス ポ ッ ト状 に 見 出 さ れ る形
に な っ た と解 釈 され る よ う で す. ⑦
こ の 予 想 を確 認 す る た め に は,地
図9.4.4で
理 的 な位 置 に 対 応 づ け た 図 で み ま し ょ う.
す.
こ れ は 原 理 的 に は 前 節 の 図9.3.5と
同 じで す が,指
標値 の誘 導 にお い て地理 的 な連
続 性 を 考 慮 に 入 れ て い る こ とか ら,連 続 性 の 強 い「X で み た傾 向 性 」 と,連 続 性 の 弱 い 「DXで
み た個 別 性 」 とが は っ き り と識 別 され る結 果 とな っ て い る よ う で す.
図9.4.4
ク ラ ス ター 区 分 の位 置 表 示(44区
分)
9.5 ク ラ ス タ ー分 析 の 適 用 意 図 ① 9.4節 の ク ラ ス タ リン グで は,地
域 的 な連 続 性 を条 件 と して,い
わば
情 報 表 現 単 位 を集 約 す る こ と を考 え て い た の で す.そ
の 結 果 と し て,入
力 デ ー タ に お け る観 察 単 位 数144が
44の 情 報 表 現 単 位 の 情 報 に 「集 約 」さ れ たの で す. ② そ の 結 果 で は,各
区分 の指標 値 に関 しては似 て いるが地理 的 に離 れた位 置 にあ
る観 察 単 位 は別 区 分 と さ れ て い ま す. し た が っ て,つ づ い て 図9.5.1
クラ ス ター 区 分 の レべ ル レー ト図(10区
図9.5.2
ク ラス タ ー 区 分 の 位 置 表 示(10区
分)
分)
そ の 情 報 表 現 単 位 を 指標 値 の類 似性 に注 目して分類 す る と い う観 点 で の ク ラ ス タ リ ン グ を適 用 す る こ とが 考 え られ ます. 図9.4.3の44地
点 につ い て,こ
集 約 し た 結 果 を 図9.5.1,9.5.2に
の 第 二 段 階 の ク ラ ス タ リ ン グ を 適 用 して10区
分に
示 して あ り ま す.9.3節
同 じ
の 図9.3.4,9.3.5と
形 式 で す か ら,そ れ ら と対 比 して くだ さ い. 結 果 的 に は ど ち ら の 方 法 を適 用 して も ほ ぼ 同 じ結 果 に な り,同
じ よ う な結 論 を誘 導
で き る こ と を 確 認 して くだ さ い. ③ 結 果 的 に は,い
ず れ の 方 法 で も,144地
点 の デ ー タ を10区
分 に集約 した こ と
に な り ます が 144地 点 に つ い て の 情 報 に つ い て,そ
の 類 似 度 を み て10区
分 に集約 す る
か わ りに 144地 点 に つ い て の 情 報 を44地
点 の 情 報 に 表 現 しな お し
44地 点 の 情 報 の 類 似 度 を み て,10区
分 を見 出す
と い う ロ ジ ッ ク を 採 用 し て い る こ とに 注 意 し て くだ さ い. ④ こ の 例 で は 「取 り上 げ た 現 象 を 表 現 す る た め の 単 位 と,比 較 す る た め の 単位 と を わ け て 考 え た 」 と い う意 味 を もつ もの で す. ど ち ら も 「わ け る」 と よ ば れ て い ま す が 観 察 単 位 を わ け る場 合 観 察 単 位 の もつ 値 を わ け る場 合 と を 区 別 す る こ とが 必 要 で す. 観 察 単位 の もつ 類 似 度 に 注 目 して わ け(後 者 の 意 味),そ け る(前 者 の 意 味)場 合 も あ れ ば,ま け(前 者 の 意 味),そ
の結 果 と して 観 察 単位 を わ
ず 観 察 単位 を そ れ ぞ れ の 定 義 な ど を参 照 し て わ
の 区 分 が 観 察 値 の 上 で ど う わ か れ て い る か(後 者 の 意 味)を 調 べ
る場 合 もあ る で し ょ う. ま た,わ
け る 目 的 に 関 す る ち が い もあ り ます.
こ の 節 で例 示 した よ うに,現
象 を適 正 に 表 現 す る 区 切 り方 を 見 出 す た め に 観 察 単 位
の位 置 を考 慮 に 入 れ て わ け,次
に,値
の類似 度 に注 目して わけ る …
こ うい う場 合 も
あ る の で す. い ず れ に し て も,「 ど う い う わ け 方 を適 用 す る か 」は,問
題 の 扱 い 方 と し て 考 え,
選 択 す べ き こ とで す. ⑤ た だ し,こ
の 節 の 方 法 は,
ク ラ ス ター 分 析 の 計 算 手 順 を減 らす ア ル ゴ リ ズ ム と し て位 置づ け る こ と もで き ます, た とえ ば,こ
の 章 で 扱 っ て い る地 域 メ ッ シ ュ に よ る 分 析 を も っ と広 い 地 域 を対 象 と
して 適 用 しよ う とす る と,計 算 所 要 時 間 が 問題 とな っ て き ます. そ こ で,第
一 の ス テ ッ プ と して 「表 現 単 位 数 を減 ら す 」た め の ク ラ ス タ リン グ を適
用 す れ ば,「 地 理 的 に 接 続 して い る」 と い う 制 約 条 件 を お い て い る た め に, 最 も近 い対 を探 索 す る範 囲 が 限 定 さ れ,計
算所要 時 間が短縮 され る
こ とに な りま す. そ の 上 で,第 す.
二 ス テ ッ プ の分 類 の た め の ク ラ ス タ リン グ を適 用 し よ う と い う こ と で
問題 9
【 地 域 デー タの 表現 】 問 1 図9.1.1を
か け.市
STATMAPYを
区 町 村 別 デ ー タ を こ の 形 式 に 示 す た め に は,プ
使 う.図 示 す る デ ー タ は デ ー タ フ ァ イ ルFOR
さ れ て い る の で,そ
れ をSTATMAPY用
ログラム
_MAPXに
記録
に 編 成 す るプ ロ グ ラ ムSTATMAPD
を 使 う. STATMAPDの
使 い 方― 東 京都を使
(1) 地 図の種 類指 定
うとして 2を 入力
Rを入力
(2) デ ー タ よみ 込 み (3) デ ー タ フ ァ イ ル 名 指 定
FOR_MAPXと
(4) 入 力 デ ー タ の確 認
矢 印 キ イ で カー ソ ル を動 か して 確 認 Escキ
(5) 区切 り値 指定
入力
イで次へ 進 む
5段 階 区分 の 区切 り値 を指定 区分 1
0
2000
区分 2 2000 4000 区分 3 4000
8000
4 8000
16000
区 分 5 16000
32000
区分
と指 定す る Escキ
(6) フ ァ イ ル へ 出 力
イ で, FOR_MAPに
プ ロ グ ラ ムSTATMAPYが STATMAPYの
出 力 し, 呼び 出 さ れ る.
使 い 方―
(1) 地 図 の種 類 「2 東 京 都 」が 指 定 さ れ て い る こ と を確 認 し てEnterキ
(2) 各 市 区町 村 ご と に,境
(3) 外 枠 表 示,凡
(4) C/Eと
界 線 表 示,区
例 表 示 は,し
な い もの と し て,N
表 示 さ れ た と き C と入 力 す る と,出
こ れ で,図9.1.1の
イ
切 り値 に 応 じた 模 様 わ け が 進 行 を入 力
力 で きる
う ち 東 京 都 の 部 分 が 出 力 さ れ る.埼 玉 県 の
分 につ い て
も 同 じ手 順 で か け る. 問 2 図9.1.4を MAPを
か け.こ
使 っ て,か
れ は 地 域 メ ッ シ ュ 統 計 に 関 す る プ ロ グ ラ ム の う ちMESH くこ とが で き る.
プ ロ グ ラ ムMESHMAPを
呼 び 出 し,デ ー タ フ ァ イ ル 指 定 に 対 し て 「 例示 を
使 う」も の と し てR を入 力 し,表 示 さ れ る例 の う ち 5を 選 ぶ と,図9.1.4が が か れ る.た
く」 と指 定 して,そ
の 範 囲 外 を 次 の 操 作 で 消 去 す る.
矢 印 の キ イ で そ の 範 囲 の 左 上 の 位 置 に カ ー ソ ル を動 か してEnterキ つ づ い て そ の 範 囲 の 右 下 の 位 置 に カ ー ソル を 動 か してEnterキ Escキ
イ で,範
C/Eで 問 3 図9.1.5を
え
だ し,デ ー タが 存 在 す る 部 分 が 地 図 の 範 囲 の 一 部 だ か ら,「 枠 を か
囲 指 定 を終 わ る と,範
イ
イ
囲外が 消去 され る
C と入 力 して コ ピー か け.こ
れ は,地
コ ウ セ ン」 を使 っ て,か
域 メ ッ シュ 統 計 に 関 す る プ ロ グ ラ ム の う ち 「トウ
く こ とが で き る.
プ ロ グ ラ ム 「トウ コ ウ セ ン」 を指 定 す る と,プ さ れ る.表 示 さ れ る例 の う ち1Cを
ロ グ ラ ムPXYPLOTが
呼び出
指 定 す る.
区 切 り値 の 参 考 デ ー タ を 計 算 す る よ うに 指 定 す る と,デ ー タ の分 布 範 囲 が 表 示 され るの で,そ 図9.1.5の
れ を 参 照 し て 区 切 り値 を指 定 す る.
場合 は
100と 指 定 す る と,図9.1.5の 30と 指 定 す る と,図9.1.5の
右側 左側
が か か れ る. 注:地 域 メ ッシ ュ統計 関 係 の プ ログ ラ ム にお いて,例 題 を用 意 して あ る もの に つ い て は,そ の範 囲 で使 っ て くだ さ い.そ の 範 囲外 の デ ー タ につ い て は,未 確 認 の 問 題 が 発 生 す る可 能性 が あ ります. 【 状 態 変 化 を説 明 す る図―
レベ ル レ ー ト図】
問 4 プ ロ グ ラ ムLOGIT_Hを
使 っ て,レ
ベ ル レー ト図 の 定 義 や 意 味 の 説 明 を よ ん で
み よ. 問 5 図9.2.1の
形 の 推 移 曲 線 と そ れ に 対 応 す る レベ ル レー ト図9.2.3を
プ ロ グ ラ ムLOGISTICと,そ 1=1と
指 定 す れ ば,ほ
問 6 図9.3.1お
ぼ こ れ らに 近 い 図 に な る.
よ び 図9.3.2を
こ れ ら の 図 は,プ
か け.
れ に 用 意 し て あ る例 示 デ ー タ を使 っ て,K=0,
か け.
ロ グ ラ ムXYPLOT1で,デ
ー タ フ ァ イ ルDMO2EO1を
す る とか く こ とが で き る(マ ー ク の 種 類 な どが ち が うが,実 で あ る).こ の プ ロ グ ラ ム の 使 い方 は 問 題 1の 問1∼5を
指定
質 的 に は同 じもの
参 照 す る こ と.
【ク ラ ス ター 分 析 】 問 7 152ペ ー ジ に 示 し た 3つ の 変X2,DX1,DX2を
使 っ て,144の
対 象 地 点 を10
区 分 に ク ラ ス タ ー わ け せ よ. プ ロ グ ラ ムCLASS,デ
ー タ フ ァ イ ルDM02E0IYを
指 定 し,CLASSの
肢 で デ ー タ タ イ プ は 「V,標 準 化 す る」 と指 定 す る と,表9.3.3を られ る が,ク
ラ ス タ ー 区 分 表 を 表 の 右 側 の 形 に す る た め に は,CLASSの
手 順 で 「表 示 の 折 り返 し箇 所 」 と して12を
指 定 す る こ と.
選択
含 む結 果 が得 進行
間 8 問 7の 出 力 を使 っ て,図9.3.4お こ れ ら の 図 は,UEDAの 問 9 問 7 で は,基
よ び 図9.3.5を
か け.
プ ロ グ ラ ム を 使 わ ず,手
書 き で か く こ と.
礎 デー タ が メ ッ シ ュ デ ー タ で あ る こ と を考 慮 に 入 れ て い な い が,
基 礎 デ ー タ が12×12の
メ ッ シ ュ 区 分 の 情 報 だ か ら,「 地 理 的 な 連 続 性 」 を 条 件
と して ク ラ ス タ ー を 求 め る こ とが 考 え られ る. そ の た め に は,メ 使 う.付 録C.3の 問10
ッ シ ュ 統 計 専 用 の ク ラ ス タ ー 分 析 プ ロ グ ラ ムMCLUSTを
説 明 に し た が っ て,こ
プ ロ グ ラ ムMCLUST,デ
の プ ロ グ ラ ム の 使 い方 を把 握 せ よ.
ー タ フ ァ イ ルDM02E01Y(問
7 と同 じ も の)を 指 定
し,表 示 され る メ ニ ュー 画 面 で,「 3 条 件 つ き で進 行 す る」 を指 定 す る と,ク ラ ス ター の ま と ま り方 を 図9.4.2の ス テ ッ プ100ま
様 式 で 表 示 しつ つ 進 行 す る.
で 進 行 し た と こ ろ で,「 中 間 結 果 を出 力 す る 」 と指 定 す る と,
そ の と き の 状 態 を 示 す 図9.4.2と,そ
の 基 礎 デ ー タ を 示 す 図9.4.1が
得 られ
る. こ の 問 題 で は,こ 問11
問10の
こ で ク ラ ス ター 分 析 の 進 行 を 中 断 す る こ と.
出 力 を使 っ て,図9.4.3お
こ れ らの 図 は,UEDAの 注:図9.4.3は
よ び 図9.4.4を
か け.
プ ロ グ ラ ム を 使 わ ず,手
プ ロ グ ラムXYPLOT1を
書 きで か くこ と.
使 って か くこ と もで き ます.た だ し,そ
の た め に使 う問 9の 出 力 形 式 が S タ イ プ に な っ て い る の で,プ ロ グ ラ ムVAR‐ CONVに 問12
よ ってV タ イプ に 変更 した上XYPLOT1を
この 問 題 に つ い て は,問10と が44に
な る ま で)進 行 させ る.そ
に 進 行 す る 」に 指 定 替 え し て,ス る.こ こ で,中 問13 問12の
使 うこ と.
同 じ手 順 で ス テ ップ100ま の ス テ ッ プ100の テ ッ プ134(ク
で(ク ラ ス タ ー 区 分
と こ ろ で,「 条 件 を つ け ず
ラ ス ター数10)ま
で 進 行 させ
間 結 果 を 出 力 せ よ.
出 力 を使 っ て,図9.5.1お
これ らの 図 は,UEDAの
よ び 図9.5.2を
プ ロ グ ラ ム を使 わ ず,手
か け. 書 きで か くこ と.
10 複 数 の観 点で 区分
ク ラス ター分 析 に お い て観点 の 異 な るデ ー タ を組 み 合 わ せ て使 った 場 合 に は,デ ー タの扱 い 方 に よっ て 結 果 が 大 き くか わ り ます.こ の 章 で は,デ ー タ の扱 い 方 が 結 果 に ど う影響 す るか を 例示 し ます.た
とえ ば,
各 観 点 が対 等 に効 くこ と を期待 して適 用 す るか , 現 実 の デ ー タで の効 き 方 を 計測 す る こ とを期 待 して適 用 す るか な ど,区 分 を適 用 す るに あ た っ て, あ らか じめ 考 え てお か ねば な らない こ とで す.
10.1 種 々 の観 点 で 区分 すべ き 問題 の 典 型 例 ① この 章 で は,各
地 域 の 人 が 自分 の 住 居 地 の 「 暮 ら しや す さ 」を ど う評 価 し て い
る か をみ る 問 題(例 7)を 取 り上 げ ま し ょ う. 当 然,暮
ら しや す さ を 測 る観 点 は さ ま ざ まで す か ら,各 観 点 ご と に わ け て 「… と い
う観 点 で は ど う で す か 」 と質 問 す る こ と に な りま す が,各 ら しや す さ,暮
評 価 者 が 「ど の 観 点 で の 暮
ら し に くさ を 問 題 視 して い る か 」が ち が う で し ょ うか ら,そ
の ちが い
も 計 測 す べ きで し ょ う. こ の た め に,「 観 点 ご とに 質 問 した 評 価 値 」 と 「総 合 して み た 場 合 の 評 価 値 」 を求 め て そ の 関 係 を み る とか,「 評 価 値 の バ ラ ツ キ の 大 き さ を 比 べ る」(問 題 視 さ れ て い る 度 合 い の 大 小 が 回 答 の バ ラ ツ キの 大 小 と して 表 わ れ る)な どの 方 法 が 考 え ら れ ま す. こ うい う見 方 を す る に は,基
礎 デ ー タ に 関 して
各 観 点 に対 応 す る デ ー タ を バ ラ ン ス よ く選 ん で お く こ とが 必 要 です. そ う な っ て い な い と, 回 答 者 の 関 心 の ち が い に よ っ て 生 じた 差 と 基 礎 デ ー タ の 選 択(扱 い 方)に よ って 生 じ た差 を 識 別 で き ませ ん.
② NHKが1978年 に 行 な っ た 「県 民 意 識 調 査 」で は,暮 一 連 の 質 問 項 目 を取 り上 げ て い ま す . 問 1
総 合 して
問2.A
交 通の便
問2.B
買 い物 の便
問2.C
図 書 館 ・公 民 館 な ど の 文 化 施 設
問2.D
病 院 ・診療 所
問2.E
下 水 道 ・ゴ ミ処 理 な ど
問2.F
レ ジ ャ ー ・娯 楽 施 設
問2.G
自然 災 害
問2.H
公害
ら しや す さ に 関 す る次 の
いず れ に つ い て も,「 よ い 」,「ど ち ら と も い え な い」,「わ る い 」の 3区 分 の ど れ か を選 ぶ 形 で 回 答 を求 め て い ま す が,こ
こ で は,ま
ず 「よ い 」 とい う 回 答 の 比 率 に 注 目
して 分 析 し ま す. こ れ らの 値 は,付 ③ ま ず,こ
表H
に示 して あ りま す.
れ ら の 評 価 値 の 平 均,標
こ れ ま で の 分 析 例 で は,こ 意 識,す
な わ ち,異
準 偏 差,相
関 係 数 を み て お き ま し ょ う.
れ らの 情 報 を 明 示 し て い ませ ん で し た が,こ
の章 の 問題
な っ た 観 点 に た つ 情 報 を組 み 合 わ せ て 扱 う場 合 に 各 観 点 の効 き方
を把 握 す る た め に は,重
要 な情 報 で す.
注 3段 階 の 回 答 を それ ぞ れ 1,0,-1と お きか えた平 均 値 を各 項 目 での 評 価 値 と して使 う こ と も考 え ら れ ま す.
④ ま ず 項 目 に よ っ て ち が う 点 を あ げ て み ま し ょ う. 平 均 値 に 関 して, 表10.1.1
各 項 目に つ い て 「よ い 」とい う答 えの比 率(例 7)
項 目 C,F の 値 が 低 い こ と 標 準 偏 差 に 関 し て,
項 目 A,B の 値 が 高 い こ と
項 目 F,H の 値 が 低 い こ と 相 関行 列 に 関 し て,
項 目 A,B,D,E,F が 相 互 に 高 い相 関 関 係 を もつ 一 群 を な し て い る こ と こ れ ら以 外 は,い
ず れ も,他 の 項 目 との 相 関 が 低 い こ と
が わ か り ま す. ま た,総 合 評 点(項 目 1)との 相 関 係 数 に 関 し て は ど の 項 目 と の 相 関 も低 い とい う結 果 で す. 注 総 合 評 点 と 「項 目別 評点 」との相 関 が低 い こ とは,総 合 評 点が 多 くの観 点 に よ る評 価 の 総合 と して 決 まる こ と を示 唆 して い ます.い いか え る と,多 次 元 で み るべ き情 報 で あ り,1 つの 次 元 に 注 目す れ ば 高相 関 だが,そ れ らが 混 在 して い るた め に,低 い相 関 係 数 に な って い る … こ うい う こ とです. この章 で は,ま ず,各 観 点 での 評 点 を分 析 した後,そ の結 果 と総 合 評 点 の関 係 を見 出そ う とす る もの と します. ⑤ この 章 では こ れ らの こ と が,結
果 に ど う影 響 す るか
あ るいは こ れ ら の こ と を,分 析 手 順 で ど う扱 うか を考 え る の で す が, こ の 節 で は,「 す べ て の 変 数 の 分 散 の ちが い を消 去 して 扱 っ た 場 合 」 次 の 節 で は,「 す べ て の 変 数 の 分 散 の ちが い を残 して 扱 っ た 場 合 」 の 結 果 を示 して お き ま し ょ う. ⑥
平 均 値 の ち が い は,「 各 観 察 単 位 で の 評 点 を全 体 で の 平 均 と の 差 」 と して 扱 い
ます か ら,ク
ラ ス ター 導 出 に は影 響 し ませ ん(結 果 の解 釈 で は考 慮 し ま す).こ
して,分 散 の ちが い に つ い て は,一般
れ に対
に 「観 察 単 位 間 差 異 」の 大 き い 項 目 ほ ど ク ラ ス
ター 導 出 に 対 し て 大 き く ひ び き ます か ら, 分 散 の ち が い を消 去 して 扱 うか, 分 散 の ち が い を残 して 扱 うか は,結
果 に 影 響 し ます.
相 関 係 数 に つ い て は,高
い 相 関 関 係 を もつ 評 価 項 目は 「共 通 す る ク ラ ス ター 区 分 に
対 応 す る結 果 に な る 」 と予 想 され ます.こ
の た め,そ
れ ら の ひ とつ ひ と つ で み た 効 果
以 上 に 大 き く影 響 す る こ と に な る で し ょ う.極 端 な 例 で す が,「 相 関 係 数 が 1の 項 目 が 2つ 含 ま れ て い る と,そ の 観 点 で の 評 価 に ウ エ イ ト 2を つ け た 結 果 に な る」の で す.
表10.1.2 各変数値 を標準化 して扱 った場合 の結果
変 数 値 は 1以 上,0.5∼1,-0.5 評 価 値 は,変
∼0.5,-1∼-0,5,1
数 A,B,D,E,F
ク ラ ス タ ー 区 分 は,変
未 満 と 区 分.
を ま と め る形 で 配 列.
数 みA,B,D,E,F
こ うい う こ とが あ る の で,⑤
の 評 価 値 に 注 目 し て 配 列.
に あ げ た い くつ か の 扱 い 方 を 適 用 し て,結
果 を 比較
し て み よ う とい うの で す. ⑦ 次 は,「 各 評 価 項 目 を対 等 に 扱 う」 と い う了 解 で,そ
れ ぞ れ の 評 価 値 を標 準 化
し て ク ラ ス ター 分 析 を適 用 し た場 合 の 結 果 で す. ⑧ ま ず 変 数 値 を み ま し ょ う. 変 数 値A,B,D,E,F す.細
か くみ れ ば,変
に つ い て は,各 数E,F
区 分 で の 評 価 値 の 大 小 が ほ ぼ 一 致 して い ま
の 値 が 区 分 5で 大 き く な っ て い る よ う で す が,
区 分 1,2,3 で は い ず れ も大 き い
区 分 4,5,6,7 では ほぼ 平均並 み
区 分 8で は い ず れ も小 さ い
と い う大 き い傾 向 と比 べ れ ば,軽
く扱 っ て よ い程 度 の 差 で し ょ う. した が っ て,こ
れ
ら の 変 数 を 「日常 生 活 一 般 に 関 す る 評 価 」 と ま とめ て 扱 っ て よ い で し ょ う. 変 数 値 C,G,H
に つ い て は,こ
の 要 約 と は 異 な る様 相 を示 し て い ま す.
変 数 C は,区
分 2で マ イ ナ ス,区
変 数 G は,区
分 6,7で マ イ ナ ス,区 分 8で プ ラ ス
分 4で は プ ラ ス
変 数 H は,区
分 1,2,7 で マ イナ ス,区 分 4,5,6 でプ ラ ス
と な っ て い ま す.し
た が っ て,「 日常 生 活 一 般 に 関 す る 評 価 」に よ る大 き い 区 分 け(1,
2,3),(4,5,6,7),(8)を
ちが っ た観 点 で 区 分 け す る効 果 を も た ら して い る の で す.
⑨ 次 に,各
ク ラ ス タ ー を構 成 す る メ ン バ ー をみ ま し ょ う.
日常 生 活 に 関 す る評 価 が プ ラ ス と さ れ て い る 3つ の 区 分 の う ち 区 分 1 と区 分 2は, 東京 ・ 神 奈 川 や 京都 ・大 阪 ・ 兵 庫 で す.こ
れ に 対 して,マ
イ ナ ス と さ れ て い る 区 分 8が,
そ れ ら に 隣 接 す る 県 で あ る こ とに 注 目 し ま し ょ う.近
くに 便 利 な と こ ろ が あ る た め
に,そ
れ と比 較 す る 意 識 が 働 い て,実
らず,最
態 と し て は も っ と わ る い地 域 が あ る の に か か わ
も わ る い とい う評 価 に な っ た の で し ょ う.
こ れ ら の 地 域 以 外 で,「 日常 生 活 一 般 に 関 す る 評 価 」の 高 か っ た ク ラ ス タ ー が 3の 宮 城 ・岡 山 ・山 口 ・福 岡 ・宮 崎 で す. 「自 然 災 害 」(項 目 G)で マ イ ナ ス 評 価 に な っ た ク ラ ス ター 6お よ び 7に つ い て は, 県 名 を み て も 「ど う して こ れ らが ま と ま っ た の か 解 釈 し に くい 」よ う で す. 「 公 害 」(項 目 H)で の 評 価 に つ い て も,前 述 し た 「区 分 1,2で マ イ ナ ス 」,「区 分 8 で は 平 均 並 み 」 とい う ち が い の 他 は,解 ま ず,こ
釈 し に くい よ う で す.
こ ま で で ひ と 区切 り と し ま す が,次
節 以 降 で,こ
の 節 と ちが った 扱 い を し
た 場 合 と比 較 し ます.
10.2 分 散 の ち が いの 影 響 ① 前 節 に あ げ た問 題 点 の う ち,各 変 数 の 分 散 の ち が い の 影 響 を み る た め に,標
準
化 せ ず に 扱 っ た 場 合 の 結 果 と比 べ て み ま し ょ う. 表10.2.1は,分
散 の ち が い を調 整 せ ず に 入 力 した 場 合 の 結 果 で す.
② 各 変 数 値 の 分 散 を そ ろ え て 扱 っ た 場 合 の 結 果(表10.1.2)と 10.2.2の
比 べ る と,図
よ う に な っ て い ます.
まず 大 き くみ る と,ク ラ ス タ ー 旧 1と 旧 2が 1つ(新 し い 1)に ま と ま っ て お り,そ の か わ りに,新
し い ク ラ ス ター 3が で き た と い う こ と で す.
各 ク ラ ス ター の メ ンバ ー 名 を,所 属 が か わ らな か っ た もの は 太 字,所
属 がか わっ た
も の は 細 字 で 示 し て あ りま す か ら,確 認 して くだ さ い. ③ 表10.1.2の
場 合 の 区 分 旧 1 と 旧 2 を 1つ と み な す と,47県
結 ぶ 関 係 に よ っ て 対 応 して い ま す.ま 47県 中44県
た,新
が実線 で
が 実 線 で結 ぶ 関係 に よ っ て 対 応 して お り,所 属 の か わ っ た もの は 3県 に
過 ぎ ま せ ん.し
た が っ て,2 つ の結 果 は た い へ ん よ く合 致 し て い る と い え ま す.
表10.2.1
分 散 の 差 を調 整 しな い 場合
変 数 値 は 1 以 上,0.5∼1,-0.5∼0.5,-1∼-0.5,-1未 評 価 値 は,変
中41県
し く形 成 され た 新 区 分 3 を除 外 す る と,
数A,B,D,E,F
ク ラ ス タ ー 区 分 は,変
満 と 区 分.
を ま と め る 形 で 配 列.
数A,B,D,E,F
で の 評 価 値 の 順 に 配 列.
図10.2.2
2と お りの 扱 い の結 果 比 較
分散の差 を調整 した場合
分散 の差 を残 した場合
か わ っ た 箇 所 につ い て 指 標 値 をみ る と
O表10.1.2の
場 合 の 区 分 1と 2で 区 別 さ れ て い た
変 数 C で の 差 が 消 さ れ て 1つ の 区 分 に な っ た
O そ れ に か わ っ て,分
散 の 差 が 大 き い 変 数A,B
と変 数D,E
の 差 に 対 応 す る新
しい 区 分 が 見 出 さ れ た と 了解 で き ま す. 注 区分 数 を 9と して再 計 算 す る と表10.1.2の
区 分 1と 2が わか れ た ま ま残 る とい う
結 果 に な る で し ょ う.
④
こ の よ うに,分
散 を そ ろ え て 扱 っ た場 合 と,分 散 の 差 が効 く形 で 扱 っ た場 合 と
で は 結 果 が ちが っ て き ま す. した が っ て,ク
ラ ス ター 分 析 の 適 用 に あ た っ て は,ど
ち
らの 扱 い を す る か を 決 め る こ と が 必 要 で す.
各 変 数 を そ れ ぞ れ 同 等 に 扱 うべ き観 点 に 対 応 す る も の と み る な ら,
各 変 数 が 1つ の観 点 の 下 位 区 分 に 対 応 す る も の と み る な ら,
分散 をそ ろえ る
分 散 の ちが い を残 した 形 で 扱 う もの と考 え れ ば よ い で し ょ う. ⑤
こ の よ う な 「分 類 に 対 す る 各 変 数 の 効 果 」は 分 散 を使 って 評 価 で き ま す.
ク ラ ス タ ー 分 析 の 標 準 出 力 で は,表10.2.3の
よ うに こ の た め の 情 報 が 出 力 さ れ て
い ます. これ ら の 評 価 値 で は,ク い ます が,こ
ラ ス タ ー 分 析 に 使 っ た 変 数 全 体 を 1セ ッ ト とみ て 計 算 して
れ ら を,各 変 数 ご とに わ け て 計 算 し,そ れ ら を 比 較 し て み れ ば よ い の で
す. 区 分 け に効 か な い 変 数 は,級
内 分 散 が 小 さ く,級 間 分 散 が 大 き く な る で し ょ う.
表10.2.3
分類の効果
分 散の差を調整 した場合
UEDAの
分散の差 を残 した場合
出力 で は偏 差 平 方 和 が 「情 報 量 」 とい う見 出 し を使 って 表 示 され て
い る.こ の 表 の 分 散 は,そ
れ を観 察 単 位 数 で わ っ た もの.
表10.2.4 各 変 数 ご とに み た級 内分 散
分散の差 を調整 した場合
分散 の差 を残 した場 合
ク ラ ス タ ー 分 析 の 扱 い で い う と, 全 分 散 が,入
力 デー タでみ た場合 の各 変数 の寄 与
級 間 分 散 が,出
力デー タ でみた場 合 の各変 数 の寄 与
で す. 区 分 け が な さ れ て い な い 入 力 デ ー タに つ い て,区 ら,こ
れ ら の 差 が,区
分 した 結 果 が 出 力 さ れ た の で す か
分 け す る こ とに よ っ て 発 生 し た こ と に な り ま す.し
た が っ て,
各 変 数 の 効 果 を評 価 で き る こ と に な り ます. 表10.2.3の
級 内 分 散 に つ い て,各
変 数 ご とに わけ て 計算 した結果 を示 してお きま
し ょ う(表10.2.4). ま ず 分 散 の 差 を調 整 した 場 合に つ い て み る と,変 数 C,E,F,G して 多 くの 情 報 が 残 され て い ます.15%
以 上 で す.効
で は区分 内分散 と
き方 が低 い ため 級 内分 散 と し
て 多 くが 残 っ て い る の で す. 級 内 分 散 が 小 さ い,す
な わ ち,効
き方 の 大 き い の は 変 数 A,B,D
分 散 の 差 を残 し た 場 合 に つ い て は, 変 数A,C,E,G 変 数 B,F,H
の 効 き方 が 低 く, の効 き方 が 大 き い
で す.
結 果 と な っ て い ます. こ れ を 比 較 した の が 右 の 図10.2.5で 2 とお りの 扱 い の ち が い は,分 否 か の ち が い で す か ら,そ に,分
2と お りの 扱 い で の
図10.2.5
級内分散の比較
す.
散 の 差 を消 去 す る か
の こ との 影 響 を み る た め
散 の 大 き い 変 数 名 は〓,分
散 の 小 さい変 数 は
〓で か こ ん で 区 別 して あ り ま す. 分 散 を 考 慮 に 入 れ る こ と に よ り,分 散 の 大 き い 変 数A,B
の 場 合 は そ の 効 果 が 小 さ くな っ て お り,分 散
の 小 さ い 変 数 F,H
の場 合 は そ の効 果 が大 き くな っ
て い る こ とが 確 認 さ れ ま す. その 結 果 が 2とお りの扱 いの結 果 に影 響 して い る の で す.各
区分 の メ ンバー構 成 の 変化 は そ の こ とだ
け で 決 ま る わ け で は あり ま せ ん が,新
し い 区 分 3が
形 成 され た こ と は変数A ,B の 効 果 が 低 くな っ た こ とか ら, (1,2,3),(4,5,6,7)と (1,2),(3),(4,5,6,7)と
わ か れ て い た もの が
各変 数 で み た級 内分 散 の 分 散 比 を,基
3分 さ れ る 形
礎 デ ー タの 分 散 を
そ ろ え て扱 っ た場 合
に な っ た もの と説 明 で き る で し ょ う.
そ ろ えず に 扱 っ た場 合 につ い て 左 右 の 軸 に プ ロ ッ ト.
10.3
階 層 構 造 を 考慮 に入 れ る
① 前 節 で 取 り上 げ た 例 で み た 「変 数A ∼D の 寄 与 が 大 き い 」と い う こ と は,変
数
の 意 味 で い う と,「 日常 生 活 に 関 す る 便 利 さ 」の 評 価 が ク ラ ス タ ー 区 分 の 形 成 に 大 き く影 響 し て い る と い う こ とで す.ま 「公 害 の 少 な さ 」の 評 価 が,ク
た,「 変 数 H の 寄 与 が 小 さ い 」 と い う こ と は,
ラ ス ター 区 分 の 形 成 に は あ ま り効 い て い な い と い う こ
とで す. 「そ う い う結 果 に な っ て い る 」と受 け と る の が 実 証 分 析 の 立 場 で す が,取 い る一 連 の 項 目の 中 に観 点 の 異 な る もの が 含 ま れ て い る と き,そ 各 変 数 の 扱 い 方 を か え る こ とが 考 え られ ま す.例
り上 げ て
の こ とに 関 連 し て,
示 に つ い て い う と,
「日常 生 活 の 便 利 さ 」と 「 公 害 の 少 な さ 」は そ れ ぞ れ 同 等 に 扱 うべ き側 面 だ と い う位 置 づ け を考 え に 入 れ て ク ラ ス ター 区 分 を 形 成 す る …
こ う い う扱 い 方 が 考 え
ら れ る の で す. こ う い う扱 い が,こ
の 節 の 主 題 で す.
注 も とに さか の ぼ れば,一 連 の 質 問 の流 れ か らこ うい う結果 に な った こ と も考 え ら れ ます が,こ こ で は,ク ラス ター 分析 の 手順 に関 連 した面 に 限 って考 え ます.
② ク ラ ス タ ー 分 析 の 基礎 デ ー タ を対 等 に 扱 うた め に,「 各 変 数 の 分 散 を そ ろ え る 」 とい う扱 い を 説 明 して あ り ます が,こ
の 節 の 問 題 意 識 で は,取
り上 げ た 「変 数 全 体 を
1セ ッ トの 情 報 」とみ て,「 そ れ らが どん な 観 点 を代 表 す る も の に な っ て い る か 」 を み る こ とが 問 題 に 入 っ て き ます. そ の 場 合,「 分 散 を そ ろ え る 」こ と だ け で は す み ませ ん.仮
に 「 観点 Aに対応する
変 数 が た くさ ん 取 り上 げ られ て お り,観 点 B に 対 応 す る変 数 が 少 数 だ 」 とす れ ば,変 数 の 数 が 結 果 に ひ び き ます. そ れ で は,各
観 点 の 効 き 方 を計 測 で き ま せ ん.し
た が っ て,
各 観 点 に 対 応 す る変 数 の数 を そ ろ え る こ と 各 変 数 の 分 散 を そ ろ え る こ と の 両 面 を み た す 扱 い をせ よ と い うこ とで す. ③ 取 り上 げ て い る例 題 で い う と, 変 数 A, B, D, E, F
日常 生 活 の 便 利 さ
(変 数 C
公 共 施 設 の 充 実 度)
変 数 G
変 数 H
自然 災 害 に 対 す る 安 全 度 公害 の少 な さ
の 4つ の 観 点 が 含 ま れ て い ます.ま
た,デ
ー タ の 上 で も,こ れ らの 4つ の 側 面 が そ れ
ぞ れ ち が っ た 形 で ク ラ ス タ ー 区 分 の 形 成 に 影 響 して い ます. しか し,各 側 面 で の 変 数 の 数 が 5,1,1,1 で あ る こ とか ら,そ れ ぞ れ の 側 面 の 効 き 方 に数 の ち が い が 重 な っ て 第 一 の 側 面 が 大 き く効 い た 区 分 に な っ て い る の で す. ④
そ こ で 考 え るべ き こ とは
各 側 面 を代 表 す る指 標 を そ れ ぞ れ 1つ に す る こ と
そ れ らの 指 標 の 分 散 を そ ろ え て ク ラ ス ター 分 析 を適 用 す る こ と
で す. 1つ の 側 面 を 代 表 す る 変 数 が 多 数 あ る と きに は,た
とえ ば そ れ ら の 平 均 値 と して 1
つ の 指 標 とす るの で す. ⑤
④ の 扱 い で は,各
変 数 が ど ん な 側 面 を代 表 す る もの に な っ て い る か が わ か っ
て い る も の と想 定 して い ます. しか し,「 どん な 側 面 を代 表 す る も の に な っ て い る か 」が わ か ら な い 変 数 もあ り え ます.ま
た,観
念 的 な 判 断 と実 際 の 調 査 結 果 で み た 区 分 と が 一 致 す る と は 限 り ま せ
ん. し た が っ て,実
証 分 析 の 手 法 と して は,
各 変 数 の 観 察 値 で 変 数 の 相 互 関 係 を 把 握 し, 異 な っ た 次 元 が あ れ ば そ れ を識 別 し 各 側 面 に 対 応 す る 指 標 値 を誘 導 す る ため に 「主 成 分 分 析 」を 使 うこ とが で き ま す. ⑥
主 成 分 分 析 に つ い て は,こ
の シ リー ズ の 第 8巻 で く わ し く解 説 して い ま す か
ら,そ
れ を参 照 し て くだ さ い.こ
の 節 で は,そ
の 結 果 を 説 明 ぬ き で 引 用 し ま す.
主 成 分 分 析 を 適 用 す る と, 基 礎 デ ー タ の もつ 情 報 の87%を
4つ の 指 標 で 代 表 で き る こ と
そ う し て,
そ れ ら と基 礎 デ ー タ の相 関 係 数 が 表10.3.1の
指 標 は,こ
よ うに な る こ と
の 表 の 相 関係 数 を ウ エ イ ト とす る加 重 平 均 と して 計 算 で き る こ と
が 誘 導 され ます. こ れ ま で の 分 析 で予 想 さ れ た よ うに,変 数 G,変 数 H,変
数A,B,D,E,F
を代 表 す る 指 標Y1,変
数 C を そ れ ぞ れ 代 表 す る指 標Y2,Y3,Y4が
見 出 さ れ て い ます.
概 念 規 定 か ら予 想 さ れ る 4つ の 側 面 が きれ い に わ か れ て い ま す. ⑦
こ れ らの 4つ の 指 標 を入 力 デ ー タ と し て ク ラ ス タ ー 分 析 を適 用 す る と,次 の 表
10.3.2の
結 果 が 得 ら れ ま す.各
そ れ ら を対 等 に 扱 う た め に,分 ⑧
指 標 1に よ って,日
指 標 が そ れ ぞ れ 異 な る観 点 に 対 応 し て い ま す か ら, 散 を そ ろ え て 使 い ます.
常 生 活 の 便 利 さ の 評 価 を み る と,東
表10.3.1
表10.3.2
変 数 値 は1.5以
京 ・愛 知 ・大 阪 ・兵 庫
基礎変数 の主成分
主 成 分 ス コア ー に よ るク ラ ス ター
上,0.5∼1.5,-0.5∼0.5,-1.5∼-0.5,1.5未
ク ラ ス ター 区分 は,指 標 1の 評 価 値 の 順 に 配 列
満 と区 分
が 上 位 に あ り,そ の 周 辺 の 茨 城 ・ 栃 木 ・群 馬 ・埼 玉 が 下 位 に な っ て い ま す.こ
れ は,隣
接 す る 大 都 市 圏 の 便 利 さ と対 比 す る こ とか ら,実 態 以 上 に低 く評 価 す る結 果 だ と解 釈 され ま す. 指 標 4,す な わ ち,図 書 館 ・公 民 館 の 充 実 度 の 評 価 も,指 標 1の 評 価 値 と ほ ぼ 似 て い ます が,区
分 2に あ げ た 県 で 高 く な って い ま す.
指 標 3,す な わ ち,公 害 の 少 な さ に つ い て は,指 標 1の 評 価 値 の 高 い と こ ろ,す わ ち 大 都 市 圏 で 低 くな っ て い ま す.そ
の 周 辺 で 高 くな っ て い るの は,大
な
都 市 と比 べ て
不 便 だ が 環 境 は よ い とい う意 識 が 働 い た 結 果 そ う な っ た も の で し ょ う. 指 標 2,す な わ ち,自 然 災 害 か らの 安 全 性 が よ くな い と評 価 さ れ た の は 和 歌 山 ・徳 島 ・高 知 で す. ⑨ こ の よ う な 点 は,こ 節 の 扱 い で は,各
れ ま で の 扱 い で もほ ぼ 同 様 に 検 出 され て い ま した が,こ
指 標 の 意 味 が は っ き り して い ま す か ら,そ れ を使 っ て 「わ け る 」こ
とか ら,「 順 位 づ け 」ま で 進 め う る と期 待 さ れ ます. 主 成 分 分 析 は,本 表10.3.4は,各
の
来,そ
う い う進 め 方 を想 定 した 手 法 で す(表10.3.3).
指 標 ご とに,各
県 の 位 置 を図 示 し た もの で す.
表10.3.3
分 散 分析 表
表10.3.4
各 指 標 値 に よ る各 県 の位 置
問題10
問1 第10章
で 取 り上 げ て い る 「暮 ら しや す さ の 評 価 」に 関 す る地 域 差 に つ い て,表
10.1.2お
よ び 図10.2.2の
プ ロ グ ラ ムPCA01,デ い を そ ろ え る,と
左 側 が 得 られ る こ と を確 認せ よ. ー タ フ ァ イ ルDN10X,デ
指 定 し て 計 算 す る と,表10.1.2が
ー タ タ イ プ Q,分 散 の ち が 得 ら れ る.
こ こ ま で は こ れ ま で の 章 で 説 明 し た と お りで あ る が,図10.2.2は,CLASS に よ る 計 算 の 最 後 に 「未 公 開 の 機 能 が あ り ま す.適 と表 示 さ れ た と き に X と入 力 す る.別
用 す る と き に は X と入 力 」
の プ ロ グ ラ ムCLASSXを
呼 び 出 し て,
デ ー タ タ イ プ Q,分 散 の ち が い を そ ろ え る,と 指 定 す る と,図10.2.2が
得 られ
る. 注:い
くつ かの 問 題 を解 決 した 後CLASSの
機 能 と して組 み 込 む予 定 で す.
当面 は,こ こに あ げ た問 題 の場 合 に 限 って使 って くだ さい. 問 2 第10章 10.2.1お
で 取 り上 げ て い る 「暮 ら しや す さ の 評 価 」に 関 す る 地 域 差 に つ い て,表 よ び 図10.2.2の
右 側 が 得 られ る こ と を確 認せ よ.
問 1と 同 様 に 計 算 で き る.た
だ し,「 分 散 の ち が い を調 整 し な い 」 と指 定 す る
こ と. 問 3 第10章
で 取 り上 げ て い る 「 暮 ら しや す さ の 評 価 」に 関 す る 地 域 差 に つ い て,主
成 分 分 析 に よ っ て 誘 導 さ れ た 「主 成 分 ス コ ア ー 」を使 っ て ク ラ ス ター 分 析 す る と,表10.3.2お
よ び 表10.3.3が
得 られ る こ と を確 認 せ よ.
た だ し,「 主 成 分 ス コア ー 」を 誘 導 す る計 算 は 省 略 し,主 成 分 ス コ ア ー を 記 録 し た デ ー タ フ ァ イ ルDN10PCAを
使 えば よ い こ と とす る.
こ の 場 合,「 各 主 成 分 を対 等 に 扱 う」の が 主 成 分 分 析 の考 え 方 だ か ら,そ
れを
使 って クラ スター 分析 す る ときに も 「 各 変 数 の 分 散 を そ ろ え る」 と指 定 す る.
付録 A ● 分析 例 とその基礎 デ ータ
例 1
東 京23区 の 人 口あ た り病 院 ・診療所 数
表 A 資料 1,5
例 2 費 目別 食費支 出額 の県別 比 較 例 3
表 B 資料 2
血縁 ・地 縁 ・職 縁 …意 識の 県別 比較
表 D 資料 3
例 4 東京23区 の住 民の職 種構 成 例 5
表 F 資料 4
食物 の好 み に関す る意 識の 県別 比較
表 C 資料 3
例 6 東京都 西部 におけ る住宅 数推 移
表 G 資料 4
例 7 暮 ら しやす さに関す る意 識 の県別 比較 例8 説明 用仮想 例
表 H 資料 3 表 I
例 9 生 きが い観 の年 齢 ・性別 比較
表 E
例10
世 論調 査の デー タ(仮 想例)
資
資料 1
総 務庁統 計 局 「 社 会生 活統 計 指標 」
資料 2 総 務庁統 計 局 「 家 計調 査年 報 」 資料 3 日本放 送協 会 「全 国 県民意 識 調査 」 資料 4 総 務庁統 計 局 「国勢調 査報 告 書」 資料 5 厚生 省 「医療 施設 調査,病 院報 告」 資料 6 見 田宗介 「現代 の青 年像 」講談 社
資料 6
表 J
料
毎年
毎年 1978年,1986年
毎 5年
毎年 1987年
付 録 B ● 図 ・表 ・問題 の基 礎 デ ー タ
付表 A
東 京23区
付表 B
付 表C.1
の 医療施 設数
家 計 に お け る 食 費 支 出額 の 地 域 比 較
付 表C.2
食物 の好 みの 地域差 食 物 の 好 み の 地 域 お よ び年 齢 差
付表 D
血 縁 ・地 縁 ・職 縁
付表 E
生 き が い 観 の 年 齢 ・性 別 比 較
付表 F
東 京23区
付表 G
東 京 都 西 部 に お け る住 宅 数 の 推 移(地 域 メ ッ シ ュ 統 計)
付表 H
暮 ら しや す さ の 評 価 の 県 別 比 較
付表 I 付表 J
の 住 民 の職 種 構 成
ク ラ ス ター 分 析 説 明 用 仮 想 例
世 論 調 査 の デ ー タ(モ デ ル 例)
* それぞれの表に記 した資料 か らの引用です.数 字の定義 などにつ いては,そ れ ぞれの資料 を参 照 して くだ さい, * 刊行機 関の組織名 は,省 庁 改変前の呼称 を使 ってい ます. * 数字 の表示桁数 などをか えた もの もあ ります. * 数字 は,そ れぞれの表に付記 したファイル名 で,UEDAの
デー タベー スに収録 されてい ます.
* ファイルには,表 示 した範囲 以外 の数字 を掲載 してい る場 合 もあ ります. * 表に付 記 したファ イル以外に,分 析用 ファイルを用意 してある場合 もあ ります.問 題 で参照 す るファイル名 は,そ れ ぞれの 問題 に記述 してあ ります.
付 表 A 東 京23区 の 医 療 施 設 数
V1:人
口数(総 務 庁 統 計 局 「国 勢 調 査 」,1995年)V2
, V3, V4:病 V5, V6, V7:人
院 数 ・診 療 所 数 計(厚 生 省 「医 療 施 設 調 査 ・病 院 報告 」,1997年) 口 十 万 人 あ た り計 数
[資 料 1,5/ファ イルDI70]
付 表 B 家 計 に お け る食 費 支 出額 の 地 域比 較(1980年)
変数:各 支 出区 分別年平 均 1か 月あた り支出額 X1:穀
類,
X10:飲
料, X11:酒
X2:魚, X3:
肉,
類, X12:外
区分 : 県庁所在市 対象 : 家計調査対象全世帯
X4:乳
卵, X5:野
菜,
X6:果
物,
X7:調
味 料,
X8:菓
子, X9:調
理 食 品,
食
[資 料2/フ
ァ イ ルDK51]
付表 C 付 表C.1
食 物 の 好 み の 地 域 差(1978)
付 表C.2
食 物 の 好 み の 地 域 お よ び年 齢 差(1978)
他 の県の 数字 も,原 資 料 には掲載 されて い る.
[資料3/フ ァイルDM20]
[資料3/フ ァイルDM10]
付表 D 血 縁 ・地 縁 ・職 縁(1996年)
変 数 1
望 ま しいのは何 で も相 談で きるつ きあい 2 望 ま しいのはお 互い のこ とに 深入 りしないつ きあい 3∼4 日頃つ きあ ってい る親戚 は 多い はい/い い え 5∼6 親戚 には信頼 で きる人 が多い はい/い い え 7∼8 隣 近所の 人 とのつ きあ いは 多い はい/い い え 9∼10 隣 近所に は信 頼 で きる人が 多い はい/い い え 11∼12 仕事 関係 の人 と仕 事以外 で もつ きあ うこ とが多 い 13∼14 仕事 関係 でつ きあって いる人に信 頼で きる人が 多い
はい/い い え はい/い い え [資料3/フ ァ イルDN70]
A
付 表 E 生 きが い観 の 年齢 ・性 別比 較(1967年)
[資 料6/フ
ァ イ ルDP10]
付 表 F 東 京23区 の 住 民 の職 種 構 成
:管 理 的 職 種, B:事 務 従 事 者, C:販 売 従 事 者 , D:工 場 労 働 者,
E:サ
[資料4/フ
ー ビ ス職 業 従 事 者 ァ イ ルDG11X]
付 表 G 東 京都 西 部 に お け る住 宅 数 の推 移(地 域 メ ッ シュ統 計)
[資 料4/フ
ァ イ ルDM02E01」
付 表 H 暮 ら しや す さの 評価 の 県 別 比 較(1978年)
そ れ ぞ れ の 評 価 基準 に つ い て,「 よ い」 と答 え た 人 の 割 合 X1:総 合 評 価,X2:交 通 の 便,X3:買 物 の 便,X4:文 境衛 生,X7:娯
楽 施 設,X8:自
然 災害,X9:公
化 施 設,X5:病
院 ・診 療 所,X6:環
害 [資 料3/フ
ァ イ ルDN10]
付 表 I ク ラ ス ター 分析 説 明用 仮 想例
付 表 J 世 論 調 査 の デ ー タ(モ デル 例)
付 録 C ● プ ロ グ ラ ムの 使 い 方
UEDAの
プ ロ グ ラ ム の 使 い 方 に つ い て は,本
の 使 い 方 』で 説 明 して あ りま す が,こ トに つ い て は,こ
シりー ズ 第 9巻 『統 計 ソ フ トUEDA
の テ キ ス トの 主 題 で あ る ク ラ ス ター 分 析 の ソ フ
こ で 説 明 し ます.
C.1 プ ログ ラ ムCLASS ① UEDAの
メ ニ ュ ー 画 面 で プ ロ グ ラ ムCLASSと
す る と,オ ー プ ニ ン グ 画 面(図C.1.1)に
図C.1.1
オー プ ニ ン グ画 画
デ ー タサ イ ズ に 関 す る制 限 に 注 意 し て くだ さ い.こ い て は,種
々 の 問 題 が 発 生 す る の で,こ
例示 用デ ー タ フ ァイル を指 定
な り ます.
の 限 度 を こ え る大 き い 問 題 に つ
の 範 囲 内 で使 っ て くだ さ い.
X を指 定 す る と,後 に 説 明 す る ク ラ ス タ リ ン グ の 進 行 の 各 ス テ ップ で,結 採 用 さ れ た 区 分 対 以 外 の 対 に つ い て の 情 報 も表 示 す る形 で 進 行 し ます が,一 Enterキ
イ を お して,標
② す る と,図C.1.2の
果 的に 般 に は,
準 の 進 行 を採 用 して くだ さい. よ う に 表 示 さ れ,使
う デ ー タ セ ッ トの 指 定,そ
のデータ
セ ッ トの デ ー タ タ イ プ 確 認,ク
ラ ス ター 数 の指 定 の順 に進 み ます.
問 題 の 扱 い 方 を考 え て 指 定 す べ き と こ ろ で す が,こ
こ で は,例 示 の よ うに 指 定 して
くだ さ い. 図C.1.2
デー タ と その 扱 い 方指 定
③ こ こ まで 指 定 す る と,計 算 に 入 り ま す. 逐 次 近 似 計 算 を 採 用 し ます か ら,ま ず,初 期 値 を指 定 し,そ
れ を逐 次,改
善 して い
くこ とに な り ます.「 1 省 略 時 ル ー ル 」を適 用 す る と例 示 の よ う な 初 期 値 が 採 用 さ れることになりま
図C.1.3
④ 確 認 し てEnterキ
イ を お す と,プ
初期値の指定
ロ グ ラム に よ っ て,所
属 ク ラ ス ター区 分 を
見 出 す た め の 計 算 を デ ー タ 1,2,3 の 順 に 適 用 し て 結 果 を表 示 し て い き ま す. 図C.1.4は
1サ イ クル 進 ん だ と きの 状 態 で す.
さ ら に 進 行 し,同 様 に 表 示 して い き ます が,前 らな い と こ ろ が,カ
の サ イ ク ル とか わ っ た と こ ろ,か
ラ ー で 区 別 さ れ ま す. 図C.1.4 1
サ イ クル 進行 後 の 状 態
わ
し た が っ て,1 サ イ ク ル か わ ら な い 箇 所 が つ づ く と,そ れ 以 上 は か わ ら な い,す
な
わ ち,逐 次 近 似 計 算 が 収 束 し た こ とに な り ます. 5サ イ ク ル 目 に 入 り 2番 目の デ ー タの 区 分 が 決 ま っ た と きの 状 態 が 図C.1.5で,最 終 結 果 を示 して い るの で す.
図C.1.5
逐 次 近 似 計 算 が 収 束 した と き の状 態
⑤ 最 後 ま で 進 行 す る と,「 結 果 を 表 示 し ま す 」 と メ ッ セ ー ジ を 表 示 し ま す か ら, Enterキ
イ をお す と, 結 果 が,図C.1.6∼C.1.8の 図C.1.6
よ う に 表 示 され ま す .
各 ク ラス ター の 特 性 値
図C.1.6は,各
ク ラ ス ター の 特 性 を 表 示 す る 部 分 で す.図
の 後 に,特
化係数の表
が つ づ き ます. 図C.1.7は,そ
れ に つ づ い て 各 ク ラ ス ター の 特 性 を 図 示 し た もの で す.特
を 5段 階 に 区 切 っ て,+−
化係数
の マ ー クで 示 し て い ます.5 段 階 の 区 切 り値 は,変
き ま す か ら,パ
タ ー ン が は っ き り しな い と き に は か え て み ま し ょ う.た
区 切 り を1.5と
か え る と− の 区 切 りは1/1.5と
な り ます.+
更 で
と え ば++ の
の 区 切 り と− の 区 切
りに つ い て も同 様 で す. ま た,ク
ラ ス タ ー の 表 示 順 を 変 更 で き ます.パ
更 す る の で す. た と え ばfromに
タ ー ン表 示 が よ み や す くな る よ う変
対 して 2と入 力 す る とtoと
ら,1 と指 定 す る と 1の 行 と 2の 行 が 入 れ か え られ ます.番 つ づ い て,各
い う表 示 が 現 わ れ ます か 号 もつ け か え られ ます.
ク ラ ス ター の 構 成 メ ンバ ー を示 す 表 が 表 示 さ れ ます.図C.1.8で 図C.1.7
図C.1.8
各 ク ラス ター の特 性値(つ づ き)
各 ク ラ ス ター の構 成 メ ンバ ー
⑥ これ で 終 わ りで す. 図C.1.9 の よ うに,結
果 の プ リン ト出 力,デ
ィ ス クへ の 記 録 を指 定 で き ます.
す.
図C.1.9
C.2
終 わ りの 画 面
プ ロ グ ラ ムCLUST
① UEDAの
メ ニ ュ ー 画 面 で プ ロ グ ラ ムCLUSTと
す る と,図C.2.1の
例 示 用 デ ー タ フ ァ イ ル を指 定
オ ー プ ニ ン グ 画 面 に な りま す.
階 層 的 手 法 で す か ら,ク
ラ ス ター 区 分 数 が 1に な る ま で進 行 し ます が,途
中段 階 で
そ の と き の ク ラス タ ー 区 分 に 関 す る 情 報 も出 力 で き ます. また,区
分 集 約 の ル ー ル に 関 し て,標
準 の 他,3 つ の オ プ シ ョン を 指 定 で き ま す.
こ れ らの う ち モ ー ド 2に つ い て は6.2節,モ
ー ド 4に つ い て は6.3節
の説 明 を参 照
し て くだ さ い. こ こ で は,標 は,他
準 モ ー ドを 指 定 し た場 合 に つ い て 説 明 し ま す が,プ
ロ グ ラム の進 行
の 場 合 もほ ぼ 同 じで す.
② Enterキ 最 初 は,使
イ を お す と進 行 し ます. うデ ー タ の 指 定 で す.1 つ の デ ー タ フ ァ イ ル に 複 数 の デ ー タ セ ッ トが 記
録 さ れ て い る場 合 が あ り ます か ら,こ の ス テ ップ が 必 要 で す が,例 か 記 録 さ れ て い ませ ん か ら,当
然 1で す.
示 の 場 合 は 1つ し
図C.2.2
図C.2.3
デー タ の指 定
進行 経 過 表示 画 面
デ ー タ タ イ プ を 確 認 し た ら,特 別 処 理 を適 用 す る場 合(合 併 許 容 条 件 を指 定 す る場 合)に は こ こ で X を 入 力 し ま す が,一 ③ す る と,図C.2.3の
般 に はEnterキ
画 面 に な り ます.計
イ をお し て,次
に 進 め ます.
算 の 進 行 経 過 を 示 す 画 面 で す.
進 行 の 仕 方 に 関 す る選 択 肢 を 指 定 す る た め の ガ イ ド(フ ァ ン ク シ ョ ン キ イ の わ り あ て)が 画 面 の 上 部 に 表 示 さ れ て い ます が,一 閾 値 は,本
文6.2節
般 に はEnterキ
イ で 進 行 させ ます.
で 説 明 した 「 加 速 オ プ シ ョ ン」 を指 定 し た場 合 に 限 り有 効 で す.
ま た,「 区 分 特 定 」は,ど
の 区 分 と どの 区 分 と を合 併 す る か を プ ロ グ ラ ム に よ らず,
ユ ー ザ ー 側 で 指 定 す る オ プ シ ョ ン で す.た
と え ば 1年 前 の デ ー タ で 求 め た ク ラ ス ター
区 分 を新 しい 年 次 の デ ー タ に 適 用 して み る と い っ た適 用 場 面 が 考 え ら れ ま す. 一 般 に は こ れ らの オ プ シ ョ ン を適 用 せ ず,標
準 の 手 順 で 進 め て くだ さ い.
そ の 場 合,1 区 分 の 合併 の た び に 画 面 が 静 止 しEnterキ
イ で 次 に 進 め ます が,PF1
を お す と 「静 止 せ ず 白動 的 に 進 行 す る モー ド」に な り ます. こ の プ ロ グ ラ ム の 場 合,進
行 の 途 中 経 過 を み た い 場 合 が あ りま す か ら,「 自 動 進 行
させ る」 と 「自動 進 行 させ な い」 を切 り替 え る よ う に し て あ る の で す. 注 合併 許 容 条 件 を指 定 す る場 合 は,各 観 察単 位 ご とに 「そ れ と合 併 す る こ と を許 容 す る観 察 単 位 のリ ス トをあ らか じめ 用 意 して お き ます.デ ー タ ファ イ ル の 中 の 「許 容 条件 .LST」 を参照 して くだ さ い.こ れ を,作 業用 フ ォル ダー¥UEDA¥WORKに 上,CLUSTを
コ ピー した
呼 び出す と,そ の許 容 条 件 を参 照 して ク ラ ス ター わ け を行 な い ます.X
と
入 力 す る とその リス トを読 み 込 む の です.そ の リス トを参 照 して,許 容 され る 範 囲 でベ ス トな所属 を探 る形 で進 行 し ます. ④ 図C.2.4は
ス テ ップ15ま
さ れ た デ ー タ,そ
の プ ー ル に よ る情 報 量 変 化 が 示 さ れ て い ま す.
で 進 行 し た と こ ろ の 画 面 で す.各
ス テ ップ で プ ー ル
情 報 量 ロ ス の 少 な い 順 に プ ー ル さ れ て い る こ と を確 認 し て くだ さ い.ま 情 報 の 何 % を カ バ ー す る形 に な っ て い るか を決 定 係 数(表 で はRsq)で き ま す.た
と え ば ス テ ップ13ま
で で 累 計5%の
こ ま で プ ー ル し て も も との 情 報 の95%が
との
い か え る と,そ
残 され て い る こ と を示 して い る の で す .
図C.2.4
⑤ こ こ でPF
ロ ス で あ る こ と,い
た,も
よ む こ とが で
途 中経 過 の 表 示
9を お す と,そ の 段 階 で の 中 間 結 果 を み る こ とが で き ま す.
ま ず,図C.2.5の よ う に 「各 ク ラ ス ター 区 分 の 度 数 」,「構 成 比 」,「特 化 係 数 」,「そ の 図 」,つ づ い て,図C.2.6の よ う に,各 区 分 の メ ン バ ー 構 成 が 表 示 され ます . 画 面 表 示 が 終 わ っ た ら,図C.2.7の
図C.2.5
よ うに,そ
の 内 容 を プ リ ン トす る,あ
途 中 段 階 で の ク ラ ス ター 特 性
る い は,
図C.2.6
途 中段 階 で の クラ ス ター 構 成
図C.2.7
中 間 結 果 の 出力 指 定
フ ァ イ ル に か く よ うに 指 定 で き ます. Enterキ
イ を お す と図C.2.4の
⑥ 図C.2.4で C.2.6の
画 面 に も ど り,区 分 合 併 を つ づ け ます.
「中 断 」と 指 定 し た と き に は,そ
よ う に 表 示 し た 後,プ
の と き の 状 態 を 図C.2.5,図
動 的 に 実 行 し,次 の 図C.2.8の
リン ト出 力 用 の フ ァ イ ル お よ び デ ィ ス クへ の 記 録 を 自 メ ッセ ー ジ を 表 示 して,終
図C.2.8
わ りま す.
終 わ りの画 面
⑦ 区 分 数 1 ま で 進 行 させ た場 合 も 同 様 で す が,区
分 数 1で す か ら,「 ク ラ ス ター
区 分 の 情 報 」は あ り ませ ん.
C.3 プログラムMCLUST ① こ の プ ロ グ ラ ム は,CLUSTと
ほ ぼ 同 じで す が,地
域 メ ッシ ュ統 計 を扱 うこ と
に と も な う オ プ シ ョン を付 加 して あ り ます. UEDAの
メ ニ ュ ー 画 面 で プ ロ グ ラ ムMCLUSTと
る と,MCLUSTが
呼 び 出 され,そ
例 示 用 デー タ フ ァイル を指 定 す
の 冒頭 で H を 入 力 す る と,図C.3.1に
示 す オー
プ ニ ン グ画 面 に な りま す. CLUSTと
同 様, ク ラ ス ター 区 分 数 が 1に な る ま で 進 行 し ま す が,途
中段 階 で その
と きの ク ラ ス ター 区 分 に 関 す る情 報 も出 力 で き ま す. 区 分 集 約 の ル ー ル に 関 し て は,こ
の 画 面 の 2に 示 す 4つ の オ プ シ ョ ン を指 定 で き ま
図C.3.1
す.こ
れ らは,CLUSTの
オー プ ニ ン グ 画 面
4つ の オ プ シ ョ ン に ほ ぼ 対 応 し て い ま す が,MCLUSTに
お け る 標 準 は 2 と 3で す. 1 と 4に つ い て は 第 7章 の 説 明 を よ ん で くだ さ い. こ こ で は,モ
ー ド 2で ス テ ッ プ100ま
使 い 方(本 文 の6.3節 ② Enterキ
で進 行 させ た 後 モ ー ド 3に 切 り替 え る とい う
を参 照)を 想 定 して 説 明 し ます.
イ を お す と進 行 し ます.
ま ず,図C.3.2で
「例 示 を使 う 」と指 定 し て くだ さ い.
す る と,例 示 用 フ ァ イ ル に 含 ま れ る 変 数 名 を 番 号 つ き で 表 示 し ま す(図C.3.3)か ら,そ の ど れ を 使 うか を 指 定 し ます.例
示 で は,す
べ て を 使 う もの と し て A と入 力
して い ます. デ ー タ タ イ プ を確 認 してEnterキ
イ を お す と,次 に 進 み ます.
図C.3.2
図C.3.3
デー タ の指 定
対象変数の指定
③ す る と,図C.3.4の
画 面 が 表 示 さ れ ま す.計
算 の 進 行 経 過 を 示 す 画 面 で す.
基 礎 デ ー タ が 地 域 メ ッ シ ュ デ ー タ で す か ら,図 の 上 部 に 示 す よ う に 「地 理 的 な位 置 関 係 に 対 応 す る表 形 式 」で,各
区 分 の 一 連 番 号 と,指 標 値 の 特 性 を示 す マ ー クが 表 示
され て い ま す. 図C.3.4
進行経過表示画 面
画 面 の 下 部 は,進 行 の 仕 方 に 関 す る選 択 肢 を指 定 す る た め の ガ イ ドで す. 1∼4が
図C.3.1に
示 し た 4つ の モ ー ドに 対 応 し ま す.7 と 8は,そ
れ ぞ れ 2と 3
と同 じ で す が,「 ス テ ップ ご と に 静 止 状 態 に す る」か,「 自動 的 に 進 行 させ る か 」の ち が い で す.特
に指 定 し な け れ ば モ ー ド 3で 進 行 し ます.
モ ー ドの 切 り替 え や 中 間結 果 出 力 な ど は,各
図C.3.5
ス テ ップ の 終 わ りで 指 定 で き ます.
途 中経 過 の 表 示
し た が っ て,自 も有 効),そ
動 進 行 の 状 態 に な っ て い る と き に は,PF
1を お し て(こ れ は い っ で
の ス テ ッ プ の 終 わ りで 自動 進 行 せ ず に 指 定 を ま つ 状 態 に な る よ う予 約 し
ます. ④ 図C.3.5は
ス テ ッ プ 5ま で 進 行 した と こ ろ の 画 面 で す,
各 ス テ ップ で プ ー ル され た デ ー タ,そ の プ ー ル に よ る 情 報 量 変 化 が 示 され て い ま す. ロ ス の 少 な い順 に プ ー ル さ れ て い る こ と,し ロ ス の 累 計 は0.00%以
か し,こ の ス テ ッ プ ま で で は,情
報量
下 で あ る こ とが 示 さ れ て い ま す,
⑤ さ ら に 進 行 さ せ,ス
テ ップ42の
と こ ろ でPF
1を お す と,画
面 の下 部 に オ プ
シ ョン を指 定 す る た め の ガ イ ドが 表 示 され ま す. 図C.3.6で
は 画 面 上 部 の 表 示 が 区 分 番 号 だ け に な っ て い ま す が,こ
容 切 り替 え はPF
う い う表 示 内
2キ イ に よ っ て 行 な うこ とが で き ま す.
図C.3.6
⑥ モ ー ドを 変 更 し て,ス 次 の 図C.3.7は
オプ シ ョン指 定 の た め の ガ イ ド表 示
テ ッ プ100ま
ス テ ッ プ100の
で 自動 進 行 させ て み ま し ょ う.
状 態,す
な わ ち,区
分 数44と
な った ときの状 態 で
す. こ こ でP3と
入 力 す る と,そ の と きの 画 面 の コ ピ ー を と る こ とが で き ま す.
ま た,F2と
入 力 す る と,ク
ラ ス タ ー 構 成 メ ンバ ー の リ ス トを 画 面 に 表 示 す る こ と
が で き,P2と
入 力 す る と,フ
ァ イ ル に 書 き出 す こ とが で き ます.
い い かえ る と,そ の 段 階 で の ク ラ ス タ ー に つ い て の 情 報 が 得 ら れ るの で す. ⑦ し た が って,そ
の 段 階 で 終 了 す る こ と も 考 え ら れ ま す.そ
うす る な ら,PF 1
を お し て 処 理 切 り替 え メ ニ ュ ー を表 示 させ,「 中 断 」を指 定 し ます. ⑧ 図C.3.8は,そ
う指 定 し た 場 合 の,終
こ の メ ッセ ー ジ の う ち最 初 の 部 分 は,⑦ 示 さ れ ます.⑦
わ りの メ ッセ ー ジ で す. で 述 べ た 処 理 を実 行 し て あ っ た 場 合 に 表
の 処 理 を実 行 した 段 階 で の 情 報 で す.
図C.3.7
ス テ ッ プ100ま
図C.3.8
で の進 行 結 果
終 わ りの 画 面
中断 と指 定 した段 階で の情報 につ い て は,出 力す る よう指定 で きます. C.4
地 域 メ ッシ ュ統 計 に 関す るデ ー タ ベー ス
① 地 域 メ ッ シ ュ 統 計 に 関 す る デ ー タ フ ァ イ ル は,一 般 の デ ー タ フ ァ イ ル と異 な る 形 式 で 記 録 さ れ て い る の で,そ れ を扱 うプ ロ グ ラ ム 以 外 で使 う と き に は,特
別 の手 順
を経 る こ とが 必 要 で す. ② そ の 手 順 の あ ら ま し を 説 明 し て お き ま し ょ う. a. 地 域 メ ッ シ ュ 統 計 は,そ
れ ら専 用 の フ ォ ル ダ ー に 記録 さ れ て い る の で,ま
デ ー タベ ー ス検 索 プ ロ グ ラ ムTBLSRCHに ル を選 び,作
よ っ て,使
ず
い た いデー タフ ァ イ
業 用 フ ォ ル ダ ー に 出 力 す る.
b. 1つ の フ ァ イ ル 中 に 複 数 の デ ー タ セ ッ トが 記 録 され て い る 場 合,デ
ータファ
イ ル 中 に 記 録 さ れ て い る変 数 の リス トが 表 示 さ れ る の で,そ の 一 部 を選 択 で き る. c. 作 業 用 フ ォ ル ダ ー に 出 力 され た デ ー タの フ ァ イ ル 名 はWORK.DATと
なっ
て い る.そ れ を 適 当 な エ デ ィ タ ー で 読 み 込 み(テ キ ス ト形 式 だ か ら ど ん な エ
デ ィ タ ー で も 読 み 込 め る),地
域 メッ シュ関係 の プ ロ グ ラム で使 うた め に付
加 さ れ て い る キ イ ワ ー ドAREAを
削 除 す る.
デ ー タの 行 ご とに そ の 最 初 に 記 録 さ れ て い る 「地 域 メ ッ シ ュ の 位 置 コ ー ド」 を削 除 す る. 図C.4.1
デー タファイルの記録形式
d. そ れ を同 じフ ァ イ ル 名WORK. こ れ が,一 e. SET形
DATで
般 プ ロ グ ラム 用 のVAR形
セ ー ブ し な お す. 式 の デ ー タ で あ る.
式 の デ ー タ を 使 う プ ロ グ ラ ム の た め に は,さ
VARCONVを ③ 問 題 9の 問11な
ら に,プ
ロ グ ラム
使 っ て 記 録 形 式 を変 更 す る. ど で は,こ
の 処 置 が 必 要 で す が,こ
の 処 置 をす ませ た デ ー タ
フ ァ イ ル を用 意 して あ り,そ れ を使 う よ う指 定 して あ りま す.
付 録 D ● 統 計 ソ フ 卜UEDA
① ま ず 明 らか な こ とは 統 計 手 法 を 適 用 す る ため に は,コ だ と い う こ とで す.計
ン ピュ ー タが 必 要
算機 な し で は 実 行 で き な い 複 雑 な計 算,何
か え して 最 適 解 を 見 出 す た め の く りか え し計 算,多 機 能 な ど,コ も,コ
回 も試 行 錯 誤 を く り
種 多様 な デー タ を管 理 し利 用 す る
ン ピ ュ ー タ が 果 た す 役 割 は大 き い の で す.ま
た,統
計 学 の学習 に お いて
ン ピ ュー タ の 利 用 を視 野 に 入 れ て進 め る こ とが 必 要 で す.
し た が っ て,こ
の シ リー ズ に つ い て も,各 テ キ ス トで 説 明 した 手 法 を 適 用 す る た め
に 必 要 な プ ロ グ ラ ム を用 意 して あ り ます. ② た だ し, 「そ れ が あ れ ば 何 で も で き る」 とい う わ け で は な い こ とに 注 意 しま し ょ う. 道 具 とい う意 味 で は,「 使 い や す い もの で あ れ 」 と期 待 さ れ ま す.当 が,広
然の要求です
範 囲 の 手 法 や 選 択 機 能 が あ り ます か ら,当 面 して い る問 題 に 対 して, 「ど の 手 法 を選 ぶ か,ど
の機 能 を指定 す るか」
と い う 「コ ン ピ ュ ー タ に は 任 せ ら れ な い」ス テ ップ が あ り ます.そ
こ が 難 し く,学 習
と経 験 が 必 要 で す. 「誰 で もで き ます 」 と気 軽 に 使 え る もの で は あ り ませ ん.「 統 計 学 を知 ら な くて も使 え る」 よ うに は で き ませ ん.こ
れ が 本 質 で す.
③ こ の ため 「 統 計 パ ッ ケ ー ジ 」は,「 知 っ て い る 人 で な い と使 え な い 」 と い う側 面 を も っ て い る の で す が,そ え ま し ょ う.た
うい う側 面 を考 慮 に 入 れ て 使 い や す くす る … こ れ は,考
と え ば,「 使 い 方 の ガ イ ドを お り こ ん だ ソ フ ト」に す る こ と を 考 え る
の で す. 特 に,学
習 用 の テ キ ス トで は
「学 習 用 とい う側 面 を考 慮 に 入 れ た設 計 が 必 要 」 で す. UEDAは,こ
の こ と を 考 慮 に 入 れ た 「学 習 用 の ソ フ ト」で す.
UEDAは,著
者 の 名 前 で あ る と と もに,Utility
称 で す. ④ 教 育 用 と い う こ と を 意 図 し て, ○ 手 法 の 説 明 を 画 面 上 に展 開 す る ソ フ ト ○ 処 理の 過 程 を 説 明 つ き で 示 す ソ フ ト
for Educating
Data
Analysisの
略
〇
典 型 的 な 使 い 方 を体 験 で き る よ うに 組 み 立 て た ソ フ ト
を,学
習 の 順 を追 っ て 使 え る よ うに な っ て い ま す.た
ム が い くつ か に わ け て あ る の も,こ ム で は,何
と え ば 「回 帰 分 析 」の プ ロ グ ラ
の こ と を考 え た た め で す .は
じめ に 使 う プ ロ グ ラ
で も で き る よ う にせ ず 基 本 的 な 機 能 に 限 定 して お く,次 に 進 む と,機
能を
選 択 で き る よ う に す る … こ う い う 設 計 に して あ るの で す. ⑤ 学 習 とい う意 味 で は,そ とが 必 要 で す.し
の た め に 適 し た 「デ ー タ 」を 使 え る よ う に し て お く こ
た が っ て,UEDAに
は,デ
ー タ を 入 力 す る機 能 だ け で な く,
学 習 用 と い う こ と を考 え て 選 ん だ デ ー タ フ ァ イ ル を収 録 した 「デ ー タ ベ ー ス 」が 用 意 さ れ て い る の で す.収 録 さ れ た デ ー タ は 必 ず し も最 新 の 情 報 で は あ り ませ ん .そ れ を 使 っ た 場 合 に,「 学 習 の観 点 で 有 効 な結 果 が 得 られ る」こ と を優 先 し て選 択 して い る の で す . ⑥ 以 上 の よ うな 意 味 で,UEDAは,テ と位 置 づ け るべ き もの で す. ⑦ こ の シ ス テ ム は,10年 して い た もの のWindows版 用 経 験 を考 慮 に 入 れ て,手 改 定 し た の が,本
キ ス ト と一 体 を な す 「学 習 用 シ ス テ ム 」だ
ほ ど前 にDOS版 で す.い
と して 開 発 し,朝 倉 書 店 を 通 じ て 市 販
くつ か の 大 学 や 社 会 人 を対 象 とす る研 修 で の 利
法 の 選 択 や 画 面 上 で の 説 明 の 展 開 を工 夫 す る な ど,大 幅 に
シ リー ズ で 扱 うVersion 6 で す(第 9巻 に 添 付).
⑧ 次 は,UEDAを
使 う と き に 最 初 に 現 わ れ る メ ニ ュ ー 画 面 で す .こ
の シ リー ズ
の す べ て の テ キ ス トに 対 応 す る 内 容 に な っ て い る の で す . く わ し い 内容 お よ び 使 い 方 は 第 9巻 『 統 計 ソ フ トUEDAの
使 い 方 』を 参 照 し て く
だ さ い. UEDAの
メニュー画面
Utilityfor Educating Data
Analysis
1… … デ ー タの 統 計 的 表 現(基 本)
8… … 多 次 元 デ ー タ 解 析
2… … デ ー タの 統 計 的 表 現(分 布)
9… … 地 域 メ ッ シ ュ デ ー タ
3……分 散分 析 と仮 説検 定
10… … ア ン ケ ー ト処 理
4… … 2変 数 の 関 係
11… … 統 計 グ ラ フ と統 計 地 図
5… … 回帰 分 析
12… … デ ー タ ベ ー ス
6… … 時 系 列 分 析
13… … 共 通 ル ー テ ィ ン
7… … 構 成 比 の 比 較 ・分 析
14… …GUIDE
注:プ
ロ グ ラ ム は,富
士 通 のBASIC言
語 コ ン パ イ ラーFBASIC97を
た プ ロ グ ラム の 実 行 時 に 必 要 な モ ジ ュ ー ル は,添 Windowsは,95,98,
NT,2000の
使 っ て 開 発 し ま した .開
付 され て い ま す.
い ず れ で も動 き ま す.
発 し
A
索引
観察 単位 20
欧 文
観 察 単位 間の 距離 49 観 察 単位 方 向 へ の結 合 117,137
CDA
16
EDA
16
parsimony
関連 の 大 きさ を測 る情 報量 61 基 礎 デ ー タの 選 び方 51
61
基 礎 デ ー タの 結合 109
ア 行
帰 謬 法 64 Q 扱 い 90
ア イ テ ム 81
Q 扱 い を した場 合 と C扱 い した場 合 の比 較 90
閾値 138
級 間情報 量 96
閾値 をこ えた 変化 140
級 間 分散 28 級 間偏 差 平 方和 28,77,96
Aと(B,C)の 二重 組 み 合 わせ 68 ,B,Cの 三重 組 み 合 わせ 68 NAを
落 と した影 響 89
級 内分 散 27,50 級 内偏 差 平 方和 28,78 寄 与 度 に応 じて ウエ イ トづ け 33 距 離 の定 義 50
力 行 区 分 数 をか え た場 合 の ク ラス ター構 成 比 較
x2分 布 64 階層 構 造 65,100 単調 な―
100
―を考慮 173 階層 的手 法 95 ―と非 階層 的 手 法 の結 果 の比 較 105
48
ク ラス ター 8,20 ク ラス ター 間 の距 離 49 ク ラス ター 区分 を固定 して 変 化 をみ る
131
ク ラス ター 区分 を固定 す る こ との妥 当 性
―の 出力 97
―の 断面 103
クラ ス ター決 定 103
135
回答 区 分 81
クラ ス ター数 の 決 め方 47
各集 団 で の構 成 比 56
クラ ス ター代 表 点 の与 え 方 49
加速 オプ シ ョン 101
クラ ス ター代 表 点 の定 義 50
合併 許 容 条件 102
クラ ス ター特 性表 42
カテ ゴ リー 81
ク ラ ス ター分 析 8,21,49
Kullbackの 情報 量 63
―に よ る区分 け 13
―の数 理 75
樹 状 図 100
―の適 用 意 図 160
主 成分 分 析 13,21,174
区 分 け 1
手 法 の選 び 方 51
―の論 理 1
条件 をか え て観 察 した結 果の 結 合 114 情報 の ロス 13
計 測単 位 の ちが い 113 K-means法 75
情 報 表 現単 位 161
決 定係 数28
情 報 表現 の分 解 67
検 証 的 デ ー タ解 析 16
情 報 量 61
現 象 の 推移 158
―を集 約 す る 160
―の減 少 21 ―の分 解 67
構 成 比 55 標 準 の―
―の分 解式 69 56
―に した上 で結 合 113 ―の相 対比 56
情 報量 分 解 65 情 報 ロス 21 所属 区 分 の変 化 138
―の比 較 54 個 別 デ ー タ 82
数量 デ ー タ 20,37
サ 行
成 長 曲線 149 制 約 条件 12
最遠 距 離 法 50
説 明 の 簡明 性 21
最 短 距 離 法 50
説 明 変数 55,119,120
三 角 図 表 10
説 明用 の 観 察単 位 123 説 明用 の 区 分 123
C扱 い 90
全 分散 27
時 間 的変 化 128
全偏 差 平 方和 28
しきい値 138 指 数 曲線 149
タ 行
実 空 間で の 連続 性 を条件 156 質 的 デー タ 20,75
対 象 者 数が 異 な る影 響 89
指 標 21
多 次 元化 29
指 標 値 の 変化 131,138 ―をみ る ため の ク ラス ター区 分 137
多 面 的 な観 点 を 入れ てわ け る 109 探 索 的 デー タ解析 16
集 計 82 重 心 間 距離 法 50
地 域 デー タの分 析 143
集 団 区 分 に対 応 す る デー タ 82
地域 メ ッ シュ統 計 145
集 中 楕 円 4
逐次 近 似 計算 38
自由度 64 集 約 21 ―に よる情 報 量 ロス 63
―の 進 め方 50 調査 事 項 81 地理 的 な連 続 性 156
―の有効 性 71 集約 法 21
定 義 上 の遠 近 65
デ ー タが示 す 事 実 の よみ方 65
分析 手 段 と しての 運 用 58
デ ー タが示 す パ ター ンで みた 遠 近 65
分析 手 段 と しての 構 成 58
デ ー タ空 間 で区 分 集 約 156
分 類体 系 95
デ ー タの扱 い方 12 デ ー タの 意味 の よみ 方 65
平均 距 離 法 50
デ ー タの 区分 け 25
偏 差平 方 和 77
デ ー タの 区分 けの 有 効性 25
変 数の 結 合 109
デ ー タ分解 65
変 数 の細 分 9
点的 な現 象 156 デ ン ドロ グラ ム 100
変 数 の追 加 9 変 数方 向 へ の結 合 117 変 数 を対 等 に扱 う 32
特化 係 数 56 トレース 29
ボ ッ ク ス プ ロ ッ ト 2
ナ 行
マ 行
年次 ご とに ク ラ ス タ リ ン グ 128
面 的 な 現 象 156 メ ン バ ー 構 成 比 較 46
ハ 行
メ ン バ ー 表 43
パ ー シ モ ニ イ 61
問 題 の 扱 い 方 33
外 れ値 2 パ タ ー ン 図 43
ヤ 行
非 階層 的 手 法 38
有 意 差 64
被 説 明変 数 55 評価 値(観 点 別) 166
ラ 行
評価 値(総 合) 166 表 現 単位 の サ イズ 143
隣 接 条 件 102
複 数 の デ ー タの 結 合 86
レ ー ト 148
普 遍性 21
レ ベ ル 148
分 散 25 ―の ちが い の 影響 170
レ ベ ル レ ー ト図 144,147,149 レ ベ ル レ ー ト図 上 で の 動 き 158
―の ちが い を消去 168 ―の ちが い を残す 168
ロ ジ ス テ ィ ッ ク カ ー ブ 149
―の変 化 50 ―を そ ろ えて 結 合 113
ワ 行
分 散 ・共分 散 行 列 29 分 散 分析 25 分散 分析 表 43
Ward法
97
著者略歴 上 田 尚 一 1927年 広島 県に生 まれる 1950年 東京 大学 第一工 学部 応用 数学科卒 業 総務庁 統計 局,厚 生省,外 務 省,統 計研修 所 な どに て 統計 ・電子 計算 機 関係 の職 務 に従 事 1982年 龍谷大 学経 済学 部教 授 主著
「 パ ソコ ンで 学ぶ デー タ解 析 の方法」Ⅰ,Ⅱ(朝倉書 店,1990,1991) 「 統 計 デー タの見 方 ・使 い方」(朝 倉 書店,1981)
講座 〈 情 報 を よむ 統 計学 〉7 定価 はカバ ー に表示
ク ラ ス タ ー分 析 2003年
1月25日
初 版 第 1刷
2007年
1月25日
第 3刷
著 者 上
田
尚
一
発行者 朝
倉
邦
造
株式 発 行所 会社 朝
倉
書
店
東 京 都 新 宿 区 新 小 川 町6-29 郵 便 電 FAX
〈 検 印省 略 〉
978-4-254-12777-5
162-8707
03(3260)0180
http://www.asakura.co.jp
中央 印刷 ・渡辺 製本
〓2003〈 無 断複 写 ・転 載 を禁ず〉
ISBN
番 号
話 03(3260)0141
C3341
Printed in Japan
好 評 の 事 典 ・辞 典 ・ハ ン ドブ ッ ク 紙の文化事典 人間の許容限界事典
尾 鍋 史彦 ほか 編 A5判 592頁
コ ン ピ ュー タ 代 数 ハ ン ドブ ッ ク
山本 慎 ほか 訳 A5判 1040頁
山崎 昌廣 ほか 編 B5判 1032頁
数理 統 計 学 ハ ン ドブ ック
豊 田秀樹 監 訳 A5判 784頁
物 理 デ ー タ事典
日本物 理学 会 編 B5判 600頁
物理 学大事典
鈴木増 雄 ほか 編 B5判
896頁
日本分析 化学 会 編 A5判 356頁
機器分析 の事典
新 田 尚 ほか 編 B5判 1040頁
気 象 ハ ン ドブ ッ ク(第3 版)
太田次郎 監訳
分子生物学大百科 事典 遺伝学事典
B5判
1172頁
東江 昭夫 ほか 編 A5判 344頁 谷内 透 ほか 編 A5判 612頁
魚 の科 学事典 環境緑化 の事典
日本緑化 工学 会 編 B5判 496頁 尾上守 夫 ほか 編 A5判 484頁
3次 元 映像 ハ ン ドブ ック 電 力 工 学 ハ ン ドブ ック
宅 間 董 ほか 編 A5判 760頁
電 子 回路 ハ ン ドブ ック
藤井信 生 ほか 編 B5判 456百
呼吸の事典
有 田秀 穂 編 A5判 744頁
肥料の事典
但野利 秋 ほか 編 B5判 408 頁 日本食 品工学 会 編 B5判 768頁
食 品 工 学 ハ ン ドブ ック
木材科 学ハ ン ドブック
岡野
健 ・祖 父江信 夫 編 A5判 464頁
水産大百科事典 心理学総合事典
水 産総合研 究 セ ンター 編 B5判 808頁 海保 博之 ・楠 見 孝 監修 B5判 784頁
オックスフォードス ポ ー ツ 医 科 学 辞 典
福永 哲 夫 監 訳 A5判 592頁
価 格 ・概 要 等 は 小 社 ホ ー ム ペ ー ジ を ご 覧 くだ さ い.