参考 地域創りの意思決定 第6節 分析技法 第4項 統計学メモ
(1)理論負荷性 地域を知るためには、まず現地を見て回り、いろいろな人から話を聞き、さらに多様な資料に目を通すことが肝要である。しかし、見聞を広めるだけでは事例的事実の収集に留まり、自らの先入観に都合のいい事例を並べがちとなる(これは「理論負荷性」と言われている)。また、他地域と比較した相対的な位置付などを含めた確実な知識には至り難い。 そこで、いろいろな見聞を踏まえつつも、統計的な指標の検討が必要となる。 理論負荷性の事例 富山県は自然が豊かだという先入観があるが、日常の居住空間の自然は乏しい。 (2)統計の入手 インターネットを利用して多様な統計が利用できるようになっている。 日本の統計は、「政府統計の総合窓口」。 各国の統計はもとより世界銀行など国際機関の統計サイトも充実している。 (3)正規分布と偏差値 平均から乖離した指標を見つける手段となる。 偏差 =各データと平均の差 分散 =偏差平方の平均 標準偏差 =分散の平方根 標準偏差(Standard Deviation) σ、s、dなどが記号として用いられる。 正規化;(各データ−平均値)/標準偏差 赤ちゃんの体重は偏差値で表現すると分かり易い。 体重を聞いてもその月令の赤ちゃんの平均的体重を知っている訳ではない。 2d以上大きい⇒上位2.3%に入っている。 (4)サンプル調査 統計には、比率を求める場合と平均値を求める場合がある。 比率の場合 標本数(n)が小さいと、標準偏差が大きくなり、結果として求められる標本比率の幅が大きくなる。 実際の調査では標本抽出が偏っていることも多い。 p±√(p*(1-p)/n)の幅の中に68%入る p±1.96√(p*(1-p)/n)の幅の中に95%入る 平均値の場合 (5)多変量解析
都道府県の指標を多変量解析(クラスター分析、主成分分析、因子分析など)。 「回帰分析」 残差の分散(散らばりの程度)の元のデータの分散に対する比率が小さいほど相関は大きい。 相関係数の二乗 =1−(残差分散−元データ分散)/元データ分散
「相関行列」 関連する統計指標を並べ、相互の相関係数を求める。 説明力の高い複数の説明変数を取り出す。 因果関係図を描いてみる。 相関係数が高いことが必ずしも因果関係の高さに繋がらないことに留意が必要。 「因子分析、主成分分析、クラスター分析」 因子分析は、データ内に潜む構造を見出す手法。 主成分分析は、データから構造を作り出す手法。 クラスター分析は、関連の強いデータを順に繋いでいく手法。 都道府県統計の因子分析の例。 日本海沿岸=太平洋沿岸型軸及び中央=周縁型の中央軸が見いだされる。 3つの分析は同じデータを利用しており、当然だが似た結果となる。 (Aug.23,2021) |