内容紹介
内閣の支持率から合計特殊出生率まで、さまざまな社会情報が数値化されている今日、それらのデータを正しく理解することは、文系・理系問わず非常に重要である。本書では、調査によるデータの収集からその集計・分類などの取り扱い、統計解析手法を用いたデータの分析まで、基礎からていねいに解説。例題には実際の政府統計や公務員試験の資料解釈で出題されたデータを多数使用し、各章末には練習問題も掲載、本文中のデータ、練習問題の解答はExcel(R)ファイルで専用ホームページからすべてダウンロード可能であり、構成に沿って学習を進めることができる。人間の行動や社会現象をさまざまなデータから科学的に読み解く方法を手ほどきする。統計データに携わるすべての人に役立つ、実践的なデータの科学の入門書。
目次
1 数字で表された社会情報とは―さまざまな統計データ―
1.1 数字で社会を語るとは
(1)社会情報としての統計データ
(2)統計データの収集
1.2 政府統計とは
(1)指定統計・承認統計・届出統計
(2)調査統計と業務統計
1.3 統計データを科学する
2 すべてを調べるか一部を調べるか―全数調査と一部調査―
2.1 全体を調べる―全数調査―
2.2 一部を調べる―一部調査―
(1)無作為抽出法
(2)有意抽出
2.3 誤りの大きさを測るには―標本誤差―
練習問題
3 実際に調査を行うには―さまざまな調査の実施方法―
3.1 調査を実施するには
(1)面接調査
(2)留置調査
(3)郵送調査
(4)電話調査
(5)集合調査
(6)インターネット調査(Web調査)
3.2 調査票を作成するには
(1)調査課題の整理・調査内容の検討
(2)質問項目の作成
(3)質問構成(レイアウト)検討
(4)プリテストの実施・調査票の修正
3.3 調査環境の変化
―個人情報保護基本法の策定とプライバシーの保護―
(1)個人情報保護法の策定
(2)プライバシーマーク制度
4 統計データの構造とは―変数とデータ―
4.1 データの属性を表す
(1)データ解析とデータ構造
(2)変数と尺度
4.2 データを分類する
(1)個票データと集計データ
(2)量的データと質的データ
(3)多変量データ
4.3 データは確率的に与えられるか―確率変数―
5 統計データの分布を見る―集計と分類―
5.1 量的データを集計・分類する―度数分布表―
(1)なぜ量的データの集計が必要か
(2)度数分布表
(3)度数分布表の問題点
5.2 質的データを集計・分類する―分割表―
練習問題
6 分布の中心を測る―さまざまな代表値―
6.1 データの中心を数値で表す―平均―
(1)相加平均(算術平均)
(2)相乗平均(幾何平均)
6.2 データの中心を位置で表す―中央値と最頻値―
(1)中央値(メディアン)
(2)最頻値(モード)
6.3 分布と代表値の関係を見る
練習問題
7 分布のバラツキを測る―散布度と集中度―
7.1 データのバラツキを表す―さまざまな散布度―
(1)目的
(2)分散と標準偏差
(3)変動係数
(4)4分位範囲
7.2 データの不均等さを表す―集中度―
(1)ローレンツ曲線
(2)ジニ係数
練習問題
8 量的な関係を探索する―相関と回帰―
8.1 関係の強さを測る―相関係数―
(1)相関関係の意味
(2)相関係数の計算
(3)例題
(4)見せかけの相関
8.2 データから予測する―回帰分析―
(1)回帰分析の目的
(2)最小2乗法
(3)決定係数
(4)例題
(5)分析上の注意点
練習問題
9 量的な現象を予測する―重回帰分析―
9.1 さまざまな要因の影響を測る
(1)重回帰分析の目的
(2)最小2乗法による回帰係数の推定
9.2 よい回帰モデルを見つける
(1)t検定による変数選択
(2)自由度調整済み決定係数と予測の精度
(3)例題
9.3 回帰モデルを診断する
(1)回帰モデルをめぐるさまざまな問題
(2)非線形の問題
(3)誤差項の自己相関の問題
(4)多重共線性の問題
(5)外れ値の問題
(6)例題
練習問題
10 質的な関連を探索する―カテゴリカルデータ解析―
10.1 分割表の関連とは何か
10.2 関連の強さを測る―連関測度―
(1)連関測度とは何か―2×2分割表の場合―
(2)カテゴリーが多いときの連関測度―r×c分割表の場合―
10.3 関連の有無を検証する―χ2検定―
(1)χ2検定とは何か
(2)独立性の検定
(3)例題
(4)イェーツの連続修正とフィッシャーの直接確率法
練習問題
11 質的な現象を測る―数量化理論―
11.1 数量化理論とは何か
11.2 現象を予測する―数量化I類―
(1)開発の経緯
(2)数量化I類の解法
(3)予測結果の評価
(4)分析例:雑誌広告の注目率予測
11.3 現象を判別・予測する―数量化II類―
(1)開発の経緯
(2)数量化II類の解法
(3)判別結果の評価
(4)分析例:局別視聴傾向の分析
11.4 現象を分類する―数量化III類―
(1)開発の経緯
(2)数量化III類の解法
(3)データの構造を探る
(4)分析例:『源氏物語』の成立順序の推定
11.5 関係を探る―数量化IV類―
(1)開発の経緯
(2)数量化IV類の解法
(3)関係を探る
(4)分析例:輸出入に見る国の依存関係
12 複雑な現象を測る―多変量データ解析―
12.1 多変量データ解析を分析する
12.2 多変量データ解析の基本
12.3 さまざまな多変量データ解析
(1)主成分分析
(2)因子分析
(3)判別分析
(4)クラスター分析
12.4 利用上の注意点
練習問題
13 データ解析の実際―世代を測る―
13.1 世代を測る(1)―コウホート分析―
(1)コウホート分析とは
(2)分析事例:新聞閲読状況のコウホート分析
13.2 世代を測る(2)―CHAID分析―
(1)CHAID分析とは
(2)分析事例:閲読雑誌記事の世代間比較
付録
A 標準正規分布(確率α→z値)
B t分布法(確率α,自由度→T値)
C χ2分布(確率α,自由度→X2値)
コラム一覧
統計学の語源について
C.F. ガウスと誤差分布
F. ゴールトンと相関・回帰
林知己夫とデータの科学
R.A.フィッシャーと実験計画法
社会調査士制度
▼ 補足資料
▼ 関連記事
- 『調査と分析のための統計』データダウンロードのご案内2008.04.16