調査と分析のための統計

調査と分析のための統計

社会・経済のデータサイエンス
著者名 上藤 一郎
森本 栄一
常包 昌宏
発行元 丸善出版
発行年月日 2006年10月
判型 A5 210×148
ページ数 200ページ
ISBN 978-4-621-07758-0
Cコード 3041
ジャンル 数学・統計学

内容紹介

内閣の支持率から合計特殊出生率まで、さまざまな社会情報が数値化されている今日、それらのデータを正しく理解することは、文系・理系問わず非常に重要である。本書では、調査によるデータの収集からその集計・分類などの取り扱い、統計解析手法を用いたデータの分析まで、基礎からていねいに解説。例題には実際の政府統計や公務員試験の資料解釈で出題されたデータを多数使用し、各章末には練習問題も掲載、本文中のデータ、練習問題の解答はExcel(R)ファイルで専用ホームページからすべてダウンロード可能であり、構成に沿って学習を進めることができる。人間の行動や社会現象をさまざまなデータから科学的に読み解く方法を手ほどきする。統計データに携わるすべての人に役立つ、実践的なデータの科学の入門書。

目次

1 数字で表された社会情報とは―さまざまな統計データ―
 1.1 数字で社会を語るとは
  (1)社会情報としての統計データ
  (2)統計データの収集
 1.2 政府統計とは
  (1)指定統計・承認統計・届出統計
  (2)調査統計と業務統計
 1.3 統計データを科学する
2 すべてを調べるか一部を調べるか―全数調査と一部調査―
 2.1 全体を調べる―全数調査―
 2.2 一部を調べる―一部調査―
  (1)無作為抽出法
  (2)有意抽出
 2.3 誤りの大きさを測るには―標本誤差―
 練習問題 
3 実際に調査を行うには―さまざまな調査の実施方法―
 3.1 調査を実施するには
  (1)面接調査
  (2)留置調査
  (3)郵送調査
  (4)電話調査
  (5)集合調査
  (6)インターネット調査(Web調査)
 3.2 調査票を作成するには
  (1)調査課題の整理・調査内容の検討
  (2)質問項目の作成
  (3)質問構成(レイアウト)検討 
  (4)プリテストの実施・調査票の修正
 3.3 調査環境の変化
      ―個人情報保護基本法の策定とプライバシーの保護―
  (1)個人情報保護法の策定
  (2)プライバシーマーク制度
4 統計データの構造とは―変数とデータ―
 4.1 データの属性を表す
  (1)データ解析とデータ構造
  (2)変数と尺度
 4.2 データを分類する
  (1)個票データと集計データ
  (2)量的データと質的データ
  (3)多変量データ
 4.3 データは確率的に与えられるか―確率変数―
5 統計データの分布を見る―集計と分類―
 5.1 量的データを集計・分類する―度数分布表―
  (1)なぜ量的データの集計が必要か
  (2)度数分布表
  (3)度数分布表の問題点
 5.2 質的データを集計・分類する―分割表―
 練習問題
6 分布の中心を測る―さまざまな代表値―
 6.1 データの中心を数値で表す―平均―
  (1)相加平均(算術平均)
  (2)相乗平均(幾何平均)
 6.2 データの中心を位置で表す―中央値と最頻値― 
  (1)中央値(メディアン)
  (2)最頻値(モード)
 6.3 分布と代表値の関係を見る 
 練習問題
7 分布のバラツキを測る―散布度と集中度― 
 7.1 データのバラツキを表す―さまざまな散布度― 
  (1)目的 
  (2)分散と標準偏差 
  (3)変動係数 
  (4)4分位範囲 
 7.2 データの不均等さを表す―集中度― 
  (1)ローレンツ曲線 
  (2)ジニ係数  
 練習問題 
8 量的な関係を探索する―相関と回帰― 
 8.1 関係の強さを測る―相関係数― 
  (1)相関関係の意味 
  (2)相関係数の計算 
  (3)例題 
  (4)見せかけの相関 
 8.2 データから予測する―回帰分析― 
  (1)回帰分析の目的 
  (2)最小2乗法 
  (3)決定係数 
  (4)例題 
  (5)分析上の注意点 
 練習問題 
9 量的な現象を予測する―重回帰分析― 
 9.1 さまざまな要因の影響を測る 
  (1)重回帰分析の目的 
  (2)最小2乗法による回帰係数の推定 
 9.2 よい回帰モデルを見つける 
  (1)t検定による変数選択 
  (2)自由度調整済み決定係数と予測の精度 
  (3)例題 
 9.3 回帰モデルを診断する 
  (1)回帰モデルをめぐるさまざまな問題 
  (2)非線形の問題 
  (3)誤差項の自己相関の問題 
  (4)多重共線性の問題 
  (5)外れ値の問題 
  (6)例題 
 練習問題 
10 質的な関連を探索する―カテゴリカルデータ解析― 
 10.1 分割表の関連とは何か 
 10.2 関連の強さを測る―連関測度―
  (1)連関測度とは何か―2×2分割表の場合― 
  (2)カテゴリーが多いときの連関測度―r×c分割表の場合― 
 10.3 関連の有無を検証する―χ2検定― 
  (1)χ2検定とは何か
  (2)独立性の検定 
  (3)例題 
  (4)イェーツの連続修正とフィッシャーの直接確率法 
 練習問題 
11 質的な現象を測る―数量化理論― 
 11.1 数量化理論とは何か 
 11.2 現象を予測する―数量化I類― 
  (1)開発の経緯 
  (2)数量化I類の解法 
  (3)予測結果の評価 
  (4)分析例:雑誌広告の注目率予測 
 11.3 現象を判別・予測する―数量化II類― 
  (1)開発の経緯 
  (2)数量化II類の解法 
  (3)判別結果の評価 
  (4)分析例:局別視聴傾向の分析 
 11.4 現象を分類する―数量化III類― 
  (1)開発の経緯 
  (2)数量化III類の解法 
  (3)データの構造を探る 
  (4)分析例:『源氏物語』の成立順序の推定 
 11.5 関係を探る―数量化IV類― 
  (1)開発の経緯 
  (2)数量化IV類の解法 
  (3)関係を探る 
  (4)分析例:輸出入に見る国の依存関係
12 複雑な現象を測る―多変量データ解析― 
 12.1 多変量データ解析を分析する 
 12.2 多変量データ解析の基本 
 12.3 さまざまな多変量データ解析 
  (1)主成分分析 
  (2)因子分析 
  (3)判別分析 
  (4)クラスター分析 
 12.4 利用上の注意点 
 練習問題 
13 データ解析の実際―世代を測る― 
 13.1 世代を測る(1)―コウホート分析― 
  (1)コウホート分析とは 
  (2)分析事例:新聞閲読状況のコウホート分析 
 13.2 世代を測る(2)―CHAID分析― 
  (1)CHAID分析とは 
  (2)分析事例:閲読雑誌記事の世代間比較 
付録
 A 標準正規分布(確率α→z値) 
 B t分布法(確率α,自由度→T値) 
 C χ2分布(確率α,自由度→X2値) 
コラム一覧
 統計学の語源について 
 C.F. ガウスと誤差分布 
 F. ゴールトンと相関・回帰 
 林知己夫とデータの科学 
 R.A.フィッシャーと実験計画法
 社会調査士制度

定価:本体2,300円+税
在庫:品切れ・重版未定