クロス集計は正しく読まなと危ない!~知っておきたいクロス集計の基礎知識①~
こんにちは、ライターの田原です。
今年も10月ですね。
年末の繁忙期を考えるとぞっとする時期になってきました。
弊社は調査分析を生業としているため、年末に近づくにつれ、集計の基本であるクロス集計を行う機会が増えてきます。
心理学などの統計を扱う学問を専攻している学生の方々も、卒業論文や修士論文のために集計の基本であるクロス集計を多用する機会が増えるのではないでしょうか。
調査を実施すると必ず行うと言っても過言ではないクロス集計の注意点について、何回かに分けて連載形式で記載していこうと思います。
「何回か」と言っているのは、第何回目で終わるか現状全く考えてないからです。
2回目でネタが尽きたら連載と言えるのだろうか、、、と少し不安ですが、気にしないようにします。
横%と縦%
クロス集計結果を何らかの集計ソフトで出力するときに、縦%か横%を選択して出力することがあります。
横%とは、横方向の割合を足し上げると100%となるもので、縦%とは縦方向の割合を足し上げると100%になるものです。
この2つをきちんと使い分けないとデータをきちんと把握できません。
自分で書いていて思いますが、そのままのことを書いていますね・・・
具体的な例で見たほうがわかりやすいので、下の図を見てください。
下の図は、A地区とB地区の二つの地区がある地域で、美術館を建てることに対する賛否をアンケートした結果です(上段が度数で下段が割合です。アンケートはもちろん架空のものです)。
横%は、A地区で賛否の割合がどうなっているのか、B地区で賛否の割合がどうなっているのかを把握するときに使います。
A地区だと、どちらかというと賛成と答える割合が最も多いことが、B地区では反対と答える割合が最も多いことがわかりますね。
縦%は、賛否の割合が、地区でどうなっているのかを把握するときに使います。
賛成と答える割合は、B地区の方がA地区より多い事がわかります。
注意しないといけない点
さらっと書きましたが、この使い分けは結構重要です。ポイントは、
横%で集計しているときは、横の比較しかできない(縦の比較はダメ)
縦%で集計しているときは、縦の比較しかできない(横の比較はダメ)
ということです。
横%の集計表で、A地区の賛成26.7%とB地区の賛成20.2%を単純に比較することはできません。
横%で縦の比較をすると、A地区の方が賛成と答える割合が多いですが、縦%で見ると、B地区の方が賛成と答える割合が多いことがわかりますね。
横%のクロス集計結果において、縦の比較をしてしまうと、B地区よりもA地区の方が「賛成」と答える数(度数)が多いと捉えられてしまう可能性があります。
読み手が勘違いしないように記載することがとても重要です。
重要なことは、何を明らかにするための集計かということを意識して、縦%か横%かを選択し、誤解が生じないように結果を記載することです。
終わりに
クロス集計はかなり便利で多用するのですが、使い方を誤ると正しくデータが把握できないので注意が必要です。
縦%と横%をうまく使い分けて、このデータはどちらを使うと知りたいことが把握できるのかという点をきちんと考える事が大切です。
横%だけで、たまに縦%じゃないとわからないことを書いている報告書を見かけますが、横着をせずに、適宜横%と縦%を使い分けてデータを見ないと、正しくデータを把握できません。
皆さんもクロス集計をする際は、縦%と横%に気を付けてくださいね。
この記事を書いた人
田原 歩
最強の男