因果
時間が無かったのでいまさらの話題ですが……
「日教組が強いところは学力が低いんじゃないか」と発言して辞めた大臣がいましたけど、まあ、「本当にそうか」というのを調べるためにはまず、散布図を描いて、それから相関係数でも計算してみるところから始めるのが定石です。
データA(たとえば「都道府県ごとの日教組の組織率」)とデータB(たとえば「都道府県ごとの全国学力調査の点数」)があった場合、相関係数は
- データAの値が大きくなるにつれてデータBの値も大きくなる傾向がある場合 - 正の値(最大値は1)
- データAの値が大きくなるにつれてデータBの値は小さくなる傾向がある場合 - 負の値(最小値は-1)
- 傾向が見られない場合 - 0に近い値
という値になります。相関係数が1に近い場合「AとBに正の相関がある」、-1に近い場合「AとBに負の相関がある」、0に近い場合「AとBは無相関である」(実際には相関係数が0に近いからと言って無相関とは言い切れないのですが)と言います。で、前大臣の発言からすれば、日教組の組織率と学力調査の点数の間には負の相関があると考えられます。
実際に、いろいろなところでいろいろな人が、既に散布図を作ったり、相関係数を計算していたりしますので、ここで同じことをやっても仕方がないと思いますので止めておきます(いや、時間が無い、というのも理由の一つですが)。たくさんの人が調べた結果から言うと「あまり相関は見られない」ということのようです。それに「日教組が強い」というのを「組織率で計っていいのか?」とか、学力テストのどの点数を使うのか、とか、いろいろと議論の余地はありますし。
で、ここからが重要なところです。もし仮に、相関係数を計算して「強い相関がある」という結果が出たとします(今回の例では、出なかったようですが)。その場合であっても、「日教組が強いところは学力が低い」は必ずしも正しくはない、ということです。相関係数は「2つのデータの間に相関がある」かどうかを言っているにすぎません。2つのデータの間の因果関係については何も証明はできないのです。「日教組が強いところは学力が低い」という前大臣の発言の意図は、
日教組が強い
↓
組合活動に熱心になって授業がおろそかになる
↓
子供たちの学力が低下する
ということを言いたかったのだと推測します。相関係数を計算したところ、仮に負の強い相関が認められたとしても、こういう因果関係であるのかどうかはわかりません。たとえば、次のような因果関係だったかも知れません。
子供たちの学力が低い
↓
教師がやる気を無くして組合活動に熱心になる
↓
日教組が強くなる
または、まったく別の原因があったかも知れません。
教師の賃金が低い
↓
授業を熱心にやる気が起きない、かつ、組合活動に熱心になる
というわけで「関係があるんじゃないか」と疑ってるデータの組に対して、散布図を描いたり、相関係数を計算したりするところまではいいのですが、その結果によって因果関係まで証明できた、としてしまうとそれは誤りです。
と、いうような話が先日書いた本にもありますので、興味があったら見てください(宣伝)。