「騙しの統計学」を読んでみて

http://members2.jcom.home.ne.jp/yu-misawa/hibi/damasi.html
犯罪に係る統計の読み取り方。ちょっと調べものをしていて出てきたサイトでなかなか興味深い事が書かれている。

 上記「再犯率」について、多分誤解さてれいる方がいると思いますので、補足させて頂きます。勘違いされている人は上記を数値をこんなふうに思っていると思います。すなわち、「同じ人物が同じ犯罪を繰り返す割合」だと。これは間違いです。このように思われている方は統計データに騙され易い人なので注意して下さい。
 正確には「一度検挙された人間が同じ罪名で再び検挙された割合」です。違いを説明します。

 ☆Aは100件の強姦を犯しました。そのうちひとりが届出を出し、Aは逮捕されました。そして出所後すぐに強姦犯罪を50件行い、うちひとりから届出され、再度逮捕されました。

 ☆Bは1件の強姦を犯しました。すぐに逮捕されました。出所後五年くらいたって、再び強姦犯罪を犯し、逮捕されました。

 上記は両方とも再犯者率としては同じ1でカウントされます。

こーゆー事、勉強しないとわからんよなあと、唸ってしまった。Aは50とカウントされると、思っちゃうよ。

でも、納得のいかない記述もある。

 統計の扱いにおいて最大の間違い、それは統計データより物事を推測するという行為です。統計データはあくまで「結論」でしかないはずですが、何故か「可能性」を論じるために使われているみたいです。
 私が中学生のときの試験問題に、「このデータより何がわかりますか?」みたいな問題がありました、今考えると明らかに統計データの意味を取り違えた愚かな問題です。冒頭に記述しました正しいデータの項目からもわからると思いますが、統計データとは厳格な定義と目的を持って行うべきで、逆説的であってはならないのです。

統計データの取り方を理解した上で、すでに積み上げられている理論に照らした演繹であれば、有効だと思う。結論を確認する目的でしか使えないというのは、せっかくの実験結果の有用性を低めていると思う。

 もう少し詳しく説明しますと、統計データとは基本は理系的な実験データであるということです。まずある「現象」があるとします。理系ではその「現象」からいろいろと「推測」するわけです。理系の戦いはここから始まります。「推測」はあくまで「仮説」でしかありません。その「仮説」を「真理」とするためにさまざまな実験や検証を通して、それを証明するのです。ここでその証明の証として「(統計)データ」が使われるわけです。
 理系では「このデータを見てわかると思いますが、○○だと思われます」なんて言葉は使いません。彼らはこう言います。「私は○○だと考えます。これがその結果(データ)です」 すなわち社会学者などが統計データを要いて、この「このデータより……」と言っているのは、理系にしたら始めの部分、「現象」から「推測」しただけにしか過ぎないのです。そこからが本番なのに、その「仮説」を何故か「真実」のように扱っています。

観測した結果を元に、理論の検証を行って、理論と違う所があれば理論を修正してまた観測… と、フィードバックしながら進むのが研究というものでは? 元記事ではこの、観測の結果で新しい理論(推測、演繹)が生まれることを否定しているように思う。データからの意味の汲み取り方が間違っていなくて、そこから導いた推測(結論ではなくて推測よ、あくまで)を検証する為に、また実験が必要よ、というのはそのとおりだと思うけども。

まあ、あれだテレビなんかでの統計の使われ方に問題があって、統計データを持ち出してくる時に、それがそこで展開される理論の検証物として提示されているのか、違う目的でとったデータから新たに考えられる可能性として論じている時のその区別が、わかりにくいというのはあるかもしれない。その曖昧に扱われている状態がよろしくないというのは、わかるかなあ。

でもそれはまた、一方で、そーゆー「曖昧な扱い」をよくわからないまま、仮説を示しているだけという状況を「あ、そーゆーコト(結論)なんだ。」と間違った理解をしてしまうリテラシのない人が多いんじゃないの? という暗黙の指摘もある。「曖昧な扱い」をする方も困るけど、それをそのまま受け入れる方にも問題があるんだ。

ふむ。日曜の朝に、いい勉強になった。というか、こんな駄文書いてねーで論文かけよ9末提出だよばかやろーと、上司におこられそうだw やばいww