統計思考の世界
[tag: book]
三中信宏「統計思考の世界」を読んだ。
統計的手法というのは、人間がすべてを理由付けによって 把握するにはあまりに大量なデータを、何とか理由を保持 しながら扱うためのものだと思う。
An At a NOA 2017-05-05 “統計”
大量のバラバラなデータのうち、それとなく揃っている
部分を一つの塊とみなすことで、データサイズが小さく
なり、データ処理にかかるコストは減少する。
これはデータ圧縮の過程である。
適切な圧縮ができれば処理能力の向上につながる一方で、
不適切な圧縮をしてしまえば処理自体が破綻する。
処理の破綻を可能な限り免れ続けるには、データの変化
に合わせて圧縮方法の適切性を常に検証し、必要に応じて
別の圧縮方法を試し続ける他ない。
この一連の試行錯誤はつまり「何をsignとするか」
についての試行錯誤である。
人間というのは、何かを見たり聞いたりする知覚の
レベルでの「自然な」signだけでなく、言語、宗教、
科学など、様々なかたちで結実している「不自然な
=人工の」signによる圧縮を、半ば投機的に試みる
ことで、他の存在に対する相対的な処理能力を向上
させてきたのだと思われる。
その様を伊藤計劃は「人間は無意味に耐えられない」
と表現した。
不用意に行われればバグのようなものになるであろう
投機的な圧縮に、「理由」を付けることで暫定的な
適切性の検証とし、その成功率を上げるというのが、
思考や意識と呼ばれるものの特徴なのだと思う。
統計学は、「これをsignにすることができる」という
意味でのsignificanceに理由を与える試みである点で、
まさに意識的な分野である。
そのまま把握するにはあまりに膨大なデータである
世界というものを「理解=理由付けて圧縮」するに
あたり、数式もグラフも駆使しながら、どのように
して圧縮や理由付けできるのか、あるいはすべきか
について試行錯誤するプロセスである統計思考。
その面白さの伝わってくる本であった。