生化学実験データの統計処理は、生物学的解釈を行う手順ではない

 これを読まれる皆さんは、数値データを「統計処理」することがありますか?

 生化学実験では、様々なデータが出てきます。処理の難しいほどの膨大なデータや、解釈に困る予想外のデータが出ることもあるでしょう。このデータがどのようなものであっても、それにどのような意味が数値的にあるのか、ないのか。それを検定する方法が、「統計処理」です。

 さて、生物学実験、生化学実験をされている方は、どのくらい「統計」についての指導を受けたことがありますでしょうか?

 私たちの薬学部で、実験をする研究室に配属された人は、ほとんどの場合、得られたデータを統計処理する場面に遭遇することになります。しかし、学部時代に受けた統計学についての講義は、決して十分だったとはいえません。

 いや、むしろ教えることができる人も少ないのでしょう。(※ 理解している人はいるはずだと思いますが、理解していることと教えられることは違います。)

 そんな薬学部の大学院での研究をする中で、しばしば後輩と統計について話をしていて、とても懸念されることがあります。それは、統計処理を「生物学的な解釈をする手順」であると勘違いされることが多いということです。

+++

 先にも書きましたが、統計処理は、生化学的な実験から得られた数値データに、数値的な意味付けを行うためだけのものです。その手法は、応用数学の手法を用いて見出された数値上の性質や規則性あるいは不規則性に基づいています。

 そのため、統計解析は、生物学的にどれだけ適切であるように見えようとも(←この基準はとても曖昧なものですが・・・)数学的に不適切であれば、例外なく不適切なのです。
 そこを誤解してしまっている人は、私が思っていた以上に多いように思っています。そして、それを正すことはとても困難なことです。

+++

 生化学実験のデータを正しく処理するには、統計学の知識が必要です。つまり、ある程度以上の数学の力が必要になります。しかし、生化学を専門にする多くの研究者が、統計学を理解できるだけの数学の力を持っているかというと、必ずしもそうは言えない例が多いのではないでしょうか。
 その証拠に、論文になっていても統計解析が適切でないことも、少なからずあります。書く側も、可否を判断する側も、(どちらもその分野の “専門家” であるにも関わらず)統計解析法を理解していない例がある証拠です。そのため、論文を参考にして方法を選ぶ場合でも、論文の内容を“参考にする”程度にして、適否を検証することが必ず必要になります。
 数学者ヒルベルトの有名な言葉に、「物理学は物理学者には難しすぎる」というものがありますが、統計学も生物学実験に必須であるとするならば、生物学は生物学者は難しすぎるのかもしれません。(自戒も込めて。)

 この辺りの問題を克服するためには、学際的な知識の修得が求められると思います。しかし、多くの大学院生は、「自分の専門は統計学ではない。今さら統計解析をゼロから勉強つもりはない」という人も多いでしょう。

 皆さんはどのようにして、統計解析を乗り越えていますか?

生物医学研究文献の誰でも見つけられる20の統計学的誤り(Ronbun.jp)

 

f:id:umerunner:20191001233018j:plain