私の考える計量生物学の研究に必要な視点
統計学は帰納的な学問であると言われています.例えば,R.A.フィッシャーは彼の有意性検定を指して「帰納的推測(inductive inference)1)」と呼んでいます.J.ネイマンは彼らの仮説検定の手順を「帰納的行動(inductive behavior)2)」と呼んでいます.また,C.R.ラオは,統計学の発展によって帰納的推論における不確かさが数量化され,帰納的推論がより正確になり,我々の思考に大きな躍進がもたらされたと主張しています3).ここでは,これらの言葉の意味するところについて簡単にまとめ,その上で計量生物学の研究にはどのような視点が必要か,私なりに考えてみたことを述べたいと思います.
一般に,科学的な推論の形式には演繹法と帰納法の二種類が存在します.演繹法は,ある事実や仮定に基づいて,論理的推論により結論を導く方法です.例えば,「全ての中学生は15歳以上で卒業していく」という事実を前提とすれば,「ある特定の,既に中学校を卒業した人」は「15歳以上である」という結論を導くことができます.公理から定理を証明していく数学的思考法はこれに相当します.一方,帰納法は,演繹法とは反対に,観察された個々の事象から,一般的な法則や原理を導こうとする方法です.例えば,「ある町において観察されたカラスは黒かった」という観察結果から,「全てのカラスは黒い」と結論付けます.与えられた前提のみから出発する演繹的推論と違い,与えられた観察結果を一般化する帰納的推論には,明らかに不確実性が伴います.しかしながら,演繹的推論によっては,前提の枠を超えるような新しい知識は創造することができません.そのため,経験科学では帰納的な考え方が用いられてきました.ラオは,統計学によって帰納的推論の中に演繹的論理の過程を導入し,不確実性を定量化することにより,帰納的推論の体系が科学的になったと述べています3).
統計学の枠組みでは,「個から一般へ」帰納的に推論していくことは,標本から,モデルで表現される仮想的無限母集団へ推論していくことに当たると,フィッシャーは考えていたようです(同様な記述はムードらの教科書にも見られます4).1935年のJRSSの論文において,フィッシャーは以下のように述べています5).…everyone who does habitually attempt the difficult task of making sense of figure is, in fact, essaying a logical process of the kind we call inductive, in that he is attempting to draw inferences from the particular to the general. Such inferences we recognize to be uncertain inferences… さらに,次の段落では以下のように続けています. The inferences of the classical theory of probability are all deductive in character. They are statements about the behavior of individuals, or samples, or sequences of samples, drawn from populations which are fully known… More generally, however, a mathematical quantity of a different kind, which I have termed mathematical likelihood, appears take its place [i.e., the place of probability] as a measure of rational belief when we are reasoning from sample to the population. 以上のフィッシャーの「帰納的推測」の考え方に対して,ネイマンは異なる考え方を持っていました.ネイマンは,統計学の推論体系は確率論に基づく数学的・演繹的なものであり,統計学は我々のとるべき行動を規則化するものであると主張しています6).1933年のE.S.ピアソンとの共著論文では,彼らの二者択一の仮説検定方式の理論に続いて次のような記述があります7).Without hoping to know whether each separate hypothesis is true or false, we may search for rules to govern our behavior with regard to them, in following which we insure that, in the long run of experience we shall not be too often wrong… test constitutes such a ‘rule of behavior’ namely by telling us when to reject hypothesis and when to accept it. ネイマンは,演繹的に導かれた規則に観察されたデータを適用した結果,決定される,起こすべき行動(仮説検定の文脈で言えば帰無仮説と対立仮説のうちどちらを選択するか)の事を指して,「帰納的行動」と呼んでいます.
帰納という言葉に対するフィッシャーとネイマンの考え方の違いは非常に興味深いものであり,ネイマンの行動に関する視点は,統計解析を検証的な目的で実施する立場からは納得のいくものであると思います.しかしながら(それはさておき),以下では計量生物学の方法論の研究という視点から,フィッシャーとネイマンの主張に対して私が重要だと考えた事を述べてみたいと思います.まず,データに基づいて母集団に関する(不確実性を含めた)知識を得る,あるいはしかるべき行動を決める,という両者の主張は,「現実の場で解決が望まれている問題」が研究対象である事が前提になっていると思われます.私の立場で言えば,医学・健康科学における未解決の重要な諸問題を研究対象とするべき,ということになります.また,当然のことながら研究の結果導き出された結論は,現実の場に適用され,その有用性が検討される必要があります.一方,ネイマンの統計学の推論体系が演繹的であるという主張は,統計学を学問として考える上で重要な一側面を捉えていると思います.すなわち,現実のデータに対して適切な定式化を行った後には,統計学的な結論は数学的・演繹的なプロセスでもたらされるという事です.そして,その過程で得た新たな方法論を他の同様な問題に対しても適用可能なように一般化することが部分的にでもできれば,なお望ましい成果という事になると思います.以上のような成果を出すためには,医学・健康科学の基本的な知識が必要です.また,現実の場ではどのような情報を還元することが要請されているかを適切に把握することが重要でしょう.そして,新たな問題を定式化し結論を導くための,数理統計学に対する幅広い知識や技能,深い洞察力も必要不可欠です.現在の私は全てにおいて力不足であることを痛感する毎日ですが,少しずつでも目指す研究者像に近付けるように精進していきたいと思っています.
参考文献
1) Fisher RA. Statistical Methods and Scientific Inference. New York: Hanfer, 1956.
2) Nayman J. ‘Inductive behavior’ as a basic concept of philosophy of science. Rev Int Stat Inst 1957; 25: 7?22.
3) C.R.ラオ著,藤越康祝,柳井晴夫,田栗正章 共訳.統計学とは何か.ちくま学芸文庫.2010.
4) Mood AM, Graybill FA, Boes DC. Introduction to the Theory of Statistics. 3rd edition. Singapore: McGraw-Hill, 1974.
5) Fisher RA. The logic of inductive inference. J R Stat Soc Ser B 1935; 98: 39?54.
6) Nayman J. Frequentist probability and frequentist statistics. Synthese 1977; 36: 97?131.
7) Nayman J, Pearson ES. On the problem of the most efficient tests of statistical hypotheses. Philos Trans R Soc Lond Ser A 1933; 231: 289?337.