統計学の変容過程

英語のstatisticsは、ドイツ語のStatistikの訳とされていて、Statistikは、Gottfried Achenwallという人の1749年の著書で初めて使われたとされている。Statistikは、当初、国家の状態を定性的に考察する分野だったようだ。

19世紀には、statisticsに数量的な性格が加わり、欧米諸国では、統計局が設置され、官庁統計を収集・作成するようになった。少なくとも、最重要なのは人口統計だったと思われる。国内の状況に関しては、古来、世界中で税収を確保することを主な目的として検地などが行われてたけど、改めて仕切り直した理由は分からない。日本の場合、1871年に"統計司"という部署が設置され、この時に、"統計"という訳語が使われている。現代の日本にも統計局はあって、総務省の管轄らしい。国勢調査以外は何をしてるのか知らない。

19世紀に、国家によって、統計データの収集が広く行われたことは間違いないけど、"統計学"が、大学で積極的に教えられてたのかは分からない。19世紀に、日本で訳された統計学の教科書は、それほど多くはない。

工業統計改良論/エルンスト・エンゲル述 http://webcatplus.nii.ac.jp/webcatplus/details/book/10375840.html
統計須知/ポルトル著;ニウマーチ校 http://webcatplus.nii.ac.jp/webcatplus/details/book/918969.html
統計入門/ガルニエ著 http://webcatplus.nii.ac.jp/webcatplus/details/book/846401.html
統計論/Maurice Block著 http://webcatplus.nii.ac.jp/webcatplus/details/book/701285.html
統計学論/Johann Eduard Wappäus著 http://webcatplus.nii.ac.jp/webcatplus/details/book/628610.html
統計学/Moreau de Jonnès著 http://webcatplus.nii.ac.jp/webcatplus/details/book/556063.html
統計論/Max Haushofer著 http://webcatplus.nii.ac.jp/webcatplus/details/book/10523892.html

1886年に、スタチスチック雑誌というのが作られたっぽい(後に、統計学雑誌と改題)
スタチスチック雑誌 (1)
http://webcatplus.nii.ac.jp/webcatplus/details/book/29412819.html

何にせよ、本来の統計学は、そういう分野で、社会科学の中で多少定量的性質を持つとは言え、数学とは縁遠い。一般に、数理統計学創始者とされるFrancis GaltonやKarl Pearsonは、別に、そういう伝統的な意味での統計学者ではない。彼らの動機が、進化や遺伝だったことは、よく知られてるし、国家の状態や社会科学には、殆ど関心を持っていない。そう考えると、現代の数理統計学統計学を名乗ってるのは不思議に思える。どういう経緯を辿って、そんなことになったのか、以前から、気になってたけど、ちゃんと説明されてるのを見ないので、調べることにした。



まず、数学の中で、"数理統計学"という分類が確立する以前は、数理統計学の基礎研究(の少なくとも一部)が、確率・組み合わせ論に分類されてたことは確認できる。

Jahrbuch über die Fortschritte der Mathematik
https://www.degruyter.com/serial/jbfmath-b/html

という、1868年〜1940年代初頭まで、ドイツで概ね毎年出されていたレビュー誌がある。当時、出版された数理科学関連論文(数学と物理が多いが、扱うテーマは幅広い)の簡単な要約を載せたもので、網羅性は高かったようだ。まだ、論文数がさほど多くなかった時代だから成立し得た雑誌だと思う。

組み合わせ論と確率論(Combinationslehre und Wahrscheinlichkeitsrechnung)のセクションは、1868年の創刊時点からあって、1900年頃、年間30〜50程度の論文が、ここに分類されている。Karl PearsonやFrancis Galtonは、1900年頃の常連。他に、1900年頃の有名人としては、ロシアのMarkovやスウェーデンのCarl Charlier(Charlier多項式やGram-Charlier展開に名前が残っている天文学者)などの名前も見つけられる。

この雑誌は1940年代まで続いたけど、オープンアクセスになってるのが、1905年くらいまでのものしかないようなので、後に、Mathematische Statistikとか、そんな感じの分類が追加されたのかは、確認できてない。


19世紀の時点で、確率論は、それほど大きな分野ではなかったが、いくつかの新しい応用先を見つけつつあった。誤差論と最小二乗法は応用というほどのものでもないけど、時折、関連する論文が書かれている。それ以外では、保険数理や砲術が、応用分野だろうと思う。19世紀日本では「確率」という訳語ではなく、「公算」と呼ばれていたようだけど、1891年の
公算学射撃学教程
https://dl.ndl.go.jp/info:ndljp/pid/844757
という本がオープンアクセスになってる。砲術への確率論の応用が、いつ、誰が始めたのか説明している文献は見当たらないので、詳細は分からない。

保険数理は、18世紀には既に存在していたけど、確率論を持ち込んだのが、誰なのかは調べてない。Laplaceの確率論の本(英題:A philosophical essay on probabilities)には、"生命,婚姻および任意の団体の平均持続期間について"という章が含まれてる(どういう内容かは読んでない)。1838年には、イギリスのDe Morganによる本"An essay on probabilities, and their application to life contingencies and insurance offices"が出版されている。このへんが、起源なのかもしれないけど、見出ししか確認してないので、嘘かもしれない

英語では、アクチュアリーという名前が、当時、既に使われていて(1848年にイギリスでInstitute of Actuariesが設立されている)、統計学とは区別されていたようだし、現在でも、統計学とは違う扱いをされるのが一般的と思う。



もう一つ、紛らわしいことではあるけど、"数理統計学"という名前は、19世紀のドイツ語圏に存在していたけど、それは、現在の数理統計学とは別物だったっぽい。ドイツでは、1869年に
Abhandlungen aus der mathematischen Statistik
https://books.google.co.jp/books/about/Abhandlungen_aus_der_mathematischen_Stat.html?id=PUZg8BjPbz8C
という本が出ている。この本は、前書き(Vorwort)を読むと、Bevölkerungsstatistik(vital statistics)に確率論や組み合わせ論を適用する旨が書かれている。また、保険数理(Theorie der Versicherungen)は、"mathematischen Statistik"には含めないとも書かれている。特に、影響を受けたらしき人として、Georg Friedrich Knappの名前が挙げられている。

著者はGustav Zeunerという人で、Wikipediaでは、工学者に分類されている。1848年にフライベルグ鉱山学校(※)に入学したとか、1875年にフライベルク鉱山学校の力学の教授となったとか書いてあるので、人口統計の分析は本業ではなく、また、数学者でもなかったらしい。フライベルグ鉱山学校の出身者には、アレクサンダー・フンボルトやエルンスト・エンゲルなどがいる。由緒正しい大学らしい。

Georg Friedrich Knappは、Wikipediaでは経済学者に分類されていて、1867年に、ライプチッヒ統計局のdirectorになったと書いてある。Knappは、伝統的な意味での統計学者だったと言っていいだろう。そして、Zeunerの本は、人口動態統計に、確率論を応用しようと試みたということらしい。


1906年や1910年に、ドイツで出版された"mathematische Statistik"の教科書も、目次を見る限り、内容的には、こうした話の延長なのかもしれない。1910年の本は、タイトルにLebensversicherung(life insurance)が含まれてるが、Statistikと区別されてる。表紙にはmathematische Statistikの文字も見える。
Vorlesungen über mathematische Statistik
https://archive.org/details/vorlesungenber00blasuoft

Wahrscheinlichkeitsrechnung und ihre Anwendung auf Fehlerausgleichung, Statistik und Lebensversicherung, 第2巻
https://books.google.com.sl/books?id=6iDOAAAAMAAJ


改めて、Jahrbuch über die Fortschritte der Mathematikを見ると、第1巻や第2巻の時点で、組み合わせ論と確率論のセクションに、Statistikをタイトルに含むものが見られる。検索しても、どういう人なのか不明なことが多いけど、これらは、vital statisticsを指していたのかもしれない。

21巻の組み合わせ論と確率論のセクションには、Arthur Newsholme(公衆衛生の専門家らしい)の1889年の著書
The Elements of Vital Statistics
https://books.google.co.jp/books/about/The_Elements_of_Vital_Statistics.html?id=oXsjAAAAMAAJ
の書評(?)らしきものが掲載されている。

19世紀後半〜20世紀初頭に、vital statisticsの分野に確率論を応用し、保険数理とは区別されてて、この分野を、特に、"数理統計学"と呼ぶ用法がドイツ語圏で存在していたらしい。これらは、伝統的な"統計学"に数学を適用した分野ということができるけど、現在の数理統計学が、これらの研究の延長上にあるというわけでは別にない。



19世紀後半には、(数理科学者ではない)一部の経済学者たちも、経済学に確率論を使おうと試みていたっぽい。元々の統計学と経済学は縁が深い。ドイツでは、1863年に、Jahrbücher für Nationalökonomie und Statistik(Journal of national economy and statistics)という雑誌ができてる。ある種の社会現象を数量的に把握しようとする"統計学"と、最初から価格という数量尺度が存在する"経済学"には、共通点があると思われたのかもしれない。

当時のイギリスでは、まだeconomicsという名前が使われておらず、該当分野を指すのに、political economyと呼ぶのが一般的だったらしい。多くの地域で、貨幣鋳造権が国家や権力者に管理された歴史を思えば、経済学が、法学や政治学の中の一つのテーマのように扱われることは不思議じゃないかもしれない。また、アリストテレスが「ニコマコス倫理学」で貨幣論を論じた伝統を継いでなのか分からないけど、19世紀後半になっても、道徳科学から経済学へ至った有名人が結構いる。

19世紀には、経済学部というものも殆ど存在してなかった。19世紀以前の人物が"経済学者"かどうかは、職業や学位によってではなく、現在"経済学"の著作と認められている本を書いたかどうかにで判定されてることが多いように思われる。本題とは関係ないし興味もないけど、当時の経済学は実証的な分野でなく、今と目的意識が同一だったのかも分からない。


そんな19世紀でも、経済学に、(確率論に限らない)数学的手法を持ち込もうという試みは、色々と存在してたらしい。通説では、Antoine Cournot(1801〜1877)あたりが嚆矢とされ、イギリスのWilliam Jevonsは、1862年に、General Mathematical Theory of Political Economyというタイトルの本を出版している(内容は知らない)。

Jevonsは1874年に、"The Principles of Science"という本を出版していて、この本自体は、経済学の本じゃないけど、その中には、確率論への言及も見られる。
The principles of science
https://archive.org/details/theprinciplesof00jevoiala

経済学への確率論の応用は、イギリスのFrancis Edgeworthあたりから本格的に始まるっぽい。Edgeworthは、1891年に創刊したthe Economic Journalの最初のeditorでもあり、1891〜1922年まで、Oxford大学の"Drummond Professor of Political Economy"(経済学のドラモンド教授職?ドラモンドは人名)を務めた。なので、一般的に、本分は経済学者と理解されている。Edgeworthは、数理統計学でも名前が残っていて、1880年代には、確率に関する論文を沢山書いている。

イギリスには、Journal of the Royal Statistical Societyという統計学会誌が存在し、1834年から現在まで続いている。当然、最初は、数理的な内容は殆どなかっただろう。

Mathematics in the London/Royal Statistical Society 1834-1934
https://www.jehps.net/juin2010/Aldrich.pdf

によると、1883年から、"regular mathematical contributions"が始まり、50年の間、minor partに留まったと書いている。1883年の論文とは、Edgeworthによる小論のこと。
On the Method of Ascertaining a Change in the Value of Gold
https://www.jstor.org/stable/2979314


また、Edgeworthは、1885年に同雑誌で
Methods of Statistics
https://www.jstor.org/stable/25163974
を寄稿している。内容的には、Edgeworthの独創というより、Galtonの以前の研究の紹介みたいな雰囲気を感じるけど、"統計学"を再定義しようとしているようにも読める。

Edgeworthは、Statistics(大文字)には、3つの定義があると述べ、第一の定義を、the arithmetical portion of Social Science、第二の定義を、"the science of Means (including physical observations)"、第三の定義を、(the sience?) of those Means which are presented by social phenomenaと述べている。そして、"平均の科学"に、主要な問題は2つあると述べ、一つは、平均値の差が偶発的なものか意味のある法則か決定すること、もう一つは、どの平均を使うのが最適か発見することと書いてる。

第一の問題は、平均値の差の検定に繋がる発想で、現在、"有意差"という言葉は頻出するので、差の検定は、統計学の代表的使用例という気はする。しかし、Edgeworthは、今日の仮説検定を完成させたわけでもないし、Laplaceは、18世紀に、男女の出生率が等しいと考えられるか、実データを基に確率的考察をしているから、新しい発想というわけでもないだろう。

正規分布に従う二群の平均値の差が偶発的か判定するには、分散を計算する必要がある(Edgeworthは、分散の2倍の平方根をmodulusと呼んでる)。Edgeworthは、実データから分散を決定するために、標本分散・不偏標本分散以外に、Airyの方法とGalton-Quetelet methodというものを紹介している。Galton-Quetlet methodは、1874〜5年頃、Galtonが、
On a Proposed Statistical Scale
https://doi.org/10.1038/009342d0

Statistics by intercomparison, with remarks on the law of frequency of error
https://galton.org/bib/JournalItem.aspx_action=view_id=44
などに書いてた方法で、正規分布では、第一四分位点と第三四分位点の距離が、modulusの2倍 x 0.476になることを利用する(erfinv(0.5)≒0.4769)。ベルギーのアドルフ・ケトレーも、原理的に同じ方法を使ってたと書いている。

Edgeworthは、イギリス人男性の身長分布を正規分布でfittingしてるけど、元データは、Francis Galtonらによる1883年の報告で
Francis Galton as Anthropologist
https://galton.org/anthropologist.htm
というページにPDFへのリンクがある。タイトルは"Final Report of the Anthropometric Committee"。

この報告には

The difference between the averatje and mean of a number of observations, and its importance in dealing with the subjects under considera­tion, has been pointed out and discussed by Mr. Roberts in the Report for 1881

という記述があり、このmeanという単語の使用は、ケトレーに従ったと書いてある。Mr. Robertsというのは、多分、Charles Robertsという人のことで、1870年代に、anthropometryという英単語を作った人と思われる。1878年に、Manual of Anthropometryという本を出版しており、

A manual of anthropometry
https://archive.org/details/manualofanthropo00robe

69ページで以下のように説明している。

An average is obtained by dividing the sum of the values observed by the number of observations, while a mean is the value at which the largest number of observations occur.

この時点でのmeanは、最頻値を指してるっぽい。一方、Edgeworthは、Meanという単語を、今日の"平均"の意味で使ってるように読める。この本には、数理統計学の色彩は皆無と言っていいと思うけど、statisticsという単語はよく出てくる。引用文献を見てると、millitary statisticsというフレーズも見られる。徴兵検査の際に行われる身長測定は、かなり古くからあるようで、それと関連してるのかもしれない。ヨーロッパでは、18世紀の記録も存在しているらしい(大体、ヨーロッパ諸国で常備軍が採用されるようになった初期からあったということだろう)。

Edgeworthの論説の中には、"統計学"から生まれた固有の数学概念と言えるものは、何もない。平均や分散の概念は、別に、"統計学"から出てきたものではない(averageという単語の起源は、アラビア語に遡れるらしい)。実データから、平均や分散を計算することも、"統計学"の専売特許ではない。


Francis Galtonは、親子の身長の関連を定量化しようとして、1880年代後半に相関の理論を作った。Galtonが、相関の理論を完成させるに当たって、伝統的な統計学が寄与したことは何もない。データは人類学で収集されたもので、親子の身長の相関という問題意識は遺伝への関心に起因するものだろうし、数学的には二次元正規分布の理論の応用である。

現代でも、相関を調べると、"統計学"という感じはあるし、分野によっては、データを集めて相関を見ただけという論文は量産されている。今は、相関のt-検定は一般的になってはいるけど、同時分布が(二変数)正規分布に従うかどうかの検定は、されてない(あるいは、書かれてないだけ?)場合が多いように思う。本来は、二次元正規分布という結構強い前提が存在してて、適用範囲は限られるはず。

相関の理論は、他の種類の統計データに適用できる手法ではあったけど、統計学の手法だったわけではない。1890年に、Galtonは、小論"Kinship and correlation"の最後の方で"相関"について、"There seems to be a wide field for the application of these methods to social problems."と書いて、社会科学の問題に、相関の概念を適用するよう示唆した。これを最初に実行したのが誰か知らないけど、1895年には、イギリスのGeorge Udny Yuleが、"On the Correlation of total Pauperism with Proportion of Out-Relief"というような論文を書いている。

Yuleは、Yule-Walker法やYule分布で、現在知られている。Wikipediaによると、ドイツのHertzの下で実験物理をやった後、1893年にイギリスに戻って、Karl Pearsonのdemonstrator(助手?)となったとある。

相関の計算は、比較的速やかに、複数分野で使用されるようになったっぽい。相関の理論が心理学で使われ始めた経緯は調べてないけど、以下のような文書がある

20世紀初頭における我が国での相関係数の普及について
https://waseda.repo.nii.ac.jp/?action=repository_uri&item_id=57867

ちゃんと調べてないけど、実験心理学の分野で確率的解析手法が使われるようになったのは、相関の理論が契機かは分からない。1897年の心理学の本
The New Psychology
https://archive.org/details/newpsychology025081mbp
の第二章のタイトルは、Statisticsになってる。

第二章の分量は少なく、相関の理論なども説明されてないけど、内容は確率論のもの。著者は、ドイツのヴィルヘルム・ヴントの所で心理学を学んだアメリカ人。本全体の内容は、生理学に近く、知覚などの問題が扱われている。20世紀の区分だと、知覚心理学とかに近いのかもしれない。もう少し細かく見ると、例えば、視覚情報処理を扱う場合、低次視覚機能が主になってるように思う。尤も、低次/高次の視覚機能という階層区分が当時認識されてたかは定かでない。心理学の門外漢からすると、心理学という単語からは、カウンセリング(臨床系の心理学)や意思決定の問題など、もっと高次の脳機能に関わるテーマを連想するけど、割と低レイヤの方から始まったらしい。

また、気象学では、Yule-Walker法のGilbert Walkerが、数学で学位を取得した気象学者で、統計的手法を持ち込んだ先駆者として知られている。


Yuleは、1897年に、Journal of the Royal Statistical Societyで、
Note on the Teaching of the Theory of Statistics at University College
https://www.jstor.org/stable/2979809
を寄稿している。

このノートで、Yuleは、英国で、"Theory of Statistics"の教育の必要性を訴え、Karl Pearsonが1891〜1894年に行った講義(lectures on the Geometry of Statistics, the Laws of Chance, and the Geometry of Chance)(Gresham lectureと通称される)に示唆されたと書いている。現在から考えると、1890年代は、現在の数理統計学で重要とされている概念の大部分が発見されてないのに気が早いと思うけど、確率論を使うという計画は示唆されている。

Yuleの仕事は多岐に渡っていて、1920年代に、ロジスティック方程式が、実際の人口動態に当てはまるか議論している(ロジスティック方程式自体は、1838年には発見されてたし、Yule以前にも先行研究はある)。ロジスティック方程式は決定論的な方程式で、数理統計学とは関係ないけど、人口統計は、本来の意味の統計データの代表なので、"統計学"の数学的研究と言えるかもしれない。

文章の統計的特徴から著者を特定しようという試み(Yule以前にも先行者はいたけど)も研究していて、1944年には、このテーマで"The Statistical Study of Literary Vocabulary"という本を出版した。

Yule-Walker法は、時系列解析の方法で、現在の(数理)統計学の教科書では、時系列解析の方法は書いてないこともある。分野によっては、時系列解析は全然使わないけど、"統計学"と題された現代の教科書の目次を何冊か見ると、社会科学系の人が書いた本では、時系列解析の説明を含んでることが多いっぽい。


1901年に、イギリスの経済学者Arthur Lyon Bowleyは、以下の本を出版した。
Elements of statistics
https://archive.org/details/elementsstatist03bowlgoog
この本は、伝統的な統計学の本のように見えるけど、後半のPart IIは、"APPLICATION OF THE THEORY OF PROBABILITY TO STATISTICS"というタイトルになっている。古典的な統計学と、現代の数理統計学を繋ぐ本と言えるかもしれない。Bowleyの本は、最後の10ページほどで、"相関の理論"を扱っている。

冒頭では、"Statistics"の定義を述べている。色々書いてあるけど、Bowleyの定義では、沢山の数量データを扱うのが"統計学"みたいなニュアンスっぽい。



1902〜1909年の間に、Yuleは、数理統計学の講義を行い、講義を元にした本が、1911年に出版された。

An Introduction Of The Theory Of Statistics
https://archive.org/details/in.ernet.dli.2015.260515

1902〜1909年の間に行った講義を元にしているというのは、初版のprefaceに書かれている。1922年には第6版が出ているので、かなり広く読まれたようである。Bowleyの本と比べると、"相関"の概念が前面に押し出されている。

Yuleの本には、"mathematical statistics"とは書かれてないけど、これは完全に"数理統計学"の教科書と言っていいと思う。統計的仮説検定はまだないけど、manifold classificationという章で、カイ二乗値の計算が説明されている。


Yuleの本には、英語のstatisticsという単語の由来や意味の変化が最初に述べられている。それによると、W. Hooperが1770年に出版した翻訳書(原著者はJakob Friedrich von Bielfeldという人と思われる)の中に、Statisticsと題された章があって、英語でstatisticsという単語が最初に使われたとしている。statisticsの主題は、“The science that teaches us what is the political arrangement of all the modern states of the known world"と説明されてる。

当初は定性的な分野だったが、19世紀に入ると、国家の状態を、数量的に把握するという側面が強調されるようになったらしい。彼らは殆ど漫然とデータを集めてたのに近いけど、平均を計算する以外に、何らかの指標を抽出しようという発想はあったと思われる。Yuleは書いてないけど、19世紀には、エンゲル係数で知られるエルンスト・エンゲルは、1850年ザクセン統計局初代局長、後にプロイセンの統計局長官を務めた。ケトレーは、BMIの考案者だそうである。これらの指標に、どこまで意味があるのか疑わしいけど、21世紀になっても、使われてはいる。


英語のstatisticsは、現在、「統計学」を指す場合と、「統計データ」そのものを指す場合がある。元々、"統計学"を指していたstatisticsだが、19世紀になると、一般の(大規模な)数量データを指して、statisticsと呼ぶ用法が出現した。そして、国家の問題に関わらない分野とデータについても、statisticsやstatisticalという単語が使われるようになった。

Yuleの本には書いてないけど、Francis Galtonは、1866年に、気象統計(meteorological statistics)という言葉を使い、1874年には、anthropological statisticsという単語も使ってる。物理で、"統計力学"という分野名を作ったのは、Gibbsだと思われる。Gibbsは、1884年に、"On the fundamental formula of statistical mechanics, with applications to astronomy and thermodynamics"という短い報告を書き、1902年に"Elementary Principles of Statistical Mechanics"という本を出版している。

Yuleの本には、"By statistics we mean quantitative data affected to a marked extent by a multiplicity of causes."と書かれている。そして、"(数理)統計学"を指す場合には、theory of statisticsを使用している。本のタイトルも、"統計学の理論"ではなく、"統計(データ)の理論"と訳されるべきなんだろう。Yuleは、本来の意味を超えて、statisticsやstatisticalが使われた事例を、いくつか挙げている。

Yuleが、theory of statisticsという名前を使ったのは、それが旧来のStatisticsの延長上にあったからではなくて、statisticsで数量データを指す慣習が広がっていたからということのように思える。そういう用法が広まってなかったら、この分野を指すのに、metricsとか、そんな感じの単語が使われてたかもしれない。



Yuleの本出版の翌年、1912年に、アメリカの経済学者Willford I. Kingは、以下の本を出版している。

The elements of statistical method
https://archive.org/details/elementsstatist04kinggoog?msclkid=20e1f7debb0f11ec992e696f7d298878

Chapter I Section10で、"Statistical method may properly be considered, a branch of mathematics"と書いてるし、目次を見ても、これは数理統計学の本と言っていいだろう。Kingの本も、第一章で、statisticsの歴史が書かれているが、Yuleの本と違って、statisticsという単語の意味の変化には注意を払ってない。

Chapter IのSection8で、"pure theory of statistics"の発展に貢献した人として、以下の名前を挙げている。
1)August Meitzen
2)Francis Edgeworth
3)Francis Galton
4)Edward Lee Thorndike: アメリカの心理学者
5)Karl Pearson
6)G. Udny Yule
7)Charles Benedict Davenport:アメリカの生物学者
8)Jacques Bertillon: 1883年からパリ市の統計局局長だったそうなので、ある意味で正当な統計学者と言える
9)Arthur L. Bowley: 1901年に"Elements of Statistics"を出版した経済学者
10)Reginald Hawthorn Hooker: 1901年に"移動平均"を発表した。Kingの本は、移動平均を紹介した最初の本だろうと思う。
11)Thos. S. Adams: 何者か分からないが、Kingの指導教官だったようである
12)Warren Persons: アメリカの経済学者らしいけど何をしたのか不明
(1)~(7)は、生物統計の人、(8)〜(12)は経済学の人としている。Edgeworthは、Biometrikaに投稿した論文も一本だけあるが、一般的に、経済学者として知られているので、生物統計の人に分類されてる理由は不明。August Meitzenという人も、ドイツの統計局に務めた伝統的統計学者らしいので、生物統計の人に分類されてる理由は謎。



1900年頃までに、国家の状態を数量的に把握するための"統計学"とは別に、大規模数量データの確率的解析手法が開発され、それぞれの分野が、一般の社会現象や経済の"統計データ"にまで適用範囲を広げた結果、接点も生じていた。

とはいえ、伝統的統計学者で数理的手法に関心を持つ人は少なかったっぽい。これについては、"統計学"以外の分野も、大体同じだったんじゃないかと思う。例えば、生物学者の多くは、別に統計的手法を使わなかった(そして、生物学の重要な結果は、そのような手法を経ずに得られたと思う)。人数が少ない内は、特殊なアプローチを採ってる一派がいるというだけで、スルーされてても不思議はない。

1910年頃になっても、英語圏では、まだmathematical statisticsという用語は一般的には使われておらず、theory of statisticsだのstatistical methodだのという呼称が使われてた(イギリスと違って、アメリカでは、statisticsを"統計学"と"統計データ"の両方の意味に使用するのに躊躇しない傾向があったかもしれない)。UCLでDepartment of Applied Statisticsが設立されたのが1911年。

Ronald Fisherの1925年出版の著書は、"Statistical Methods for Research Workers"というタイトル。尤も、Fisherは、Introductionで、

Statistics may be regarded as (i.) the study of populations, (ii.) as the study of variation, (iii.) as the study of methods of the reduction of data.

と書いてるから、Statisticsで数理統計学を指してもいいと思ってたらしい。更に、以下のようにも書いてる。

Statistical methods are essential to social studies, and it is principally by the aid of such methods that these studies may be raised to the rank of sciences. This particular dependence of social studies upon statistical methods has led to the painful misapprehension that statistics is to be regarded as a branch of economics, whereas in truth methods adequate to the treatment of economic data, in so far as these exist, have only been developed in the study of biology and the other sciences.

アメリカの経済学者Willford Kingが、"pure theory of statistics"の開発に貢献した人として、経済学者も列挙してたのに対して、Fisherは、statistical methodsの開発に経済学者が貢献したことはないという立場らしい。


Journal of the Royal Statistical Societyでは、1930年あたりから、一年に一回、"Recent Advances in Mathematical Statistics"という紹介記事が掲載されるようになっている。

Recent Advances in Mathematical Statistics (1930)
https://doi.org/10.2307/2341934

1934年に、雑誌に、Supplement to the Journal of the Royal Statistical Societyという名称で、産業や農学研究のためのセクションが追加され、戦後になって、supplementは、Series B (Statistical Methodology)となったそうだ。


アメリカでは、1918年に"Introduction to mathematical statistics"という本が出版されて、1930年にAnnals of Mathematical Statisticsという雑誌が作られてる。
The Annals of Mathematical Statistics VOL. 1 · NO. 1 | February, 1930
https://projecteuclid.org/journals/annals-of-mathematical-statistics/volume-1/issue-1
最初のarticleで、以下のように述べられてる

For some time past, however, it has been evident that the membership of our organization is tending to become divided into two groups — those familiar with advanced mathematics, and those who have not devoted themselves to this field. The mathematicians are, of course, interested in articles of a type which are not intelligible to the non-mathematical readers of our Journal.

こうしたことを見ると、英語圏で、mathematical statisticsという呼称が一般化したのは、この時期のようである。


1930年のアメリカでは、Econometric Society/計量経済学会も作られている。econometricsという単語は、これ以後一般化したと思われ、それ以前の使用例は、Arthur Robert Crathorneという数学者が、1926年の記事で、econometryという名前を提案している以外に、発見できなかった。計量経済学会の設立時の会員を見ると、経済学者以外に、Walter Shewhart(統計的品質管理の考案者として知られる技術者)や、数学者Karl Menger(経済学者Carl Mengerとは親子)、Norbert Wienerが含まれている。初期メンバーは、全員アメリカ人(移民もいるが)で、イギリス人経済学者とかは、いないっぽい。


英語圏の事情は、調べる(原文を読む)のに、膨大なやる気が必要なのでpass。以下の論文は、飛ばし読みしただけど、1920年代のフランスの事情が書いてある。Borelが頑張ったらしい
The emergence of French statistics. How mathematics entered the world of statistics in France during the 1920s
https://arxiv.org/abs/0906.4205v2


ドイツ、イタリア、オランダ、ロシアあたりの事情は分からないけど、以下の論文には、1910年前後のスウェーデンの事情が、どうだったか書いてある。スウェーデンは、現在も、数理統計学統計学の区別があるみたいに書いてある。
Why Distinguish Between Statistics and Mathematical Statistics–The Case of Swedish Academia
https://doi.org/10.1111/insr.12275
[PDF] https://sites.stat.washington.edu/peter/history/mathstat.pdf
引用文献の多くが、スウェーデン語なので、細かいところまでは確認できない。ついでに、Charlierは1910年に、Grunddragen af den matematiska statistikenという本を出版しているらしい。


インドでは、1931年に、マハラビノスの主導によって、Indian Statistical Instituteが設立されてる。インドでは、1870年代に、最初の国勢調査が行われたようなので、伝統的な統計学者も存在してたんじゃないかと思うけど、詳しいことは分からない。


日本も、1940年代には、イギリスやアメリカの流れに追随することになった。1941年に、統計数理研究という雑誌が作られている。
統計数理研
https://catalog.lib.kyushu-u.ac.jp/opac_search/?reqCode=fromsrch&lang=0&amode=2&smode=1&disp_exp=20&kywd1_exp=bms&con1_exp=c_string_pubname

初っ端が、"量子統計力学の基礎"で、寄稿者の多くが、数学者や物理学者だったためか、初期には、通常の統計学よりも広いテーマが扱われてる。

統計学の未来
https://www.amazon.co.jp/dp/B096XT44HK/
という1976年出版の本を読むと、1944年に、数学者が中心になって、統計数理研究所が作られ、設立メンバーは6人と書いてある(60ページ)。当時の日本には、社会科学としての統計学をやってる人が中心の統計学会があって、そういうのとは独立して、統計数理研究所ができたので揉めたみたいなことも書いてある(38ページ)。

社会統計学のエライ人は、高野岩三郎という名前が挙がっている。1903年に留学から戻った後、20世紀初頭に、東京帝国大学などで統計学の講義を行い、また、戦後の1948年に日本統計学会初代会長にもなったらしい。Wikipediaで日本統計学会の歴代会長を眺めると、初期は、大体、経済学者っぽい

高野岩三郎による、大正12年度(1923年?)の講義録が、以下で見れる。数学的な内容は含んでないと思う。
統計学 [高野岩三郎 述]
https://dl.ndl.go.jp/info:ndljp/pid/927574




統計数理研究所が設立されたのは、戦時中なので、軍事に貢献することが当然要求された。「統計学の未来」には、生産管理や品質管理をやってたみたいなことが書かれてるけど、詳しいことは分からない。雑誌「統計数理研究」の中には、以下の論説がある。

米國數理統計學會の戰爭準備委員會の報告 : The Annals of Mathematical Statistics Vol.XI(1940) No.4
https://catalog.lib.kyushu-u.ac.jp/opac_detail_md/?lang=0&amode=MD100000&bibid=12901

1940年に書かれたもので、数理統計学者が、どういう問題で国防に寄与できるかというテーマが、9つ挙げられている。
(1)品質管理及び規格
(2)試料抽出による調査
(3)諸種の実験: Fisherの実験計画法への言及が見られる
(4)人的資源の選択: 人材の能力測定、特に、心理検査の解析に言及している
(5)用品及び食糧: 衣服や食糧資源の効率的分配への利用が言及されている(具体的方法は不明)
(6)運輸及び通信: 輻輳問題の解決に統計学が利用できるだろうとしている
(7)砲撃及び爆撃
(8)気象学
(9)医薬: 薬品、毒物の毒性の実験と解析に触れている。(3)と重複してる気もする

国防の観点から論じられてるので、実用性重視ではあるのだろうけど、当時の統計学への認識が分かる。最も詳しいのが、(1)なので、統計的品質管理は、一番重要と思われてたんだろう。統計的品質管理は、1924年に、ベル研究所のWalter A. Shewhart(1930年に設立された計量経済学会の初期メンバーでもあった)が始めたと一般的に説明される。Egon Pearsonも、1935年に、統計的品質管理の本を出版している。



二次大戦前後の時期に、日本で出版された"統計学"の教科書を探すと、沢山ある。以下は網羅的であることを意図したものではなく、Webcat plusで目次を見ることができるものをピックアップした。数が多いので、それでも抜けがあるかもしれない。

[1927年]統計学/竹下清松著 http://webcatplus.nii.ac.jp/webcatplus/details/book/887629.html
[1929年]統計学/汐見三郎著 http://webcatplus.nii.ac.jp/webcatplus/details/book/903401.html
[1930年]統計学/横山雅男著 http://webcatplus.nii.ac.jp/webcatplus/details/book/755736.html
[1932年]数理統計学概要/成実清松著 http://webcatplus.nii.ac.jp/webcatplus/details/book/893524.html
[1937年]数理統計学/松村宗治著 http://webcatplus.nii.ac.jp/webcatplus/details/book/604460.html
[1939年]統計学の理論と方法/寺尾琢磨著 http://webcatplus.nii.ac.jp/webcatplus/details/book/904341.html
[1942年]統計学/大内兵衛http://webcatplus.nii.ac.jp/webcatplus/details/book/546460.html
[1943年]統計学の理論と実際/塚原仁訳 http://webcatplus.nii.ac.jp/webcatplus/details/book/586631.html
[1944年]統計学/藤本幸太郎著 http://webcatplus.nii.ac.jp/webcatplus/details/book/682811.html
[1948年]統計学入門/寺尾琢磨著 http://webcatplus.nii.ac.jp/webcatplus/details/book/757690.html
[1949年]数理統計学/佐藤良一郎著 http://webcatplus.nii.ac.jp/webcatplus/details/book/239635.html
[1949年]統計学/宗藤圭三著 http://webcatplus.nii.ac.jp/webcatplus/details/book/621717.html
[1952年]数理統計学要説/成実清松,坂井忠次共著 http://webcatplus.nii.ac.jp/webcatplus/details/book/249004.html
[1952年]社会統計学と抽出理論/馬場吉行著 http://webcatplus.nii.ac.jp/webcatplus/details/book/213879.html
[1952年]統計学/内藤勝著 http://webcatplus.nii.ac.jp/webcatplus/details/book/1200300.html
[1952年]統計学概論/宗藤圭三著 http://webcatplus.nii.ac.jp/webcatplus/details/book/431813.html
[1954年]統計学/中川友長著 http://webcatplus.nii.ac.jp/webcatplus/details/book/293521.html
[1954年]統計学の理論と応用/淡中忠郎著 http://webcatplus.nii.ac.jp/webcatplus/details/book/258471.html
[1957年]統計学/水谷一雄,後尾哲也共著 http://webcatplus.nii.ac.jp/webcatplus/details/book/255892.html
[1960年]数理統計学/S.S.ウィルクス著 http://webcatplus.nii.ac.jp/webcatplus/details/book/270798.html

目次を見ると、戦前には、(数学的なものと、そうでないものの)二種類の"統計学"が、共存してた様子が見える。"数理統計学"という単語がタイトルに使われたのは、検索する限り、1932年の本が最初だと思われる。著者は、Egon Pearsonの下で統計学を学んだ人だそうだ。

1937年の数理統計学には、"仮説検定"の内容はなさそうだけど、1949年の数理統計学では、検定に、かなりのページが割かれるようになっている。戦後になると、数学者の書いた数理統計学の本だけでなく、経済学者や社会科学者の書いた統計学の本でも、数学的内容(相関や時系列分析)を含むようになり、非数学的な統計学は、(大学以降の教科書、専門書レベルでは)ほぼ消滅したように見える。

戦後も、経済学者たちの"統計学"と、数学者たちの数理統計学が存在してたように見える。1950年代時点では、数学者の書いた数理統計学の教科書は、"数理統計学"と題して区別される場合が一般的だけど、1954年の淡中忠郎のような例もある。前者の統計学は、今は、社会統計学と呼ばれることもある。



社会統計学と数理統計学(『統計通報』誌(1975-78年)での討論) : 学説史上の位置づけ
http://doi.org/10.14992/00010614
という文書が2014年に公開されてる。1950年代前半のドイツやソ連で、本来の"統計学"と数理統計学の関係を問う議論があって、数理統計学は、本来の統計学と全く別の分野と主張する人もいたらしい

面倒なので、原文を探してチェックすることまではしてないけど、例えば、ドイツでは、

マイヤーは, 数理的方法は応用数学の分野の構成部分である, 社会的諸現象と諸過程を数理的手法で分析できないのは自明である, 統計学は社会科学であり, 数理的科学ではない, 統計学は独立の国家学である

ソ連だと、以下のような人がいる。

スタラドウブスキーは 「統計学」 のタームが, 社会統計学にも, 数理統計学にも使われていることを問題視する。 この問題意識の背景にあるのは, 統計学がもともと社会経済現象の数量的把握を目的とした科学なので, その用語を使うことは妥当だが, 数学の一分野である科学にこの統計学という用語を使うことが適当でないという考え方である。

スタラドウブスキーはいわゆる数理統計学は 「蓋然性論にもとづく数理的な確率論」 と呼ぶべきであり,そこで社会科学的資料が使用されても,そのことでもってこの科学を統計学分野に所属せじめる根拠にはならない,と強調する。

これらの主張は正当なもので、応用確率論とかいう名前にしてれば、軋轢も生じなかった(し、"統計学史"も書きやすかっただろう)と思うけど、色々な事情が重なって、数理統計学という名前が広まってしまった。これらの主張とは真逆の極端な立場として、数理統計学を、自然現象と社会現象に適用できる普遍的方法と見なす人もいたと書いてある。

現在の実態として、いくつかの日本の教科書を見た限り、社会統計学は数理統計学の手法を大幅に取り込んで成立しているように見える。数理統計学の成果を早期に取り入れようとした経済学者たちの試みから発展したものなんだろう。社会現象に数理統計学を適用できない派は、日本にはいなかったか、滅んだらしい。

数理統計学自体は、(比較的簡単な)数学的事実の集まりなので、そこは信用できるとしても、暗黙の内に数学的な理想化が入ってるし、明示的な前提条件もある。社会現象のように人間集団を対象とする場合、実データが、これらの条件を本当に満たしてる(と考えて差し支えない)かは明らかでない。数理統計学は、現象の数学的モデルの一つに過ぎず、現実に適合してるかは、数学だけ見てても答えはない。それを確かめる方法は論理とか哲学ではなく、実験的な検証に依るしかない。けど、コイン投げや機械部品の寸法とかならともかく、人間の集団で検証するのは多分難しい。大抵の場合、何を見ればいいのかすら確かではない。結局、そのへんは曖昧なまま、形式的に、数理統計学を適用する方向に進んだっぽい。

数学を使う"統計学"が台頭しつつあったけど、数学を使わない"統計学"が、そのせいで滅んだのかは分からない。何にせよ、国家の状態を数量的に把握するための"統計学"が殆ど消滅した後に、数理統計学と社会統計学を眺めた人からすれば、その共通部分は、ほぼ数理統計学そのものになってたので、"統計学"は数理統計学と同義と考えるようになっても仕方ない。



ついでに、「統計学は科学の文法である」、英語だと"Statistics is the Grammar of Science"という文章の起源を探した。なんでか知らないけど、このフレーズは、2010年頃から見られるようになった。

基本的事実として、Karl Pearsonは、1892年に、"The Grammar of Science"という本を出版して、第二版が1900年に、第三版は1911年に出た。
The grammar of science (2nd edition)
https://archive.org/details/grammarofscience00pearuoft

The grammar of science (3rd edition)
https://archive.org/details/p1grammarofscien00pearuoft
検索する限り、どの版でも、この文言は含まれていない。OCRのミスという可能性は、あるかもしれないけど、この本が出版された時期は、まだ旧式の統計学もあった時代で、数理統計学を、単にStatisticsと呼ぶと、紛らわしかったのでないかと思う。


Google scholarGoogle booksで検索したところ、英語では、以下の本の第4章冒頭、81ページにあるのが見つかった。2008年出版の本らしい。英語圏で、これより古いのは、今の所発見してない。
Statistics for Nursing and Allied Health
https://books.google.co.jp/books?hl=ja&id=yc-WIr2dZBwC&oi=fnd&pg=PA81

日本語だと、1991年初版の

統計学入門 (基礎統計学Ⅰ)
https://www.amazon.co.jp/gp/product/4130420658
の第一章冒頭に、

「自然は数学という言語で書かれた書物である」これはガリレイのよく知られた言葉である。近代統計学理論の基礎の建設者カール・ピアソン(1857-1936)が、統計学は「科学の文法」The Grammar of Scienceであるという有名な言い方を残しているのも、だいたいにおいて同じ意味である。

と書いてある。Amazonの試し読みで見たので、初版からあるのか不明。この本は" 東京大学教養学部統計学教室 編"とあり、日本では、影響力が大きかったと思われる。


(適当に検索して出てきた)Statistics Quotesと題されたページ
http://www.math.wpi.edu/Course_Materials/SAS/quotes.html
の冒頭に、この文言は書かれているが、Wayback machineに保存されていた2009年1月には、まだ記載がない。
https://web.archive.org/web/20090131070147/http://www.math.wpi.edu/Course_Materials/SAS/quotes.html

いつ追加されたか正確には分からないけど、2013年6月には存在せず、2014年10月には存在している。一例ではあるけど、2010年頃には、まだ、このフレーズは普及してなかったのだろうと思う。