誕生日が重なる確率

穂滝薫理



1.誕生日が重なる確率は70分の1?

 小学生だったか中学生だったか、私がまだ子供のころ、「人が70人集まれば、その中に1組は同じ誕生日の人がいる」と聞いたことがある。そのときは「へぇ」くらいにしか思わなかったが、いや子供だからこれを鵜呑みにして「なんたる神秘」くらいは思ったかもしれず、「これでまた、ひとつ賢くなった」とさえ思ったかもしれない。それはともかく、大人になった今は「本当かよ?」と思っている。だって、1年は365日あるのだから、366人集まれば必ず誰か誕生日が重なる人が出るのは納得がいく。それが、たった70人集まっただけで、誕生日の重複があるとは到底信じられないじゃないか。
 というワケで、今回はこの件を検証してみたい。

 ゴールを明確にしておかなければならない。今、求めようとしているのは、“ある集団の中から2人を取り出したとき、その2人の誕生日が同じになる確率”ではない。“ある集団の中からn人を取り出したとき、その中に誕生日が同じになる人が最低1組は含まれる場合のn”が知りたいのである。前者であれば、比較的簡単に求められる(ように思える)。その場合、まず1人目の誕生日は、365日のうちどの日でもありうるから、この日を仮にX月Y日とする。2人が同じ誕生日になるためには、2人目も同じX月Y日でなければならない。考えてみれば、これは1人目はどうでもよくて、単に2人目の誕生日がX月Y日になるかどうかを考慮すればよいということだ。だから、この問題は結局、2人目(ある人、と言っても同じことだが)の誕生日が任意の日付(この場合はX月Y日)である確率を求めるのに等しい。ある人の誕生日がX月Y日である確率は当然365分の1である。よって先述の前者の確率は365分の1だ。ちなみにこれを計算すると、0.002739726…となり、パーセントで表わすと、約0.274%となる。まぁ、めったにない確率と言えよう。


2.簡単な場合で考えてみる

 さて、問題を簡単にするために、1年は10日しかなく、この世に人間は20人しかいないとしてみよう。この20人の誕生日は1日から10日のうちのどれかになるが、どの日になる確率も等しいとする。つまり、どの誕生日にも均等に2人ずつ含まれるとみなすワケである。まぁ実際にはそういうことは少ないと思われるが、確率的にはそのようになる。たとえて言うなら、サイコロを6回ふれば、“確率的には”どの目も1回ずつ出るのと同じことである。すると、この20人に1から20までの番号をふれば、誕生日は図1のようになる。当然ながら、順番は関係なくて、1番の人が4日生まれであってもいい。ただ、便宜的に並べてみているだけのことである。

日にち 1日 2日 3日 4日 5日 6日 7日 8日 9日 10日
その日が
誕生日の人 1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
図1:1年が10日しかない場合の20人の誕生日の分布

 さて、この20人の中から5人を取り出したと仮定したとき、最低1組は同じ誕生日の人が出る確率を求めてみよう。だが実際には、この場合は“1組も誕生日が重ならない確率”のほうが求めやすいので、そちらを求めて、あとで1から引くという方法を取ることにする。
 まず1人目は、20人のうち誰でも取りうるから、20分の20の確率だ。彼または彼女の誕生日が、仮に1日だったとする。2人目は、残り19人の中から選ぶことになるが、今求めようとしているのは、“1組も誕生日が重ならない確率”だから、誕生日が1人目と同じ1日の人は選ぶことができず、取りうる人は18人しかいない。どの誕生日も2人いるということを思い出してほしい。だから誕生日が重ならないよう2人目を選ぶ確率は19分の18となる(図2)。同様にして3人目を選ぶ確率は18分の16、4人目は17分の14、5人目は16分の12となる。つまり、5人選んだ段階で誰も誕生日が重なっていない確率は、




=約0.52
となる。したがって、少なくとも1組の誕生日が同じになる確率は、1から0.52を引き、
1−0.52=0.48
である。約48%の確率で誕生日が同じ組ができるとは結構多い気がするが、まぁ、1年が10日、総人数が20人、選ぶのが5人という特殊な場合なのでなんとも言えない。

日にち 1日 2日 3日 4日 5日 6日 7日 8日 9日 10日
その日が
誕生日の人 1
2 3 4 5 6 7 8 9 10
11
12 13 14 15 16 17 18 19 20
図2:1組も誕生日が重ならないように5人選ぶ場合。
1人目に1日生まれを選ぶと2人目に1日生まれは選べない。


3.式を一般化する

 次に一般化を行なう。つまり、1年がp日、総人数がm人、選ぶのがn人のときに、少なくとも1組の誕生日が重なる(または1組も重ならない)確率を求めるワケである。
 上記の式を見ればわかるように、分母は、
m、m-1、m-2、…、m-(n-1)
と1ずつ減っていく。このとき、分子は上の式では2ずつ減っていっているが、これは、同じ誕生日の人が2人ずついるからである。なぜ2人ずついるかというと、1年が10日しかないのに、総人数が20人いるからだ。すなわち、20を10で割って
20÷10=2
というワケである。記号で表わすと
m÷p
となり、最初の項はm、次がm-(m÷p)、次がm-(m÷p)×2という感じで減っている。まとめると分子は、
m、m-(m÷p)×1、m-(m÷p)×2、…、m-(m÷p)×(n-1)
と変化していることがわかる。そして、分数の個数は選んだ人数と同じn個あり、このn個の分数をかけたものが、1組も重ならない確率である。よって、少なくとも1組が重なる確率は1からこれを引いて、



となる。
 ここまでくればあとは簡単。p=365、総人数は日本の場合としてm=120,000,000を代入し、nに1から365までを順に入れてパソコンで計算すればよい。うるう年は考えず、1年は365日とみなす。
 で、計算したところ、驚くべき結果が出た。図3を見てほしい。














図3:誕生日が重なる確率はn=65あたりでほぼ100%になる

これはn=1〜100までの計算結果をグラフにしたものである。よこ軸は選んだ人数(n)で、たて軸はそのときに少なくとも1組は誕生日が重なる確率をパーセントで表わす。確率は、n=40くらいまで急激に増え、およそn=65くらいのところで、ほとんど100%になってしまっている。もう少し正確な値を言えば、n=65のときの“少なくとも1組の誕生日が重なる確率”は約99.77%である。最初に出てきた70人すなわちn=70のときでは、実に約99.92%となる。確かに100%ではないが、ここまでくれば「人が70人集まれば、その中に1組は同じ誕生日の人がいる」と言ってしまって差し支えないであろう(n=366になるまで決して100%にはならない)。ついでに言えば、この確率が90%を超えるのはn=41のときである。つまり、40人いればその中に1組以上同じ誕生日の人がいる確率は約90%ということだ。クラスに1組くらい同じ誕生日の人がいてもなんら不思議はないのである。
 いや、驚いた。まさに、なんたる神秘。これでまた、ひとつ賢くなった。


4.以下余談

 結論は出たので以下は余談である。
 図3のグラフは、mに日本の人口1億2000万人を入れて計算したものである。これに世界人口65億人を入れるとどうなるか。実は結果は変わらず、n=70のときの確率は約99.92%だ(実際には小数点以下6ケタ目で少し増える)。逆に総人数を減らして10万人とするとn=70のときの確率は99.91%、総人数を1000人まで減らしてもn=70のときの確率は約99%である。つまり、この確率はmの値にはあまり左右されないということがわかる。本当はm=∞としたいところだが、まぁ1億人くらいにしておけば実用上問題なさそうということだ。
 さて、例の式において、p=365、m=120,000,000、n=2のときの誕生日が重なる確率を求めると、0.002739718…である。n=2ということはつまり本論文の最初のほうに出てきた“ある集団から2人を取り出したときに誕生日が重なる確率”を求めていることになる。論文では、この確率は365分の1、すなわち、0.002739726…であると述べているが、実際には微妙にずれている。正確に言えば小数点以下8ケタ目から違う数値になっている。これは母集団を考慮に入れるか入れないかの差で、後者(365分の1のほう)は、まさにm=∞としたときの確率になっている(ハズだ)。
 余談ついでに、もうひとつ。本文中で、確率は「n=366になるまで決して100%にならない」と書いているが、ではn=365のときの確率はいくつになるだろうか?(ただしm=120,000,000) 答えは99.999999…と小数点以下に9が155個ついたものである。まぁ100%と言ってしまって差し支えないかも。





論文リストへ