ある集団で誕生日が同じ人がいる確率

よく「クラスに誕生日が同じ人がいる確率は?」なんて問題を見る.
まあ,すごく一般的な疑問だし,問題としても平易なので,
いろいろなところで,この問いとその答えが書かれているけども,
改めて,ちょいと計算をしてみる.

問題:
「人数がn人の集団で,誕生日が同じ人がいる確率は?」

解答:
全員の誕生日が異なる場合(余事象)の確率を考え,
1(全事象)からその確率を引くことで得られる.
(全員が異ならない = 一人以上の同じ誕生日の人が存在)

                                         365
最初の一人目は,365日のいずれが誕生日であっても良いので,—– = 1.
                                         365

                                           365 – 1
2人目は,1人目の誕生日以外のいずれかの日であれば良いので,———
                                              365

                                            365 – 2
3人目は,1, 2人目の誕生日以外のいずれかの日であれば良いので,———
                                               365

                                                365 – (n-2)

n-1人目は,n-2人目までの誕生日以外のいずれかの日であれば良いので,———

                                                   365

                                               365 – (n-1)

n人目は,n-1人目までの誕生日以外のいずれかの日であれば良いので,———-

                                                   365

したがって,n人全員の誕生日が異なる確率は以下のようになる.

   364   363   362         365 – (n-2)   365 – (n-1)
1 x —– x —– x —– x …… x ———– x ———–
   365   365   365           365       365

そして,一人でも誕生日が同じ人がいるという確率は,

       364   363   362         365 – (n-2)   365 – (n-1)
1 – 1 x —– x —– x —– x …… x ———– x ———–
        365   365   365           365       365

となる.

例えば,30人(n = 30)のクラスであれば,

       364   363   362         365 – 28   365 – 29

1 – 1 x —– x —– x —– x …… x ——— x ——— = 0.7297

        365   365   365           365     365

となり,およそ73.0 %の確率で,同じ誕生日の人がいることになる.

また,50人(n = 50)だとして同様の計算を行えば,確率は0.9743…となり,
およそ97.4 %の確率で,同じ誕生日の人がいるということになる.

これをグラフ化すると,以下のようになる(n = 100で計算).

ホントは……50 %のところ,70 %のところ,99 %のところ,
99.9 %のところだけグリッド線引きたかったんだけど,
やり方が分からないので……簡単なグラフになる..

その代わりと言ってはなんだけど,以下が1~100人までの計算結果.

Columns 1 through 11

         0    0.5479    1.3654    2.4463    3.7826    5.3643    7.1792    9.2137   11.4522   13.8782   16.4736

  Columns 12 through 22

   19.2197   22.0968   25.0849   28.1636   31.3126   34.5117   37.7413   40.9821   44.2160   47.4255   50.5944

  Columns 23 through 33

   53.7076   56.7515   59.7137   62.5834   65.3512   68.0092   70.5509   72.9714   75.2670   77.4354   79.4755

  Columns 34 through 44

   81.3873   83.1721   84.8318   86.3694   87.7885   89.0933   90.2886   91.3794   92.3714   93.2701   94.0814

  Columns 45 through 55

   94.8111   95.4650   96.0490   96.5686   97.0292   97.4362   97.7944   98.1086   98.3833   98.6225   98.8300

  Columns 56 through 66

   99.0095   99.1642   99.2970   99.4107   99.5075   99.5898   99.6595   99.7183   99.7677   99.8090   99.8436

  Columns 67 through 77

   99.8723   99.8961   99.9157   99.9319   99.9451   99.9560   99.9648   99.9719   99.9777   99.9823   99.9861

  Columns 78 through 88

   99.9890   99.9914   99.9933   99.9948   99.9960   99.9969   99.9976   99.9982   99.9986   99.9989   99.9992

  Columns 89 through 99

   99.9994   99.9995   99.9997   99.9997   99.9998   99.9999   99.9999   99.9999   99.9999  100.0000  100.0000

  Column 100

  100.0000

90人を超えると,表示桁数をオーバーして100になっている.
表示桁数を増やすと,以下のような感じ.

  Columns 89 through 92

          99.9993831456003          99.9995352466852          99.9996511166897          99.9997390544008

  Columns 93 through 96

          99.9998055419096          99.9998556215274           99.999893199486          99.9999212894842

  Columns 97 through 100

          99.9999422070734          99.9999577240783          99.9999691906982          99.9999776316028

ただまあ,そもそもとして,有効数字というものを考えれば……,
観測値の有効数字が3桁なのだから,表示桁数を増やすことにあまり意味は無い.

有効桁3桁で考えれば,72人を超えればほぼ100 %同じ誕生日の人がいるということになる.

カテゴリー: 数理科学 パーマリンク