確率変数の和の個数の分布
ある現象が繰り返し発生するとします。その現象は、前に起きた時刻からある確率分布に従う時間後に次の発生があるものとします。そしてその確率分布は変わらないものとします。現象のある発生から次の発生までの間隔を確率変数で表すことにします。時刻の時に発生があるとします。次の発生がある時刻をで表すことにします。は確率的に変動するのでは確率変数です。回目の発生のある時刻をで表すことにします。と同一の分布を持つ確率変数(ただし、)を考えると
- ・・・・(1)
と表すことが出来ます。確率変数の平均を、標準偏差をで表すことにします。すると式(1)は同一分布の確率変数の和になりますからの平均は
- ・・・・(2)
標準偏差は
- ・・・・(3)
になります。さらに、が大きくなると統計学で有名な中心極限定理により、の分布は正規分布に近づきます。これはの値を非常に大きくとっていますが、を固定した場合のの値の分布について述べています。
今度は、ある時刻を決めて、それまでに何回この現象が発生したかを考えます。が確率変数なので発生した回数は確率的に変動します。の値を充分大きくした時、この分布はどのような分布になるでしょうか? これはつまり
- ・・・・(4)
かつ
- ・・・・(5)
であるようなの値の分布です。この分布を求めることが、私がここで解きたいと思っている問題です。
まずを固定して考えます。がからの間にある確率を
- ・・・・(6)
で表すことにします。はについての確率密度になります。の値を大きくしていくとは正規分布に近づきます。さてここで、平均ゼロ、標準偏差1の正規分布をで表すことにします。つまり
- ・・・・(7)
です。の平均と標準偏差はそれぞれ式(2)(3)で与えられますから、
- ・・・・(8)
となります。の前の
は、確率密度の規格化のために必要な係数です。さて、ここでの代わりに新しい変数
- ・・・・(9)
を考えます。そしての代わりにに関する確率密度を考えます。すると
- ・・・・(10)
となります。一方、式(9)から
- ・・・・(11)
なので
となるのでこの式と式(10)から
- ・・・・(12)
となります。式(12)と式(8)から
- ・・・・(13)
さらにの代わりに
- ・・・・(14)
で定義されるを考えます。に関する確率密度を考えます。
となりますから
- ・・・・(15)
となります。式(14)から
今はを固定にして確率密度を考えていますから。よって
- ・・・・(16)
一方のほうは、式(13)に式(14)を代入して
よって
- ・・・・(17)
式(15)に(16)(17)を代入して
- ・・・・(18)
ここでを一定にしてとすると式(14)から。よって
- ・・・・(19)
また
なので
- ・・・・(20)
よって式(18)の右辺は
となります。また、正規分布による近似は中心極限定理によりで正確になりますので結局
- ・・・・(21)
となります。式(21)を見るとに依存することなくは平均ゼロ、標準偏差1の正規分布で分布することが分かります。ということはにも依存しないことになります。よってを固定した場合にもは平均ゼロ、標準偏差1の正規分布で分布します。ここで式(14)
- ・・・・(14)
をもう一度考えると、を固定すればを固定することになるので、が平均ゼロ、標準偏差1の正規分布で分布することから考えて、は平均、標準偏差の正規分布で分布することが分かります。