ファインマンさんの肩に乗って晴耕雨読の日々

ファインマンを読んで気付いた事そして日常生活の記録

Poisson分布と指数分布

第12章は「関数の確率」が経路積分によって議論できることを述べている.

その導入部で,次のような意味の文章が書かれてある:「離散的事象がランダムに起こっている例として,宇宙線が検出器に入射する場合がある.粒子が平均計測率$\mu$で降下すると,任意の長い期間$T$では$\mu T$個の粒子が観測されると期待される.その場合、(A)「短い時間$t$の間に$n$個の粒子を観測する確率」は次の「Poisson分布」で与えられる: $$ P(n,t) = \frac{(\mu t)^{n}}{n!}e^{-\mu t} \tag{12.1} $$ 他方、(B)「一つ粒子が入射してから次の粒子が入射するまでの間隔がある特定な時間$t$となる確率は幾らか?」と問うことも出来よう.しかし,実はこのような仕方で述べられた確率問題には答えられない!!.ただし、(C)「次の粒子が入射するまでの時間間隔が$t$に等しいかそれ以上である確率ならば$e^{-\mu t}$」と答えられる.従って我々が答えられるのは、(D)『生起率$\mu$のポアソン過程に於いては,「始めての入射が起こるまでの待ち時間分布」は同じパラメータ$\mu$を持つ次の「指数分布」で与えられる: $$ P(t)dt=\mu e^{-\mu t}dt \tag{12.2} $$ という事だけ』である.

上記(A)$\sim$(D)のことを,ダベンポート/ルート:「不規則信号と雑音の理論」などを参考書として求めて見たのでその概略を書いておく. (と言うよりは,関係する要点を抜粋してまとめただけである.好い加減の物理・工学的な数学で溢れていると思う.)

[1]. 実の不規則変数$x$について考える.この実線上の一点$X$を考え,不規則変数$x$が$X$以下である確率を値に持つ$X$の関数を不規則変数$x$の「確率分布関数」と言い$P(x\le X)$で表す.そして「確率密度関数」$p(X)$は,この確率分布関数$P(x\le X)$の微分として定義される: $$ p(X)=\frac{d}{dX} P(x\le X),\quad P(x\le X)=\int_{-\infty}^{X} p(x)\,dx \tag{1} $$ すると「不規則変数$x$が区間$(X-dX<x\le X)$に在る確率」は次となる: $$ p(X)dX = P(X-dX < x \le X) \tag{2} $$ 従って,連続的な不規則変数$x$が区間$(a< x\le b)$に存在する確率$P$は確率密度関数積分により与えられる: $$ P(a< x\le b)=\int_a^{b} p(x)\,dx,\quad\text{particularly}\quad \int_{-\infty}^{\infty} p(x)\,dx=1 \tag{3} $$ この定義により,連続的な不規則変数の確率分布関数はジャンプのない滑らかな曲線となるので,任意の点$x_0$では明らかに$P(x=x_0)=0$である. すなわち「連続的な不規則変数が任意の特定な値をとる確率はゼロである」.しかしこれは「この事象が起こり得ないことを意味するものではない」ことも明らかである.従って(B)が言えるのである.

[2]. ある時間間隔に於ける入射確率は,それ以前の入射確率と統計的に独立であると仮定して良い.また短い時間間隔$\Delta t$を考えるならば,入射確率はその時間間隔に比例するとして良いであろう.また短い時間間隔では2つ以上の入射はないと仮定出来る.よって, $$ P(1,\Delta t)=\mu\,\Delta t,\quad P(0,\Delta t)+P(1,\Delta t)=1 \quad\rightarrow\quad P(0,\Delta t)=1-\mu\,\Delta t \tag{4} $$ ただし$\mu$は平均入射率であることが,後で入射数の平均を考えると分かる.次に,長さ$t$の時間間隔に1個の入射もない確率$P(0,t)$を考える.長さ$t+\Delta t$の時間間隔を長さ$t$と長さ$\Delta t$の2つの部分に分けて考えると、$\Delta t$間の入射は$t$の間の入射とは独立と見做せるから次が言える: $$ P(0,t+\Delta t)=P(0,t)\,P(0,\Delta t) \tag{5} $$ 上の式(4)と式(5)とから次が言える: $$ \frac{P(0,t+\Delta t)-P(0,t)}{\Delta t}=-\mu\,P(0,t)\ \xrightarrow{\ \Delta t\to 0\ }\ \frac{d}{dt}P(0,t)=-\mu\,P(0,t) \tag{6} $$ この微分方程式境界条件$P(0,0)=1$として解くならば次を得る: $$ P(0,t)=\exp(-\mu\,t) \tag{7} $$ よって「有限時間$t$の間に全く入射がない確率は$e^{-\mu t}$である」ことが分かる.

[3]. 「前の入射から$T$時間後の微小時間$dt$中に次の入射が起こる確率」を$P_W(t)dt$とおく.すると「$T$まで全く入射が無いこと」と「$T$までに入射が起ること」とは互いに余事象の関係にあるので,次の関係が成り立つ: $$ P(0,T)=1-\int_{-\infty}^{T}P_W(t)\,dt=\int_{-\infty}^{\infty}P_W(t)\,dt-\int_{-\infty}^{T}P_W(t)\,dt=\int_{T}^{\infty}P_W(t)\,dt \tag{8} $$ この式は「時間$T$の間に全く入射が無い確率は,時間$T$以降に次の入射が起る確率に等しい」ことを述べている.この式(8)と式(7)とから, $$ P(0,T)=\int_{T}^{\infty}P_W(t)\,dt=\exp(-\mu T) \tag{9} $$ これは「時間$T$以降に次の入射が起る確率は $e^{-\mu T}$であること」すなわち(C)のことを述べている.

[4]. 次に時間間隔$t+\Delta t$の間に$n$個の入射が起こる確率$P(n,t+\Delta t)$を考える.ここで、$t$までに$n-1$個の入射があった場合に,次の$\Delta t$で1個の入射が起る条件付き確率を$P(n-1,t;1,\Delta t)$などと記すことにすると、$t$までの入射と区間$\Delta t$での入射は独立と考えて良いので, $$ P(n-1,t;1,\Delta t)=P(n-1,t)P(1,\Delta t) $$ が言える.また$\Delta t$の部分では,その間に1個の入射が有るかまたは1つも無いかの2つの場合しかあり得ない.従って,確率$P(n,t+\Delta t)$について次が言える: $$ \begin{align} P(n,t+\Delta t)&=P(n-1,t ; 1,\Delta t)+P(n,t ; 0, \Delta t)\notag\\ &=P(n-1; t)P(1,\Delta t)+P(n,t)P(0,\Delta t) \tag{10} \end{align} $$ これに式(4)の関係を入れ$\Delta t\to0$の極限をとると,次の漸化式の微分方程式が得られる: $$ \frac{d}{dt}P(n,t)+\mu P(n,t)=\mu P(n-1,t) \tag{11} $$ 境界条件は$P(n,0)=0$であるから,この1階線形微分方程式の解は次である: $$ P(n,t)=\mu e^{-\mu t}\int_0^{t} e^{-\mu s}\,P(n-1,s)\,ds,\quad \text{where}\quad P(0,t)=e^{-\mu t} \tag{12} $$ この結果を$n=1$の場合から順番に求めることで最終的に次を得る: $$ P(n,t)=e^{-\mu t}\frac{(\mu t)^{n}}{n!},\quad n=0,1,2,\dotsb \tag{13} $$ このようにして「時間間隔$t$の間に$n$個の入射が起こる確率はPoisson分布で与えられる」こと,すなわち(A)が示された.

[5]. 式(8)を微分すると次が得られる: $$ P_W(T)=-\frac{d}{dT} P(0,T),\quad \text{where}\quad P(0,T)=e^{-\mu T} \tag{14} $$ すると「$t$時間後の微小時間$dt$中に次の入射が起こる時刻$t_w$が入る確率」は次のようにして求められる: $$ P(t-dt<t_W< t)=P_W(t)\,dt = -\frac{d}{dt}P(0,t)\,dt=-\frac{d}{dt} e^{-\mu t}\,dt=\mu e^{-\mu t}\,dt \tag{15} $$ これを「指数分布」と言う.これは「次の入射が起こるまでの待ち時間$t$がパラメータ$\mu$の指数分布に従うこと」,すなわち(D)を示している: $$ P_W(t)dt=\mu\,e^{-\mu t}\,dt \tag{16} $$

確率・統計は苦手なのでここまで求めるのに大変苦労した.特に指数分布とポアソン分布の違いを理解するのに手こずった. この指数分布とポアソン分布とは混同し易いようで、Wikipediaにもその注意を記したサイトへのリンクがあるようだ.それによると,

ポアソン分布となるのは「単位時間当たりの生起確率」であり、指数分布となるのは「事象の生起間隔の確率」の方である.

とのことです.