指数分布とポアソン分布(前編)

いま、ある窓口に客が次々と到着する状況を想定します。そして、その客の到着間隔が指数分布に従っているとします。

指数分布の確率密度関数\lambda\gt 0 をある定数として f(t)=\lambda e^{-\lambda t} (t\geq 0) で、その期待値は \frac{1}{\lambda} です。*1

現在時刻を t とし、それ以前に最後に客が訪れた時刻を t-t' とします。このとき、時刻 (t,t+\Delta t) の間に最初の客が訪れる確率は
\begin{align}P(t'\lt T\leq t'+\Delta t|T\gt t')&=\frac{P(t'\lt T\leq t'+\Delta t)}{P(T\gt t')}\\&=\frac{1-e^{-\lambda(t'+\Delta t)}-(1-e^{-\lambda t'})}{e^{-\lambda t'}}\\&=\frac{e^{-\lambda t'}(1-e^{-\lambda\Delta t})}{e^{-\lambda t'}}\\&=1-e^{-\lambda\Delta t}=P(T\leq\Delta t)\end{align}
で、tt' には依存しません。そこで t'=0 と考えて以降の話を進めます。

時刻 t 以降の第一の客と第二の客の到着間隔を表す確率変数を T_1,T_2 とします。このとき T_1T_2 は共に期待値 \frac{1}{\lambda} の指数分布に従うので、T_1+T_2 の従う分布の確率密度関数
\begin{align}\lambda^2\int_0^t e^{-\lambda x}e^{-\lambda(t-x)}dx&=\lambda^2 e^{-\lambda t}\int_0^t dx\\&=\lambda^2 te^{-\lambda t}\end{align}
となります。

時刻 (t,t+\Delta t) の間に到着する客の数を N(\Delta t) で表すことにすると
\begin{align}P\{N(\Delta t)=0\}&=P(T_1\gt \Delta t)\\&=e^{-\lambda\Delta t}\\&=1+(-\lambda\Delta t)+\frac{(-\lambda\Delta t)^2}{2}+\dots\\&=1-\lambda\Delta t+o(\Delta t)\end{align}
\begin{align}P\{N(\Delta t)\leq 1\}&=P(T_1+T_2\gt \Delta t)\\&=\lambda^2\int_{\Delta t}^\infty te^{-\lambda t}dt\\&=\lambda^2\left\{\left[-\frac{t}{\lambda}e^{-\lambda t}\right]_{\Delta t}^\infty+\int_{\Delta t}^\infty\frac{1}{\lambda}e^{-\lambda t}dt\right\}\\&=\lambda\left\{[-te^{-\lambda t}]_{\Delta t}^\infty+\int_{\Delta t}^\infty e^{-\lambda t}dt\right\}\\&=\lambda\{\Delta t e^{-\lambda\Delta t}+\left[-\frac{e^{-\lambda t}}{\lambda}\right]_{\Delta t}^\infty\}\\&=\lambda\Delta te^{-\lambda\Delta t}+e^{-\lambda\Delta t}\end{align}
ゆえ
\begin{align}P\{N(\Delta t)=1\}&=P\{N(\Delta t)\leq 1\}-P\{N(\Delta t)=0\}\\&=\lambda\Delta t e^{-\lambda\Delta t}\\&=\lambda\Delta t\{1+(-\lambda\Delta t)+\dots\}\\&=\lambda\Delta t+o(\Delta t)\end{align}
\begin{align}P\{N(\Delta t)\geq 2\}&=1-P\{N(\Delta t)=0\}-P\{N(\Delta t)=1\}\\&=1-(1-\lambda\Delta t+o(\Delta t))-(\lambda\Delta t+o(\Delta t))\\&=o(\Delta t)\to 0 (\Delta t\to 0)\end{align}
となります。

以上のことから、客の到着がある特定の時間帯に特別に多かったり少なかったりすることはなく(定常性)、またある時間帯の客の到着数はそれ以前の客の到着数とは無関係(無残留効果性)であること、さらに、多くの客が同時に訪れることはほとんどない(希少性)ということも分かります。つまり、客の到着間隔が指数分布に従うことは、客がランダムに到着することを表していることが分かります。

これがどうポアソン分布と関係してくるかについては次回に。

*1:この値を「平均到着間隔」と言います。