一様乱数の差の分布(前編)

とある国家試験に次のような問題が出たそうです。

0 から 1 までの一様乱数から X と Y を取り出すことを 600 回繰り返す。このとき Y < X を満たす回数の期待値はいくらか。

実際には選択肢が与えられているので、勘で当てられなくもありませんが、ちょっと真面目に計算するとなると、こういうことになります。

まず、X, Y は一様分布 U[0,1] に従う独立な確率変数とみなせます。

一般に、(X, Y) の同時分布の確率密度関数を p(x,y) とするとき、Z = X + Y の確率密度関数を求めようとすると、z = x + y と変換して
\left|\frac{\partial(x,y)}{\partial(x,z)}\right|=\left|\det\left(\begin{array}{cc}1&0\\-1&1\end{array}\right)\right|=1
なので求める確率密度関数
h(z)=\int_{-\infty}^\infty p(x,z-x)dx
となります。特に X と Y が独立のとき、それぞれの確率密度関数を f(x), g(y) とすれば
h(z)=\int_{-\infty}^\infty f(x)g(z-x)dx
となることが分かります。

話を問題に戻しましょう。Z = X - Y とおきます。これを Z = X + (- Y) と解釈します。ここで - Y は一様分布 U[-1,0] に従います。X の確率密度関数を f(x), - Y の確率密度関数を g(y) として
h(z)=\int_{-\infty}^\infty f(x)g(z-x)dx
ですが、f(x) は x < 0, 1 < x では 0、0 ≤ x ≤ 1 では 1 なので上式は
h(z)=\int_0^1 g(z-x)dx=\int_{z-1}^z g(y)dy
と直せます。ここで g(y) は y < - 1, 0 < y で 0、- 1 ≤ y ≤ 0 で 1 なので
(i) z < - 1 のとき h(z)=0,
(ii) - 1 ≤ z < 0 のとき h(z)=\int_{-1}^z dy=z+1,
(iii) 0 ≤ z < 1 のとき h(z)=\int_{z-1}^0 dy=1-z,
(iv) z ≥ 1 のとき h(z)=0
となります。h(z) を - ∞ から z まで積分すれば分布関数も得られます。以下に、確率密度関数と分布関数のグラフを掲載します。

以上のことから P(Y < X) = P(Z > 0) = 1 - P(Z ≤ 0) = 1 - 1/2 = 1/2.

というわけで P(Y < X) = 1/2 とわかったので、期待値は 600 * (1/2) = 300 (回)となることが分かります。後編で別法を紹介します。