ポアソン過程と順序統計量－到着時刻と一様分布の関係

どうも！初めましての方は初めまして、初心者のWebサイト勉強のとみーです！

ポアソン過程は、

ある時刻までに希少現象が発生した回数の総和

をモデル化できる確率過程で、待ち行列理論でよく用いられます。

参考ポアソン過程の基礎については、こちらでわかりやすくまとめています。

ポアソン過程とポアソンの極限定理をわかりやすく解説！

どうも！初めましての方は初めまして、初心者のWebサイト勉強のとみーです！待ち行列理論では、ポアソン過程と呼ばれる確率過程がよく登場します。確率過程は、簡単にいうと時刻

https://www.beginner-blogger.com/poisson-process/

, 1, \cdots, t, \cdots$ の確率変数を集...

ポアソン過程には、重要な性質がいくつかあります。

ポアソン過程に関連する重要事項

とみー

今回は、そんなポアソン過程の到着時刻の確率分布を、順序統計量という値を用いてまとめました！

簡単にいうと

到着時刻が一様分布に従う

という性質をご紹介します。

対象レベル

確率の基本的な知識がある方（高校数学〜大学入門）

順序統計量とは
1. 順序統計量の定義
2. 順序統計量の具体例
ポアソン過程の到着時刻は一様分布の順序統計と同じ分布
一様分布に従う $n$ 変数の同時確率密度
1. $n$ 変数の同時確率密度関数
2. 順序統計量の同時確率密度関数
ポアソン過程の到着時刻の確率分布
まとめ

順序統計量とは

具体的な性質の話に入る前に、そもそも順序統計量とは何かを理解しましょう。

順序統計量の定義

順序統計量

数列 $X_1, X_2, \cdots, X_n$ について、$i$ 番目に小さい値を $X_{(i)}$ と表したとき、それらを小さい順に並べた

$X_{(1)}, X_{(2)}, \cdots, X_{(n)}$

を順序統計量という。

とみー

要するに、元の数列を小さい順に並び替えたものです。

そのため、次のような関係が成り立ちます。

$X_{(1)} = \min \{X_1, X_2, \cdots, X_n\}$
$X_{(n)} = \max \{X_1, X_2, \cdots, X_n\}$

$X_{(1)}$ が一番小さく、$X_{(n)}$ が一番大きいという意味ですね。

順序統計量の具体例

例えば、$(X_1, X_2, X_3) = (3, 2, 5)$ という数列 $\{X_i\}_{i=\{1, 2, 3\}}$ を考えましょう。

この数列を小さい順に並び替えると

$(2, 3, 5)$

になりますよね。

よって、

$(X_{(1)}, X_{(2)}, X_{(3)}) = (2, 3, 5)$

となります。

元の数列と比較すると、

$X_{(1)} = X_2$
$X_{(2)} = X_1$
$X_{(3)} = X_3$

です。

とみー

記号がごちゃっとしていますが、小さい順に並び替えているだけです！

ポアソン過程の到着時刻は一様分布の順序統計と同じ分布

順序統計量がわかったところで、早速ポアソン過程の話にいきましょう。

ここでは、ポアソン過程を $\Lambda(t)$ と表し、$i$ 回目の到着時刻を $Z_i$ のように表します。

簡単に触れておくと、$\Lambda(t)$ は時刻 $t$ までの到着数を表します。

とみー

文字やグラフの意味がわからない方は、ポアソン分布の基礎についてまとめたこちらをご覧ください。

ポアソン過程 $\Lambda (t)$ と順序統計量の間には、次のような関係が成り立ちます。

定理

$\Lambda(t) = n$ の場合、到着時刻 $(Z_1, Z_2, \cdots, Z_n)$ は

一様分布 $\mathcal{U}_{[0, t]}$ に従う
独立同分布の $n$ 個の確率変数の
順序統計

と同じ分布を持つ。

$\Lambda(t)=n$ の意味

$\Lambda(t)$ は時刻 $t$ までの到着数を表すので、

$\Lambda(t)=n$

は、時刻 $t$ までの到着数を $n$ とおく、という意味です。

到着時刻 $(Z_1, Z_2, \cdots, Z_n)$ について

$Z_1$ は１回目の到着時刻、$Z_2$ は２回目の到着時刻、…と定義したので、

$0<Z_1<Z_2< \cdots < Z_n$

よって

$(Z_1, Z_2, \cdots, Z_n)$ はそれ自身が順序統計量

となっています。

数式で書くと、

$\forall i \in \{1, \cdots, n\}, \; Z_{(i)} = Z_i$

つまり、

$Z_{(\color{red}1\color{black})} = Z_{\color{red}1\color{black}}$
$Z_{(\color{red}2\color{black})} = Z_{\color{red}2\color{black}}$
・・・
$Z_{(\color{red}n\color{black})} = Z_{\color{red}n\color{black}}$

のように、添字が完全に一致しているということです。

ざっくりとした定理のイメージ

この定理は、すごくざっくり言うとポアソン過程の

到着時刻の確率分布がわかる定理

です。

ちなみに、到着間隔を $\{X_i\}$ とすると、再生過程との関連から到着間隔の確率分布を求めることができます。

とみー

今回の話に到着間隔 $\{X_i\}$ は出てきませんが、重要な性質なので興味がある方はこちらのページも併せてご覧ください。

直感的でわかりやすい定理のイメージ

ポアソン過程には、独立増分性と定常増分性という２つの性質があります。

独立増分性：重なりを持たない区間における到着数は独立
定常増分性：到着数は区間の長さだけに依存

とみー

独立増分性についてはこちらのページ、定常増分性についてはこちらのページでわかりやすくまとめています。

ここでは、簡単のために $n=1$ のケースを考えてみましょう。

$n=1$ を例に考える

$n=1$ ということは、時刻 $t$ までに到着が１回しかなかったことを意味します。

ここで、区間 $[0, t)$ を同じ長さの小区間に分割すると、次の図のようになります。

それぞれの区間は互いに重なりを持たず（独立増分）、区間の長さがすべて同じ（定常増分）なので、

どの区間でも到着が発生する確率は同じ

ということが直感的に理解できると思います。

とみー

「どの区間も同じ→一様分布」という予測が立ちます！

数式で確認してみる

このことは、数式で簡単に確認することができます。

$0 < t_1 < t$
$h_1 > 0$

とすると、$t_1 \leq Z_1 < t_1 + h_1$ は到着が区間 $[t_1, t_1 + h_1)$ で発生したことを表します。

区間 $[t_1, t_1 + h_1)$ の到着数は $\Lambda(t_1 + h_1) \;-\; \Lambda(t_1)$ と表されますが、定常増分性から $\Lambda(h_1)$ と同じ確率分布に従うことがわかります。

また、今は区間 $[0, t)$ で到着が１回しかない状況を考えているので、$[t_1, t_1 + h_1)$ 以外の区間の到着数は０です。

これらをまとめると、

$[0, t_1)$ の到着数が０
- $\Lambda(t_1) = 0$
$[t_1, t_1 + h_1)$ の到着数が１
- $\Lambda(t_1 + h_1) \;-\; \Lambda(t_1) = 1 \iff \Lambda(h_1) = 1 $
$[t_1 + h_1, t)$ の到着数が０
- $\Lambda(t) \;–\; \Lambda(t_1+h_1) = 0 \iff \Lambda(t \;-\; t_1\;-\;h_1) = 0$

となります。

よって、

$ \begin{eqnarray} \mathbb{P}(t_1 \leq Z_1 < t_1 + h_1 | \Lambda(t) = 1) &=& \frac{\mathbb{P}(t_1 \leq Z_1 < t_1 + h_1, \Lambda(t) = 1)}{\mathbb{P}(\Lambda(t) = 1)} \\ &=& \frac{\mathbb{P}(\Lambda(h_1) = 1, \Lambda(t_1) = 0, \Lambda(t \;-\; t_1 \;-\; h_1) = 0)}{\mathbb{P}(\Lambda(t) = 1)} \\ &=& \frac{\mathbb{P}(\Lambda(h_1) = 1) \cdot \mathbb{P}(\Lambda(t_1) = 0) \cdot \mathbb{P}(\Lambda(t \;-\; t_1 \;-\; h_1) = 0)}{\mathbb{P}(\Lambda(t) = 1)} \\ &=& \frac{\lambda h_1 e^{-\lambda h_1} \cdot e^{-\lambda t_1} \cdot e^{–\lambda (t \;-\; t_1 \;-\; h_1)} }{\lambda t e^{-\lambda t} } \\ &=& \frac{h_1}{t} \end{eqnarray} $

ポアソン分布の確率質量関数

$\mathbb{P}(\Lambda (t) = i) = \displaystyle \frac{e^{-\lambda t} (\lambda t)^i }{i!}$

$\lambda > 0$ はポアソン過程のパラメータです。

ここで、両辺を $h_1$ で割り $h_1 \rightarrow 0$ とすると、

$f_{Z_1} (t_1\,|\, \Lambda(t) = 1) = \displaystyle \frac{1}{t}$

これは、一様分布の確率密度関数に他なりません。

とみー

先ほどの直感が数式で確かめられました！

$n$ が２以上の場合

これまでは $n=1$ の例を見てきましたが、上の定理は $n=2$ 以上の場合でも成り立ちます。

これを導いていくために、一様分布に従う多変数の同時確率分布を確認しておきましょう。

一様分布に従う $n$ 変数の同時確率密度

$n$ 個の確率変数 $X_1, X_2, \cdots, X_n$ が一様分布 $\mathcal{U}_{[0, t]}$ に従うとします。

確率密度関数は、次のように表されます。

$\displaystyle \forall i \in \{1, \cdots, n\},\; f_{X_i} (t_i) = \frac{1}{t}$

$n$ 変数の同時確率密度関数

このとき、$X = (X_1, \cdots, X_n)$ の同時確率密度関数は

$ \begin{eqnarray} f_{X} (t_1, \cdots, t_n) = \left\{ \begin{array}{l} \displaystyle \frac{1}{t^n} \quad \forall i \in \{1, \cdots, n\}, t_i \in [0, t] \\ 0 \quad \mbox{その他} \end{array} \right. \end{eqnarray} $

となります。

とみー

それぞれの確率密度関数が $\frac{1}{t}$ で、変数が $n$ 個なので当たり前ですね。

順序統計量の同時確率密度関数

$(X_{(1)}, \cdots, X_{(n)}) = (x_1, \cdots, x_n)$ のとき、元の $(X_1, \cdots, X_n)$ の組み合わせは $n!$ 個存在します。

例えば $(X_{(1)}, X_{(2)}, X_{(3)}) = (1, 2, 3)$ の場合、

$(X_1, X_2, X_3) = (1, 2, 3)$
$(X_1, X_2, X_3) = (1, 3, 2)$
$(X_1, X_2, X_3) = (2, 1, 3)$
$(X_1, X_2, X_3) = (2, 3, 1)$
$(X_1, X_2, X_3) = (3, 1, 2)$
$(X_1, X_2, X_3) = (3, 2, 1)$

の $3! = 6$ 通り存在します。

とみー

高校の時に登場した順列ですね！

つまり、一様分布 $\mathcal{U}_{[0, t]}$ に従う $n$ 個の確率変数の順序統計量 $X_{(\cdot)} = (X_{(1)}, \cdots, X_{(n)})$ の同時確率密度関数は

$ \begin{eqnarray} f_{X_{(\cdot)}} (t_1, \cdots, t_n) = \left\{ \begin{array}{l} \displaystyle \frac{n!}{t^n} \quad 0 \leq t_1 \leq \cdots \leq t_n \leq t \\ 0 \quad \mbox{その他} \end{array} \right. \end{eqnarray} $

となります。

順序統計量なので、$0 \leq t_1 \leq \cdots \leq t_n \leq t$ のような順番になることに注意しましょう。

先ほどの例を使うと、

$ \begin{eqnarray} f_{X_{(\cdot)}} (1, 2, 3) &=& f_X (1,2,3) + f_X (1,3,2) + f_X (2, 1, 3) + f_X (2, 3, 1) + f_X (3, 1, 2) + f_X (3, 2, 1) \\ &=& 6 \cdot f_X (1,2,3) \\ &=& \frac{3!}{t} \end{eqnarray} $

です。

ポアソン過程の到着時刻の確率分布

以上を踏まえて、一般（$n = 2$ 以上）の場合でも、ポアソン過程の到着時刻が

一様分布に従う $n$ 個の確率変数の順序統計量と同じ分布を持つ

ことを示しましょう。

とみー

流れは $n=1$ の場合とそっくりです！

到着が発生する区間を仮定

ポアソン過程には、到着が同時に発生しないという性質があります。

そのため、到着時刻の関係は

$0 < Z_1 < \cdots < Z_n$

のように、不等式に等号（＝）を含みません。

したがって、すべての $i\in \{1, \cdots, n\}$ に対して、

$t_i \leq Z_i < t_i + h_i$

となる $0 < t_1 < \cdots < t_n$、$h_i > 0$ を取ることができます。

とみー

このとき、各区間 $[t_i, t_i+h_i)$ は重なりを持たないように取れることに注意しましょう。

状況を式にする

上の図の状況を式でまとめると、次のようになります（$\forall i \in \{1, \cdots, n, n+1\}$）。

$[t_i, t_i + h_i)$ の到着数が１
- $\Lambda(t_i + h_i) \;-\; \Lambda(t_i) = 1 \iff \Lambda(h_i) = 1 $
それ以外の区間の到着数が０
- $\Lambda(t_i) \;–\; \Lambda(t_{i-1}+h_{i-1}) = 0 \iff \Lambda(t_i \;-\; t_{i-1}\;-\;h_{i-1}) = 0$

ただし、式を簡単にするために $t_0 = h_0= 0$、$t_{n+1} = t$ としています。

とみー

ここまでで、同時確率密度を求める準備ができました！

導出

最後に式変形をしましょう。

$ \begin{eqnarray}\mathbb{P}(\forall i \in \{1, \cdots, n\}, t_i \leq Z_i < t_i + h_i | \Lambda(t) = n)　 &=& \frac{\mathbb{P}(\forall i \in \{1, \cdots, n\}, t_i \leq Z_i < t_i + h_i), \Lambda(t) = n) }{\mathbb{P}(\Lambda(t) = n)} \\ &=& \frac{\mathbb{P}(\forall i \in \{1, \cdots, n\}, \Lambda(h_i) = 1, \Lambda(t_i \;-\; t_{i-1}\;-\;h_{i-1}) = 0) }{\mathbb{P}(\Lambda(t) = n)} \\ &=& \frac{\prod_{i=1}^{n+1} \mathbb{P}(\Lambda(h_i) = 1) \cdot \mathbb{P}(\Lambda(t_i \;-\; t_{i-1}\;-\;h_{i-1}) = 0)}{\mathbb{P}(\Lambda(t) = n)} \\ &=& \frac{\prod_{i=1}^{n+1} \lambda h_i e^{-\lambda h_i} \cdot e^{-\lambda (t_i \;-\; t_{i-1} \;-\; h_{i-1})}}{\frac{(\lambda t)^n e^{-\lambda t}}{n!}} \\ &=& \frac{n!}{t^n} h_1 \cdots h_n \end{eqnarray}$

両辺で、$\forall i \in \{1, \cdots, n\}, h_i \rightarrow 0$ とすると、

$\displaystyle f_Z (t_1, \cdots, t_n \;|\; \Lambda(t) = n) = \frac{n!}{t^n}$

これは、上で見た一様分布 $\mathcal{U}_{[0, t]}$ に従う $n$ 個の確率変数の順序統計量 $X_{(\cdot)} = (X_{(1)}, \cdots, X_{(n)})$ の同時確率密度関数です！

とみー

よって、導出完了です！

つまり、ポアソン過程の到着時刻は

一様分布に従う $n$ 個の確率変数の順序統計量と同じ分布を持つ

ことが示されました。

確率過程のおすすめ本

リンク