ポアソン過程と順序統計量-到着時刻と一様分布の関係

ポアソン過程と順序統計量-到着時刻と一様分布の関係再生過程
スポンサーリンク

どうも!初めましての方は初めまして、初心者のWebサイト勉強のとみーです!

ポアソン過程は、

ある時刻までに希少現象が発生した回数の総和

をモデル化できる確率過程で、待ち行列理論でよく用いられます。

ポアソン過程には、重要な性質がいくつかあります。

とみー
とみー

今回は、そんなポアソン過程の到着時刻の確率分布を、順序統計量という値を用いてまとめました!

簡単にいうと

到着時刻が一様分布に従う

という性質をご紹介します。

対象レベル

確率の基本的な知識がある方(高校数学〜大学入門)

スポンサーリンク

順序統計量とは

順序統計量

具体的な性質の話に入る前に、そもそも順序統計量とは何かを理解しましょう。

順序統計量の定義

順序統計量

数列 $X_1, X_2, \cdots, X_n$ について、$i$ 番目に小さい値を $X_{(i)}$ と表したとき、それらを小さい順に並べた

$X_{(1)}, X_{(2)}, \cdots, X_{(n)}$

順序統計量という。

とみー
とみー

要するに、元の数列を小さい順に並び替えたものです。

そのため、次のような関係が成り立ちます。

  • $X_{(1)} = \min \{X_1, X_2, \cdots, X_n\}$
  • $X_{(n)} = \max \{X_1, X_2, \cdots, X_n\}$

$X_{(1)}$ が一番小さく、$X_{(n)}$ が一番大きいという意味ですね。

順序統計量の具体例

例えば、$(X_1, X_2, X_3) = (3, 2, 5)$ という数列 $\{X_i\}_{i=\{1, 2, 3\}}$ を考えましょう。

この数列を小さい順に並び替えると

$(2, 3, 5)$

になりますよね。

よって、

$(X_{(1)}, X_{(2)}, X_{(3)}) = (2, 3, 5)$

となります。

順序統計量の例

元の数列と比較すると、

  • $X_{(1)} = X_2$
  • $X_{(2)} = X_1$
  • $X_{(3)} = X_3$

です。

とみー
とみー

記号がごちゃっとしていますが、小さい順に並び替えているだけです!

スポンサーリンク

ポアソン過程の到着時刻は一様分布の順序統計と同じ分布

順序統計量がわかったところで、早速ポアソン過程の話にいきましょう。

ここでは、ポアソン過程を $\Lambda(t)$ と表し、$i$ 回目の到着時刻を $Z_i$ のように表します。

ポアソン過程の設定

簡単に触れておくと、$\Lambda(t)$ は時刻 $t$ までの到着数を表します。

とみー
とみー

文字やグラフの意味がわからない方は、ポアソン分布の基礎についてまとめたこちらをご覧ください。

ポアソン過程 $\Lambda (t)$ と順序統計量の間には、次のような関係が成り立ちます。

定理

$\Lambda(t) = n$ の場合、到着時刻 $(Z_1, Z_2, \cdots, Z_n)$ は

  • 一様分布 $\mathcal{U}_{[0, t]}$ に従う
  • 独立同分布の $n$ 個の確率変数の
  • 順序統計

と同じ分布を持つ。

$\Lambda(t)=n$ の意味

$\Lambda(t)$ は時刻 $t$ までの到着数を表すので、

$\Lambda(t)=n$

は、時刻 $t$ までの到着数を $n$ とおく、という意味です。

到着時刻 $(Z_1, Z_2, \cdots, Z_n)$ について

$Z_1$ は1回目の到着時刻、$Z_2$ は2回目の到着時刻、…と定義したので、

$0<Z_1<Z_2< \cdots < Z_n$

よって

$(Z_1, Z_2, \cdots, Z_n)$ はそれ自身が順序統計量

となっています。

数式で書くと、

$\forall i \in \{1, \cdots, n\}, \; Z_{(i)} = Z_i$

つまり、

  • $Z_{(\color{red}1\color{black})} = Z_{\color{red}1\color{black}}$
  • $Z_{(\color{red}2\color{black})} = Z_{\color{red}2\color{black}}$
  • ・・・
  • $Z_{(\color{red}n\color{black})} = Z_{\color{red}n\color{black}}$

のように、添字が完全に一致しているということです。

ざっくりとした定理のイメージ

この定理は、すごくざっくり言うとポアソン過程の

到着時刻の確率分布がわかる定理

です。

ちなみに、到着間隔を $\{X_i\}$ とすると、再生過程との関連から到着間隔の確率分布を求めることができます。

ポアソン過程の到着間隔
とみー
とみー

今回の話に到着間隔 $\{X_i\}$ は出てきませんが、重要な性質なので興味がある方はこちらのページも併せてご覧ください。

直感的でわかりやすい定理のイメージ

ポアソン過程には、独立増分性定常増分性という2つの性質があります。

  • 独立増分性重なりを持たない区間における到着数は独立
  • 定常増分性到着数は区間の長さだけに依存
とみー
とみー

独立増分性についてはこちらのページ、定常増分性についてはこちらのページでわかりやすくまとめています。

ここでは、簡単のために $n=1$ のケースを考えてみましょう。

$n=1$ を例に考える

$n=1$ ということは、時刻 $t$ までに到着が1回しかなかったことを意味します。

ここで、区間 $[0, t)$ を同じ長さの小区間に分割すると、次の図のようになります。

ポアソン過程 区間を等分割

それぞれの区間は互いに重なりを持たず(独立増分)、区間の長さがすべて同じ (定常増分)なので、

どの区間でも到着が発生する確率は同じ

ということが直感的に理解できると思います。

とみー
とみー

「どの区間も同じ→一様分布」という予測が立ちます!

数式で確認してみる

このことは、数式で簡単に確認することができます。

  • $0 < t_1 < t$
  • $h_1 > 0$

とすると、$t_1 \leq Z_1 < t_1 + h_1$ は到着が区間 $[t_1, t_1 + h_1)$ で発生したことを表します。

ポアソン過程最初の到着

区間 $[t_1, t_1 + h_1)$ の到着数は $\Lambda(t_1 + h_1) \;-\; \Lambda(t_1)$ と表されますが、定常増分性から $\Lambda(h_1)$ と同じ確率分布に従うことがわかります。

また、今は区間 $[0, t)$ で到着が1回しかない状況を考えているので、$[t_1, t_1 + h_1)$ 以外の区間の到着数は0です。

これらをまとめると、

  • $[0, t_1)$ の到着数が0
    • $\Lambda(t_1) = 0$
  • $[t_1, t_1 + h_1)$ の到着数が1
    • $\Lambda(t_1 + h_1) \;-\; \Lambda(t_1) = 1 \iff \Lambda(h_1) = 1 $
  • $[t_1 + h_1, t)$ の到着数が0
    • $\Lambda(t) \;–\; \Lambda(t_1+h_1) = 0 \iff \Lambda(t \;-\; t_1\;-\;h_1) = 0$

となります。

よって、

$ \begin{eqnarray} \mathbb{P}(t_1 \leq Z_1 < t_1 + h_1 | \Lambda(t) = 1) &=& \frac{\mathbb{P}(t_1 \leq Z_1 < t_1 + h_1, \Lambda(t) = 1)}{\mathbb{P}(\Lambda(t) = 1)} \\ &=& \frac{\mathbb{P}(\Lambda(h_1) = 1, \Lambda(t_1) = 0, \Lambda(t \;-\; t_1 \;-\; h_1) = 0)}{\mathbb{P}(\Lambda(t) = 1)} \\ &=& \frac{\mathbb{P}(\Lambda(h_1) = 1) \cdot \mathbb{P}(\Lambda(t_1) = 0) \cdot \mathbb{P}(\Lambda(t \;-\; t_1 \;-\; h_1) = 0)}{\mathbb{P}(\Lambda(t) = 1)} \\ &=& \frac{\lambda h_1 e^{-\lambda h_1} \cdot e^{-\lambda t_1} \cdot e^{–\lambda (t \;-\; t_1 \;-\; h_1)} }{\lambda t e^{-\lambda t} } \\ &=& \frac{h_1}{t} \end{eqnarray} $

$\lambda > 0$ はポアソン過程のパラメータです。

ここで、両辺で $h_1 \rightarrow 0$ とすると、

$f_{Z_1} (t_1\,|\, \Lambda(t) = 1) = \displaystyle \frac{1}{t}$

これは、一様分布の確率密度関数に他なりません。

とみー
とみー

先ほどの直感が数式で確かめられました!

$n$ が2以上の場合

これまでは $n=1$ の例を見てきましたが、上の定理は $n=2$ 以上の場合でも成り立ちます。

これを導いていくために、一様分布に従う多変数の同時確率分布を確認しておきましょう。

スポンサーリンク

一様分布に従う $n$ 変数の同時確率密度

$n$ 個の確率変数 $X_1, X_2, \cdots, X_n$ が一様分布 $\mathcal{U}_{[0, t]}$ に従うとします。

確率密度関数は、次のように表されます。

$\displaystyle \forall i \in \{1, \cdots, n\},\; f_{X_i} (t_i) = \frac{1}{t}$

$n$ 変数の同時確率密度関数

このとき、$X = (X_1, \cdots, X_n)$ の同時確率密度関数は

$ \begin{eqnarray} f_{X} (t_1, \cdots, t_n) = \left\{ \begin{array}{l} \displaystyle \frac{1}{t^n} \quad \forall i \in \{1, \cdots, n\}, t_i \in [0, t] \\ 0 \quad \mbox{その他} \end{array} \right. \end{eqnarray} $

となります。

とみー
とみー

それぞれの確率密度関数が $\frac{1}{t}$ で、変数が $n$ 個なので当たり前ですね。

順序統計量の同時確率密度関数

$(X_{(1)}, \cdots, X_{(n)}) = (x_1, \cdots, x_n)$ のとき、元の $(X_1, \cdots, X_n)$ の組み合わせは $n!$ 個存在します。

例えば $(X_{(1)}, X_{(2)}, X_{(3)}) = (1, 2, 3)$ の場合、

  • $(X_1, X_2, X_3) = (1, 2, 3)$
  • $(X_1, X_2, X_3) = (1, 3, 2)$
  • $(X_1, X_2, X_3) = (2, 1, 3)$
  • $(X_1, X_2, X_3) = (2, 3, 1)$
  • $(X_1, X_2, X_3) = (3, 1, 2)$
  • $(X_1, X_2, X_3) = (3, 2, 1)$

の $3! = 6$ 通り存在します。

とみー
とみー

高校の時に登場した順列ですね!

つまり、一様分布 $\mathcal{U}_{[0, t]}$ に従う $n$ 個の確率変数の順序統計量 $X_{(\cdot)} = (X_{(1)}, \cdots, X_{(n)})$ の同時確率密度関数は

$ \begin{eqnarray} f_{X_{(\cdot)}} (t_1, \cdots, t_n) = \left\{ \begin{array}{l} \displaystyle \frac{n!}{t^n} \quad 0 \leq t_1 \leq \cdots \leq t_n \leq t \\ 0 \quad \mbox{その他} \end{array} \right. \end{eqnarray} $

となります。

順序統計量なので、$0 \leq t_1 \leq \cdots \leq t_n \leq t$ のような順番になることに注意しましょう。

先ほどの例を使うと、

$ \begin{eqnarray} f_{X_{(\cdot)}} (1, 2, 3) &=& f_X (1,2,3) + f_X (1,3,2) + f_X (2, 1, 3) + f_X (2, 3, 1) + f_X (3, 1, 2) + f_X (3, 2, 1) \\ &=& 6 \cdot f_X (1,2,3) \\ &=& \frac{3!}{t} \end{eqnarray} $

です。

ポアソン過程の到着時刻の確率分布

以上を踏まえて、一般($n = 2$ 以上)の場合でも、ポアソン過程の到着時刻が

一様分布に従う $n$ 個の確率変数の順序統計量と同じ分布を持つ

ことを示しましょう。

とみー
とみー

流れは $n=1$ の場合とそっくりです!

到着が発生する区間を仮定

ポアソン過程には、到着が同時に発生しないという性質があります。

そのため、到着時刻の関係は

$0 < Z_1 < \cdots < Z_n$

のように、不等式に等号(=)を含みません

したがって、すべての $i\in \{1, \cdots, n\}$ に対して、

$t_i \leq Z_i < t_i + h_i$

となる $0 < t_1 < \cdots < t_n$、$h_i > 0$ を取ることができます。

ポアソン過程到着区間
とみー
とみー

このとき、各区間 $[t_i, t_i+h_i)$ は重なりを持たないように取れることに注意しましょう。

状況を式にする

上の図の状況を式でまとめると、次のようになります($\forall i \in \{1, \cdots, n, n+1\}$)。

  • $[t_i, t_i + h_i)$ の到着数が1
    • $\Lambda(t_i + h_i) \;-\; \Lambda(t_i) = 1 \iff \Lambda(h_i) = 1 $
  • それ以外の区間の到着数が0
    • $\Lambda(t_i) \;–\; \Lambda(t_{i-1}+h_{i-1}) = 0 \iff \Lambda(t_i \;-\; t_{i-1}\;-\;h_{i-1}) = 0$

ただし、式を簡単にするために $t_0 = h_0= 0$、$t_{n+1} = t$ としています。

とみー
とみー

ここまでで、同時確率密度を求める準備ができました!

導出

導出

最後に式変形をしましょう。

$ \begin{eqnarray}\mathbb{P}(\forall i \in \{1, \cdots, n\}, t_i \leq Z_i < t_i + h_i | \Lambda(t) = n)  &=& \frac{\mathbb{P}(\forall i \in \{1, \cdots, n\}, t_i \leq Z_i < t_i + h_i), \Lambda(t) = n) }{\mathbb{P}(\Lambda(t) = n)} \\ &=& \frac{\mathbb{P}(\forall i \in \{1, \cdots, n\}, \Lambda(h_i) = 1, \Lambda(t_i \;-\; t_{i-1}\;-\;h_{i-1}) = 0) }{\mathbb{P}(\Lambda(t) = n)} \\ &=& \frac{\prod_{i=1}^{n+1} \mathbb{P}(\Lambda(h_i) = 1) \cdot \mathbb{P}(\Lambda(t_i \;-\; t_{i-1}\;-\;h_{i-1}) = 0)}{\mathbb{P}(\Lambda(t) = n)} \\ &=& \frac{\prod_{i=1}^{n+1} \lambda h_i e^{-\lambda h_i} \cdot e^{-\lambda (t_i \;-\; t_{i-1} \;-\; h_{i-1})}}{\frac{(\lambda t)^n e^{-\lambda t}}{n!}} \\ &=& \frac{n!}{t^n} h_1 \cdots h_n \end{eqnarray}$

両辺で、$\forall i \in \{1, \cdots, n\}, h_i \rightarrow 0$ とすると、

$\displaystyle f_Z (t_1, \cdots, t_n \;|\; \Lambda(t) = n) = \frac{n!}{t^n}$

これは、上で見た一様分布 $\mathcal{U}_{[0, t]}$ に従う $n$ 個の確率変数の順序統計量 $X_{(\cdot)} = (X_{(1)}, \cdots, X_{(n)})$ の同時確率密度関数です!

とみー
とみー

よって、導出完了です!

つまり、ポアソン過程の到着時刻は

一様分布に従う $n$ 個の確率変数の順序統計量と同じ分布を持つ

ことが示されました。

確率過程のおすすめ

まとめ

まとめ

今回は、ポアソン過程の到着時刻の確率過程を順序統計量を使って解説しました。

とみー
とみー

導出は少し複雑ですが、結果は一様分布と単純になることが重要です!

コメント

タイトルとURLをコピーしました