どうも!初めましての方は初めまして、初心者のWebサイト勉強のとみーです!
ポアソン過程は、
ある時刻までに希少現象が発生した回数の総和
をモデル化できる確率過程で、待ち行列理論でよく用いられます。
参考 ポアソン過程の基礎については、こちらでわかりやすくまとめています。
ポアソン過程には、重要な性質がいくつかあります。
今回は、そんなポアソン過程の到着時刻の確率分布を、順序統計量という値を用いてまとめました!
簡単にいうと
到着時刻が一様分布に従う
という性質をご紹介します。
順序統計量とは
具体的な性質の話に入る前に、そもそも順序統計量とは何かを理解しましょう。
順序統計量の定義
要するに、元の数列を小さい順に並び替えたものです。
そのため、次のような関係が成り立ちます。
$X_{(1)}$ が一番小さく、$X_{(n)}$ が一番大きいという意味ですね。
順序統計量の具体例
例えば、$(X_1, X_2, X_3) = (3, 2, 5)$ という数列 $\{X_i\}_{i=\{1, 2, 3\}}$ を考えましょう。
この数列を小さい順に並び替えると
$(2, 3, 5)$
になりますよね。
よって、
$(X_{(1)}, X_{(2)}, X_{(3)}) = (2, 3, 5)$
となります。
元の数列と比較すると、
です。
記号がごちゃっとしていますが、小さい順に並び替えているだけです!
ポアソン過程の到着時刻は一様分布の順序統計と同じ分布
順序統計量がわかったところで、早速ポアソン過程の話にいきましょう。
ここでは、ポアソン過程を $\Lambda(t)$ と表し、$i$ 回目の到着時刻を $Z_i$ のように表します。
簡単に触れておくと、$\Lambda(t)$ は時刻 $t$ までの到着数を表します。
文字やグラフの意味がわからない方は、ポアソン分布の基礎についてまとめたこちらをご覧ください。
ポアソン過程 $\Lambda (t)$ と順序統計量の間には、次のような関係が成り立ちます。
$\Lambda(t)=n$ の意味
$\Lambda(t)$ は時刻 $t$ までの到着数を表すので、
$\Lambda(t)=n$
は、時刻 $t$ までの到着数を $n$ とおく、という意味です。
到着時刻 $(Z_1, Z_2, \cdots, Z_n)$ について
$Z_1$ は1回目の到着時刻、$Z_2$ は2回目の到着時刻、…と定義したので、
$0<Z_1<Z_2< \cdots < Z_n$
よって
$(Z_1, Z_2, \cdots, Z_n)$ はそれ自身が順序統計量
となっています。
数式で書くと、
$\forall i \in \{1, \cdots, n\}, \; Z_{(i)} = Z_i$
つまり、
のように、添字が完全に一致しているということです。
ざっくりとした定理のイメージ
この定理は、すごくざっくり言うとポアソン過程の
到着時刻の確率分布がわかる定理
です。
ちなみに、到着間隔を $\{X_i\}$ とすると、再生過程との関連から到着間隔の確率分布を求めることができます。
今回の話に到着間隔 $\{X_i\}$ は出てきませんが、重要な性質なので興味がある方はこちらのページも併せてご覧ください。
直感的でわかりやすい定理のイメージ
ポアソン過程には、独立増分性と定常増分性という2つの性質があります。
ここでは、簡単のために $n=1$ のケースを考えてみましょう。
$n=1$ を例に考える
$n=1$ ということは、時刻 $t$ までに到着が1回しかなかったことを意味します。
ここで、区間 $[0, t)$ を同じ長さの小区間に分割すると、次の図のようになります。
それぞれの区間は互いに重なりを持たず(独立増分)、区間の長さがすべて同じ (定常増分)なので、
どの区間でも到着が発生する確率は同じ
ということが直感的に理解できると思います。
「どの区間も同じ→一様分布」という予測が立ちます!
数式で確認してみる
このことは、数式で簡単に確認することができます。
とすると、$t_1 \leq Z_1 < t_1 + h_1$ は到着が区間 $[t_1, t_1 + h_1)$ で発生したことを表します。
区間 $[t_1, t_1 + h_1)$ の到着数は $\Lambda(t_1 + h_1) \;-\; \Lambda(t_1)$ と表されますが、定常増分性から $\Lambda(h_1)$ と同じ確率分布に従うことがわかります。
また、今は区間 $[0, t)$ で到着が1回しかない状況を考えているので、$[t_1, t_1 + h_1)$ 以外の区間の到着数は0です。
これらをまとめると、
となります。
よって、
$ \begin{eqnarray} \mathbb{P}(t_1 \leq Z_1 < t_1 + h_1 | \Lambda(t) = 1) &=& \frac{\mathbb{P}(t_1 \leq Z_1 < t_1 + h_1, \Lambda(t) = 1)}{\mathbb{P}(\Lambda(t) = 1)} \\ &=& \frac{\mathbb{P}(\Lambda(h_1) = 1, \Lambda(t_1) = 0, \Lambda(t \;-\; t_1 \;-\; h_1) = 0)}{\mathbb{P}(\Lambda(t) = 1)} \\ &=& \frac{\mathbb{P}(\Lambda(h_1) = 1) \cdot \mathbb{P}(\Lambda(t_1) = 0) \cdot \mathbb{P}(\Lambda(t \;-\; t_1 \;-\; h_1) = 0)}{\mathbb{P}(\Lambda(t) = 1)} \\ &=& \frac{\lambda h_1 e^{-\lambda h_1} \cdot e^{-\lambda t_1} \cdot e^{–\lambda (t \;-\; t_1 \;-\; h_1)} }{\lambda t e^{-\lambda t} } \\ &=& \frac{h_1}{t} \end{eqnarray} $
$\lambda > 0$ はポアソン過程のパラメータです。
ここで、両辺を $h_1$ で割り $h_1 \rightarrow 0$ とすると、
$f_{Z_1} (t_1\,|\, \Lambda(t) = 1) = \displaystyle \frac{1}{t}$
これは、一様分布の確率密度関数に他なりません。
先ほどの直感が数式で確かめられました!
$n$ が2以上の場合
これまでは $n=1$ の例を見てきましたが、上の定理は $n=2$ 以上の場合でも成り立ちます。
これを導いていくために、一様分布に従う多変数の同時確率分布を確認しておきましょう。
一様分布に従う $n$ 変数の同時確率密度
$n$ 個の確率変数 $X_1, X_2, \cdots, X_n$ が一様分布 $\mathcal{U}_{[0, t]}$ に従うとします。
確率密度関数は、次のように表されます。
$\displaystyle \forall i \in \{1, \cdots, n\},\; f_{X_i} (t_i) = \frac{1}{t}$
$n$ 変数の同時確率密度関数
このとき、$X = (X_1, \cdots, X_n)$ の同時確率密度関数は
$ \begin{eqnarray} f_{X} (t_1, \cdots, t_n) = \left\{ \begin{array}{l} \displaystyle \frac{1}{t^n} \quad \forall i \in \{1, \cdots, n\}, t_i \in [0, t] \\ 0 \quad \mbox{その他} \end{array} \right. \end{eqnarray} $
となります。
それぞれの確率密度関数が $\frac{1}{t}$ で、変数が $n$ 個なので当たり前ですね。
順序統計量の同時確率密度関数
$(X_{(1)}, \cdots, X_{(n)}) = (x_1, \cdots, x_n)$ のとき、元の $(X_1, \cdots, X_n)$ の組み合わせは $n!$ 個存在します。
例えば $(X_{(1)}, X_{(2)}, X_{(3)}) = (1, 2, 3)$ の場合、
の $3! = 6$ 通り存在します。
高校の時に登場した順列ですね!
つまり、一様分布 $\mathcal{U}_{[0, t]}$ に従う $n$ 個の確率変数の順序統計量 $X_{(\cdot)} = (X_{(1)}, \cdots, X_{(n)})$ の同時確率密度関数は
$ \begin{eqnarray} f_{X_{(\cdot)}} (t_1, \cdots, t_n) = \left\{ \begin{array}{l} \displaystyle \frac{n!}{t^n} \quad 0 \leq t_1 \leq \cdots \leq t_n \leq t \\ 0 \quad \mbox{その他} \end{array} \right. \end{eqnarray} $
となります。
先ほどの例を使うと、
$ \begin{eqnarray} f_{X_{(\cdot)}} (1, 2, 3) &=& f_X (1,2,3) + f_X (1,3,2) + f_X (2, 1, 3) + f_X (2, 3, 1) + f_X (3, 1, 2) + f_X (3, 2, 1) \\ &=& 6 \cdot f_X (1,2,3) \\ &=& \frac{3!}{t} \end{eqnarray} $
です。
ポアソン過程の到着時刻の確率分布
以上を踏まえて、一般($n = 2$ 以上)の場合でも、ポアソン過程の到着時刻が
一様分布に従う $n$ 個の確率変数の順序統計量と同じ分布を持つ
ことを示しましょう。
流れは $n=1$ の場合とそっくりです!
到着が発生する区間を仮定
ポアソン過程には、到着が同時に発生しないという性質があります。
そのため、到着時刻の関係は
$0 < Z_1 < \cdots < Z_n$
のように、不等式に等号(=)を含みません。
したがって、すべての $i\in \{1, \cdots, n\}$ に対して、
$t_i \leq Z_i < t_i + h_i$
となる $0 < t_1 < \cdots < t_n$、$h_i > 0$ を取ることができます。
このとき、各区間 $[t_i, t_i+h_i)$ は重なりを持たないように取れることに注意しましょう。
状況を式にする
上の図の状況を式でまとめると、次のようになります($\forall i \in \{1, \cdots, n, n+1\}$)。
ここまでで、同時確率密度を求める準備ができました!
導出
最後に式変形をしましょう。
$ \begin{eqnarray}\mathbb{P}(\forall i \in \{1, \cdots, n\}, t_i \leq Z_i < t_i + h_i | \Lambda(t) = n) &=& \frac{\mathbb{P}(\forall i \in \{1, \cdots, n\}, t_i \leq Z_i < t_i + h_i), \Lambda(t) = n) }{\mathbb{P}(\Lambda(t) = n)} \\ &=& \frac{\mathbb{P}(\forall i \in \{1, \cdots, n\}, \Lambda(h_i) = 1, \Lambda(t_i \;-\; t_{i-1}\;-\;h_{i-1}) = 0) }{\mathbb{P}(\Lambda(t) = n)} \\ &=& \frac{\prod_{i=1}^{n+1} \mathbb{P}(\Lambda(h_i) = 1) \cdot \mathbb{P}(\Lambda(t_i \;-\; t_{i-1}\;-\;h_{i-1}) = 0)}{\mathbb{P}(\Lambda(t) = n)} \\ &=& \frac{\prod_{i=1}^{n+1} \lambda h_i e^{-\lambda h_i} \cdot e^{-\lambda (t_i \;-\; t_{i-1} \;-\; h_{i-1})}}{\frac{(\lambda t)^n e^{-\lambda t}}{n!}} \\ &=& \frac{n!}{t^n} h_1 \cdots h_n \end{eqnarray}$
両辺で、$\forall i \in \{1, \cdots, n\}, h_i \rightarrow 0$ とすると、
$\displaystyle f_Z (t_1, \cdots, t_n \;|\; \Lambda(t) = n) = \frac{n!}{t^n}$
これは、上で見た一様分布 $\mathcal{U}_{[0, t]}$ に従う $n$ 個の確率変数の順序統計量 $X_{(\cdot)} = (X_{(1)}, \cdots, X_{(n)})$ の同時確率密度関数です!
よって、導出完了です!
つまり、ポアソン過程の到着時刻は
一様分布に従う $n$ 個の確率変数の順序統計量と同じ分布を持つ
ことが示されました。
まとめ
今回は、ポアソン過程の到着時刻の確率過程を順序統計量を使って解説しました。
導出は少し複雑ですが、結果は一様分布と単純になることが重要です!
コメント
Awesome! Its genuinely remarkable post, I have got much clear idea regarding from this post