PR

【再生過程】スプレッドの極限分布とインスペクションパラドックス

【再生過程】スプレッドの極限分布とインスペクションパラドックス 再生過程
記事内に広告が含まれています。
スポンサーリンク

どうも!初めましての方は初めまして、初心者のWebサイト勉強のとみーです!

みなさんは、

自分が並ぶレジはいつも他のレジよりも待ち時間が長い気がする…

とか

なぜか混んでいる電車にばっか乗る気がする…

と感じたこと、ありませんか?

実は、

自分の待ち時間は平均よりも長くなる

というのは気のせいではなく、数学的に証明することができます。

とみー
とみー

そこで今回は、再生過程を用いてその仕組みを明らかにしていこうと思います!

対象レベル

確率の基本的な知識がある方(高校数学〜大学入門)

スポンサーリンク

スプレッドを考えるための再生過程

まずは、問題の設定を明らかにしておきましょう。

条件・設定

ここでは電車の到着を例に考え、以下のように変数を設定します。

  • Xnn1 本目の電車と n 本目の電車の到着間隔
  • Znn 本目の電車の到着時刻
  • M(t):時刻 t までに到着した電車の本数(再生過程

スプレッド X(t)

スプレッドは、

スプレッド

X(t)=XM(t)+1

で表される変数です。

スプレッド X(t) と到着間隔 {Xn} は異なるので注意しましょう!スプレッドは時刻 t の関数、到着間隔は数列です。

スプレッドは時刻 t を含む到着間隔の長さを表しますが、分かりやすくいうと

時刻 t に到着した客が観測する到着間隔

です。

とみー
とみー

そのため、X(t) の確率分布がわかればどの到着間隔に遭遇しやすいかが分かります!

そこで、

P(X(t)x)

x は任意の定数)を求めることが目標になります。

しかし、これを求めるにはテクニックが必要なので、一旦次のような再生報酬過程を考えます。

スポンサーリンク

スプレッドを考えるための再生報酬過程

報酬の導入

求めたいのは

P(X(t)x)

なので、次のような報酬を考えます。

報酬

I{X(t)x}(t)={1X(t)x0X(t)>x

これは、スプレッドが x 以下となるような時刻 t に客が到着できたら+1の報酬がもらえることを表しています。

とみー
とみー

言い換えると、x 未満の長さの区間で+1の報酬が発生します。

累積報酬 C(t)(再生報酬過程)

報酬 I{X(t)x} の表現を使うと、再生報酬過程(累積報酬)は次のように表されます。

再生報酬過程

C(t)=0tI{X(u)x}du

とみー
とみー

時刻 t と紛らわしいので、積分変数は u としています。

X(t)x のときに報酬が1発生するので、累積報酬の傾きは1になります。

とみー
とみー

電車の到着時刻 {Zn} とは関係なく報酬が変化するので、これは部分報酬モデルです。

ちなみに、この C(t)X(t)x となる時間の総和、つまり

時刻 t までの長さ x 以下の到着間隔の総和

を表しています。

再生報酬関数 c(t)

再生報酬過程において、c(t)=E[C(t)]再生報酬関数といいます。

今回の例では、

時刻 t までに長さ x 以下の到着間隔がどれくらいあると見込めるか

を表します。

C(t)=0tI{X(t)x}(t)dt を代入して計算を行うと

再生報酬関数

c(t)=0tP(X(u)x)du

が得られます。

とみー
とみー

時刻 t と紛らわしいので、ここでも積分変数は u としています。

c(t)=E[C(t)]=E[0tI{X(u)x}(u)du]=0tE[I{X(u)x}(u)]du

ここで、I{X(u)x}

  • X(u)x のとき1
  • X(u)>x のとき0

なので、

E[I{X(u)x}(u)]=1P(X(u)x)+0P(X(u)>x)=P(X(u)x)

である。

よって

c(t)=0tP(X(u)x)du

部分報酬 {Rn}

部分報酬モデルの考え方にしたがって、時刻 Zn の累積報酬と時刻 Zn1 の累積報酬の差を部分報酬 Rn とすると、

部分報酬

nN,Rn={XnXnx0Xn>x

となります。

スポンサーリンク

再生報酬定理

ここまでで再生報酬過程が定義できたので、再生報酬定理を適用します。

再生報酬定理

すべての自然数 n に対し、E[Xn]=1μ<,V[Xn]<E[Rn]< が成り立つとき、

limtc(t)t=μE[Rn]

となる。

とみー
とみー

途中の式変形で登場するので、部分報酬の期待値だけ最初に確認しておきましょう。

部分報酬 {Rn} の期待値 E[Rn]

計算を行うと、{Rn} の期待値は

E[Rn]=xFX(x)0xFX(u)du

であることが求められます。

部分積分を使うと

0P(Rn>u)du=[uP(Rn>u)]00uuP(Rn>u)du=00uu(1P(Rnu))du=0uu(1FR(u))du=0u(fR(u))du=0ufR(u)du=E[Rn]

となる。

定義より Rnx なので、

0P(Rn>u)du=0xP(Rn>u)du

0<u<x のとき、

Rn>uu<Xnx

だから

0xP(Rn>u)dx=0xP(u<Xnx)du=0x(FX(x)FX(u))du=xFX(x)0xFX(u)du

再生報酬定理の適用

上で求めた c(t) の表現を使うと、

c(t)t=1t0tP(X(u)x)du

なので、再生報酬定理を適用すると

limt1t0tP(X(u)x)du=μ(xFX(x)0xFX(u)du)

となります。

とみー
とみー

これは後で式変形のために使うので、どういう意味かは置いておきましょう。

スプレッドの分布-客の到着が一様分布

さて、ここまでの話は客の到着時間に関して何も仮定していませんでした。

とみー
とみー

要するに、到着時間がどんな確率分布にしたがっていても成り立ちます。

ここからは、話をさらに深めていくために客が時刻 0 から t の間でランダムに到着するとしましょう。

つまり、客の到着時間を U としたときに、

U は一様分布 U[0,t] にしたがう

と仮定します。

このとき、確率密度関数は

fU(u)={1tu[0,t]0u[0,t]

です。

スプレッドの確率分布

客の到着時間が一様分布にしたがうとき、スプレッドの累積分布関数は

P(X(U)x)=0P(X(u)x)fU(u)du

です。

とみー
とみー

これは累積分布関数を確率密度関数で表しただけです。

確率密度関数 fU を代入すると

P(X(U)x)=1t0tP(X(u)x)du

となります。

とみー
とみー

これは先ほど上で見た c(t)t に他なりません!

スプレッドの極限分布

P(X(U)x)c(t)t が同じということは、先ほどの再生報酬定理の結果が使えるので

limtP(X(U)x)=μ(xFX(x)0xFX(u)du)

が成り立ちます。

この式の右辺は x についての関数と見ることができるので、ここで

Fs(x)=μ(xFX(x)0xFX(u)du)

としましょう。

すると、Fs(y)

x についての累積分布関数

になっています。

Fs が累積分布関数であることを示すためには、

  • 非減少
  • limxFs(x)=1

の2つを確かめればOKです。

まず、x1<x2 とすると、

Fs(x2)Fs(x1)=μ(x2FX(x2)0x2FX(u)du)μ(x1FX(x1)0x1FX(u)du)=μ(x2FX(x2)x1FX(x1)0x1FX(u)dux1x2FX(u)du+0x1FX(u)du)=μ(x2FX(x2)x1FX(x1)x1x2FX(u)du)=μ([uFX(u)]x1x2x1x2FX(u)du)=μ(x1x2(FX(u)+ufX(u))dux1x2FX(u)du)=μx1x2ufX(u)du>0

よって、Fx は非減少。

また、x1=0,x2= とすると、

Fs()Fs(0)= μ0ufX(u)duFs()= μ0ufX(u)du=1E[Xn]E[Xn]du=1

なので、limxFs(x)=1

とみー
とみー

よって、スプレッドの極限分布は次のようになります。

スプレッドの極限分布
  • 累積分布Fs(x)=μ(xFX(x)0xFX(u)du)
  • 確率密度fs(x)=μxfX(x)

ここまでで、必要な式はすべて揃いました。

とみー
とみー

それでは解釈をしていきましょう!

インスペクションパラドックス

スプレッドの極限分布の確率密度関数

fs(x)=μxfX(x)

に注目すると、

fsx に比例する

ことが分かります。

とみー
とみー

そして、fs(x)ランダムに到着した客が観測する到着間隔が x となる確率です。

直感的には

客はランダムに到着するので観測される到着間隔もランダムになるはず

と思われますが、この結果が示しているのは

到着間隔が長ければ長いほど遭遇しやすい

ということです。

直感に反するこの現象は、インスペクションパラドックスと呼ばれます。

とみー
とみー

本来ならランダムである到着間隔のうち、長間隔の部分を優先的に選んでしまうという意味で、サンプリングにバイアスがかかるとも言われます。

まとめ

とみー
とみー

今回は、再生過程に関連するインスペクションパラドックスについて解説しました。

今回は

  • 横軸:時間
  • Xnn1 本目のバスと n 本目のバスの到着間隔

としましたが、これを

  • 横軸:合計乗客人数
  • Xnn 本目のバスの乗客人数

として同じように議論をすると、

混んでいるバスほど遭遇しやすい

という結論が導かれます。

確率過程のおすすめ
スポンサーリンク

コメント

タイトルとURLをコピーしました