どうも!初めましての方は初めまして、初心者のWebサイト勉強のとみーです!
再生過程には、再生過程と再生関数の極限に関する性質を示す基本再生定理(Elementary Renewal Theorem:ERT)という定理が存在します。
参考 再生過程の基礎については、こちらの記事をご覧ください。
参考 基本再生定理については、こちらの記事をご覧ください。
そして、再生過程を拡張した再生報酬過程にも似たような再生報酬定理(Renewal Reward Theorem:RRT)という定理があります。

そこで今回は、その再生報酬定理について解説します!
確率の基本的な知識がある方(高校数学〜大学入門)
イメージをしやすくするために、電車の駅に到着した客が購入する切符による売上を題材として
という風に変数を置きます。
図にすると、次のような感じです。
参考 再生報酬過程の基本や切符の売上の例の詳しい説明は、こちらの記事をご覧ください。
再生報酬定理(RRT)とは
再生報酬定理の導出・理解のために必要な
確率変数の概収束
についてはじめに押さえましょう。
確率変数の概収束(ほとんど確実に収束)

基本再生定理のときと同じなので、概収束が何かわかっている人はスキップしてOKです!
再生報酬定理は概収束を使った定理なので、概収束のイメージを掴んでおきましょう。
確率変数列
を満たすとき、
と表す。

概収束は、収束する確率が1という意味です。
再生報酬定理
再生報酬定理とは、再生報酬過程・再生報酬関数の極限に関する次の関係のことです。
すべての自然数
となる。
証明は結構複雑なので後回しにしましょう。

基本再生定理と同様に式の形と直感的な意味が理解できれば十分です。
再生報酬定理の直感的なイメージ
定理に登場する
の意味をまず整理しましょう。
その
単位時間あたりの報酬
を表しています。
単位時間とは、1秒や1分など時間を測る際の基準となる時間です。
十分長い時間が経った時の単位時間あたりの報酬
を表しています。
下の画像を見るとイメージがつかみやすいと思います。
1回の到着で
再生報酬過程の
は、十分に時間が経てば確かに単位時間あたりの報酬は

つまり、基本再生定理と同様に直感通りの結果になるというのが再生報酬定理①の主張です。
続いて、
その
単位時間あたりに見込まれる報酬
を表しています。

十分長い時間が経った時の単位時間あたりの見込み報酬
を表しています。
これが
が成り立ちます。
これは、十分に長い時間が経つと
が一致することを表しています。

つまり、「見込み」と「実際」が一致するというのがこの定理の主張です!
再生報酬定理のイメージはつかめたでしょうか?
以上で説明は終了です。ここからは証明になるので、興味がある方はじっくり読んでみましょう。
再生報酬定理①の証明
再生報酬定理①
の証明は、大数の強法則と基本再生定理を使うと簡単に行えます。
大数の強法則
独立同分布の確率変数列
が成り立つとき、
が成り立つ。
基本再生定理
2以上のすべての整数
となる。
詳しくは、「基本再生定理とは?導出から解釈までわかりやすく解説」の記事で解説しています。
証明
が成り立つ。
また、基本再生定理より
よって、
基本報酬定理②の証明
再生報酬定理②
の証明は、基本再生定理を使えば簡単です。
証明
まず、定理①のときと同様に基本再生定理から
が成り立つ。
また、
であるから、
コメント