PR

斉時的なマルコフ連鎖の性質-推移確率・状態確率をわかりやすく

斉時的なマルコフ連鎖の性質-推移確率・状態確率をわかりやすく 確率過程
記事内に広告が含まれています。
スポンサーリンク

どうも!初めましての方は初めまして、初心者のWebサイト勉強のとみーです!

マルコフ連鎖を考えるときは、斉時的なマルコフ連鎖を仮定して話を進めることが多いです。

とみー
とみー

そこで今回は、斉時的なマルコフ連鎖の性質と関連してよく用いられる推移確率についてまとめました!

対象レベル

確率の基本的な知識がある方(高校数学〜大学入門)

以下では、斉時的なマルコフ連鎖を

{Xn}n0

とし、状態空間(各確率変数の取り得る値の集まり)を

E={i0,,in,j}

とします(n0)。

スポンサーリンク

推移確率とは

定義

斉時的なマルコフ連鎖は、定義から

P(Xn+1=j|Xn=i)=P(Xn=j|Xn1=i)=P(X2=j|X1=i)=P(X1=j|X0=i)

を満たし、状態 i から状態 j へ遷移する確率は時刻 n には無関係です。

そのため、状態 i から状態 j へ遷移する確率は

pijij だけの関数)

と書くことができます。

これを、状態 i から状態 j への遷移確率といいます。

具体例

例えば、画像のようなすごろくを考えましょう。

すごろくはサイコロの目をもとに何マス先に進むかが決まるので、例えばマス1→マス2となる推移確率は、

p12=P(1が出る確率)=16

となります。

スポンサーリンク

推移確率行列とは

推移確率は、ある状態から次の状態へ遷移する確率なので、状態の数が N のとき推移確率は N2 個存在します。

定義

すべての推移確率を行列の形に表したものを、推移確率行列といいます。

数式で書くと

P=(pij)

です。

具体例

先ほどのすごろくの例に戻りましょう。

すごろくのマスは9箇所あるので、推移確率は81個あり、推移確率行列は 9×9 です。

P=[p11p12p13p14p15p16p17p18p19p21p22p23p24p25p26p27p28p29p31p32p33p34p35p36p37p38p39p41p42p43p44p45p46p47p48p49p51p52p53p54p55p56p57p58p59p61p62p63p64p65p66p67p68p69p71p72p73p74p75p76p77p78p79p81p82p83p84p85p86p87p88p89p91p92p93p94p95p96p97p98p99]=[016161616161600001616161616160000161616161616160001616161616161600016161616161616000161616161616160001616161616161600016161616161616000]

スポンサーリンク

状態確率とは

推移確率は、ある状態から次の状態へ遷移する確率でしたが、場合によっては

時刻 n で状態 i にいる確率

を求めたい場合があります。

とみー
とみー

上のすごろくの例で言えば、サイコロを2回振ってゴールする(マス9に辿り着く)確率、といった感じです。

この「時刻 n で状態 i にいる確率」を状態確率といいます。

数式

数式では、次のように書きます。

pi(n)=P(Xn=i)

右下の添字は状態、右上の添字は時刻(回数)を表しています。

状態確率ベクトル

ある時刻 n における状態確率は、状態の数だけ存在します。

そこで、すべての状態に関する状態確率をベクトルの形でまとめたものを状態確率ベクトルといいます。

状態の数が N 個のとき、数式では

p(n)=[pi1(n),,piN(n)]

のようになります。

とみー
とみー

具体例は、次の性質を通してご紹介します。

専門性を活かした就活で差をつけよう!

確率や統計の専門性は理系の就活でかなり優位に働きます。

そのため、エンジニア就活特化のプラットフォームを使えば他では見られない高待遇な就職先が見つかります!

特徴 リンク
UZUZ理系
  • 内定率 86% 以上!
  • ブラック企業徹底排除
  • 機械・電気電子・情報系は特に求人多数
【UZUZ】
エンジニア就活
  • 未経験から即戦力まで幅広く対応
  • IT企業特化の企業研究・就活コラム
  • 企業から直接スカウトも!
【エンジニア就活】
レバテックルーキー
  • 書類通過率 90% 以上
  • プログラミング経験者限定のハイクラス求人
  • 新卒年収 500 万円以上の求人も!
レバテックルーキー

経験不足で大丈夫かな…という方はプログラミングスクールでスキルアップしておくとバッチリです。

特徴 リンク
エンジニアズゲート
  • 完全無料のプログラミングスクール!
  • 95% 超えの就職率
  • 専任のキャリアアドバイザーがサポート
エンジニアズゲート
TechAcademy
  • Web 制作・アプリ開発・AI など幅広いコース
  • 学割あり
  • 初心者からでも副業できるレベルのスキルが身に付く!
テックアカデミー無料体験
とみー
とみー

エンジニアズゲート は特に完全無料なので検討の余地ありです!

斉時的なマルコフ連鎖の性質

斉時的なマルコフ連鎖の

  1. 状態確率ベクトル
  2. 遷移確率行列

には、次の関係式が成り立ちます。

公式

公式

p(n)=p(n1)P=p(0)Pn

これは、初期状態の状態確率ベクトルと遷移確率行列がわかれば、任意の時間の状態確率ベクトルが求められるという公式です。

ベイズの定理より、

P(X1=i1)=i0P(X0=i0,X1=i1)=i0P(X0=i0)P(X1=i1|X0=i0)

遷移確率、状態確率を使って書き直すと

pi1(1)=i0pi0(0)pi0i1

これを状態の数だけ考えると、次のような行列に関する等式になる。

[pi0(1)piN(1)]=[pi0(0)piN(0)][pi0i0pi0iNpiNi0piNiN]

よって

p(1)=p(0)P

で、再帰的に

p(n)=p(n1)P=p(0)Pn

公式の適用-具体例

すごろくの例を続けましょう。

スタート地点がマス1なので、n=0 における状態確率ベクトルは

p(0)=[100000000]

です。

公式を使うと、

p(1)=p(0)P=[100000000][016161616161600001616161616160000161616161616160001616161616161600016161616161616000161616161616160001616161616161600016161616161616000]=[016161616161600]

同様の計算をもう1度行うと

p(2)=p(1)P=[191121121121121953616536]

よって、2回でゴールに辿り着く確率は 536 ということが求められました。

確率過程のおすすめ

まとめ

今回は、確率過程のマルコフ連鎖についてご紹介しました。

スポンサーリンク

コメント

タイトルとURLをコピーしました