模拟马尔可夫链

模拟马尔可夫链,第1张

蒙特卡罗(Monte Carlo)是世界著名的[赌城],是摩纳哥的标志。富丽堂皇的蒙地卡罗赌场,建于一八六三年,是一幢古色古香以及巍峨的宫殿式建筑物,再加上山明水秀,使游客抵达门前,立即发生好感。门前有一大片广场,是一个花圃,一草一木都修剪整齐,鲜花盛放,七彩缤纷,园旁有一停车场,园尽处一间宫殿式的建筑便是闻名世界的蒙地卡罗赌场了。登台阶入门,站着警卫把守。照摩纳哥法律,本国人不准入内赌博,观光客自然欢迎,然后凭护照交十法朗便成为[一日]的[会员],凭此证才能进入赌场。场内气派堂皇,墙上的装饰与帷幕,加上白天也亮的钻石般闪烁的水晶灯,满铺的红地毯烘托着,穿着整齐礼服的侍者,气氛上是不同凡响。内有适合歌剧表演的大舞台,再过一道门进入一间大厅,便是著名的赌场了。

赌场几乎等于是蒙特罗的小缩影,不管您赌不赌博,如果来到蒙特卡罗没到赌场走一遭,或者试一下手气,那可真是有入宝山空手而返的感觉。只要下点小赌注,看桌上筹码搬家的声音,想像着财富不知几时会向您面前推过来,那种经验和感觉,就值得日后向儿孙辈夸上老半天了。

蒙特卡罗赌场以轮盘为主,现在虽加入其他赌具,但轮盘赌仍最受人欢迎。它受欢迎的理由之一,是赌客有较多获胜机会。这里的轮盘和其他赌场里稍有不同:这里的轮盘赌只有一个零(庄家统吃)而其他地方则有两个零。蒙特卡罗现有轮盘赌十八桌,每个轮盘上有卅七孔(卅六个数字加上零),可容纳小象牙球的落入。赌客们可以在任何数字上下注,如果胜了,庄家付出卅五倍的钱。也可以赌单数或双数,红格或黑格(每一个孔的颜色是红黑相间的),如果下这一类的注,胜了可得与财相同的钱,不过获胜的机会是一比一的。零点的颜色是绿的,要是出了这个数,庄家除了赔系在零字上的赌注外,其他台上各门统吃。单只这个零点便给庄家带来百分之二点七的获胜机会,虽然不多,但已足够维持赌场的开支与盈利了

F1赛事中历史最悠久的就是摩纳哥大奖赛。自1950 年F1大赛在这里问世以来,风景优美的蒙特卡洛城街道已经49次作为F1大奖赛的赛道。这里没有看台,有居民甚至自豪地说,他是站在自己家的阳台上观看比赛的。这里平时是街道,等到正式比赛才加上防护墙,组成了临时赛道。正是这样的原因,这条赛道自1950 年以来几乎没有做过改动。

“这是一条一点错误都不能有的赛道。”舒马赫指出:“对赛车的调教必须十分小心,以应付赛道的每一种特点。我的经验是稳定性在摩纳哥是最为重要的一个方面。”驾驭马力强大的F1赛车78次穿越狭窄的街道完成这站比赛对车手来说确实是一次充满刺激的挑战。难怪有人将摩纳哥大奖赛称为F1“王冠上的明珠”,在这里夺得冠军的车手无意中也会被车迷们“看高”一个档次

现在在学术上称一种随机现象为蒙特卡罗现象

马尔可夫链:过程在 时刻所处状态条件与过程在时刻 之前所出的状态无关。(在已经知道“现在”的条件下,其“将来”与“过去”无关)

数学表达为:

Bob和Alice是一对好朋友,Bob的心情与天气有关,如果天气很好为 sunny,记为S ,Bob一般是处于 happy,记为H 状态的,如果天气是 rain,记为R ,Bob的心情一般是处于 grumpy,记为G 状态的。 Alice呢,是一个很细心很会观察的女孩,收集了14天以来 天气情况 ,以及Bob15天的 心情

统计图中状态转换对应的数量:

统计图中状态转换对应的数量:

绘制了下面这张图。

图3-1中的几个概率值称为 transition probabilities

图3-2中的几个概率值称为 emission probabilities

在[图2. Bob心情与天气对应关系]中,晴天有十天,雨天有五天,在Bob没有任何信息提示的情况下,晴天所占比例为 ,雨天所占比例为 。所以第一问题的答案为有 的可能性是晴天, 的可能性是雨天。

其实这是一个贝叶斯问题:

已知

, ,

, ,

, ,

,

求 与 的概率。

连续三天,共有 中可能:

以第3种情况为例:

这样分别计算8中情况,取概率最大的

考虑了六天,那么总共有 种可能性,每增加一天,考虑的可能性是呈指数上升的,在这里,需要借助 动态规划 的思想。

Alice根据Bob心情预测天气的例子就是问题3——预测问题。

通过一道简单例题说明:

分为以下几个步骤:

在 时刻,红球的概率为

在 时刻,3个盒子转移到不同盒子的概率以及生成白球的概率如下表所示。

完整过程如下:

代表,在 时刻,在盒子1是红球的条件的情况下,观测序列是:白,红2(第二颗红球)的概率。

在 时刻

在 时刻

每一个盒子的概率和的意义为:该盒子是白球的条件下,观测序列为[红球]的概率

给定模型参数 和观测 ,在时刻 处于状态 的概率记为:

在学习算法中,分为 监督学习 非监督学习

当训练集中包括了 观测序列 状态序列 时,可采用监督学习的方法对参数值进行估计。

本文第3节“隐马尔科夫的科学推导” 之“3.1 基本概念” 中“隐马尔可夫模型的形式定义”下方的Bob心情与天气的例子。

当训练集仅包括 观测序列 ,目标是学习估计马尔科夫的参数(状态转移矩阵,观测概率矩阵以及初始概率)

此时,将观测序列看做是观测数据 ,状态序列看做是隐变量 借助 EM模型 即可求解。

具体例子见本文2.3节:Viterbi 算法

马尔可夫过程(Markov process)是一类随机过程。它的原始模型马尔可夫链,由俄国数学家A.A.马尔可夫于1907年提出。该过程具有如下特性:在已知目前状态 (现在)的条件下,它未来的演变 (将来)不依赖于它以往的演变 ( 过去 ) 。 例如森林中动物头数的变化构成——马尔可夫过程 。在现实世界中,有很多过程都是马尔可夫过程,如液体中微粒所作的布朗运动、传染病受感染的人数、车站的候车人数等,都可视为马尔可夫过程。关于该过程的研究,1931年A.H.柯尔莫哥洛夫在《概率论的解析方法》一文中首先将微分方程等分析的方法用于这类过程,奠定了马尔可夫过程的理论基础。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/yw/12199537.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-21
下一篇2023-05-21

发表评论

登录后才能评论

评论列表(0条)

    保存