概率图模型从概率和图的角度重新审视
2023-10-16 06:07:35
人工智能技术作为当代科技创新研究的热点,不断取得新的突破和进展。而作为人工智能算法最为重要的领域之一,机器学习技术更是不断发展出新奇实用的算法供人们的使用。
相信朋友们都已经熟悉了大名鼎鼎的卷积神经网络、循环神经网络,或是数字处理领域的自然语言处理、图像识别等等,那么问题来了,这些算法的背后,或者说它们的基础技术是什么呢?
若要追根溯源,必然要提到概率图模型,也就是今天的主角。在机器学习当中,概率图模型作为一种生成模型,是其他算法的理论基础,它可以将复杂的变量关系表达为一个图的形式,利用概率分布和图的结构对数据进行建模,并通过条件概率和贝叶斯定理等知识对其进行推理和预测。
我们常说学习方法分为监督学习、无监督学习和强化学习三种。其实,这三种学习方法只是在不同情况下对数据挖掘的应用,或者说形式的不同。
从机器学习算法本质上而言,可以归结为两种算法形式:
- 判别式模型
- 生成式模型
判别式模型代表,如SVM支持向量机,本质上是一个分类器,它是基于已知样本数据构建一个分类规则,使其能够对新样本进行预测。
而生成式模型顾名思义,它是学习得到一个数据生成的过程,对数据的联合分布进行建模,进而对该分布进行采样产生新的数据。生成式算法的经典代表便是概率图模型,其中最具代表性的有朴素贝叶斯模型、隐马尔可夫模型、条件随机场、高斯混合模型等。
好了,科普到此结束。
概率图模型的应用场景非常广泛,包括:
- 自然语言处理
- 机器学习
- 图像处理
- 语音识别
- 生物信息学
- 经济学
- 金融学等领域
在开始学习概率图模型之前,我们先从两个方面对概率图模型做一下宏观认知。
1. 概率图模型的概念
概率图模型(Probabilistic Graphical Model,简称PGM),又称图形模型(Graphical Model),是一种用于表示概率分布的模型。
概率图模型由两部分组成:
- 图结构:用于表示变量之间的关系。
- 概率分布:用于量化变量之间的关系。
2. 概率图模型的类型
概率图模型有许多不同的类型,最常见的包括:
- 有向无环图模型(Directed Acyclic Graph,简称DAG) :图中所有边都是有向的,并且不存在环。
- 无向图模型(Undirected Graph) :图中所有边都是无向的。
- 马尔可夫随机场(Markov Random Field,简称MRF) :一种特殊的无向图模型,其中变量之间的关系是局部化的。
- 因子图(Factor Graph) :一种特殊的图模型,其中变量之间的关系是通过因子函数表示的。
- 贝叶斯网络(Bayesian Network) :一种特殊的概率图模型,其中变量之间的关系是通过贝叶斯定理表示的。
文章内涉及部分公式与手写版原稿资料已保存,可扫码关注公众号【AI机器学习与知识图谱】,回复: 概率图模型第一讲 即可获取。
好了,关于概率图模型的理论知识,我们先到这里。当然,我们并非止步于此,下一篇文章,我将会以更为实用的角度,向大家展示该模型的应用与落地场景。让我们一起期待。