2024年6月14日发(作者:)

朴素贝叶斯分类原理

朴素贝叶斯(NaiveBayes)分类法是一种用来建立分类模型的算

法,它基于贝叶斯定理和特征条件独立假设(即“naive”),其基本

思想是:对实例进行分类时,首先基于已知的训练数据集,求出每个

类别的先验概率以及每个特征条件下各个类别的条件概率,然后将这

些概率应用到预测数据中,基于求出的后验概率最大的类别来预测

2017 年 9 月发生可能性最大的类别.

贝叶斯定理是概率论的基础,它公式为:

P(A|B)=P(B|A)*P(A)/P(B),其中:P(A|B)表示“B已发生的条件下A

发生的概率”;P(B|A)表示“A已发生的条件下B发生的概率”;P(A)

表示“A发生的概率”;P(B)表示“B发生的概率”.

朴素贝叶斯分类法的一般过程如下:

1.计算训练数据集中每个类别的先验概率P(Ci)。

2.对每个特征Xi,计算训练数据集中每个类别Ci 中Xi取各种

值的条件概率P(Xi|Ci)。

3.对于给定的观测数据,利用上述公式计算出每个类别Ci 的后

验概率P(Ci|X)。

4.由后验概率最大的类别作为给定数据的分类结果。

二、朴素贝叶斯分类原理的优缺点

朴素贝叶斯分类法的优点:

1.朴素贝叶斯分类法是一种简单高效的贝叶斯算法,它易于理解

和实现;

- 1 -

2.朴素贝叶斯分类法在处理分类问题时,只需要一些假设即可,

而不需要大量训练数据;

3.朴素贝叶斯分类法可以处理多类别分类中的一些关联特征;

4.朴素贝叶斯分类法算法比较方便,不需要做特征选择。

朴素贝叶斯分类法的缺点:

1.朴素贝叶斯分类法假设特征之间相互独立,这个假设在实际应

用中往往难以成立;

2.朴素贝叶斯分类法需要计算先验概率,而在某些时候先验概率

可能困难获取;

3.由于朴素贝叶斯分类法是基于概率模型,而概率模型运行的效

率是较低的。

- 2 -