數據挖掘貝葉斯分類

貝葉斯分類是根據 貝葉斯定理。貝葉斯分類器的統計分類。貝葉斯分類器是能夠預測類別成員概率,例如一個給定的元組屬於一個特定類的概率。

貝葉斯定理

托馬斯·貝葉斯後貝葉斯定理命名。有兩種類型的概率,如下所示:

  • 後驗概率 [P(H/X)]

  • 先驗概率 [P(H)]

其中,X是數據元組和H是一些假設。

根據貝葉斯定理

P(H/X)= P(X/H)P(H) / P(X)

貝葉斯信仰網絡

  • 貝葉斯信念網絡指定聯合條件概率分佈

  • 貝葉斯網絡和概率網絡被稱爲信念網絡。

  • 貝葉斯信念網絡允許類條件獨立的變量子集之間進行定義。

  • 貝葉斯信念網絡提供上學習可以進行因果關係的圖形模型。

我們可以利用受過訓練的貝葉斯網絡進行分類。以下是與該貝葉斯信仰也是已知的名稱:

  • 信念網絡

  • 貝葉斯網絡

  • 概率網絡

有兩個組成部分來定義貝葉斯信仰網絡:

  • 向無環圖

  • 一組條件概率表

向無環圖

  • 在有向無環圖中的每個節點代表一個隨機變量。

  • 這些變量可以是離散的或連續的重視。

  • 這些變量可以對應於數據給出實際的屬性。

向無環圖表示

下圖顯示了一個有向無環圖六布爾變量。

Acyclic

圖中的電弧使因果知識的表示。例如肺癌是肺癌的一個人的家族病史,以及影響的人是否是吸菸者。值得注意的是,該可變正X光不依賴於患者是否患有肺癌的家族史或者是吸菸者,因爲我們知道患者有肺癌。

設置條件概率表表示:

條件概率表變量LungCancer(LC),顯示它的父節點,家族史(FH)和吸菸者(S)的值的每一種可能的組合的值。

Probability