# Naive Bayes Classifiers ##### tags: `python` `data mining` --- ## 對於單純貝式機率模型 我不認為能夠用來分析那些非高斯分布的大型資料,因為這方式主要是能夠在這些該有的屬性中找到關聯性,藉此對於這些資料進行分類並盡可能找出他們該有的分類 關於程式部分,我們先對資料根據類別分類,然後計算每個分類屬性的均值和變異數。首先,先計算出ABC類的均質,並計算出ABC類的標準差,將常態分佈給計算出來 但基本上150個訓練樣本對高斯單純貝式機率模型來說,其實是很足夠的了,但我覺得像是這麼少的訓練樣本應該要用更適合少訓練樣本的模型訓練會更好 而要是遇到大量樣本的資料,就適合使用離散化連續數值的方法,這會使訓練結果更精確