:将K—means算法引入到朴素贝叶斯分类研究中,提出一种基于K—means的朴素贝叶斯分类算法。首先用K— me.arks算法对原始数据集中的完整数据子集进行聚类,计算缺失数据子集中的每条记录与 个簇重心之间的相似度,把记 录赋给距离最近的一个簇,并用该簇相应的属性均值来填充记录的缺失值,然后用朴素贝叶斯分类算法对处理后的数据 集进行分类。实验结果表明,与朴素贝叶斯相比,基于K—means思想的朴素贝叶斯算法具有较高的分类准确率。