Python 实战：用朴素贝叶斯算法实现邮件分类及效果评估

以下是一个使用 Python 实现朴素贝叶斯算法进行邮件分类的简单示例代码： ```python from sklearn.naive_bayes import MultinomialNB from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 假设我们有邮件文本数据和对应的类别标签 emails = ["这是一封垃圾邮件", "这是正常邮件", "又是垃圾邮件", "正常的邮件"] labels = [1, 0, 1, 0] # 1 表示垃圾邮件，0 表示正常邮件 # 向量化邮件文本 vectorizer = TfidfVectorizer() X = vectorizer.fit_transform(emails) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, labels, test_size=0.2, random_state=42) # 创建并训练朴素贝叶斯分类器 clf = MultinomialNB().fit(X_train, y_train) # 在测试集上进行预测 y_pred = clf.predict(X_test) # 计算准确率 print("准确率:", accuracy_score(y_test, y_pred)) # 额外需要注意的逻辑点： # 1. 数据预处理的质量对分类效果有很大影响。 # 2. 特征选择和提取的方法要根据实际情况优化。 # 3. 模型的评估指标要综合考虑多种因素，不仅仅是准确率。 ``` ######[AI写代码神器 | 337点数解答 | 2025-04-24 14:08:44]

服务商

更多选项

快捷项

自定义