在先前的训练阶段,我们发现算法模型在训练集上达到了1.0的准确率,然而,其在测试集上的表现却不尽如人意,这暗示着模型可能出现了过拟合现象。 我们的算法模型是直接依据每个数字图像的像素数据进行学习的。因...
经过第八章节的特征优化,我们的手写数字识别准确率有着明显的提升。但是仍然存在一个显而易见的问题,即:我们绘制的数字是对位置很敏感的。接下来,我们将会去探讨解决这一问题的方法。 1. 图像数据增强 数据...
1. Windows 打包步骤 首先,进入到项目根目录下然后,在项目根目录下执行命令:接着,拷贝 source、data、model 目录到 dist 目录下,保证和 exe 同级目录最后,可以分发给...
视频课程地址:https://space.bilibili.com/429380437 《垃圾邮件识别器》项目旨在开发一个能够支持邮件输入、并自动识别垃圾邮件的窗口应用程序。该项目主要包含以下方面的内...
我们的开发环境:Win11 + PyCharm 2021.1.3 + Python 3.8.5 1. 虚拟环境 https://mengbaoliang.cn/archives/tag/py-env ...
项目的第一步就是编写需要的界面,我们使用 Python 标准的 GUI 库 Tkinter 来实现。这一节就快速学习该库中将会用到的控件,为搭建图形界面做准备。 主窗口 主菜单 文本控件 其他控件 1...
通过前面学习的 Tkinter 知识,这一节我们将《垃圾邮件识别器》所需要的界面搭建起来,界面主要包括: 主窗口 顶部菜单 中心文本框 底部状态栏 1. 主窗口 创建 MainFrame.py 文件,...
这一节我们将通过学习贝叶斯公式、朴素贝叶斯、文本分类案例三部分来了解垃圾邮件识别的算法原理。 首先,我们将理解贝叶斯公式,这是垃圾邮件识别中关键的数学基础; 接着,我们将介绍朴素贝叶斯算法,它建立在贝...
Scikit-Learn 是一个用于机器学习和数据分析的 Python 库,它提供了各种用于数据预处理、特征工程、模型选择、模型训练和模型评估的工具和算法。我们使用到的朴素贝叶斯算法实现,以及文本特征...
垃圾邮件分类是一种具有广泛应用场景的二分类问题,可以利用机器学习进行解决,市场上已经有很成熟的垃圾邮件分类软件或集成在 Outlook上 的垃圾邮件过滤插件。接下来,我们使用朴素贝叶斯算法训练一个《垃...
这一章节主要涉及算法模型训练、算法模型评估、算法模型封装: 算法模型训练: 模型使用已标记的垃圾邮件和非垃圾邮件样本来学习如何识别垃圾邮件; 算法模型评估: 使用测试数据来评估模型的性能; 算法模型封...
这一部分主要完成两个任务: 将封装的 RecognizerMail 应用到项目中; 将项目打包成可执行程序。 1. 完成代码 在开发的 MainFrame 界面中集成邮件识别器 RecognizerM...
我们通过一个案例,来了解朴素贝叶斯如何实现垃圾邮件分类。步骤为: 文本转换为数值 朴素贝叶斯训练 朴素贝叶斯推理 我们使用到的训练数据如下: 样本 标签 您中奖了!点击链接领取您的百万大奖。 垃圾 免...
当我们将贝叶斯公式应用到实际问题中时,我们发现存在问题。接下来,我们结合下面的数据来看看存在哪些问题。数据如下: 样本数 职业 体型 是否喜欢 1 程序员 超重 不喜欢 2 产品 匀称 喜欢 3 程序...