词袋模型(Bag-of-Words,BoW)是一种表示和处理文本数据的模型或框架,它提供了一种简单的思想,使得我们能够实现文本转换为数值形式,以便进行进一步的分析,例如:进行新闻分...
什么是缺失值? 就是数据缺少的数据,在 pandas 是 nan 标记,但是实际数据文件中可能会用另外一种方式标记,比如:问号。 对于缺失值,我们要进行如下步骤处理: 如何判断缺失...
我们以前在学习 C++ 构造函数的时候,经常会有以下的一些认知: 1. 当类的内部没有提供默认构造函数时,编译器会给类提供一个无实现的无参数的构造函数。 2. 当类的内部没有提供...
我们的开发环境:Win11 + PyCharm 2021.1.3 + Python 3.8.5 1. 虚拟环境 接下来,创建 spam-env 虚拟环境,并在其中安装如下所需要的第...
项目的第一步就是编写需要的界面,我们使用 Python 标准的 GUI 库 Tkinter 来实现。这一节就快速学习该库中将会用到的控件,为搭建图形界面做准备。 主窗口 主菜单 文...
通过前面学习的 Tkinter 知识,这一节我们将《垃圾邮件识别器》所需要的界面搭建起来,界面主要包括: 主窗口 顶部菜单 中心文本框 底部状态栏 1. 主窗口 创建 MainFr...
这一节我们将通过学习贝叶斯公式、朴素贝叶斯、文本分类案例三部分来了解垃圾邮件识别的算法原理。 首先,我们将理解贝叶斯公式,这是垃圾邮件识别中关键的数学基础; 接着,我们将介绍朴素贝...
Scikit-Learn 是一个用于机器学习和数据分析的 Python 库,它提供了各种用于数据预处理、特征工程、模型选择、模型训练和模型评估的工具和算法。我们使用到的朴素贝叶斯算...
垃圾邮件分类是一种具有广泛应用场景的二分类问题,可以利用机器学习进行解决,市场上已经有很成熟的垃圾邮件分类软件或集成在 Outlook上 的垃圾邮件过滤插件。接下来,我们使用朴素贝...
这一章节主要涉及算法模型训练、算法模型评估、算法模型封装: 算法模型训练: 模型使用已标记的垃圾邮件和非垃圾邮件样本来学习如何识别垃圾邮件; 算法模型评估: 使用测试数据来评估模型...
这一部分主要完成两个任务: 将封装的 RecognizerMail 应用到项目中; 将项目打包成可执行程序。 1. 完成代码 在开发的 MainFrame 界面中集成邮件识别器 R...
单例模式保证一个类的实例只有一个。如何保证一个类只有一个实例,不同的语言语法特性不同,需要结合语言的语法特点来实现。在 C++中的实现方式如下: 上面类通过: 普通构造、拷贝构造私...
逻辑回归是一种广义的线性回归分析模型,常用于疾病自动诊断,经济预测等领域。本文从以下几个方面介绍逻辑回归: Sigmoid 函数 逻辑回归损失函数 逻辑回归 API 介绍 1. S...
командующий ленинградским фронтом Говоров посмотрел на часы 、до начала концерта ...
Александра Сергеевича Пушкина называют солнцем русской поэзии , его стихи знает каждый чел...