在我们的《手写数字识别》项目中,需要提供一个用于手写数字的绘图板作为用户界面,便于获得用户手写的数字输入算法模型以便能够进行识别。这一章节,我们主要介绍关于绘图板开发过程中用到的相关技术。主要包括: 画布构建 图形绘制 ...
前面我们已经学习了 Tkinter Canvas 控件相关的技术,现在我们将会使用前面学习的内容来实现用于手写数字的绘画板。绘画板主要包括四个部分,分别是: 主窗口界面 顶部工具栏 中心绘画区 底部状态栏 1. 主窗口界...
《手写数字识别》项目基于支持向量机算法的,该算法的背后有着坚实的数学理论作为支撑,为算法的有效性和可靠性提供了坚实的基础。接下来,我们将会从以下第五个方面来讲解: 算法思想初探 算法训练内容 算法推理过程 惩罚参数作用 ...
《手写数字识别器》中会应用支持向量机算法、以及相关的参数搜索方法。这两个在 Scikit-Learn 中都有实现。这一节,我们将会学习两个相关的 API 的使用。 数据介绍 算法使用 网格搜索 1. 数据介绍 鸢尾花数据...
这一节,我们主要给大家讲解图像相关的基础知识,以及操作方法。 1. 图像知识 图像可以被视为一系列像素的集合,每个像素分别对应 0 到 255 之间的整数,0 表示黑色,255 表示白色。图像可以根据其颜色模式分为灰度图...
经过前面的准备,我们将会进行初次的算法模型训练以及封装,并测试效果。从中去分析不足,然后在后续内容中针对不足进行优化。 1. 数据处理 首先,我们先对训练数据进行读取,并提取图像特征。需要说明一点,由于图像本身就是由一系...
在先前的训练阶段,我们发现算法模型在训练集上达到了1.0的准确率,然而,其在测试集上的表现却不尽如人意,这暗示着模型可能出现了过拟合现象。 我们的算法模型是直接依据每个数字图像的像素数据进行学习的。因此,当遇到新的数字图...
经过第八章节的特征优化,我们的手写数字识别准确率有着明显的提升。但是仍然存在一个显而易见的问题,即:我们绘制的数字是对位置很敏感的。接下来,我们将会去探讨解决这一问题的方法。 1. 图像数据增强 数据增强是一种通过对训练...
1. Windows 打包步骤 首先,进入到项目根目录下然后,在项目根目录下执行命令:接着,拷贝 source、data、model 目录到 dist 目录下,保证和 exe 同级目录最后,可以分发给没有 Python ...
线性回归(Linear Regression)是最基础的机器学习算法之一,用于建模因变量(目标变量)与一个或多个自变量(特征)之间的线性关系。它广泛应用于预测分析、统计建模和数据挖掘领域。 1. 决策函数 线性回归的核心...
Boosing 是一族可以将弱学习器提升为强学习器的算法。这族算法的工作机制是:先从初始化训练集训练处一个基学习器,再根据学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多的关注,然后基于调...
Teacher Forcing 是一种在训练序列生成模型(如循环神经网络 RNN、长短期记忆网络 LSTM、Transformer 等)时使用的技术。 1. 问题场景 Teacher Forcing 是一种用于训练序列...
在机器学习中,岭回归(Ridge Regression)是一种常用的回归分析方法,它是线性回归的一种变体,通过引入正则化来减小模型的复杂度,防止过拟合,尤其在特征数多且存在多重共线性问题时,岭回归能有效提高预测精度。 1...
词袋模型(Bag-of-Words,BoW)是一种表示和处理文本数据的模型或框架,它提供了一种简单的思想,使得我们能够实现文本转换为数值形式,以便进行进一步的分析,例如:进行新闻分类、文档检索、情感分析等任务。 1. 文...