什么是缺失值? 就是数据缺少的数据,在 pandas 是 nan 标记,但是实际数据文件中可能会用另外一种方式标记,比如:问号。 对于缺失值,我们要进行如下步骤...
我们以前在学习 C++ 构造函数的时候,经常会有以下的一些认知: 1. 当类的内部没有提供默认构造函数时,编译器会给类提供一个无实现的无参数的构造函数。 2....
在机器学习中,岭回归(Ridge Regression)是一种常用的回归分析方法,它是线性回归的一种变体,通过引入正则化来减小模型的复杂度,防止过拟合,尤其在特...
词袋模型(Bag-of-Words,BoW)是一种表示和处理文本数据的模型或框架,它提供了一种简单的思想,使得我们能够实现文本转换为数值形式,以便进行进一步的分...
将 SimHei 字体拷贝到 ~/.viritalenvs/虚拟环境目录/ib/python3.7/site-packages/matplotlib/mpl-d...
Teacher Forcing 是一种在训练序列生成模型(如循环神经网络 RNN、长短期记忆网络 LSTM、Transformer 等)时使用的技术。 1. ...
Boosing 是一族可以将弱学习器提升为强学习器的算法。这族算法的工作机制是:先从初始化训练集训练处一个基学习器,再根据学习器的表现对训练样本分布进行调整,使...
线性回归(Linear Regression)是最基础的机器学习算法之一,用于建模因变量(目标变量)与一个或多个自变量(特征)之间的线性关系。它广泛应用于预测分...