在数据集较为复杂的场景下,数据集中容易出现一些异常数据、特征多重共线性问题,使得参数更新出现剧烈的震荡,难以快速收敛到最优解。 通过 L1 和 L2 正则化,一定程度上可以使得参数...
1. KD 树构建 KD 树的构建需要确定两个问题: 选择使用那个维度作为分裂点: 随机选择 顺序选择 方差最大的维度 确定以当前维度那个值作为分裂点: 中位数 注意:如果中位数对...
AdaBoost (Adaptive Boosting, 自适应提升)是 Boosting 算法的一种实现,是一种用于分类问题的算法,它用弱分类器的线性组合来构造强分类器。弱分类器...
我们知道 BN 通过对输入 mini batch 样本进行 normalization,能够加快网络收敛。但是,BN 不适合用在 RNN 网络。原因是:BN 是对同一个批次所有样本...
哈希表也叫做散列表,它通过 key 能够快速访问 value。 我们知道数组通过 key 去搜索元素效率比较低,但是通过位置来访问速度是非常快的。例如:你要搜索值为 5 的元素,那...
有时,躺在床上懒得起来,或者出门在外,忘记电脑关机,这时,我们希望能实现通过手机实现远程关机。这一节,给大家介绍一种简单的方案,只需要简单、少许编码就可以实现。 1. 实现思路 我...
BiEncoder 将句子 A 和 句子 B 分别输入 Bert 模型,得到两个句子向量,然后使用余弦相似度比较两个输入句子。而 CrossEncoder 则将句子 A 和 B 拼...
Fasttext 和 Word2vec 都是词向量模型,用于将输入文本转换为词向量表示,但是它们在模型结构、训练速度、OOV问题处理方面有些很大的不同: 模型结构不同:word2v...
std::function 是 C++11 标准库中的一个类模板,用于封装可调用对象(函数、函数指针、成员函数指针、Lambda 表达式等),并提供一种统一的方式来管理它们。 通过...
Rouge(Recall-Oriented Understudy for Gisting Evaluation)用于自动摘要的评估,简单介绍下论文中提到的几种 Rouge 评估方法...
可以使用C对变量中的个别位进行操作。您可能对人们想这样做的原因感到奇怪。这种能力有时确实是必须的,或者至少是有用的。C提供位的逻辑运算符和移位运算符。 1. 位运算符 位运算符 取...
C99 提供一个成为 伸缩性数组成员 的特性。利用这一特性可以声明结构体的最后一个成员具有特殊的属性。 该数组成员的特性:1. 该成员可存在,也可不存在,当不存在时,并不占用结构...
最大期望算法是一类通过迭代进行极大似然估计的优化方法,通常用于包含因变量或缺失数据的概率模型进行参数估计。EM 算法的标准计算过程由 E 步和 M 步 交替组成,算法的收敛性可以确...
连接查询是数据库中很重要的查询操作,其可以实现将多张表按照某个条件进行连接。主要包括内连接、左连接、右连接。 我们的数据表如下: 此时,如果想要对这两个表进行查询,比如: 此时会产...
多项式回归时线性回归模型的一种,使用多项式可以逼近任意函数,因此多项式回归有着广泛的应用。 多项式回归的最大优点就是可以通过增加 x 的高次项对样本集进行逼近,直至达到目标为止。在...
GBDT 的全称是 Gradient Boosting Decision Tree,是 Boosing 算法思想的一种实现,是最速下降法与前向加法模型的结合。训练时,通过拟合损失函...
浮点小数是程序中经常使用的一种数据类型,其使用非常广泛,特别是在科学计算、工程领域以及计算机图形学、人工智能等领域。 1. 原理 在计算机中,浮点数常常采用 IEEE 754 标准...
自动混合精度(AMP)
2024-06-07阅读(1159)
XGBoost(Extreme Gradient Boosting)
2023-03-29阅读(1494)
XLNet
2022-10-16阅读(1127)
因子分解机(Factorization Machine)
2022-09-29阅读(1038)
霍夫曼编码算法(Huffman Coding)
2022-09-22阅读(1328)
克鲁斯卡尔算法(Kruskal)
2022-09-21阅读(1003)
普利姆算法(Prim)
2022-09-21阅读(925)
迪杰斯特拉算法(Dijkstra)
2022-09-20阅读(977)
图遍历算法(DFS、BFS)
2022-09-20阅读(889)
潜在语义分析(Latent Semantic Analysis)
2022-06-28阅读(816)