Word2Vec 是 Google 在 2013 年推出的一种用于生成词向量的模型,它通过无监督学习的方式从大量文本数据中学习单词的语义关系。即:通过训练一个浅层的神经网络模型来学...
在写程序时,我们经常会处理小数这种数据。这节课,将会给同学们讲解下,在计算机中小数存储的两种方式:浮点小数和定点小数。学习目标: 最后,我们来总结下这两种存储方式:
字节序(Byte Order)是指在多字节数据类型(如整数和浮点数)在内存中存储时,字节的排列顺序。常见的字节序有大端序(Big Endian)和小端序(Little Endian...
joblib 是一个Python库,用于在Python中高效地保存和加载对象,特别是那些包含大型数据数组的对象。它在机器学习领域中非常有用,因为经常需要保存训练好的模型或中间数据。...
SoftMax 函数是深度学习和机器学习中一个非常重要的概念,主要用于处理多分类问题。Softmax 函数能够将一个实数向量映射为一个概率分布,使得输出向量的所有元素都在 0 到 ...
聚类(Clustering)指的是将一组数据点按照某种规则或者方法分成多个组或簇,使得同一组内的数据点在某种意义上更相似,而不同组之间的数据点相对较不相似。 聚类时,可以基于数据分...
HOG(Histogram of Oriented Gradients)是一种用于图像处理和计算机视觉任务的特征描述方法,它通常用于目标检测和物体识别。HOG 特征是一种用于描述图...
这篇文章我想讲解的是 scikit-learn 中 SVC 的二分类、多分类场景下 ovo、ovr 决策函数的计算过程,以了解 SVC 进行推理时的逻辑。从而加深对 SVC 的理解...
软间隔支持向量机在处理线性不可分问题时引入,允许一些训练样本出现在间隔内部的概念。这是通过引入松弛变量(slack variables)来实现的,它们允许一些样本出现在错误的一侧,...
1. SVM 目标函数 支持向量机的求解目标是:训练时,在能够将所有样本正确分类的前提下,追求间隔最大化。 如何表示最大间隔?我们把两条边界的直线用如下公式表示: 那我们要求解的支...
核函数是一种在机器学习和统计学中广泛应用的数学函数,它用于将数据从原始特征空间映射到更高维度的特征空间,以便更容易地解决一些问题,尤其是在支持向量机(SVM)等算法中。核函数的主要...
Sobel 算子是一种常用的图像处理工具,它描述了图像中每个像素点处的亮度或颜色值变化方向和强度。它通常用于分析图像的边缘、纹理、形状和其他特征。 在二维图像中,梯度通常是两个分量...
Qdrant 是一个用于向量相似性搜索的 Python 库和引擎,它的主要目的是帮助用户高效地存储、搜索和管理向量数据。它支持多种语言,例如:Python、Rust、Go、Type...
Product Quantization 是一种有效的近似最近邻搜索方法,具有较高的搜索效率和较低的内存消耗。该方法已被广泛应用于图像检索、文本检索和机器学习等领域。 PQ 将高维...
局部敏感哈希索引(Locality-Sensitive Hashing,LSH)是一种用于高维数据检索的技术,特别适用于近似最近邻搜索(Approximate Nearest Ne...
Chroma is the open-source embedding database. Chroma makes it easy to build LLM apps by ma...
Faiss(Facebook AI Similarity Search)是由 Facebook AI 团队开发的一个开源库,用于高效相似性搜索的库,特别适用于大规模向量数据集的存储...
在 scikit-learn 机器学习框架中,sklearn.naive_bayes.MultinomialNB 是对多项式朴素贝叶斯算法的工程实现。接下来,通过一个例子能够理解:...
转置卷积核(Transpose Convolution Kernel)是深度学习中用于进行反卷积操作的核心组件之一。虽然有时也被称为 “逆卷积”,但实际上它...
自动混合精度(AMP)
2024-06-07阅读(1150)
XGBoost(Extreme Gradient Boosting)
2023-03-29阅读(1491)
XLNet
2022-10-16阅读(1120)
因子分解机(Factorization Machine)
2022-09-29阅读(1028)
霍夫曼编码算法(Huffman Coding)
2022-09-22阅读(1312)
克鲁斯卡尔算法(Kruskal)
2022-09-21阅读(1001)
普利姆算法(Prim)
2022-09-21阅读(920)
迪杰斯特拉算法(Dijkstra)
2022-09-20阅读(974)
图遍历算法(DFS、BFS)
2022-09-20阅读(887)
潜在语义分析(Latent Semantic Analysis)
2022-06-28阅读(814)