HOG(Histogram of Oriented Gradients)是一种用于图像处理和计算机视觉任务的特征描述方法,它通常用于目标检测和物体识别。HOG 特征是一种用于描述图...
这篇文章我想讲解的是 scikit-learn 中 SVC 的二分类、多分类场景下 ovo、ovr 决策函数的计算过程,以了解 SVC 进行推理时的逻辑。从而加深对 SVC 的理解...
软间隔支持向量机在处理线性不可分问题时引入,允许一些训练样本出现在间隔内部的概念。这是通过引入松弛变量(slack variables)来实现的,它们允许一些样本出现在错误的一侧,...
1. SVM 目标函数 支持向量机的求解目标是:训练时,在能够将所有样本正确分类的前提下,追求间隔最大化。 如何表示最大间隔?我们把两条边界的直线用如下公式表示: 那我们要求解的支...
核函数是一种在机器学习和统计学中广泛应用的数学函数,它用于将数据从原始特征空间映射到更高维度的特征空间,以便更容易地解决一些问题,尤其是在支持向量机(SVM)等算法中。核函数的主要...
Sobel 算子是一种常用的图像处理工具,它描述了图像中每个像素点处的亮度或颜色值变化方向和强度。它通常用于分析图像的边缘、纹理、形状和其他特征。 在二维图像中,梯度通常是两个分量...
Qdrant 是一个用于向量相似性搜索的 Python 库和引擎,它的主要目的是帮助用户高效地存储、搜索和管理向量数据。它支持多种语言,例如:Python、Rust、Go、Type...
Product Quantization 是一种有效的近似最近邻搜索方法,具有较高的搜索效率和较低的内存消耗。该方法已被广泛应用于图像检索、文本检索和机器学习等领域。 PQ 将高维...
局部敏感哈希索引(Locality-Sensitive Hashing,LSH)是一种用于高维数据检索的技术,特别适用于近似最近邻搜索(Approximate Nearest Ne...
Chroma is the open-source embedding database. Chroma makes it easy to build LLM apps by ma...
Faiss(Facebook AI Similarity Search)是由 Facebook AI 团队开发的一个开源库,用于高效相似性搜索的库,特别适用于大规模向量数据集的存储...
在 scikit-learn 机器学习框架中,sklearn.naive_bayes.MultinomialNB 是对多项式朴素贝叶斯算法的工程实现。接下来,通过一个例子能够理解:...
随机森林(Random Forest)是一种基于集成学习思想的监督学习算法,广泛用于分类和回归任务。它是通过构建多个决策树并将其结果进行整合来提高模型性能和鲁棒性的一种方法。 随机...
随机森林(Random Forest)能够用于分类和回归任务。通过两个应用案例来学习如何使用随机森林来解决分类和回归问题,以及算法的基本原理。 1. 算法使用 2. 基本原理 随机...
1. 算法原理 随机森林(Random Forest)通过构建多个决策树模型(基学习器、弱学习器),并将这些树的结果进行组合来进行分类或回归任务。 那么,多个基学习器如何构建? 我...
1. 基本参数 2. 袋外估计 随机森林在构建每棵树时,采用有放回抽样,即从原始训练集中有放回地随机抽取样本,这样可能会存在一些未被抽到的样本集,称为袋外数据(OOB 数据)。 对...
转置卷积核(Transpose Convolution Kernel)是深度学习中用于进行反卷积操作的核心组件之一。虽然有时也被称为 “逆卷积”,但实际上它...
对抗生成网络(Generative Adversarial Network,GAN)是一种深度学习模型,由生成器(Generator)和判别器(Discriminator)组成,通...
在 C/C++中,随机数生成是一项常见的任务,通常用于模拟、游戏、密码学和统计等应用中。生成时一般会指定满足均匀分布、或者正态分布的随机数。下面,介绍下如何在 C 和 C++ 中生...