快速排序是 C.R.A.Hoare 于1962 年提出的一种排序算法,该算法如其名一样确实很快。快速排序采用了一种 “汾治策略” 来对序列进行排序。 算法基本思想是:通过一次遍历将序列分成两部分,...
HOG(Histogram of Oriented Gradients)是一种用于图像处理和计算机视觉任务的特征描述方法,它通常用于目标检测和物体识别。HOG 特征是一种用于描述图像中局部纹理和形状的特征向量,其主要思想...
这篇文章我想讲解的是 scikit-learn 中 SVC 的二分类、多分类场景下 ovo、ovr 决策函数的计算过程,以了解 SVC 进行推理时的逻辑。从而加深对 SVC 的理解。 决策函数公式得到决策值之后,直接判断...
《垃圾邮件识别器》项目旨在开发一个能够支持邮件输入、并自动识别垃圾邮件的窗口应用程序。通过本项目的学习能够使你深刻的理解朴素贝叶斯算法,以及相关的实现编码技巧。
软间隔支持向量机在处理线性不可分问题时引入,允许一些训练样本出现在间隔内部的概念。这是通过引入松弛变量(slack variables)来实现的,它们允许一些样本出现在错误的一侧,从而使模型更加健壮并能够容忍噪声和离群值...
1. SVM 目标函数 支持向量机的求解目标是:训练时,在能够将所有样本正确分类的前提下,追求间隔最大化。 如何表示最大间隔?我们把两条边界的直线用如下公式表示: 那我们要求解的支持向量机就可以表示为: 当 wx + b...
核函数是一种在机器学习和统计学中广泛应用的数学函数,它用于将数据从原始特征空间映射到更高维度的特征空间,以便更容易地解决一些问题,尤其是在支持向量机(SVM)等算法中。核函数的主要作用是在高维空间中进行非线性映射,而无需...
Sobel 算子是一种常用的图像处理工具,它描述了图像中每个像素点处的亮度或颜色值变化方向和强度。它通常用于分析图像的边缘、纹理、形状和其他特征。 在二维图像中,梯度通常是两个分量的矢量,分别表示在水平和垂直方向上的变化...
Product Quantization 是一种有效的近似最近邻搜索方法,具有较高的搜索效率和较低的内存消耗。该方法已被广泛应用于图像检索、文本检索和机器学习等领域。 PQ 将高维数据点分成多个子空间,并对每个子空间使用...
局部敏感哈希索引(Locality-Sensitive Hashing,LSH)是一种用于高维数据检索的技术,特别适用于近似最近邻搜索(Approximate Nearest Neighbor Search)的问题。在高...
Chroma is the open-source embedding database. Chroma makes it easy to build LLM apps by making knowledge, fact...
Faiss(Facebook AI Similarity Search)是由 Facebook AI 团队开发的一个开源库,用于高效相似性搜索的库,特别适用于大规模向量数据集的存储与检索。 https://github....
在 scikit-learn 机器学习框架中,sklearn.naive_bayes.MultinomialNB 是对多项式朴素贝叶斯算法的工程实现。接下来,通过一个例子能够理解: 算法的拟合和推理的计算过程; 拉普拉斯...
飞机大战是一种经典的 2D 射击游戏,通常初学者学习 Python 编程的一个很好的项目。通过这个课程帮助大家扎实 Python 基础知识和技能。