支持向量机(Support Vector Machine,SVM)是 Vapnik 等人在 1995 年完善的经典监督学习算法,可广泛应用于分类与回归任务。凭借严谨的数学理论支撑与出色的泛化能力,它在...
MediaPipe 是 Google 开源的跨平台、可定制化机器学习解决方案框架,专注于快速构建和部署实时多媒体(图像、视频、音频)处理应用,尤其在人体视觉分析任务(人脸识别、姿态检测、手势识别等)上...
一直以来,我的博客都没有好好整理过,内容布局比较杂乱,有些只是随手写的随笔,也不够完整。现在关注我的人越来越多,我也希望能把博客做得更像样一些:写,就尽量写好;排版,也尽量做到清晰易读。因为我并不擅长...
Fun-CosyVoice3-0.5B-2512 是阿里巴巴通义语音团队推出的开源文本转语音(TTS)模型,具备多语言、多方言合成、情感控制、音色克隆等实用功能,且部署门槛低,非常适合初学者上手。本教...
C++20 引入的协程特性,对 C++ 具有极其重要意义。这一特性能够帮助开发者在多任务场景下编写出可读性、可维护性更好的代码,提升复杂系统的开发效率和可维护性。 需要明确的是,协程不是框架,也不是现...
值类别是 C++11 为适配移动语义而引入的重要概念,要理解这个概念我们得了解:左值、右值、将亡值、纯右值的概念,以及引入这些概念的原因。 1. 左值右值 在 C++ 中,表达式指的是任何可以被求值(...
AdaBoost(Adaptive Boosting,自适应提升)算法由 Yoav Freund 和 Robert Schapire 于 1995 年提出,是一种能自动找出薄弱环节并不断改进的集体学习...
在 C++ 多线程编程中,我们绕不开一个核心问题:共享资源竞争。为了保护数据一致性,锁是最常用的工具:访问共享资源前 lock 加锁,操作完成后 unlock 解锁,使用起来虽然简单,但存在一些潜在的...
XGBoost(Extreme Gradient Boosting)2014 年由陈天奇开发,旨在对传统梯度提升算法(GBDT)进行高效实现和优化。2015 年,XGBoost 在 Kaggle 竞赛...
在 C++ 的发展历程中,有一个极为重要的核心理念:RAII(Resource Acquisition Is Initialization,资源获取即初始化)。通过这个理念,能够使得开发者编写出更加安...
梯度提升树(Gradient Boosting Decision Tree,简称 GBDT)由 Friedman 提出,是集成学习领域的经典算法。 因此,GBDT 依旧具有极高的学习价值,是每一位数据...
在数据分析中,K-means 聚类是一种非常常用的聚类方法。它的核心思想是:将相似的数据点归为同一簇,并为每个簇计算一个质心,然后把每个点分配到距离最近的质心所属簇中。 这种方法简单高效,但也存在一些...
GBDT(Gradient Boosting Decision Tree,梯度提升树)本质上是一个二分类模型。它通过不断迭代地拟合前一轮模型的负梯度,逐步提升模型的预测精度。在二分类任务中,GBDT ...
在多线程编程中,如果共享的数据结构很复杂(比如链表、map、数据库缓存等),不同线程可能同时对它进行插入、删除等操作。 总结1:复杂共享数据 → std::mutex 不可或缺。 但如果只是对一个 整...
词袋模型(Bag-of-Words,BoW)是一种表示和处理文本数据的模型或框架,它提供了一种简单的思想,使得我们能够实现文本转换为数值形式,以便进行进一步的分析,例如:进行新闻分类、文档检索、情感分...
日志能够记录程序中问题信息,用户通过它来检查错误发生的原因。Python logging 模块是一个日志记录的模块。logging 模块的工作流程为: 记录器产生日志信息,并将日志信息封装成 LogR...
我们经常在编写程序时,碰到网络问题、或者其他问题导致异常抛出,使得我们当前的任务中断。 此时,我们可能并不想直接中断任务,而是想重新尝试去执行异常抛出的部门代码。Tenacity 就是一个可以解决此问...
在 Python 中,我们经常使用 type 来查看对象的类型,如下: type 除此用法之外,还可以动态创建类。所谓动态创建类指的是指在运行时通过编程方式创建新的类,而不是在源代码中静态定义类。 1...
nn.Identity 是 PyTorch 中的一个层,它的作用是不做任何改变地传递输入数据。它在前向传播时会返回输入数据本身,而不对其进行任何处理或变换。 这样的一个实现,在大多数人看来似乎没有什么...
AlexNet 是 2012 年 ImageNet 竞赛冠军获得者 Hinton 和他的学生 Alex Krizhevsky 设计的。AlexNet 把CNN 的基本原理应用到了很深很宽的网络中。主要...
Python 反射机制是一种在运行时检查、访问和修改对象属性和方法的能力。下面介绍下相关的模块和函数: 内置函数 inspect 模块 插件系统示例 1. 内置函数 getattr(obj, name...
在自然语言处理(NLP)任务中,自动评估文本生成质量是一个核心问题。例如,在机器翻译、自动摘要、文本生成等任务中,我们需要度量生成文本与参考文本的相似度。Rouge(Recall-Oriented U...
线性回归是机器学习中的基础算法之一,通过最小化预测值和真实值之间的误差来拟合数据。在本教程中,我们将使用 PyTorch 从零开始构建一个线性回归模型,并拆解成关键部分,以便更好地理解 PyTorch...
C++ 中的 using 用法有很多种,我们下面剖析下常见几种场景: using 关键字给类型增加别名 using 用于继承中的同名函数 using 关键字用于构造函数 1. using 关键字给类型...
卷积核(Convolution Kernel)是卷积神经网络(CNN)中的核心组件之一,通常用于图像处理和深度学习模型中。它是一个小的矩阵,用于对输入图像进行卷积操作,从而提取图像中的特征。卷积核通过...
Albert(A Lite Bert For Self-Supervised Learning Of Language Representations)是对 Bert 的改进,其主要思想就是用更少的参...
命名实体识别(Named Entity Recognition,简称 NER)是自然语言处理(NLP)中的一项重要任务,旨在从非结构化文本中识别并分类具有特定意义的实体,如人名、地名、机构名、时间表达...
当看到 weight decay 时,从字面意思看是权重参数衰减,很容易让人觉得它和 L2 正则化是等价的,因为 L2 正则化也能让权重变小。但实际上,两者的概念和实现位置并不相同。 L2 正则化通常...