全部文章

Python 手把手教你玩转 MediaPipe 手势识别
MediaPipe 是 Google 开源的跨平台、可定制化机器学习解决方案框架，专注于快速构建和部署实时多媒体（图像、视频、音频）处理应用，尤其在人体视觉分析任务（人脸识别、姿态检测、手势识别等）上...
老孟2026-01-1984203
机器学习 GBDT 多分类计算过程
GBDT（Gradient Boosting Decision Tree，梯度提升树）本质上是一个二分类模型。它通过不断迭代地拟合前一轮模型的负梯度，逐步提升模型的预测精度。在二分类任务中，GBDT ...
老孟2025-09-2145100
Python Python 日志模块
日志能够记录程序中问题信息，用户通过它来检查错误发生的原因。Python logging 模块是一个日志记录的模块。logging 模块的工作流程为：记录器产生日志信息，并将日志信息封装成 LogR...
老孟2025-07-28129301
Python Tenacity 重试执行库
我们经常在编写程序时，碰到网络问题、或者其他问题导致异常抛出，使得我们当前的任务中断。此时，我们可能并不想直接中断任务，而是想重新尝试去执行异常抛出的部门代码。Tenacity 就是一个可以解决此问...
老孟2025-07-28141101
Python Python MetaClass
在 Python 中，我们经常使用 type 来查看对象的类型，如下： type 除此用法之外，还可以动态创建类。所谓动态创建类指的是指在运行时通过编程方式创建新的类，而不是在源代码中静态定义类。 1...
老孟2025-07-2882002
机器学习 AlexNet CIFAR10 图像分类
AlexNet 是 2012 年 ImageNet 竞赛冠军获得者 Hinton 和他的学生 Alex Krizhevsky 设计的。AlexNet 把CNN 的基本原理应用到了很深很宽的网络中。主要...
老孟2025-07-28107402
机器学习恒等映射层 nn.Identity 的作用
nn.Identity 是 PyTorch 中的一个层，它的作用是不做任何改变地传递输入数据。它在前向传播时会返回输入数据本身，而不对其进行任何处理或变换。这样的一个实现，在大多数人看来似乎没有什么...
老孟2025-07-28196402
Python Python 反射机制
Python 反射机制是一种在运行时检查、访问和修改对象属性和方法的能力。下面介绍下相关的模块和函数: 内置函数 inspect 模块插件系统示例 1. 内置函数 getattr(obj, name...
老孟2025-07-2887302
机器学习 Rouge 评价指标
在自然语言处理（NLP）任务中，自动评估文本生成质量是一个核心问题。例如，在机器翻译、自动摘要、文本生成等任务中，我们需要度量生成文本与参考文本的相似度。Rouge（Recall-Oriented U...
老孟2025-07-28221103
机器学习基于 PyTorch 手动实现线性回归
线性回归是机器学习中的基础算法之一，通过最小化预测值和真实值之间的误差来拟合数据。在本教程中，我们将使用 PyTorch 从零开始构建一个线性回归模型，并拆解成关键部分，以便更好地理解 PyTorch...
老孟2025-07-28128804
C/C++C++ 中 using 关键字的用法
C++ 中的 using 用法有很多种，我们下面剖析下常见几种场景： using 关键字给类型增加别名 using 用于继承中的同名函数 using 关键字用于构造函数 1. using 关键字给类型...
老孟2025-07-28121302
机器学习卷积核（Convolution Kernel）
卷积核（Convolution Kernel）是卷积神经网络（CNN）中的核心组件之一，通常用于图像处理和深度学习模型中。它是一个小的矩阵，用于对输入图像进行卷积操作，从而提取图像中的特征。卷积核通过...
老孟2025-07-28212105
机器学习 BERT
Bert（Pre-training of Deep Bidirectional Transformers for Language Understanding）模型采用的是 Transformer 的...
老孟2025-07-28400603
机器学习一个轻量级的 Albert 模型
Albert（A Lite Bert For Self-Supervised Learning Of Language Representations）是对 Bert 的改进，其主要思想就是用更少的参...
老孟2025-07-28140200
机器学习基于 Bert 实现 NER 任务
命名实体识别（Named Entity Recognition，简称 NER）是自然语言处理（NLP）中的一项重要任务，旨在从非结构化文本中识别并分类具有特定意义的实体，如人名、地名、机构名、时间表达...
老孟2025-07-28161203
机器学习权重衰减（Weight Decay）
当看到 weight decay 时，从字面意思看是权重参数衰减，很容易让人觉得它和 L2 正则化是等价的，因为 L2 正则化也能让权重变小。但实际上，两者的概念和实现位置并不相同。 L2 正则化通常...
老孟2025-07-28349602
机器学习 Learning Rate Scheduler（二）
书接上回，上篇文章介绍了 7 种学习率的调整策略，PyTorch 1.11 版本中共有 14 种，本篇文章接着介绍剩下的 7 种学习率调整策略。 lr_scheduler.CosineAnnealin...
老孟2025-07-28186701
机器学习 Learning Rate Scheduler（一）
torch.optim.lr_scheduler 提供了动态调整学习率的方法。在使用的时， Learning Rate Scheduler 一般在优化器的更新参数之后调用。另外，我们也可以在程序中使用...
老孟2025-07-28190900
未分类基于 PEGASUS 生成中文文本摘要
PEGASUS 是一种编码器-解码器模型，接下来我们基于开源的 PEGASUS 预训练模型来微调自己的生成式文本摘要模型。感谢 https://huggingface.co/IDEA-CCNL 给开源...
老孟2025-07-2830004
机器学习基于 GAN 网络 STL10 生成图像
STL-10 是一个用于图像识别和生成任务的数据集，训练集共计 5000 张图片，测试集共计 8000 张，另外包含 100000 张无标签图像，适用于无监督和半监督学习。图像尺寸为 96×96，适合...
老孟2025-07-2822800
机器学习伯努利朴素贝叶斯（Bernoulli NB）
伯努利朴素贝叶斯（Bernoulli Naive Bayes）分类器是一种基于贝叶斯定理的概率分类器，常用于处理文本分类等离散数据。它假设特征之间是条件独立的，并且每个特征都遵循伯努利分布，即每个特征...
老孟2025-07-28182304
机器学习索贝尔算子（Sobel）图像边缘检测
Sobel 算子是一种常用的图像处理工具，它描述了图像中每个像素点处的亮度或颜色值变化方向和强度。它通常用于分析图像的边缘、纹理、形状和其他特征。在二维图像中，梯度通常是两个分量的矢量，分别表示在水...
老孟2025-07-28151202
C/C++局部敏感哈希（Locality Sensitive Hashing）
局部敏感哈希索引（Locality-Sensitive Hashing，LSH）是一种用于高维数据检索的技术，特别适用于近似最近邻搜索（Approximate Nearest Neighbor Sea...
老孟2025-07-28144700
机器学习 AUC（Area Under the Curve）
AUC（Area Under the Curve）是一种常用二分类评估方法，它指的是 ROC 曲线（Receiver Operating Characteristic Curve）下的面积。 1. R...
老孟2025-07-2892200
机器学习门控循环单元（GRU）
门控循环单元（Gated Recurrent Unit, GRU）是一种改进的循环神经网络（RNN）架构，旨在解决传统 RNN 在处理长序列时面临的梯度消失问题。GRU 由 KyungHyun Cho...
老孟2025-07-2888600
机器学习长短期记忆网络（LSTM）
长短期记忆网络（Long Short-Term Memory，LSTM）是一种特殊的循环神经网络（RNN），与传统的 RNN 相比，在处理涉及较长距离时间依赖的任务中表现出更强的能力。 1. 算法原理...
老孟2025-07-2896900
机器学习循环神经网络（RNN）
循环神经网络（Recurrent Neural Network, RNN）是一类用于处理序列数据的神经网络。什么是序列数据？序列数据是指按照一定顺序排列的数据集合，其中的每个元素被称为序列的一个项。...
老孟2025-07-2859200
机器学习自动混合精度（AMP）
自动混合精度是一种能够提升训练效率的方法。它通过减少训练过程中的显存使用，从而提高 batch_size 大小，加快模型训练。在 PyTorch 中张量默认使用的是 float32 类型，如果我们能够...
老孟2025-07-28205601
Python 《Python Gradio》（五）灵活构建
Blocks 是 Gradio 库中的一个用来自定义构建交互式 web app 的模块。它相较于 Interface 而言，更加底层，能够用来构建更复杂的应用。ChatInterface 可用来便捷构...
老孟2025-07-28235702
Python 《Python Gradio》（四）常用效果
1. 进度条 2. 会话保持 Gradio 会话保持（Session State）是指在用户会话过程中，保存用户请求的数据。这对于需要跟踪用户状态、或在用户交互中保留上下文的应用程序非常有用。 3. ...
老孟2025-07-2870400

文章筛选