孟宝亮的文章

有着15年的开发和教学经验，专注于分享 Python、机器学习、深度学习、大模型、以及 Linux C/C++ 等方面的技术课程！

我的文章 PyTorch DataLoader 使用
孟宝亮2025-07-28180004
在 PyTorch 中，使用 torch.utils.data.DataLoader 类可以实现批量的数据集加载，在我们训练模型中非常常用，其功能也确实比较强度...
我的文章 C++ default 关键字
孟宝亮2025-07-28136403
在 C++11 标准中引入的 default 关键字，主要用于在类的声明中显式指定编译器生成默认的特殊成员函数实现。这些特殊成员函数包括： 1. 默认构造 ht...
我的文章 C++ 函数对象
孟宝亮2025-07-2893201
函数对象有时也叫仿函数，其本质是一个类对象，由于重载函数调用符号，其可以像普通函一样使用。 1. 函数调用符号重载语法 2. 函数对象相对于普通函数的优点 C+...
我的文章 C++ 的常函数和常对象
孟宝亮2025-07-2886804
常对象指的是使用 const 关键字修饰的类对象，常函数指的是由 const 关键字修饰的函数。这里需要注意：只有成员函数才可以被 const 关键字修饰，而全...
我的文章深度残差网络（Residue Network）
孟宝亮2025-07-28104004
我们都知道增加网络的宽度和深度可以很好提高网络的性能，深的网络一般都比浅的的网络效果好。比如，一个深的网络 A 和一个浅的网络 B，那 A 的性能至少都能跟 B...
我的文章 Dropout 正则化
孟宝亮2025-07-28148302
在训深层练神经网络时，由于模型参数较多，在数据量不足的情况下，很容易过拟合。Dropout 就是在神经网络中一种缓解过拟合的方法。我们知道，缓解过拟合的方式就...
我的文章基于 TF 和 word2vec + kmeans 抽取文本摘要
孟宝亮2025-07-2836001
我们可能经常碰到这样的一种需求，需要对一篇文章、一大串关于某个主题的文本内容进行摘要的提取。文本摘要的提取思路主要有抽取式、生成式：抽取式主要是从文章中抽取一...
我的文章神经网络 BP 算法
孟宝亮2025-07-2896103
BP （Back Propagation）算法也叫做误差反向传播算法，它用于求解模型的参数梯度，从而使用梯度下降法来更新网络参数。它的基本工作流程如下：通过正...
我的文章 LLM 解码策略
孟宝亮2025-07-28132604
LLM 解码是指将模型预测的概率分布转换为实际文本的过程。每一步，模型都会给出一个词汇表中所有可能单词的概率，我们需要从中选择一个或多个词来构建最终的句子。解码...
我的文章 PyTorch 模型保存和加载
孟宝亮2025-07-2899901
神经网络的训练有时需要几天、几周、甚至几个月，为了在每次使用模型时避免高代价的重复训练，我们就需要将模型序列化到磁盘中，使用的时候反序列化到内存中。 PyTor...
我的文章 Transformer 词嵌入+位置编码
孟宝亮2025-07-28123403
Transformer 是谷歌在 2017 年的论文《Attention Is All you Need》中提出的一种新架构，它在多项 NLP 任务上效果很不...
我的文章回归评估方法
孟宝亮2025-07-28113800
下面整理常见的用于回归损失函数： MAE 平均绝对误差 MSE 均方误差 R-Square R方损失函数 Huber 损失函数 Log-Cosh 损失函数 RM...
我的文章 BCELoss、CrossEntropyLoss
孟宝亮2025-07-28106100
PyTorch 提供了两种损失函数的使用方法：函数形式、模块形式，函数形式的损失函数定义在 torch.nn.functional 库中，使用时传入神经网络的预...
我的文章 Batch 文本长度不同（pad_sequence）
孟宝亮2025-07-28101502
1. pad_sequence pad_sequence 函数通过填充的方式，将同一个 batch 中的 sequences 通过默认填充 0 的方式，变成最长...
我的文章 PyTorch 中 GRU 和 LSTM 循环网络层
孟宝亮2025-07-28110100
在 NLP 任务中主要处理带有序列关系的文本数据，这就需要了解循环（递归）神经网络。下图是一个简单的循环神经网络：网络中包含一个神经元，但是它具有不同的时间步...

1 … 8 9 10 … 37

孟宝亮的文章

我的文章 PyTorch DataLoader 使用

我的文章 C++ default 关键字

我的文章 C++ 函数对象

我的文章 C++ 的常函数和常对象

我的文章 深度残差网络（Residue Network）

我的文章 Dropout 正则化

我的文章 基于 TF 和 word2vec + kmeans 抽取文本摘要

我的文章 神经网络 BP 算法

我的文章 LLM 解码策略

我的文章 PyTorch 模型保存和加载

我的文章 Transformer 词嵌入+位置编码

我的文章 回归评估方法

我的文章 BCELoss、CrossEntropyLoss

我的文章 Batch 文本长度不同（pad_sequence）

我的文章 PyTorch 中 GRU 和 LSTM 循环网络层

孟宝亮 的文章

孟宝亮的文章