我的文章

我的文章 Batch 文本长度不同（pad_sequence）
孟宝亮2025-07-2898402
1. pad_sequence pad_sequence 函数通过填充的方式，将同一个 batch 中的 sequences 通过默认填充 0 的方式，变成最长 sequence 的长度，如下所示： ...
我的文章 BCELoss、CrossEntropyLoss
孟宝亮2025-07-28102500
PyTorch 提供了两种损失函数的使用方法：函数形式、模块形式，函数形式的损失函数定义在 torch.nn.functional 库中，使用时传入神经网络的预测值和目标值来计算损失，模型形式是通过构...
我的文章回归评估方法
孟宝亮2025-07-28110800
下面整理常见的用于回归损失函数： MAE 平均绝对误差 MSE 均方误差 R-Square R方损失函数 Huber 损失函数 Log-Cosh 损失函数 RMSLE 均方根对数误差 1. MAE 平...
我的文章 Transformer 词嵌入+位置编码
孟宝亮2025-07-28116503
Transformer 是谷歌在 2017 年的论文《Attention Is All you Need》中提出的一种新架构，它在多项 NLP 任务上效果很不错，训练速度也比 RNN 更快。目前 T...
我的文章 PyTorch 模型保存和加载
孟宝亮2025-07-2897401
神经网络的训练有时需要几天、几周、甚至几个月，为了在每次使用模型时避免高代价的重复训练，我们就需要将模型序列化到磁盘中，使用的时候反序列化到内存中。 PyTorch 提供了两种保存模型的方法：直接序...
我的文章 Momentum、AdaGrad、RMSProp、Adam
孟宝亮2025-07-2896902
传统的梯度下降优化算法中，可能会碰到以下情况：碰到平缓区域，梯度值较小，参数优化变慢碰到 “鞍点” ，梯度为 0，参数无法优化碰到局部最小值对于这些问题, 出现了一些对...
我的文章 C/C++ 编写 Python 扩展-调用C函数（1）
孟宝亮2025-07-2893100
在 Python 中使用 ctypes 模块可以很轻松定义 C 类型的变量，以及调用 C/C++ 函数. 1. 基础类型变量程序输出结果： 2. 指针类型变量程序输出结果： 3. Python 调...
我的文章 C/C++ 编写 Python 扩展-返回值（2）
孟宝亮2025-07-28188704
我们简单介绍下，C/C++ 编写的扩展函数，导入到 Python 中使用。步骤如下：编写使用 Python/C API 编写 C/C++ 函数编写 setup.py 文件编译安装 C/C++ 扩...
我的文章 C/C++ 编写 Python 扩展-传递参数（3）
孟宝亮2025-07-28113104
https://docs.python.org/3.8/c-api/ 导出函数： setup.py 文件： Python 调用文件：程序运行结果：
我的文章 Xavier 初始化
孟宝亮2025-07-28109701
神经网络模型一般都是靠随机梯度下降算法进行训练和参数更新。网络的收敛效果很大程度上受到网络参数初值的影响。不合理的网络参数初始化，可能会导致 “梯度消失” 或者 “...
我的文章 PyTorch 初始化 API
孟宝亮2025-07-2881602
网络参数初始化的优劣在极大程度上决定了网络的最终性能。比较推荐的初始化方式有 He 初始化是，将参数初始化为服从高斯分布或均匀分布的较小随机整数，同时对参数方差加以规范化。处于稳定状态下的神经网络，...
我的文章 one hot 编码
孟宝亮2025-07-28104003
自然语言是用来表达含义的系统，词是其基本单元。在计算机处理中，我们需要把自然语言中的词进行数值化，才能够让计算机识别处理。最简单的将词进行词嵌入的方法是：one hot 编码。根据词的数量 N，构建...
我的文章卷积核（Convolution Kernel）
孟宝亮2025-07-28174704
卷积核（Convolution Kernel）是卷积神经网络（CNN）中的核心组件之一，通常用于图像处理和深度学习模型中。它是一个小的矩阵，用于对输入图像进行卷积操作，从而提取图像中的特征。卷积核通过...
我的文章池化（Pooling）的作用和计算
孟宝亮2025-07-28123604
池化层（Pooling Layer）是卷积神经网络（CNN）中的一种层结构，主要用于对特征图进行降采样，以减小数据的空间尺寸，降低模型的计算量和参数数量，从而在一定程度上防止过拟合。池化层的主要作用包...
我的文章句子相似性计算
孟宝亮2025-07-28108901
句子的相似性可以使用下面的一些方法来计算：杰卡德相似度余弦相似度 TextRank 相似度 1. 杰卡德相似度杰卡德相似度需要计算两个句子的交并集，然而这里没有说明使用什么粒度来计算。所以我们可...

1 … 8 9 10 … 28

我的文章

我的文章 Batch 文本长度不同（pad_sequence）

我的文章 BCELoss、CrossEntropyLoss

我的文章 回归评估方法

我的文章 Transformer 词嵌入+位置编码

我的文章 PyTorch 模型保存和加载

我的文章 Momentum、AdaGrad、RMSProp、Adam

我的文章 C/C++ 编写 Python 扩展-调用C函数（1）

我的文章 C/C++ 编写 Python 扩展-返回值（2）

我的文章 C/C++ 编写 Python 扩展-传递参数（3）

我的文章 Xavier 初始化

我的文章 PyTorch 初始化 API

我的文章 one hot 编码

我的文章 卷积核（Convolution Kernel）

我的文章 池化（Pooling）的作用和计算

我的文章 句子相似性计算