我的文章

我的文章 XLNet
孟宝亮2025-07-28158202
XLNet 是 Google Brain 和 CMU（卡内基梅隆大学）联合提出的一种自回归语言模型，它结合了 Transformer-XL 结构，并在双向上下...
我的文章协同过滤（Collaborative Filtering）
孟宝亮2025-07-28110304
协同过滤推荐（Collaborative Filtering Recommendation）：该算法的核心是分析用户的兴趣和行为，利用共同行为习惯的群体有相似喜...
我的文章焦点损失（focal loss）
孟宝亮2025-07-28130500
在分类问题中，会碰到样本类别不均衡的情况。此时，模型为了能够降低损失，会去尽量学习多数样本，导致对少数类别样本的学习减弱。举个不太恰当的例子，我们有数学和语文...
我的文章显存使用分析（PyTorch）
孟宝亮2025-07-28187700
我们一直使用 PyTorch 进行模型训练，有时会出现显存不足的情况。除了找到对应的解决办法，比如：累加梯度、使用自动混合精度，还应该了解训练时，显存究竟在哪些...
我的文章 PyTorch 叶子张量
孟宝亮2025-07-28124504
叶子张量是 PyTorch 计算图中的一个重要概念，叶子张量指的就是我们的模型参数，而模型参数一般都是我们自己创建的 requires_grad=True 的张...
我的文章 PyTorch 自定义算子（operator）
孟宝亮2025-07-2898901
PyTorch 算子是 PyTorch 框架的核心组成部分，用于构建神经网络模型、执行计算任务以及进行张量操作。它们提供了丰富的功能、高效的性能和灵活的开发方式...
我的文章 Longformer（Long Document Transformer）
孟宝亮2025-07-2893001
Longformer（Long Document Transformer）是由 Allen Institute for AI（AI2）在 2020 年提出的一种...
我的文章 Bert 模型复杂度
孟宝亮2025-07-28171903
我们通常用模型包含的参数量和计算量来衡量一个模型的复杂度。参数量指的是模型学习参数数量，它决定了模型的大小，以及内存资源的占用，当然，在训练过程中，模型的实际内...
我的文章 PaddleNLP Embedding
孟宝亮2025-07-28114701
PaddleNLP 提供多个开源的预训练词向量模型，使用非常便捷。接下来结合官方给出的详细文档总结下主要的内容。 https://paddlenlp.readt...
我的文章 PaddleNLP Sequence 2 Vector
孟宝亮2025-07-2892504
PaddleNLP 中封装了一些 Encoder，可以帮助我们 sequence 中的多 token 向量转换为 sequence vector，主要方法有： ...
我的文章 TextCNN（CNN for Sentence Classification）
孟宝亮2025-07-28131904
在文本处理中，Conv1D 可以处理序列数据。假设我们有一段文本序列，首先会通过词嵌入将每个单词转换成固定维度的向量，然后使用 Conv1D 对这些向量进行卷积...
我的文章时序卷积网络（Temporal Convolutional Network）
孟宝亮2025-07-28196001
时序卷积网络（TCN）是一种用于处理时序数据的神经网络架构。它在许多任务（如时间序列预测、自然语言处理等）中被认为是替代循环神经网络（RNN）的一个强大模型。 ...
我的文章 VGG（Visual Geometry Group）
孟宝亮2025-07-2892903
VGG 网络模型是在 2014 年 ImageNet 大规模视觉识别挑战赛（ILSVRC）中提出的，该模型在图像分类任务中取得了优异的成绩。VGG 网络的核心思...
我的文章卷积层替换全连接层
孟宝亮2025-07-28109900
在 CV 中，我们常见的任务就是对输入的图像进行分类。在分类层常见的形式是 backbone 特征提取网络之后接一个或多个全连接层来得到标签分数。我们可以用卷积...
我的文章空间金字塔池化（Spatial Pyramid Pooling）
孟宝亮2025-07-28123204
传统的 CNN 通常要求输入图像的尺寸是固定的（例如224×224，这是因为全连接层（Fully Connected Layer）需要固定长度的输入向...

1 … 15 16 17 … 27

我的文章

我的文章 XLNet

我的文章 协同过滤（Collaborative Filtering）

我的文章 焦点损失（focal loss）

我的文章 显存使用分析（PyTorch）

我的文章 PyTorch 叶子张量

我的文章 PyTorch 自定义算子（operator）

我的文章 Longformer（Long Document Transformer）

我的文章 Bert 模型复杂度

我的文章 PaddleNLP Embedding

我的文章 PaddleNLP Sequence 2 Vector

我的文章 TextCNN（CNN for Sentence Classification）

我的文章 时序卷积网络（Temporal Convolutional Network）

我的文章 VGG（Visual Geometry Group）

我的文章 卷积层替换全连接层

我的文章 空间金字塔池化（Spatial Pyramid Pooling）

老孟