我的文章

我的文章近似近邻算法（ANNOY）
孟宝亮2025-07-28125103
ANNOY（Approximate Nearest Neighbors Oh Yeah）算法能够帮助我们高效的查找近邻的 N 个向量。其基本原理：就是将所有向量按照空间进行划分，直到子空间小于等于 K...
我的文章 Sentence Transformers
孟宝亮2025-07-28232502
Sentence Transformers 是由 Hugging Face 维护的开源 Python 库，通过深度学习模型捕捉文本的语义信息，转换为数值向量表示。基于这些向量可以实现语义相似度计算、文...
我的文章更加鲁棒的 RoBERTa 模型
孟宝亮2025-07-2892302
RoBERTa（Robustly Optimized BERT Pretraining Approach）是 Meta AI（Facebook AI）在 2019 年提出的一种优化版 BERT。它的核...
我的文章用于文本摘要 Pegasus 预训练模型
孟宝亮2025-07-28102703
Pegasus（Pre-training with Extracted Gap-sentences for Abstractive Summarization）是一个用于文本摘要的预训练模型，最初由 ...
我的文章 Unigram Tokenization
孟宝亮2025-07-2828300
Unigram 算法通常用于 SentencePiece，这是 AlBERT、T5、mBART、Big Bird 和 XLNet 等模型使用的分词算法。它从一个较大的词汇表开始，然后逐步删除其中的 ...
我的文章 XLNet
孟宝亮2025-07-28153102
XLNet 是 Google Brain 和 CMU（卡内基梅隆大学）联合提出的一种自回归语言模型，它结合了 Transformer-XL 结构，并在双向上下文建模方面优于 BERT。XLNet ...
我的文章协同过滤（Collaborative Filtering）
孟宝亮2025-07-28105704
协同过滤推荐（Collaborative Filtering Recommendation）：该算法的核心是分析用户的兴趣和行为，利用共同行为习惯的群体有相似喜好的原则，推荐用户感兴趣的信息。基于用...
我的文章焦点损失（focal loss）
孟宝亮2025-07-28124500
在分类问题中，会碰到样本类别不均衡的情况。此时，模型为了能够降低损失，会去尽量学习多数样本，导致对少数类别样本的学习减弱。举个不太恰当的例子，我们有数学和语文两个科目，其中数学的学习资料特别多，而语...
我的文章显存使用分析（PyTorch）
孟宝亮2025-07-28173900
我们一直使用 PyTorch 进行模型训练，有时会出现显存不足的情况。除了找到对应的解决办法，比如：累加梯度、使用自动混合精度，还应该了解训练时，显存究竟在哪些环节被大量占用。主要有以下四个环节： C...
我的文章 PyTorch 叶子张量
孟宝亮2025-07-28120404
叶子张量是 PyTorch 计算图中的一个重要概念，叶子张量指的就是我们的模型参数，而模型参数一般都是我们自己创建的 requires_grad=True 的张量。它位于整个计算图的开始位置，比如下面...
我的文章 PyTorch 自定义算子（operator）
孟宝亮2025-07-2893801
PyTorch 算子是 PyTorch 框架的核心组成部分，用于构建神经网络模型、执行计算任务以及进行张量操作。它们提供了丰富的功能、高效的性能和灵活的开发方式，是深度学习开发中不可或缺的工具。什么...
我的文章 Longformer（Long Document Transformer）
孟宝亮2025-07-2887201
Longformer（Long Document Transformer）是由 Allen Institute for AI（AI2）在 2020 年提出的一种 Transformer 变体，旨在高效...
我的文章 Bert 模型复杂度
孟宝亮2025-07-28163403
我们通常用模型包含的参数量和计算量来衡量一个模型的复杂度。参数量指的是模型学习参数数量，它决定了模型的大小，以及内存资源的占用，当然，在训练过程中，模型的实际内存使用量并不仅仅由参数量来决定模型的计...
我的文章 PaddleNLP Embedding
孟宝亮2025-07-28108701
PaddleNLP 提供多个开源的预训练词向量模型，使用非常便捷。接下来结合官方给出的详细文档总结下主要的内容。 https://paddlenlp.readthedocs.io/zh/latest/...
我的文章 PaddleNLP Sequence 2 Vector
孟宝亮2025-07-2888104
PaddleNLP 中封装了一些 Encoder，可以帮助我们 sequence 中的多 token 向量转换为 sequence vector，主要方法有： BoWEncoder CNNEncode...

1 … 15 16 17 … 28

我的文章

我的文章 近似近邻算法（ANNOY）

我的文章 Sentence Transformers

我的文章 更加鲁棒的 RoBERTa 模型

我的文章 用于文本摘要 Pegasus 预训练模型

我的文章 Unigram Tokenization

我的文章 XLNet

我的文章 协同过滤（Collaborative Filtering）

我的文章 焦点损失（focal loss）

我的文章 显存使用分析（PyTorch）

我的文章 PyTorch 叶子张量

我的文章 PyTorch 自定义算子（operator）

我的文章 Longformer（Long Document Transformer）

我的文章 Bert 模型复杂度

我的文章 PaddleNLP Embedding

我的文章 PaddleNLP Sequence 2 Vector