我的文章

我的文章平衡二叉树实现（Balanced Binary Tree）
孟宝亮2025-07-28124302
平衡二叉树（Balanced Binary Tree）是二叉查找树的一个进化体，也是第一个引入平衡概念的二叉树。1962年，G.M. Adelson-Velsk...
我的文章霍夫曼编码算法（Huffman Coding）
孟宝亮2025-07-28236802
霍夫曼编码（英语：Huffman Coding），又译为哈夫曼编码、赫夫曼编码，是一种用于无损数据压缩的熵编码（权编码）算法。由大卫·霍夫曼在1952年发明。熵...
我的文章动态规划（Dynamic Programming）
孟宝亮2025-07-28139303
20世纪50年代初，美国数学家贝尔曼（R.Bellman）等人在研究多阶段决策过程的优化问题时，提出了著名的最优化原理，从而创立了动态规划。在现实生活中，有类...
我的文章最长公共子序列（LCS）
孟宝亮2025-07-28134102
最长公共子序列是一个非常实用的问题，它可以描述两段文本之间的 “相似程度”。所谓的子序列就是从原来的序列中取出一部分做成新的序列，新的序...
我的文章基于 Doc2vec 训练 sentence 向量
孟宝亮2025-07-28110802
如何将一个句子、段落、或者文档用一个向量表示？词袋模型，该模型将每个文档转换为固定长度的整数向量。例如，给定以下句子：模型输出向量：每个向量有 10 个元素...
我的文章因子分解机（Factorization Machine）
孟宝亮2025-07-28157202
线性回归在建模的时候，只考虑到了单个特征的影响。但是有些场景下，添加组合特征（交叉特征）会给模型带来非常好的效果。 POLY2 算法（二阶多项式）在线性回归基础...
我的文章增量学习（Incremental Learning）
孟宝亮2025-07-28186100
我们使用的算法模型中大都是批量学习（Batch Learning）模式，即：假设在训练之前所有训练样本一次都可以得到，学习这些样本之后，学习过程就终止了，不再学...
我的文章 Ernie 中文情感分类任务
孟宝亮2025-07-28133000
情感分析本质是一个文本分类任务。PaddleNLP 内置了 ERNIE、BERT、RoBERTa、Electra 等丰富的预训练模型，并且内置了各种预训练模型对...
我的文章从 Bert 到 BiLSTM 知识蒸馏
孟宝亮2025-07-2896603
我们使用的是 TNEWS 数据集，该数据集来自今日头条的新闻版块，共提取了15个类别的新闻，包括旅游，教育，金融，军事等。数据量：训练集(53,360)，验证集...
我的文章模型剪枝（Model Pruning）
孟宝亮2025-07-28104602
对模型进行剪枝，使得模型参数稀疏化可以降低模型的复杂度，也能够一定程度上加快模型的计算速度。我们知道决策树通过剪枝能够起到正则化，防止过拟合。在深度学习模型中，...
我的文章近似近邻算法（ANNOY）
孟宝亮2025-07-28130803
ANNOY（Approximate Nearest Neighbors Oh Yeah）算法能够帮助我们高效的查找近邻的 N 个向量。其基本原理：就是将所有向量...
我的文章 Sentence Transformers
孟宝亮2025-07-28254702
Sentence Transformers 是由 Hugging Face 维护的开源 Python 库，通过深度学习模型捕捉文本的语义信息，转换为数值向量表示...
我的文章更加鲁棒的 RoBERTa 模型
孟宝亮2025-07-2897802
RoBERTa（Robustly Optimized BERT Pretraining Approach）是 Meta AI（Facebook AI）在 201...
我的文章用于文本摘要 Pegasus 预训练模型
孟宝亮2025-07-28108003
Pegasus（Pre-training with Extracted Gap-sentences for Abstractive Summarization）...
我的文章 Unigram Tokenization
孟宝亮2025-07-2840100
Unigram 算法通常用于 SentencePiece，这是 AlBERT、T5、mBART、Big Bird 和 XLNet 等模型使用的分词算法。它从一...

1 … 14 15 16 … 27

我的文章

我的文章 平衡二叉树实现（Balanced Binary Tree）

我的文章 霍夫曼编码算法（Huffman Coding）

我的文章 动态规划（Dynamic Programming）

我的文章 最长公共子序列（LCS）

我的文章 基于 Doc2vec 训练 sentence 向量

我的文章 因子分解机（Factorization Machine）

我的文章 增量学习（Incremental Learning）

我的文章 Ernie 中文情感分类任务

我的文章 从 Bert 到 BiLSTM 知识蒸馏

我的文章 模型剪枝（Model Pruning）

我的文章 近似近邻算法（ANNOY）

我的文章 Sentence Transformers

我的文章 更加鲁棒的 RoBERTa 模型

我的文章 用于文本摘要 Pegasus 预训练模型

我的文章 Unigram Tokenization

老孟