PaddleNLP 库提供了非常简便的文本数据增强实现,主要包括: 并且 WordSubstitute 和 WordInsert 还支持 4 种替换和插入方法:...
多分类交叉熵是我们经常使用的一种损失函数,这篇文章总结下关于多分类交叉熵的一些小点,主要有: 1. 整数标签 其中: 示例代码: 程序输出结果: 2. 浮点数标...
模型架构来自论文:https://arxiv.org/pdf/1905.08284.pdf,文章内容主要来自对这篇 Paper 的学习。Relation Cla...
很多资料表明,通过文本数据增强也能够增强模型的分类性能。本篇文章总结几种文本数据增强的方法: 马尔科夫链文本增强 百度回译数据增强 EDA 数据增强 1. 数据...
提到目标检测,我们几乎都是从 R-CNN 开始,这篇文章就对 R-CNN 做一个简单的了解。要内容来自 Paper 《Rich feature hierarch...
PyTorch 中提供了 BCELoss 和 BCEWithLogitsLoss 两个用于计算二分类交叉熵损失的函数。两者的区别如下: BCELoss 要求输入...
ELECTRA(Efficiently Learning an Encoder that Classifies Token Replacements Accur...
主题模型(Topic Model) 是以非监督的方式对文档的隐含语义结构(Latent Semantic Structure)进行聚类的统计模型。它主要被用于自...
我们知道 PCA 能够对信息(矩阵)进行压缩,图像数据也是矩阵形式,所以 PCA 也能够实现对图像数据压缩。 程序输出结果: 上面代码中,我们设置保留原始图像 ...