人工智能

人工智能 PaddleNLP 数据增强函数
孟宝亮2022-06-0997103
PaddleNLP 库提供了非常简便的文本数据增强实现，主要包括：并且 WordSubstitute 和 WordInsert 还支持 4 种替换和插入方法：其中自定词典简单示例如下：使用示例代码：
人工智能 R-BERT（Relation-BERT）
孟宝亮2022-06-09122002
模型架构来自论文：https://arxiv.org/pdf/1905.08284.pdf，文章内容主要来自对这篇 Paper 的学习。Relation Classification 是一个重要的 NLP 任务，它主要用...
人工智能 PyTorch Ignite Concepts
孟宝亮2022-05-30102400
Ignite 是一个可以帮助我们在 PyTorch 中训练和评估神经网络的高级库。简单来讲，使用该训练库可以让我们的训练代码更加简洁，灵活。工具的安装命令如下： Ignite 中主要有以下 4 个重要概念： Engine...
人工智能 Learning Rate Scheduler（二）
孟宝亮2022-05-28143001
书接上回，上篇文章介绍了 7 种学习率的调整策略，PyTorch 1.11 版本中共有 14 种，本篇文章接着介绍剩下的 7 种学习率调整策略。 lr_scheduler.CosineAnnealingLR lr_sch...
人工智能 Learning Rate Scheduler（一）
孟宝亮2022-05-28159700
torch.optim.lr_scheduler 提供了动态调整学习率的方法。在使用的时， Learning Rate Scheduler 一般在优化器的更新参数之后调用。另外，我们也可以在程序中使用多个 schedul...
人工智能权重衰减（Weight Decay）
孟宝亮2022-05-28287602
当看到 weight decay 时，从字面意思指的是权重参数衰减，会觉得其和 L2 正则化是等价，因为 L2 正则化也能够达到权重衰减的作用，其实概念是不同的。L2 一般作为正则化项是添加到损失函数中，作为损失计算的一...
人工智能 Adam 优化器原理
孟宝亮2022-05-26209704
AdaGrad、RMSProp 针对学习率进行了优化，不同的参数分量在更新时能够使用各自更适合的学习率。Momentum 则是对梯度进行了优化，可以避免碰到鞍点、局部最小值时参数无法更新的情况。我们经常把 Adam 理...
人工智能 AdaGrad 和 RMSProp 优化器原理
孟宝亮2022-05-26118002
我们在使用梯度下降法时应该发现了不同参数分量在更新时使用相同的学习率。注意：不同分量使用的梯度可能是不同的。例如：我们现在有参数向量，它有 3 个分量，使用梯度下降法更新参数时都使用相同的学习率 lr。 AdaGrad ...
人工智能 SGD 优化器原理
孟宝亮2022-05-26121004
我们先回顾下梯度下降法参数更新的公式：从公式，可以很清楚的看到，参数能否学习就看学习率 LR 和梯度 G 了。如果某一点的梯度是 0 的话，那么参数就无法更新。什么时候会出现梯度为 0 的情况？比如局部极小值，另外就是...
人工智能基于 BiLSTM+CRF 实现 NER 任务 – 训练预测
孟宝亮2022-05-25110702
我们接下来编写训练函数、评估函数、预测函数。 1. 训练函数由于我们希望批次输入训练数据，在使用 RNN、GRU、LSTM 时，可以使用 pad_sequence、packed_pad_sequence、pad_pac...
人工智能基于 BiLSTM+CRF 实现 NER 任务 – 模型构建
孟宝亮2022-05-25118800
模型构建主要包括了 CRF 层的实现，以及 BiLSTM 层的实现。其中 CRF 层相对复杂一些，主要有两个较难的难点：一、要计算所有路径的损失，二、要根据发射矩阵回溯最优路径。 1. CRF 层实现 CRF 层实现时计...
人工智能基于 BiLSTM+CRF 实现 NER 任务 – 数据处理
孟宝亮2022-05-25100400
数据处理主要是加在语料、构建词典、以及将数据集转换为索引表示。我们这里会删除句子长度超过 505 的句子。由于构建词典时，是根据训练集数据构建的，所以在对测试集进行编码时，可能会出现 oov 问题，我们直接用 UNK 来...
人工智能 BERT 长度限制
孟宝亮2022-05-24210304
Bert 模型对输入有 512 的长度限制，有时我们的输入会超过 512，此时就需要一些方法来解决，这里总结了一些方法。修改模型的长度限制对输入进行长度截断通过滑动窗口重构输入通过提取关键部分重构输入使用支持长...
人工智能基于 Bert 实现 NER 任务
孟宝亮2022-05-24122203
命名实体识别（Named Entity Recognition，简称 NER）是自然语言处理（NLP）中的一项重要任务，旨在从非结构化文本中识别并分类具有特定意义的实体，如人名、地名、机构名、时间表达、数量、货币和百分比...
人工智能 CRF 层详细实现
孟宝亮2022-05-19144902
BiLSTM + CRF 中的 CRF 层重要的是两个函数的实现，一个是损失的计算，一个是维特比解码算法的实现。前者用于模型在训练过程中学习网络参数，后者用于预测最优的解码输出。 1. 矩阵扩展 CRF 层无论是计算损失...

1 … 11 12 13 … 20

人工智能

人工智能 PaddleNLP 数据增强函数

人工智能 R-BERT（Relation-BERT）

人工智能 PyTorch Ignite Concepts

人工智能 Learning Rate Scheduler（二）

人工智能 Learning Rate Scheduler（一）

人工智能 权重衰减（Weight Decay）

人工智能 Adam 优化器原理

人工智能 AdaGrad 和 RMSProp 优化器原理

人工智能 SGD 优化器原理

人工智能 基于 BiLSTM+CRF 实现 NER 任务 – 训练预测

人工智能 基于 BiLSTM+CRF 实现 NER 任务 – 模型构建

人工智能 基于 BiLSTM+CRF 实现 NER 任务 – 数据处理

人工智能 BERT 长度限制

人工智能 基于 Bert 实现 NER 任务

人工智能 CRF 层详细实现

一个视频轻松搞懂《Python 垃圾回收机制》是咋回事

基于文本向量实现零样本分类 – 再也不用调参！一文搞懂向量语义分类全流程

C++ 线程局部存储 – 创建线程私有变量的方案

Python 异步编程 – 让程序不再死等，提高效率

基于 dify + xinference + ChatTTS + SenseVoiceSmall 本地搭建语音聊天应用