机器学习

机器学习 PyTorch Ignite Concepts
孟宝亮2022-05-30102100
Ignite 是一个可以帮助我们在 PyTorch 中训练和评估神经网络的高级库。简单来讲，使用该训练库可以让我们的训练代码更加简洁，灵活。工具的安装命令如下： Ignite 中主要有以下 4 个重要概念： Engine...
机器学习 Learning Rate Scheduler（二）
孟宝亮2022-05-28142701
书接上回，上篇文章介绍了 7 种学习率的调整策略，PyTorch 1.11 版本中共有 14 种，本篇文章接着介绍剩下的 7 种学习率调整策略。 lr_scheduler.CosineAnnealingLR lr_sch...
机器学习 Learning Rate Scheduler（一）
孟宝亮2022-05-28159400
torch.optim.lr_scheduler 提供了动态调整学习率的方法。在使用的时， Learning Rate Scheduler 一般在优化器的更新参数之后调用。另外，我们也可以在程序中使用多个 schedul...
机器学习权重衰减（Weight Decay）
孟宝亮2022-05-28286502
当看到 weight decay 时，从字面意思指的是权重参数衰减，会觉得其和 L2 正则化是等价，因为 L2 正则化也能够达到权重衰减的作用，其实概念是不同的。L2 一般作为正则化项是添加到损失函数中，作为损失计算的一...
机器学习 Adam 优化器原理
孟宝亮2022-05-26209404
AdaGrad、RMSProp 针对学习率进行了优化，不同的参数分量在更新时能够使用各自更适合的学习率。Momentum 则是对梯度进行了优化，可以避免碰到鞍点、局部最小值时参数无法更新的情况。我们经常把 Adam 理...
机器学习 AdaGrad 和 RMSProp 优化器原理
孟宝亮2022-05-26117702
我们在使用梯度下降法时应该发现了不同参数分量在更新时使用相同的学习率。注意：不同分量使用的梯度可能是不同的。例如：我们现在有参数向量，它有 3 个分量，使用梯度下降法更新参数时都使用相同的学习率 lr。 AdaGrad ...
机器学习 SGD 优化器原理
孟宝亮2022-05-26120204
我们先回顾下梯度下降法参数更新的公式：从公式，可以很清楚的看到，参数能否学习就看学习率 LR 和梯度 G 了。如果某一点的梯度是 0 的话，那么参数就无法更新。什么时候会出现梯度为 0 的情况？比如局部极小值，另外就是...
机器学习基于 BiLSTM+CRF 实现 NER 任务 – 训练预测
孟宝亮2022-05-25109802
我们接下来编写训练函数、评估函数、预测函数。 1. 训练函数由于我们希望批次输入训练数据，在使用 RNN、GRU、LSTM 时，可以使用 pad_sequence、packed_pad_sequence、pad_pac...
机器学习基于 BiLSTM+CRF 实现 NER 任务 – 模型构建
孟宝亮2022-05-25118600
模型构建主要包括了 CRF 层的实现，以及 BiLSTM 层的实现。其中 CRF 层相对复杂一些，主要有两个较难的难点：一、要计算所有路径的损失，二、要根据发射矩阵回溯最优路径。 1. CRF 层实现 CRF 层实现时计...
机器学习基于 BiLSTM+CRF 实现 NER 任务 – 数据处理
孟宝亮2022-05-25100200
数据处理主要是加在语料、构建词典、以及将数据集转换为索引表示。我们这里会删除句子长度超过 505 的句子。由于构建词典时，是根据训练集数据构建的，所以在对测试集进行编码时，可能会出现 oov 问题，我们直接用 UNK 来...
机器学习 BERT 长度限制
孟宝亮2022-05-24210004
Bert 模型对输入有 512 的长度限制，有时我们的输入会超过 512，此时就需要一些方法来解决，这里总结了一些方法。修改模型的长度限制对输入进行长度截断通过滑动窗口重构输入通过提取关键部分重构输入使用支持长...
机器学习基于 Bert 实现 NER 任务
孟宝亮2022-05-24122103
命名实体识别（Named Entity Recognition，简称 NER）是自然语言处理（NLP）中的一项重要任务，旨在从非结构化文本中识别并分类具有特定意义的实体，如人名、地名、机构名、时间表达、数量、货币和百分比...
机器学习 CRF 层详细实现
孟宝亮2022-05-19144502
BiLSTM + CRF 中的 CRF 层重要的是两个函数的实现，一个是损失的计算，一个是维特比解码算法的实现。前者用于模型在训练过程中学习网络参数，后者用于预测最优的解码输出。 1. 矩阵扩展 CRF 层无论是计算损失...
机器学习 BiLSTM + CRF 核心概念理解
孟宝亮2022-05-17182603
对于命名实体识别任务，基于神经网络的方法应用非常常见。其中的 CRF 层对于刚刚接触学习的同学可能不是特别容易理解，下联链接的文章的作者对 CRF 做了非常好的讲解。我认真学习了作者的相关文章，把自己的理解总结下来，想看...
机器学习一个轻量级的 Albert 模型
孟宝亮2022-05-16120000
Albert（A Lite Bert For Self-Supervised Learning Of Language Representations）是对 Bert 的改进，其主要思想就是用更少的参数，取得更好的效果。...

1 … 9 10 11 … 16

机器学习

机器学习 PyTorch Ignite Concepts

机器学习 Learning Rate Scheduler（二）

机器学习 Learning Rate Scheduler（一）

机器学习 权重衰减（Weight Decay）

机器学习 Adam 优化器原理

机器学习 AdaGrad 和 RMSProp 优化器原理

机器学习 SGD 优化器原理

机器学习 基于 BiLSTM+CRF 实现 NER 任务 – 训练预测

机器学习 基于 BiLSTM+CRF 实现 NER 任务 – 模型构建

机器学习 基于 BiLSTM+CRF 实现 NER 任务 – 数据处理

机器学习 BERT 长度限制

机器学习 基于 Bert 实现 NER 任务

机器学习 CRF 层详细实现

机器学习 BiLSTM + CRF 核心概念理解

机器学习 一个轻量级的 Albert 模型

基于文本向量实现零样本分类 – 再也不用调参！一文搞懂向量语义分类全流程

C++ 线程局部存储 – 创建线程私有变量的方案

Python 异步编程 – 让程序不再死等，提高效率

基于 dify + xinference + ChatTTS + SenseVoiceSmall 本地搭建语音聊天应用

你的 Python 项目安全吗？Pickle 漏洞揭秘！