在自然语言处理(NLP)中,语言模型的评估是衡量模型表现的重要步骤之一。评估指标多种多样,而其中困惑度(Perplexity)是最常用的评估方法之一。 简单来说,困惑度(Perplexity)是衡量语言模型对给定文本的 ...
图像对比度越高,我们的眼睛对图像细节就更容易识别,此时,图像直方图则在整个像素值范围内(0-255)分布比较均匀,也表明了图像使用了更多的灰度级别,图像的细节表现的更好。对比度较低时,图像的直方图往往集中分布在一个较小的...
face_recognition 是一个基于 dlib 库的人脸识别工具包。主要包括: 该 Python 工具包使用起来也比较简单,我们就通过几个例子来了解下使用方法。也可以直接参考文档,下联链接已经给出: Docume...
图像形态学是根据图像的形状进行的操作,它可以从图像中提取出用于表示图像形状最基本的信息,使得计算机能够更好的理解和识别图像信息。 形态学操作一般针对的是二值图像进行操作。这里简单说下二值图、灰度图、彩色图的区别: 下面是...
传统的 CNN 通常要求输入图像的尺寸是固定的(例如224×224,这是因为全连接层(Fully Connected Layer)需要固定长度的输入向量。然而,实际应用中,图像的尺寸各异,我们需要对输入图像进行...
VGG 网络模型是在 2014 年 ImageNet 大规模视觉识别挑战赛(ILSVRC)中提出的,该模型在图像分类任务中取得了优异的成绩。VGG 网络的核心思想是通过使用小尺寸的卷积核(3×3)和增加网络深...
时序卷积网络(TCN)是一种用于处理时序数据的神经网络架构。它在许多任务(如时间序列预测、自然语言处理等)中被认为是替代循环神经网络(RNN)的一个强大模型。 Paper:https://arxiv.org/pdf/18...
在文本处理中,Conv1D 可以处理序列数据。假设我们有一段文本序列,首先会通过词嵌入将每个单词转换成固定维度的向量,然后使用 Conv1D 对这些向量进行卷积操作,以捕获不同大小的上下文窗口中的特征。 1. 计算过程 ...
PaddleNLP 中封装了一些 Encoder,可以帮助我们 sequence 中的多 token 向量转换为 sequence vector,主要方法有: BoWEncoder CNNEncoder GRUEncod...
PaddleNLP 提供多个开源的预训练词向量模型,使用非常便捷。接下来结合官方给出的详细文档总结下主要的内容。 https://paddlenlp.readthedocs.io/zh/latest/model_zoo/...
我们通常用模型包含的参数量和计算量来衡量一个模型的复杂度。参数量指的是模型学习参数数量,它决定了模型的大小,以及内存资源的占用,当然,在训练过程中,模型的实际内存使用量并不仅仅由参数量来决定 模型的计算量指的是浮点数运算...
Longformer(Long Document Transformer)是由 Allen Institute for AI(AI2)在 2020 年提出的一种 Transformer 变体,旨在高效处理长文本。它的设计...
PyTorch 算子是 PyTorch 框架的核心组成部分,用于构建神经网络模型、执行计算任务以及进行张量操作。它们提供了丰富的功能、高效的性能和灵活的开发方式,是深度学习开发中不可或缺的工具。 什么是 PyTorch ...