机器学习

机器学习困惑度（Perplexity）
孟宝亮2023-02-2511300
在自然语言处理（NLP）中，语言模型的评估是衡量模型表现的重要步骤之一。评估指标多种多样，而其中困惑度（Perplexity）是最常用的评估方法之一。简单来说，困惑度（Perplexity）是衡量语言模型对给定文本的 ...
机器学习直方图均衡化（Histogram Equalization）
孟宝亮2023-02-17126102
图像对比度越高，我们的眼睛对图像细节就更容易识别，此时，图像直方图则在整个像素值范围内（0-255）分布比较均匀，也表明了图像使用了更多的灰度级别，图像的细节表现的更好。对比度较低时，图像的直方图往往集中分布在一个较小的...
机器学习 Python face_recognition 人脸识别
孟宝亮2023-02-1390304
face_recognition 是一个基于 dlib 库的人脸识别工具包。主要包括：该 Python 工具包使用起来也比较简单，我们就通过几个例子来了解下使用方法。也可以直接参考文档，下联链接已经给出： Docume...
机器学习 OpenCV 形态学转换
孟宝亮2023-02-1189402
图像形态学是根据图像的形状进行的操作，它可以从图像中提取出用于表示图像形状最基本的信息，使得计算机能够更好的理解和识别图像信息。形态学操作一般针对的是二值图像进行操作。这里简单说下二值图、灰度图、彩色图的区别: 下面是...
机器学习 YOLO V1
孟宝亮2022-12-1299702
YOLO 模型是一种 one-stage 的目标检测方法，相较于 two-stage 的 R-CNN 目标检测方法速度更快，更加适合实时物体检测场景。我们通过以下几个方面来了解下算法思想： YOLO V1 模型的输入输出...
机器学习空间金字塔池化（Spatial Pyramid Pooling）
孟宝亮2022-11-13108204
传统的 CNN 通常要求输入图像的尺寸是固定的（例如224×224，这是因为全连接层（Fully Connected Layer）需要固定长度的输入向量。然而，实际应用中，图像的尺寸各异，我们需要对输入图像进行...
机器学习卷积层替换全连接层
孟宝亮2022-11-09102600
在 CV 中，我们常见的任务就是对输入的图像进行分类。在分类层常见的形式是 backbone 特征提取网络之后接一个或多个全连接层来得到标签分数。我们可以用卷积层来代替全连接层。接下来，我们看下如何在下面两种场景下使用卷...
机器学习 VGG（Visual Geometry Group）
孟宝亮2022-11-0886203
VGG 网络模型是在 2014 年 ImageNet 大规模视觉识别挑战赛（ILSVRC）中提出的，该模型在图像分类任务中取得了优异的成绩。VGG 网络的核心思想是通过使用小尺寸的卷积核（3×3）和增加网络深...
机器学习时序卷积网络（Temporal Convolutional Network）
孟宝亮2022-10-29180601
时序卷积网络（TCN）是一种用于处理时序数据的神经网络架构。它在许多任务（如时间序列预测、自然语言处理等）中被认为是替代循环神经网络（RNN）的一个强大模型。 Paper：https://arxiv.org/pdf/18...
机器学习 TextCNN（CNN for Sentence Classification）
孟宝亮2022-10-29123304
在文本处理中，Conv1D 可以处理序列数据。假设我们有一段文本序列，首先会通过词嵌入将每个单词转换成固定维度的向量，然后使用 Conv1D 对这些向量进行卷积操作，以捕获不同大小的上下文窗口中的特征。 1. 计算过程 ...
机器学习 PaddleNLP Sequence 2 Vector
孟宝亮2022-10-2787904
PaddleNLP 中封装了一些 Encoder，可以帮助我们 sequence 中的多 token 向量转换为 sequence vector，主要方法有： BoWEncoder CNNEncoder GRUEncod...
机器学习 PaddleNLP Embedding
孟宝亮2022-10-27108401
PaddleNLP 提供多个开源的预训练词向量模型，使用非常便捷。接下来结合官方给出的详细文档总结下主要的内容。 https://paddlenlp.readthedocs.io/zh/latest/model_zoo/...
机器学习 Bert 模型复杂度
孟宝亮2022-10-24162603
我们通常用模型包含的参数量和计算量来衡量一个模型的复杂度。参数量指的是模型学习参数数量，它决定了模型的大小，以及内存资源的占用，当然，在训练过程中，模型的实际内存使用量并不仅仅由参数量来决定模型的计算量指的是浮点数运算...
机器学习 Longformer（Long Document Transformer）
孟宝亮2022-10-2486701
Longformer（Long Document Transformer）是由 Allen Institute for AI（AI2）在 2020 年提出的一种 Transformer 变体，旨在高效处理长文本。它的设计...
机器学习 PyTorch 自定义算子（operator）
孟宝亮2022-10-2493701
PyTorch 算子是 PyTorch 框架的核心组成部分，用于构建神经网络模型、执行计算任务以及进行张量操作。它们提供了丰富的功能、高效的性能和灵活的开发方式，是深度学习开发中不可或缺的工具。什么是 PyTorch ...

1 … 6 7 8 … 16

机器学习

机器学习 困惑度（Perplexity）

机器学习 直方图均衡化（Histogram Equalization）

机器学习 Python face_recognition 人脸识别

机器学习 OpenCV 形态学转换

机器学习 YOLO V1

机器学习 空间金字塔池化（Spatial Pyramid Pooling）

机器学习 卷积层替换全连接层

机器学习 VGG（Visual Geometry Group）

机器学习 时序卷积网络（Temporal Convolutional Network）

机器学习 TextCNN（CNN for Sentence Classification）

机器学习 PaddleNLP Sequence 2 Vector

机器学习 PaddleNLP Embedding

机器学习 Bert 模型复杂度

机器学习 Longformer（Long Document Transformer）

机器学习 PyTorch 自定义算子（operator）

一个视频轻松搞懂《Python 垃圾回收机制》是咋回事

基于文本向量实现零样本分类 – 再也不用调参！一文搞懂向量语义分类全流程

C++ 线程局部存储 – 创建线程私有变量的方案

Python 异步编程 – 让程序不再死等，提高效率

基于 dify + xinference + ChatTTS + SenseVoiceSmall 本地搭建语音聊天应用