我的文章

我的文章 TextCNN（CNN for Sentence Classification）
孟宝亮2025-07-28123904
在文本处理中，Conv1D 可以处理序列数据。假设我们有一段文本序列，首先会通过词嵌入将每个单词转换成固定维度的向量，然后使用 Conv1D 对这些向量进行卷积操作，以捕获不同大小的上下文窗口中的特征...
我的文章时序卷积网络（Temporal Convolutional Network）
孟宝亮2025-07-28181701
时序卷积网络（TCN）是一种用于处理时序数据的神经网络架构。它在许多任务（如时间序列预测、自然语言处理等）中被认为是替代循环神经网络（RNN）的一个强大模型。 Paper：https://arxiv....
我的文章 VGG（Visual Geometry Group）
孟宝亮2025-07-2886803
VGG 网络模型是在 2014 年 ImageNet 大规模视觉识别挑战赛（ILSVRC）中提出的，该模型在图像分类任务中取得了优异的成绩。VGG 网络的核心思想是通过使用小尺寸的卷积核（3×...
我的文章卷积层替换全连接层
孟宝亮2025-07-28102900
在 CV 中，我们常见的任务就是对输入的图像进行分类。在分类层常见的形式是 backbone 特征提取网络之后接一个或多个全连接层来得到标签分数。我们可以用卷积层来代替全连接层。接下来，我们看下如何在...
我的文章空间金字塔池化（Spatial Pyramid Pooling）
孟宝亮2025-07-28108504
传统的 CNN 通常要求输入图像的尺寸是固定的（例如224×224，这是因为全连接层（Fully Connected Layer）需要固定长度的输入向量。然而，实际应用中，图像的尺寸各异，我...
我的文章 YOLO V1
孟宝亮2025-07-28100002
YOLO 模型是一种 one-stage 的目标检测方法，相较于 two-stage 的 R-CNN 目标检测方法速度更快，更加适合实时物体检测场景。我们通过以下几个方面来了解下算法思想： YOLO ...
我的文章 C++ Web Framework Oat++ Hello World
孟宝亮2025-07-28207501
Oat++ 是一个开源的 C++ Web 开发框架，接下来通过几篇文章了解下该框架的工作过程以及使用方法。文章主要内容包括： Oat++ 安装过程 Oat++ 基本使用 Document：Oat++ ...
我的文章 C++ Web Framework Oat++ DTO
孟宝亮2025-07-28199703
在请求 URL 时，我们希望返回 json 格式的数据。Oat++序列化的格式是由 Object Mapper 来定义的。使用步骤如下：定义 DTO 数据类，并在该类中定义数据字段在 Hanlde...
我的文章 C++ Web Framework Oat++ Component
孟宝亮2025-07-28183703
在前面例子中，我们在 run 函数中定义一系列需要的组件。这就使得对象的初始化工作和业务代码耦合在一起，如下代码： Oat++ 提供了两个宏 OATPP_CREATE_COMPONENT 和 OATP...
我的文章 C++ Web Framework Oat++ Controller
孟宝亮2025-07-28169001
前面的例子中，每一个请求的 URL 都对应了一个 HttpRequestHandler 类，并实现该类中 handle 函数，如下代码：如果我们设计更多的 URL 就需要写更多的 HttpReque...
我的文章 OpenCV 形态学转换
孟宝亮2025-07-2889702
图像形态学是根据图像的形状进行的操作，它可以从图像中提取出用于表示图像形状最基本的信息，使得计算机能够更好的理解和识别图像信息。形态学操作一般针对的是二值图像进行操作。这里简单说下二值图、灰度图、彩...
我的文章 Python face_recognition 人脸识别
孟宝亮2025-07-2890504
face_recognition 是一个基于 dlib 库的人脸识别工具包。主要包括：该 Python 工具包使用起来也比较简单，我们就通过几个例子来了解下使用方法。也可以直接参考文档，下联链接已经...
我的文章直方图均衡化（Histogram Equalization）
孟宝亮2025-07-28127002
图像对比度越高，我们的眼睛对图像细节就更容易识别，此时，图像直方图则在整个像素值范围内（0-255）分布比较均匀，也表明了图像使用了更多的灰度级别，图像的细节表现的更好。对比度较低时，图像的直方图往往...
我的文章 FFmpeg Hello World
孟宝亮2025-07-2890003
FFmpeg 是一个功能强大、开源的音视频处理工具，可以满足用户在音视频处理方面的各种需求。可以用于录制、转换、编辑、播放和流媒体处理等。它是一个跨平台的工具，支持 Windows、Mac、Linux...
我的文章 FFmpeg AVCodecContext
孟宝亮2025-07-2892000
当我们打开一个多媒体文件时，FFmpeg 会用 AVCodecContext 结构体来存储文件的一些信息和参数，用于后续对文件的一系列操作。本篇就简单介绍下，如何使用 FFmpeg 打开和关闭一个多媒...

1 … 16 17 18 … 28

我的文章

我的文章 TextCNN（CNN for Sentence Classification）

我的文章 时序卷积网络（Temporal Convolutional Network）

我的文章 VGG（Visual Geometry Group）

我的文章 卷积层替换全连接层

我的文章 空间金字塔池化（Spatial Pyramid Pooling）

我的文章 YOLO V1

我的文章 C++ Web Framework Oat++ Hello World

我的文章 C++ Web Framework Oat++ DTO

我的文章 C++ Web Framework Oat++ Component

我的文章 C++ Web Framework Oat++ Controller

我的文章 OpenCV 形态学转换

我的文章 Python face_recognition 人脸识别

我的文章 直方图均衡化（Histogram Equalization）

我的文章 FFmpeg Hello World

我的文章 FFmpeg AVCodecContext