孟宝亮的文章

有着15年的开发和教学经验，专注于分享 Python、机器学习、深度学习、大模型、以及 Linux C/C++ 等方面的技术课程！

我的文章感知机（Perceptron）
孟宝亮2025-07-28185901
感知机（Perceptron）是1958 年由弗兰克·罗森布拉特（Frank Rosenblatt）提出的一个经典线性分类算法。它是机器学习领域最早提出的基于数...
我的文章自注意力机制（Self-Attention）
孟宝亮2025-07-28128203
多头自注意力机制（Multi-Head Self-Attention）是深度学习中一种用于处理序列数据的重要机制，广泛应用于自然语言处理（NLP）和计算机视觉等...
我的文章线性 SVC 原始形式（Primal）
孟宝亮2025-07-2831100
在 sklearn 中，LinearSVC 线性支持向量机（SVM）的原始形式支持的两种目标函数类型，分别是： squared_hinge 是目标函数中的损失...
我的文章层归一化（Layer Normalization）
孟宝亮2025-07-28294503
在训练深度模型（如 RNN、Transformer）时，由于网络层数较深，随着训练进行，网络各层的输入分布不断变化，这会导致训练变慢，甚至无法收敛。为了解决这个...
我的文章批量归一化（Batch Normalization）
孟宝亮2025-07-28124102
Batch Normalization（BN）主要解决的是内部协变量偏移（Internal Covariate Shift）问题。该问题指的是深度神经网络在训练...
我的文章 FP8（8-bit Floating Point）
孟宝亮2025-07-28151500
在深度学习和高性能计算领域，浮点数的精度和计算效率一直是关键问题。随着模型规模的不断增大，如何在保持精度的同时提高计算效率成为了一个重要的研究方向。FP8 作为...
我的文章注意力机制（Self-Attention Mechanism）
孟宝亮2025-07-284300
自注意力机制是 Transformer 架构的核心组件，它最早在 2017 年的论文《Attention Is All You Need》中被提出。它的作用是通...
我的文章 C++ std::mutex 互斥锁
孟宝亮2025-07-2832700
std::mutex 是 C++11 引入的用于多线程同步的类，它提供了互斥锁（mutex）机制，确保同一时刻只有一个线程能够访问某个共享资源，从而防止多...
我的文章逻辑回归原始形式（Logistic Regression）
孟宝亮2025-07-28154803
逻辑回归（Logistic Regression）是一种用于分类问题的统计方法，适用于二分类问题。其核心是通过Sigmoid 函数将线性回归的结果映射到概率区间...
人工智能全量微调 Qwen2.5-0.5B-Instruct 分类任务
孟宝亮2025-07-28227722
Qwen2.5-0.5B-Instruct 是阿里云 Qwen 团队开发的 Qwen2.5 系列语言模型中的一个指令微调模型，参数规模为 0.5B，类型为因果语...
我的文章基于 LoRA 高效微调分类任务
孟宝亮2025-07-2832301
直接微调（全量微调）会更新模型的所有参数，根据特定数据集对模型的权重进行全面优化。这种方式能够充分利用模型的全部参数来适应新任务，理论上可以获得最佳性能，但需要...
我的文章基于 AutoAWQ 模型量化压缩
孟宝亮2025-07-2861301
AutoAWQ（Automatic Aware Quantization）是一个基于 AWQ（Activation-aware Weight Quantizat...
我的文章 C++ CUDA Hello World
孟宝亮2025-07-2835200
CUDA（Compute Unified Device Architecture）是由NVIDIA推出的一种并行计算平台和编程模型，旨在利用GPU的强大计算能力...
我的文章基于 RNN/GRU/LSTM 手撸实现评论分类模型
孟宝亮2025-07-28109705
本文将从零开始，详细讲解如何使用递归神经网络（RNN/GRU/LSTM）实现文本情感分类。我们将基于 PyTorch 从头构建一个模型，并应用于情感分析任务。内...
我的文章基于文本语义的图像检索应用
孟宝亮2025-07-2830600
近年来，随着大型语言模型（LLM）的发展，基于文本语义的图像检索技术取得了显著进步。这些模型通过理解复杂的自然语言描述，能够更准确地捕捉文本的语义，从而提高检索...

1 … 24 25 26 … 37

孟宝亮的文章

我的文章 感知机（Perceptron）

我的文章 自注意力机制（Self-Attention）

我的文章 线性 SVC 原始形式（Primal）

我的文章 层归一化（Layer Normalization）

我的文章 批量归一化（Batch Normalization）

我的文章 FP8（8-bit Floating Point）

我的文章 注意力机制（Self-Attention Mechanism）

我的文章 C++ std::mutex 互斥锁

我的文章 逻辑回归原始形式（Logistic Regression）

人工智能 全量微调 Qwen2.5-0.5B-Instruct 分类任务

我的文章 基于 LoRA 高效微调分类任务

我的文章 基于 AutoAWQ 模型量化压缩

我的文章 C++ CUDA Hello World

我的文章 基于 RNN/GRU/LSTM 手撸实现评论分类模型

我的文章 基于文本语义的图像检索应用

孟宝亮 的文章

孟宝亮的文章