我的文章

我的文章层归一化（Layer Normalization）
老孟2025-07-28235603
在训练深度模型（如 RNN、Transformer）时，由于网络层数较深，随着训练进行，网络各层的输入分布不断变化，这会导致训练变慢，甚至无法收敛。为了解决这个问题，层归一化（LN）应运而生。它通过标...
我的文章逻辑回归原始形式（Logistic Regression）
老孟2025-07-28149003
逻辑回归（Logistic Regression）是一种用于分类问题的统计方法，适用于二分类问题。其核心是通过Sigmoid 函数将线性回归的结果映射到概率区间 [0,1]，通常用于预测某事...
我的文章 C++ std::mutex 互斥锁
老孟2025-07-2827700
std::mutex 是 C++11 引入的用于多线程同步的类，它提供了互斥锁（mutex）机制，确保同一时刻只有一个线程能够访问某个共享资源，从而防止多个线程同时修改共享数据时引发数据竞争 ...
我的文章注意力机制（Self-Attention Mechanism）
老孟2025-07-281300
自注意力机制是 Transformer 架构的核心组件，它最早在 2017 年的论文《Attention Is All You Need》中被提出。它的作用是通过动态地计算每个 token 与其他 t...
我的文章 FP8（8-bit Floating Point）
老孟2025-07-2868600
在深度学习和高性能计算领域，浮点数的精度和计算效率一直是关键问题。随着模型规模的不断增大，如何在保持精度的同时提高计算效率成为了一个重要的研究方向。FP8 作为一种新兴的低精度浮点数格式，正在逐渐引起...
我的文章基于 RNN/GRU/LSTM 手撸实现评论分类模型
老孟2025-07-28104205
本文将从零开始，详细讲解如何使用递归神经网络（RNN/GRU/LSTM）实现文本情感分类。我们将基于 PyTorch 从头构建一个模型，并应用于情感分析任务。内容涵盖数据预处理、构建词汇表、分词器、模...
我的文章 C++ CUDA Hello World
老孟2025-07-2829500
CUDA（Compute Unified Device Architecture）是由NVIDIA推出的一种并行计算平台和编程模型，旨在利用GPU的强大计算能力来加速计算密集型任务。 Doc：http...
我的文章基于 AutoAWQ 模型量化压缩
老孟2025-07-2854601
AutoAWQ（Automatic Aware Quantization）是一个基于 AWQ（Activation-aware Weight Quantization for LLM）算法的自动化量...
我的文章基于 LoRA 高效微调分类任务
老孟2025-07-2824501
直接微调（全量微调）会更新模型的所有参数，根据特定数据集对模型的权重进行全面优化。这种方式能够充分利用模型的全部参数来适应新任务，理论上可以获得最佳性能，但需要大量的计算资源和时间。 LoRA（Low...
我的文章基于 GPT2 生成文本摘要
老孟2025-07-28132100
GPT-2（Generative Pre-trained Transformer 2）是 OpenAI 开发的一种基于 Transformer 结构的自回归语言模型。它以无监督学习的方式在大规模文本数...
我的文章基于 GAN 网络 CIFAR10 生成图像
老孟2025-07-2898004
对抗生成网络（Generative Adversarial Network）是一种深度学习模型，它通过两个神经网络生成器（Generator）和判别器（Discriminator）之间的对抗过程进行训...
我的文章基于文本语义的图像检索应用
老孟2025-07-2821400
近年来，随着大型语言模型（LLM）的发展，基于文本语义的图像检索技术取得了显著进步。这些模型通过理解复杂的自然语言描述，能够更准确地捕捉文本的语义，从而提高检索的精度和效率。基于文本语义的图像检索是...
我的文章实现 Seq2Seq + Attention 生成对联
老孟2025-07-28107302
对联是中国传统文化中的一项独特艺术形式，它不仅要求上下句字数相同，还要对仗工整、意义相对。随着人工智能和自然语言处理技术的进步，如何让机器自动生成符合对联规律的文本，变得越来越有趣也越来越可行。接下来...
我的文章基于 mT5 实现中英翻译
老孟2025-07-2822200
在自然语言处理（NLP）里，中英翻译是个常见的任务。但中文和英文在语法、词序、表达方式上差别很大，所以想要让机器做好翻译并不容易。不过，随着大模型技术的发展，这个难题已经比以前简单了很多。现在，...
我的文章变分自编码器（Variational Autoencoder）
老孟2025-07-2832800
变分自编码器（VAE）是一种深度生成模型。它主要由编码器（Encoder）和解码器（Decoder）两部分组成： 1. 基本思想假设模型想要知道如何生成一张图像，首先得知道该图像的分布，例如...

1 … 24 25 26 … 28

我的文章

我的文章 层归一化（Layer Normalization）

我的文章 逻辑回归原始形式（Logistic Regression）

我的文章 C++ std::mutex 互斥锁

我的文章 注意力机制（Self-Attention Mechanism）

我的文章 FP8（8-bit Floating Point）

我的文章 基于 RNN/GRU/LSTM 手撸实现评论分类模型

我的文章 C++ CUDA Hello World

我的文章 基于 AutoAWQ 模型量化压缩

我的文章 基于 LoRA 高效微调分类任务

我的文章 基于 GPT2 生成文本摘要

我的文章 基于 GAN 网络 CIFAR10 生成图像

我的文章 基于文本语义的图像检索应用

我的文章 实现 Seq2Seq + Attention 生成对联

我的文章 基于 mT5 实现中英翻译

我的文章 变分自编码器（Variational Autoencoder）