我的文章

我的文章基于 RNN/GRU/LSTM 手撸实现评论分类模型
孟宝亮2025-07-28112005
本文将从零开始，详细讲解如何使用递归神经网络（RNN/GRU/LSTM）实现文本情感分类。我们将基于 PyTorch 从头构建一个模型，并应用于情感分析任务。内...
我的文章 C++ CUDA Hello World
孟宝亮2025-07-2836800
CUDA（Compute Unified Device Architecture）是由NVIDIA推出的一种并行计算平台和编程模型，旨在利用GPU的强大计算能力...
我的文章基于 AutoAWQ 模型量化压缩
孟宝亮2025-07-2863201
AutoAWQ（Automatic Aware Quantization）是一个基于 AWQ（Activation-aware Weight Quantizat...
我的文章基于 LoRA 高效微调分类任务
孟宝亮2025-07-2834301
直接微调（全量微调）会更新模型的所有参数，根据特定数据集对模型的权重进行全面优化。这种方式能够充分利用模型的全部参数来适应新任务，理论上可以获得最佳性能，但需要...
我的文章基于 GPT2 生成文本摘要
孟宝亮2025-07-28139700
GPT-2（Generative Pre-trained Transformer 2）是 OpenAI 开发的一种基于 Transformer 结构的自回归语言...
我的文章基于 GAN 网络 CIFAR10 生成图像
孟宝亮2025-07-28106604
对抗生成网络（Generative Adversarial Network）是一种深度学习模型，它通过两个神经网络生成器（Generator）和判别器（Disc...
我的文章基于文本语义的图像检索应用
孟宝亮2025-07-2832600
近年来，随着大型语言模型（LLM）的发展，基于文本语义的图像检索技术取得了显著进步。这些模型通过理解复杂的自然语言描述，能够更准确地捕捉文本的语义，从而提高检索...
我的文章实现 Seq2Seq + Attention 生成对联
孟宝亮2025-07-28115702
对联是中国传统文化中的一项独特艺术形式，它不仅要求上下句字数相同，还要对仗工整、意义相对。随着人工智能和自然语言处理技术的进步，如何让机器自动生成符合对联规律的...
我的文章基于 mT5 实现中英翻译
孟宝亮2025-07-2841700
在自然语言处理（NLP）里，中英翻译是个常见的任务。但中文和英文在语法、词序、表达方式上差别很大，所以想要让机器做好翻译并不容易。不过，随着大模型技术的发展...
我的文章变分自编码器（Variational Autoencoder）
孟宝亮2025-07-2852300
变分自编码器（VAE）是一种深度生成模型。它主要由编码器（Encoder）和解码器（Decoder）两部分组成： 1. 基本思想假设模型想要知道如何生...
我的文章 Python Pickle 不可序列化对象处理
孟宝亮2025-07-2856300
在 Python 中，不可序列化对象指的是无法直接使用 pickle 等序列化模块转换为可存储或传输格式的对象。常见的不可序列化对象包括：下面，我们介绍两种...
我的文章绝对位置编码（Absolute Positional Encoding）
孟宝亮2025-07-2889200
在 Transformer 模型中，输入的词向量是没有顺序信息的，比如：我爱你和你爱我两个含义不同句子，在注意力计算时，每个 Token 的表示是相同的，...
我的文章 LangChain 文本向量
孟宝亮2025-07-2815300
1. 向量模型 2. 向量操作
《LangChain 开发实战》
我的文章 LangChain 输出解析
孟宝亮2025-07-2823100
LangChain 中的输出解析器（Output Parser）主要作用是：将大语言模型生成的原始文本转换为结构化的数据格式，方便后续程序处理。比如，你让模...
《LangChain 开发实战》
我的文章 LangChain 链式调用
孟宝亮2025-07-2819300
LangChain 是一个用于构建语言模型应用的强大框架，它支持将多个链”（Chain）组合起来进行复杂的推理任务。所谓链式调用，就是将多个处理步骤像流水线...
《LangChain 开发实战》

1 … 21 22 23 24

我的文章

我的文章 基于 RNN/GRU/LSTM 手撸实现评论分类模型

我的文章 C++ CUDA Hello World

我的文章 基于 AutoAWQ 模型量化压缩

我的文章 基于 LoRA 高效微调分类任务

我的文章 基于 GPT2 生成文本摘要

我的文章 基于 GAN 网络 CIFAR10 生成图像

我的文章 基于文本语义的图像检索应用

我的文章 实现 Seq2Seq + Attention 生成对联

我的文章 基于 mT5 实现中英翻译

我的文章 变分自编码器（Variational Autoencoder）

我的文章 Python Pickle 不可序列化对象处理

我的文章 绝对位置编码（Absolute Positional Encoding）

我的文章 LangChain 文本向量

我的文章 LangChain 输出解析

我的文章 LangChain 链式调用

老孟