我的文章

我的文章基于 LoRA 高效微调分类任务
孟宝亮2025-07-2833801
直接微调（全量微调）会更新模型的所有参数，根据特定数据集对模型的权重进行全面优化。这种方式能够充分利用模型的全部参数来适应新任务，理论上可以获得最佳性能，但需要...
我的文章基于 GPT2 生成文本摘要
孟宝亮2025-07-28139200
GPT-2（Generative Pre-trained Transformer 2）是 OpenAI 开发的一种基于 Transformer 结构的自回归语言...
我的文章基于 GAN 网络 CIFAR10 生成图像
孟宝亮2025-07-28106204
对抗生成网络（Generative Adversarial Network）是一种深度学习模型，它通过两个神经网络生成器（Generator）和判别器（Disc...
我的文章基于文本语义的图像检索应用
孟宝亮2025-07-2832000
近年来，随着大型语言模型（LLM）的发展，基于文本语义的图像检索技术取得了显著进步。这些模型通过理解复杂的自然语言描述，能够更准确地捕捉文本的语义，从而提高检索...
我的文章实现 Seq2Seq + Attention 生成对联
孟宝亮2025-07-28114502
对联是中国传统文化中的一项独特艺术形式，它不仅要求上下句字数相同，还要对仗工整、意义相对。随着人工智能和自然语言处理技术的进步，如何让机器自动生成符合对联规律的...
我的文章基于 mT5 实现中英翻译
孟宝亮2025-07-2841400
在自然语言处理（NLP）里，中英翻译是个常见的任务。但中文和英文在语法、词序、表达方式上差别很大，所以想要让机器做好翻译并不容易。不过，随着大模型技术的发展...
我的文章变分自编码器（Variational Autoencoder）
孟宝亮2025-07-2851800
变分自编码器（VAE）是一种深度生成模型。它主要由编码器（Encoder）和解码器（Decoder）两部分组成： 1. 基本思想假设模型想要知道如何生...
我的文章 Python Pickle 不可序列化对象处理
孟宝亮2025-07-2855600
在 Python 中，不可序列化对象指的是无法直接使用 pickle 等序列化模块转换为可存储或传输格式的对象。常见的不可序列化对象包括：下面，我们介绍两种...
我的文章绝对位置编码（Absolute Positional Encoding）
孟宝亮2025-07-2888600
在 Transformer 模型中，输入的词向量是没有顺序信息的，比如：我爱你和你爱我两个含义不同句子，在注意力计算时，每个 Token 的表示是相同的，...
我的文章 LangChain 文本向量
孟宝亮2025-07-2814800
1. 向量模型 2. 向量操作
《LangChain 开发实战》
我的文章 LangChain 输出解析
孟宝亮2025-07-2822700
LangChain 中的输出解析器（Output Parser）主要作用是：将大语言模型生成的原始文本转换为结构化的数据格式，方便后续程序处理。比如，你让模...
《LangChain 开发实战》
我的文章 LangChain 链式调用
孟宝亮2025-07-2819000
LangChain 是一个用于构建语言模型应用的强大框架，它支持将多个链”（Chain）组合起来进行复杂的推理任务。所谓链式调用，就是将多个处理步骤像流水线...
《LangChain 开发实战》
我的文章 LangChain 聊天历史
孟宝亮2025-07-2833700
在使用 LangChain 构建对话系统时，聊天记录的管理、处理是至关重要的一环。本篇文章主要介绍如何存储对话历史，以及如何对对话历史进行处理。 1. 对话历史...
《LangChain 开发实战》
我的文章 LangChain 工具调用
孟宝亮2025-07-2813100
在 LangChain 中，Tool 是一种把 Python 函数和它的调用规范（schema）包装起来的机制，这样模型就可以“请求”调用这个函数并传入参数。 ...
《LangChain 开发实战》
我的文章 LangChain 响应缓存
孟宝亮2025-07-2816900
在 LangChain 中，缓存机制是一种用于提升语言模型调用效率、降低成本的重要手段。其核心思想是：将提示词的响应结果缓存起来，在后续遇到相同或相似的请求时直...
《LangChain 开发实战》

1 … 24 25 26 27

我的文章

我的文章 基于 LoRA 高效微调分类任务

我的文章 基于 GPT2 生成文本摘要

我的文章 基于 GAN 网络 CIFAR10 生成图像

我的文章 基于文本语义的图像检索应用

我的文章 实现 Seq2Seq + Attention 生成对联

我的文章 基于 mT5 实现中英翻译

我的文章 变分自编码器（Variational Autoencoder）

我的文章 Python Pickle 不可序列化对象处理

我的文章 绝对位置编码（Absolute Positional Encoding）

我的文章 LangChain 文本向量

我的文章 LangChain 输出解析

我的文章 LangChain 链式调用

我的文章 LangChain 聊天历史

我的文章 LangChain 工具调用

我的文章 LangChain 响应缓存

老孟