机器学习

机器学习 Learning Rate Scheduler（一）
torch.optim.lr_scheduler 提供了动态调整学习率的方法。在使用的时， Learning Rate Scheduler 一般在优化器的更新参数之后调用。另外，我们也可以在程序中使用...
老孟2025-07-28178900
未分类基于 PEGASUS 生成中文文本摘要
PEGASUS 是一种编码器-解码器模型，接下来我们基于开源的 PEGASUS 预训练模型来微调自己的生成式文本摘要模型。感谢 https://huggingface.co/IDEA-CCNL 给开源...
老孟2025-07-2825504
机器学习基于 GAN 网络 STL10 生成图像
STL-10 是一个用于图像识别和生成任务的数据集，训练集共计 5000 张图片，测试集共计 8000 张，另外包含 100000 张无标签图像，适用于无监督和半监督学习。图像尺寸为 96×96，适合...
老孟2025-07-2817300
机器学习伯努利朴素贝叶斯（Bernoulli NB）
伯努利朴素贝叶斯（Bernoulli Naive Bayes）分类器是一种基于贝叶斯定理的概率分类器，常用于处理文本分类等离散数据。它假设特征之间是条件独立的，并且每个特征都遵循伯努利分布，即每个特征...
老孟2025-07-28170704
机器学习索贝尔算子（Sobel）图像边缘检测
Sobel 算子是一种常用的图像处理工具，它描述了图像中每个像素点处的亮度或颜色值变化方向和强度。它通常用于分析图像的边缘、纹理、形状和其他特征。在二维图像中，梯度通常是两个分量的矢量，分别表示在水...
老孟2025-07-28140202
机器学习 AUC（Area Under the Curve）
AUC（Area Under the Curve）是一种常用二分类评估方法，它指的是 ROC 曲线（Receiver Operating Characteristic Curve）下的面积。 1. R...
老孟2025-07-2881200
机器学习循环神经网络（RNN）
循环神经网络（Recurrent Neural Network, RNN）是一类用于处理序列数据的神经网络。什么是序列数据？序列数据是指按照一定顺序排列的数据集合，其中的每个元素被称为序列的一个项。...
老孟2025-07-2851600
机器学习长短期记忆网络（LSTM）
长短期记忆网络（Long Short-Term Memory，LSTM）是一种特殊的循环神经网络（RNN），与传统的 RNN 相比，在处理涉及较长距离时间依赖的任务中表现出更强的能力。 1. 算法原理...
老孟2025-07-2885500
机器学习门控循环单元（GRU）
门控循环单元（Gated Recurrent Unit, GRU）是一种改进的循环神经网络（RNN）架构，旨在解决传统 RNN 在处理长序列时面临的梯度消失问题。GRU 由 KyungHyun Cho...
老孟2025-07-2874500
机器学习自动混合精度（AMP）
自动混合精度是一种能够提升训练效率的方法。它通过减少训练过程中的显存使用，从而提高 batch_size 大小，加快模型训练。在 PyTorch 中张量默认使用的是 float32 类型，如果我们能够...
老孟2025-07-28194801
机器学习基于 RNN/GRU/LSTM 手撸实现评论分类模型
本文将从零开始，详细讲解如何使用递归神经网络（RNN/GRU/LSTM）实现文本情感分类。我们将基于 PyTorch 从头构建一个模型，并应用于情感分析任务。内容涵盖数据预处理、构建词汇表、分词器、模...
老孟2025-07-28118105
机器学习全量微调 Qwen2.5-0.5B-Instruct 分类任务
Qwen2.5-0.5B-Instruct 是阿里云 Qwen 团队开发的 Qwen2.5 系列语言模型中的一个指令微调模型，参数规模为 0.5B，类型为因果语言模型，经过了预训练（Pretraini...
老孟2025-07-28251022

123

机器学习

机器学习 Learning Rate Scheduler（一）

未分类 基于 PEGASUS 生成中文文本摘要

机器学习 基于 GAN 网络 STL10 生成图像

机器学习 伯努利朴素贝叶斯（Bernoulli NB）

机器学习 索贝尔算子（Sobel）图像边缘检测

机器学习 AUC（Area Under the Curve）

机器学习 循环神经网络（RNN）

机器学习 长短期记忆网络（LSTM）

机器学习 门控循环单元（GRU）

机器学习 自动混合精度（AMP）

机器学习 基于 RNN/GRU/LSTM 手撸实现评论分类模型

机器学习 全量微调 Qwen2.5-0.5B-Instruct 分类任务

文章筛选