CUDA(Compute Unified Device Architecture)是由NVIDIA推出的一种并行计算平台和编程模型,旨在利用GPU的强大计算能力来加速计算密集型任务。 Doc:https://docs.n...
在深度学习和高性能计算领域,浮点数的精度和计算效率一直是关键问题。随着模型规模的不断增大,如何在保持精度的同时提高计算效率成为了一个重要的研究方向。FP8 作为一种新兴的低精度浮点数格式,正在逐渐引起广泛关注。 1. F...
Ollama 是一个开源的人工智能平台,它主要用于提供强大的 AI 模型接口,并帮助开发者和团队快速构建、集成和管理 AI 应用。Ollama 通过提供本地化的 AI 模型,可以帮助用户在不依赖外部 API 的情况下运行...
逻辑回归(Logistic Regression)是一种用于分类问题的统计方法,适用于二分类问题。其核心是通过Sigmoid 函数将线性回归的结果映射到概率区间 [0,1],通常用于预测某事件是否发生。逻辑回归...
std::lock 是一个 C++ 并发工具,用于一次性锁住多个互斥锁(std::mutex),它通过确保锁定顺序一致,避免了死锁的发生。死锁是指程序中有多个共享资源,通常情况下,多个共享资源需要多个互斥锁来保护,以确保...
std::mutex 是 C++11 引入的用于 多线程同步 的类,它提供了 互斥锁(mutex)机制,确保同一时刻只有一个线程能够访问某个共享资源,从而防止多个线程同时修改共享数据时引发 数据竞争 问题。 1. 问题场...
在训练深度模型(如 RNN、Transformer)时,由于网络层数较深,随着训练进行,网络各层的输入分布不断变化,这会导致训练变慢,甚至无法收敛。为了解决这个问题,层归一化(LN)应运而生。它通过标准化每一层的输出,减...
Batch Normalization(BN)主要解决的是内部协变量偏移(Internal Covariate Shift)问题。该问题指的是深度神经网络在训练过程中,每一层的输入分布会随着前面层参数的更新而变化,从而导...
梯度提升树(GBDT,Gradient Boosting Decision Tree)回归是一种集成学习方法,它通过逐步构建多个决策树来优化预测结果,尤其适用于回归问题。GBDT 通过“加法模型”逐步提高模型的预测能力,...
GBDT 是一种强大的集成学习方法,广泛用于分类和回归问题。它属于提升(Boosting)算法的一种,通过多个弱学习器(通常是决策树)结合起来提高模型的准确性。 1. 二分类 对于 GBDT 应用到二分类的场景,其预测过...
在 sklearn 中,LinearSVC 线性支持向量机(SVM)的原始形式支持的两种目标函数类型,分别是 : squared_hinge 是目标函数中的损失项,它是标准的 hinge loss 的平方形式。它可以提供...
感知机(Perceptron)是1958 年由弗兰克·罗森布拉特(Frank Rosenblatt)提出的一个经典线性分类算法。它是机器学习领域最早提出的基于数学规则进行分类的模型之一,适用于解决二分类问题。 作为一种线...
线性判别分析(Linear Discriminant Analysis,简称 LDA)是一种经典的统计学方法,主要用于 特征降维 和 分类问题。课程详细讲解了 LDA 降维和分类的原理。
std::async 是 C++11 引入的一个工具函数,它主要用于在程序中创建 异步任务、延迟任务。本篇文章将通过设计的 6 个示例程序来展示如何利用 std::async 实现异步任务与延迟任务。