一亩三分地 - 第 18 页 - 专注于分享 Linux C/C++、 Python、机器学习、深度学习、大模型等方面的技术课程！

机器学习更多

《FastText 工具使用》

《FastText 工具使用》

《决策树》

《决策树》

《垃圾邮件识别器》

《垃圾邮件识别器》

《手写数字识别器》

《手写数字识别器》

《随机森林》

《随机森林》

《高斯混合模型》

《高斯混合模型》

本地搭建语音聊天应用

本地搭建语音聊天应用

基于 llama-factory 大语言模型微调实战

基于 llama-factory 大语言模型微调实战

《C++ 智能指针》

《C++ 智能指针》

《Google Protobuf》

《Google Protobuf》

C++ std::lock 避免死锁

C++ std::lock 避免死锁

C++ std::async 工具使用

C++ std::async 工具使用

C++ std::thread 使用详解

C++ std::thread 使用详解

Google gRPC 编译、安装、使用

Google gRPC 编译、安装、使用

C++ std::ref 引用包装器

C++ std::ref 引用包装器

C++ std::bind 函数适配器

C++ std::bind 函数适配器

Python更多

《Python Gradio》

《Python Gradio》

《Python 开发环境》

《Python 开发环境》

《Python飞机大战》

《Python飞机大战》

Python 异步编程

Python 异步编程

Python Pickle 反序列化漏洞

Python Pickle 反序列化漏洞

Python Joblib 工具使用

Python Joblib 工具使用

Faiss 向量检索库

Faiss 向量检索库

Python 可变和不可变类型

Python 可变和不可变类型

机器学习 XGBoost 解决多分类问题
孟宝亮2023-03-30276303
分类问题主要分为二分类、多分类。我们先推导一下 XGB 是如何解决二分类问题，再去理解 XGB 如何解决多分类问题。二分类问题时，我们一般会使用 Simoid 函数，将模型的输出值映射到 0-1 范围内，得到模型预测 ...
机器学习 XGBoost（Extreme Gradient Boosting）
孟宝亮2023-03-29194402
XGBoost 是对 GBDT 算法的改进。其改进主要如下：损失函数求解使用了泰勒二阶展开; 损失函数中添加了正则化项; XGBoost 损失函数如下：第一部分真实值和预测值之间的经验损失，第二部分是正则化项。一般来...
Linux C/C++给 Python 构建 C++ 扩展模块
孟宝亮2023-03-27143802
我们知道 C++代码的执行效率大多数情况下都会优于 Python 代码。当我们开发一个 Python 工具，分享时，使用者就可以通过 pip install xxx 的方式安装我们的工具，我们将该工具包中某些运行效率太低...
机器学习 SimCSE 对比学习训练句向量思路
孟宝亮2023-03-21118401
SimCSE 提出一种基于 Dropout，把 Dropout 作为一种数据增强方法的无监督训练 sentence embedding 的方法。 Paper：https://aclanthology.org/2021.e...
机器学习 CasRel 关系三元组抽取网络
孟宝亮2023-03-21106702
构建知识图谱最重要的工作就是从非结构化的文本中抽取关系三元组 (subject，relation，object), 原来的方法我们都是组装一个 pipeline 来完成这项工作，比如：先训练一个 NER 模型进行实体抽取...
PYTHON 基于 GAN 网络 STL10 生成图像
孟宝亮2023-03-195800
STL-10 是一个用于图像识别和生成任务的数据集，训练集共计 5000 张图片，测试集共计 8000 张，另外包含 100000 张无标签图像，适用于无监督和半监督学习。图像尺寸为 96×96，适合作为生成模型的训练数...
机器学习 Bert MHA 源码分析
孟宝亮2023-03-13105700
我们在使用 Bert 模型时，对每一个 token 的表征计算都是通过其内部的自注意力机制来完成的，具体就是由 Bert 模型的 BertAttention 来负责自注意力计算，分析的实现代码是 transformers...

1 … 17 18 19 … 59