老孟的文章

我是一名 80 后，写过多年代码，讲过很多年课，积累了丰富经验。如今，想把这些经验整理，通过我的博客分享给大家。点击前往老的B站主页

机器学习《随机森林》（三）算法细节
对于随机森林算法而言，预测过程非常简单，易于理解。理解的重点是其如何训练多个基学习器来构建强学习器。 1. 有放回采样随机森林基于原始训练集通过有放回的采样（Bootstrap Sampling）产...
老孟2023-09-1766601
机器学习《随机森林》（四）算法实现
scikit-learn 提供了 RandomForestClassifier 和 RandomForestRegressor 两个随机森林的实现，用于分类和回归任务。为了能够更好的使用随机森林，我们...
老孟2023-09-1662401
Python Python 可变和不可变类型
在 Python 中存在 int、str、float、bool 等基本数据类型，也存在 list、tuple、set、dict 这样的容器数据类型。这些数据类型被划分为可变（mutable）和不可变（...
老孟2023-07-06179400
机器学习补集朴素贝叶斯（Complement NB）
Complement Naive Bayes (CNB) 是对多项式朴素贝叶斯 (Multinomial Naive Bayes, MNB) 的一种改进。它主要针对多项式朴素贝叶斯在处理类别不平衡问题...
老孟2023-06-27155700
Python Python gRPC
Google gRPC（Google Remote Procedure Call）是一个高性能、开源的远程过程调用框架，它允许客户端直接调用远程服务器上的方法，就像调用本地方法一样，屏蔽了网络通信的复...
老孟2023-06-0316001
Python 《FastText 工具使用》（一）准备工作
前置要求：了解 Word2Vec 中的 Skip-Gram 和 CBOW 模型，以及负采样、层次 SoftMax 知识。 FastText 在 2016 年发布时，是当时最先进的词嵌入模型之一。它具...
老孟2022-12-30125407
Python 《FastText 工具使用》（二）训练词向量
词向量就是将自然语言中的词使用数值向量表示，例如我们将每个词使用 5 维向量表示：词向量可以是任意的维度，32、64、512、768、1024… 等等。将文本表示为数值向量之后，就可以使...
老孟2022-12-29110502
Python 《FastText 工具使用》（三）词向量模型
FastText 的预训练模型通常是使用大规模文本语料库进行训练得到的，因此可以捕获单词的语义和语法信息。这些预训练模型的优势在于它们可以为各种语言和领域提供通用的语义表示，从而在具有限制的数据情况下...
老孟2022-12-28133603
Python 《FastText 工具使用》（四）训练文本分类
文本分类是一种自然语言处理（NLP）任务，旨在将文本数据分配到预定义的类别或标签中。在文本分类任务中，算法接收输入的文本数据，并根据其内容或语义特征将其分配到一个或多个类别中。文本分类在许多现实世界...
老孟2022-12-26140323
Python 《FastText 工具使用》（五）文本分类模型
FastText 提供了预训练的文本分类模型，它是在大规模文本数据上进行训练得到的，并且通常具有良好的泛化能力。这些预训练的分类模型可用于快速搭建文本分类系统，无需从头开始训练模型，省去了大量数据收集...
老孟2022-12-2673300
C/C++C++ 线程局部存储（TLS）
在 C++ 多线程编程中，线程局部存储（Thread Local Storage）是一项非常重要且值得深入理解的技术。它在提升线程安全性、简化并发设计中发挥着关键作用，是每一位 C++ 开发者都应...
老孟2022-12-2153701
C/C++C++ 函数的动态绑定
函数调用绑定（Function Call Binding）指的是将一个函数调用与相应的函数定义（实现）关联起来的过程。 1. 函数绑定对于 C++ 程序而言，将函数查找、关联的过程放在编译期完成，在...
老孟2022-05-2896400

1...9 101112 13...16

老孟的文章

机器学习 《随机森林》（三）算法细节

机器学习 《随机森林》（四）算法实现

Python Python 可变和不可变类型

机器学习 补集朴素贝叶斯（Complement NB）

Python Python gRPC

Python 《FastText 工具使用》（一）准备工作

Python 《FastText 工具使用》（二）训练词向量

Python 《FastText 工具使用》（三）词向量模型

Python 《FastText 工具使用》（四）训练文本分类

Python 《FastText 工具使用》（五）文本分类模型

C/C++C++ 线程局部存储（TLS）

C/C++C++ 函数的动态绑定

老孟 的文章

老孟的文章