机器学习

机器学习 K-means 算法聚类评估方法
孟宝亮2019-01-12139304
K-means 算法中，如何去度量聚类结果的优劣？以及 K 值究竟如何设定更加合适呢？下面我们通过几个方面来介绍下： 1. 误差平方和假设：我们现在有 3 个簇，累加每个簇的所属样本减去其质心的平方和，即为该聚类结果的...
机器学习多分类性能评估方法
孟宝亮2018-07-2736800
在评估多分类模型性能时，我们经常会使用一些指标来衡量其表现。其中，micro-averaging、macro-averaging 和 weighted-averaging 是常见的评估指标之一。它们在衡量分类器的精确度、...
机器学习线性回归（Linear Regression）
孟宝亮2018-07-03118701
线性回归（Linear Regression）是最基础的机器学习算法之一，用于建模因变量（目标变量）与一个或多个自变量（特征）之间的线性关系。它广泛应用于预测分析、统计建模和数据挖掘领域。 1. 决策函数线性回归的核心...
机器学习 Adaboost（Adaptive Boost）
孟宝亮2018-06-18107204
Boosing 是一族可以将弱学习器提升为强学习器的算法。这族算法的工作机制是：先从初始化训练集训练处一个基学习器，再根据学习器的表现对训练样本分布进行调整，使得先前基学习器做错的训练样本在后续受到更多的关注，然后基于调...
机器学习 Teacher Forcing
孟宝亮2018-06-1240004
Teacher Forcing 是一种在训练序列生成模型（如循环神经网络 RNN、长短期记忆网络 LSTM、Transformer 等）时使用的技术。 1. 问题场景 Teacher Forcing 是一种用于训练序列...
机器学习岭回归（Ridge Regression）
孟宝亮2018-06-0311600
在机器学习中，岭回归（Ridge Regression）是一种常用的回归分析方法，它是线性回归的一种变体，通过引入正则化来减小模型的复杂度，防止过拟合，尤其在特征数多且存在多重共线性问题时，岭回归能有效提高预测精度。 1...
机器学习词袋模型（Bag of Words）
孟宝亮2018-03-14179502
词袋模型（Bag-of-Words，BoW）是一种表示和处理文本数据的模型或框架，它提供了一种简单的思想，使得我们能够实现文本转换为数值形式，以便进行进一步的分析，例如：进行新闻分类、文档检索、情感分析等任务。 1. 文...
机器学习 OVO 和 OVR
孟宝亮2018-02-2741800
许多机器学习算法，如支持向量机、逻辑回归等，是针对二元分类设计的，因此需要某种方法来将二分类器进行转换，从而应用于多分类问题。下面两个是常用的方法： 1. One-vs-One OVO 创建多个二分类器来解决多分类问题。...
机器学习《垃圾邮件识别器》内容摘要
孟宝亮2017-12-153235010
视频课程地址：https://space.bilibili.com/429380437 《垃圾邮件识别器》项目旨在开发一个能够支持邮件输入、并自动识别垃圾邮件的窗口应用程序。该项目主要包含以下方面的内容：相信通过本项目...
《垃圾邮件识别器》
机器学习《垃圾邮件识别器》（一）准备工作
孟宝亮2017-12-14485406
我们的开发环境：Win11 + PyCharm 2021.1.3 + Python 3.8.5 1. 虚拟环境 https://mengbaoliang.cn/archives/tag/py-env 接下来，创建 spa...
《垃圾邮件识别器》
机器学习手动实现决策树
孟宝亮2017-09-2862104
为了实现决策树，我们需要完成以下几个函数的编写： calculate_max_info_gain_index：计算每个特征的信息增益，并选择出最优特征 split_dataset_by_feature：拿到最优特征，需要...
机器学习负采样（Negative Sampling）
孟宝亮2017-03-0648000
负采样（Negative Sampling）是一种优化策略，广泛用于词向量训练中，以降低计算复杂度并提高训练效率。本文将重点从词向量训练的角度，讲解负采样的背景问题、优化思路及其实际效果。 1. 问题场景在训练词向量时...
机器学习朴素贝叶斯文本分类案例
孟宝亮2016-10-09202604
我们通过一个案例，来了解朴素贝叶斯如何实现垃圾邮件分类。步骤为：文本转换为数值朴素贝叶斯训练朴素贝叶斯推理我们使用到的训练数据如下：样本标签您中奖了！点击链接领取您的百万大奖。垃圾免费试用我们的产品，不...
机器学习朴素贝叶斯（Naive Bayes）
孟宝亮2016-09-01232402
当我们将贝叶斯公式应用到实际问题中时，我们发现存在问题。接下来，我们结合下面的数据来看看存在哪些问题。数据如下：样本数职业体型是否喜欢 1 程序员超重不喜欢 2 产品匀称喜欢 3 程序员匀称喜欢 4 ...

1 … 15 16

机器学习

机器学习 K-means 算法聚类评估方法

机器学习 多分类性能评估方法

机器学习 线性回归（Linear Regression）

机器学习 Adaboost（Adaptive Boost）

机器学习 Teacher Forcing

机器学习 岭回归（Ridge Regression）

机器学习 词袋模型（Bag of Words）

机器学习 OVO 和 OVR

机器学习 《垃圾邮件识别器》内容摘要

机器学习 《垃圾邮件识别器》（一）准备工作

机器学习 手动实现决策树

机器学习 负采样（Negative Sampling）

机器学习 朴素贝叶斯文本分类案例

机器学习 朴素贝叶斯（Naive Bayes）

基于文本向量实现零样本分类 – 再也不用调参！一文搞懂向量语义分类全流程

C++ 线程局部存储 – 创建线程私有变量的方案

Python 异步编程 – 让程序不再死等，提高效率

基于 dify + xinference + ChatTTS + SenseVoiceSmall 本地搭建语音聊天应用

你的 Python 项目安全吗？Pickle 漏洞揭秘！