机器学习

机器学习补集朴素贝叶斯（Complement NB）
孟宝亮2023-06-27142600
Complement Naive Bayes (CNB) 是对多项式朴素贝叶斯 (Multinomial Naive Bayes, MNB) 的一种改进。它主要针对多项式朴素贝叶斯在处理类别不平衡问题时表现不佳的情况进行...
机器学习 Neo4j 简单使用
孟宝亮2023-04-28113900
我们构建一个《水浒传》中 108 好汉的知识图谱，问答系统的设置问题围绕该知识图谱设计。这一步主要包含两部分：爬取数据构建图谱 1. 爬取数据数据中一部分从百度百科爬取，一部分则手动构建。 2. 构建图谱这一步实...
机器学习 AdaBelief 优化器原理
孟宝亮2023-04-11146400
Paper：https://arxiv.org/pdf/2010.07468.pdf
机器学习 Bert 学习 OpenAI 句向量
孟宝亮2023-04-09137003
OpenAI 提供了 text-embedding-ada-002 模型用于计算输入 sentence 的向量表示。该模型包括一个多层双向 Transformer 编码器和一个平均池化层，用于将编码器的输出转换为固定长度...
机器学习基于 OpenAI 微调分类模型
孟宝亮2023-04-09148503
基于 OpenAI 的模型进行分类任务微调，大致需要以下几个步骤： Doc：https://platform.openai.com/docs/api-reference/fine-tunes 1. 准备数据原始数据内容...
机器学习 OpenAI Moderation
孟宝亮2023-04-09145604
内容审核（Moderation）是指对在线内容，如评论、消息和帖子进行审核和监控，以确保它们符合特定平台或社区的规则和政策。内容审核可以通过人工审核或自动化系统来执行，其目的是防止有害或不适当的内容被共享。内容审核在在...
机器学习基于 OpenAI 实现文本相似度匹配
孟宝亮2023-04-09172300
使用 embeddings 可以实现如下的一些 NLP 任务：搜索(根据与查询字符串的相关性对结果进行排名) 聚类(文本字符串按相似度分组) 推荐(推荐具有相关文本字符串的项) 异常检测(识别相关性很小的异常值) 多样...
机器学习 OpenAI 模型解码参数
孟宝亮2023-04-07165102
Completions 是指GPT模型接收一个输入字符串，然后自动生成一个完成的输出字符串。这种功能通常用于生成文本，例如自动生成文章、电子邮件回复或聊天记录等。用户可以指定输入字符串的前缀，然后让模型生成可能的后缀。这...
机器学习 XGBoost 解决多分类问题
孟宝亮2023-03-30282303
分类问题主要分为二分类、多分类。我们先推导一下 XGB 是如何解决二分类问题，再去理解 XGB 如何解决多分类问题。二分类问题时，我们一般会使用 Simoid 函数，将模型的输出值映射到 0-1 范围内，得到模型预测 ...
机器学习 XGBoost（Extreme Gradient Boosting）
孟宝亮2023-03-29198302
XGBoost 是对 GBDT 算法的改进。其改进主要如下：损失函数求解使用了泰勒二阶展开; 损失函数中添加了正则化项; XGBoost 损失函数如下：第一部分真实值和预测值之间的经验损失，第二部分是正则化项。一般来...
机器学习 SimCSE 对比学习训练句向量思路
孟宝亮2023-03-21121301
SimCSE 提出一种基于 Dropout，把 Dropout 作为一种数据增强方法的无监督训练 sentence embedding 的方法。 Paper：https://aclanthology.org/2021.e...
机器学习 CasRel 关系三元组抽取网络
孟宝亮2023-03-21112802
构建知识图谱最重要的工作就是从非结构化的文本中抽取关系三元组 (subject，relation，object), 原来的方法我们都是组装一个 pipeline 来完成这项工作，比如：先训练一个 NER 模型进行实体抽取...
机器学习 Bert MHA 源码分析
孟宝亮2023-03-13108900
我们在使用 Bert 模型时，对每一个 token 的表征计算都是通过其内部的自注意力机制来完成的，具体就是由 Bert 模型的 BertAttention 来负责自注意力计算，分析的实现代码是 transformers...
机器学习基于 SKEP 模型实现观点抽取
孟宝亮2023-03-11104002
SKEP 通过情感知识增强型而得到的预训练的 transformer 模型，能够更好的用于情感分类场景。该模型如下图所示： SKEP 模型掩码策略称为 Hybrid Sentiment Masking，它将输入序列中的 ...
机器学习 SpanBERT
孟宝亮2023-02-28108303
SpanBERT 是由 Facebook AI 在 2019 年提出的一种改进版本的 BERT。它的核心改进点在于增强对 span（文本片段）的表示能力，从而在涉及实体识别、关系抽取等任务时比 BERT 表现更优。...

1 … 5 6 7 … 16

机器学习

机器学习 补集朴素贝叶斯（Complement NB）

机器学习 Neo4j 简单使用

机器学习 AdaBelief 优化器原理

机器学习 Bert 学习 OpenAI 句向量

机器学习 基于 OpenAI 微调分类模型

机器学习 OpenAI Moderation

机器学习 基于 OpenAI 实现文本相似度匹配

机器学习 OpenAI 模型解码参数

机器学习 XGBoost 解决多分类问题

机器学习 XGBoost（Extreme Gradient Boosting）

机器学习 SimCSE 对比学习训练句向量思路

机器学习 CasRel 关系三元组抽取网络

机器学习 Bert MHA 源码分析

机器学习 基于 SKEP 模型实现观点抽取

机器学习 SpanBERT

一个视频轻松搞懂《Python 垃圾回收机制》是咋回事

基于文本向量实现零样本分类 – 再也不用调参！一文搞懂向量语义分类全流程

C++ 线程局部存储 – 创建线程私有变量的方案

Python 异步编程 – 让程序不再死等，提高效率

基于 dify + xinference + ChatTTS + SenseVoiceSmall 本地搭建语音聊天应用