Python 提供了对容器元素构建和操作的两个便捷语法,分别是: 生成式语法:构造容器元素 切片语法:容器元素选择 1. 生成式语法 生成式语法能够实现非常便捷的构建容器元素,下面是使用案例: 1.1 列表生成式 1.2...
容器提供了一组强大而灵活的工具,用于处理和操作数据集合。Python 中常用的容器包括列表(list)、元组(tuple)、字典(dict)、集合(set) ,这些容器中提供了添加、删除、访问和修改元素的功能,使得操作变...
在 Python 中,函数是一种重要的程序结构,用于组织和封装可重复使用的代码块。函数允许开发者将一段特定的逻辑或功能封装成一个独立的单元,并通过函数名和参数列表进行调用。 Python 作为一种语法灵活的编程语言,其函...
多项式朴素贝叶斯(Multinomial Naive Bayes)是朴素贝叶斯分类器的一种变体,主要用于文本分类任务。它是一种基于概率的分类算法,通常适用于处理离散型特征,特别是在文本分类问题中表现良好。 我们以下面数据...
伯努利朴素贝叶斯(Bernoulli Naive Bayes)分类器是一种基于贝叶斯定理的概率分类器,常用于处理文本分类等离散数据。它假设特征之间是条件独立的,并且每个特征都遵循伯努利分布,即每个特征只有两个可能的取值(...
高斯朴素贝叶斯(Gaussian Naive Bayes)是一种基于贝叶斯定理的分类算法,它假设数据的特征遵循高斯(正态)分布,属于朴素贝叶斯分类器的一种。 我们可以基于词频、TF-IDF、Word2Vec 等方法将邮件...
状态机用于描述系统或对象在不同状态之间的转换和行为。它由一组状态(States)、一组可能的事件(Events)和一组状态转换规则(Transitions)组成。 在状态机中,系统或对象可以处于不同的状态,而事件触发状态...
我们构建一个《水浒传》中 108 好汉的知识图谱,问答系统的设置问题围绕该知识图谱设计。这一步主要包含两部分: 爬取数据 构建图谱 1. 爬取数据 数据中一部分从百度百科爬取,一部分则手动构建。 2. 构建图谱 这一步实...
人工智能标记语言(Artificial Intelligence Markup Language,AIML)是由 Richard Wallace 和世界各地的自由软件社区在 1995 年至 2002 年发明的。它是一种基...
OpenAI 提供了 text-embedding-ada-002 模型用于计算输入 sentence 的向量表示。该模型包括一个多层双向 Transformer 编码器和一个平均池化层,用于将编码器的输出转换为固定长度...
基于 OpenAI 的模型进行分类任务微调,大致需要以下几个步骤: Doc:https://platform.openai.com/docs/api-reference/fine-tunes 1. 准备数据 原始数据内容...
内容审核(Moderation)是指对在线内容,如评论、消息和帖子进行审核和监控,以确保它们符合特定平台或社区的规则和政策。内容审核可以通过人工审核或自动化系统来执行,其目的是防止有害或不适当的内容被共享。 内容审核在在...
使用 embeddings 可以实现如下的一些 NLP 任务: 搜索(根据与查询字符串的相关性对结果进行排名) 聚类(文本字符串按相似度分组) 推荐(推荐具有相关文本字符串的项) 异常检测(识别相关性很小的异常值) 多样...
Completions 是指GPT模型接收一个输入字符串,然后自动生成一个完成的输出字符串。这种功能通常用于生成文本,例如自动生成文章、电子邮件回复或聊天记录等。用户可以指定输入字符串的前缀,然后让模型生成可能的后缀。这...
《垃圾邮件识别器》(六)数据处理
2017-12-09阅读(5930)
Faiss 向量检索库
2023-10-06阅读(4871)
《垃圾邮件识别器》(一)准备工作
2017-12-14阅读(4854)
《垃圾邮件识别器》(四)算法理论
2017-12-11阅读(4047)
《垃圾邮件识别器》(七)训练评估
2017-12-09阅读(4041)
jieba 工具使用
2019-02-13阅读(3771)
《垃圾邮件识别器》(五)Scikit-Learn
2017-12-10阅读(3740)
Windows Protobuf 编译安装
2024-05-27阅读(3731)
《垃圾邮件识别器》内容摘要
2017-12-15阅读(3235)
《垃圾邮件识别器》(二)Tkinter
2017-12-13阅读(3118)
向量数据库 milvus 使用
2023-03-11阅读(3051)
BERT
2022-05-04阅读(3048)
C++ 运行时类型识别(RTTI)
2020-12-25阅读(2905)
权重衰减(Weight Decay)
2022-05-28阅读(2865)
《垃圾邮件识别器》(三)界面搭建
2017-12-12阅读(2856)
《垃圾邮件识别器》(八)收尾工作
2017-12-08阅读(2821)
XGBoost 解决多分类问题
2023-03-30阅读(2820)
最新评论