1. 虚拟环境安装 安装 virtualenv 需要使用 pip 命令,我们的全局存在两个版本的 pip,任意选择一个安装即可(我们这里选择使用 pip3.8 来安装 virutalenv 虚拟环境工具)。 virtua...
前面课程中,我们都是手动安装、配置多个版本的 Python 解释器以及 virtualenv 虚拟环境工具。pyenv-win 则是一种更加方便的工具,能够自动下载安装不同版本的解释器、以及虚拟环境的创建。 1. 安装配...
Anaconda 是一个开源的软件包管理和环境管理系统,用于科学计算、数据科学和机器学习。它使用户能够轻松地安装、管理和协调这些工具的版本。Anaconda 还提供了一个名为 Conda 的包管理器,可以方便地安装、更新...
PyCharm是由JetBrains开发的一款专业的Python集成开发环境(IDE)。它提供了丰富的功能,包括代码编辑、调试、测试、版本控制等工具,旨在帮助开发者更高效地进行Python应用程序的开发。 PyCharm...
Jupyter Lab是一种开源的交互式计算环境,支持多种编程语言,最为常用的是 Python。它的名字来源于三种核心编程语言:Julia、Python 和 R。 1. Jupyter Lab 安装 创建虚拟环境: 使用...
word2vec 是基于浅层神经网络的词向量工具,接下来介绍下该工具的安装与使用。 1. word2vec 工具安装 官网地址:Google Code Archive – Long-term storage ...
在机器学习中,K 近邻算法(KNN)是一种经典的监督学习方法,用于分类和回归问题。尽管它是一个简单的算法,但在许多实际应用中,它依然表现出色。尤其是在以下几个场景: 1. 算法原理 KNN 是一种懒学习(Lazy Lea...
在做检索时,我们可以通过关键字召回可能的结果。这里就是两个简单的方法: 基于 Inverted Index 进行召回 基于 TF-IDF 进行召回 1. 基于 Inverted Index 进行召回 这个思路较为简单,比...
贝叶斯公式是概率论中的一个重要公式,它以18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)的名字命名。它用于计算在给定一些先验信息的情况下,估计某一事件的概率。 贝叶斯公式在许多领域中都有广泛的应用,包括统计学...
基于 word2vec + kmeans 实现文本摘要的思路如下: 文本处理:对文本内容进行一些必须的预处理; 分割句子:将文档分割成多个子句; 句子编码:使用 word2vec 或者 bert 对句子进行编码; 文本聚...
二进制向量之间的距离或相似度可以使用以下度量方法: Jaccard 距离 Hanming 距离 Tanimoto 距离 1. Jaccard 相似度 x ∪ y 表示 x 和 y 集合的并集 x ∩ y 表示 x 和 y...
K-means 算法中,如何去度量聚类结果的优劣?以及 K 值究竟如何设定更加合适呢?下面我们通过几个方面来介绍下: 1. 误差平方和 假设:我们现在有 3 个簇,累加每个簇的所属样本减去其质心的平方和,即为该聚类结果的...
手写数字识别是计算机视觉领域的经典问题之一,具有广泛的应用。本课程将深入介绍使用支持向量机(SVM)技术来构建一个高效的手写数字识别系统。学生将学习如何使用SVM进行分类,以及如何提取和使用 HOG 特征来实现数字图像的...
我们的开发环境:Win11 + PyCharm 2021.1.3 + Python 3.8.5 使用下面的命令创建虚拟环境 digit-env: 在虚拟环境中,安装以下项目所需要的工具包: