SoftMax 函数是深度学习和机器学习中一个非常重要的概念,主要用于处理多分类问题。Softmax 函数能够将一个实数向量映射为一个概率分布,使得输出向量的所有元素都在 0 到 1 之间,并且它们的和为 1。 层次 S...
聚类(Clustering)指的是将一组数据点按照某种规则或者方法分成多个组或簇,使得同一组内的数据点在某种意义上更相似,而不同组之间的数据点相对较不相似。 聚类时,可以基于数据分布、基于数据密度、基于数据相似度、基于图...
TF-IDF(Term Frequency – Inverse Document Frequency)是一种用于信息检索与文本挖掘的常用技术,是进行文本任务的重要算法。
Jieba(结巴)分词是基于 Python 的中文分词工具,以其高性能和简单易用的特点而著称。该工具在信息检索以及文本挖掘等领域广泛应用,成为中文文本处理领域的重要工具。
学习和使用 Python 编码的前提就是要搭建相应的开发环境。虽然搭建过程并不难,但对于很多初学者而言,搭建过程还是会很凌乱。课程将从零开始,演示环境的搭建的过程。