Teacher Forcing 是一种在训练序列生成模型(如循环神经网络 RNN、长短期记忆网络 LSTM、Transformer 等)时使用的技术。 1. 问题场景 Teacher Forcing...
将 SimHei 字体拷贝到 ~/.viritalenvs/虚拟环境目录/ib/python3.7/site-packages/matplotlib/mpl-data/fonts vim ~/.vir...
词袋模型(Bag-of-Words,BoW)是一种表示和处理文本数据的模型或框架,它提供了一种简单的思想,使得我们能够实现文本转换为数值形式,以便进行进一步的分析,例如:进行新闻分类、文档检索、情感分...
在机器学习中,岭回归(Ridge Regression)是一种常用的回归分析方法,它是线性回归的一种变体,通过引入正则化来减小模型的复杂度,防止过拟合,尤其在特征数多且存在多重共线性问题时,岭回归能有...
K-means 算法中,如何去度量聚类结果的优劣?以及 K 值究竟如何设定更加合适呢?下面我们通过几个方面来介绍下: 1. 误差平方和 假设:我们现在有 3 个簇,累加每个簇的所属样本减去其质心的平方...
C 实现链表的方式有多种,这篇文章我们将实现一种简单的单向链表。C 语言中由于没有模板技术,实现能够存储不同类型的数据就需要根据实际需求来设计链表。 一种方法是链表可以只存储用户数据的指针,另外一种则...
第二种链表的实现方式利用了 C99 中可伸缩数组成员这个特性,该特性使得我们在进行链表内存管理时,减少内存的申请和释次数。 第一种实现方式,我们在创建结点时如下图所示: 结点内存需要 malloc 一...
STL 中的 vector 容器就是一个基于模板泛型的动态数组,它和原生数组不同的之处在于:原生数组在定义时需要指定长度,无法随着需要自动增长,而动态数组则可以根据元素个数自动扩展内存。动态数组可以使...
日志能够记录程序中问题信息,用户通过它来检查错误发生的原因。Python logging 模块是一个日志记录的模块。logging 模块的工作流程为: 记录器产生日志信息,并将日志信息封装成 LogR...
根据词的特点将词主要划分为实词和虚词两大类。 实词指的是意义具体的词,包括名词、动词、形容词、数词、量词、代词六大类。 虚词指的是一般不能单独成句,意义比较抽象,有帮助造句作用的词。汉语虚词包括副词、...
Sympy 是 Python 的一个代数计算库。简单来说,可以通过该库进行一些代数计算,比如构建方程,求解方程组,求解导数等等… 下面是使用 Sympy 的简单例子:
依存句法分析是自然语言处理中的一种技术,它可以用来分析句子中心词与词之间的依存关系。在依存句法分析中,每个词都被看作是句子的一个节点,而它们之间的关系则是由边来表示的。这些边描述了不同词之间的依存关系...
PageRank 算法是谷歌根据网页重要程度给网页排名的算法,该值越高说明网页越重要,当用户进行相关搜索时,越有可能优先展现给用户。 我们通过一个例子来理解 PageRank 的算法计算过程,我们现在...
图像的归一化是将不同量纲的特征归一化到指定的范围内,可以消除不同特征量纲的影响。图像规范化则是将图像规范化到相同的分布。两者都有利于加快模型训练、收敛。 1. 归一化 图像的每个像素值的范围是 [0,...