下联模型采用 Seq2Seq + Attention 结构。其计算过程如下: 首先,将上联送入编码器得到对上联的语义理解; 然后,将下联送入解码器得到对下联的语义理解; 接着,计算...
上联生成模型比较简单,使用词嵌入层 + GRU + 线性层即可,其训练数据的构造如下: 输入的数据和目标数据相差一个位置,即:输入前一个词预测后一个词。我们每个迭代就向网络中送入一...
这次的对联生成任务需要两个模型来完成,第一个模型根据首字来生成上联,例如:输入 “月” 预测出 “月似高人明大道”, 第二个模型则根...
Dockerfile 是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令和说明。例如:我们现在有 ubuntu 18.04 这个基础的 docker 镜像,需要该...
Docker 是一个开源的应用容器引擎,使用 Docker 可以将我们的应用程序和其依赖环境打包到一起进行移植、发布,我们就不需要在一台新的机器上为应用程序去安装、配置所需的依赖包...
当对 Docker 容器执行 stop 时,我们在容器内所做的一些更改就会丢失。我们可以使用以下几种来保存对容器的一些更改: 使用 docker cp 命令,该命令比较适合将个别的...
Docker 是一个开源的应用容器引擎,使用 Docker 可以将我们的应用程序和其依赖环境打包到一起进行移植、发布,我们就不需要在一台新的机器上为应用程序去安装、配置所需的依赖包...
定点小数是一种用固定位数表示小数部分的数值表示方法。在定点小数中,小数点的位置是固定的,不像浮点数那样可以在数字中的不同位置浮动。 1. 存储原理 使用定点数存储小数,我们首先得先...
1. KL 散度 KL 散度又叫相对熵(relative entropy)、信息散度(information divergence),指的是两个概率分布间差异的非对称性度量。 设 ...
高斯混合模型(Gaussian Mixture Model, GMM)通过多个高斯分布的加权来描述一个随机变量的概率分布,它的公式表示如下: K 表示高斯分布的数量 wi 表示将多...
TextCNN 网络是使用卷积神经网络来解决 NLP 任务的一种网络模型,它利用了了多分支的卷积核来对文本进行特征提取,所以也可以叫多分支的卷积神经网络。 在做图像处理时,我们一般...
在带有注意力机制的 Encoder-Decoder 模型中存在很多注意力机制,本篇文章根据原始论文对 Bahdanau 注意力计算方法和 Luong 注意力计算方法进行总结。 Ba...