C++11 中存在 3 个智能指针,分别是 unique_ptr、shared_ptr、weak_ptr,其他文章中已经讲解前 2 个智能指针的用法,本篇文章从以下3 个方面来讲解 weak_ptr 的使用: 1. w...
智能指针的工厂函数是一个创建智能指针的函数,用于方便地创建特定类型的智能指针对象,这些函数通常都是以 make 开头的函数。比如 1. make_unique std::make_unique 是一个 C++14 中引入...
分词器是我们在使用 transformers 时一个重要的核心组件,它的主要职责就是将输入的原始文本转换为模型需要的格式,例如:对输入的文本添加开始和结束符、填充、计算掩码、转换为索引等等。 1. Tokenizer 使...
我们将会研究下创建和使用模型,我们以 BERT 架构模型为例。 1. 创建模型 如果我们打算创建一个新的模型,即: 从头开始训练一个 BERT 模型,我们可以按照下面步骤来构建模型: 实例化一个用于模型配置的 BertC...
Transformer 通常有数树百万、甚至数百亿的参数,训练和部署这些模型是一项复杂的工作。此外,由于几乎每天都会发布新模型并且每个模型都有自己的实现,使用它们并不是一件容易的事。Transformers 库提供了简单...
谷歌团队在 2017年6月提出了 Transformer 架构,目标是翻译任务。接着又出现了一些有影响力的模型: 2018 年 6 月:GPT 模型,第一个预训练的 Transformer 模型,被用于微调适应各种 NL...
下联模型采用 Seq2Seq + Attention 结构。其计算过程如下: 首先,将上联送入编码器得到对上联的语义理解; 然后,将下联送入解码器得到对下联的语义理解; 接着,计算解码器每一个时间步的输出和编码器各个时间...
上联生成模型比较简单,使用词嵌入层 + GRU + 线性层即可,其训练数据的构造如下: 输入的数据和目标数据相差一个位置,即:输入前一个词预测后一个词。我们每个迭代就向网络中送入一条数据,并计算损失。 1. 词表类 2....
这次的对联生成任务需要两个模型来完成,第一个模型根据首字来生成上联,例如:输入 “月” 预测出 “月似高人明大道”, 第二个模型则根据输入的上联预测出下联,例如:输入 ...
Dockerfile 是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令和说明。例如:我们现在有 ubuntu 18.04 这个基础的 docker 镜像,需要该容器实例中安装我们需要的软件环境,比如安...
Docker 是一个开源的应用容器引擎,使用 Docker 可以将我们的应用程序和其依赖环境打包到一起进行移植、发布,我们就不需要在一台新的机器上为应用程序去安装、配置所需的依赖包、环境变量等。 1. Docker 组件...
当对 Docker 容器执行 stop 时,我们在容器内所做的一些更改就会丢失。我们可以使用以下几种来保存对容器的一些更改: 使用 docker cp 命令,该命令比较适合将个别的一些更改的文件的手动备份到宿主机; 使用...