Transformer 通常有数树百万、甚至数百亿的参数,训练和部署这些模型是一项复杂的工作。此外,由于几乎每天都会发布新模型并且每个模型都有自己的实现,使用它们并不是一件容易的事。Transformers 库提供了简单...
谷歌团队在 2017年6月提出了 Transformer 架构,目标是翻译任务。接着又出现了一些有影响力的模型: 2018 年 6 月:GPT 模型,第一个预训练的 Transformer 模型,被用于微调适应各种 NL...
Dockerfile 是一个用来构建镜像的文本文件,文本内容包含了一条条构建镜像所需的指令和说明。例如:我们现在有 ubuntu 18.04 这个基础的 docker 镜像,需要该容器实例中安装我们需要的软件环境,比如安...
Docker 是一个开源的应用容器引擎,使用 Docker 可以将我们的应用程序和其依赖环境打包到一起进行移植、发布,我们就不需要在一台新的机器上为应用程序去安装、配置所需的依赖包、环境变量等。 1. Docker 组件...
当对 Docker 容器执行 stop 时,我们在容器内所做的一些更改就会丢失。我们可以使用以下几种来保存对容器的一些更改: 使用 docker cp 命令,该命令比较适合将个别的一些更改的文件的手动备份到宿主机; 使用...
1. 安装 docker https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository 2. 安装 dify 请先访问 https...
Docker 是一个开源的应用容器引擎,使用 Docker 可以将我们的应用程序和其依赖环境打包到一起进行移植、发布,我们就不需要在一台新的机器上为应用程序去安装、配置所需的依赖包、环境变量等。Docker 主要有以下几...
1. 配置环境 首先从链接 https://nodejs.org/zh-cn/download 下载 node.js 22.14.0(LTS),安装之后进行如下配置: 在 “user” confi...
梯度裁剪是一种有效的防止梯度爆炸的技术,特别是在训练深度神经网络和循环神经网络时。它通过限制梯度的大小,使训练过程更加稳定。虽然有时可能会影响收敛速度,但它对于防止训练失败是非常有用的。 1. 梯度爆炸 梯度爆炸是指在反...
定点小数是一种用固定位数表示小数部分的数值表示方法。在定点小数中,小数点的位置是固定的,不像浮点数那样可以在数字中的不同位置浮动。 1. 存储原理 使用定点数存储小数,我们首先得先确定: 假设:使用单字节(8个二进制位)...
《垃圾邮件识别器》(六)数据处理
2017-12-09阅读(5930)
Faiss 向量检索库
2023-10-06阅读(4871)
《垃圾邮件识别器》(一)准备工作
2017-12-14阅读(4854)
《垃圾邮件识别器》(四)算法理论
2017-12-11阅读(4047)
《垃圾邮件识别器》(七)训练评估
2017-12-09阅读(4041)
jieba 工具使用
2019-02-13阅读(3771)
《垃圾邮件识别器》(五)Scikit-Learn
2017-12-10阅读(3740)
Windows Protobuf 编译安装
2024-05-27阅读(3731)
《垃圾邮件识别器》内容摘要
2017-12-15阅读(3235)
《垃圾邮件识别器》(二)Tkinter
2017-12-13阅读(3118)
向量数据库 milvus 使用
2023-03-11阅读(3051)
BERT
2022-05-04阅读(3048)
C++ 运行时类型识别(RTTI)
2020-12-25阅读(2905)
权重衰减(Weight Decay)
2022-05-28阅读(2865)
《垃圾邮件识别器》(三)界面搭建
2017-12-12阅读(2856)
《垃圾邮件识别器》(八)收尾工作
2017-12-08阅读(2821)
XGBoost 解决多分类问题
2023-03-30阅读(2820)
最新评论