随笔记录

STL-10 dataset

孟宝亮 15

STL-10 数据集是一个用于开发无监督特征学习、深度学习和自学习算法的图像识别数据集。它受 CIFAR-10 数据集的启发,但有所修改。特别是,每个类别的有标签训练样本比 CIFAR-10 少,但提供了一个非常大的无标签样本集,以便在监督训练前学习图像模型。主要的挑战在于如何利用无标签数据(其分布与有标签数据相似但不同)来构建有用的先验知识。我们还预计,该数据集较高的分辨率(96×96)将成为开发更具可扩展性的无监督学习方法的一个挑战性基准。

下载地址:https://cs.stanford.edu/%7Eacoates/stl10

回复

我来回复
  • 暂无回复内容