STL-10 dataset
15
STL-10 数据集是一个用于开发无监督特征学习、深度学习和自学习算法的图像识别数据集。它受 CIFAR-10 数据集的启发,但有所修改。特别是,每个类别的有标签训练样本比 CIFAR-10 少,但提供了一个非常大的无标签样本集,以便在监督训练前学习图像模型。主要的挑战在于如何利用无标签数据(其分布与有标签数据相似但不同)来构建有用的先验知识。我们还预计,该数据集较高的分辨率(96×96)将成为开发更具可扩展性的无监督学习方法的一个挑战性基准。