ImageNet#
根据WordNet层次结构,ImageNet数据集包含14,197,122张注释图像。自2010年以来,该数据集用于ImageNet大规模视觉识别挑战(ILSVRC),这是图像分类和物体检测的基准。公开发布的数据集包含一组手动注释的训练图像。还发布了一组测试图像,并保留了手动注释。 ILSVRC注释分为两类:
(1)图像中存在或不存在对象类的二进制标签的图像级注释,例如,“此图像中有汽车”,但“没有老虎”,以及
(2)图像中对象实例周围的紧密边界框和类标签的对象级注释,例如,“有一个以位置(20,25)为中心的螺丝刀,宽度为50像素,高度为30像素”。ImageNet项目不拥有图像的版权,因此只提供图像的缩略图和URL。
非空WordNet synsets总数:21841
图像总数:14197122
带有边界框注释的图像数量:1,034,908
具有SIFT功能的同步数:1000
具有SIFT功能的图像数量:120万