当前位置：主页 > 查看内容

机器学习和计算机视觉的20大图像数据集

发布时间：2021-05-13 00:00| 有位朋友查看

简介：本文转载自公众号读芯术(ID：AI_Discovery)。计算机视觉使得计算机能够理解图像和视频的内容，其目标是能够如同人体视觉系统一样，自动完成任务。计算机视觉任务包括图像采集、处理和分析。图像数据以不同的形式呈现，如视频序列、多机位成像，或是来自医学……

本文转载自公众号“读芯术”(ID：AI_Discovery)。

计算机视觉使得计算机能够理解图像和视频的内容，其目标是能够如同人体视觉系统一样，自动完成任务。计算机视觉任务包括图像采集、处理和分析。图像数据以不同的形式呈现，如视频序列、多机位成像，或是来自医学扫描仪的多维数据。本文就将介绍一些适用于机器学习训练的数据集。

(1) Labelme：由麻省理工学院计算机科学和人工智能实验室(CSAIL)共同创建的大型数据集，包含187240张图像、62197张带注释的图像和658992个带标签的对象。

(2) ImageNet：新算法的实际图像数据集，根据WordNet层次结构进行组织，层次结构中的每个节点都由成百上千的图像描述。

(3) LSUN：场景理解，附带许多辅助任务(房间布局估计、显著性预测等)。

(4) MS COCO：COCO是一个大规模的对象检测、分割和说明的数据集，包含200000张以上带标签的图像。可用于对象分割、上下文中的识别等等。

(5) 哥伦比亚大学图像库：COIL100数据集包含100个不同的对象，以360°全角度成像。

(6) Visual Genome：是一个数据集兼知识库，旨在将结构化图像概念与语言联系起来。该数据集是包含108077张图像说明的详细视觉知识库。

(7) Lego Bricks：包含大约12700张16种不同乐高积木的图片，按文件夹分类，用Blender进行计算机渲染。

(8) 谷歌开放图像：在知识共享(Creative Commons)的支持下，900万张图像的URL“已经用跨越6000多个类别的标签进行了注释”。

开放图像数据集中的带注释的图像。左：Kevin Krejci的“幽灵拱门”。右：J B.的一些银器。两张图像均在CC BY 2.0的许可下使用。

(9) Youtube-8M：由数百万个YouTube视频ID组成的大规模标签数据集，包含超过3800个视觉实体的注释。

(10) Labelled Faces in the Wild：包含13000张带标签的人脸图像，旨在开发人脸识别相关应用。

(11) 斯坦福犬类数据集：包含20580张图像和120个犬类品种，每个类别大概150张图像。

(12) Places：以场景为主的数据库，包含205个场景类别和250万个带有类别标签的图像。

(13) CelebFaces：拥有超过200000张名人图像的人脸数据集，每张都有40个属性注释。

CelebFaces数据集中的示例图像

(14) Flowers：在英国常见的花卉图像数据集，由102个不同类别组成。每个花卉类别由40到258张不同姿态和光线变化的图像组成。

(15) Plant Image Analysis：跨越100多万张植物图像的数据集的集合。可以从11种植物中选择。

(16) Home Objects：包含家庭中随机对象的数据集，主要来自厨房、浴室和客厅，分为训练数据集和测试数据集。

(17) CIFAR-10：由60000张32×32彩色图像组成的大型图像数据集，分为10类。数据集分为五个训练批次和一个测试批次，每个批次包含10000张图像。

(18) CompCars：包含163款汽车品牌，共有1716种车型，每种车型都标有五个属性，包括最大速度、排量、车门数量、座椅数量和汽车类型。

(19) 室内场景识别数据集：这是一个非常独特的数据集。因为大多数场景识别模型在室外发挥更好，所以该数据集很有用。包含67个室内类别，共15620张图片。

(20) VisualQA：VQA数据集包含265,016张图像的开放性问题。这些问题需要对视觉和语言的理解。对于每张图像，至少有3个问题，每个问题至少有10个答案。

【责任编辑：赵宁宁 TEL：（010）68476606】
本文转载自网络，原文链接：https://www.toutiao.com/i6917562301360914956/
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：“人工智能+学习”会让教育变得更好吗？ 下一篇：没有了

随机推荐

增加更多内容权益，令5G套餐获青睐

中国电信5G套餐用户累计8650万，超出中国电信在2019年的业绩报告中的预期目标：2...
5G为新型物联网项目铺平道路

自两年前重大启动以来，5G一直在全球范围内持续保持着稳定的应用步伐，并日渐商...
如何在评估机器学习模型时防止数据泄漏

本文讨论了评估模型性能时的数据泄漏问题以及避免数据泄漏的方法。在模型评估过...
我们无处安放的隐私

关于你的一切，正在以各种各样的形式大白于天下。 3月15日晚间，央视315晚会曝光...
新AI技术现身顶会：只需一张大头照，就能

如果只有一张图片，怎么创建出一个人逼真的数字化身？在 2020 年计算机视觉与模...
如何通过开源协作推进人工智能的发展

人工智能如今成为行业组织炒作和宣传的术语之一，也有人提出一些问题：其潜力到...
今年的12306大有不同！春节回家必懂的新

随着新年元旦钟声敲响，一年一度的春运大迁徙又开始了。和往年不同，今年的春运...
爱情经典说说：你是我的谁都抢不走，我就

1．真正的爱情，应该是两个人，彼此理解，互相尊重，不缠绕，不牵绊，不占有，然...
微信 8.0 添加好友，必须设置好友权限

IT之家 1 月 22 日消息昨天微信迎来了 8.0 大版本更新，iOS 系统已经率先更新，...
商用倒计时 5G消息“点火”在即

5G消息，被视为运营商5G时代重大业务创新。在运营商内部也称之为内循环背景下5G...

机器学习和计算机视觉的20大图像数据集

推荐图文

个性爱情QQ说说：我的另一半是个路痴，所以到现在还

聊聊TCP连接耗时的那些事儿

通过自动化AI发现意外的收入机会

微信支付能提现免费了！官方支招

论“GPL就是给软件开发者们准备的坑”

帮助重新定义国防和安全领域的人工智能初创公司

随机推荐

增加更多内容权益，令5G套餐获青睐

5G为新型物联网项目铺平道路

如何在评估机器学习模型时防止数据泄漏

我们无处安放的隐私

新AI技术现身顶会：只需一张大头照，就能

如何通过开源协作推进人工智能的发展

今年的12306大有不同！春节回家必懂的新

爱情经典说说：你是我的谁都抢不走，我就

微信 8.0 添加好友，必须设置好友权限

商用倒计时 5G消息“点火”在即

关于我们