首页 >> 新闻 >> 科技 >> 互联网 >> 正文
  • 腾讯 AI Lab 正式开源业内最大规模多标签图像数据集

  • 时间:2018-10-17 新闻来源: 北京视窗
    •     2018年10月17日,腾讯AI Lab宣布正式开源“Tencent ML-Images”项目,地址为https://github.com/Tencent/tencent-ml-images。该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。

        该开源项目的主要内容包括:

        ML-Images数据集的全部图像URLs,以及相应的类别标注。出于原始图像版权的考虑,此次开源将不直接提供原始图像,用户可利用我们提供的下载代码和URLs自行下载图像。

        ML-Images数据集的详细介绍,包括图像来源,图像数量,类别数量,类别的语义标签体系,标注方法,以及图像的标注数量等统计量。

        完整的代码和模型。我们提供的代码涵盖从图像下载,图像预处理,基于ML-Images的预训练,基于ImageNet的迁移学习,到基于训练所得模型的图像特征提取的完整流程。该项目提供了基于小数据集的训练示例,以方便用户快速体验我们的训练流程。该项目还提供了非常高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

        “Tencent ML-Images”作为腾讯开源第58个项目(https://github.com/Tencent),是腾讯AI Lab在计算机视觉领域所累积的基础能力的一次释放,将为人工智能领域的科研人员和工程师提供充足的高质量训练数据,及简单易用、性能强大的深度学习模型。在工作中,ML-Images能为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升,促进人工智能行业共同发展。

      网站首页 | 关于我们 | 联系方式 | 招聘信息 | 版权声明 | 网站地图 | 北京视窗
      地址:北京朝阳区农展馆南里12号通广大厦 投稿QQ:927569073 投稿邮箱927569073@qq.com
      Copyright © 2010 www.jingsc.com Inc. All Rights Reserved. 北京视窗 版权所有