九乐棋牌

    <xmp id="70ysd"><code id="70ysd"></code></xmp><input id="70ysd"><output id="70ysd"></output></input>
    
    
    1. <var id="70ysd"></var>
    2. “数据是王”是真的吗? 谷歌抚摸着数据量的

      雷锋网 (微信公众号:雷锋网) 艾科技导报社:在过去的十年里,内部的研究人员在计算视觉领域取得了巨大的成功。 其中,深度学习模式在机器感知任务中的应用发挥了重要作用。。 此外,自2012年以来,由于深度学习模型的复杂性增加、计算能力的急剧增加和可用标记数据的增加,这种系统的再现能力也取得了很大的进步。。

      然而,在这三种辅助条件下,可用数据集的开发速度跟不上模型的复杂性(从7层的AlexNet发展到101层的ResNet)和计算能力的提高速度。。 2011年,只有100万张照片的图像网仍然被用来训练101层的ResNet模型。因此,研究人员一直在想,如果训练数据能扩大10倍,准确性能提高一倍吗 通过将容量扩大100或300倍可以实现什么样的结果 我们能突破目前的准确性高原吗 数据的增加能带来更多突破吗

      在过去的五年里,GPU的计算能力和模型大小一直在不断提高,但数据集的大小保持不变。

      在《回顾深度学习时代数据的不合理有效性》一文中,研究者们首先驱散了围绕海量数据与深度学习之间关系的迷雾。他们的目标是探索以下问题:

      1。 如果现有的算法不断地被图片标记,它们的视觉再现能力会继续提高吗?

      2。 在诸如分类、目标检测和图像分割等视觉任务中,数据和性能之间的关系的本质是什么?

      3。 在计算视觉的应用中,能够处理所有问题的顶级模型是否使用大规模学习技术

      然而,在考虑上述问题之前,我们应该首先考虑在哪里可以找到比图像网大300倍的数据集。谷歌一直在努力构建这样一个数据集,以改进计算视觉算法。具体来说,谷歌的数据集JFT-3亿已经有3亿张图片,分为18291个类别。负责标记这些图片的是一种特殊的算法,它使用一系列信息,如原始网络信号、网页关系和用户反馈。

      贴标工作完成后,这3亿张图片有超过10亿张标签。在这些标签中,大约有3个。7。负责标签精度的算法选择了50亿个。然而,即使如此,整个数据集中的标签中仍然存在大量噪声。初步估计显示,所选图片的标签中有20%属于噪声范围。由于缺乏详细的评论,研究人员无法准确判断哪些标签应该被取消。

      经过一些实验,研究人员验证了一些假设,这些实验也带来了一些意想不到的惊喜:

      1。更好的表征学习辅助效果。 实验表明,使用大规模数据集可以提高表征学习效应,进而提高视觉任务的性能。因此,在开始培训之前建立一个大规模的数据集是非常有用的。同时,实验也表明无监督和半监督的表征学习有着光明的前景。此外,只要数据扩大,噪声问题就不再重要。

      2。性能将随着训练数据的数量级线性增加。 也许整个实验中最惊人的发现是视觉任务的表现和表征学习使用的训练数据规模之间的关系。它们之间存在异常的线性关系。即使有多达3亿张训练图片,实验中也没有高原效应。

      目标检测性能将随着训练数据量的增加而线性增加

      3。容量非常重要。 在实验中,研究人员还发现,为了充分利用这个庞大的数据集,模型的深度和容量必须足够大。例如,ResNet-50在COCO目标检测基准上仅是1。87%,而ResNet-152只有3%。

      4。新成就。 在本文中,研究人员还在JFT-300M数据集训练模型中发现了许多新的结果。例如,一个型号已经可以达到37。4 AP,而之前的COCO目标检测基准仅为34。3美联社。

      应该注意的是,实验中使用的训练系统、学习安排和参数设置都是基于以前对ConvNets训练的理解。当时,数据集是图像网,只有100万张图片。在这项工作中,研究人员没有使用超参数最优组合,因此最终结果可能并不完美,因此数据的实际影响在这里也可能被低估。

      这项研究并不关注特定任务的数据。研究人员认为,获得大规模的特定任务数据将成为未来的一个新的研究重点。

    3. 首页
    4. 游艇租赁
    5. 电话
    6. 关于我们
    7. 九乐棋牌|www.binniclub.com 696棋牌游戏中心| 345棋牌官方下载| 5178棋牌游戏| 命运棋牌官方下载| 赌博网