2021-03-15 10:37:26
来 源
中存储
认知计算
为了促进对用户视频的培训,Facebook正在使用一种称为自我监督学习的方法,从而消除了对标记数据集的需求。

Facebook旨在通过两个新的视频AI项目来促进机器学习

Facebook近日分享了有关两个内部人工智能项目(从视频中学习和TimeSformer)的详细信息,这些项目旨在促进更强大的机器学习模型的开发。

通过第一个项目“视频学习”,该公司将在用户上传的剪辑上训练支持其社交网络的机器学习系统。Facebook依靠AI来执行从内容推荐到政策实施的各种任务。该公司希望通过用户创建的视频对其机器学习系统进行培训,以增强其功能。 

通常,研究人员会使用手工训练的数据集来开发AI模型,其中的专家会使用描述性标签来标记单个文件。这些标签有助于在学习过程中引导模型朝正确的方向发展。

但是需要权衡:手动注释文件的要求限制了研究人员可以实际组装的训练数据集的大小。反过来,这限制了AI模型在训练期间可以进行的学习量。

通过使其模型能够在未标记的用户创建的视频上进行训练,Facebook将允许他们从比传统手工训练数据集中更多的信息中学习。 “通过学习覆盖几乎每个国家和数百种语言的全球公开视频流,我们的人工智能系统不仅可以提高准确性,还可以适应我们快速发展的世界,并认识到不同文化和地区之间的细微差别和视觉提示,” Facebook研究人员今天在博客中写道。 

研究人员强调,该倡议将强调隐私。他们写道:“我们正在建立和维护一个强大的隐私基础,该基础使用自动化解决方案来大规模实施隐私。” “通过将这项工作嵌入基础架构级别,我们可以在我们的系统中始终如一地应用隐私要求。”

为了促进对用户视频的培训,Facebook正在使用一种称为自我监督学习的方法,从而消除了对标记数据集的需求。它已经开始在生产中实施该方法。社交网络披露,Instagram的Reels功能使用自我监督的AI模型来显示推荐的视频,这些视频类似于用户最近观看的剪辑。

除了进行自我监督学习之外,该公司今天还详细介绍了一个单独的AI项目,该项目被称为TimeSformer。它被描述为第一个完全基于所谓的Transformers的视频处理AI,Transformers是最初创建用于分析文本的高效机器学习模型。Facebook表示,由于使用了该技术,TimeSformer所使用的数据不到传统模型所需的计算资源的十分之一,并且可以以三倍的速度进行训练。 

Facebook表示,其方法还可以通过其他方式改善培训过程。该公司的研究人员解释说:“当今最好的3D CNN(一种AI)只能使用几秒钟长的视频片段。” “使用TimeSformer,我们可以在更长的视频片段上进行训练-长达数分钟。这可能会极大地促进研究,使机器学习视频中复杂的长形动作。”

图片:Facebook

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。