优酷这类视频类网站是如何鼓励用户上传视频的?采用了哪些方法?
为解决长期以来人工智能领域缺少优秀的中文视频-文本数据集的问题,阿里达摩院的研究人员们从来自中国最流行的视频网站之一优酷(YouKu)上的4亿视频中,精选出了一千万条视频,并进行了人工标注,最终将其分成45个类别,从而为大尺度预训练模型的发展提供了良好的基础,这些数据可以被应用在常见的视频文本任务中去,比如说跨模态检索、视频描述和视频分类等。
此前研究者们已经发布了大量英文的视频-文本数据集,如Howto100M、WebVid-2.5M、VLP等,都对研究工作起到了很好的助力作用,但是业界一直缺少比较好的精标中文视频-文本数据集,这个问题阻碍了中文场景下人工智能技术的发展,因此,一个优秀的精标中文视频-文本数据集是业内的迫切需要。在此情况下,达摩院推出的Youku-mPLUG数据集,将大大推进中文语境下一系列人工智能任务的发展。与此同时,达摩院也发布了视频文本模型ALPRO和mPLUG-2。并在此基础上进行了各种类型的任务测试,取得了良好的效果。喜欢本文的话,欢迎关注活在信息时代哦:)