优酷这类视频类网站是如何鼓励用户上传视频的？采用了哪些方法？

时间：2023-06-17

　　为解决长期以来人工智能领域缺少优秀的中文视频-文本数据集的问题，阿里达摩院的研究人员们从来自中国最流行的视频网站之一优酷（YouKu）上的4亿视频中，精选出了一千万条视频，并进行了人工标注，最终将其分成45个类别，从而为大尺度预训练模型的发展提供了良好的基础，这些数据可以被应用在常见的视频文本任务中去，比如说跨模态检索、视频描述和视频分类等。

　　此前研究者们已经发布了大量英文的视频-文本数据集，如Howto100M、WebVid-2.5M、VLP等，都对研究工作起到了很好的助力作用，但是业界一直缺少比较好的精标中文视频-文本数据集，这个问题阻碍了中文场景下人工智能技术的发展，因此，一个优秀的精标中文视频-文本数据集是业内的迫切需要。在此情况下，达摩院推出的Youku-mPLUG数据集，将大大推进中文语境下一系列人工智能任务的发展。与此同时，达摩院也发布了视频文本模型ALPRO和mPLUG-2。并在此基础上进行了各种类型的任务测试，取得了良好的效果。喜欢本文的话，欢迎关注活在信息时代哦：）