视频语义分割和视频全景分割比赛详解

释放双眼,带上耳机,听听看~!
本文详细介绍了视频语义分割和视频全景分割比赛的规则、数据集以及训练模型的方法,欢迎关注CV技术指南公众号获取更多相关信息。

前言 本次比赛包含两个track,视频语义分割(VSS Track)与视频全景分割(VPS Track)。

来源丨CVer

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

视频语义分割和视频全景分割比赛详解

视频语义分割和视频全景分割比赛详解

Workshop主页链接:

www.vspwdataset.com/Workshop%20…

简介:像素级视频理解是计算机视觉领域的一个基本任务。目前学界对图片分割己经有了比较充分的研究。然而对与现实世界的很多应用,比如自动驾驶、短视频编辑等等,需要处理的多为视频数据。因此,对视频分割的研究是必要且具有现实意义的。为此,主办方采集了目前最大规模的视频语义分割数据集 Video Scene Parsing in the Wild (VSPW) [1] 以及视频全景分割数据集VIdeo Panoptic Segmentation in the Wild (VIPSeg) [2],并在此基础上举办视频语义/全景分割比赛。比赛公开了VSPW与VIPSeg 数据集的训练集和验证集,而测试集的ground truth 不会公开。参赛者可以提交测试集预测结果到比赛网站上来获得模型测试结果。

同时我们也欢迎不限于此次比赛的相关学术论文投稿,研究topic 包括但不限于视频/图片语义分割(VSS),视频物体分割(VOS),视频实例分割(VIS),视频全景分割(VPS),目标跟踪(Tracking)以及其他视频相关应用,投稿cmt地址为:

www.vspwdataset.com/Workshop%20….

截稿日期详见workshop主页:

www.vspwdataset.com/Workshop%20….

本次比赛包含两个track,视频语义分割(VSS Track)与视频全景分割(VPS Track)

视频语义分割赛道(VSS Track):在此赛道中,参赛者可以使用VSPW的训练集来训练模型。其他相关的分割数据集(COCO、ADE20k 等)也可以应用在训练中,如果应用了其他数据集,需要向主办方说明使用额外数据集的信息。排行榜根据分割结果与ground truth 的mIoU来决定。

参赛网站:

codalab.lisn.upsaclay.fr/competition…

数据集下载:

github.com/VSPW-datase…

Baseline代码:

github.com/VSPW-datase…

视频全景分割赛道(VPS Track):在此赛道中,参赛者可以使用VIPSeg的训练集来训练模型。其他相关的分割数据集(COCO、ADE20k 等)也可以应用在训练中,如果应用了其他数据集,需要向主办方说明使用额外数据集的信息。排行榜根据VPQ score来决定。

参赛网站:

codalab.lisn.upsaclay.fr/competition…

数据集下载:

github.com/VIPSeg-Data…

Baseline 代码:

github.com/VIPSeg-Data…

比赛分为两个阶段:

第一阶段时间为1月20日至5月15日,参赛者可开发模型,提交测试集预测结果。本阶段返回部分测试集的预测结果。

第二阶段为 5月15日至5月25日,是比赛的最终阶段。

[1] VSPW: A Large-scale Dataset for Video Scene Parsing in the Wild. CVPR 2021

[2] Large-scale Video Panoptic Segmentation in the Wild: A Benchmark. CVPR 2022

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。

模型部署交流群:732145323。用于计算机视觉方面的模型部署、高性能计算、优化加速、技术学习等方面的交流。

其它文章

Rethinking Attention with Performers

MobileDets:终端目标检测新标杆

U-Net在2022年相关研究的论文推荐

用少于256KB内存实现边缘训练,开销不到PyTorch千分之一

PyTorch 2.0 重磅发布:一行代码提速 30%

Hinton 最新研究:神经网络的未来是前向-前向算法

聊聊计算机视觉入门

FRNet:上下文感知的特征强化模块

DAMO-YOLO | 超越所有YOLO,兼顾模型速度与精度

《医学图像分割》综述,详述六大类100多个算法

如何高效实现矩阵乘?万文长字带你从CUDA初学者的角度入门

近似乘法对卷积神经网络的影响

BT-Unet:医学图像分割的自监督学习框架

语义分割该如何走下去?

轻量级模型设计与部署总结

从CVPR22出发,聊聊CAM是如何激活我们文章的热度!

入门必读系列(十六)经典CNN设计演变的关键总结:从VGGNet到EfficientNet

入门必读系列(十五)神经网络不work的原因总结

入门必读系列(十四)CV论文常见英语单词总结

入门必读系列(十三)高效阅读论文的方法

入门必读系列(十二)池化各要点与各方法总结

TensorRT教程(三)TensorRT的安装教程

TensorRT教程(一)初次介绍TensorRT

TensorRT教程(二)TensorRT进阶介绍

计算机视觉中的高效阅读论文的方法总结

计算机视觉中的神经网络可视化工具与项目

计算机视觉中的transformer模型创新思路总结

计算机视觉中的传统特征提取方法总结

计算机视觉中的数据预处理与模型训练技巧总结

计算机视觉中的图像标注工具总结

计算机视觉中的数据增强方法总结

计算机视觉中的注意力机制技术总结

计算机视觉中的特征金字塔技术总结

计算机视觉中的池化技术总结

计算机视觉中的高效阅读论文的方法总结

计算机视觉中的论文创新的常见思路总结

神经网络中的归一化方法总结

神经网络的初始化方法总结

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

大型语言模型的涌现能力质疑

2023-12-7 17:08:14

AI教程

百度百舸AI IaaS解决方案助力自动驾驶业务发展

2023-12-7 17:27:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索