视频语义分割和视频全景分割比赛详解

AI教程
23年12月7日
编辑

CV技术指南

释放双眼，带上耳机，听听看~！

本文详细介绍了视频语义分割和视频全景分割比赛的规则、数据集以及训练模型的方法，欢迎关注CV技术指南公众号获取更多相关信息。

前言本次比赛包含两个track，视频语义分割（VSS Track）与视频全景分割（VPS Track）。

来源丨CVer

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

视频语义分割和视频全景分割比赛详解

视频语义分割和视频全景分割比赛详解

Workshop主页链接：

www.vspwdataset.com/Workshop%20…

简介：像素级视频理解是计算机视觉领域的一个基本任务。目前学界对图片分割己经有了比较充分的研究。然而对与现实世界的很多应用，比如自动驾驶、短视频编辑等等，需要处理的多为视频数据。因此，对视频分割的研究是必要且具有现实意义的。为此，主办方采集了目前最大规模的视频语义分割数据集 Video Scene Parsing in the Wild (VSPW) [1] 以及视频全景分割数据集VIdeo Panoptic Segmentation in the Wild (VIPSeg) [2]，并在此基础上举办视频语义/全景分割比赛。比赛公开了VSPW与VIPSeg 数据集的训练集和验证集，而测试集的ground truth 不会公开。参赛者可以提交测试集预测结果到比赛网站上来获得模型测试结果。

同时我们也欢迎不限于此次比赛的相关学术论文投稿，研究topic 包括但不限于视频/图片语义分割(VSS)，视频物体分割（VOS），视频实例分割（VIS），视频全景分割（VPS），目标跟踪（Tracking）以及其他视频相关应用，投稿cmt地址为：

www.vspwdataset.com/Workshop%20….

截稿日期详见workshop主页：

www.vspwdataset.com/Workshop%20….

本次比赛包含两个track，视频语义分割（VSS Track）与视频全景分割（VPS Track）。

视频语义分割赛道（VSS Track）：在此赛道中，参赛者可以使用VSPW的训练集来训练模型。其他相关的分割数据集（COCO、ADE20k 等）也可以应用在训练中，如果应用了其他数据集，需要向主办方说明使用额外数据集的信息。排行榜根据分割结果与ground truth 的mIoU来决定。

参赛网站：

codalab.lisn.upsaclay.fr/competition…

数据集下载：

github.com/VSPW-datase…

Baseline代码：

github.com/VSPW-datase…

视频全景分割赛道（VPS Track）：在此赛道中，参赛者可以使用VIPSeg的训练集来训练模型。其他相关的分割数据集（COCO、ADE20k 等）也可以应用在训练中，如果应用了其他数据集，需要向主办方说明使用额外数据集的信息。排行榜根据VPQ score来决定。

参赛网站：

codalab.lisn.upsaclay.fr/competition…

数据集下载：

github.com/VIPSeg-Data…

Baseline 代码：

github.com/VIPSeg-Data…

比赛分为两个阶段：

第一阶段时间为1月20日至5月15日，参赛者可开发模型，提交测试集预测结果。本阶段返回部分测试集的预测结果。

第二阶段为 5月15日至5月25日，是比赛的最终阶段。

[1] VSPW: A Large-scale Dataset for Video Scene Parsing in the Wild. CVPR 2021

[2] Large-scale Video Panoptic Segmentation in the Wild: A Benchmark. CVPR 2022

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群：444129970。群内有大佬负责解答大家的日常学习、科研、代码问题。

模型部署交流群：732145323。用于计算机视觉方面的模型部署、高性能计算、优化加速、技术学习等方面的交流。

其它文章

Rethinking Attention with Performers

MobileDets：终端目标检测新标杆

U-Net在2022年相关研究的论文推荐

用少于256KB内存实现边缘训练，开销不到PyTorch千分之一

PyTorch 2.0 重磅发布：一行代码提速 30%

Hinton 最新研究：神经网络的未来是前向-前向算法

聊聊计算机视觉入门

FRNet：上下文感知的特征强化模块

DAMO-YOLO | 超越所有YOLO，兼顾模型速度与精度

《医学图像分割》综述，详述六大类100多个算法

如何高效实现矩阵乘？万文长字带你从CUDA初学者的角度入门

近似乘法对卷积神经网络的影响

BT-Unet:医学图像分割的自监督学习框架

语义分割该如何走下去？

轻量级模型设计与部署总结

从CVPR22出发，聊聊CAM是如何激活我们文章的热度！

入门必读系列（十六）经典CNN设计演变的关键总结：从VGGNet到EfficientNet

入门必读系列（十五）神经网络不work的原因总结

入门必读系列（十四）CV论文常见英语单词总结

入门必读系列（十三）高效阅读论文的方法

入门必读系列（十二）池化各要点与各方法总结

TensorRT教程（三）TensorRT的安装教程

TensorRT教程（一）初次介绍TensorRT

TensorRT教程（二）TensorRT进阶介绍

计算机视觉中的高效阅读论文的方法总结

计算机视觉中的神经网络可视化工具与项目

计算机视觉中的transformer模型创新思路总结

计算机视觉中的传统特征提取方法总结

计算机视觉中的数据预处理与模型训练技巧总结

计算机视觉中的图像标注工具总结

计算机视觉中的数据增强方法总结

计算机视觉中的注意力机制技术总结

计算机视觉中的特征金字塔技术总结

计算机视觉中的池化技术总结

计算机视觉中的高效阅读论文的方法总结

计算机视觉中的论文创新的常见思路总结

神经网络中的归一化方法总结

神经网络的初始化方法总结

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

Computer Vision 数据集比赛视频分割训练模型

大型语言模型的涌现能力质疑

2023-12-7 17:08:14

百度百舸AI IaaS解决方案助力自动驾驶业务发展

2023-12-7 17:27:14

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部