探索音视频技术的极致-稀土开发者大会2023精彩预告

释放双眼,带上耳机,听听看~!
稀土开发者大会2023将带来音视频技术的最佳实践,包括如何节省点播成本、FreeSWITCH连接RTC及人工智能融合通信实践,以及视频编解码算法的开发和优化。

文末有抽奖!

最近,一款全新的音频理解与生成系统 AudioGPT 惊艳亮相,将 ChatGPT 与音频基础模式相结合,让用户可以轻松创建丰富多彩的音视频内容。在新技术与体验双重驱动下,音视频技术的发展走向极致,拥有无限可能性。

过去几年里,随着元宇宙、VR 等技术不断演进和兴起,音视频对强互动、低时延、超高清有了更高的要求,最显著的变化就是,不断提升在线娱乐社交产业的丰富程度和体验感,撬动传统企业以远程办公为代表的强实时、强互动场景的数字化升级。直播、短视频、云会议、云办公等新生产生活方式需求迸发,使得音视频正在成为一种不可或缺的社会基础设施。未来几年,音视频技术的发展将是互联网技术发展的重头戏,在各行各业中的音视频应用占比一定会进一步提升,随之而来的是如何与各种前沿技术融合,持续创新和突破。比如,现在热门的应用,如视频编辑、图像合成、虚拟化妆等都离不开人脸的感知,如何让算法在能捕捉到精准细微的面部表情和姿态的同时保证实时性,就成为我们待解的难题之一。

6 月 30 日- 7 月 1 日北京·新云南皇冠假日酒店,由稀土掘金技术社区举办的 「稀土开发者大会2023」上,刘歧(FFmpeg 官方源代码维护者)作为出品人,为大家带来《音视频技术前沿》专场,火山引擎视频点播产品负责人赵春波、烟台小樱桃网络 CTO 杜金房、网易云信视频编解码算法专家苗晋伟、声网 AI 算法工程师王丽,将为技术开发者们分享音视频技术最佳实践,一起探索音视频技术的极致。

探索音视频技术的极致-稀土开发者大会2023精彩预告

演讲嘉宾:赵春波 火山引擎视频点播产品负责人

10 余年视频云相关研发和产品经验。当前主要负责火山引擎视频点播的产品工作,支撑抖音、西瓜等业务的点播体验优化和成本优化,并将这些技术能力沉淀到火山引擎,来服务更多的行业客户。

演讲主题:如何利用播放器节省 20% 点播成本

在具有视频点播业务的公司里,点播的基础设施成本经常是公司采购成本的重要构成部分,如何做优化成本是业务发展的必备工作。我们在 toB 业务交流中发现,大部分公司都关注到了服务端能力降本的手段,比如压低带宽采购价格、提升转码压缩率等,但较少有团队关注到客户端播放器在成本优化的关键作用。本次分享结合我们实践的成本优化经验和降本策略,介绍客户端播放器对点播业务的成本优化方法,以及背后数据驱动能力的建设思路。

演讲大纲:

  1. 点播成本构成
  2. 播放器的成本优化方法
  3. 成本评估公式
  4. 数据挖掘成本优化空间
  5. 总结和展望

演讲嘉宾:杜金房 烟台小樱桃网络 CTO

FreeSWITCH 中文社区创始人,《FreeSWITCH 权威指南》、《Kamailio 实战》作者。烟台小樱桃网络科技有限公司CTO,腾讯云 TVP。

演讲主题:FreeSWITCH 连接 RTC 及人工智能融合通信实践

聚焦实时音视频与各种前沿技术融合。通信的本质是“通”。本次演讲便以 FreeSWITCH 开源软件为基础,兼谈商业化实践,分享融合 SRS、声网SDK、腾讯会议、微软 Teams、微信小程序、4G VoLTE、5G VoNR、ASR/TTS、ChatGPT 等各种平台和技术,打造统一通信平台的技术要点和实践经验。

演讲大纲:

  1. FreeSWITCH 与 RTC 简介
  2. MCU 与 SFU 对接解决方案
  3. FreeSWITCH 连接各种音视频服务
  4. FreeSWITCH 连接 AI 平台及 AI 服务
  5. 小结

演讲嘉宾:苗晋伟 网易云信视频编解码算法专家

10 余年视频编解码与处理、音视频引擎开发优化等实践经验。曾就职于华为、腾讯,目前在网易云信负责视频编解码算法的开发和优化工作,主要包括 RTC 实时通信场景、视频直播点播转码场景等。

演讲主题:RTC 场景下的视频编码优化与 AI 超分结合实践

网易云信在 RTC 场景下的 NE 系列视频编码器包括 NE264、NE265、NEVC 编码器,其中 NE264、NE265 是符合标准的 H264、H265 协议,在此基础上结合 RTC 场景下的一些痛点问题,定制了 NEVC 私有编码器,可以进一步改善 RTC 场景下端到端的通话体验。针对 NE 系列视频编码器,在降低码率、提升质量、码控控制等方向上,我们尝试了大量的快速算法的优化。同时也结合 AI 前处理,结合网络状态等,也做了很多编码优化。另外,结合网易云信自研的轻量级的 AI 超分算法,在 NEVC 编码器内部做了自适应降分辨率的策略,可以在保持主观质量不降低的情况下,进一步的降低编码码率。

演讲大纲:

  1. NE 编码器介绍
  2. NE 编码器在 RTC 场景下的优化
  3. 轻量化端侧的 AI 超分介绍
  4. NE 编码器与 AI 超分结合的落地实践

演讲嘉宾:王丽 声网 AI 算法工程师

复旦大学计算机系理学博士。主要从事基于深度学习的计算机视觉方向研究,研究内容包括 2D/3D 目标检测、人群计数、3D 人体/人脸重建等。在计算机视觉领域发表学术论文 10 余篇,引用量达 1500 余次,获 ICME 2017 最佳会议论文奖。2022 年加入声网,主要从事 3D 人体/人脸重建方向的研究和应用。

演讲主题:基于单张 RGB 图片的人脸重建方法

使用单张 RGB 图片进行人脸表情、姿态捕捉,进一步进行人脸重建,已成为计算机视觉领域的一个新兴研究课题。它的迅速发展驱动了 VR/AR 的 3D Avatar 创建,可以帮助进行人机交互。现在热门的应用,如视频编辑、图像合成、虚拟化妆等都离不开人脸的感知。如何让算法在能捕捉到精准细微的面部表情和姿态的同时保证实时性,则成为我们主要的研究方向。本次分享将分为三个部分:第一部分介绍人脸重建的背景和主要技术路线;第二部分介绍如何在移动端实时的进行人脸表情、姿态捕捉及重建;第三部分介绍算法的后续可能发展方向。

演讲大纲:

  1. 人脸重建的背景和主要技术路线介绍
  2. 在移动端实时进行人脸重建技术介绍
  3. 人脸技术当前的局限性以及未来发展方向

除了以上嘉宾分享的**「音视频技术前沿」外,本届大会策划的专题还包含「大模型与AIGC、云原生实践、前端工程实践、前端未来、分布式云和边缘计算、可观测性探索、低代码技术实践和创新应用」等数十个技术专场,这些议题由来自字节、腾讯、FFmpeg、哗哩哗哩、阿里巴巴、小红书**等公司具备技术影响力与洞察力的行业专家负责把控。目前大会出品人已全部集齐,讲师阵容也即将确认完毕。

邀请你 👉  线下参会

👉 扫描下方购票,购买线下门票的同学即可获得【在吗?在码!】开发者大会系列定制T恤。

🔘 扫码购票:

探索音视频技术的极致-稀土开发者大会2023精彩预告

🔘 购票后请填写问卷:

探索音视频技术的极致-稀土开发者大会2023精彩预告

邀请你 👉 线上预约

👉  扫描下方二维码进入直播预约界面,点击「预约直播」,预约2023稀土开发者大会主论坛,即可参与极米投影仪抽奖。

🔘 抽奖链接:

探索音视频技术的极致-稀土开发者大会2023精彩预告

🙋 微信群

探索音视频技术的极致-稀土开发者大会2023精彩预告

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

逻辑斯蒂回归模型及非线性分类任务

2023-12-16 21:46:14

AI教程

LabVIEW实现图像语义分割教程

2023-12-16 22:06:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索