-
-
-
字节&复旦大学多模态理解大模型LEGO详解
本文详细介绍了字节&复旦大学多模态理解大模型LEGO的研究成果,包括模型架构、数据集生成、实验评估等方面,展示了LEGO在视频定位、图像内容解读等多模态任务中的优异表现。- 675
- 0
-
Chat-UniVi: 130亿参数的统一视觉语言大模型
Chat-UniVi是一个具有130亿参数的统一视觉语言大模型,能够同时处理图片和视频任务,通过动态视觉token和多尺度表征实现了卓越性能,为深度学习模型的训练和推理提供更加便捷和经济的解决方案。- 611
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!