-
英特尔Gaudi2技术在大规模语言模型推理方面的性能优势及未来发展
本文章报道了英特尔的Gaudi2技术在大规模语言模型推理方面的性能优势,以及未来Gaudi3技术的发展趋势,适合于对AI加速器技术和大规模语言模型感兴趣的读者。- 181
- 0
-
盘古智能体框架(Pangu-Agent):通用、微调、结构化推理能力的智能体模型
本文介绍了盘古智能体框架(Pangu-Agent),一种通用的、可微调的、具有结构化推理能力的智能体模型,探讨了其创新点和在多种任务和环境中的应用优势。- 188
- 0
-
TextStarCraftII:基于python-sc2框架的星际争霸II新交互环境
了解TextStarCraftII项目如何利用python-sc2框架将星际争霸II的状态信息和动作空间映射到文本空间,提升了大规模语言模型在游戏决策中的理解和决策能力。- 311
- 0
-
CMU Catalyst Group团队发布投机式推理引擎SpecInfer
近日,来自卡耐基梅隆大学(CMU)的 Catalyst Group 团队发布了一款「投机式推理」引擎 SpecInfer,可以借助轻量化的小模型来帮助大模型,在不影响生成内容准确度的情况下,实现两到三倍的推理加速。该技术将对大规模语言模型应用和部署产生重大影响。- 297
- 0
-
-
-
新加坡国立大学HPC-AI实验室研发CAME优化器:性能不变内存消耗降低一半
新加坡国立大学HPC-AI实验室研发CAME优化器,将大语言模型训练中的内存消耗降低一半,保持性能不变,为高性能计算和机器学习系统带来重大突破。- 64
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!