全部标签

LLM推理

英特尔®Extension for Transformer：LLM运行时优化，满足更多场景应用需求

了解英特尔®Extension for Transformer中的LLM运行时优化，如何满足更多场景应用需求，以及如何在CPU上实现出色的LLM推理性能。
AI教程
- 428
- 0
量子位23年12月8日
英特尔® Extension for Transformers工具包：大型语言模型推理性能加速40倍

英特尔® Extension for Transformers工具包通过LLM Runtime技术实现大型语言模型推理性能加速40倍，同时引入流式LLM技术优化了聊天场景应用，为人工智能领域的进一步推动提供了强有力的支持。
AI资讯
- 251
- 0
AICMTY23年12月1日
雅可比迭代法打破自回归解码顺序依赖性

最新研究：使用雅可比迭代法打破自回归解码中的顺序依赖性，加速LLM推理，提高模型预测速度。探索前向解码算法，克服自回归解码的挑战，实现并行生成多个n-grams，加速生成token。了解如何利用Jacobi迭代轨迹来缓存生成的n-grams，提高解码能力。
AI教程
- 691
- 0
量子位23年11月28日
BladeLLM: 阿里云PAI平台超长上下文推理引擎

本文介绍BladeLLM作为阿里云PAI平台提供的超长上下文推理引擎，以及其在大模型推理性能优化方面的优势和挑战。
AI教程
- 460
- 0
阿里云大数据AI技术23年11月27日

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部