Infini官网链接地址:https://arxiv.org/abs/2404.07143
网站默认显示语言:英语
Infini 介绍
Infini-attention是谷歌开发的技术,旨在扩展基于Transformer的大语言模型以处理无限长的输入,通过压缩记忆机制实现无限长输入处理,并在多个长序列任务上取得优异表现。该技术适用于处理要求对长序列数据进行高效建模和推理的NLP任务。
Infini用户群体
适用于需要对长序列数据进行高效建模和推理的NLP任务。
利用Infini-attention技术,可以生成长篇文章、处理长序列密钥上下文块检索任务以及生成精炼的文本摘要。
Infini的核心功能
- 压缩记忆机制
- 局部与长期注意力结合
- 流式处理能力
- 支持快速流式推理
- 模型扩展性