如何实现上下文扩展？Kimi团队背后的技术原理揭秘

释放双眼，带上耳机，听听看~！

本文深入探讨了如何实现上下文扩展，揭秘了Kimi团队背后的技术原理，涉及到RAG技术和GPT-4 Turbo，解析了大文本上下文解析的重要性和挑战，为SEO优化带来新思路。

两位百万？怎么做到的？

前段时间写过一篇文章:# GPT4-Turbor 128k ？还不够？还不够！记得 GPT4-T 的上下文参数量 128k，也就大概 100 万英文字符、50 万汉字字符，kimi 是如何做到 double 的？

真的能做到吗？

上下文的扩充有尽头吗？

在前面文章里提到了 RAG 技术，即 生成式检索增强，它能通过 API 调用，请求页面或读取文件，优化检索数据，缩小文本或标记梳理，同时保留必要信息；然后使用文本分割器，将文档转换为段落、代码块，确定每段落大小；接着进行语义索引、并存储在向量数据库；在回复用户生成的内容前，选择与用户初始请求语义相关的段落块，插入到提示中。

白话来说就是将上下文提示语分块、分析、加权重、插入到提示，那么：如果能无限扩充上下文长度，RAG 技术还有意义吗？

如何实现上下文扩展？Kimi团队背后的技术原理揭秘

Kimi 背后原理，官网做出了解释：# Kimi Chat 公布“大海捞针”长文本压测结果

这里的“针”就是“大上下文提示语”的核心，我们需要提取的、解析的核心：

有几个有意思的数据：

1、GPT-4 Turbo（128K）在语料长度超过 72K 且句子（“针”）藏在文本头部的时候，准确率不佳。（这也是我们前面提到过的）

如何实现上下文扩展？Kimi团队背后的技术原理揭秘

2、而Claude 2.1似乎在语料长度超过20K 之后就开始准确率不佳，而且句子（针）藏在语料靠前的位置时，准确率尤其差。

如何实现上下文扩展？Kimi团队背后的技术原理揭秘

而 Kimi Chat 在“大海捞针”实验中的测试结果是这样的：

如何实现上下文扩展？Kimi团队背后的技术原理揭秘

kimi 的测试结果好的让人意外！

那… kimi 究竟做对了什么？

官方也没明说，只是最后给了个这样的结论：

如何实现上下文扩展？Kimi团队背后的技术原理揭秘

具体技术实现细节，背后是大量复杂的工程优化和算法创新设计，这也是 kimi 团队核心技术壁垒，不得而知。

内部成员的回复：

如何实现上下文扩展？Kimi团队背后的技术原理揭秘

思考：

以后的大模型比拼什么？两点：

1、数据的精准性-各行业

2、计算能力、解析能力-这里的大文本上下文解析就算！

说到这里，我们不难发现：成长与发展是工作与生活的主旋律 ~ 最后，自荐一下我和机械工业出版社联合出版的《程序员成长手记》一书：全书分为3大模块、8个章节：从入门程序员到程序员自驱成长，回归纸质阅读，相信能给你一个更全局的程序员视野，提供成长帮助。京东搜“程序员成长手记”

如何实现上下文扩展？Kimi团队背后的技术原理揭秘

OK，以上便是本次分享，希望各位喜欢~ 欢迎点赞、收藏、评论 🤟 我是安东尼 🤠 人气技术博主 💥 坚持千日更文 ✍ 关注我，安东尼陪你一起度过漫长编程岁月

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

如何实现上下文扩展？Kimi团队背后的技术原理揭秘

如何用跨平台、灵活的框架训练PyTorch模型？

buzz开源项目：视频/音频转录文字工具，实时语音转文字，离线使用

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

如何用跨平台、灵活的框架训练PyTorch模型？

buzz开源项目：视频/音频转录文字工具，实时语音转文字，离线使用

Transformer 世家：探索自然语言处理技术的演进

Transformer 世家：探索自然语言处理领域的最新进展

大语言模型的发展及其技术原理解析

ARHUD驾车导航技术及其虚像投影原理解析