Qwen1.5-MoE-A2.7B：性能与效率的最佳实践

AI资讯
3月29日
编辑

AICMTY

释放双眼，带上耳机，听听看~！

通义千问团队推出了Qwen1.5-MoE-A2.7B，这是一款性能与效率优异的机器学习模型，拥有出色的训练成本、推理速度和参数优化。该模型已在ModelScope社区开源，并持续更新支持第三方框架，是推理训练的最佳实践之一。

AICMTY（aicmty.com） 3月29日消息:通义千问团队推出了 Qwen 系列的首个 MoE 模型，命名为 Qwen1.5-MoE-A2.7B。这个模型只有27亿个激活参数，但性能却与当前最先进的70亿参数模型相媲美。与 Qwen1.5-7B 相比，Qwen1.5-MoE-A2.7B 只有20亿个非嵌入参数，大约是原模型大小的三分之一。此外，相较于 Qwen1.5-7B，Qwen1.5-MoE-A2.7B 的训练成本降低了75%，推理速度提升了1.74倍。

Qwen1.5-MoE-A2.7B：性能与效率的最佳实践

Qwen1.5-MoE 模型采用了特别设计的 MoE 架构。与传统 MoE 方法不同的是，Qwen1.5-MoE 使用了64个 finegrained experts，并引入了新的 routing 机制 DeepSeek-MoE 和 DBRX。这种 finegrained experts 设计的目的是在不增加参数数量的情况下生成更多 expert。Qwen1.5-MoE 模型在训练成本和推理效率方面表现出色，性能接近最先进的7B 模型。

Qwen1.5-MoE-A2.7B 模型拥有14.3亿激活参数和2亿非嵌入参数，训练成本降低了75%。在实验中，使用单个 NVIDIA A100-80G GPU 测试时，Qwen1.5-MoE-A2.7B 的推理速度提高了约1.74倍。Qwen1.5-MoE 模型已在 ModelScope 社区开源，可直接下载使用。

除了性能和效率，Qwen1.5-MoE 模型还将持续更新对第三方框架的支持，包括 llama.cpp、MLX 等。

总体来说，Qwen1.5-MoE 模型在性能、效率和推理速度方面取得了显著的优势，是推理训练的最佳实践之一。

Qwen1.5-MoE体验链接:

https://modelscope.cn/studios/qwen/qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4-demo

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

Qwen1.5-MoE-A2.7B：性能与效率的最佳实践

2023年大型语言模型定制指南：硬件需求与GPU选择

人工智能和机器学习：深度学习和生成式AI的区别

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

2023年大型语言模型定制指南：硬件需求与GPU选择

人工智能和机器学习：深度学习和生成式AI的区别

三星发布全新生成式AI模型Samsung Gauss，提升工作效率和用户体验

ChatGPT自拍照事件揭秘：AI模型随机生成Imgur链接导致网友恐慌

GPT-5即将问世？泄密者透露多模态Gobi或为GPT-5

OpenAI Whisper模型：将语音转换成文本