全部标签

MoE

MoE的Scaling Law: 从理论到实验的建模方式演进

本文从理论推导到实验观察，探讨了MoE的Scaling Law在神经网络模型中的应用，对模型结构和数据的影响进行了重新评估，对于对神经网络模型感兴趣的读者具有一定参考价值。
AI教程
- 440
- 0
陈道一23年12月26日
MoE：高效大模型的神奇技术

Mistral最新的MoE技术震惊了开源圈子，MoE是构建高性能大型语言模型的关键技术，本文深度解析MoE的原理和优势，帮助您深入了解MoE在机器学习领域的重要性和应用价值。
AI资讯
- 187
- 0
新智元23年12月12日
Mistral AI发布开源MoE大模型，开发者热议新阶段

Mistral AI发布了首个开源MoE大模型，引发了AI开发者的热议，该模型被认为是GPT-4的最新竞争对手。本文探讨了该模型的特点、社区反响以及Mistral AI的背景和发展。
AI资讯
- 616
- 0
量子位23年12月10日
混合专家系统（Mixture of Experts, MoE）：集成学习的关键技术

了解混合专家系统（Mixture of Experts, MoE）及其在神经网络领域的应用，探讨了子任务和专家模型的重要性。
AI教程
- 462
- 0
SenseParrots23年12月8日
GPT-4的混合模型：MoE + 指令调优带来1 + 1 > 2的效果

研究表明，GPT-4采用了混合模型MoE和指令调优技术，大幅提升了语言模型的性能。该模式在Google、UC Berkeley等机构的研究中得到了验证。
AI教程
- 228
- 0
机器之心23年12月4日