阿里通义千问开源模型Qwen2-72B-Instruct荣登国内通用能力第一

快科技

释放双眼，带上耳机，听听看~！

根据SuperCLUE发布的中文大模型基准测评最新报告，阿里通义千问开源模型Qwen2-72B-Instruct以卓越的表现位居国内通用能力第一，是全球范围内最强的开源模型。该模型在理科、文科和Hard三个维度的综合测评中展现了全面而均衡的能力，同时在端侧小模型测评中也取得了显著成绩。

快科技7月10日消息，根据SuperCLUE发布的中文大模型基准测评最新报告，阿里通义千问开源模型Qwen2-72B-Instruct以卓越的表现位居国内通用能力第一，更在全球范围内成为最强开源模型。

SuperCLUE报告详细披露了对国内外33个大模型的综合测评结果，Qwen2-72B在一级总分上以77分的高分与Claude-3.5-Sonnet并列第二，仅次于OpenAI的GPT-4o。

这一得分超越了百度文心一言4.0、讯飞星火V4.0、Llama-3-70B等开闭源大模型。

阿里通义千问开源模型Qwen2-72B-Instruct荣登国内通用能力第一

具体来看，在理科、文科和Hard三个维度的具体测评中，Qwen2-72B展现了全面而均衡的能力。

特别是在理科任务上，Qwen2-72B与GPT-4o的分差仅为5分，显示出其在计算、逻辑推理和代码测评方面的强劲实力。

在文科任务和Hard任务上，Qwen2-72B同样表现不俗，得分均达到了76分，与GPT-4o的得分相差无几。

特别值得一提的是，在端侧小模型测评中，Qwen2-7B以70亿参数的模型规模，超越了上一代320亿参数的Qwen1.5-32B和130亿参数的Llama-3-8B-Instruct，夺得了排名第一的宝座。

阿里通义千问开源模型Qwen2-72B-Instruct荣登国内通用能力第一

这一成绩不仅证明了Qwen2-7B在小尺寸模型中的极致性能，也极大提升了端侧小模型落地的可行性。

数据显示，截至目前Qwen系列模型的下载量已突破2000万次，其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证