通义千问2.5发布：超越GPT-4Turbo，Qwen1.5-110B成开源新星

AI资讯
5月9日
编辑

AICMTY

释放双眼，带上耳机，听听看~！

阿里云发布通义千问2.5版本，超越GPT-4Turbo，开源1100亿参数模型Qwen1.5-110B表现卓越，成为开源领域新星。理解能力、逻辑推理、指令遵循等能力显著提升，与GPT-4Turbo持平，证明在自然语言处理领域的领先地位。

AICMTY（aicmty.com）5月9日消息:阿里云今日正式发布通义千问2.5版本，该版本在模型性能上全面赶超了GPT-4Turbo，展现了其强大的技术实力。与此同时，通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩，超越了Meta的Llama-3-70B模型，成为开源领域的新星。

与通义千问2.1版本相比，2.5版本在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言，理解能力提升了9%，逻辑推理能力提升了16%，指令遵循能力提升了19%，而代码能力则提升了10%。这一飞跃性的进步使得通义千问2.5在权威基准OpenCompass上的得分与GPT-4Turbo持平，证明了其在自然语言处理领域的领先地位。

通义千问2.5发布：超越GPT-4Turbo，Qwen1.5-110B成开源新星

除了通义千问2.5的发布，通义还推出了最新款开源模型Qwen1.5-110B。这款拥有1100亿参数的模型在MMLU、TheoremQA、GPQA等基准测评中均表现出色，成功超越了Meta的Llama-3-70B模型。在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上，Qwen1.5-110B更是荣登榜首，进一步巩固了通义开源系列在业界的领先地位。

通义的多模态模型和专有能力模型同样令人瞩目。其中，通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了Gemini Ultra和GPT-4V，其强大的视觉理解能力已经在实际应用中得到了广泛验证。而通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手，展现了其在代码生成和代码理解方面的卓越能力。

这一模型的推出不仅满足了开发者对于高效代码生成的需求，也为企业客户提供了更为智能的代码管理和优化解决方案。

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

通义千问2.5发布：超越GPT-4Turbo，Qwen1.5-110B成开源新星

人工智能(AI)的发展、优势与局限性

AlphaFold 3发布：AI预测生物分子结构再次掀起学术圈巨震

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

人工智能(AI)的发展、优势与局限性

AlphaFold 3发布：AI预测生物分子结构再次掀起学术圈巨震

解密Transformer模型：AI大模型的核心机制

OpenAI发布自定义版ChatGPT“GPTs”，开放给所有ChatGPT+订阅者

如何使用GPTs软件？GPTs是否需要开通ChatGPTPlus订阅？

BibiGPT智能视频总结工具，快速提取关键信息