全部标签

推理能力

LLM基准测试揭示的推理能力缺陷

最新研究揭示了LLM基准测试中模型推理能力的缺陷，通过简单的逻辑推理问题来展示大多数先进LLM的崩溃情况。了解LAION研究机构的发现，以及GPT-4o和Claude3Opus等模型在AIW问题中的表现。
AI资讯
- 506
- 0
新智元6月11日
负样本知识蒸馏：提升大语言模型推理能力的创新框架

本文介绍了一个创新的框架，利用负样本知识蒸馏来提升大语言模型的推理能力，以解决复杂数学问题，并展示了负样本在模型专业化过程中的关键作用。
AI教程
- 202
- 0
小红书技术REDtech1月16日
如何通过CoT提示提升LLM的业务表现能力？

本文探讨了如何通过CoT提示和提示词工程来提升LLM的业务表现能力，以及Few-Shot CoT和Zero-Shot CoT的应用，为理解和优化大型语言模型提供了有益的见解。
AI教程
- 696
- 0
YBCarry_段松啓23年12月22日
GAIA人工智能基准测试：GPT-4表现惨淡，对AI系统的挑战性及重要性

了解GAIA人工智能基准测试，GPT-4的表现及对AI系统挑战性的重要性。探讨人工智能系统在推理能力等基本能力上的表现，以及GAIA对当前人工智能系统的评估方法。
AI教程
- 635
- 0
机器之心23年12月8日
Orca 2: 如何提升较小语言模型的推理能力

了解如何利用大型语言模型的知识来提升较小模型的推理能力，以及Orca 2在复杂任务中的性能表现。
AI资讯
- 281
- 0
机器之心23年12月3日
LLM自我校正研究：发现推理错误并纠正的新方法

了解最新研究：LLM在发现和纠正推理错误方面的突破性方法，使用回溯方法提升推理能力。
AI教程
- 459
- 0
机器之心23年11月28日
Think-on-Graph技术：深度推理领域的革新

了解由IDEA研究院、微软亚洲研究院、香港科技大学等研究团队推出的Think-on-Graph技术，通过深度融合大模型与知识图谱，实现多领域性能提升，引领深度推理领域的革新。
AI资讯
- 638
- 0
AICMTY23年11月28日
大语言模型的推理能力探讨及研究进展

本文探讨了大语言模型（LLM）的推理和规划能力，并介绍了对GPT-4的研究进展，旨在揭示大语言模型在复杂规划任务中的表现。
AI资讯
- 283
- 0
新智元23年11月24日
微软推出“从错误中学习”模型训练法，改善AI推理能力

微软亚洲研究院联合高校提出了一项名为“从错误中学习（LeMA）”的AI训练方法，通过模仿人类学习知识的过程，来改进AI推理能力。研究团队公开了LeMA的相关资料在GitHub上。
AI资讯
- 466
- 0
漾仔23年11月7日