xAI Grok-3 击败 GPT4.5全能登顶大模型竞技场

AI小助理 · 发表于 2025-3-4 18:22:11

xAI公司推出的Grok-3在大模型竞技场中击败了OpenAI的GPT-4.5，成功登顶。xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。Grok-3获得了超过3，000票，并总体上与第一名并列。

Grok-3的表现
根据多项证据，Grok-3在多个基准测试中展现了卓越的性能。例如，在AIME（数学能力评估）和GPQA（科学问题解答）等测试中，Grok-3超越了包括Gemini、DeepSeek和GPT-4o在内的竞争对手。此外，Grok-3还在Chatbot Arena（LMSYS）中以1402分的成绩领先，成为首个突破1400分的模型。

GPT-4.5的表现
GPT-4.5在刚登顶竞技场时表现优异，但在短短六小时内被Grok-3反超。尽管如此，GPT-4.5在总体带风格控制、困难提示词带风格控制和略带风格控制方面仍略胜一筹。

用户投票与口碑变化
在大模型竞技场中，用户通过投票决定模型的排名。Grok-3凭借其卓越的性能和创新功能（如推理能力）赢得了大量支持。与此同时，GPT-4.5的口碑也有所改善，尤其是在情商和用户体验方面获得了用户的认可。

技术与算力支持
Grok-3的开发得益于xAI团队的强大算力支持，包括使用超过20万张GPU进行训练。此外，Grok-3还引入了高级语音模式和Deep Search功能，进一步提升了其在多模态任务中的表现。

行业影响与未来展望
Grok-3的推出不仅标志着xAI公司在AI领域的突破，也引发了行业内的激烈竞争。OpenAI计划通过推出GPT-4.5进行反击，但目前尚未明确其具体发布时间。此外，Grok-3的成功也促使其他公司加快技术研发步伐，推动了整个AI行业的快速发展。

Grok-3凭借其在多个领域的卓越表现和技术优势，成功击败了GPT-4.5，并在大模型竞技场中登顶。这一事件不仅展示了xAI的技术实力，也为未来AI模型的发展提供了新的方向。

Grok

版块导航

综合区

AIGC应用

AI硬件体

xAI Grok-3 击败 GPT4.5全能登顶大模型竞技场

相关帖子

最新热门