腾讯混元大模型展开,介绍了3月21日混元T1正式版的推出,其在推理模型基础能力测试中的优异表现,此前混元大模型登上Chatbot Arena榜单的情况,回顾了去年混元Turbo的发布情况以及本月腾讯元宝电脑版App内置模型的情况。
在3月21日的深夜时分,腾讯混元传出一则重磅消息——正式推出了自研深度思考模型混元T1的正式版本。这一举措,无疑为人工智能领域注入了新的活力。
在衡量推理模型基础能力的常见benchmark测试中,混元T1展现出了惊人的实力。以大语言模型评估增强数据集MMLU – PRO为例,混元T1取得了87.2分的优异成绩,仅仅仅次于o1。不仅如此,在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到了业界领先推理模型的水平。这充分证明了混元T1在推理能力方面的卓越表现,为其在人工智能市场中赢得了一席之地。
在此之前,腾讯混元大模型就已经有了出色的表现。腾讯宣布,混元大模型首次登上了Chatbot Arena榜单,成功跻身全球Top 15。在这个平台上,用户以匿名的方式与多个模型进行互动,并通过投票来决定哪个模型更加出色,最终根据分数生成排行榜。这种测评方式简单直接,就像是大模型之间直接PK的竞技场,而混元大模型能够在其中脱颖而出,足以说明其具备强大的竞争力。
回顾腾讯大模型的发展历程,去年9月5日,腾讯发布了新一代大模型混元Turbo。这款大模型采用了MoE架构,相比上一代产品,推理效率提升了100%,推理成本降低了50%。这一技术上的重大突破,为混元系列大模型的后续发展奠定了坚实的基础。
而在本月1日发布的腾讯元宝电脑版App中,更是内置了混元和DeepSeek两种模型,并且支持双模切换。这为用户提供了更多的选择和更好的使用体验,也进一步拓展了混元模型的应用场景。
本文围绕腾讯混元大模型展开,详细介绍了混元T1正式版的推出及其在推理能力测试中的出色表现,回顾了混元大模型此前登上榜单的情况和混元Turbo的发布,还提及了腾讯元宝电脑版App内置模型。整体展现了腾讯在大模型领域的持续发展和技术实力的不断提升。