腾讯推出的自研深度思考模型混元T1正式版,包括其上线情况、在各项基准测试中的表现、在超长文本推理领域的优势、价格,还提及腾讯混元推出的图生视频模型及全新3D生成模型并开源的消息。
你是否渴望拥有一个能秒回消息、吐字飞快,且摘要幻觉低、特别擅长超长文推理的大模型,来解决你在信息处理和推理方面的痛点呢?3月21日,腾讯传来重磅消息,其自研的深度思考模型——混元T1正式版震撼登场。目前,该模型已经在腾讯云官网顺利上线,并且即将在腾讯元宝开启灰度测试。
混元T1在推理模型基础能力的常见测评中表现卓越。以大语言模型评估增强数据集MMLU – PRO为例,混元T1取得了87.2分的优异成绩,仅次于o1。不仅如此,在CEval、AIME、Zebra Logic等涵盖中英文知识以及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到了业界领先推理模型的水平,充分展示了其强大的推理能力。
除了在基准测试中的出色表现,混元T1在多项任务中也展现出了极强的适应性。无论是对齐任务、指令跟随任务,还是工具利用任务,混元T1都能轻松应对。
在超长文本推理这个极具挑战性的领域,混元T1更是凭借其出色的长文捕捉能力脱颖而出。它能够有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,其采用的混合Mamba架构针对长序列处理进行了专项优化。通过高效的计算方式,在保证对长文本信息捕捉能力的同时,大幅降低了资源消耗。在相近的激活参数量下,混元T1实现了解码速度提升2倍的惊人效果。
目前,混元T1正式版已经在腾讯云官网上线,其收费标准明确。输入价格为每百万tokens 1元,输出价格为每百万tokens 4元。
值得一提的是,日前腾讯混元还宣布了另外一项重要举措。其推出了图生视频模型以及5个全新3D生成模型,并且将这些模型全部开源。这一举措无疑将持续推动AI技术的开放共享以及整个行业的发展。
腾讯自研的深度思考模型混元T1正式版的上线情况,它在各项基准测试中表现优异,在超长文本推理领域优势明显,还公布了价格。此外,腾讯混元推出的图生视频模型及全新3D生成模型并开源,体现了腾讯在推动AI技术开放共享与行业发展方面的积极作为。