文章详情

腾讯近日宣布推出其最新的大型语言模型——混元-T1,并表示该模型在推理能力上可与OpenAI的最佳推理系统相匹敌。据腾讯
2025-04-26 17:14:26
文章详情介绍
腾讯近日宣布推出其最新的大型语言模型——混元-T1,并表示该模型在推理能力上可与OpenAI的最佳推理系统相匹敌。
据腾讯介绍,混元-T1在开发过程中高度依赖强化学习,高达96.7%的训练后算力都用于提升模型的逻辑推理能力以及与人类偏好的一致性。
在多项基准测试中,混元-T1展现出强大的性能。在测试14个学科知识的MMLU-PRO评估中,该模型取得了87.2分,仅略低于OpenAI的o1模型。在科学推理方面,浑元-T1在GPQA-diamond测试中获得了69.3分。
尤其值得一提的是,腾讯强调混元-T1在数学方面的卓越表现。其在MATH-500基准测试中获得了高达96.2分的成绩,仅次于Deepseek-R1。此外,该模型在代码生成(LiveCodeBench:64.9分)和高难度推理(ArenaHard:91.9分)等方面也表现出色。腾讯还指出,混元-T1在多项中文任务上的准确率超过90%。
在模型训练方面,腾讯采用了课程学习的方法,逐步增加任务难度。此外,该公司还创新性地开发了自我奖励系统,利用模型的早期版本评估新版本的输出,从而驱动模型性能的持续提升。
混元-T1采用了Transformer Mamba混合架构,腾讯声称在相同条件下,该架构处理长文本的速度是传统模型的两倍。目前,Hunyuan-T1已通过腾讯云对外开放,并且在Hugging Face上提供了演示。
此次发布是继百度和阿里巴巴相继推出其声称达到o1水平的自研模型后,中国科技巨头在AI领域展开竞争的又一重要举措。值得注意的是,阿里巴巴、百度和Deepseek都在积极推行开源战略。人工智能投资者、前谷歌中国区总裁李开复此前曾公开表示,这些中国AI模型的发展对OpenAI构成了潜在的生存威胁。
最新星火攻略
更多- 新一轮测试考验 AI 智能能力:ARC-AGI-2 使顶尖模型面临严峻挑战
- QQ飞车游戏内喇叭刷屏辅助工具的作用与潜在风险评估分析
- 阿里发布创新多模态模型 Qwen2.5-VL-32B:兼顾视觉信息处理与数学推理能力的最新突破
- Google AI Studio 现已开放,用户可以通过 ai.dev 域名直接进行访问和使用
- OpenAI 改进语音助手功能,使对话更加自然流畅并显著降低打断频率
- 3366小游戏植物大战僵尸2 3366小游戏:深入解析植物大战僵尸2的游戏机制与策略
- 国产AI芯片迅速崛起!最新消息透露蚂蚁集团训练成本下降20%,已接近英伟达水平
- 阿里新推出的TaoAvatar虚拟人项目:全身AR虚拟人物拥有表情与动作,能够在增强现实场景中流畅对话
- 韩国人工智能芯片创业公司FuriosaAI拒绝Meta提出的8亿美元收购报价,选择独立发展
- 中国AI新星DeepSeek-V3强势来袭:以20令牌每秒的速度,能否掀起AI行业的新革命?
- 震撼来袭!DeepSeek-V3-0324版本正式上线,便捷免费商用,普通消费者电脑轻松运行!
- 探索英雄联盟中的露 Lulu:作为辅助之光的战斗与魅力
- DeepSeek-V3-0324 稳步推出:技术界热议的低调优化与全面升级
- 知乎直答全新版本上线:显著降低AI幻觉,实现回答可直接追溯至答主的便利新体验
- 谷歌Gemini Live推出全新功能:实现屏幕共享与实时视频互动,提升交流体验!
最新星火智能
更多- 高尔夫已不再是精英的游戏,Golfoy 创始人借助 AI 技术重塑高尔夫体验与参与方式
- 剑网3天策职业加点详解与攻略,助你轻松掌握天策角色养成及技能搭配
- 苹果手表即将添加人工智能功能与摄像头,开启全新用户体验之旅
- 口袋妖怪与信长之野望的跨世冒险:奇幻融合之旅的探索与体验
- LiblibAI与阿里通义大模型深度合作,推出全新10秒AI视频生成技术,赋能创作新可能
- 告别为短视频转文案付费的烦恼,豆包网页版让你轻松一键搞定抖音视频转文案!
- 视觉语言AI再迎重大进展!伯克利推出TULIP模型,性能显著超越当前所有技术水平
- 与岳乱lun合欢第1集:深度剖析剧情发展与角色塑造之美
- 英国政府官员呼吁民众支持人工智能版权改革,抵制不应成为选择
- 首个针对海洋行业的专业人工智能模型“瀚海智语”正式发布,为智慧海洋时代的发展注入强大动力
- 微软发布 GeoMap-Bench,推动地质图解析智能化进程,提升地质数据理解能力
- 19岁高清免费观看国语版新闻:新一代视听盛宴,掀起观影热潮的背后故事
- 周杰伦的音乐旅程:探寻副本歌词中的奇幻冒险与情感交织
- 百度秒哒正式全线发布 宣称为国内首个对话式应用开发平台的引领者
- 蚂蚁集团推出两款前沿 MoE 大模型,显著降低训练成本并提升效率