文章详情

在科技发展的浪潮中,人工智能(AI)技术日新月异。最近,由著名大模型训练平台 Together AI 和智能体平台 Ag
2025-04-28 20:35:09
文章详情介绍
在科技发展的浪潮中,人工智能(AI)技术日新月异。最近,由著名大模型训练平台 Together AI 和智能体平台 Agentica 联合开源的新模型 DeepCoder-14B-Preview,吸引了广泛关注。
该模型以仅有的140亿参数,在代码测试平台 LiveCodeBench 上的得分为60.6%,超过了 OpenAI 的 o1模型(59.5%),仅略低于 o3-mini(60.9%)。这一成绩在 Codeforces 和 AIME2024的评测中也表现出色,与 o1和 o3-mini 不相上下。
DeepCoder 不仅仅是一个新模型,其开源内容丰富,包含了模型权重、训练数据集、训练方法、训练日志及优化策略等,极大方便了开发者深入理解模型的开发流程。开源地址和相关的 GitHub 链接均已公布,便于有兴趣的开发者进行探索和研究。
DeepCoder 是在 Deepseek-R1-Distilled-Qwen-14B 基础上,通过分布式强化学习(RL)进行微调而成。为了构建高质量的训练数据集,研究团队收集了24,000个可验证的编程问题,并通过程序验证、测试过滤和去重等步骤确保数据质量。所有问题均通过外部官方解决方案进行验证,并满足严格的单元测试标准。
在代码强化学习训练过程中,DeepCoder 使用了两种沙盒环境来执行单元测试并计算奖励。Together Code Interpreter 环境高效且可扩展,能够支持大量并发沙盒,另外一个本地代码沙盒则确保了与现有排行榜的一致性。
DeepCoder 在奖励函数设计上采用了稀疏结果奖励模型,确保模型专注于生成高质量代码,而非通过记忆测试用例获取奖励。同时,为了实现更稳定的训练过程,模型采用了改进版的 GRPO 算法,并引入了迭代上下文扩展技术,显著提高了模型的推理能力。
为了加速端到端的 RL 训练,DeepCoder 团队还开源了优化扩展 verl-pipeline,通过一次性流水线技术,使训练、奖励计算和采样的过程完全流水化,大大提高了训练效率。
尽管 DeepCoder 刚刚开源,然而网友们对其表现非常赞赏,认为其是一个值得期待的开源项目。Together AI 成立于2022年,致力于提供高性能的 AI 模型和服务,最近还获得了3.05亿美元的融资,显示出其在行业中的强劲势头。
开源地址:https://huggingface.co/agentica-org/DeepCoder-14B-Preview
github:https://github.com/agentica-project/rllm
划重点:
🌟 DeepCoder-14B-Preview 模型表现优秀,得分超过 OpenAI 的 o1模型。
📈 开源内容丰富,包括模型权重和训练数据,方便开发者研究。
⚙️ 采用多种技术确保数据质量和训练效率,显著提升了模型性能。
最新星火攻略
更多- NS2与NS卡带的兼容性探讨:揭示Nintendo Switch如何处理旧款游戏卡带的兼容性挑战
- 网信办:至2025年3月31日已有346款生成性人工智能服务完成备案登记工作
- 剑网3指尖江湖:全面解析快速提高战力的多种有效策略与方法
- AI虚拟化身推动技术创新浪潮:生成模型为多元化应用开启新视野
- 深入星露谷物语的探险:成功献祭沙漠柱子的实用技巧与策略指南
- Deep Research正式推出Gemini 2.5 Pro:谷歌最新的AI智能模型引领科技潮流
- 燕云十六声:扇子武学的偷师秘籍与实用攻略分享
- DNF忍者觉醒深入解析:技能特点、玩法策略及角色发展全方位分析
- SiteMCP:一款将普通网站转变为功能强大的MCP服务器的创新解决方案
- 魔兽世界:轻松获取战地修理机器人110G图纸的高效攻略与技巧分享
- 抖音宣布推出辟谣卡功能:将人工审核与AI大模型技术相结合以提升辟谣准确性
- 魔兽世界MC中的灭火任务全攻略详解,助你轻松完成挑战
- 甲骨文在建设 OpenAI 数据中心方面进展缓慢或将对未来的合作关系产生潜在影响
- 烟雨江湖曲谱选购技巧与购买渠道全解析
- 《2025年全球人工智能发展指数报告》:全球AI创新持续加速,中国在多个领域展现出强劲的增长势头
最新星火智能
更多- 探索获取新月同行超相尘道具的详细方法与最佳攻略技巧
- 2025年全国大模型算法备案补贴政策重磅出台,最高可获5000万元的奖励补贴详情一览!
- 2024 LCK S14dk 各大战队阵容及选手国籍全面解析
- 全新SkyReels-A2视频生成框架发布:可控视频生成技术再攀高峰,开启创作新纪元
- 魔兽世界PLUS各职业符文天赋全解析——输出牧师的必备攻略与选择指南
- AI动态更新:阿里即将推出最新模型Qwen3;GitHub宣布开源MCP服务器;Runway隆重发布Gen-4 Turbo新版本
- 中华网游戏:深入探讨多元化游戏世界的无尽探索与可能性
- 2024年畅玩拳皇手游下载榜单:最佳街机游戏强烈推荐
- Vision-R1:借助强化学习技术提升视觉定位能力,图文模型性能显著提升达50%
- 有效提升技能熟练度的实用方法与策略,让你快速掌握各项技能
- Sync Labs 推出 Lipsync-2:全球首个实现零-shot嘴部动作同步的革命性模型
- 赛尔号丁格具体出现位置详解及捕获技巧分析
- 神仙道:嫦娥升仙所需的道具数量究竟有多少?
- IBM推出全新z17大型机:每天可完成高达4500亿次AI推理,性能相比前代提升达50%
- WLK巫妖王之怒怀旧服:推荐高原创度冰法AA天赋的全面指南与策略分析
最新星火游戏
更多








