文章详情

一项新的独立评估显示,Meta 最新推出的 Llama4模型——Maverick 和 Scout 在标准测试中表现出色,
2025-04-28 15:46:55
文章详情介绍
一项新的独立评估显示,Meta 最新推出的 Llama4模型——Maverick 和 Scout 在标准测试中表现出色,但在复杂长上下文任务中表现欠佳。根据人工智能分析的“智能指数”,Maverick 得分49分,领先 Claude3.7Sonnet(得分未具体列出),但落后于 Deepseek V30324(53分);Scout 得分36分,与 GPT-4o-mini 相当,优于 Claude3.5Sonnet 和 Mistral Small3.1。两款模型在推理、编码和数学任务中表现稳定,未显示明显短板。
Maverick 的架构效率令人瞩目,其活动参数仅为 Deepseek V3的170亿(对比370亿),总参数占60%(4020亿对比6710亿),且能处理图像而非仅限于文本。价格方面,Maverick 每百万输入/输出代币均价为0.24美元/0.77美元,Scout 为0.15美元/0.4美元,低于 Deepseek V3,甚至比 GPT-4o 便宜10倍,成为最实惠的 AI 模型之一。
然而,Llama4的发布引发争议。LMArena 基准测试显示,Maverick 在 Meta 推荐的“实验性聊天版本”下排名第二,但启用“风格控制”后跌至第五,凸显其依赖格式优化而非纯粹内容质量。测试人员质疑 Meta 的基准可靠性,指出其与其他平台表现差异明显。Meta 承认优化了人类评估体验,但否认训练数据作弊。
长上下文任务是 Llama4的明显弱点。Fiction.live 测试表明,Maverick 在128,000个令牌下准确率仅为28.1%,Scout 更低至15.6%,远逊于 Gemini2.5Pro 的90.6%。尽管 Meta 宣称 Maverick 支持100万令牌、Scout 支持1000万令牌上下文窗口,但实际性能远未达标。研究显示,超大上下文窗口收益有限,128K 以下更实用。
Meta 生成 AI 负责人 Ahmad Al-Dahle 回应称,早期不一致源于实施问题,而非模型缺陷。他否认测试作弊指控,并表示部署优化正在进行,预计数日内稳定。
最新星火攻略
更多- 全面探讨鹅鸭杀游戏中的所有角色及其阵营详细介绍与分析
- 谷歌DeepMind被指实施严厉竞业限制协议,员工离职后一年内禁止加入竞争公司
- 优化家居设计灵感:米姆哈建房子技巧全面解析与实践分享
- 谷歌 Gemini Live 屏幕共享功能现已支持 Pixel 9 和 Galaxy S25 手机用户的便捷体验
- 获取橡子屋放大镜的详细方法及实用攻略汇总
- Shopify首席执行官强调团队在招聘新员工前,需证明人工智能无法胜任该职位的工作
- 复古传奇手游电脑版:经典重温,带你再度感受辉煌岁月的奇幻旅程
- 桃源记2微氪玩家如何合理购买礼包以提升游戏体验
- 商汤科技 SenseCore 2.0 即将升级,预计算力将迎来指数级的飞跃性增长
- 星痕共鸣中神射手的最佳玩法与详细攻略分享
- 阿里国际大力招募人工智能人才:八成岗位专注于AI技术与应用领域
- 魔法祈幻界莉莉的魅力与实力分析,值得关注的角色揭秘
- 阿里发布OmniTalker:突破AI视频生成技术,通过单一参考视频实现语音风格化与表情同步效果
- 秘影曼德拉如何有效收集地图碎片并完成游戏任务
- Supabase全新发布MCP服务器:推动AI与数据库技术深度融合的新里程碑
最新星火智能
更多- 醉逍遥中哪种职业最为强大和厉害 玩家推荐的热门职业分析
- 作者们联合抗议Meta未经授权使用其作品进行AI训练,版权问题引发广泛关注与热烈讨论
- 崩溃大陆2中如何快速解锁火力全开成就的详细攻略和心得分享
- DeepSeek与清华大学联合开发先进的自我优化人工智能模型,推动智能技术持续进步
- 风暴崛起流程视频的详细介绍与观看指南,了解游戏的精妙之处
- 初级开发者对AI的过度依赖或将导致的潜在风险值得我们高度重视
- DNF无知灾祸属性的无常特性是什么,以及对角色战斗的影响分析
- 阴阳师悬赏任务详解 阴阳师悬赏机制及攻略全面解析
- Kimi开放平台宣布实施价格调整:模型推理服务和上下文缓存服务价格双双下调
- 探秘洛克王国世界机械系精灵的种类与特点,看看都有些什么神奇的角色
- 人工智能音乐版权争议:科技巨头与音乐行业之间的持续博弈与较量
- 云顶之弈S14赛季执事阵容最佳搭配策略与玩法解析
- AI最新动态:Kimi官方宣布价格下调;OpenRouter发布全新免费AI模型Quasar Alpha;Midjourney V7正式发布重磅新功能
- 冒险王之神兵传奇无敌版全方位剖析与深入解读,探索无敌版的游戏特点及技巧
- 魔法祈幻界希亚是否真有强大实力?她的能力到底如何?
最新星火游戏
更多








