文章详情

近日,华为技术有限公司携手北京大学高性能计算校级公共平台,正式揭晓了DeepSeek全栈开源推理方案,这一发布标志着双方在人工智能推理领域...
2025-04-04 12:40:01
文章详情介绍
近日,华为技术有限公司携手北京大学高性能计算校级公共平台,正式揭晓了DeepSeek全栈开源推理方案,这一发布标志着双方在人工智能推理领域的深度合作迈出了重要一步。
DeepSeek方案依托北京大学自主研发的SCOW算力平台系统与鹤思调度系统,并巧妙融合了DeepSeek、openEuler、MindSpore及vLLM/RAY等多个开源社区组件。该方案专为华为昇腾系列硬件设计,旨在实现高效推理,并支持大规模算力集群的训推一体化部署。尤为所有开发者均可自由获取源码,并根据实际需求进行二次开发,其性能表现已接近市面上的闭源方案。
相较于传统的闭源方案,DeepSeek在硬件配置上展现出了显著优势。以DeepSeek-R1-w8a8配置为例,在2台Atlas 800I A2服务器的支持下,输入长度为4096时,输出长度可达1024,系统吞吐量高达1198,而在用户并发测试中,同样达到了128的并发处理能力。
目前,DeepSeek方案已成功部署于北京大学未名卓越一号集群。该集群由北京大学计算中心负责运维,是北大鲲鹏昇腾科教创新卓越中心的重要算力支撑。作为国内首个基于高校自研基础软件的国产智算平台,未名卓越一号集群自2024年11月18日上线以来,已集成了20台昇腾AI服务器与10台鲲鹏通用服务器,其AI算力规模达到了30.64PFlops(半精度),为科研与教学提供了强大的算力保障。
DeepSeek推理方案的核心优势在于其全栈开源组件的构建与深度优化。在openEuler开源操作系统层面,方案进行了全面优化,通过异构调度负载感知MoE冷热专家,实现了更精细的任务调度。同时,方案还采用了异构融合技术,有效管理内存,大幅减少了系统内存碎片。毕昇编译器的进一步优化,更是显著减少了算子下发耗时,从而提升了推理的整体性能。
上图展示了算力集群全栈开源推理方案的架构图,从中不难看出,DeepSeek方案在设计与实施上均体现出了高度的专业性与创新性。此次合作不仅展示了华为与北京大学在人工智能领域的深厚积累,更为国内AI推理技术的发展注入了新的活力。
最新星火攻略
更多- 魔兽争霸无双乱舞4.27新手完整攻略与玩法流程详解
- 怪物猎人荒野所需最低显卡配置详解与评估
- 天国拯救2入侵者支线任务完全攻略与完成流程指南
- Win11预览版重磅升级:画图、截图及记事本引入全新AI功能助力创作
- 宇树G1机器人展现“鲤鱼打挺”技能,精通太极格斗,AI技术亦在不断进化
- 苹果智能显示屏推迟发布,Siri升级是否成了发展的主要障碍?
- 英伟达首席执行官黄仁勋高度评价华为:彰显中国科技自立自强的优秀范例
- 崩坏星穹铁道3.1末日幻影猢狲博弈全星攻略与通关技巧分享
- 腾讯第四季度营收同比增长11%,AI投资热潮推动资本支出激增近四倍
- 仙剑世界林家堡画痴解谜任务位置及全流程详细指南
- 掌握英雄联盟星陨之誓宝典快速升级的秘诀与技巧
- 百川智能中止通用大模型的预训练工作,全力投入到医疗领域的深度发展
- 崩坏星穹铁道嗷呜嗷呜事务所如何成功击败最终敌手通关详尽流程
- 过敏季节悄然来临,叮当快药成为市民的“守护天使”,全天候解决过敏问题
- 金铲铲之战的利息计算机制详细解析与规则说明
最新星火智能
更多- 刺客信条奥德赛温泉之战序章详细攻略与战斗流程分析
- 苹果智能手表或将新增摄像头功能,古尔曼透露最新进展动态
- 金铲铲之战新年祝福腕豪阵容搭配与玩法推荐
- 稚晖君智元机器人推出全新GO-1大模型:开启具身智能发展的新纪元
- 腾讯加速推进AI战略,全球竞争中能否重新获得行业领先地位?
- 如何下载守望先锋国服-详细的守望先锋国服下载安装步骤指南
- 苹果智能手表即将迎来重大革新?或配备摄像头与人工智能功能
- 东南大学首推阿里QwQ-32B模型,科研AI推理能力显著提升!
- 荒野大镖客2:揭秘城镇习俗彩蛋,探寻游戏内的文化与历史印记
- 梦幻模拟战神乐实战指南:玩转神乐特色玩法攻略详解
- 大华股份合作伙伴大会隆重开幕,共同探索数智化新生态,携手创造行业崭新未来
- PGL克卢日纳波卡2025年最有价值球员MVP究竟是谁?详细介绍与分析
- 王者荣耀每日一题答案于2月25日隆重公布,快来查看你的答案!
- 怪物猎人荒野秘药快速获取攻略-提升荒野秘药获取效率的方法汇总
- 金铲铲之战13.6版本哪些阵容适合上分玩家使用