文章详情

中国人工智能初创公司DeepSeek悄然发布了大型语言模型DeepSeek-V3-0324,在人工智能行业引发了震动。该
2025-04-26 15:58:53
文章详情介绍
中国人工智能初创公司DeepSeek悄然发布了大型语言模型DeepSeek-V3-0324,在人工智能行业引发了震动。该模型以641GB的体量现身于AI资源库Hugging Face,此次发布延续了DeepSeek低调却极具影响力的风格,没有大肆宣传,仅附带空的README文件和模型权重。
这款模型采用MIT许可,可免费用于商业用途,且能在消费级硬件——配备M3Ultra芯片的苹果Mac Studio上直接运行。AI研究人员Awni Hannun在社交媒体透露,4位量化版本的DeepSeek-V3-0324在512GB的M3Ultra芯片上,运行速度超20令牌/秒。尽管Mac Studio价格高昂,但能在本地运行如此大规模模型,打破了以往顶尖AI对数据中心的依赖。
DeepSeek-V3-0324采用混合专家(MoE)架构,执行任务时仅激活约370亿个参数,而非全部6850亿个参数,大幅提升了效率。同时,它融入了多头潜在注意力(MLA)和多令牌预测(MTP)技术,MLA增强了模型在长文本中的上下文理解能力,MTP使模型每次能生成多个令牌,输出速度提升近80%。4位量化版本将存储需求降至352GB,这使得在高端消费级硬件上运行成为可能。
早期测试者反馈,DeepSeek-V3-0324较上一版本有显著提升。AI研究人员Xeophon宣称,该模型在所有测试指标上都有巨大飞跃,已超越Anthropic的Claude Sonnet3.5,成为最佳非推理模型。而且,与需订阅使用的Sonnet不同,DeepSeek-V3-0324的权重可免费下载使用。
DeepSeek的开源发布策略与西方AI公司形成鲜明对比。美国的OpenAI和Anthropic等将模型设置付费门槛,而中国AI企业愈发倾向于宽松的开源许可。这一策略加速了中国AI生态系统的发展,像百度、阿里巴巴和腾讯等科技巨头也纷纷跟进,发布开源AI模型。在面临英伟达芯片限制的情况下,中国企业通过强调效率和优化,将劣势转化为竞争优势。
DeepSeek-V3-0324很可能是即将推出的DeepSeek-R2推理模型的基础。当前推理模型计算需求巨大,若DeepSeek-R2性能出色,将对OpenAI传闻中的GPT-5构成直接挑战。
对于想要体验DeepSeek-V3-0324的用户和开发者,可从Hugging Face下载完整模型权重,但文件较大,对存储和计算资源要求较高。也可选择云服务,如OpenRouter提供免费API访问和友好的聊天界面;DeepSeek自身的聊天界面可能也已更新支持新版本。开发者还能通过Hyperbolic Labs等推理服务提供商集成该模型。
值得注意的是,DeepSeek-V3-0324在沟通风格上有所变化,从之前类似人类的对话式风格转变为更正式、技术化的风格。这种转变是为了适应专业和技术应用场景,但可能会影响其在面向消费者应用中的吸引力。
DeepSeek的开源策略正在重塑全球AI格局。此前,中国AI与美国有1-2年的差距,如今已大幅缩小至3-6个月,部分领域甚至实现了赶超。就像安卓系统通过开源获得全球主导地位一样,开源AI模型凭借广泛的应用和开发者的集体创新,有望在竞争中脱颖而出,推动AI技术更广泛地应用。
最新星火攻略
更多- 震撼来袭!DeepSeek-V3-0324版本正式上线,便捷免费商用,普通消费者电脑轻松运行!
- 探索英雄联盟中的露 Lulu:作为辅助之光的战斗与魅力
- DeepSeek-V3-0324 稳步推出:技术界热议的低调优化与全面升级
- 知乎直答全新版本上线:显著降低AI幻觉,实现回答可直接追溯至答主的便利新体验
- 谷歌Gemini Live推出全新功能:实现屏幕共享与实时视频互动,提升交流体验!
- 高尔夫已不再是精英的游戏,Golfoy 创始人借助 AI 技术重塑高尔夫体验与参与方式
- 剑网3天策职业加点详解与攻略,助你轻松掌握天策角色养成及技能搭配
- 苹果手表即将添加人工智能功能与摄像头,开启全新用户体验之旅
- 口袋妖怪与信长之野望的跨世冒险:奇幻融合之旅的探索与体验
- LiblibAI与阿里通义大模型深度合作,推出全新10秒AI视频生成技术,赋能创作新可能
- 告别为短视频转文案付费的烦恼,豆包网页版让你轻松一键搞定抖音视频转文案!
- 视觉语言AI再迎重大进展!伯克利推出TULIP模型,性能显著超越当前所有技术水平
- 与岳乱lun合欢第1集:深度剖析剧情发展与角色塑造之美
- 英国政府官员呼吁民众支持人工智能版权改革,抵制不应成为选择
- 首个针对海洋行业的专业人工智能模型“瀚海智语”正式发布,为智慧海洋时代的发展注入强大动力
最新星火智能
更多- 微软发布 GeoMap-Bench,推动地质图解析智能化进程,提升地质数据理解能力
- 19岁高清免费观看国语版新闻:新一代视听盛宴,掀起观影热潮的背后故事
- 周杰伦的音乐旅程:探寻副本歌词中的奇幻冒险与情感交织
- 百度秒哒正式全线发布 宣称为国内首个对话式应用开发平台的引领者
- 蚂蚁集团推出两款前沿 MoE 大模型,显著降低训练成本并提升效率
- AI最新动态:美团推出内部大型模型LongCat;vivo设立独立机器人实验室;腾讯正式发布混元T1版本
- 研究揭示,人工智能工具的应用加大了管理层与普通员工之间的矛盾与冲突
- 王兴:美团内部大模型LongCat已开发完成,并投入数十亿元购置GPU资源以支持人工智能发展
- 在QQ农场中选择哪些作物能够更快升级,提升游戏体验的方法与建议
- 手机行业领军者纷纷布局机器人领域,vivo 机器人实验室正式成立,开启技术创新新篇章
- 怪物猎人P3:探索古代鱼的奇妙世界与猎捕技巧
- 研究发现:ChatGPT 的使用频率增加与个体孤独感上升之间的潜在联系
- 德克萨斯州Alpha学校成功采用AI辅导系统,学生学业成绩迅速提升至全国前2%的水平
- 探索天书奇谈私服的神秘世界,揭开奇幻与冒险的无尽篇章
- 腾讯首次涉足具身智能领域:领投智元机器人最新一轮融资项目