文章来源:放心AI网发布时间:2025-04-03 14:05:48
DeepSeek 悄然发布了最新大型语言模型 DeepSeek-V3-0324,在人工智能行业引发了强烈震动。这款容量高达641GB的模型在 AI 模型库 Hugging Face 上低调亮相,延续了该公司一贯的低调但具有深远影响的发布风格。
性能飞跃,可媲美 Claude Sonnet3.5。
DeepSeek-V3之所以备受瞩目,不仅因其强大的功能,还因其独特的部署方式和许可协议。早期测试者反馈,新模型在各项性能指标上均取得了显著进步。
AI 研究员 Xeophon 在 X 平台上表示,DeepSeek V3在其内部测试中“所有测试指标均有巨大提升”,并声称其现在是“最佳的非推理模型,已取代 Sonnet3.5”。若此说法得到广泛验证,DeepSeek 的新模型将超越备受尊敬的商业 AI 系统 Claude Sonnet3.5。
开源商用,惠及大众:打破付费壁垒。
与需订阅使用的 Sonnet 不同,DeepSeek-V3-0324的模型权重完全免费,供所有人下载与使用。更重要的是,该模型采用 MIT 许可证,意味着它可自由用于商业目的。这种开放态度与西方 AI 公司常见的付费使用模式形成鲜明对比。
MoE 架构与两大技术突破。
DeepSeek V3-0324的创新架构实现了卓越效率。该模型采用混合专家(MoE)架构,从根本上改变了大型语言模型的运作方式。与传统模型不同,DeepSeek 的方法在特定任务中仅激活其6850亿参数中的约370亿个,而非全部激活。这种选择性激活标志着模型效率的重大转变,大幅降低计算需求的同时,实现了与更大完全激活模型相当的性能。
此外,该模型还融合了两项突破性技术:多头潜在注意力(MLA)和多令牌预测(MTP)。MLA 增强了模型在长文本中维持上下文的能力,而 MTP 则能每步生成多个令牌,而非传统的一次生成一个。这些创新共同将输出速度提升了近80%。
硬件友好,本地运行:消费级设备也能驾驭。
开发者工具创建者 Simon Willison 指出,一个4位量化版本将存储占用减少到352GB,使在高端消费级硬件(如配备 M3Ultra 芯片的 Mac Studio)上运行成为可能。尽管9499美元的 Mac Studio 可能超出了“消费级硬件”的定义,但在本地运行如此庞大的模型与通常需要数据中心级 AI 基础设施的最新 AI 形成了鲜明对比。
风格转变,更重技术。
早期用户反馈显示,新模型的沟通风格发生了显著变化。之前的 DeepSeek 模型因其对话式、类似人类的语调而受到称赞,而“V3-0324”则呈现出更正式、更注重技术的风格。这种转变可能反映了 DeepSeek 工程师的有意识设计选择,旨在将模型重新定位为更专业的和技术性的应用。
DeepSeek 的发布策略揭示了中国和西方公司在 AI 商业理念上的根本差异。在获取尖端 Nvidia 芯片受限的情况下,中国公司更加重视效率和优化,这反而成为了一种潜在的竞争优势。
目前,用户可通过 Hugging Face 下载完整的模型权重,或通过 OpenRouter 等平台体验 DeepSeek-V3-0324的 API 接口。DeepSeek 的开放战略正在重新定义全球 AI 格局,预示着一个更开放、更普及的 AI 创新时代的到来。
上一篇: 中国AI新秀DeepSeek-V3惊艳亮相:20令牌/秒高效运算,或将重塑AI领域?
中国人工智能初创公司DeepSeek近期低调发布了大型语言模型DeepSeek-V3-0324,这一举动在人工智能领域引起了不小的震动。该模型以惊人的641GB体积亮相于AI资源库Hugging Face,延续了DeepSeek一贯的低调而富有影响
下一篇: DeepSeek-V3-0324惊艳亮相:免费商用,电脑轻松驾驭!
DeepSeek 悄然发布了最新大型语言模型 DeepSeek-V3-0324,在人工智能行业引发强烈震动。这款容量高达641GB的模型意外亮相于AI模型库Hugging Face,延续了该公司低调却极具分量的发布风格。性能测试结果显示,Deep
相关攻略 更多
最新资讯 更多
AI语音独角兽ElevenLabs完成2.5亿美元C轮融资,估值突破30亿
更新时间:2025-04-29
百川智能推出国内首个全场景深度思考医疗大模型,革新医学推理方式
更新时间:2025-04-29
奥特曼加码长寿科技:RetroBiosciences欲筹10亿美元,挑战人类寿命极限
更新时间:2025-04-29
OpenAI新成立的PBC部门估值达300亿美元,微软投资股份尚未确定
更新时间:2025-04-29
扎克伯格表示,2025年底Meta将拥有130万个用于AI的GPU
更新时间:2025-04-29
德勤:企业在推行生成式AI项目上面临规模化挑战
更新时间:2025-04-29
AI基础设施争夺战愈演愈烈:OpenAI与微软的微妙关系
更新时间:2025-04-29
聊天机器人平台CharacterAI以第一修正案为由申请驳回与青少年自杀案的诉讼
更新时间:2025-04-29
Deezer日均上传超万首AI音乐,平台开始检测与标记
更新时间:2025-04-29
AI创业公司GameOn创始人与律师妻子被控6000万美元投资诈骗
更新时间:2025-04-29