文章来源:放心AI网发布时间:2025-05-01 09:37:42
DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。
DeepSeek R1在后训练阶段大规模应用了强化学习技术,即便是在极少标注数据的情况下,也显著提升了模型的推理能力。在数学、代码、自然语言推理等关键任务上,DeepSeek R1的性能均能与OpenAI o1正式版平分秋色,展示了其强大的实力。
为了回馈开源社区,DeepSeek同时开源了DeepSeek-R1和DeepSeek-R1-Zero两款模型,均采用660B参数规模。此外,DeepSeek还通过模型蒸馏技术,开源了6个小模型,其中包括32B和70B参数的模型。这些小模型在多项能力上超越了OpenAI的o1-mini,进一步丰富了开源生态。
在API定价方面,DeepSeek也展现了其开放的姿态:缓存命中每百万输入tokens仅需1元,未命中则为4元;输出tokens每百万定价为16元,整体定价更具竞争力。
更为重要的是,DeepSeek R1采用了标准的MIT License,允许用户无限制商用。同时,DeepSeek还鼓励用户利用R1的输出结果训练其他模型,进一步推动AI技术的普及和发展。DeepSeek R1的开源,无疑将为全球开发者带来更强大的工具,也为AI技术的创新和应用注入新的活力,预示着AI技术平权化时代的加速到来。
论文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
API文档:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model
相关攻略 更多
最新资讯 更多
淘天推出创新对齐方法,解决视觉大模型中的幻觉问题
更新时间:2025-05-06
OpenAI几周内发布o3-mini,性能略逊于o1-pro
更新时间:2025-05-06
Runway推全新AI图像生成器Frames,打造电影级视觉表现
更新时间:2025-05-06
微软推出WindowsAI搜索功能测试,提升文件查找体验
更新时间:2025-05-06
OpenAI专家:社交媒体上的AI炒作远比你想象的复杂!
更新时间:2025-05-06
AI始祖重生:世界首个聊天机器人ELIZA在60年后重获新生
更新时间:2025-05-06
大型出版公司Dotdash与OpenAI达成合作,裁员百余人
更新时间:2025-05-06
阶跃星辰上线Step-2mini、Step-2文学大师版语言模型
更新时间:2025-05-06
MiniMax海螺语音全球同步上线包含T2A-01-Turbo等模型
更新时间:2025-05-06
MIT、DeepMind研究揭示视觉语言模型无法理解否定表达的原因
更新时间:2025-05-06