首页 > 扩展AI

sensecore商汤大装置

v1.0.0

类型：扩展AI更新时间：2025-06-10 10:02:54

安全访问

526

简介信息热门同类推荐

sensecore商汤大装置,高效率、低成本、规模化的新一代AI基础设施

放心AI网·扩展AI栏目来啦！小编带你挖掘那些小众但超好用的AI神器，错过就亏大啦~

sensecore商汤大装置官网,高效率、低成本、规模化的新一代AI基础设施

什么是sensecore

商汤大装置是高效率、低成本、规模化的新一代AI基础设施。截至2024年末，其总算力规模已实现了质的飞跃，达到23,000PetaFLOPS，构建了覆盖全国的强大智算网络。根据IDC发布的《中国智算服务市场（2024上半年）跟踪》报告，商汤与阿里巴巴、火山引擎共同位列2024年上半年中国通用人工智能（GenAI）基础设施即服务（IaaS）提供商前三甲，持续引领中国智算服务市场的潮流。

商汤大装置平台上3个月内可限时免费使用1000万tokens，同时支持deepseek128K最大上下文长度限制。

sensecore商汤大装置官网:https://www.sensecore.cn/

商汤大装置上架DeepSeek系列模型，限免体验、服务升级！

即日起，企业客户和开发者可在商汤大装置万象平台中，快速部署DeepSeek-V3、DeepSeek-R1等模型，可享受3个月内1000万tokens免费使用权益。

立即体验，开启AI开发新旅程

链接地址：https://console.sensecore.cn/aistudio

升级服务：全周期定制化方案，赋能智能开发全流程

商汤大装置依托领先的技术平台与专家资源，形成了”场景定义-训练-部署-迭代”的闭环服务体系，确保客户开发效率与应用效果的双重提升。

为满足不同行业的企业级需求，创新了模型定制服务——为企业量身打造轻量化模型定制，基于场景强化学习在特定场景提升基模型，支持蒸馏到小模型高效推理，在提升精度的同时下推理效率提升300%。

针对私有化需求，提供全流程端到端服务——针对场景的综合解决方案，涵盖模型定制、模型开发平台、Agent应用开发平台三大核心模块，可适配多种国产化硬件，提供全链路支持。配合商汤专家团队驻场服务，最快两周内可帮助企业完成部署与业务对接。

个性部署：异构算力智能调度，最大化用户效能

商汤大装置还提供个性化部署方案，支持公有云、私有化及一体机等部署方式。帮助企业用户在激烈的市场竞争中取得优势，实现跨越式发展。

在硬件层面，兼容英伟达与国产异构芯片。商汤大装置还通过软硬件深度协同优化，实现了多种芯片高效混合部署、流量智能分发，有效提升硬件效率，最大化用户效能。

在推理层面，支持多款主流推理引擎，缓存可针对性加速优化。商汤大装置还计划在未来推出PD（Prefill-Decode）分离式推理架构，将计算任务智能拆分，并分别调度至最适合的算力单元执行，进一步提升能效比。

商汤大装置致力于为企业和开发者提供高效率、低成本、规模化的新型人工智能基础设施，支持商汤“日日新”融合大模型SenseNova、DeepSeek、Qwen、Llama等大模型。

商汤目前已为央国企、运营商、金融、互联网、汽车、泛科技等多个行业提供服务，帮助客户实现业务场景的提智增效。未来，商汤还将继续提供强大的技术支持和全方位的服务保障，持续为行业输出高效、易用、普惠的AI云服务。

主要功能和特色

此外，商汤大装置万象，专为企业和开发者设计，提供了一站式大模型服务。该平台依托商汤大装置的强大算力底座和日日新大模型技术，集成了模型管理、推理、微调、数据管理以及智能体应用等全方位服务，极大地促进了AI技术的普及与应用。

在权威研究机构弗若斯特沙利文（Frost&Sullivan,简称“沙利文”）联合头豹研究院发布的《2024年中国GenAI技术栈市场报告》中，商汤科技在11家GenAI厂商中脱颖而出，不仅在增长指数和创新指数上双双夺冠，超越了阿里云、百度智能云和华为云等国内竞争对手，而且在全球范围内也仅次于亚马逊云科技，展现了其卓越的竞争力和创新能力。

展望未来，商汤科技将矢志不渝地致力于构建行业领先的AI云，实现大装置、基础模型与AI应用的深度融合与无缝集成。携手产业各界，共同翻开“AI云”赋能产业升级的新篇章，开启智慧未来的无限可能。

DeepSeek

商汤大装置ModelStudio支持DeepSeek系列模型，全面融合ModelStudio推理链路，集成内容安全算子，为广大新老用户提供高效且安全的Deepseek模型服务。当前DeepSeek-R1和DeepSeek-V3限时免费，蒸馏版本完全免费。

以下模型将于近期陆续上线至ModelStudio模型广场，敬请关注！可在ModelStudio服务管理，完成模型购买，并查看模型开通状态

如果希望调用满足低时延、高并发等需求的DeepSeepR1模型，请联系客服或销售咨询商用版（页面右下角客服）

模型服务（model_id）价格（每百万tokens）最大上下文长度API接口模型速率限制

DeepSeek-R1输入4元输出16元（限时免费至5月9日）32K对话生成（深度推理）1QPS6RPM128000TPM

DeepSeek-V3输入2元输出8元（限时免费至5月9日）32K对话生成（深度推理）1QPS6RPM128000TPM

DeepSeek-R1-Distill-Qwen-14B免费32K对话生成（深度推理）1QPS6RPM128000TPM

DeepSeek-R1-Distill-Qwen-32B免费8K对话生成（深度推理）1QPS6RPM128000TPM

DeepSeek-R1商用版（独立通道）输入4元输出16元32K对话生成（深度推理）5QPS60RPM128000TPM

DeepSeek-R1

DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAIo1正式版。

模型介绍

DeepSeek-R1的前身DeepSeek-R1-Zero是一种通过大规模强化学习(RL)训练的模型，无需监督微调(SFT)作为初步步骤，在推理方面表现出色。在RL的帮助下，DeepSeek-R1-Zero自然而然地出现了许多强大而有趣的推理行为。然而，DeepSeek-R1-Zero面临着诸如无休止重复、可读性差和语言混合等挑战。为了解决这些问题并进一步提高推理性能，引入了DeepSeek-R1，它在RL之前整合了冷启动数据。DeepSeek-R1在数学、代码和推理任务中实现了与OpenAI-o1相当的性能。为了支持研究社区，开源了DeepSeek-R1-Zero、DeepSeek-R1以及基于Llama和Qwen从DeepSeek-R1中提炼出的六个密集模型。DeepSeek-R1-Distill-Qwen-32B在各种基准测试中均优于OpenAI-o1-mini，为密集模型取得了新的最先进成果。

更多信息请查看模型开源详情页

模型提供方

DeepSeek杭州深度求索人工智能基础技术研究有限公司

模型使用声明

DeepSeekAI团队的官方声明可直接参考模型开源详情页

DeepSeek-R1-Distill-Qwen-14B模型由DeepSeek-AI团队研发，使用需遵循MIT许可协议与Apache2.0许可协议。

第三方模型回答不代表商汤万象模型开发平台ModelStudio立场，且平台不对使用效果做任何明示/默示担保，用户使用第三方模型应自行做好内容安全与合规保障

特殊参数说明

此模型暂不支持对话生成（无会话历史）接口中的请求体参数：[n][know_ids][knowledge_config][plugins][web_search][associated_knowledge]

DeepSeek-V3

DeepSeek-V3在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中，DeepSeek-V3在开源模型中位列榜首，与世界上最先进的闭源模型不分伯仲。

模型介绍

DeepSeek-V3，这是一个强大的混合专家(MoE)语言模型，总共有671B个参数，每个token激活37B。为了实现高效的推理和经济高效的训练，DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构，这些架构在DeepSeek-V2中得到了彻底的验证。此外，DeepSeek-V3开创了一种无辅助损失的负载平衡策略，并设置了多token预测训练目标以获得更强大的性能。在14.8万亿个多样化和高质量的token上对DeepSeek-V3进行了预训练，然后进行监督微调和强化学习阶段，以充分利用其功能。综合评估表明，DeepSeek-V3优于其他开源模型，并实现了与领先的闭源模型相当的性能。尽管性能出色，但DeepSeek-V3仅需要278.8万H800GPU/小时即可完成完整训练。

更多信息请查看模型开源详情页

模型提供方

DeepSeek杭州深度求索人工智能基础技术研究有限公司

模型使用声明

DeepSeek-V3模型由DeepSeek-AI团队研发，使用需遵循MIT许可协议与Apache2.0许可协议。

特殊参数说明

此模型暂不支持对话生成（无会话历史）接口中的请求体参数：[n][know_ids][knowledge_config][plugins][web_search][associated_knowledge]

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Qwen-14B是基于Qwen2.5-14B通过知识蒸馏得到的模型。该模型使用DeepSeek-R1生成的80万个精选样本进行微调，在数学、编程和推理等多个领域展现出卓越的性能。在AIME2024、MATH-500、GPQADiamond等多个基准测试中都取得了优异成绩，其中在MATH-500上达到了93.9%的准确率，展现出强大的数学推理能力

模型介绍

通过DeepSeek-R1671B模型的推理蒸馏技术打造。在数学推理、代码生成等复杂任务中表现卓越，尤其擅长多步推导和跨领域问题解决。关键特性：

核心能力：数学与编程能力显著超越同等规模模型

模型优化：知识蒸馏技术继承大模型思维链，推理效率较传统训练提升200%+

小模型蒸馏典范：基于R1推理数据蒸馏的14B模型，多项指标超越或持平OpenAIo1-mini

更多信息请查看模型开源详情页

模型提供方

DeepSeek杭州深度求索人工智能基础技术研究有限公司

模型使用声明

DeepSeek-R1-Distill-Qwen-14B模型由DeepSeek-AI团队研发，使用需遵循MIT许可协议与Apache2.0许可协议。

特殊参数说明

此模型暂不支持对话生成（无会话历史）接口中的请求体参数：[n][know_ids][knowledge_config][plugins][web_search][associated_knowledge]

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-32B是基于Qwen2.5-32B通过知识蒸馏得到的模型。该模型使用DeepSeek-R1生成的80万个精选样本进行微调，在数学、编程和推理等多个领域展现出卓越的性能。在AIME2024、MATH-500、GPQADiamond等多个基准测试中都取得了优异成绩，其中在MATH-500上达到了94.3%的准确率，展现出强大的数学推理能力

模型介绍

通过DeepSeek-R1671B模型的推理蒸馏技术打造。在数学推理、代码生成等复杂任务中表现卓越，尤其擅长多步推导和跨领域问题解决。关键特性：

核心能力：数学与编程能力显著超越同等规模模型

模型优化：知识蒸馏技术继承大模型思维链，推理效率较传统训练提升200%+

小模型蒸馏典范：基于R1推理数据蒸馏的32B模型，多项指标超越OpenAIo1-mini

更多信息请查看模型开源详情页

模型提供方

DeepSeek杭州深度求索人工智能基础技术研究有限公司

模型使用声明

DeepSeek-R1-Distill-Qwen-32B模型由DeepSeek-AI团队研发，使用需遵循MIT许可协议与Apache2.0许可协议。

特殊参数说明

请求体参数中的max_new_tokens默认为1024，最大可配置为10000