文章来源:放心AI网发布时间:2025-04-28 17:33:07
国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。
这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。
英伟达发言人补充道,推理过程需要大量英伟达GPU和高性能网络支持。英伟达目前掌握三种扩展规律:持续进行的预训练与后训练,以及新的测试时间缩放技术。这一表态也意味着DeepSeek使用的GPU完全符合美国的出口管制要求。
测试时间缩放技术是近年来备受讨论的一个话题,它指出如果一个已完成完整训练的AI模型在预测、生成文本或图像时投入更多计算资源帮助其推理,模型将输出更优质的答案。这一技术已被应用于OpenAI的o1等模型中。
1月27日,美股三大指数收盘涨跌不一,英伟达股价暴跌16.86%,收于每股118.58美元,跌至过去10个月以来的最低点。英伟达总市值2.90万亿美元,一日蒸发5900亿美元,创史上最大单日个股市值蒸发纪录。英伟达的暴跌也使得创始人黄仁勋的身家大幅缩水210亿美元。
在英伟达的带领下,美股半导体芯片板块集体受挫。DeepSeek系量化巨头幻方量化旗下大模型公司,1月20日正式发布推理大模型DeepSeek-R1。R1凭借其出色的性能、开源的性质、大幅下降的售价和训练成本获得了广泛关注。R1的预训练费用只有557.6万美元,在2048块英伟达H800GPU集群上运行55天完成。
上一篇: 阿里云通义开源Qwen2.5-VL,视觉AI超越Claude3.5
阿里云通义千问开源了全新的视觉模型Qwen2 5-VL,并推出了3B、7B和72B三个尺寸版本。其中,旗舰版Qwen2 5-VL-72B在13项权威评测中夺得视觉理解冠军,超越了GPT-4o与Claude3 5。阿里云官方介绍称,新的Qwen2 5-VL
下一篇: ChatGPT回应DeepSeek超越:排名变化或为暂时现象
DeepSeek应用超越ChatGPT,登顶苹果美国区免费App下载排行榜,引发市场热议。这家被称为“大模型版拼多多”的中国公司,其应用的快速上升让海内外技术同行和投资机构都密切关注。对于这一排名变化,ChatGPT回应称,
相关攻略 更多
最新资讯 更多
好未来MathGPT“出圈”2025财年第三季度净营收达超6亿美元
更新时间:2025-04-29
AI语音独角兽ElevenLabs完成2.5亿美元C轮融资,估值突破30亿
更新时间:2025-04-29
百川智能推出国内首个全场景深度思考医疗大模型,革新医学推理方式
更新时间:2025-04-29
奥特曼加码长寿科技:RetroBiosciences欲筹10亿美元,挑战人类寿命极限
更新时间:2025-04-29
OpenAI新成立的PBC部门估值达300亿美元,微软投资股份尚未确定
更新时间:2025-04-29
扎克伯格表示,2025年底Meta将拥有130万个用于AI的GPU
更新时间:2025-04-29
德勤:企业在推行生成式AI项目上面临规模化挑战
更新时间:2025-04-29
AI基础设施争夺战愈演愈烈:OpenAI与微软的微妙关系
更新时间:2025-04-29
聊天机器人平台CharacterAI以第一修正案为由申请驳回与青少年自杀案的诉讼
更新时间:2025-04-29
Deezer日均上传超万首AI音乐,平台开始检测与标记
更新时间:2025-04-29