文章来源:放心AI网发布时间:2025-05-13 12:39:45
在一篇聚焦医疗AI评测的研究论文中,微软似乎再次"不经意"地披露了业界多个顶级大语言模型的参数规模。这份发布于12月26日的论文不仅揭示了包括OpenAI、Anthropic在内的多家公司的模型参数数据,还引发了业内对模型架构和技术实力的热议。
根据论文披露,OpenAI的o1-preview模型约有300B参数,GPT-4o约200B,而GPT-4o-mini仅有8B参数。这与英伟达今年初公布的GPT-4采用1.76T MoE架构的说法形成鲜明对比。同时,论文还透露了Claude3.5Sonnet的参数规模约为175B。
这已经不是微软第一次在论文中"泄露"模型参数信息。去年10月,微软曾在一篇论文中披露GPT-3.5-Turbo的20B参数规模,随后又在更新版本中删除了这一信息。这种反复出现的"泄露"让业内人士对其是否存在某种特定意图产生猜测。
值得注意的是,这篇论文的主要目的是介绍一个名为MEDEC的医疗领域基准测试。研究团队分析了来自三家美国医院的488份临床笔记,评估了各大模型在识别和纠正医疗文档错误方面的能力。测试结果显示,Claude3.5Sonnet在错误检测方面以70.16的得分领先其他模型。
业内对这些数据的真实性展开了热烈讨论。有观点认为,如果Claude3.5Sonnet确实以更小的参数量达到优秀性能,这将凸显Anthropic的技术实力。也有分析人士通过模型定价反推,认为部分参数估计具有合理性。
特别引人注意的是,论文仅对主流模型参数进行估计,却独独没有提及谷歌Gemini的具体参数。有分析认为,这可能与Gemini使用TPU而非英伟达GPU有关,导致难以通过token生成速度进行准确估算。
随着OpenAI逐渐淡化开源承诺,模型参数等核心信息可能会继续成为业界持续关注的焦点。这场意外泄露再次引发了人们对AI模型架构、技术路线以及商业竞争的深入思考。
参考资料:
https://arxiv.org/pdf/2412.19260
https://x.com/Yuchenj_UW/status/1874507299303379428
https://www.reddit.com/r/LocalLLaMA/comments/1f1vpyt/why_gpt_4o_mini_is_probably_around_8b_active/
相关攻略 更多
最新资讯 更多
微软论文再曝OpenAI模型参数?医疗AI评测意外暴露4o-mini只有8B
更新时间:2025-05-13
菜鸟发布L4级无人车GTPro:起售价14.98w续航180公里快充1.5小时
更新时间:2025-05-13
151个上榜!工信部公布人工智能赋能新型工业化典型应用案例名单
更新时间:2025-05-13
字节跳动否认开发AI手机传闻:未有相关计划
更新时间:2025-05-13
“AI教父”杰弗里·辛顿批评OpenAI转型为营利公司
更新时间:2025-05-13
AI问答机“小窗”成为2025年首个AI融资案例
更新时间:2025-05-13
阿里云携手零一万物成立产业大模型联合实验室,深化AI技术产业落地
更新时间:2025-05-13
2024大模型年度复盘:GPT-4垄断被打破,大模型服务价格飞速下降
更新时间:2025-05-13
谷歌DeepMind推新框架InfAlign:提升语言模型推理对齐能力
更新时间:2025-05-13
OpenAI联手吴恩达推出o1系列模型免费课程,聚焦深度推理能力开发
更新时间:2025-05-13