文章来源:放心AI网发布时间:2025-06-08 09:07:53
AI 竟然开始“长脑子”了?!麻省理工学院的最新研究表明,大型语言模型(LLM)的内部结构,竟然和人脑有着惊人的相似之处!
这项研究利用稀疏自编码器技术,对LLM的激活空间进行了深入分析,发现了三个层级的结构特征,令人惊叹:
首先,在微观层面上,研究人员发现了类似“晶体”结构的存在。这些“晶体”的面是由平行四边形或梯形构成,类似于我们熟知的词汇类比,例如“男人:女人::国王:女王”。
更令人惊讶的是,通过线性判别分析技术去除一些无关的干扰因素(如词语长度)后,这些“晶体”结构会变得更加清晰。
其次,在中观层面上,研究人员发现LLM的激活空间存在着类似人脑功能分区的模块化结构。
例如,与数学和代码相关的特征会聚集在一起,形成一个类似于人脑功能叶的“脑叶”。通过多种指标进行量化分析,研究人员证实了这些“脑叶”的空间局部性,表明共同出现的特征在空间上也更加聚集,远远超出了随机分布的预期。
在宏观层面上,研究人员发现LLM特征点云的整体结构并非各向同性,而是呈现出一种幂律特征值分布,并且这种分布在中间层最为明显。
研究人员还量化分析了不同层级的聚类熵,发现中间层的聚类熵较低,表明特征表示更加集中,而早期和晚期层的聚类熵较高,表明特征表示更加分散。
这项研究为我们理解大型语言模型的内部机制提供了全新的视角,也为未来开发更强大、更智能的AI系统奠定了基础。
相关攻略 更多
最新资讯 更多
AI终于要长脑子了?MIT大牛发现大模型惊现“人脑分区”!
更新时间:2025-06-08
Meta正在自研搜索引擎,欲摆脱Google微软依赖
更新时间:2025-06-08
康宁公司第三季度业绩强劲增长,得益于生成式人工智能产品
更新时间:2025-06-08
专为苹果AI而生!苹果宣布推出M4Max芯片
更新时间:2025-06-08
神秘大模型“小熊猫”身份揭晓:英国AI公司最新图像生成模型RecraftV3
更新时间:2025-06-08
阿里通义回应三季度投放450万广告费:根本没那么多
更新时间:2025-06-08
孩子们该如何拥抱人工智能?AI未来说-青少年人工智能普及教育校长论坛举行
更新时间:2025-06-08
健康体检巨头如何AllinAI?对话美年健康总裁徐涛
更新时间:2025-06-07
为AI提速,墨云藏境系列DDR5实测体验
更新时间:2025-06-07
面壁智能与百度智能云达成合作共同开发大模型端云协同解决方案
更新时间:2025-06-07