群核科技近日发布的空间理解开源模型SpatialLM登上全球最大AI开源社区HuggingFace趋势榜第二位的消息。介绍了该模型的特点、研发情况、开源后的反响,以及其对具身智能领域的重要意义。
3月28日,记者从群核科技方面了解到一则令人瞩目的消息。该公司于近日发布的空间理解开源模型SpatialLM,成功登上了全球最大AI开源社区HuggingFace趋势榜的第二位。这一成绩无疑彰显了该模型在AI领域的突出表现和巨大影响力。
当前,该榜单的前三甲分别为Deepseek、群核科技的SpatialLM以及通义千问Qwen2.5 – Omni 。值得一提的是,这三家都与杭州有着紧密的联系,仿佛在AI领域形成了一股来自杭州的强大力量。
从公开资料中我们可以得知,SpatialLM是群核科技凭借自身强大的研发实力自主打造的一款空间理解模型。它具有独特的优势,仅通过一段视频,就能够生成物理正确的3D场景布局。与传统的大语言模型不同,SpatialLM成功突破了对物理世界几何与空间关系理解的局限。这一突破意义非凡,它将在提升机器类人的空间认知和解析能力方面发挥至关重要的作用。
目前,SpatialLM已经在HuggingFace、GitHub、魔搭社区等多个知名平台面向全球开发者进行开源。在开源后的短短一周时间里,SpatialLM就在海外社交平台LinkedIn、Twitter上受到了行业人士的热烈追捧,足见其受欢迎程度。
据悉,SpatialLM是经过数百万张照片级真实RGBD渲染图片,以及约10万高质量物理正确的3D室内空间训练而成的。这种大规模、高质量的数据训练,加速了机器人对空间理解的进程,让机器人在空间认知方面有了更显著的提升。
群核科技表示,SpatialLM模型开源后,将为具身智能领域的企业或机构科研团队提供一个空间认知理解的基础训练框架。对于那些不具备模型开发能力的具身智能企业来说,这无疑是一个福音。它们可以基于SpatialLM模型进行微调,从而降低具身智能训练的门槛,推动具身智能技术的更广泛应用。
群核科技还介绍到,“同时,SpatialLM模型与去年群核科技发布的空间智能解决方案SpatialVerse之间,形成了从空间认知理解到空间行动交互的具身智能训练闭环。”这些基于SpatialLM模型生成的一个个结构化场景又能够泛化生成亿万级新场景。这就相当于形成了一条 “现实 — 虚拟 — 现实”的闭环路径,让现实世界成为“数字道场”的原料来源。这样不仅让SpatialVerse的数据更加多样化,同时还能有效缩小仿真与现实之间的“差距”,使得虚拟世界与现实世界的结合更加紧密。
此前,群核科技创始人黄晓煌曾介绍,具身智能机器人即将迎来爆发性发展。群核科技希望通过空间模型和数据开源,为这一领域的发展贡献自己的一份力量。
本文围绕群核科技的空间理解开源模型SpatialLM登上HuggingFace趋势榜第二位展开,介绍了模型特点、研发训练情况、开源反响及对具身智能领域的意义。SpatialLM不仅突破传统局限,还通过开源降低具身智能训练门槛,与SpatialVerse形成闭环,体现了群核科技为具身智能发展助力的决心。