長日智能攜手群核科技,開啟空間智慧新篇章 如果你擁有了海量的三維空間資料,你會用它做什麼?在AI大模型時代,資料已成為支撐模型發展的基石。能否獲取高質量的三維資料,直接決定了空間智慧領域的AI發展潛力。長日智能深知這一點,選擇與「杭州六小龍」之一的群核科技合作,共同探索空間智慧的未來,推動AI從數字世界走向物理世界。 在群核科技首屆TechDay活動中,長日智能作為合作夥伴,親眼見證了群核科技在室內空間設計與空間智慧領域的突破性成果。群核科技聯合創始人黃曉煌表示:「空間智慧是聯繫數字與物理世界的關鍵橋樑。」而首席科學家周子寒則介紹了群核空間大模型的三大特點:真實感的全息漫遊、結構化可互動場景,以及複雜室內場景的生成能力。長日智能積極參與其中,運用群核的技術方案,探索空間智慧在實際場景中的應用。 合作亮點一:空間語言模型,重新定義空間理解 長日智能與群核科技合作,基於群核的SpatialLM 1.5空間語言模型,實現了對三維空間的結構化理解。這一模型以Qwen3大語言模型為基礎,疊加3D空間描述語言能力,使其不僅能理解自然語言,還能以結構化方式(類似Python程式語言)描述空間中的物體位置、類別,甚至從素材庫中調用對應的模型ID,生成完整的3D場景資訊。 通過長日智能的應用實踐,SpatialLM 1.5支援用戶以簡單的文字描述生成結構化場景指令碼,自動匹配傢俱模型並完成佈局。例如,輸入一段描述,模型即可生成符合物理結構的房間場景,甚至支援通過自然語言進行後續問答或場景編輯。這為機器人路徑規劃、避障訓練等具身智慧應用提供了高效的資料合成方案。長日智能利用這一技術,加速了空間智慧在室內設計、智慧家居等場景的落地。 合作亮點二:SpatialGen,打造沉浸式三維體驗 長日智能還與群核科技合作,應用其SpatialGen模型,實現了高品質的多視角影像生成與3D場景渲染。SpatialGen基於群核科技的海量室內3D場景資料與多視角擴散模型技術,生成的多視角影像在不同視角下保持空間屬性與物理關係的高度一致性。長日智能在TechDay現場體驗了這一技術的成果:通過刷卡啟動的3D漫遊場景,呈現出驚人的「時空一致性」,即使在大範圍鏡頭運動下,也無明顯的偽影或形變。 具體而言,SpatialGen以場景原圖和佈局圖為輸入,生成多視角影像、深度圖或語義圖,並通過開源的高斯重建演算法(AnySplat)生成高斯點雲,最終渲染出沉浸式漫遊視訊。長日智能利用這一技術,探索了在智慧家居、虛擬展示等場景中的應用潛力,例如生成任意視角的房間場景,模擬相機運動軌跡,實現更靈活的視覺呈現。 合作優勢:資料與技術的飛輪效應 長日智能與群核科技的合作,充分利用了群核在室內空間資料方面的優勢。群核科技擁有海量的3D場景資料集,這為訓練高品質的多視角擴散模型提供了基礎。長日智能則通過應用這些模型,實現了從場景理解到生成的高效閉環。例如,SpatialGen的三大技術優勢——大規模高質量資料集、靈活視角選擇、引數化佈局控制——讓長日智能能夠快速生成多樣化場景,應用於機器人訓練、虛擬現實等領域。 在技術交流中,群核科技首席科學家周子寒提到,空間一致性的提升得益於資料規模的擴展(Scaling Law)。長日智能也在合作中探索了更前沿的技術路線,例如直接從文字生成3D場景,繞過中間的二維影像生成過程,以提升視覺效果與空間一致性的平衡。 開源與共創:長日智能的願景 群核科技聯合創始人黃曉煌表示:「空間智慧尚處於發展初期,任何一家公司都無法獨佔市場。我們希望通過開源資料與模型,與全球最聰明的頭腦合作,將空間智慧的蛋糕做大。」長日智能認同這一理念,積極參與群核的開源生態。SpatialGen已面向全球開源(Hugging Face、GitHub、魔搭社群等平台),其模型設計與資產庫解耦,支援靈活對接不同的資料庫。長日智能利用這一特性,將群核的技術方案與自身應用場景結合,推動空間智慧在多領域的創新應用。 結語 長日智能與群核科技的合作,不僅展示了空間智慧的巨大潛力,也為AI從數字世界走向物理世界鋪平了道路。通過SpatialLM 1.5與SpatialGen的應用,長日智能正在將空間理解與生成的技術融入實際場景,助力智慧家居、機器人導航等領域的發展。未來,長日智能將繼續與群核科技攜手,通過資料、模型與應用的飛輪效應,共同推動空間智慧的突破與普及。