3D 生成,一直在等待它的「ChatGPT時刻」。
首先,3D 內容在藝術質量、生成速度、3D 網格結構和拓撲質量、UV 貼圖結構以及紋理清晰度和解析度方面具有嚴格的標準; 其次,與其他研究相比,可用的資料量少。雖然該領域有數十億張影像和影片可供學習,但可用於訓練的 3D 內容數量要少三到四個數量級。因此,現階段的3D 生成還必須從非 3D 的影像和影片中學習,而且需要從部分 2D 觀察中推斷出 3D 資訊; 傳統方法生成的3D 資源通常難以實現逼真的照明和材質屬性,從而限制了它們在專業工作流程中的實用性; 3D生成是一個非常耗費算力的過程,主要因為它涉及到複雜的計算和大量的資料處理,如實時渲染、細節處理。並且由於算力不夠,可能會導致生成速度非常慢。
論文地址:https://ai.meta.com/research/publications/meta-3d-gen/?continueFlag=24428397aaeb0cc6751570d48a532d36
綜合排序為:Meta 3D Gen > Third-party T23D generator > Tripo3D > Meshy v3 > CSM Cube 2.0 > Rodin Gen-1 。其中前三名差距很小(3個點的差距,404個prompt中的12個)。CSM和Rodin相較其他方法有明顯差異,Rodin和3DGen相比,兩者相差 21.8個點。 分項評測方面,最簡單的objects中表現最好的是Meshy v3。角色類和複雜組合概念的表現代表了技術水準,也是3D產業應用中最重要的部分,Meta在複雜組合上排名第一,Tripo3D則是難度越高表現越強,僅次於Meta,和第一名差距很小。
Meshy v3紋理分最高、Rodin紋理分最低; Rodin幾何分比較高; 在綜合性一致性、整體質量方面,Rodin表現不佳; All users和專業使用者打分標準可以看出略有不同,但排名趨勢是一樣的:對幾何和紋理的正確性給予了更多的權重;