(譯)如何優化cocos2d程式的記憶體使用和程式大小:第一部分

weixin_34377065發表於2012-12-09

譯者:

在我完成第一個遊戲專案的時候,我深切地意識到“使用cocos2d來製作遊戲的開發者們,他們大多會被cocos2d的記憶體問題所困擾”。而我剛開始接觸cocos2d的時候,社群裡面的人們討論了一個非常有意義的話題:“請簡單地講述你認為新手cocos2d程式設計師在他開始編碼之前,最應該先知道,或者應該關注和注意的事項。”這個問題的答案很多,有人講是“如何載入和儲存遊戲資料”,有人講的是“如何實現有限狀態機”等等。而最吸引我的則是,有一個人講到,新手cocos2d程式設計師或者新手cocoa程式,他們所遇到的80%的問題都與記憶體相關。

 

因為有著c/c++背景的我,看到這句話的時候,很是贊同,因此剛開始cocos2d程式設計的時候格外注意記憶體方面的問題。即便如此,在我完成自己第一個遊戲的過程中,還是遇到了大量的記憶體問題,它們讓我頭疼,讓我睡不著覺。慶幸的是,我通過社群都找到了答案並且解決了我的問題。

 

我在《我的第一個遊戲FoodieTheBug完成之後的幾點心得體會》這篇博文中也講述過一些記憶體方面的使用心得。但是,不夠具體,我當時想講的內容有很多。因為有些難以用文字具象化,我也就偷了一回懶了。這次,當我看到Steffen Itterheim寫了兩篇這麼經典的優化cocos2d記憶體使用和程式大小的文章之後,我有一種“於我心有慼慼焉”的感覺。我迫不及待地想跟大家分享,可惜很多人抱怨說訪問不了,被牆了等等。可能也有一些同行,對E文不是很感冒。趁著週末,我花一個下午的時間,給大家翻譯一下,與大家共勉。

 

全文如下:

我目前正完成我的最後一個合約專案。在這個專案的最後階段,我需要考慮的一件事情就是如何優化遊戲的記憶體使用。

 

在今天的iDevBlogADay文章中,我將向大家講述,我是如何減少25-30MB遊戲記憶體消耗的(現在遊戲消耗記憶體90-95MB,我還通過這個過程,消除了一些由於記憶體警告而引起的程式崩潰問題)。同時,我還將遊戲程式的大小從25MB減少到了20MB以下(如果蘋果沒有在不久前將蜂窩網下載應用的限制從20MB提高到50MB的話,那麼我這個小的優化就太棒了,它可以潛在地給我帶來更多的下載量)。

我還會給大家介紹,如何在你載入遊戲資源的時候展示一個帶有動畫的Loading介面,我還會加入一些最佳實踐和小技巧。

 

什麼消耗了90%的記憶體?

大家猜一下:)

在大部分情況下,是紋理(textures)消耗了遊戲程式大量的記憶體。因此,紋理是我們首要考慮優化的物件,特別是當你碰到記憶體警告的問題的時候。

 

避免一個接一個地載入PNG和JPG紋理(他們之間至少等待一幀)

cocos2d裡面紋理載入分為兩個階段:1.從圖片檔案中建立一個UIImage物件。2.以這個建立好的UIImage物件來建立CCTexture2D物件。這意味著,當一個紋理被載入的時候,在短時候內,它會消耗兩倍於它本身記憶體佔用的記憶體大小。(譯註:為什麼只是短時間內呢?因為autoRelease pool和引用計數的關係,臨時建立的UIImage物件會被回收。)

當你在一個方法體內,接二連三地載入4個紋理的時候,這個記憶體問題會變得更加糟糕。因為在這個方法還沒結束之前,每一個紋理都會消耗兩倍於它本身的記憶體。

我不是很確定,現在的cocos2d是否仍然如此。或者這種情況是否只適用於手工引用計數管理,或許ARC不會如此呢?我習慣於按順序載入紋理,但是在載入下一個紋理之前要等待一幀。這將會使得任何紋理載入的消耗對記憶體的壓力降低。因為等待一幀,引用計數會把臨時的UIImage物件釋放掉,減少記憶體壓力。此外,在後續的文章中,如果你想在背景執行緒中按序載入紋理的話,也可以採用這種方法。

 

不要使用JPG圖片!

cocos2d-iphone使用JPG紋理的時候有一個問題。因為JPG紋理在載入的時候,會實時地轉化為PNG格式的紋理。這意味著cocos2d-iphone載入紋理是非常慢的(這裡有演示),而且JPG紋理將消耗三倍於本身記憶體佔用大小的記憶體。

一個2048*2048大小的紋理會消耗16M的記憶體。當你載入它的時候,在短時間內,它將消耗32MB記憶體。現在,如果這個圖片是JPG格式,你會看到這個數字會達到48MB,因為額外的UIImage物件的建立。雖然,最終記憶體都會降到16M,但是,那一個時刻的記憶體飆高,足以讓os殺死你的遊戲程式,造成crash,影響使用者體驗。

JPG不論在載入速度和記憶體消耗方面都很差。所以,千萬不要使用JPG!

 

忽視檔案圖片大小

這種情況,我見到很多。它乍聽起來可能覺得有點荒誕,但事實如此,因為它需要關於檔案格式的知識,而這些知識並不是每一個程式設計師都瞭解的。我經常聽到的論斷就是“嘿!我的程式不可能有記憶體警告,我所有的圖片資源加起來還不到30MB!”。

怎麼說呢,因為圖片檔案大小和紋理記憶體佔用是兩碼事。假設他們是帳篷。圖片檔案就相當於帳篷被裝在行李箱。但是,如果你想要使用帳篷的話,它必須被撐起來,被“膨脹”。

圖片檔案和紋理的關係與此類似。圖片檔案大多是壓縮過的,它們被使用的話必須先解壓縮,然後才能會GPU所處理,變成我們熟知的紋理。一個2048*2048的png圖片,採用32位顏色深度編碼,那麼它在磁碟上佔用空間只有2MB。但是,如果變成紋理,它將消耗16MB的記憶體!

當然,減少紋理佔用記憶體大小是有辦法滴。

 

使用16-bit紋理

最快速地減少紋理記憶體佔用的辦法就是把它們作為16位顏色深度的紋理來載入。cocos2d預設的紋理畫素格式是32位顏色深度。如果把顏色深度減半,那麼記憶體消耗也就可以減少一半。並且這還會帶來渲染效率的提升,大約提高10%。

你可以使用CCTexture2D物件的類方法setDefaultAlphaPixelFormat來更改預設的紋理畫素格式,程式碼如下:

[CCTexture2D setDefaultAlphaPixelFormat:kCCTexture2DPixelFormat_RGB5A1];
[[CCTextureCache sharedTextureCache] addImage:@"ui.png"];

 

這裡有個問題:首先,紋理畫素格式的改變會影響後面載入的所有紋理。因此,如果你想後面載入紋理使用不同的畫素格式的話,必須再呼叫此方法,並且重新設定一遍畫素格式。

其次,如果你的CCTexture2D設定的畫素格式與圖片本身的畫素格式不匹配的話,就會導致顯示嚴重失真。比如顏色不對,或者透明度不對等等。

 

有哪些比較有用的紋理畫素格式呢?

generate 32-bit textures: kCCTexture2DPixelFormat_RGBA8888 (default)
generate 16-bit textures: kCCTexture2DPixelFormat_RGBA4444
generate 16-bit textures: kCCTexture2DPixelFormat_RGB5A1
generate 16-bit textures: kCCTexture2DPixelFormat_RGB565 (no alpha)

 

RGBA8888是預設的格式。對於16位的紋理來說,使用RGB565可以獲得最佳顏色質量,因為16位全部用來顯示顏色:總共有65536總顏色值。但是,這裡有個缺點,除非圖片是矩形的,並且沒有透明畫素。所以RBG565格式比較適合背景圖片和一些矩形的使用者控制元件。

RBG5A1格式使用一位顏色來表示alpha通道,因此圖片可以擁有透明區域。只是,1位似乎有點不夠用,它只能表示32768種可用顏色值。而且圖片要麼只能全部是透明畫素,或者全部是不透明的畫素。因為一位的alpha通道的緣故,所以沒有中間值。但是你可以使用fade in/out動作來改變紋理的opacity屬性。

如果你的圖片包含有半透明的區域,那麼RBGA4444格式很有用。它允許每一個畫素值有127個alpha值,因此透明效率與RGBA8888格式的紋理差別不是很大。但是,由於顏色總量減少至4096,所以,RBGA4444是16點陣圖片格式裡面顏色質量最差的。

現在,你可以得到16位紋理的不足之處了:它由於顏色總量的減少,有一些圖片顯示起來可能會失真,而且可能會產生“梯度”。

 

使16位紋理看起來更棒

幸運的是,我們有TexturePacker.(後面簡稱TP)

TP有一個特性叫做“抖動”,它可以使得原本由於顏色數量減少而產生的失真問題得到改善。(TP裡面有很多抖動演算法,關於這些演算法,讀者可以參考我翻譯的另一篇文章)。

特別是在擁有Retina顯示的畫素密度下,你幾乎看不出16位與32位的紋理之間的顯示差別。當然,前提是你需要採用“抖動”演算法。

cocos2d預設的顏色深度將會把所有的紋理都渲染到16位的color framebuffer裡面,然後再顯示到你的裝置螢幕上面。既然這樣,我們為什麼不把所有的紋理的格式都弄成16位呢,32位又有什麼用呢?反正它本來就會渲染到16位的framebuffer上去的。這個問題有點太底層了,我不想深挖下去,而且我也不適合解釋這個問題。(譯者:哈哈,知之為知之,不知為不知)

 

使用NPOT紋理

NOPT是“non power of two”的縮寫,譯作“不是2的冪”。NPOT stands for “non power of two”. 在cocos2d1.x的時候,你必須在ccConfig.h檔案中開啟對NPOT的支援,但是,cocos2d 2.x就不需要了,它預設是支援NPOT的。所有3代(iphone 3GS)以後的ios設定都支援cocos2d 2.x(因為它們支援OpenGL ES2.0),所以也都能支援NPOT紋理。

如果紋理圖集(texture atlas)使用NPOT的紋理,它將有一個具大的優勢:它允許TP更好地壓縮紋理。因此,我們會更少地浪費紋理圖集的空白區域。而且,這樣的紋理在載入的時候,會少使用1%到49%左右的記憶體。而且你可以使用TP強制生成NPOT的紋理。(你只需要勾選“allow free size”即可)

為什麼要關心NPOT呢?因為蘋果的OpenGL驅動有一個bug,導致如果使用POT的紋理,則會產生額外33%的記憶體消耗

 

預設使用PVR格式的紋理

TP讓你可以建立PVR格式的紋理。除了PVR紋理支援NPOT外,它們不僅可以不是2的冪,而且還可以不是方形的。

PVR是最靈活的紋理檔案格式。除了支援標準的未壓縮的RGB圖片格式外,支援有失真壓縮的pvrtc格式。另外,未壓縮的pvr格式的紋理的記憶體消耗非常地低。不像png圖片那樣要消耗2倍於本身記憶體佔用大小的記憶體,pvr格式只需要消耗紋理本身記憶體大小再加上一點點處理該圖片格式的記憶體大小。

pvr格式的一個缺點就是,你不能在Mac上面開啟檢視。但是,如果你安裝了TP的話,就可以使用TP自帶的pvr圖片瀏覽器來瀏覽pvr格式的圖片了。(強烈建議大家購買TP,支援TP,不要再盜版了)

使用PVR格式的檔案幾乎沒有缺點。此外,它還可以極大地提高載入速度,後面我會解釋到。

 

使用pvr.ccz檔案格式

在三種可選用的pvr檔案格式中,優先選擇pvr.ccz格式。它是專門為cocos2d和TP設計的。在TP裡面,這是它生成的最小的pvr檔案。而且pvr.ccz格式比其它任何檔案格式的載入速度都要快

當在cocos2d裡面使用pvr格式的紋理時,只使用pvr.ccz格式,不要使用其它格式!因為它載入速度超快,而且載入的時候使用更少的記憶體!

 

當視覺察覺不出來的時候,可以考慮使用PVRTC壓縮

PVR紋理支援PVRTC紋理壓縮格式。它主要是採用的有失真壓縮。如果拿PVRTC圖片與JPG圖片作對比的話,它只有JPG圖片中等質量,但是,最大的好處是可以不用在記憶體裡面解壓縮紋理。

這裡把32位的png圖片(左邊)與最佳質量的PVRTC4(4位)圖片(點選圖片檢視完整的大小)作對比:

注意,在一些高對比度的地方,明顯有一些瑕疵。有顏色梯度的地方看起來還好一點。

PVRTC肯定不是大部分遊戲想要採用的紋理格式。但是,它們對於粒子效果來說,非常適用。因為那些小的粒子在不停地移動、旋轉、縮放,所以你很難看出一些視覺瑕疵。

 

PVRTC壓縮圖片格式

TP提供的PVR格式不僅有上面兩種,還包括TC2和TC4這兩種沒有alpha通道的格式。

這裡的alpha和16位紋理的alpha是一樣的。沒有alpha通道意味著圖片裡面沒有透明畫素,但是,更多的顏色位會用來表示顏色,那麼顏色質量看起來也會更好一些。

有時候,PVRTC圖片格式指的是使用4位或者2位顏色值 ,但是,並不完全是那樣。PVRTC圖片格式可以編碼更多的顏色值。

 

預先載入所有的紋理

就像標題所說,盡你所能,一定要預先載入所有的紋理。如果你的所有的紋理加起來不超過80MB記憶體消耗的話(指的是擁有Retina顯示的裝置,非Retina的減半考慮),你可以在第一個loading場景的時候就全部載入進來。

這樣做最大的好處在於,你的遊戲體驗會表現得非常平滑,而且你不需要再擔心資源的載入和解除安裝問題了。

這樣也使得你可以讓每一個紋理都使用合適的紋理畫素格式,而且可以更方便地找出其它與紋理無關的記憶體問題。因為如果與紋理有關,那麼在第一次載入所有的紋理的時候,這個問題就會暴露出來的。如果所有的紋理都載入完畢,這時候再出現記憶體問題,那麼肯定就與紋理無關了,而是其它的問題了。

如果你知道問題與紋理無關的話,那麼你查詢剩下的記憶體問題將會變得更加簡單。而且你避免了前面說的這種情況:當2048*2048的紋理載入的時候,它本來只需要消耗16MB記憶體,但是短時間會衝到32MB記憶體。後面會提出一種方法來解決“間歇性記憶體飆高”(“譯者發明滴”)的方法。(譯者:希望下次開發者的對話中“間歇性記憶體飆高”的說法會出現,呵呵)

 

按照紋理size從大到小的順序載入紋理

由於載入紋理時額外的記憶體消耗問題,所以,採用按紋理size從大到小的方式來載入紋理是一個最佳實踐。

假設,你有一個佔記憶體16MB的紋理和四個佔用記憶體4MB的紋理。如果你首先載入4MB的紋理,這個程式將會使用16MB的記憶體,而當它載入第四張紋理的時候,短時間內會飆到20MB。這時,你要載入16MB的那個紋理了,記憶體會馬上飆到48MB(4*4 + 16*2),然後再降到32MB(4*4 + 16)。

但是,反過來,你先載入16MB的紋理,然後短時候內飆到32MB。然後又降到16MB。這時候,你再依次載入剩下的4個4MB的,這時,最多會彪到(4*3 + 4*2 + 16=36)MB。

在這兩種情況下,記憶體的峰值使用相差12MB,要知道,可能就是這12MB會斷送你的遊戲程式的小命哦!

 

避免在收到記憶體警告訊息的時候清除快取

我有時候看到了一種奇怪的“自己開槍打自己的腳”的行為:紋理已經全部在Loading場景裡面載入完畢了,這時候,記憶體警告發生了,然後cocos2d就會把沒有使用的紋理從快取中釋放掉。

聽起來不錯,沒有使用到的紋理都被釋放掉了,但是!。。。

你剛剛把所有的紋理都載入進來,還沒有進入任何一個場景中(此時所有的紋理都被當作“unused”),但是馬上被全部從texture cache中移除出去。可是,你又需要在其它場景中使用它們。怎麼辦?你需要接著判斷,如果有紋理沒有載入,就繼續載入。但是,一載入,由於“間歇性記憶體飆高”,又馬上收到了記憶體警告,再釋放,再判斷,再載入。。。。 我的天,這是一個死迴圈啊!這也能解釋為什麼有些童鞋,在loading場景完了之後進入下一個場景 的時候很卡的原因了。

現在,當我收到記憶體警告的時候,我的做法是----什麼也不做。記憶體警告仍然在發生,但是,它只是在程式剛開始載入的時候。我知道這是為什麼,因為“間歇性記憶體飆高”嘛,所以,我不去管它。(但是,如果是遊戲過程中再收到記憶體警告,你就要注意了,因為這時候可能你有記憶體洩漏了!!!)

我有時候會想辦法改善一下,通過移除掉一些不使用的紋理和一些只有在很特殊的場景才會使用的圖片(比如settings介面,玩家是不經常訪問的)。然後,不管什麼時候,當我需要某張圖片的時候,我會首先檢查一下該sprite frame是否在cache中,如果沒有就載入。你會在後面看到具體的做法。

 

理解在什麼時候、在哪裡去清除快取

不要隨機清除快取,也可以心想著釋放一些記憶體而去移除沒有使用的紋理。那不是好的程式碼設計。有時候,它甚至會增加載入次數,並多次引發“間歇記憶體飆高”。分析你的程式的記憶體使用,看看記憶體裡面到底有什麼,以及什麼應該被清除,然後只清除該清除的。

你可以使用dumpCachedTextureInfo方法來觀察哪些紋理被快取了:

[[CCTextureCache sharedTextureCache] dumpCachedTextureInfo];

 

這個方法的輸出如下:(為了清楚起見,我把那些與-hd字尾有關的資訊遮蔽掉了) 

cocos2d: "ingamescorefont.png" rc=9 name=ingamescorefont-hd.png id=13 128 x 64 @ 32 bpp => 32 KB
cocos2d: "ui.png" rc=15 name=ui-hd.png id=5 2048 x 2048 @ 16 bpp => 8192 KB
cocos2d: "ui-ingame.png" rc=36 name=ui-ingame-hd.png id=8 1024 x 1024 @ 16 bpp => 2048 KB
cocos2d: "digits.png" rc=13 name=digits-hd.png id=10 512 x 64 @ 16 bpp => 64 KB
cocos2d: "hilfe.png" rc=27 name=hilfe-hd.png id=6 1024 x 2048 @ 32 bpp => 8192 KB
cocos2d: "settings.png" rc=8 name=settings-hd.png id=9 1024 x 1024 @ 16 bpp => 2048 KB
cocos2d: "blitz_kurz.png" rc=1 name=(null) id=12 50 x 50 @ 32 bpp => 9 KB
cocos2d: "gameover.png" rc=8 name=gameover-hd.png id=7 1024 x 2048 @ 32 bpp => 8192 KB
cocos2d: "home.png" rc=32 name=home-hd.png id=4 2048 x 2048 @ 16 bpp => 8192 KB
cocos2d: "particleTexture.png" rc=2 name=(null) id=11 87 x 65 @ 32 bpp => 22 KB
cocos2d: "stern.png" rc=2 name=(null) id=2 87 x 65 @ 32 bpp => 22 KB
cocos2d: "clownmenu.png" rc=60 name=clownmenu-hd.png id=1 1024 x 2048 @ 32 bpp => 8192 KB
cocos2d: CCTextureCache dumpDebugInfo: 13 textures using 60.1 MB (紋理總共佔用的記憶體大小!!!)

 上面包含了非常多有用的資訊。紋理的大小、顏色深度(bpp)和每一個被快取的紋理在記憶體中所佔用大小等。這裡的“rc”代表紋理的“引用計數”。如果這個引用計數等於1或2的話,那麼意味著,這個紋理當前可能不會需要使用了,此時,你可以放心地把它從紋理cache中移除出去。

你只移除你知道在當前場景下不太可能會被使用的紋理(即上面介紹的引用計數為1或2的情況),這是一個明智的做法。另外,只移除那些佔用記憶體大的紋理。如果一個紋理只佔幾個kb的記憶體,其它移不移除都沒什麼太大的影響。(譯註:這就和程式優化一樣,不要做過多的細節優化,不要過早優化,要找到效能的瓶頸,然後再重點優化,以20%的時間換取80%的效率。過早和過多細節優化對於大多數程式而言,是需要極力避免的)。

 

SpriteFrames retain textures!

上面提到的例子中,紋理的引用計數可能有點讓人看不懂。你會發現,紋理集有很高的retain count,即使你知道這些紋理集中的紋理當前並沒有被使用。

你可能忽略了一件事:CCSprteFrame會retain它的紋理。因此,如果你使用了紋理集,你要完全移除它不是那麼容易。因為,由這個紋理集產生的sprite frame還是保留在記憶體中。所以,你必須呼叫CCSpriteFrameCache的removeSpriteFramesFromTexture方法,能徹底清除紋理快取中的紋理集。(譯註:記住,不是你呼叫物件的release方法了,物件的記憶體就會被釋放掉,而是引用計數為0了,記憶體才會被刪除)

[[CCSpriteFrameCache sharedSpriteFrameCache] removeSpriteFramesFromTexture:uncachedTexture];

 你也可以使用 removeSpriteFramesFromFile,並指定一個紋理集的.plist檔案來清除快取起來的精靈幀(spriteframes).

 

 

新增 SpriteFrames 非常耗時, 每次都是!

Note: 這一點只針對cocos2d v1.0有效,而cocos2d v2.x在載入之前會預先判斷。

這樣看起來有點無知(innocent):

[[CCSpriteFrameCache sharedSpriteFrameCache] addSpriteFramesWithFile:@"ui.plist"];

相關文章