作者:Jack OmniXRI, 2024/3/15
一年一度的世界通訊大會(MWC 2024)[1]於2/26到2/29在西班牙巴塞隆納盛大舉行,以往重點都是在酷炫的行動通訊裝置,而此次重點則都落在AI上,尤其是不靠連網、本機可獨立運算的生成式應用。
2022年底OpenAI推出ChatGPT後,一時風起雲湧,每週都有新的驚喜,各種大語言模型(LLM)及生成式AI(GenAI / AIGC)應用層出不窮,讓文字可以生成文章、音樂、影像、影片甚至可以使用多模態(Multimodal)模型讓文字影音可以相互感知和生成。LLM剛開始時,使用的模型參數量都非常巨大,可高達1750億(簡寫成175B)個參數,隨著各種專家學者的努力,在特定用途、推論能力和精度略減時,可將參量縮減至330億(33B), 130億(13B), 70億(7B)甚至13億(1.3B),若加上模型量化技術,就能讓模型儲存空間縮減到原先1/4(INT8)至1/8(INT4)。此時剛好高算力、大記憶體容量手機誕生,滿足運行最低門檻,於是AI手機就變成此次 MWC 2024 的新寵兒。
為了讓大家更理解AI手機究竟有哪些方案供應商,硬體上究竟有哪些重大突破及軟體上到底能玩什麼應用,接下來就一一幫大家介紹一下。
此次AI手機晶片供應商主要由兩大家包辦,包括聯發科和高通,相關技術規格如下所示。其中AI計算引擎(APU/NPU)的性能提升是主要促成單機離線AI應用的重要關鍵,解決了以往單靠CPU或DSP計算能力有限的問題。
以下列出目前有支援這些晶片的手機製造商、機種名稱、動態記憶體(DRAM)及快閃記憶體(FLASH)容量。
聯發科 天磯(Dimemsity) 9300 [2]
高通 驍龍(Snapdragon) 8 Gen 3 [3]
註:各家手機隨價格不同,會配置更大容量的動態及快閃記憶體,這裡僅列出最低配置。
從上述AI手機硬體規格來看,動態記憶體(DDR)是決定可以運行多大模型的關鍵。扣除手機作業系統及常用APP使用量,其餘的才是模型運行時可支配的容量。以較常見的7B模型來看,若參數以8位元整數(INT8)來表示,在模型不使用剪枝、權重共享等優化手段且一次讀入完整模型情況下,則至少要動用7GByte的動態記憶體。這對手機負擔頗重,所以通常會將模型參數量化成4位元整數(INT4),讓動態記憶體需求量馬上降到1/2。當然,如果再搭配分段讀入甚至模型優化等手段,這樣動態記憶體的使用量就能變得更低。這裡建議將來有想購買AI手機的人,由於動態記憶體無法擴充,所以要選購容量大一點的,才能容許功能更強大、參數更多的模型運行。
一般手機配置的快閃記憶體(Flash)容量通常都很大,不夠用時也能很輕易加上外掛的記憶卡,所以可以用來存放很多不同用途的AI模型,就像手機端上不同的APP一樣。未來除了晶片廠、手機商外,相信會有更多第三方開發出更多應用,這樣手機就能變得更聰明了。
由於現有AI手機不像桌機、筆電有豐富的硬體資源可用,所以可使用的模型還是較受限的。各手機商為了確保AI模型能順利工作及免除使用者不知如何選用及安裝,出貨時多半已直接內建多種常用的模型。如果使用者還想擴充AI功能,亦可從晶片或手機商提供的管道下載模型。
以下就以高通 AI Hub [14] 為例,列出目前已提供的模型清單給大家參考,更完整的內容可自行查閱參考連結。
註:這裡提及的「影像生成」,在電腦視覺類是指 GAN 技術,而生成式類則是指 Diffusion 技術。
目前AI手機主要可完成的生成式應用,主要集中在文字、語音及影像之間的互相生成,以下就分別對各家展示的內容作一簡單整理和說明。
現階段AI手機仍在起步階段,各種高性能的手機會陸續推出,各種大型AI模型仍在不斷地努力瘦身想辦法擠進有限的硬體資源中,各種有趣的應用也在不停地被開發,相信不久後就會像智慧型手機剛出現時APP大爆發一樣,也會有各種AI應用被APP化。未來甚至手機不需要有實際的操作介面,就像電影鋼鐵人中的Jarvis虛擬助理一樣,所有事只要動動嘴就能完成一切,就讓我們期待這一天早日到來!
[1] MWC BARCELONA
https://www.mwcbarcelona.com/
[2] 聯發科技,天璣9300
https://www.mediatek.tw/products/smartphones-2/mediatek-dimensity-9300
[3] Qualcomm, Snapdragon 8 Gen 3 Mobile Platform
https://www.qualcomm.com/products/mobile/snapdragon/smartphones/snapdragon-8-series-mobile-platforms/snapdragon-8-gen-3-mobile-platform
[4] OPPO, Find X7 技術規格
https://www.oppo.com/cn/smartphones/series-find-x/find-x7/specs/
[5] VIVO, X100 技術規格
https://www.vivo.com/tw/products/param/x100
[6] VIVO, iQOO Neo 9 PRO 技術規格
https://shop.vivo.com.cn/product/10009292
[7] 華碩, ROG Phone 8 技術規格
https://rog.asus.com/tw/phones/rog-phone-8/spec/
[8] 榮耀, Magic6 Pro 技術規格
https://www.hihonor.com/cn/phones/honor-magic6-pro/spec/
[9] OPPO, Find X7 Ultra 技術規格
https://www.oppo.com/cn/smartphones/series-find-x/find-x7-ultra/specs/
[10] 三星, S24+ 技術規格
https://www.samsung.com/tw/smartphones/galaxy-s24/specs/
[11] 三星, S24 Ultra 技術規格
https://www.samsung.com/tw/smartphones/galaxy-s24-ultra/specs/
[12] 小米, 14 技術規格
https://www.mi.com/xiaomi-14/specs
[13] 小米, 14 Ultra 技術規格
https://www.mi.com/xiaomi-14-pro
[14] Qualcomm, AI Hub Models
https://aihub.qualcomm.com/models
[15] MediaTek at MWC 2024 - Generative AI
https://www.mediatek.com/blog/mediatek-at-mwc-2024-generative-ai
https://youtu.be/dlZMedOHQ60
本文同步發表在【台灣自造者 vMaker】
OmniXRI 整理製作,歡迎點贊、收藏、訂閱、留言、分享