亚洲精品一区二三区在线观看_久久美_91妖精视频_成av人电影在线_久久久国产精品免费_久热亚洲

首頁 > 活動(dòng)線報(bào) > 每日福利 > 如何定義一款新的AI處理器?AI芯片案例分析

如何定義一款新的AI處理器?AI芯片案例分析

發(fā)布時(shí)間:2024-10-20 22:09:38來源: 13041198719
AI大模型的熱潮不斷,預(yù)計(jì)未來十年,AGI時(shí)代即將到來。但目前支撐AI發(fā)展的GPU和AI專用芯片,都存在各種各樣的問題。 那么,在分析這些問題的基礎(chǔ)上,我們能不能針對(duì)這些問題進(jìn)行優(yōu)化,重新定義一款能夠支持未來十年AGI大模型的、足夠靈活通用的、效率極高性能數(shù)量級(jí)提升的、單位算力成本非常低廉的、新的AI處理器類型?
 
01.首先分析場(chǎng)景特點(diǎn),做好軟硬件劃分
 
1.1 一方面,AI處理器存在問題
 
差不多是從2015年前后,開始興起了專用AI芯片的浪潮。以谷歌TPU為典型代表的各種架構(gòu)的AI專用芯片,如雨后春筍般涌現(xiàn)。 但從AI落地情況來看,效果并不是很理想。這里的主要問題在于:
 
AI芯片專用設(shè)計(jì),把許多業(yè)務(wù)邏輯沉到硬件里,跟業(yè)務(wù)緊密耦合;但業(yè)務(wù)變化太快,算法不斷更新,芯片和業(yè)務(wù)的匹配度很低。
 
AI算法是專用的,面向具體場(chǎng)景,比如人臉識(shí)別、車牌識(shí)別,各種物品識(shí)別等。綜合來看,算法有上千種,加上算法自身仍在快速演進(jìn),加上各種變種的算法甚至超過數(shù)萬種。
 
用戶的業(yè)務(wù)場(chǎng)景是綜合性的,把業(yè)務(wù)場(chǎng)景比做一桌宴席,AI芯片就是主打的那道主菜。對(duì)AI芯片公司來說,自己只擅長(zhǎng)做這一道菜,并不擅長(zhǎng)做其他的菜品,更不擅長(zhǎng)幫助用戶搭配一桌美味可口、葷素均衡、營養(yǎng)均衡的宴席。
 
1.2 另一方面,GPU也存在問題
 
NVIDIA的GPU是通用并行處理器:
 
性能效率相對(duì)不高,性能逐漸見頂。要想算力提升,只能通過提升集群規(guī)模(Scale Out,增加GPU數(shù)量)的方式。
 
增加集群規(guī)模,受限于I/O的帶寬和延遲。一方面,集群的網(wǎng)絡(luò)連接數(shù)量為O(n^2),連接數(shù)量隨著集群規(guī)模的指數(shù)級(jí)增加;另一方面,AI類的計(jì)算任務(wù),不同節(jié)點(diǎn)間的數(shù)據(jù)交互本身就非常巨大。因此,受阿姆達(dá)爾定律影響,I/O的帶寬和延遲,會(huì)約束集群規(guī)模的大小。(在保證集群交互效率的情況下,)目前能支持的集群規(guī)模大約在1500臺(tái)左右。
 
還有另外一個(gè)強(qiáng)約束,就是成本。據(jù)稱GPT5需要5萬張GPU卡,單卡的成本在5W美金左右,再加上其他硬件和基礎(chǔ)設(shè)施已經(jīng)運(yùn)營的成本。僅硬件開銷接近50億美金,即350億RMB。這對(duì)很多廠家來說,是天文數(shù)字。
 
1.3 問題的核心:芯片的靈活性要匹配場(chǎng)景的靈活性
 
首先,仍然是從我們之前很多文章中提到的這個(gè)“從軟件到硬件的典型處理器劃分圖”開始分析。
 
 
 
指令是處理器軟件和硬件的媒介:有的指令非常簡(jiǎn)單,就是基本的加減乘除等標(biāo)量計(jì)算;有的指令非常復(fù)雜,不是純粹的向量、矩陣或多維張量計(jì)算,而是各種維度計(jì)算再組合的一個(gè)混合的宏指令,或者說是一個(gè)算子甚至算法,就對(duì)應(yīng)到一條(單位計(jì)算)指令。 AI專用處理器是一種DSA,是在ASIC基礎(chǔ)上具有一定的可編程能力。性能效率足夠好,但不夠靈活,不太適合業(yè)務(wù)邏輯和算法快速變化的AI場(chǎng)景。而GPU足夠靈活,但性能效率不夠,并且性能逐漸達(dá)到上限。 從目前大模型宏觀發(fā)展趨勢(shì)來看:
 
Transformer會(huì)是核心算法,在大模型上已經(jīng)顯露威力。未來模型的底層算法/算子會(huì)逐漸統(tǒng)一于Transformer或某個(gè)類Transformer的算法。從此趨勢(shì)分析可得:AI場(chǎng)景的業(yè)務(wù)邏輯和算法在逐漸收斂,其靈活性在逐漸降低。
 
此外,AI計(jì)算框架也走過了百家爭(zhēng)鳴的階段,目前可以看到的趨勢(shì)是,PyTorch占據(jù)了絕大部分份額。這說明整個(gè)生態(tài)也在逐漸收斂,整個(gè)系統(tǒng)的迭代也在放慢。
 
這兩個(gè)趨勢(shì)都說明了,未來,“專用”的AI芯片會(huì)逐漸地綻放光芒。當(dāng)然了,作為AI芯片的公司,不能等,而是需要相向而行:
 
需要定義一款,其性能/靈活性特征介于GPU和目前傳統(tǒng)AI-DSA處理器之間的,新型的通用AI處理器。“比GPU更高效,比AI芯片更通用”。
 
通用性體現(xiàn)在兩個(gè)方面:
 
一方面,處理器的通用性。能夠適配更多的算法差異性和算法迭代,覆蓋更多場(chǎng)景和更長(zhǎng)的生命周期。
 
另一方面,面向AGI通用人工智能。不再是專用AI的“場(chǎng)景千千萬,處理器千千萬”,架構(gòu)和生態(tài)完全碎片;而是一個(gè)通用的強(qiáng)人工智能算法,一個(gè)通用的強(qiáng)處理器平臺(tái),去強(qiáng)智能化的適配各種場(chǎng)景。
 
02.大核少核 or 小核眾核?
 
 
 
CPU是大核,但通常一個(gè)芯片里只有不到100個(gè)物理核心;而GPU是小核眾核的實(shí)現(xiàn),目前通常在上萬個(gè)核左右;而傳統(tǒng)AI芯片,通常是大的定制核+相對(duì)少量核(100核以內(nèi))的并行。
 
 
 
此外,一個(gè)很重要的現(xiàn)象是,GPU核,不再是之前只有CUDA核的標(biāo)量處理器,而是增加了很多Tensor核的類協(xié)處理器的部分。新的GPU處理器不再在處理器核的數(shù)量上增加,反而把寶貴的晶體管資源用在單個(gè)核的協(xié)處理器上,把單核的能力做更多的強(qiáng)化。 因此,新型通用AI芯片需要:
 
在目前工藝情況下,并行的單芯片處理器核心(GA,通用AI處理器核心)數(shù)量在500-1000之間比較合適;
 
單個(gè)GA采用通用高效能CPU核(例如定制的RISC-v CPU)+強(qiáng)大的Tensor協(xié)處理器的方式。
 
03.極致擴(kuò)展性,多層次強(qiáng)化內(nèi)聯(lián)交互
 

每日福利更多>>

從月亮到六便士:沃爾沃全新XC90上市,開啟產(chǎn)品大年的紳士打法 沃爾沃終于"狠"了一把!全新S90硬剛BBA三杰 第30屆沃爾沃高爾夫中國公開賽開賽 奧迪將“價(jià)格戰(zhàn)”再升級(jí)!跌至12.99萬,配10氣囊,性價(jià)比確實(shí)高 20萬SUV選領(lǐng)克09,老司機(jī)吵翻了!領(lǐng)克09憑什么\"卷\"贏合資? 新 方程豹 5 加高再申報(bào),標(biāo)配小天幕及無人機(jī)艙!自駕游航拍的福音 江淮江南或?qū)F(xiàn)同期少見暖熱 3月初強(qiáng)冷空氣登場(chǎng) 榮耀Magic 7 Pro的AI技術(shù)修復(fù)曼聯(lián)球隊(duì)經(jīng)典老照片 買車需謹(jǐn)慎!質(zhì)量最好十大國產(chǎn)品牌:奇瑞遺憾丟冠,領(lǐng)克長(zhǎng)安入圍 專科300-400分,這4所專科院校性價(jià)比最高,就業(yè)情況不輸本科院校 幼兒園“花式”開學(xué)傳遞滿滿的愛 廣汽豐田開年王炸!威蘭達(dá)直降4.4萬+終身質(zhì)保,現(xiàn)在抄底有多賺? iOS 18.3正式版,近期表現(xiàn)最差的版本,不要升級(jí)。 三星電機(jī)發(fā)布全球首款用于激光雷達(dá)的超小型高容量MLCC 邁克爾·戴爾:從宿舍到科技巨頭的商業(yè)傳奇 華為、聯(lián)想搶先接入DeepSeek!AI手機(jī)終于要爆發(fā)了? 國產(chǎn)SUV的那些事兒:北汽昌河Q7,它到底咋了?銷量為零的真相! 預(yù)算18萬元,選小鵬P7+還是領(lǐng)克Z10,一文了解透 理想汽車:3個(gè)核心的競(jìng)爭(zhēng)力! 新一輪價(jià)格戰(zhàn)“開打”!特斯拉、小鵬等品牌“加碼”,專家:今年市場(chǎng)競(jìng)爭(zhēng)將兩極分化 ROG日本官方調(diào)侃主板插顯卡上,旗艦顯卡投影面積接近ITX主板 業(yè)主買下126㎡“老破舊”的二手房,改造完工后,原業(yè)主:我不賣 深圳樓市迎來“開門紅”;全國人均存款首超10萬;英歌舞這次又“火”出國門!| 灣區(qū)福財(cái)訊 性能黨必看!4款銷量‘最佳’的超強(qiáng)性能手機(jī)大盤點(diǎn) 2024直屏旗艦:魅族21、三星S24 、紅魔10 誰才是你的最愛? 魅族 22 仍在路上,星際魅族高管回應(yīng)新機(jī)計(jì)劃有序推進(jìn)中 雷軍“進(jìn)廠上班”!小米新車將至,“正討論進(jìn)一步提產(chǎn)”! 2024年全球智能手機(jī)市場(chǎng)回暖,華為增長(zhǎng)37%最為迅猛 華為、蘋果等折疊新品將陸續(xù)面世,折疊機(jī)市場(chǎng)有望高增 OPPO Find N5邀請(qǐng)函來了,999純金打造,開工沾喜氣
主站蜘蛛池模板: 日韩三区| 国产精品不卡一区 | 成人免费观看国产高清 | 免费看一区二区三区 | 亚洲天堂欧美在线 | 日本美女毛茸茸 | 欧美丰满丝袜videossex | 久草新在线 | 久久99精品久久久久久琪琪 | 热久久精品在线 | 国产成人精品免费视频大 | 国产精品美女久久久 | 国产成人在线免费视频 | 99精品一区二区免费视频 | 国产日韩一区二区三区在线观看 | 久久se精品一区精品二区 | 婷婷在线免费视频 | 久在线视频 | 另类综合网 | 免费国产一区 | 午夜精品一区二区三区免费视频 | 欧美两性人xxxx高清免费 | 欧美高清免费 | 国产精品久久久久aaaa九色 | 久久影城| 国产综合在线视频 | 欧美一区二区在线免费观看 | 中国一级特黄 | 国产99久久久国产精品 | 欧美xxxxx69xxxx| 亚洲一区二区中文字幕 | 国产综合在线播放 | 婷婷在线观看网站 | 亚洲欧洲日本无在线码天堂 | 亚洲午夜在线 | 欧美成熟丰满老妇xxxx | 无码免费人妻A片AAA毛片一区 | 亚洲精品第一国产综合高清 | 亚洲国产精久久久久久久 | 欧洲怡红院 | 欧美狂猛xxxxx乱大交3 |