香蕉视频污版_香蕉视频下载链接_下载香蕉视频_香蕉视频APP成人

?這顆用整個晶圓做的芯片,會是顛覆者嗎?

日期:2020-10-29 / 人氣: / 來源:

[概要說明]基于大型晶圓的機架和硅光子技術(shù)相結(jié)合的系統(tǒng)的未來發(fā)展并非無道理,這種技術(shù)可以解決熱量問題,并具有可分割,可擴展且在合理的功率預(yù)算內(nèi)的真實通信。
長期以來人們一直對晶圓級架構(gòu)持懷疑態(tài)度,這種懷疑可以追溯到幾十年前。出于商業(yè)或技術(shù)原因,僅有少數(shù)人做過相關(guān)嘗試,但他們都毫不例外地失敗了,當中包括著名的Gene Amdah)。但是,除了適當建立的半導(dǎo)體技術(shù)基礎(chǔ)之外,也許還缺少合適的時機。
如果您問Andrew Feldman,為什么晶圓級方法不那么普遍,他的回答很簡單:他在Cerebras Systems的團隊是唯一弄清楚如何真正做到這一點的人。在他看來,沒有人能夠或?qū)⒁獓L試這個,至少短期內(nèi)不會。
“我認為沒有人能做到。我們花了五年的時間,我們還擁有龐大的專利產(chǎn)品組合。AI這一工作量將占總計算量的約三分之一。如果您看一下Google,他們已經(jīng)完成了大部分工作,看起來像是AI工作負載。此外,用于解決AI問題的計算量正以驚人的速度增長。在接下來的三到五年中,數(shù)據(jù)中心中的更多工作將是AI或類似AI的工作,更多的難題將圍繞如何在數(shù)據(jù)中尋找見解。”
如果我們巧妙地越過專利組合的那薄弱的威脅,以及它對 Cerebras 的可能性證明所鼓舞的潛在初創(chuàng)公司意味著什么,那么還會出現(xiàn)其他一些問題。首先,為什么以前沒有這項工作,其次,如果現(xiàn)在可能的話,為什么專業(yè)人士不這樣做呢?
“我們觀察了1984年Amdahl所做的晶圓級芯片,事實是,人們對此記憶猶新的的是芯片是如此之大,但他們其實從未真正看過它。當時我們的行業(yè)還不那么成熟,所以肯定圍繞芯片制造工藝。但自那時以來,我們已經(jīng)制造了成千上萬的芯片。流程和體系結(jié)構(gòu)要好得多。我們?yōu)榫A規(guī)模選擇了一種架構(gòu),但Gene Amdahl沒有。我們試圖采用他喜歡的架構(gòu)并將其推廣到晶圓級。
他繼續(xù)說道:“我們能夠利用我們的架構(gòu)設(shè)計芯片并物理現(xiàn)實。我們要做的一件事是用超過40萬個相同的塊構(gòu)建重復(fù)的圖塊設(shè)計。如果發(fā)生故障,我們可以解決。這是一個新發(fā)現(xiàn),它是如何結(jié)合已知的事實,即存在缺陷的已知事實。這不是新事物;DRAM將位單元的行和列放在一邊,這就是他們獲得高良率的方式。但是直到我們這樣做之前,沒有人使用計算機來做到這一點。”
訣竅可能是做到這一點并擁有一個功能齊全、高效的系統(tǒng),但是,您不能只出售獨立的設(shè)備,并不是每個芯片制造商都希望負擔(盡管Nvidia的DGX機器可能反映出不同的東西)。從編譯器到冷卻的完整堆棧是唯一有意義的方法。這正是Feldman的公司Cerebras Systems正在推廣其CS-1系統(tǒng)的原因?;叵胍幌?,Cerebras今年通過其Wafer Scale Engine方法應(yīng)用于AI獲得了一些動力,特別是在以研究為中心的站點上進行了安裝,包括Lawrence Livermore國家實驗室,Argonne國家實驗室和匹茲堡超級計算中心。很難說出它們可能在企業(yè)或超大規(guī)模系統(tǒng)中的位置,但就目前而言,即使在純AI訓(xùn)練和推理之外。
我們必須假設(shè)英特爾和Nvidia的大量研究預(yù)算至少使該主題有了一些想法,尤其是在看到Cerebras證明了這一概念之后。也許他們確實找到了使所有片上電路都變得更重要的方法,更重要的是,編譯器成功地解決了這一問題,并發(fā)現(xiàn)盡管實用,但從經(jīng)濟上講不合算。也許那是因為您不能僅僅構(gòu)建要在2020-2025年的晶圓級游戲中使用的設(shè)備:整個系統(tǒng)必須以人類已知的最復(fù)雜的代碼簽名練習(xí)之一來構(gòu)建。大多數(shù)芯片制造商和加速器初創(chuàng)公司都不希望(或?qū)嶋H上不能)從事系統(tǒng)業(yè)務(wù),并且該設(shè)備的集成也不是典型的集成過程。
具有大量內(nèi)核且可以超快速度通信的芯片有很多機會,而這些都不是新鮮事物。除了AI,HPC領(lǐng)域(包括計算流體動力學(xué))具有廣泛的商業(yè)價值,適合大規(guī)模使用信號處理等工作。開關(guān)芯片的想法更加萌芽,如果該行業(yè)已經(jīng)在使用一些最大的硅片,那么在更廣泛的可行范圍內(nèi),它可以輕松地改變晶片規(guī)模。那只是近期。我們甚至可以更進一步,提出一個系統(tǒng)的概念,該系統(tǒng)將晶圓級引擎與裸露在機架上的硅光子相連,能夠保持涼爽并真正處理大量工作負載,而無需離開設(shè)備或橫向擴展而無需全部多余的熱量和性能損失。但這是另一個長遠的故事。
對于石油和天然氣以及超級計算級科學(xué)法規(guī)中HPC等高價值應(yīng)用領(lǐng)域,新架構(gòu)的挑戰(zhàn)始終是相同的。這些代碼基本上是一成不變的,只有最近才可以從GPU加速中受益。但是,對于那些愿意大力投資的人來說,人工智能的故事顯而易見。我們從未能夠了解晶圓級方法的成本,以及與使用相同晶圓進行切片和切塊以單獨出售的方式有何不同。使所有部件連接起來的所有額外網(wǎng)絡(luò)可能會帶來可觀的成本開銷
對于那些定義狹窄的應(yīng)用程序集,是否有足夠的市場需要解決,以使所有這些都值得呢?以及其中一家開關(guān)芯片制造商和集成商得到暗示并為其工程購買Cerebras以及使具有AI功能的開關(guān)芯片產(chǎn)品多樣化需要多長時間?
“如果您看一下Nvidia和Intel的研究,他們正在發(fā)表論文說無法做到。我們解決了70年來一直未解決的問題。這些擁有數(shù)萬名工程師的巨型公司一直說這是不可能的,而我們位于洛斯阿爾托斯(Los Altos)房地產(chǎn)市場的小團隊做到了。他的斷言是,由于天生缺乏技術(shù),大公司沒有追求晶圓規(guī)模。“ Nvidia和其他公司知道更大的芯片更適合這種工作負載。如果您從2013年開始繪制GPU的圖表,它的大小將增加一倍以上。為什么?因為他們知道更大的籌碼會更好。但是他們不知道怎么做,仍然不知道,是如何變得大50到60倍,這就是我們所做的。”他補充道。
即使可以甚至確實存在硅片規(guī)模,也無論如何都無法解決所有問題。但是對于需要小型,密集計算和低功耗,低延遲和超高帶寬的大規(guī)模通信的AI工作負載,這種方法很有意義。盡管其他加速器和基于加速器的系統(tǒng)提供了此功能,但仍然存在外部網(wǎng)絡(luò)無法解決的問題。
但是,如果晶圓級的概念被證明是有效的,我們是否可以看到其他初創(chuàng)公司采用類似的方法?對自己的工廠進行嚴格控制的公司可以輕松實現(xiàn)這一飛躍。Feldman說,他們之所以沒有這樣做,是因為他們不知道如何做,但他們這樣做的原因可能更加復(fù)雜,并且與關(guān)注點,半導(dǎo)體經(jīng)濟和需求有關(guān)。如果是這樣,他們將不得不用一種價格便宜的產(chǎn)品來應(yīng)對潛在的市場嗎?例如,考慮到像英特爾這樣的擁有全部網(wǎng)絡(luò),晶圓廠和市場專業(yè)知識的公司并沒有走這條路,那么,肯定有些事情要么不值得努力,要么根本無法完成。
那么,要回答標題中的問題,是否有至少一個或兩個以上的初創(chuàng)公司,也許還有一個專業(yè)進入該行業(yè)的晶圓級芯片行業(yè) ?也許。這就是為什么我們保持密切關(guān)注Cerebras機器的原因。不僅是為了查看它是否有效,還在于編程模型如何運行以及它是否真的可以承擔起不僅僅限于AI的任務(wù)。
如上所述,基于大型晶圓的機架和硅光子技術(shù)相結(jié)合的系統(tǒng)的未來發(fā)展并非無道理,這種技術(shù)可以解決熱量問題,并具有可分割,可擴展且在合理的功率預(yù)算內(nèi)的真實通信。然后事情就變得有趣了,特別是如果魔術(shù)編譯器可以真正地在HPC和大規(guī)模分析中使用并行代碼以及AI工作負載演變成的任何東西。


Go To Top 回頂部