美國田納西州孟菲斯,全球最大超級計算中心“Supercluster”已近日正式開始運轉(zhuǎn)。該項目隸屬于馬斯克旗下的xAI。
埃隆·馬斯克最近在社交平臺“X”上宣布了這一消息。他表示,xAI公司已開始在“Supercluster”上進行訓練,該集群由10萬個液冷英偉達(Nvidia)H100 GPU組成,在單個遠程直接數(shù)據(jù)存取(RDMA)結構上運行,號稱是“世界上最強大的AI訓練集群”。
對比來看,OpenAI訓練GPT4,需要用到25000塊A100GPU,約為前者的1/20。
“它是世界上最強大的AI訓練集群。”馬斯克聲稱,Supercluster將全方位、深層次地參與并加速“世界上最強大人工智能”的訓練過程。
從GPU規(guī)模上來看,這一集群已經(jīng)全面超越了最新Top500榜單上的任何一臺超級計算機,包括超過配備37888個AMDGPU的Frontier、60000個IntelGPU的Aurora,以及14400個NvidiaH100GPU的MicrosoftEagle,在規(guī)模和訓練效率被公認為全球最強大的AI訓練平臺。
xAI創(chuàng)始成員TobyPhln表示,“一年前創(chuàng)辦這家公司時,我們的目標是實現(xiàn)三大優(yōu)勢:數(shù)據(jù)優(yōu)勢、人才優(yōu)勢和計算優(yōu)勢。從今天開始,我們擁有了這三項優(yōu)勢。”馬斯克隨后轉(zhuǎn)載了這一消息。
Supercluster原定于2025年秋季啟動,xAI提前了一年實現(xiàn)該目標。
據(jù)福布斯報道,據(jù)大孟菲斯商會主席Ted Townsend透露,馬斯克僅花費一周,就決定將他的人工智能初創(chuàng)公司xAI的新超級計算機建造在孟菲斯。
“經(jīng)過3月份的幾天旋風式談判之后,馬斯克和他的團隊(其中包括他旗下幾家公司的代表)選擇了田納西州的這座城市。”Ted Townsend解釋稱,這里有充足的電力和快速建設的能力,該項目將價值數(shù)十億美元。在選擇孟菲斯之前,xAI還與其他七八個城市進行了洽談。
今年6月份,Ted Townsend曾告訴彭博社,有關新廠的許多細節(jié)尚未披露,包括總成本和將創(chuàng)造的就業(yè)數(shù)量。他表示,該市還討論了向xAI提供稅收減免或其他商業(yè)激勵措施,以吸引項目落戶孟菲斯,但具體細節(jié)尚未敲定。
xAI承包商將該項目稱為“巨人項目”(Project Colossus),源自于1970年的科幻電影《巨人:福賓計劃》,講述的是一個失控的人工智能被賦予美國核武庫控制權的故事。“巨人,它能看到一切,感知一切,了解一切,控制所有武器和防御。當這個沒有感情的造物成為人類的主宰時,結果將是災難性的。”
然而,這一投資進程并不順利。福布斯報道稱,孟菲斯市議會的幾名議員正在敦促該市叫停這項投資,議員們被排除在項目決策過程之外。當?shù)孛癖妼@筆交易偷偷摸摸的性質(zhì)和數(shù)據(jù)中心對水電的需求感到擔憂。
人工智能的發(fā)展正在對歐美國家?guī)砭薮蟮碾娏ω摀?/p>
根據(jù)國際能源署的數(shù)據(jù),一次ChatGPT查詢需要2.9瓦時的電力,與之相比,谷歌搜索僅需要0.3瓦時的電力。高盛研究部估計,2023年至 2030年間,人工智能所驅(qū)動的數(shù)據(jù)中心功耗每年總體增長約200太瓦時;到2028年,預計人工智能將占數(shù)據(jù)中心電力需求的19%左右。
據(jù)估計,xAI孟菲斯工廠每小時可能使用高達150兆瓦的電力,相當于10萬戶家庭所需電量,而xAI預計每天至少需要100萬加侖的散熱水。這可能會對當?shù)貋碚f會造成巨大的負擔。
xAI為了達成這項協(xié)議,已口頭承諾將改善孟菲斯的公共基礎設施,以支持數(shù)據(jù)中心的發(fā)展,包括興建一個新的變電站和一個污水處理設施。然而,這一舉措并不能讓當?shù)厝诵欧?,馬斯克此前在其他地方承諾的一些公共基礎設施項目并未如約推進。
另一方面,馬斯克從OpenAI高薪挖來的Kyle Kosic,已于今年4月離職,重返OpenAI。
伴隨著非議,馬斯克的AI夢想仍在快速前進。
當?shù)貢r間5月26日,xAI宣布完成60億美元的B輪融資。
馬斯克另外透露,xAI的Grok-2模型在來自甲骨文的2.4萬個英偉達H100芯片上進行訓練,“可能準備下月發(fā)布”。此前,xAI已經(jīng)從甲骨文租用了大約1.6萬顆H100芯片,成為該公司此類芯片最大客戶。
6月19日,馬斯克在社交平臺X上表示,戴爾正在組裝xAI在建超級計算機的一半機架,日本SMC組裝另一半。7月9日,xAI已結束與甲骨文擴大現(xiàn)有協(xié)議、租用英偉達芯片的洽談。甲骨文在去年9月表示,將向xAI提供云基礎設施以訓練AI模型,但未透露合同價值和期限。今年5月有報道稱,兩家公司接近達成擴大合作關系的協(xié)議,xAI將斥資約100億美元向甲骨文租用云服務器、為期數(shù)年。
馬斯克稱,xAI的10萬個H100GPU已經(jīng)投入到Grok3模型的專項訓練中,預計將于今年12月前完成訓練。
目前,xAI已經(jīng)發(fā)布了Grok-1、Grok-1等多個版本的模型。今年發(fā)布的Grok-1.5模型已具備長上下文能力,而Grok-1.5V則有了圖像理解能力。
按照計劃,xAI將在8月份發(fā)布Grok2。馬斯克的最終目標是在今年12月之前訓練出“按每項指標衡量都是世界上最強大的人工智能”——Grok3。
相較于其他競爭對手,xAI入局較晚,在模型參數(shù)表現(xiàn)上也不突出。但財大氣粗的馬斯克表示,“我們的根本競爭力有賴于比其他任何人工智能公司更快。”
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。