9月26日消息,華為官方宣布,中國移動集團首席專家、研究院網(wǎng)絡與IT技術研究所所長張昊在華為全聯(lián)接大會2024期間與華為數(shù)據(jù)存儲產品線副總裁謝強強共同發(fā)布了智算中心超大規(guī)模集群AI存儲解決方案。
張昊表示,近年來,大模型技術正在快速向更大規(guī)模、更強能力發(fā)展,大模型技術發(fā)展趨勢總體仍然遵循ScalingLaw,參數(shù)已邁進萬億甚至十萬億規(guī)模,從單模態(tài)走向多模態(tài);OpenAI、字節(jié)跳動、中國移動、Meta等國內外大型科技公司正積極投建萬卡/超萬卡集群智算中心,建設一批萬卡、超萬卡集群成為新基建的“暴力美學”。但是隨著大模型規(guī)模越來越大,尤其是萬卡集群處理海量非結構化數(shù)據(jù)時,傳統(tǒng)存儲系統(tǒng)面臨高吞吐性能、多協(xié)議處理、數(shù)據(jù)管理效率等多方面挑戰(zhàn)。
對此,中國移動在哈爾濱萬卡超大規(guī)模智算集群首次大規(guī)模部署了基于華為OceanStorAI存儲的多協(xié)議融合存儲,存儲集群可得容量達150PB,依托“并行客戶端、高密全閃介質、冷熱數(shù)據(jù)自動分級、GSE全調度以太網(wǎng)”的高性能融合存儲系統(tǒng),大幅提升大模型訓練效率。
參考此前報道,國內運營商最大單集群智算中心——中國移動智算中心(哈爾濱)于8月30日建設完成并正式投產使用。該智算中心具有單集群算力規(guī)模最大、國產化網(wǎng)絡設備組網(wǎng)規(guī)模最大等特點。單集群智算中心把所有AI加速卡打造成1個集群,用以支持千萬億級參數(shù)的大模型進行訓練。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。