大數(shù)據(jù)時(shí)代,算力不僅改變了人們生產(chǎn)、生活方式,更成為科技進(jìn)步和經(jīng)濟(jì)社會(huì)發(fā)展的關(guān)鍵“底座”。從太空探索,到人類基因測序、醫(yī)藥研發(fā),再到消費(fèi)、出行,都需要強(qiáng)大的算力處理海量數(shù)據(jù)。
高性能:超算中心最核心的服務(wù)能力是算力輸出,因此需要具備優(yōu)質(zhì)的智算服務(wù)、先進(jìn)的計(jì)算能力。
安全可靠:作為國家級(jí)計(jì)算中心,需要具有穩(wěn)定可靠的算力設(shè)備,避免突發(fā)事件對數(shù)據(jù)的破壞。
靈活擴(kuò)展:算力集群需要與網(wǎng)絡(luò)、存儲(chǔ)等節(jié)點(diǎn)鏈接,因此需要更靈活的擴(kuò)展能力。
易維護(hù):出現(xiàn)故障,單獨(dú)排查運(yùn)維成本高,因此需要打造管理集群,簡化運(yùn)維操作。
安擎針對超算中心商用輔助計(jì)算的需求,依托數(shù)十臺(tái)EG840-G30 4U服務(wù)器部署輔助算力集群系統(tǒng)。
EG840-G30是專為計(jì)算密集型應(yīng)用場景推出的新一代服務(wù)器,具有高性能、高可靠、高擴(kuò)展的特點(diǎn)。
高性能
· 采用第三代英特爾? 至強(qiáng)? 可擴(kuò)展系列處理器(TDP 270W),每顆 CPU 最大提供 64 Lane PCI-E 4.0 總線;
· 在4U的空間內(nèi)可支持10片全高全長雙寬專業(yè)GPU卡,單U算力可達(dá)1560TFLOPS。
高可靠
· 通過檢測、控制并持續(xù)糾正錯(cuò)誤和故障,而不是通過強(qiáng)制重置 GPU 來提高其正常運(yùn)行時(shí)間和可靠性;在處理錯(cuò)誤和故障邏輯中,運(yùn)用歸因、隔離、遏制等策略針對 MIG 環(huán)境,確保GPU在高性能計(jì)算環(huán)境中的安全;
· 配置 2000W 鉑金級(jí) 2+2 冗余電源,防止瞬間掉電,提供更穩(wěn)定可靠的系統(tǒng)電源。
高擴(kuò)展
· 配置12個(gè)PCI-E4.0 插槽,可搭配 100G 以太網(wǎng)卡和Infiniband 網(wǎng)卡,組建低延時(shí)高擴(kuò)展的存儲(chǔ)與計(jì)算網(wǎng)絡(luò)。
易管理
· 集成 IPMI 功能,可以對服務(wù)器進(jìn)行遠(yuǎn)程操作和維護(hù),有效提高產(chǎn)品可靠性和穩(wěn)定性;
· 智慧BMC遠(yuǎn)程管理,提供零接觸運(yùn)維,提高運(yùn)維效率;支持 IPMI 和 KVM Over IP 高級(jí)管理功能。
靈活擴(kuò)展,高速的存儲(chǔ)計(jì)算集群,滿足輔助計(jì)算需求;
持續(xù)穩(wěn)定的算力輸出,打造可靠的算力底座;
數(shù)字化管理,降低管理運(yùn)維成本。