在AI技術(shù)驅(qū)動產(chǎn)業(yè)變革的浪潮中,星網(wǎng)銳捷積極擁抱人工智能發(fā)展趨勢,全面推進AI戰(zhàn)略建設(shè)。經(jīng)過多年的數(shù)字化深耕,已積累了豐富的數(shù)據(jù)主機與多元算力設(shè)備資源,覆蓋國產(chǎn)/非國產(chǎn)算力卡、本地/云端等多類型算力資源。
然而,伴隨AI建設(shè)的深入推進,碎片化、多元化的數(shù)據(jù)與算力資源管理問題日益凸顯。構(gòu)建高效統(tǒng)一的算力管理體系,成為集團突破發(fā)展瓶頸、釋放AI潛力的關(guān)鍵所在。
星網(wǎng)銳捷推出自研星巢智算管理平臺,實現(xiàn)對不同城市推理及推訓設(shè)備的跨區(qū)域納管。平臺基于各城市數(shù)據(jù)主機構(gòu)建知識庫,并與推理集群的大模型關(guān)聯(lián),進而能夠跨區(qū)域提供應用服務(wù) —— 為算力集群外的應用主機提供基于大模型二次開發(fā)的接口,實現(xiàn)不同區(qū)域數(shù)據(jù)與算力資源的整合,向其他區(qū)域用戶輸出服務(wù)。
多元異構(gòu),算力調(diào)度
星巢智算管理平臺破解AI算力困局
星巢智算管理平臺StarNest針對多元異構(gòu)算力,包括通算、智算、超算、公有云、私有云、混合云、裸金屬、虛機和容器等,通過整合“算力門戶”、“算力接入”、“算力調(diào)度”、“算力運營”和“算力監(jiān)控”等功能,以直觀的界面和智能化的調(diào)度功能,幫助用戶輕松管理多元算力資源,實現(xiàn)資源的高效利用和精準分配;通過為算力供給方、算力消費方和算力運營方提供一站式解決方案,實現(xiàn)全局算力資源“看得清”、“說得明”、“管得住”,推動算力產(chǎn)業(yè)生態(tài)的發(fā)展,助力企業(yè)智能化轉(zhuǎn)型。
星巢智算管理平臺監(jiān)控視圖
算力資源集中管理、統(tǒng)一調(diào)度,規(guī)避資源浪費風險
通過算力管理平臺對企業(yè)內(nèi)部各類算力設(shè)備實施統(tǒng)一管理,各子公司及部門可根據(jù)實際需求申請使用算力設(shè)備,有效規(guī)避因信息不對稱、需求分散等因素造成的重復建設(shè)問題,避免算力資源閑置與浪費現(xiàn)象的發(fā)生。
內(nèi)核級精準算力切分,靈活分配算力資源
通過算力管理平臺,提供1%細粒度的算力切分能力,將單卡分割為多個虛擬實例,供不同任務(wù)按需調(diào)用,打破傳統(tǒng) “整卡獨占” 的粗粒度模式,實現(xiàn)資源的動態(tài)分配,GPU利用率最高提升70%。
兼容國產(chǎn)與非國產(chǎn)生態(tài),系統(tǒng)靈活更替
算力管理平臺兼容主流的國產(chǎn)和非國產(chǎn)算力設(shè)備和操作系統(tǒng),在國際貿(mào)易環(huán)境中算力芯片面臨斷供風險的情形下,可實現(xiàn)算力設(shè)備與操作系統(tǒng)的靈活更替,且上層大模型應用無需進行重復適配,有效降低適配工作及平臺遷移過程中的人力成本投入。
統(tǒng)一發(fā)布軟件功能,內(nèi)外協(xié)同避免重復研發(fā)
在集團協(xié)同創(chuàng)新體系下,子公司完成某一功能研發(fā)后,可通過平臺構(gòu)建標準化服務(wù)模塊,對內(nèi)實現(xiàn)全集團高效復用,對外統(tǒng)一進行市場發(fā)布。有效避免重復研發(fā),實現(xiàn)算力、數(shù)據(jù)等資源的集約化管理,加速技術(shù)創(chuàng)新與產(chǎn)業(yè)升級。
通過星巢智算管理平臺的助力,星網(wǎng)銳捷在算力資源管理層面實現(xiàn)重要突破,顯著降低了年度算力成本。星網(wǎng)銳捷積極構(gòu)建自主可控的算力生態(tài),為企業(yè)降本增效和數(shù)字化轉(zhuǎn)型提供具有示范意義的”智慧大腦“ ;更以智能化算力底座為支撐,為數(shù)字經(jīng)濟高質(zhì)量發(fā)展注入動能。