在技術(shù)創(chuàng)新論壇上,優(yōu)刻得高級技術(shù)經(jīng)理吳成斌發(fā)表了主題為《數(shù)據(jù)中心智能化的實踐與思考》的精彩演講。
吳成斌介紹,優(yōu)刻得烏蘭察布智算中心是公司緊貼“東數(shù)西算”國家戰(zhàn)略、按照國際A級數(shù)據(jù)中心標準所自建的“西部”智能算力中心,位于全國一體化算力網(wǎng)絡(luò)國家樞紐節(jié)點集寧大數(shù)據(jù)產(chǎn)業(yè)園,整體建筑面積約14萬平方米,總計可容納12000個機柜,能夠提供高性能、靈活、安全可靠的算力支撐和技術(shù)支持,幫助用戶解決算力資源不足、成本高昂等問題,為用戶帶來更高價值。
優(yōu)刻得烏蘭察布智算中心支持機房模塊布置、基礎(chǔ)設(shè)施配置的靈活部署、深度定制,可全面提供從數(shù)據(jù)中心、服務(wù)器、到計算、存儲、網(wǎng)絡(luò)、安全、架構(gòu)設(shè)計的一整套AIGC解決方案,將產(chǎn)品能力轉(zhuǎn)化成差異性的服務(wù)交付給客戶,為企業(yè)構(gòu)建穩(wěn)定可靠的大模型算力底座。目前,優(yōu)刻得烏蘭察布智算中心已經(jīng)形成可支持萬億參數(shù)、千卡集群的大模型訓(xùn)練能力,以高性能算力服務(wù)于大模型訓(xùn)練和推理任務(wù)。
談及智算中心的“智能化”改造,吳成斌表示,數(shù)據(jù)集中管理是智能化的基礎(chǔ),而監(jiān)控系統(tǒng)是智能化的核心。優(yōu)刻得智能算力中心充分運用RFID資產(chǎn)管理、機器人智能巡檢、DCIM系統(tǒng)監(jiān)控、AR遠程運維、數(shù)字孿生等技術(shù),實現(xiàn)了自動化運維、智能化巡檢、數(shù)字化管理。優(yōu)刻得積極投入數(shù)據(jù)中心創(chuàng)新技術(shù)研究,并作為參編單位參與了《數(shù)據(jù)中心浸沒液冷系統(tǒng)碳氟類冷卻液技術(shù)要求和測試規(guī)范》的標準制定。當前也正不斷探索運用與人工智能相結(jié)合的先進技術(shù),實現(xiàn)AI節(jié)能控制、故障自動診斷與預(yù)測。
在算力基礎(chǔ)設(shè)施之上,優(yōu)刻得還構(gòu)建了智能、一體化的智算解決方案,基于優(yōu)刻得的云主機、裸金屬、高性能存儲和低延遲網(wǎng)絡(luò)等基礎(chǔ)設(shè)施,結(jié)合了“孔明”智算平臺和UModelVerse模型服務(wù)平臺,能夠為大模型開發(fā)者、應(yīng)用廠商、高校和科研機構(gòu)等提供一站式的AI計算開發(fā)服務(wù)。其中,優(yōu)刻得孔明智算平臺具備多用戶管理、分布式訓(xùn)練、斷點續(xù)訓(xùn)和智能運維等功能,面向眾行業(yè)用戶,提供一站式管理的算力資源和運營服務(wù),使得模型開發(fā)者能夠更專注于模型開發(fā),無需擔(dān)心底層訓(xùn)練環(huán)境的部署。
大會期間,優(yōu)刻得混合云業(yè)務(wù)中心總經(jīng)理唐立參與探討了“算力租賃是否一門好生意”的圓桌對話。他表示,優(yōu)刻得作為中立的云廠商,自身不做大模型業(yè)務(wù),但能夠?qū)ν馊孑敵鲆徽臼降闹撬惴⻊?wù)平臺能力,幫助用戶提升算力使用的便捷性,這種租賃的方式會極大地降低用戶的算力使用成本。
基于高性能計算和大規(guī)模數(shù)據(jù)處理能力,智算中心不僅成為科研、金融、制造、醫(yī)療等行業(yè)領(lǐng)域的關(guān)鍵基礎(chǔ)設(shè)施,也將成為數(shù)字經(jīng)濟發(fā)展的新引擎。作為云計算領(lǐng)軍型企業(yè),優(yōu)刻得將不斷加強技術(shù)創(chuàng)新與應(yīng)用實踐,持續(xù)推進智算中心建設(shè),為人工智能和大模型產(chǎn)業(yè)發(fā)展提供強大堅實的數(shù)字底座支撐。