
為什么要開放高質(zhì)量網(wǎng)智數(shù)據(jù)集
通信網(wǎng)絡是數(shù)字經(jīng)濟發(fā)展的基石,提升通信網(wǎng)絡的智能化水平,建設高度數(shù)字化、智能化的自智網(wǎng)絡是不僅是當前ICT產(chǎn)業(yè)技術創(chuàng)新的熱點方向,更關系到數(shù)字經(jīng)濟的發(fā)展新動能。長期以來,通信行業(yè)缺少具備行業(yè)影響力、公信力的通信網(wǎng)絡公開數(shù)據(jù)集,尤其是有現(xiàn)網(wǎng)特色的真實、多樣的規(guī)模性數(shù)據(jù),制約著網(wǎng)絡智能化關鍵技術的發(fā)展與突破,業(yè)界對高質(zhì)量數(shù)據(jù)集需求迫切。
首批開放的數(shù)據(jù)集覆蓋多種場景
首批開放的7個網(wǎng)智精品數(shù)據(jù)集,來自于移動現(xiàn)網(wǎng)不同領域的生產(chǎn)創(chuàng)新需求,經(jīng)過數(shù)據(jù)清洗及治理,總數(shù)據(jù)量達到上億,已經(jīng)在中國移動一線維護、優(yōu)化、服務保障等領域的生產(chǎn)實踐中經(jīng)過了充分驗證,具有現(xiàn)網(wǎng)真實性、多樣性、數(shù)量多、種類全,覆蓋廣的特點,涵蓋網(wǎng)絡智能感知、預測、診斷、決策等多項能力場景,能夠為網(wǎng)絡智能化創(chuàng)新能力研發(fā)孵化提供數(shù)據(jù)基礎。數(shù)據(jù)集詳情如下:
CSI壓縮反饋:復雜信道環(huán)境的無線信道狀態(tài)信息數(shù)據(jù)及實測數(shù)據(jù)集,數(shù)據(jù)量級達到60萬條。該數(shù)據(jù)集可用于訓練CSI壓縮反饋等網(wǎng)元智能模型,壓縮UE側(cè)的信道特征信息,并實現(xiàn)信道狀態(tài)信息的無損還原, 實現(xiàn)快速準確的CSI壓縮反饋能力, 提升反饋精度、降低反饋開銷。
光網(wǎng)絡啞資源合規(guī)檢測:2萬張光交箱、通信桿、光纜等五類場景圖片數(shù)據(jù)集,該數(shù)據(jù)集可用于訓練網(wǎng)絡視覺模型,對傳輸線路中可能存在的啞資源進行檢測和識別,打造安全可靠、穩(wěn)定運行的光纖傳輸網(wǎng)絡。
無線側(cè)故障根因分析:現(xiàn)網(wǎng)豐富的無線網(wǎng)絡運維告警數(shù)據(jù)和故障工單數(shù)據(jù),涵蓋130類告警及23類故障原因,數(shù)據(jù)量級達到460萬條。該數(shù)據(jù)集可用于訓練故障根因分析模型,高效快速地定位故障問題,從而 減少實際派單數(shù)量,優(yōu)化派單策略,節(jié)約人工成本。
無線鏈路質(zhì)量預測:5G 多樣化業(yè)務應用場景下2萬條高精度時間分辨率下的無線網(wǎng)絡狀態(tài)參數(shù)及相應用戶業(yè)務下行速率信息數(shù)據(jù),該數(shù)據(jù)集可用于訓練無線鏈路質(zhì)量預測模型,預測用戶業(yè)務下行速率,實現(xiàn)無線鏈路狀態(tài)實時感知,提升用戶視頻業(yè)務體驗和無線網(wǎng)絡服務能力,達到網(wǎng)絡和業(yè)務協(xié)同的用戶體驗跨層智能優(yōu)化。
無線小區(qū)多指標時空序列預測:無線通信場景下現(xiàn)網(wǎng)長時間(2個月)、大規(guī)模(萬量級)移動通信小區(qū)歷史序列數(shù)據(jù),數(shù)據(jù)量級達到億條,涵蓋流量、用戶數(shù)等重要指標及多維度小區(qū)屬性信息,該數(shù)據(jù)集可用于訓練時空聯(lián)合序列預測模型,預測 多項小區(qū)性能指標的演變趨勢, 從而為網(wǎng)絡規(guī)劃和維護工作制定更精準智能的優(yōu)化策略。
算網(wǎng)異常檢測及故障定位:算力網(wǎng)絡環(huán)境下網(wǎng)絡云化設備運行日志數(shù)據(jù),包含154類異常標注,數(shù)據(jù)量級達到60萬 條。該數(shù)據(jù)集可用于建立有效的云網(wǎng)異常檢測模型和根因分析算法模型,實現(xiàn)快速準確的云設備故障檢測并定位故障原因,提升網(wǎng)絡運維效率。
網(wǎng)絡拓撲優(yōu)化:面對現(xiàn)網(wǎng)環(huán)境拓撲負載不均衡的挑戰(zhàn),現(xiàn)網(wǎng)10萬條網(wǎng)絡拓撲連接關系和網(wǎng)元屬性數(shù)據(jù),該數(shù)據(jù)集可用于建立智能網(wǎng)絡優(yōu)化模型 ,探索網(wǎng)元流量的變化規(guī)律,并據(jù)此對網(wǎng)絡拓撲結(jié)構(gòu)進行動態(tài)優(yōu)化,實現(xiàn)網(wǎng)絡負載均衡,提高網(wǎng)絡的性能和可靠性。
數(shù)據(jù)集的發(fā)布得到業(yè)界的高度認可
本次數(shù)據(jù)集的發(fā)布得到了中國移動各級領導和相關部門的大力支持。
中國移動集團公司副總工程師、集團級首席科學家王曉云表示:“高質(zhì)量數(shù)據(jù)是實現(xiàn)人工智能高質(zhì)量發(fā)展的核心要素。中國移動傾力構(gòu)建的這批網(wǎng)絡精品數(shù)據(jù)集,瞄準的是解決網(wǎng)絡智能化領域長期數(shù)據(jù)資源不足、技術創(chuàng)新路徑受限的產(chǎn)業(yè)難題。相信中國移動的貢獻,一定能夠為我國人工智能,特別是網(wǎng)絡智能化領域的技術研究、產(chǎn)品研發(fā)、人才培養(yǎng)、生態(tài)建設帶來全新動能。”
中國移動集團公司技術部總經(jīng)理陳洪濤表示:“本次開放的7項網(wǎng)絡數(shù)據(jù)集,覆蓋了多領域的網(wǎng)元、運維、服務智能場景,具有很強的移動通信行業(yè)特色和應用價值,這也是中國移動建設“智慧網(wǎng)絡國家新一代人工智能開放創(chuàng)新平臺”的重要舉措之一,后續(xù)中國移動將持續(xù)發(fā)揮自身優(yōu)勢,為產(chǎn)業(yè)開放更多的創(chuàng)新資源,更好的促進我國通信+AI技術的融合創(chuàng)新與突破。”
中國移動研究院院長黃宇紅表示:“中國移動構(gòu)建的網(wǎng)絡數(shù)據(jù)集,既著眼當下又面向未來,不僅能夠助力現(xiàn)網(wǎng)運維優(yōu)化等領域的人工智能算法創(chuàng)新,也能服務下一代網(wǎng)絡的前沿技術研究、方案驗證、模擬仿真和標準化等。中國移動期待能基于數(shù)據(jù)集的建設和不斷發(fā)展,與產(chǎn)學研各界勇闖網(wǎng)絡新技術無人區(qū),共同構(gòu)建我國信息通信技術新優(yōu)勢!”
中國移動集團級首席科學家,研究院人工智能與智慧運營中心總經(jīng)理馮俊蘭表示:“中國移動正在構(gòu)建業(yè)界領先的網(wǎng)絡大模型,深刻感受到高質(zhì)量數(shù)據(jù)的重要意義,也深知數(shù)據(jù)集的開放共享對于產(chǎn)業(yè)的巨大價值。我們希望以本次數(shù)據(jù)集的建設和發(fā)布為新的起點,能在網(wǎng)絡智能化技術創(chuàng)新方面匯聚更多的產(chǎn)業(yè)力量,攜手攻克智慧網(wǎng)絡的科學難題,共同實現(xiàn)通信網(wǎng)絡AI+X的發(fā)展新范式。”
中國移動集團公司網(wǎng)絡事業(yè)部副總經(jīng)理顧寧倫表示:“中國移動充分發(fā)揮自智網(wǎng)絡子鏈的產(chǎn)業(yè)帶動作用,依托現(xiàn)網(wǎng)豐富多樣的數(shù)據(jù)優(yōu)勢,挖掘網(wǎng)絡智能化痛點問題和生產(chǎn)需求,體系化構(gòu)建多領域、大規(guī)模的移動網(wǎng)絡特色數(shù)據(jù)集。相信本次發(fā)布的數(shù)據(jù)集能夠有效助力網(wǎng)絡智能感知、診斷、預測、決策等領域的技術創(chuàng)新,助力我國自智網(wǎng)絡加快演進升級。”
同時,業(yè)界專家對本次數(shù)據(jù)集的發(fā)布也給予了高度關注和充分肯定。
北京郵電大學理學院副院長、北京郵電大學-中國移動研究院聯(lián)合創(chuàng)新中心主任張建華教授表示:“展望6G,將是通感算智深度融合的移動通信信息網(wǎng)絡。全面、海量、精確的通信網(wǎng)絡數(shù)據(jù)集,是6G技術研究和產(chǎn)業(yè)發(fā)展的亟需。我們期待并相信中國移動網(wǎng)智數(shù)據(jù)集的開放將為6G與 AI的深度融合技術創(chuàng)新提供寶貴的數(shù)據(jù)要素。北郵與中國移動研究院成立聯(lián)合創(chuàng)新中心以來,在6G信道測量平臺與數(shù)據(jù)集共建方面取得了豐碩成果,共同發(fā)布了面向6G AI空口的信道數(shù)據(jù)集。今后我們將繼續(xù)深化合作,持續(xù)建設發(fā)布優(yōu)質(zhì)數(shù)據(jù)集,服務產(chǎn)業(yè)發(fā)展需要。”
新華三集團行業(yè)事業(yè)部副總裁、移動系統(tǒng)部總經(jīng)理王棟良表示:“在新一輪的產(chǎn)業(yè)變革中,人工智能正在釋放科技革命和產(chǎn)業(yè)革新的巨大能量。而數(shù)據(jù),則是這股能量的關鍵源泉。自2021年開始,新華三便開始建設AI數(shù)據(jù)集,我們堅信,只有充分挖掘數(shù)據(jù)的潛力,才能推動算法不斷升級,加速產(chǎn)業(yè)突破。新華三積極支持移動研究院數(shù)據(jù)資源開放共享的建設,提供了大量AI數(shù)據(jù)集,充分挖掘數(shù)據(jù)集潛力,期待與大家攜手共同推動數(shù)據(jù)集的落地,助力數(shù)字產(chǎn)業(yè)發(fā)展變革。
未來,中國移動將依托“智慧網(wǎng)絡國家新一代人工智能開放創(chuàng)新平臺”,建設并開放更多優(yōu)質(zhì)網(wǎng)智數(shù)據(jù)集,為我國通信領域智能化技術突破、產(chǎn)業(yè)發(fā)展和通信+AI復合型人才的培養(yǎng)做出更大的貢獻。