當(dāng)前位置: 首頁 > 電力數(shù)字化 > 大數(shù)據(jù)

發(fā)布!乘云數(shù)字參編中國信通院《運(yùn)維智能體(SRE AGENT)能力要求》正式發(fā)布

電力網(wǎng)發(fā)布時(shí)間:2025-07-23 13:22:38


摘要:2025年7月23日,由中國通信標(biāo)準(zhǔn)化協(xié)會(huì)主辦的 “2025可信云大會(huì)” 在京舉行,《運(yùn)維智能體(SRE AGENT)能力要求》標(biāo)準(zhǔn)正式發(fā)布,杭州乘云數(shù)字作為運(yùn)維智能體及可觀測(cè)領(lǐng)域領(lǐng)導(dǎo)者,重點(diǎn)參與了本次報(bào)告的編寫。
 
2025年12月23日,由中國通信標(biāo)準(zhǔn)化協(xié)會(huì)主辦、中國信通院承辦的 “2025可信云大會(huì)-軟件工程智能化分論壇” 在北京中關(guān)村國家自主創(chuàng)新示范區(qū)會(huì)議中心舉行,《運(yùn)維智能體(SRE AGENT)能力要求》正式發(fā)布。杭州乘云數(shù)字作為可觀測(cè)性領(lǐng)域領(lǐng)導(dǎo)者,重點(diǎn)參與了本次報(bào)告的編寫。該標(biāo)準(zhǔn)參與編寫單位包括:中國信息通信研究院、移動(dòng)云、華為云、螞蟻、農(nóng)業(yè)銀行、杭州乘云數(shù)字、小米、神州靈云、農(nóng)商銀行、中電普華、百度、恒為科技、福建移動(dòng)、宜通衡睿、銀信、長三角數(shù)鏈。本標(biāo)準(zhǔn)文件由云計(jì)算開源產(chǎn)業(yè)聯(lián)盟提出并歸口。
 
 
 

報(bào)告介紹

隨著AI技術(shù)、運(yùn)維自動(dòng)化能力的不斷發(fā)展,基于智能體的運(yùn)維能力作為一種高效、自主的新型運(yùn)維工具,能夠?qū)崿F(xiàn)更智能的資源調(diào)度、自動(dòng)化運(yùn)維和精準(zhǔn)的故障預(yù)測(cè),從而降低運(yùn)營成本并提高系統(tǒng)穩(wěn)定性。
本標(biāo)準(zhǔn)規(guī)范了在開展運(yùn)維智能體建設(shè)或度量時(shí),如何指導(dǎo)運(yùn)維場(chǎng)景應(yīng)用、協(xié)同能力構(gòu)建、智能體能力建設(shè)和基智能體底座建設(shè)。
 
本標(biāo)準(zhǔn)同時(shí)適用于服務(wù)商提供的運(yùn)維智能體服務(wù)和運(yùn)維智能體軟件產(chǎn)品,即面向公共用戶提供的運(yùn)維智能體服務(wù)和私有環(huán)境下的軟件產(chǎn)品或解決方案;依據(jù)交付形式的差異,本標(biāo)準(zhǔn)針對(duì)不同的使用場(chǎng)景其技術(shù)指標(biāo)要求略有不同。
 
 
圖1 運(yùn)維智能體(SRE Agent)技術(shù)分級(jí)能力要求框架圖
 
該架構(gòu)以?場(chǎng)景需求為牽引??,通過協(xié)同層打通系統(tǒng)壁壘,以智能體層的感知-決策-行動(dòng)閉環(huán)為核心能力載體,最終由底座提供工程化支撐。四層能力環(huán)環(huán)相扣,既明確了技術(shù)能力邊界,又強(qiáng)調(diào)實(shí)際落地場(chǎng)景的適配性,為企業(yè)構(gòu)建智能運(yùn)維體系提供清晰的模塊化建設(shè)路徑。
  1. 運(yùn)維場(chǎng)景層(頂層)?
    覆蓋智能體服務(wù)的核心業(yè)務(wù)場(chǎng)景,包含:
    ? ?流程管理??:自動(dòng)化運(yùn)維流程執(zhí)行
    ? ?變更管理??:系統(tǒng)變更的智能化控制
    ? ?故障管理??:異常檢測(cè)、根因定位與自愈
    ? ?風(fēng)險(xiǎn)管理??:預(yù)判性監(jiān)控與容錯(cuò)控制
    ? ?運(yùn)維管理??:資源調(diào)度與配置優(yōu)化
    定位:直接對(duì)接企業(yè)實(shí)際運(yùn)維需求,定義智能體價(jià)值出口。
  2. 協(xié)同能力層(承上啟下)?
    支撐智能體在復(fù)雜環(huán)境中的協(xié)作能力:
    ? ?多智能體協(xié)同??:集群任務(wù)分配與聯(lián)動(dòng)作業(yè)
    ? ?跨系統(tǒng)協(xié)同??:對(duì)接CMDB、監(jiān)控系統(tǒng)等第三方平臺(tái)
    ? ?智能體安全??:數(shù)據(jù)加密、權(quán)限控制與行為審計(jì)
    定位:破除系統(tǒng)孤島,確保人-機(jī)-系統(tǒng)安全交互。
  3. 智能體層(核心技術(shù)層,橫向三模塊)?
    ? ?感知能力??:
      - ?運(yùn)維數(shù)據(jù)??(指標(biāo)/日志/鏈路)
      - ?環(huán)境數(shù)據(jù)??(硬件狀態(tài)/網(wǎng)絡(luò)拓?fù)洌?br />  - ?交互數(shù)據(jù)??(用戶指令/反饋)
      (注:多源數(shù)據(jù)融合感知)
    ? ?控制能力??:
      - ?信息理解??:數(shù)據(jù)語義解析與特征提取
      - ?記憶能力??:知識(shí)圖譜構(gòu)建與經(jīng)驗(yàn)存儲(chǔ)
      - ?計(jì)劃能力??:任務(wù)拆解與決策路徑生成
    ? ?行動(dòng)能力??:
      - 自動(dòng)執(zhí)行修復(fù)、擴(kuò)縮容等物理操作
      - 支持工單生成、告警通知等人機(jī)協(xié)同
  4. 智能體底座(基礎(chǔ)設(shè)施)?
    ? ?模型接入??:兼容AI大模型與專業(yè)算法引擎
    ? ?軟件質(zhì)量??:高可用架構(gòu)與性能保障
    ? ?自維護(hù)??:智能體自監(jiān)控、自升級(jí)與故障隔離
作為?國內(nèi)首個(gè)聚焦SRE Agent的專項(xiàng)能力標(biāo)準(zhǔn)??,該報(bào)告具有三大核心價(jià)值:
  1. 統(tǒng)一規(guī)則:? 為產(chǎn)品開發(fā)與評(píng)估提供清晰依據(jù),規(guī)范市場(chǎng)秩序。
  2. 賦能企業(yè):? 指導(dǎo)企業(yè)高效選型和建設(shè)SRE Agent能力,提升運(yùn)維智能化水平。
  3. 引領(lǐng)發(fā)展:? 樹立行業(yè)技術(shù)標(biāo)桿,加速智能運(yùn)維技術(shù)成熟與應(yīng)用創(chuàng)新。

篇章預(yù)覽:

5.3.2故障定位
描述:故障定位是指故障發(fā)生以后能夠采取多種手段找到問題原因。一般故障定位能力分為現(xiàn)象定位、對(duì)象定位、原因定位三種。智能體應(yīng)該與企業(yè)當(dāng)前故障定位能力結(jié)合,在故障處理過程中通過大模型能力快速判斷、整合,從而提升故障定位效率。
1級(jí):應(yīng)具備故障現(xiàn)象定位能力,通過現(xiàn)象關(guān)聯(lián)分析,實(shí)現(xiàn)故障初步定位及影響范圍識(shí)別。
2級(jí):
a) 智能體應(yīng)具備故障對(duì)象定位能力。以及部分故障原因定位能力。
b) 智能體應(yīng)具備結(jié)合多源數(shù)據(jù)進(jìn)行多維度根因分析的能力。
3級(jí):智能體應(yīng)具備精準(zhǔn)分析故障原因與趨勢(shì),輸出處置預(yù)測(cè)報(bào)告的能力
 

乘云數(shù)字運(yùn)維智能體介紹

乘云數(shù)字,作為數(shù)字化可觀測(cè)性領(lǐng)域的領(lǐng)軍企業(yè),持續(xù)專注于可觀測(cè)性、現(xiàn)代AIOps、數(shù)字化經(jīng)營等先進(jìn)產(chǎn)品與技術(shù)的研究與應(yīng)用,深入自主研發(fā),聚焦解決國內(nèi)企業(yè)全面上云帶來的數(shù)字化運(yùn)維、數(shù)字化經(jīng)營的全新挑戰(zhàn)。
憑借在領(lǐng)域的技術(shù)創(chuàng)新與行業(yè)領(lǐng)跑實(shí)力,乘云數(shù)字被評(píng)選為 “國家高新技術(shù)企業(yè)”、“浙江省專精特新企業(yè)”、“浙江省科技型企業(yè)”,并連續(xù)獲得多輪融資。
乘云數(shù)字運(yùn)維智能體引擎,結(jié)合預(yù)測(cè)性、因果關(guān)系和生成式 AI,能夠?qū)崿F(xiàn)分鐘級(jí)的根因定位,利用大模型生成精準(zhǔn)的處建建議,并可在問題對(duì)客戶造成影響之前進(jìn)行預(yù)測(cè)。
 
 

預(yù)測(cè)AI :融合機(jī)器學(xué)習(xí)與多模態(tài)數(shù)據(jù)分析,實(shí)時(shí)處理指標(biāo)、日志、追蹤等運(yùn)維數(shù)據(jù),構(gòu)建動(dòng)態(tài)基線,提前預(yù)警潛在故障(如資源瓶頸、性能衰退),并定位根因、提供修復(fù)建議。通過仿真推演與智能決策,優(yōu)化資源規(guī)劃與發(fā)布策略,降低故障率,推動(dòng)運(yùn)維從“被動(dòng)響應(yīng)”邁向“主動(dòng)預(yù)防”的價(jià)值驅(qū)動(dòng)模式。
因果AI :分析指標(biāo)、日志、追蹤等數(shù)據(jù)間的因果關(guān)系,精準(zhǔn)定位故障根因(如配置錯(cuò)誤、依賴故障),區(qū)分直接與間接誘因,減少誤報(bào)。通過回溯故障傳播路徑、量化影響并推薦修復(fù)方案,助力運(yùn)維從“經(jīng)驗(yàn)猜測(cè)”轉(zhuǎn)向“因果可解釋”的精準(zhǔn)決策,提升故障處理效率與系統(tǒng)穩(wěn)定性。
生成式AI :結(jié)合大語言模型(LLM)與知識(shí)圖譜,實(shí)現(xiàn)基于自然語言的查詢分析、報(bào)告生成、數(shù)據(jù)可視化等能力。通過沉淀歷史經(jīng)驗(yàn)和專家知識(shí),推動(dòng)運(yùn)維自動(dòng)化與知識(shí)高效復(fù)用,提升故障處理與系統(tǒng)優(yōu)化效率。
具體實(shí)現(xiàn)效果可參考閱讀以下內(nèi)容:
databuff與dynatrace 的智能體故障定位能力對(duì)比 https://databuff.com/resourceDetail/blog101



評(píng)論

用戶名:   匿名發(fā)表  
密碼:  
驗(yàn)證碼:
最新評(píng)論0