AI a monitoringban: gyorsabb riasztáskezelés
Al-Nuwaihi Gergő
2026.03.05
Az AI ma már nem „jövőkép”, hanem mindennapi adottság: évek óta velünk van gépi tanulás, mélytanulás, nyelvfeldolgozás vagy gépi látás formájában, az utóbbi években pedig a generatív AI hozott látványos ugrást tartalomautomatizálásban, hatékonyságnövelésben és gyorsabb döntéstámogatásban. A kérdés az IT-üzemeltetésben egyszerű: hogyan fordítható ez kézzelfogható előnnyé a napi hibakezelésben és a monitoring zajának csökkentésében?
Miért kulcs a központi monitoring?
Központi monitoringra szinte minden szervezetnek szüksége van, mert így:
- egy helyen látható az összes rendszer, eszköz és szolgáltatás állapota,
- valós idejű képet ad a működésről,
- támogatja a gyors hibafelismerést és az azonnali riasztásokat,
- hosszabb távon a proaktív üzemeltetés alapja.
Emellett a monitoring nem csak „piros-zöld lámpa”: szolgáltatásmonitoringra és SLA-mérésre, trendanalízisre, jövőtervezésre, valamint integrációkra (pl. CMDB, ticketing, naplógyűjtők) is támaszkodunk.
Zabbix mint alap: stabil, skálázható, rugalmas
A Zabbix kézenfekvő választás, ha teljes körű infrastruktúra-monitoring kell:
- sablon alapú működés (gyors bevezethetőség),
- fejlett vizualizáció és dashboarding,
- skálázható architektúra (front-end/back-end felépítés, proxy funkció),
- gyártó- és platformfüggetlenség,
- agent és agentless megoldások,
- nyílt forráskód, és nagyvállalati környezetre elérhető LTS verzió.
A klasszikus monitoring-feladatok viszont ettől még megmaradnak: rendszerállapot-felügyelet, rendellenességek korai észlelése, riasztások kezelése és priorizálása, incidenskezelés támogatása, teljesítmény- és kapacitásfigyelés.
A kihívás ott kezdődik, amikor a riasztások száma és összetettsége miatt a csapat ideje egyre nagyobb része a „zaj válogatására” megy el.

AI-támogatás a riasztások kezelésének gyorsítására
Az üzemeltetésben két tipikus igény jelenik meg:
- Egyedi riasztások gyors értelmezése és a következő lépések támogatása
- Sok riasztásból a valóban kritikusak kiemelése, hogy legyen fókusz
1) Alert Assist: „mit jelent ez a riasztás, és mit csináljak most?”
Az Alert Assist egy, a Zabbix felületébe beépülő frontend modul, amely nyelvi modellel értelmezi a kiválasztott problémát, és rövid, jól olvasható támogatást ad az operátornak.
A válasz szerkezete kifejezetten üzemeltetési logikát követ:
- Lehetséges kiváltó okok: például szolgáltatásleállás, hálózati elérés/probléma, tűzfal-szűrés, hibás konfiguráció vagy túlterheltség.
- Ellenőrző lépések parancsokkal: javasolt parancsok/ellenőrzések, amelyekkel gyorsan validálható a gyanú.
- Javasolt intézkedési sorrend: mit érdemes először megnézni, mit lehet azonnal kizárni.
- Megelőzési javaslatok: hogyan csökkenthető annak esélye, hogy a hiba ismét felbukkanjon.
A cél nem az, hogy „hosszú esszét” kapjon a csapat, hanem hogy a napi operátori munkához szükséges döntési pontok gyorsabban meglegyenek – különösen hasznos ez betanulásnál, junior kollégáknál, vagy amikor a tudás szétszórtan létezik.

2) Priority Manager: amikor 10–20 oldalnyi riasztásból kell 5-re fókuszálni
Nagyobb, produktív környezetben tipikus, hogy a monitoring „tele van” eseménnyel. Ilyenkor a legnehezebb kérdés az, hogy mi igényel azonnali beavatkozást.
A Priority Manager egy, a felületbe illeszkedő komponens, amely az összes aktív problémát halmazként vizsgálja, majd nyelvi modell (és opcionálisan belső tudás) alapján rangsorolja a legkritikusabbakat.
A gyakorlatban ez azt jelenti, hogy:
- egy Top N lista jön létre (konfigurálható: 5/10/15 stb.),
- minden tételhez látszik a probléma típusa és az érintett környezet,
- a listában szereplő problémákra külön is kérhető javasolt intézkedés, magyarul megfogalmazva,
- lehet szűrni a válasz hosszára, illetve áttekinteni a riasztások történetét,
- és azonos jellegű problémák csoportosítva is megjelenhetnek (nem csak „szerverenként” szemlélve a helyzetet).
A hozzáadott érték itt az, hogy a csapat gyorsan rátalál a „valódi tűzre”, és a monitoringból érkező zaj kezelhetőbbé válik.

Technikai háttér: rugalmas modellválasztás, kontrollált adatkitettség
Mindkét megoldásnál fontos szempont, hogy a szervezetek eltérően állnak a felhős AI-hoz. Emiatt a kialakítás két irányt is támogat:
- On-prem futtatás: HPE GPU-s szerverrel, helyi modellekkel (pl. ollama/localai).
- Felhős LLM: igény szerint több szolgáltató API-ja felé (pl. OpenAI, Google, Amazon, Microsoft).
Gyakorlati, üzemeltetési szempontból különösen lényeges a kontroll:
- a szenzitív infrastruktúra-azonosítók (például szervernevek, IP-k) nem feltétlenül kerülnek ki a modell felé; a megközelítés anonimizálást alkalmazhat,
- a válasz minőségét pedig szándékosan kialakított system prompt segíti: rövid, operátori fókuszú, és a téves „túlköltés” (hallucináció) minimalizálására törekszik.
A rangsorolás oldala workflow-alapú automatizációként is felépíthető (nem script-ekre építve), így jól kiegészíthető belső tudással, szabályokkal és szervezeti sajátosságokkal.
Üzemeltetési előnyök: gyorsabb reakció, kisebb teher, kevesebb „zaj”
Az AI-val támogatott monitoring legfontosabb kézzelfogható előnyei:
- Gyorsabb riasztáskezelés: fókusz a kritikusokra, kevesebb idő a válogatáson.
- Üzemeltetők tehermentesítése: a rutinkörök és az első vizsgálatok egyszerűsödnek.
- L1/helpdesk szint erősítése: az AI-asszisztens támogatásával több hiba ellenőrizhető magasabb szintű eszkaláció nélkül.
- „Shadow AI” kockázat csökkentése: ha a kollégák amúgy is AI-t használnak, érdemes kontrollált, szervezeti keretek közé terelni, mit és hogyan adunk át a modellnek.
Jövőkép: agentic működés és „beszélgetés” a monitoringgal
A következő lépcső nem csak a javaslatokban van, hanem az agentic irányban: amikor a rendszer nem csupán magyaráz, hanem bizonyos, szabályozott lépésekben végre is hajt feladatokat (például ismétlődő, alacsony kockázatú teendők automatizálása, vagy a riasztások historikus értelmezése alapján a zaj csökkentése).
Ezzel párhuzamosan megjelenik az igény arra is, hogy ne csak „kattintgassuk” a felületet: egy MCP (Modell Context Protocol) szerver koncepciója azt célozza, hogy a monitoringhoz természetes nyelven lehessen kapcsolódni – ami a tanulási görbét is rövidítheti, különösen olyan eszközöknél, amelyeknél gyakori visszajelzés a komplex kezelhetőség.