Hüppa põhisisu juurde Hüppa navigatsiooni juurde Hüppa jaluse juurde
Piiratud aja jooksul: Disainipartneri programm — BUSINESS pakett eluaegselt

Jälgimine

Jälgige masina tervist, konteinereid, teenuseid, hoidlaid ning käivitage diagnostikat.

Jälgimine

Rediacc pakub sisseehitatud jälgimiskäske masina tervise, töötavate konteinerite, teenuste, hoidlate oleku ja süsteemi diagnostika kontrollimiseks.

Masina tervis

Hankige masina kohta põhjalik terviseraport:

rdc machine health --name server-1

See raporteerib:

  • Süsteem: tööaeg, ketta kasutus, andmehoidla kasutus
  • Konteinerid: töötavate, tervete, ebatervete arv
  • Salvestus: SMART tervise olek
  • Probleemid: tuvastatud probleemid

Kasutage --output json masinloetava väljundi jaoks.

Konteinerite loetlemine

Vaadake kõiki töötavaid konteinereid kõikides hoidlates masinal:

rdc machine containers --name server-1
VeergKirjeldus
NameKonteineri nimi
StatusTööaeg või väljumispõhjus
StateTöötab, väljunud jne
HealthTerve, ebaterve, puudub
CPUCPU kasutuse protsent
MemoryMälukasutus / piirang
RepositoryMilline hoidla omab konteinerit

Valikud:

  • --health-check, Teosta aktiivseid tervisekontrolle konteineritele
  • --output json, Masinloetav JSON-väljund

JSON-väljund sisaldab täielikke konteineri üksikasju (labels, port_mappings, image, id) koos repository (lahendatud nimi), repository_guid (algne GUID), domain ja autoRoute väljadega.

Teenuste loetlemine

Vaadake Rediacciga seotud systemd teenuseid masinal:

rdc machine services --name server-1
VeergKirjeldus
NameTeenuse nimi
StateAktiivne, mitteaktiivne, nurjunud
Sub-stateTöötab, surnud jne
RestartsTaaskäivituste arv
MemoryTeenuse mälukasutus
RepositorySeotud hoidla

Valikud:

  • --stability-check, Märgi ebastabiilsed teenused (nurjunud, >3 taaskäivitust, automaatne taaskäivitus)
  • --output json, Masinloetav JSON-väljund

JSON-väljund sisaldab täielikke teenuse üksikasju koos repository (lahendatud nimi) ja repository_guid (algne GUID) väljadega.

Hoidlate loetlemine

Vaadake hoidlaid masinal koos üksikasjalike statistikatega:

rdc machine repos --name server-1
VeergKirjeldus
NameHoidla nimi
SizeKettapildi suurus
MountÜhendatud või lahti ühendatud
DockerDockeri deemon töötab või peatunud
ContainersKonteinerite arv
Disk UsageTegelik ketta kasutus hoidlas
ModifiedViimane muutmisaeg

Valikud:

  • --search <text>, Filtreeri nime või ühendamistee järgi
  • --output json, Masinloetav JSON-väljund

JSON-väljund sisaldab name (lahendatud) ja guid (algne GUID) ning pesastab iga hoidla containers (koos domain, autoRoute, repository/repository_guid väljadega) ja services massiivid.

Salvestuse tervis

Kontrollige BTRFS-i fragmentatsiooni ja reflink’i jagamist kõikides hoidlates masinal:

rdc machine query --name server-1 --storage-health
VeergKirjeldus
SizeLUKS-pildifaili suurus (kuidas hoidla välja näeb)
UniqueTegelik unikaalne andmemaht, mis kuulub ainult sellele hoidlale
SharedAndmeplokid, mida taaskasutatakse hoidlate vahel BTRFS-i reflink’ide kaudu (tasuta koopiad)
ExtentsFaililaiendite arv (kõrgem = rohkem fragmenteeritud)
FragFragmentatsioonitase: madal, mõõdukas või kõrge

Kokkuvõte näitab BTRFS-i reflink’idest saadud säästu kokku:

14 repos, 224.3 GB virtual size
Unique data: 323.7 MB | Shared: 224.0 GB | Efficiency: 99.9%
  • Virtuaalne suurus on kõikide hoidla pildisuuruste summa. See on see, kuidas hoidlad välja näevad, kuid see loeb topelt reflink’ide kaudu jagatud plokke.
  • Unikaalsed andmed on tegelik salvestusruum, mida tarbivad hoidla andmed, mis eksisteerivad ainult ühes hoidlas. See on see, mida vabastaksite hoidla kustutamisel.
  • Jagatud on andmed, mida taaskasutatakse hoidlate vahel BTRFS-i reflink’ide kaudu. Hoidla hargnemine loob reflink’i koopiad, mis jagavad plokke, kuni kumbki pool kirjutab uusi andmeid, mille tulemusel plokid lahknevad.
  • Efektiivsus on reflink’ide kaudu taaskasutatud andmete protsent. Kõrgem on parem. Masin, millel on palju hargnemisi samalt vanemalt, näitab lähedal-100% efektiivsust.

Hoidlad, millel on kõrge fragmentatsioon ja null jagatud plokke, saab turvaliselt defragmenteerida btrfs filesystem defragment abil. Hoidlaid, millel on jagatud plokid, ei tohiks defragmenteerida, kuna defrag asendab jagatud plokid unikaalsete koopiatega, suurendades ketta kasutust.

Skaneerimine töötab paralleelselt ja võtab 5—15 sekundit sõltuvalt hoidlate arvust ja suurusest. Kui --storage-health ei ole täpsustatud, ilmub päringuväljundi järel üherealise vihje meeldetuletusena.

BTRFS-i skrubb

Rediacc planeerib automaatselt iganädalase BTRFS-i skrubimise igal masinal. Skrubb loeb iga andmeploki andmehoidlas, kontrollib kontrollsummasid ja raporteerib igasuguse riknemise. See tabab vaikse andmete riknemise (bitrot) enne, kui see levib varukoopiatesse ja hargnemistesse.

Skrubb töötab igal pühapäeval kell 02:00 kohalikus ajas (masina ajavöönd) koos juhusliku viivitusega kuni 1 tund. See töötab madalaimal I/O prioriteedil (ionice idle, nice 19), nii et see ei häiri töötavaid teenuseid. SSD-toega masinatel oodake ligikaudu 8 minutit 100 GB andmehoidla kohta.

Skrubimise taimer installitakse automaatselt esimesel deemoni käivitusel pärast reneti uuendust. Kui skrubimispoliitika muutub tulevases reneti versioonis, uuendab see end järgmisel deemoni käivitusel ilma kasutaja sekkumiseta.

Skrubimise olek

Viimase skrubimise tulemus salvestatakse väljaspool BTRFS-i mahtu (aadressil /var/lib/rediacc/scrub-last-result.json), nii et see jääb loetavaks isegi kui mahul on probleeme. rdc machine query --system väljund sisaldab välja scrub_status:

"scrub_status": {
  "last_run_human": "3 days ago",
  "status": "ok",
  "total_errors": 0,
  "uncorrectable": 0,
  "duration_seconds": 312
}
OlekTähendus
okViimane skrubb lõpetati vigadeta
never_runSkrubimist pole veel toimunud (taimer installiti just)
overdueViimane skrubb oli rohkem kui 14 päeva tagasi
errors_foundSkrubb leidis kontrollsumma mittevastavusi (kontrollige total_errors ja uncorrectable arve)
failedSkrubimise protsess väljus nullist erineva koodiga

Kui uncorrectable on suurem kui null, ei saa mõjutatud plokke automaatselt parandada (ühe kettaga BTRFS-il pole redundantset koopiat). Taastage mõjutatud hoidla viimasest varukoopia versioonist.

Käsitsi skrubb

Skrubimise koheseks käivitamiseks (nt pärast toitekatkestust või ketta migreerimist):

rdc term connect -m server-1 -c "sudo renet maintenance scrub --datastore /mnt/rediacc"

Tulemus salvestatakse samasse JSON-faili ja on koheselt nähtav järgmises rdc machine query --system väljundis.

Vault’i olek

Hankige masina täielik ülevaade koos juurutusteabega:

rdc machine vault-status --name server-1

See annab:

  • Hostinimi ja tööaeg
  • Mälu-, ketta- ja andmehoidla kasutus
  • Hoidlate koguarv, ühendatud arv, Dockeri töötav arv
  • Üksikasjalik teave hoidla kaupa

Kasutage --output json masinloetava väljundi jaoks.

Ühenduse testimine

Ainult pilveadapter. Lokaalse adapteri korral kasutage rdc term connect -m server-1 -c "hostname" ühenduvuse kontrollimiseks.

Kontrollige SSH-ühenduvust masinaga:

rdc machine test-connection --ip 203.0.113.50 --user deploy

Raporteerib:

  • Ühenduse olek (edukas/ebaõnnestunud)
  • Kasutatud autentimismeetod
  • SSH-võtme konfiguratsioon
  • Avaliku võtme juurutuse olek
  • Teadaolevate hostide kirje

Valikud:

  • --port <number>, SSH-port (vaikimisi: 22)
  • --save -m server-1, Salvesta kontrollitud hosti võti masina konfiguratsiooni

Diagnostika (doctor)

Käivitage põhjalik diagnostikakontroll oma Rediacc keskkonnale:

rdc doctor
KategooriaKontrollid
KeskkondNode.js versioon, CLI versioon, SEA režiim, Go installatsioon, Dockeri kättesaadavus
RenetBinaarifail asukoht, versioon, CRIU, rsync, SEA manustatud varad
KonfiguratsioonAktiivne konfiguratsioon, adapter, masinad, SSH-võti
VirtualiseerimineKontrollib, kas teie süsteem saab käitada kohalikke virtuaalmasinaid (rdc ops)

Iga kontroll raporteerib OK, Hoiatus või Tõrge. Kasutage seda esimese sammuna igasuguse probleemi tõrkeotsinguks.

Väljumiskoodid: 0 = kõik läbisid, 1 = hoiatused, 2 = tõrked.