Backup e Ripristino

Rediacc esegue il backup dei repository cifrati su storage esterno e li ripristina sulla stessa o su una macchina diversa. I backup sono cifrati; per il ripristino è necessaria la credenziale LUKS del repository.

Configurare lo Storage

Prima di inviare i backup, registra un provider di storage. Rediacc supporta qualsiasi storage compatibile con rclone: S3, B2, Google Drive e molti altri.

Importa da rclone

Se hai già un remote rclone configurato:

rdc config storage import --file rclone.conf

Riferimento CLI: rdc config storage import

Questo importa le configurazioni di storage da un file di configurazione rclone nella configurazione corrente. Tipi supportati: S3, B2, Google Drive, OneDrive, Mega, Dropbox, Box, Azure Blob e Swift.

Visualizza gli Storage

rdc config storage list

Riferimento CLI: rdc config storage list

Invia un Backup

Invia il backup di un repository allo storage esterno:

rdc repo push --name my-app -m server-1 --to my-storage

Riferimento CLI: rdc repo push

Il backup finisce nella cartella hot/ dello storage quando il repository è montato al momento dell’invio, e in cold/ quando non è montato. Questo è lo stesso layout dei backup pianificati, quindi rdc repo backup list mostra tutti i backup in un’unica tabella.

Opzione	Descrizione
`--to <storage>`	Posizione dello storage di destinazione
`--to-machine <machine>`	Macchina di destinazione per il backup da macchina a macchina
`--dest <filename>`	Nome file di destinazione personalizzato
`--checkpoint`	Crea un checkpoint CRIU prima dell’invio (per container con etichetta `rediacc.checkpoint=true`). La destinazione si ripristina automaticamente su `repo up`
`--force`	Sovrascrive un backup esistente
`--bwlimit <limit>`	Limite di banda per il trasferimento rsync (ad es. `10M`, `500K`)
`--tag <tag>`	Etichetta il backup
`-w, --watch`	Monitora il progresso dell’operazione
`--debug`	Abilita l’output dettagliato
`--skip-router-restart`	Salta il riavvio del route server dopo l’operazione

Scarica / Ripristina un Backup

Scarica il backup di un repository dallo storage esterno:

rdc repo pull --name my-app -m server-1 --from my-storage

Riferimento CLI: rdc repo pull

Il download verifica sempre che il repository di destinazione sia montato prima di scrivere. Se non è montato, l’operazione viene interrotta.

Opzione	Descrizione
`--from <storage>`	Posizione dello storage sorgente
`--from-machine <machine>`	Macchina sorgente per il ripristino da macchina a macchina
`--force`	Sovrascrive il backup locale esistente
`--bwlimit <limit>`	Limite di banda per il trasferimento rsync (ad es. `10M`, `500K`)
`-w, --watch`	Monitora il progresso dell’operazione
`--debug`	Abilita l’output dettagliato
`--skip-router-restart`	Salta il riavvio del route server dopo l’operazione

Elenca i Backup

Visualizza i backup disponibili in una posizione di storage:

rdc repo backup list --from my-storage -m server-1

Riferimento CLI: rdc repo backup list

L’output è una tabella unificata che unisce entrambe le cartelle dei backup pianificati (hot/ e cold/) in modo da vedere ogni backup in un’unica vista:

Colonna	Significato
`Mode`	`hot` o `cold`. In quale cartella di backup pianificato si trova questa voce
`Name`	Nome del repository risolto dalla configurazione locale (fallback al GUID per i repository non in configurazione)
`GUID`	Il GUID del repository su disco
`Size`	Dimensione leggibile del file di backup
`Modified`	Timestamp UTC dal backend di storage

Per approfondire una singola modalità, passare --path:

rdc repo backup list --from my-storage -m server-1 --path hot
rdc repo backup list --from my-storage -m server-1 --path cold

Riferimento CLI: rdc repo backup list

Layout dello storage

I backup pianificati finiscono in sottocartelle per modalità all’interno della cartella configurata dello storage, in modo che lo stesso storage ospiti in modo ordinato sia lo stream orario che quello settimanale senza mescolarli:

<bucket>/<folder>/
├── hot/
│   ├── <guid-1>
│   ├── <guid-2>
│   └── ...
└── cold/
    ├── <guid-1>
    ├── <guid-3>
    └── ...

Un repository può apparire sia in hot/ che in cold/ (lo schedule orario ne crea uno snapshot; lo schedule settimanale ne crea un altro). L’elenco unificato mostra entrambe le righe in modo che sia chiaro quali stream coprono quali repository.

Sincronizzazione Massiva

Invia o scarica tutti i repository contemporaneamente:

Invia Tutti allo Storage

rdc repo push --to my-storage -m server-1

Riferimento CLI: rdc repo push

Scarica Tutti dallo Storage

rdc repo pull --from my-storage -m server-1

Riferimento CLI: rdc repo pull

Opzione	Descrizione
`--to <storage>`	Storage di destinazione (direzione push)
`--from <storage>`	Storage sorgente (direzione pull)
`--repo <name>`	Sincronizza repository specifici (ripetibile)
`--override`	Sovrascrive i backup esistenti
`--debug`	Abilita l’output dettagliato
`--skip-router-restart`	Salta il riavvio del route server dopo l’operazione

Backup Pianificati

Rediacc usa strategie di backup con nome. Ogni strategia definisce uno schedule, una modalità di backup, un limite di banda opzionale e filtri sui file. Le macchine fanno riferimento alle strategie per nome per determinare quali backup eseguire su di esse.

Modalità di Backup

Modalità	Comportamento	Downtime
`hot`	Snapshot BTRFS effettuato mentre i servizi sono in esecuzione (crash-consistent)	Nessuno
`cold`	Servizi fermati, snapshot effettuato, servizi riavviati, snapshot caricato (app-consistent)	Finestra di stop+start per repository, parallelizzata tra i repository. Vedere “Stima del Downtime del Backup Cold” di seguito.

Usare hot per i servizi che tollerano snapshot crash-consistent. Usare cold quando si ha bisogno di consistenza garantita e si può accettare un breve riavvio.

Semantica del Backup Cold

Un backup cold viene eseguito in tre fasi per ogni repository incluso: stop > snapshot > start. Capire dove finiscono le garanzie aiuta gli operatori a individuare precocemente i fallimenti parziali.

Cosa garantisce il backup cold:

Prima dello snapshot, ogni container in esecuzione in ogni repository incluso viene fermato correttamente tramite l’hook down() del Rediaccfile e il daemon Docker per repository viene quiescito. Lo snapshot è quindi application-consistent, non meramente crash-consistent.
L’insieme degli ID container in esecuzione prima dello snapshot viene persistito in un sidecar in /var/run/rediacc/cold-backup-<guid>.running.json. Questo è la fonte di verità per “cosa deve essere attivo quando abbiamo finito”.
Dopo lo snapshot, l’hook up() del Rediaccfile del repository viene richiamato per ripristinare lo stack compose completo.
Un sidecar di stato per esecuzione in /var/run/rediacc/cold-backup-<guid>.status.json registra la fase, il risultato ed eventuali errori di ogni tentativo.

Cosa NON garantisce il backup cold:

up() è best-effort. Può fallire per ragioni al di fuori del controllo del backup cold (una condizione depends_on: service_healthy ancora in attesa, un errore di sintassi nel file compose, un errore di rete transitorio durante il pull di un’immagine). Quando fallisce, il backup cold registra l’errore a livello di errore, scrive il sidecar di stato e passa al repository successivo.
Quando up() fallisce, si attiva un riavvio diretto di fallback: il sidecar dei container in esecuzione viene letto e ogni ID container registrato viene riavviato tramite l’API Docker diretta (senza compose). Questo riporta i servizi su anche se il flusso compose ha un problema, sebbene senza rieseguire alcun hook del Rediaccfile.
Se anche il fallback fallisce per alcuni ID container (ad esempio, il daemon Docker stesso è down), il sidecar viene lasciato in posizione in modo che il watchdog del router possa continuare a riprovare a ogni tick.

Recupero del watchdog: a ogni tick, il watchdog controlla la presenza di un running-sidecar. Qualsiasi ID container elencato che è attualmente fermo viene riavviato, indipendentemente dalla restart_policy salvata del container. Ciò significa che i servizi con restart: on-failure (che Docker NON riavvierebbe dopo uno stop pulito) tornano comunque attivi dopo un backup cold. Una volta che ogni container elencato è in esecuzione, il sidecar viene eliminato.

Come gli operatori rilevano i fallimenti:

rdc machine query --name <machine> --containers mostra lo stato di esecuzione. Confrontare con il set atteso.
/var/run/rediacc/cold-backup-<guid>.status.json sulla macchina. Ispezionare tramite rdc term connect -m <machine> -r <repo> -c "cat /var/run/rediacc/cold-backup-$GUID.status.json". success: false con un startedAt obsoleto significa che l’ultimo backup non è stato completato in modo pulito.
I log dell’esecuzione del backup di renet (journalctl -u renet-* o l’invocazione diretta rdc machine backup schedule) emettono una riga di riepilogo finale della forma Cold backup: post-snapshot restart summary total=N compose_ok=N fallback_ok=N failed=N failed_repos=[...]. Un failed_repos non vuoto è il target di grep.

Stima del Downtime del Backup Cold

Ogni repository è fermo solo per la propria finestra down() + up(). Su un host caldo questi sono tipicamente:

Dimensione repository	Stop+start tipico
Piccolo (1-2 container, nessun DB)	5-15 s
Medio (web app + cache)	20-45 s
Pesante (DB + queues + mail)	60-120 s

Il passo di snapshot (btrfs subvolume snapshot -r) è O(1) indipendentemente dalla dimensione del repository: 0,1-1 s. Un repository non rimane fermo per gli snapshot degli altri repository. L’uploader poi gira su uno snapshot in sola lettura mentre ogni repository è già tornato attivo.

Il tempo totale di esecuzione dipende da quanti repository si riavviano in modo concorrente. Renet lo deriva dall’host:

concurrency = min(repoCount, max(2, NumCPU/2), 8)

Esempi:

Host	Repository	Concorrenza	Riavvio wall-clock
VM 4 CPU	5 repository, media 30 s ciascuno	2	~75 s
Server 16 CPU	10 repository, media 40 s ciascuno	8	~80 s
Nodo fleet 64 CPU	50 repository, media 40 s ciascuno	8	~4 min

Override tramite env: impostare REDIACC_COLD_BACKUP_CONCURRENCY=N nell’ambiente del servizio di backup (un drop-in systemd è il modo comune) per fissare un valore specifico. =1 forza riavvii strettamente seriali, utile per il debug di un crashloop nell’hook up() di un repository.

Se si gestisce un repository sensibile alla latenza (web app pubblica, mail), il suo downtime è delimitato dal proprio stop+start (tipicamente 30-90 s), non dalla durata totale dell’esecuzione. I repository vengono assegnati agli slot di concorrenza nell’ordine in cui sono stati scoperti; non esiste una coda con priorità. Suddividere i repository pesanti nelle proprie strategie con scope --exclude se si ha bisogno di una pianificazione più granulare.

Backup di Lunga Durata e Schedule Sovrapposti

Un backup cold che richiede più tempo del proprio intervallo di schedule (ad esempio, un primo seed di un repository da 500 GB su un link modesto può legittimamente richiedere più di 24 ore, durante le quali il timer notturno si attiva di nuovo) non mette in coda né avvia una seconda esecuzione. L’unità systemd Type=oneshot è a istanza singola: quando il timer si attiva e il servizio è già activating, systemd unisce l’avvio nel job esistente. Nessun nuovo processo viene avviato, nessuna esecuzione viene messa in coda per dopo.

In concreto, un’esecuzione che inizia lunedì alle 03:00 UTC e finisce giovedì a mezzogiorno:

Giorno	Attivazione 03:00 UTC	Risultato
Lunedì	Prima attivazione	L’esecuzione inizia
Martedì	Seconda attivazione	Scartata silenziosamente (l’esecuzione precedente è ancora attiva)
Mercoledì	Terza attivazione	Scartata silenziosamente (l’esecuzione precedente è ancora attiva)
Giovedì	L’esecuzione finisce a mezzogiorno	Nessun recupero; la prossima esecuzione è venerdì alle 03:00 UTC

La direttiva Persistent=true del timer non salva queste attivazioni. Persistent=true riproduce le attivazioni mancate perché il timer stesso era inattivo (sistema spento, timer disabilitato). Le attivazioni scartate perché il servizio era occupato sono perdute.

Questo comportamento predefinito è deliberato. Eseguire due backup cold in parallelo sullo stesso datastore causerebbe contesa sul percorso dello snapshot BTRFS, sul remote rclone e sui sidecar per repository in /var/run/rediacc/cold-backup-<guid>.status.json. La serializzazione dietro un’istanza a lunga esecuzione è il risultato sicuro.

Implicazione per il monitoraggio. Un backup bloccato (ad esempio, rclone inceppato su un blackhole di rete) scarta silenziosamente ogni attivazione successiva del timer. Lo scheduler non emette alcun allarme. Controllare systemctl show <unit> -p ActiveEnterTimestamp: se il servizio è in activating da più tempo del previsto (ad esempio, più di 48 ore su un timer notturno), investigare.

Se si ha bisogno che ogni attivazione pianificata venga eseguita, cambiare il timer da OnCalendar=<cron> a OnUnitInactiveSec=<interval>. Questo si attiva N ore dopo il completamento dell’esecuzione precedente anziché su uno schedule fisso, quindi le esecuzioni lunghe non causano scartamenti. Spostano semplicemente la prossima esecuzione più avanti. Il compromesso è lo slittamento dello schedule: il tuo notturno alle 03:00 diventa “24 ore dopo la fine dell’ultimo”.

Snapshot, Interruzioni e Spazio nel Pool

Ogni push opera da uno snapshot momentaneo del datastore, quindi i dati caricati sono coerenti anche mentre i repository continuano a scrivere. Mentre il backup è in esecuzione, quello snapshot continua a fare riferimento a ogni blocco che condivide con i repository attivi: eliminazioni e trim liberano meno spazio nel pool finché il ciclo non termina e lo snapshot viene eliminato. Il report sulla salute dello storage mostra quanto spazio gli snapshot di backup stanno attualmente bloccando.

Le interruzioni sono sicure. Fermare il servizio (o riavviare la macchina) fa sì che il backup interrompa il trasferimento ed elimini il suo snapshot prima di uscire; la prossima esecuzione pianificata riprende da dove si era fermata, poiché i file non modificati vengono saltati tramite checksum. Se il processo viene terminato in modo troppo brusco per poter fare pulizia (perdita di alimentazione), lo snapshot orfano viene rilevato e rimosso automaticamente dal gestore dello storage entro pochi minuti.

Definire una Strategia

Il default canonico è una divisione in due strategie: uno stream hot orario veloce che cattura ogni repository e uno stream cold settimanale più lento che crea snapshot app-consistent. Le due strategie scrivono in sottocartelle di storage diverse (hot/ e cold/) in modo che i backup non si mescolino mai.

rdc config backup-strategy set \
  --name hourly-hot \
  --destination my-storage \
  --cron "0 * * * *" \
  --mode hot \
  --bwlimit 20M \
  --enable

Riferimento CLI: rdc config backup-strategy set

rdc config backup-strategy set \
  --name weekly-cold \
  --destination my-storage \
  --cron "15 3 * * 0" \
  --mode cold \
  --exclude very-large-repo \
  --enable

Riferimento CLI: rdc config backup-strategy set

Il filtro --exclude sulla strategia cold è la via d’uscita consigliata per i repository molto grandi che non rientrano nella finestra di manutenzione settimanale. La strategia hot oraria li copre comunque; cold li salta semplicemente. I nomi dei repository in --exclude corrispondono al nome del repository nella configurazione locale (senza :tag).

Opzione	Descrizione
`--name <name>`	Nome della strategia (usato per l’associazione alla macchina)
`--destination <storage>`	Provider di storage su cui caricare
`--cron <expression>`	Espressione cron (ad es. `"0 2 * * *"` per ogni giorno alle 2:00)
`--mode <hot\|cold>`	Modalità di backup
`--bwlimit <limit>`	Limite di banda per i caricamenti (ad es. `10M`)
`--include <pattern>`	Filtro di inclusione (ripetibile)
`--exclude <pattern>`	Filtro di esclusione (ripetibile)
`--enable` / `--disable`	Abilita o disabilita la strategia

Visualizza le Strategie

rdc config backup-strategy list
rdc config backup-strategy show --name weekly-cold

Riferimento CLI: rdc config backup-strategy list · rdc config backup-strategy show

Rimuovi una Strategia

rdc config backup-strategy remove --name weekly-cold

Riferimento CLI: rdc config backup-strategy remove

Associa le Strategie a una Macchina

Nella tua configurazione, associa uno o più nomi di strategia a una macchina:

{
  "machines": {
    "hostinger": {
      "backupStrategies": ["hourly-hot", "weekly-cold"]
    }
  }
}

Il binding è solo configurazione locale. Definire una strategia e collegarla a una macchina non modifica la macchina. Esegui rdc machine backup schedule -m <machine> (vedi Distribuisci lo Schedule sulla Macchina) per distribuire i timer systemd, e rilancialo dopo ogni modifica di strategia o binding.

Scegliere tra Hot e Cold e il filtraggio per repository

Hot vs cold in sintesi

	Hot	Cold
Consistenza	Crash-consistent (snapshot BTRFS durante l’esecuzione)	Application-consistent (stop > snapshot > start)
Downtime	Nessuno	Finestra di stop+start per repository (tipicamente 5-120 s)
Frequenza adatta	Alta (ad es. oraria)	Bassa (ad es. giornaliera o settimanale)
Uso tipico	Rete di sicurezza ad alta frequenza	Backup pianificato con consistenza garantita

Hot è il default corretto per le esecuzioni ad alta frequenza. I servizi continuano a girare mentre lo snapshot viene effettuato, quindi la finestra di backup non interrompe gli utenti. Lo snapshot è crash-consistent: equivale a quello che si otterrebbe dopo uno spegnimento non pulito. Per la maggior parte dei database moderni e delle code di messaggi questo è accettabile.

Cold è appropriato quando si ha bisogno di uno snapshot application-consistent garantito e si può accettare un breve riavvio per repository. I servizi vengono fermati prima dello snapshot e riavviati prima che inizi il caricamento, quindi un caricamento lento o fallito non prolunga mai la finestra di downtime. Vedere Semantica del Backup Cold per il modello di garanzia completo.

Filtraggio dei repository per strategia

Ogni strategia può avere filtri --include e --exclude. I nomi di repository che corrispondono a un pattern --exclude vengono saltati per quella strategia; --include limita l’esecuzione solo a quei nomi. I filtri corrispondono al nome del repository nella configurazione locale (senza :tag).

# Strategia hot: backup di tutto ogni ora
rdc config backup-strategy set \
  --name hourly-hot \
  --destination my-storage \
  --cron "0 * * * *" \
  --mode hot \
  --bwlimit 6M \
  --enable

# Strategia cold: backup di tutto ogni settimana, escludendo il dataset derivato di grandi dimensioni
rdc config backup-strategy set \
  --name weekly-cold \
  --destination my-storage \
  --cron "15 3 * * 0" \
  --mode cold \
  --exclude analytics-demo \
  --enable

Riferimento CLI: rdc config backup-strategy set

Quando escludere un repository dalla strategia hot ad alta frequenza

Escludi un repository dall’esecuzione ad alta frequenza quando:

Il repository è grande e completamente rigenerabile dai dati sorgente già presenti nel volume, quindi ogni backup orario spreca banda significativa senza aggiungere valore di recupero significativo.
L’esecuzione del backup supererebbe il proprio intervallo di schedule alla velocità di caricamento disponibile.

Esempio. Un repository analytics-demo contiene circa 114 GB di tabelle Postgres derivate che possono essere completamente ricostruite dai file di dump CSV grezzi già memorizzati all’interno dello stesso volume. Con un limite di caricamento di 6 MB/s, un singolo backup hot di quel repository richiede oltre 5 ore. Eseguirlo ogni ora significa che ogni esecuzione è ancora in corso quando parte quella successiva, il che causa lo scarto silenzioso di ogni esecuzione successiva (vedere Backup di Lunga Durata e Schedule Sovrapposti). Escluderlo da hourly-hot e mantenerlo in weekly-cold significa che viene eseguito il backup una volta alla settimana invece di mai.

Se i dati sono puramente rigenerabili, considera se è necessario eseguirne il backup. Un’alternativa è eseguire il backup solo degli input sorgente grezzi (i dump CSV, in questo esempio) e saltare la copia derivata del tutto. Un backup cold settimanale degli input sorgente è molto più piccolo e completamente sufficiente per il recupero.

I repository non esclusi da nessuna delle due strategie appaiono in entrambe le sottocartelle di storage hot/ e cold/. L’output unificato di rdc repo backup list mostra entrambe le righe in modo da poter verificare quali stream coprono quali repository.

Operazioni di Backup

Distribuisci lo Schedule sulla Macchina

Invia le strategie associate a una macchina come timer systemd:

rdc machine backup schedule -m server-1
rdc machine backup schedule -m server-1 --dry-run

Riferimento CLI: rdc machine backup schedule

La distribuzione è un riconciliatore di stato. Legge i file unit correnti e lo stato systemd sulla macchina, li confronta con ciò che la configurazione produrrebbe (SHA-256 per file) e tocca solo le unit il cui contenuto è effettivamente cambiato. La riesecuzione senza modifiche alla configurazione è una no-op: nessuna scrittura, nessun daemon-reload, nessun cambio di timer.

--dry-run stampa il piano per ogni strategia (created, updated (service, timer, env), unchanged, removed) senza toccare la macchina. Combinare con --debug per stampare anche i corpi delle unit generate; i token rclone sono redatti.

Se un backup è attualmente in esecuzione per una strategia che si sta per aggiornare o rimuovere, la distribuzione fallisce rapidamente con un suggerimento di annullarlo o di passare --force. Con --force, l’invocazione in esecuzione mantiene la propria unit in memoria e la nuova configurazione si applica al prossimo tick del timer, quindi il backup in esecuzione non viene mai interrotto.

--reset-failed è opt-in. Se passato, cancella lo stato di fallimento di systemd sui servizi toccati dopo una distribuzione riuscita. Disabilitato per impostazione predefinita affinché i segnali di fallimento precedenti rimangono visibili agli alert.

Esegui un Backup Ora

Attiva un backup immediatamente senza attendere il timer. Funziona anche se non sono stati distribuiti timer, usando systemd-run per l’esecuzione ad-hoc:

rdc machine backup now -m server-1
rdc machine backup now -m server-1 --strategy weekly-cold

Riferimento CLI: rdc machine backup now

Visualizza lo Stato del Backup

Mostra lo stato corrente dei timer di backup e i risultati dei job recenti:

rdc machine backup status -m server-1
rdc machine backup status -m server-1 --strategy hourly-hot

Riferimento CLI: rdc machine backup status

Annulla un Backup in Esecuzione

rdc machine backup cancel -m server-1
rdc machine backup cancel -m server-1 --strategy weekly-cold

Riferimento CLI: rdc machine backup cancel

Migrazione del Repository

Sposta un repository da una macchina a un’altra:

rdc repo migrate --name my-app --from server-1 --to server-2

Riferimento CLI: rdc repo migrate

Opzione	Descrizione
`--name <repo>`	Repository da migrare
`--from <machine>`	Macchina sorgente
`--to <machine>`	Macchina di destinazione
`--provision`	Effettua il provisioning del repository sulla destinazione prima del trasferimento
`--checkpoint`	Crea un checkpoint CRIU prima della migrazione
`--skip-dns`	Salta l’aggiornamento dei record DNS dopo la migrazione
`--bwlimit <limit>`	Limite di banda per il trasferimento (ad es. `50M`)

La migrazione trasferisce i dati del repository cifrato tramite rsync. Il repository sorgente rimane intatto fino a quando non lo si rimuove esplicitamente.

Sfoglia lo Storage

Sfoglia i contenuti di una posizione di storage:

rdc storage browse --name my-storage

Riferimento CLI: rdc storage browse

Buone Pratiche

Pianifica backup cold giornalieri per snapshot app-consistent dei dati critici
Usa i backup hot per snapshot ad alta frequenza dove è richiesto zero downtime
Testa periodicamente i ripristini per verificare l’integrità dei backup
Usa più provider di storage per i dati critici (ad es. S3 + B2)
Tieni le credenziali al sicuro; i backup sono cifrati ma la credenziale LUKS è necessaria per il ripristino