Sicurezza degli AI Agent e Guardrail

Stai indirizzando un assistente di coding AI alla tua infrastruttura. Quando Claude Code, Cursor, Gemini CLI, Copilot CLI o strumenti simili guidano rdc, la CLI lo rileva e applica un set di regole diverso da quello di un umano alla tastiera. Questa pagina spiega cosa l’agent può e non può fare, e come i guardrail resistono anche quando tenta di convincerti a lasciargli il controllo.

Riferimento rapido: cosa gli agent possono e non possono fare

Operazione	Comportamento predefinito dell’agent	Come sbloccarla per un caso d’uso specifico
`rdc config show` (redatto)	✅ consentito
`rdc config field get --pointer <pointer>` (stub redatto o digest)	✅ consentito
`rdc config field get --pointer <pointer> --digest`	✅ consentito
`rdc config field set --pointer <pointer>` (campo pubblico)	✅ consentito
`rdc config field set --pointer <pointer>` (campo sensibile, con `--current` corretto)	✅ consentito
`rdc config edit --dump` (JSONC redatto)	✅ consentito
`rdc config audit {log, tail, verify}`	✅ consentito
`rdc config field set --pointer <pointer>` (campo sensibile, senza `--current`)	🔴 rifiutato	Fornisci `--current "<old value>"`
`rdc config field get --pointer <pointer> --reveal`	🔴 rifiutato	Usa `--digest` invece
`rdc config show --reveal`	🔴 rifiutato	Usa il semplice `rdc config show`
`rdc config edit` (editor interattivo)	🔴 rifiutato	L’umano imposta `REDIACC_ALLOW_CONFIG_EDIT=*` prima di lanciare l’agent
`rdc config edit --apply <file>`	🔴 rifiutato	Stesso override
`rdc config field rotate --pointer <pointer>`	🔴 rifiutato	Stesso override; usa conferma interattiva
`rdc term connect -m <machine>` (SSH diretto alla macchina)	🔴 rifiutato	Fork prima un repo e connettiti al fork

Ogni rifiuto viene scritto nel log di audit con outcome: refused e una ragione.

Come gli agent sono rilevati

La CLI tratta un processo come un agent quando uno di questi è vero:

Uno di REDIACC_AGENT, CLAUDECODE, GEMINI_CLI, COPILOT_CLI è impostato su "1", oppure CURSOR_TRACE_ID è impostato.
Su Linux: qualsiasi processo parent nella catena di ascendenza ha una di queste variabili nel suo ambiente (tramite /proc/<pid>/environ). Anche se l’agent cancella le sue variabili con env -i o uno script wrapper, la catena parent comunica sempre alla CLI chi l’ha avviato.

Il rilevamento viene eseguito una sola volta per processo ed è memorizzato in cache. Non può essere disabilitato.

Il modello knowledge-gate

Le mutazioni sensibili seguono la convenzione passwd(1): per cambiare un segreto, prova che lo conoscevi già. Simmetrico per umani e agent. Entrambi passano attraverso lo stesso gate. Non esiste il bypass “Sono io alla tastiera”.

Vuoi ruotare un token API memorizzato in /credentials/cfDnsApiToken?
La CLI chiede: “qual è il valore attuale?”
L’agent (o l’umano) fornisce il plaintext tramite --current "$OLD". La CLI esegue l’hash di $OLD con SHA-256 e lo confronta con il digest del valore attualmente memorizzato. Match → la scrittura procede. Mismatch → rifiutato, registrato.
Per ruotare senza verificare il valore precedente, passa --rotate-secret (mutualmente esclusivo con --current). Questa azione viene chiaramente registrata come una rotazione.

Il modello chiude tre superfici di attacco:

Rotazione silenziosa: un chiamante (agent o umano) senza accesso precedente a $OLD non può sostituirlo con un valore proprio.
Exfiltrazione tramite probing: la risposta del digest non contiene mai plaintext; anche un log di audit compromesso mostra expected abc12345…, got deadbeef…, non i valori sottostanti.
Calpestamento accidentale della configurazione di produzione: richiede --current deliberato ogni volta, anche al TTY. Cattura l’errore “Intendevo impostare STRIPE_TEST ma sono nella shell di produzione”.

Suggerimenti strutturati sulla prossima azione

Quando la precondizione fallisce, l’envelope JSON (--output json) contiene un campo errors[].next strutturato che dice agli agent esattamente cosa suggerire all’umano:

{
  "errors": [{
    "code": "PRECONDITION_MISMATCH",
    "message": "...",
    "next": {
      "summary": "Provide the current value or acknowledge rotation.",
      "options": [
        { "description": "Re-read current digest, then retry with --current",
          "run": "rdc repo secret get --name mail --key STRIPE_KEY" },
        { "description": "Skip the precondition (rotation, audited)",
          "run": "rdc repo secret set --name mail --key STRIPE_KEY --value <new> --mode file --rotate-secret" }
      ]
    }
  }]
}

Gli agent dovrebbero trasmettere next.options[].run all’umano così come è piuttosto che sintetizzare i propri comandi. Questo evita il fallimento “agent inventa un comando che non esiste” e mantiene l’operatore al controllo dell’azione effettiva.

Esempio pratico

# Scopri il digest breve dello stub di redazione (sicuro per gli agent).
$ rdc config field get --pointer /credentials/cfDnsApiToken
{"pointer": "/credentials/cfDnsApiToken", "value": "<redacted:secret>:abc12345"}

# Prova a sovrascrivere senza prova: rifiutato.
$ rdc config field set --pointer /credentials/cfDnsApiToken --new '"agent-picked-value"'
✗ Precondition failed: sensitive path requires --current (or --rotate-secret)

# Fornisci il plaintext attuale: consentito.
$ rdc config field set --pointer /credentials/cfDnsApiToken \
    --current "$OLD_CF_TOKEN" \
    --new   "$NEW_CF_TOKEN"
Set /credentials/cfDnsApiToken

Se l’agent non ha mai avuto $OLD_CF_TOKEN, non può soddisfare la precondizione e la rotazione viene rifiutata. L’utente che ha il valore può comunque farla tramite l’editor o passando --current dalla sua shell.

Redazione per impostazione predefinita

Ogni comando rdc che legge lo stato sensibile, config show, config field get, config machine list, config edit --dump, restituisce stub di redazione per i campi segreti, non plaintext:

"sshKey":       "<redacted:credential>:9f3a2c1b"
"cfDnsApiToken":"<redacted:secret>:abc12345"
"storages.s3-prod.vaultContent": "<redacted:secret>:1f2e3d4c"

Il suffisso hex di 8 caratteri dello stub è il primo 8 caratteri di sha256(canonicalize(value)): abbastanza per distinguere a prima vista due valori diversi, non abbastanza per invertire. Un agent può usare uno stub per tracciare se un valore è cambiato senza vederlo mai.

--reveal annulla la redazione per gli umani su un TTY interattivo. Gli agent sono rifiutati indipendentemente dallo stato del TTY. Ogni concessione scrive una voce di audit reveal_granted; ogni rifiuto scrive una voce refused con i segnali dell’agent allegati.

L’override `REDIACC_ALLOW_CONFIG_EDIT`

Alcune operazioni, l’editor interattivo, --apply, field rotate, esistono per gli umani e non hanno percorsi sicuri per agent. Se vuoi attivamente che un agent ne faccia uno, imposta:

export REDIACC_ALLOW_CONFIG_EDIT='*'          # bypass completo
# oppure
export REDIACC_ALLOW_CONFIG_EDIT='/credentials/ssh/privateKey,/infra/cfDnsZoneId'
# (glob di scope separati da virgola: i wildcard * sono consentiti per segmento)

…e l’agent lo eredita.

Dettaglio cruciale: l’override deve apparire in un processo al di sopra dell’agent nella catena di ascendenza. Se l’agent lo imposta nel suo stesso ambiente (o in una subshell che ha generato), la CLI rifiuta e te lo dice:

Interactive editor is blocked in agent environments (REDIACC_ALLOW_CONFIG_EDIT was set but ancestry verification failed: the override must be set by your shell, not by an agent).

L’effetto: un agent non può convincerti a superare un guardrail eseguendo export REDIACC_ALLOW_CONFIG_EDIT='*' a metà sessione. Solo un processo parent (tu, nel tuo terminale, prima di lanciare l’agent) può aprire quella porta.

Supporto della piattaforma: come l’override è verificato su ogni OS

Sia REDIACC_ALLOW_CONFIG_EDIT che REDIACC_ALLOW_GRAND_REPO si basano sulla verifica dell’ascendenza per provare che l’override è stato impostato da te e non iniettato dall’agent. La verifica funziona su Linux, macOS e Windows, ma la testimone che legge è diversa per ogni piattaforma, e così è il livello di certezza della garanzia:

Piattaforma	Testimone	Livello di certezza
Linux	`/proc/<pid>/environ` per ogni processo della catena	Snapshot al momento dell’exec, servito dal kernel. Un processo non può modificare retroattivamente cosa è stato avviato con.
macOS	`kern.procargs2` sysctl, letto da un piccolo helper che si trova dentro `rdc`	Stessa proprietà dello snapshot al momento dell’exec come Linux. Leggibile per i tuoi stessi processi senza root.
Windows	Il blocco di ambiente dal vivo di ogni processo antenato (PEB), letto dallo stesso helper, con guardie di riuso dei PID	Più debole: Windows non conserva uno snapshot al momento dell’exec, quindi il controllo legge la memoria corrente. Gli antenati comunque non possono essere riscritti da nulla che un agent normalmente esegue, ma la testimone non è congelata dal kernel come su Linux e macOS.

Su macOS e Windows la CLI avvia il suo binario renet integrato per fare la lettura; l’helper riferisce quale di queste variabili monitorate ciascun antenato contiene, e tutta la logica decisionale rimane nella CLI. Se l’helper manca, è obsoleto o fallisce per qualsiasi motivo, la CLI non può verificare l’override e fallisce in chiusura: l’override viene rifiutato e l’errore dice che la verifica non era disponibile, non che hai fatto qualcosa di sbagliato. Un’installazione funzionante non mostra mai quel messaggio; reinstallare rdc ripristina l’helper.

Quello che rimane vero su ogni piattaforma: l’override deve già essere presente nell’ambiente del processo agent quando si avvia. Esportalo nel tuo terminale, poi lancia l’agent. Un agent che imposta la variabile a metà sessione viene rifiutato.

Log di audit

Ogni mutazione, ogni rifiuto, ogni concessione --reveal scrive una riga JSONL in ~/.config/rediacc/audit.log.jsonl (modalità 0600, ruotato a 10 MB). Ogni riga è collegata tramite hash: il campo prevHash è sha256("<riga precedente>"). La manomissione di qualsiasi riga rompe la catena in tutte le righe successive.

{"ts":"2026-04-21T10:02:47.831Z","actor":{"kind":"agent","agentSignals":["CLAUDECODE"]},"command":"config field set","paths":["/credentials/cfDnsApiToken"],"outcome":"ok","configId":"...","configVersion":48,"prevHash":"sha256:9f3a..."}
{"ts":"2026-04-21T10:02:51.114Z","actor":{"kind":"agent","agentSignals":["CLAUDECODE"]},"command":"config edit","paths":[],"outcome":"refused","reason":"agent without REDIACC_ALLOW_CONFIG_EDIT=*","prevHash":"sha256:abc1..."}
{"ts":"2026-04-21T10:03:05.220Z","actor":{"kind":"human"},"command":"config show --reveal","paths":[],"outcome":"reveal_granted","configId":"...","configVersion":48,"prevHash":"sha256:deac..."}

Ispezione

# Elenca le voci recenti
rdc config audit log --since 24h

# Filtra per glob del puntatore
rdc config audit log --path '/credentials/*'

# Solo voci originate dagli agent
rdc config audit log --actor agent

# Mostra le nuove voci in tempo reale (Ctrl+C per fermare)
rdc config audit tail

# Verifica che la catena hash sia intatta
rdc config audit verify
# → "Chain integrity verified across 247 entries."
#   OPPURE
# → "Chain broken at line 103: file has been tampered with or corrupted."

Riferimento CLI: rdc config audit log · rdc config audit tail · rdc config audit verify

Cosa non appare mai nel log di audit

Valori dei segreti in testo in chiaro
Passphrase, token, chiavi SSH
I valori vecchi/nuovi in caso di mancata corrispondenza della precondizione --current (solo il prefisso digest a 8 caratteri)

Il log è sicuro da condividere con un revisore della sicurezza o da allegare a un report di bug.

Limiti del modello comportamentale

I guardrail degli agenti sono comportamentali, non crittografici. Un agente determinato o istruito che gira con lo stesso UID del file di configurazione può sempre eseguire cat ~/.config/rediacc/rediacc.json e leggere il testo in chiaro, perché il file è leggibile dal processo.

Per un’applicazione crittografica reale, usa l’archivio di configurazione cifrato: i segreti risiedono lato server, ogni campo sensibile porta un commitment HMAC per campo e il worker dell’account rifiuta le scritture la cui precondizione --current non corrisponde all’hash memorizzato. Il server non vede mai il testo in chiaro (zero-knowledge), ma applica comunque il gate.

Il percorso locale: la via facile è quella sicura. L’archivio remoto: anche la via alternativa è crittograficamente difficile.

Cosa Rediacc non isola

I guardrail degli agenti in questa pagina proteggono l’infrastruttura propria di Rediacc: il file di configurazione, il daemon Docker per repository, i dati del repository cifrati con LUKS, la sandbox SSH con scope limitato. Non proteggono i servizi esterni per cui il repository detiene credenziali.

Un fork di un repository è un reflink BTRFS del volume del genitore. Tutto ciò che risiede sul disco nel genitore è byte-identico nel fork: codice, dati e file .env compresi. Se il repository contiene un STRIPE_LIVE_KEY, un AWS_ACCESS_KEY_ID, un token API di Railway o qualsiasi altra credenziale a lunga durata per un servizio di terze parti, il fork la eredita. Un agente che opera nella sandbox del fork può leggere quel file, esfiltrare il valore o usarlo per chiamare l’API di terze parti. Il servizio di terze parti non ha modo di sapere se la chiamata proviene da un fork o dalla produzione.

Questa è la linea di responsabilità condivisa:

Confine	Proprietario
Dati del repository, mount namespace, scope Docker, guardrail degli agenti, log di audit, iniezione dei segreti al momento del deployment	Rediacc
Codice applicativo che utilizza quei segreti e le credenziali inserite nell’immagine in fase di build	Sviluppatore del repository

La mitigazione principale è integrata: i segreti per repository sono memorizzati in un piano separato dall’immagine del repository cifrata e non vengono copiati attraverso il confine del fork. I container di un fork si avviano con una mappa dei segreti vuota e si identificano come un’entità esterna diversa dal genitore. Impostarli con rdc repo secret set (modalità env per l’interpolazione in compose, modalità file per i blocchi secrets: tmpfs). Il mutation gate è simmetrico: sia gli esseri umani che gli agenti devono fornire --current (precondizione stile passwd) o --rotate-secret (rotazione con audit) per sovrascrivere o eliminare un valore esistente.

L’isolamento tra repository è applicato. Un file compose malevolo o trascurato nel repository B non può fare riferimento alla directory dei segreti del repository A. Il validatore di compose di renet rifiuta categoricamente qualsiasi percorso secrets: file:, configs: file: o env_file: che punta fuori dalla directory ${REDIACC_NETWORK_ID} del repository corrente, e il rifiuto NON è annullabile con --unsafe. Difesa in profondità: la sandbox Landlock attorno al sottoprocesso bash del Rediaccfile limita le letture del filesystem alla sola directory dei segreti della rete corrente, quindi un cat /var/run/rediacc/secrets/<altro>/X da un Rediaccfile malevolo fallisce con EACCES a livello kernel.

Due pattern aggiuntivi chiudono i casi limite:

Non inserire credenziali di produzione nel filesystem del repository. Un file .env incluso nell’immagine, o una credenziale persistita in un volume durante up(), viene reflinkata nel fork. La funzionalità dei segreti per repository protegge solo i valori che si mantengono nel piano dei segreti. Non può proteggere retroattivamente i byte che già risiedono nell’immagine LUKS. Per i repository esistenti con file .env incorporati, spostali manualmente nei segreti per repository.
Limitare la rete in uscita del fork con il filtraggio egress eBPF in modo che possa raggiungere solo localhost ed endpoint sandbox espliciti. L’isolamento di rete per repository di Rediacc è la base; le allowlist egress per fork non sono ancora costruite, ma il percorso è aperto.

Rediacc gestisce l’iniezione al momento del deployment, l’isolamento tra fork e l’isolamento tra repository. La parte “non inserirlo nell’immagine” è a carico dell’utente.

Ricette rapide

Permettere a un agente di ruotare un singolo token cloud

# Come utente, prima di avviare l'agente:
export REDIACC_ALLOW_CONFIG_EDIT='/credentials/cfDnsApiToken'
claude-code              # oppure cursor, gemini, ecc.

Ora l’agente può eseguire config field rotate /credentials/cfDnsApiToken --new … ma non può ancora modificare /credentials/ssh/privateKey né aprire l’editor interattivo.

Permettere a un agente una sessione di modifica della configurazione ampia

export REDIACC_ALLOW_CONFIG_EDIT='*'
claude-code

L’agente può aprire rdc config edit, usare --reveal ed eseguire field rotate. Ogni azione viene comunque registrata nel log di audit con actor.kind: agent e il segnale CLAUDECODE.

Scoprire quali campi un agente è autorizzato a toccare

rdc config field list --sensitive --output json

Riferimento CLI: rdc config field list

Restituisce ogni template di puntatore, il suo tipo (secret / credential / pii / identifier) e se è incluso nell’envelope HMAC lato server.

Vedi anche

Panoramica sull’integrazione degli agenti AI: il tour di livello superiore
Configurazione di Claude Code: template di integrazione
Envelope di output JSON: risposte leggibili dalla macchina
Archivio di configurazione cifrato: applicazione crittografica lato server
Sicurezza dell’account: postura di sicurezza dell’operatore