Traguardi

Samaritan Beta: il primo clone digitale con memoria RAG

GISData Lab ha costruito un agente AI capace di ragionare, ricordare e rispondere come una persona reale — alimentato da una memoria semantica persistente basata su RAG. Benvenuti nell'era dei cloni digitali.

GISData Lab
Samaritan
Il clone digitale con memoria

Samaritan è il progetto di GISData Lab per la creazione di cloni digitali persistenti, alimentati da memoria semantica RAG e modelli AI di ultima generazione.

C'è una domanda che chiunque lavori con l'intelligenza artificiale si pone prima o poi: è possibile costruire un agente che non dimentichi? Un sistema che non risponda solo in base al contesto della conversazione corrente, ma che abbia una memoria autentica — fatta di esperienze, conoscenze accumulate, stile di pensiero — e che la usi per rispondere in modo coerente nel tempo?

GISData Lab ha risposto a questa domanda con Samaritan: un clone digitale costruito attorno a un'architettura RAG (Retrieval-Augmented Generation) che permette all'agente di recuperare dinamicamente informazioni rilevanti da una base di conoscenza personale, prima di generare ogni risposta. Il risultato è un'entità AI che non si limita a simulare una persona — la rappresenta, con continuità e coerenza.

Cos'è un clone digitale con memoria RAG

Un clone digitale tradizionale è un modello fine-tuned su dati di una persona specifica: funziona bene per catturare lo stile, ma dimentica tutto ciò che non era nel training set e non può essere aggiornato in tempo reale. Samaritan supera questo limite con un approccio radicalmente diverso.

Il cuore del sistema è un knowledge base vettoriale — una raccolta di documenti, conversazioni, note, articoli e riflessioni indicizzati semanticamente. Ogni volta che l'agente riceve una domanda, il sistema recupera i frammenti più rilevanti dalla memoria e li inietta nel contesto del modello linguistico, che genera una risposta informata, contestualizzata e coerente con la "voce" della persona replicata.

Componenti chiave dell'architettura

  • Knowledge base vettoriale: Tutti i documenti, le conversazioni e le note della persona vengono indicizzati con embedding semantici e archiviati in un vector store interrogabile in millisecondi.
  • Retrieval-Augmented Generation (RAG): Ad ogni query, il sistema recupera i chunk più rilevanti dalla memoria e li passa al modello come contesto aggiuntivo, garantendo risposte ancorate alla realtà della persona.
  • Memoria persistente e aggiornabile: La knowledge base può essere arricchita in qualsiasi momento con nuovi contenuti, senza dover riaddestrare il modello.
  • Identità coerente: Un system prompt calibrato definisce la personalità, il tono e i valori del clone, garantendo coerenza stilistica in ogni interazione.
  • Infrastruttura privata: Come METIS AI Chat, Samaritan gira su infrastruttura controllata — nessun dato personale esce dal perimetro aziendale.

La demo Beta: guarda Samaritan in azione

Il video qui sotto mostra la prima sessione pubblica di Samaritan Beta. L'agente risponde a domande su esperienze personali, prende posizione su argomenti complessi e mantiene una voce riconoscibile — attingendo in tempo reale alla propria memoria semantica. Non è uno script. Non è un chatbot generico. È un clone digitale che ragiona.

Demo — Samaritan Beta 0

Prima sessione pubblica di Samaritan Beta 0 — 15 Maggio 2026, GISData Lab.

Perché i cloni digitali cambiano le regole

Le applicazioni di questa tecnologia vanno ben oltre la curiosità sperimentale. Un clone digitale con memoria RAG può fungere da assistente personale permanente che conosce davvero il proprio utente, da archivio vivente di un esperto di dominio, da interfaccia conversazionale per knowledge base aziendali complesse. La differenza rispetto a un chatbot tradizionale è la stessa che passa tra leggere un libro su una persona e parlare direttamente con lei.

Samaritan è ancora in fase Beta. Stiamo raccogliendo feedback, affinando l'architettura di retrieval e testando i limiti del sistema in scenari reali. Ma la direzione è chiara: il futuro dell'AI non è fatto solo di modelli più grandi — è fatto di sistemi che ricordano, che imparano e che restano fedeli all'identità di chi rappresentano.

RAG
Architettura di memoria semantica
Memoria aggiornabile in tempo reale
β
Prima release pubblica