Chatbot NLP per WhatsApp: esempi open source, architettura e una guida pratica introduttiva

22.10.2025

Sviluppare un chatbot WhatsApp che "capisca" (comprendendo frasi diverse, errori di battitura e intenti) non significa rimanere intrappolati in una scatola nera proprietaria. Con stack di elaborazione del linguaggio naturale (NLP) open source e maturi, puoi creare un bot WhatsApp su cui hai il pieno controllo, inclusi dati, logica e costi, offrendo comunque un'esperienza raffinata e simile a quella umana. Questa guida ti illustra architetture di riferimento, opzioni open source concrete e tre esempi end-to-end che puoi utilizzare per la tua prima release.

‍

Perché rendere open source WhatsApp NLP?

Controllo su dati e privacy. Conserva dati di training, log e modelli nel tuo repository/cloud.
Componibile: scambia tokenizzatori, classificatori di intenti, livelli di recupero o gestori di dialogo senza riscrivere tutto.
Trasparenza dei costi: paga per l'hosting/l'elaborazione, non per i ricarichi per messaggio derivanti da componenti aggiuntivi "intelligenti".
Velocità della community: Rasa, Haystack, spaCy e LangChain si evolvono rapidamente e forniscono modelli collaudati che puoi adattare.

‍

Bot NLP di WhatsApp: l'architettura minima (e dove si inserisce l'open source)

Trasporti (piattaforma WhatsApp Business):
- Utilizza la piattaforma WhatsApp Business di Meta (API Cloud) come canale ufficiale. Invia messaggi al tuo webhook e ti consente di inviare risposte.
- Ospiterai un piccolo ricevitore webhook (FastAPI/Express) per verificare le firme, analizzare il JSON in entrata e inoltrare un evento normalizzato al runtime del tuo bot.
Runtime del bot (open source):
- NLU e gestione del dialogo:
  - Rasa (end-to-end: tokenizzatore, estrazione di intenti/entità, policy, moduli, storie)
  - Botpress open source (flussi visivi + NLU)
  - LangChain/LangGraph (orchestrazione orientata a LLM se si prevede di utilizzare modelli generativi)
- Recupero e conoscenza:
  - Haystack o LangChain + un database vettoriale (FAISS o Chroma) per RAG (generazione aumentata dal recupero).
- Brani classici di PNL:
  - spaCy (regole, pipeline NER), Hugging Face Transformers (classificatori di intenti ottimizzati), fastText per linee di base di intenti leggere.
Stato e conservazione:
- Stato della conversazione (SQLite/Postgres/Redis).
- Indice dei contenuti (FAISS/Chroma/Weaviate).
- Registri/metriche (Postgres + Grafana/Prometheus, o un semplice CSV/S3 se si sta creando un prototipo).
Amministrazione e strumenti:
- Annotazione e controllo delle versioni dei set di dati (Label Studio + DVC/Git LFS).
- Script di valutazione (pytest + metriche personalizzate per intento F1, entità F1 e tasso di completamento dell'obiettivo).

Il passaggio di consegne è semplice: WhatsApp → webhook → runtime del bot (Rasa/Botpress/LangChain) → logica di business → risposta tramite l'API di invio di WhatsApp.

‍

Blocchi di costruzione open source (curati)

Rasa : testato sul campo per l'estrazione di intenti/entità, moduli (riempimento di slot), storie, policy; buon equilibrio tra basato su regole e ML.
Botpress (edizione open source) : generatore di flussi visivi; rapido nell'integrazione di non sviluppatori; da utilizzare quando il team desidera una canvas più NLU.
spaCy : primitive NLP di livello produttivo, modelli multilingue, componenti personalizzati per entità basate su pattern.
Haystack : pipeline RAG pulite, archivi di documenti, recuperatori, lettori; ideale per bot di FAQ e knowledge base.
LangChain/LangGraph : agenti/strumenti componibili per progetti incentrati su LLM; abbinabili a un modello aperto o a un modello API, secondo necessità.
FAISS / Chroma : ricerca vettoriale leggera per il recupero basato su incorporamenti.
Node-RED : collante low-code per orchestrare webhook, chiamate HTTP e decisioni quando si desidera effettuare spedizioni rapide.

‍

Modello di dati e normalizzazione dei messaggi

I payload di WhatsApp variano in base al tipo di messaggio. Normalizza in anticipo in modo che il tuo stack NLP veda uno schema coerente:

marca temporale (ISO)
from_phone (E.164)
message_type (testo | immagine | posizione | audio | documento)
testo (testo estratto; esegui l'OCR per le immagini solo se ne hai veramente bisogno)
media_url (se applicabile)
locale (se presente; fallback con rilevamento della lingua)
session_id (stabile per utente/giorno)

Inizialmente, mantieni semplici i rami non testuali: conferma la ricezione dei contenuti multimediali, poni domande di chiarimento e conserva i riferimenti per la revisione umana.

‍

Tre modelli di esempio open source (pronti per la copia)

1) FAQ + qualificazione dei lead (Rasa-first)

Quando scegliere: è necessaria una classificazione degli intenti solida, entità (ad esempio, prodotto, città) e riempimento degli slot deterministico.

Fluire:

Testo in entrata → Rasa NLU → intent (pricing_query, book_install, out_of_scope).
Se pricing_query, estrai le entità (città, tipo_sistema); se mancante, i moduli pongono domande.
Recupera le risposte standard da un file di conoscenza YAML/JSON o da un semplice RAG se il contenuto è di grandi dimensioni.
Passare all'uomo se la confidenza è inferiore alla soglia o se il modulo scade.

Il bello è che le policy Rasa (TED, RulePolicy) bilanciano il comportamento appreso con regole esplicite. È possibile ottimizzare l'NLU con poche decine di esempi/intenti.

2) Domande e risposte basate sui documenti (Haystack RAG)

Quando scegliere: la knowledge base è grande (PDF, documenti, FAQ) e vuoi che le risposte siano basate sui tuoi contenuti.

Fluire:

Testo in entrata → rilevamento della lingua → query di incorporamento.
Haystack : Retriever (ad esempio, Dense Passage Retrieval) recupera i passaggi top-k da FAISS/Chroma.
Il lettore/generatore compone una breve risposta con citazioni.
La risposta include un'etichetta sorgente di facile comprensione ("Guida all'installazione §2.1").

Il bello è che con una solida base si evitano le allucinazioni. Si possono ampliare i contenuti senza toccare la logica dei dialoghi.

3) Triage del servizio basato sul flusso (regole Botpress + spaCy)

Quando scegliere: le operazioni si basano su flussi di lavoro strutturati (ticket aperto, aggiornamento ETA, riprogrammazione) e si desidera una tela visiva condivisa.

Fluire:

Flusso Botpress per rami ad alta affidabilità (menu, passaggi del modulo).
I tag dei componenti personalizzati spaCy ordinano numeri, e-mail e date.
Botpress chiama un backend (ad esempio, /tickets/create) e invia il riferimento all'utente.
Ricorrere a un elenco di risposte rapide del tipo "Non ho capito, scegli un'opzione".

Il bello è che anche chi non è uno sviluppatore può modificare i flussi in modo sicuro. Le regole di spaCy individuano rapidamente le entità fragili e specifiche del formato.

‍

Dati di addestramento: come si presenta il “sufficiente”

Intenti: inizia con 8-15 intenti che coprano l'80% del traffico. Un MVP sano è di circa 20-30 esempi per intento.
Entità: concentrarsi sulle entità operative (città, order_id, livello di prodotto). Scrivere alcune funzionalità di espressioni regolari (ID ordine, email) per aumentare la precisione.
Esempi negativi: includere chiacchiere fuori tema e chiacchiere cortesi, in modo che la politica di riserva abbia effetto.
Multilingue: se si prevedono lingue miste, aggiungere il rilevamento della lingua e il routing verso pipeline o modelli separati per lingua.

Dataset di versione con Git + DVC. Ogni build di modello dovrebbe essere collegata a un commit del dataset.

‍

Progettazione della conversazione scalabile

I primi due o tre suggerimenti dopo un fallback ("Intendevi prezzi o tempi di installazione?") sono più efficaci di "Mi dispiace, non ho capito".
Divulgazione progressiva: chiedi uno slot mancante alla volta, riepiloga le informazioni raccolte, quindi conferma prima di agire.
Coinvolgimento umano: fornisci una parola chiave come "agente" o semplicemente rileva i modelli di frustrazione e intensificali con il contesto della trascrizione.

‍

Sicurezza, conformità e specifiche di WhatsApp

Opt-in + opt-out: fai rispettare un consenso chiaro. Fai in modo che "STOP" (o una variante locale) funzioni fin dal primo giorno.
Minimizzazione delle informazioni personali identificabili (PII): archivia solo i campi realmente necessari (ad esempio, order_id, città). Maschera o applica hash agli identificatori sensibili nei log.
Limiti di frequenza e nuovi tentativi: implementa il backoff esponenziale per gli errori di invio; registra i codici di risposta.
Modelli di messaggio: per i messaggi aziendali inviati al di fuori della finestra di 24 ore, preparare modelli approvati (requisito WhatsApp).
Igiene dei media: non scaricare automaticamente gli allegati alla cieca; esegui la scansione se la conformità lo richiede.

‍

Osservabilità: misura ciò che conta

Matrice di accuratezza e confusione degli intenti: trova intenti simili e unisci o riformula gli esempi.
Tasso di completamento dell'obiettivo: percentuale di utenti che raggiungono un risultato aziendale (prenotazione, creazione di biglietti).
Tasso di fallback per tipo di messaggio: monitora se i fallback aumentano per determinate lingue o campagne.
Frequenza e motivi del passaggio di consegne umano: utilizzare categorie (fatturazione, caso limite, abuso) per dare priorità alla formazione.
Latenza (p50/p90): mantenere la latenza end-to-end al di sotto di 2-3 secondi per le risposte di testo.

Inizia con una dashboard leggera: sessioni giornaliere, utenti unici, tasso di completamento, fallback e messaggi medi per sessione.

‍

Manuale di avvio rapido (percorso di una settimana)

Giorno 1 – Scheletro

Webhook in piedi (FastAPI/Express).
Crea un progetto Rasa (o un'area di lavoro Botpress).
Collega WhatsApp → webhook → bot → WhatsApp.

Giorno 2 – Intenti e forme

Definisci 10 intenti e 3 entità; aggiungi 20 campioni/intento.
Crea un modulo (ad esempio, prenotazione: data, città, e-mail di contatto).
Aggiungere una soglia di policy; indirizzare i valori a bassa confidenza al fallback.

Giorno 3 – Conoscenza

Indice 10–20 documenti principali con Haystack + FAISS.
Aggiungere un intento "/kb question" che attiva RAG con le prime 3 citazioni.

Giorno 4 – Passaggio di consegne

Implementare un comando di escalation e una casella di posta per gli agenti (inizialmente anche un bridge condiviso e-mail/Slack).
Registrare le trascrizioni con i tag ("necessita di escalation").

Giorno 5 – Ciclo di valutazione

Eseguire un piccolo gruppo; raccogliere i messaggi classificati in modo errato.
Riqualificazione; confronta F1 e matrice di confusione.

Giorno 6 – Modelli e dopo l'orario di lavoro

Aggiungi modelli di messaggi WhatsApp per i flussi avviati dall'azienda.
Risposte basate sul tempo ("Torneremo alle 09:00") con un compito di follow-up mattutino.

Giorno 7 – Indurimento

Aggiungi nuovi tentativi, registrazione degli errori, controlli di integrità ed esportazione giornaliera nell'archivio.
Documentare la pipeline, i set di dati e le fasi di rilascio.

‍

Suggerimenti su costi e prestazioni

Modelli: iniziare con i backbone dei trasformatori di luce (classe DistilBERT) o anche con i classici SVM/fastText per gli intenti se il budget è limitato.
Ricerca vettoriale: FAISS sulla CPU è solitamente sufficiente per passaggi <500k.
Memorizzazione nella cache: memorizza nella cache le risposte frequenti (ad esempio, i tempi di consegna) per ridurre il calcolo.
Batching: se si trasmettono notifiche (messaggi modello), suddividere le richieste in batch in modo responsabile e rispettare i limiti di frequenza.

‍

Errori comuni (e come evitarli)

Intent bloat: avere più di 30 intent granulari troppo presto aumenta la confusione. Consolidare e utilizzare le entità per perfezionare.
Esagerazione delle espressioni regolari: modelli troppo ampi creano falsi positivi; limitare con limiti di parole e controlli del contesto.
Soluzione di riserva unica: definisci soluzioni di riserva a più livelli: chiarisci → riformula → offri gli intenti principali → intensifica.
Ignorare la realtà multilingue: aggiungere il rilevamento precoce della lingua; indirizzare verso la pipeline giusta.
Contesto illimitato: mantenere finestre di sessione ragionevoli; riepilogare i thread lunghi per evitare deviazioni del modello.

‍

Mettere tutto insieme

Un bot WhatsApp NLP open source non è un progetto di ricerca: è un insieme di componenti pratici e componibili che puoi assemblare rapidamente e sviluppare in sicurezza. Inizia con un webhook WhatsApp verificato, scegli un runtime adatto al tuo team (Rasa per flussi basati su policy, Botpress per l'orchestrazione visiva, Haystack/LangChain per il recupero) e progetta conversazioni che richiedano solo ciò di cui hai bisogno, un passo alla volta. Misura i risultati, riaddestra settimanalmente partendo da trascrizioni reali e passa il compito agli umani quando è davvero utile.

In questo modo sarai tu a gestire la tua roadmap, i tuoi dati e i tuoi costi, mentre i tuoi utenti potranno godere di un'esperienza WhatsApp veloce, naturale e utile.

‍

Leggi altre notizie

Chatbot NLP per WhatsApp: esempi open source, architettura e una guida pratica introduttiva

Perché rendere open source WhatsApp NLP?

Bot NLP di WhatsApp: l'architettura minima (e dove si inserisce l'open source)

Blocchi di costruzione open source (curati)

Modello di dati e normalizzazione dei messaggi

Tre modelli di esempio open source (pronti per la copia)

1) FAQ + qualificazione dei lead (Rasa-first)

2) Domande e risposte basate sui documenti (Haystack RAG)

3) Triage del servizio basato sul flusso (regole Botpress + spaCy)

Dati di addestramento: come si presenta il “sufficiente”

Progettazione della conversazione scalabile

Sicurezza, conformità e specifiche di WhatsApp

Osservabilità: misura ciò che conta

Manuale di avvio rapido (percorso di una settimana)

Suggerimenti su costi e prestazioni

Errori comuni (e come evitarli)

Mettere tutto insieme

Articoli/notizie correlate

Connettore WhatsApp ↔ Google Sheets per prototipi: crea, testa e impara rapidamente.

Integrazione delle FAQ dell'Helpdesk e delle risposte dei bot in WhatsApp: automazione dell'assistenza clienti

Migliorare la fedeltà dei clienti: feedback WhatsApp automatico dopo la risoluzione del ticket

Sfruttare i microservizi per integrazioni WhatsApp scalabili

Connettore WhatsApp ↔ Google Sheets per prototipi: crea, testa e impara rapidamente.

Integrazione delle FAQ dell'Helpdesk e delle risposte dei bot in WhatsApp: automazione dell'assistenza clienti

Migliorare la fedeltà dei clienti: feedback WhatsApp automatico dopo la risoluzione del ticket

WhatsApp Business API Richiesta di prova gratuita