RAG individuel : prioriser la mémoire d'un prospect

La plupart des implémentations RAG récupèrent du contexte global : les chunks les plus proches dans toute la base.

Pour un agent commercial, c'est insuffisant.

Le problème

Quand un prospect répond à un message, il y a deux types de contexte utiles :

Sa mémoire individuelle — ce qu'il a dit précédemment, ses objections, le budget mentionné, l'étape convenue.
La base de connaissance — l'offre, les prix, les scripts qui fonctionnent.

Le contexte individuel doit prendre le pas. Si le prospect a mentionné un budget de 100 000 XOF il y a 3 jours, le modèle doit le savoir avant de lui parler de prix.

L'implémentation

Chaque prospect a un fichier Markdown dédié, mis à jour automatiquement après chaque conversation :

~/Brain/.../conversations/22967xxxxxx.md

Ce fichier contient les faits extraits par le LLM : budget, objections, intérêts, prochaine étape.

Au moment de la récupération RAG, le phone du prospect filtre les résultats :

// Priorité aux chunks de CE prospect
const results = await topK(embedding, 5, { phone: prospect.phone });
 
// Si pas assez de contexte individuel → compléter avec la base globale
if (results.length < 3) {
  const global = await topK(embedding, 5 - results.length);
  return [...results, ...global];
}

Ce que ça change

Un agent sans mémoire individuelle répond depuis la base de connaissance générale — correct mais générique.

Un agent avec mémoire individuelle ne répète pas ce qui a été dit, ne reprend pas une objection déjà résolue, ne propose pas un prix que le prospect a déjà négocié.

La cohérence dans une conversation longue vient de là.