9 min
Quando il Markdown peggiora un sistema RAG: shallow chunks come falsi positivi nella dense retrieval
Uno studio completo su 20 PDF scientifici mostra che la conversione in Markdown prima dell'indicizzazione RAG genera shallow structural chunks — frammenti strutturali vuoti che rubano posti nella top-k e degradano la qualità della risposta.
RAGretrievalembeddingmarkdownbenchmarkricercapubblicazione
Leggi →