RAG

Retrieval-Augmented Generation – LLMs mit eigenem Wissen erweitern.

fertig11 Lektionen

llmembeddingsretrievalvector-db

RAG kombiniert Information Retrieval mit Sprachmodellen: Statt das LLM raten zu lassen, suchst du erst die relevanten Dokumente und gibst sie als Kontext mit. Wirkt simpel — die Tücken stecken in Chunking, Embedding-Wahl, Retrieval-Qualität und Re-Ranking.

Wo soll ich anfangen?

Drei Reisen durch das Material – such dir aus, was zu dir passt.

🌱

Einstieg

Was RAG ist, wie die Pipeline läuft, wo es klemmt.

1Was ist RAG?
2Die Pipeline
3Chunking
4Embeddings

Pfad starten →

💻

Engineer

Was du baust, wenn das Skelett steht.

1Vector Databases
2Hybrid: BM25 + Vektor
3Cross-Encoder
4Metadaten & Filter

Pfad starten →

🔥

Production

Was du misst und wo es brennt, wenn echte User ankommen.

1Halluzinationen trotz Kontext
2Evaluation
3Lost in the Middle

Pfad starten →

Die ganze Landkarte

Grundlagen

Was RAG löst und wann es nicht passt.

Vorverarbeitung

Wie aus Dokumenten durchsuchbare Stücke werden.

Retrieval

Die ähnlichsten Stücke aus der Wissensbasis holen.

Re-Ranking

Aus 50 Kandidaten die wirklich besten 5 machen.

⚖️Cross-Encoder→

Anwendung

Wo es in echten Systemen wehtut.