RAG

Retrieval-Augmented Generation – LLMs mit eigenem Wissen erweitern.

fertig11 Lektionen
llmembeddingsretrievalvector-db
Lektion starten →

RAG kombiniert Information Retrieval mit Sprachmodellen: Statt das LLM raten zu lassen, suchst du erst die relevanten Dokumente und gibst sie als Kontext mit. Wirkt simpel — die Tücken stecken in Chunking, Embedding-Wahl, Retrieval-Qualität und Re-Ranking.

Wo soll ich anfangen?

Drei Reisen durch das Material – such dir aus, was zu dir passt.

🌱

Einstieg

Was RAG ist, wie die Pipeline läuft, wo es klemmt.

  1. 1Was ist RAG?
  2. 2Die Pipeline
  3. 3Chunking
  4. 4Embeddings
Pfad starten →
💻

Engineer

Was du baust, wenn das Skelett steht.

  1. 1Vector Databases
  2. 2Hybrid: BM25 + Vektor
  3. 3Cross-Encoder
  4. 4Metadaten & Filter
Pfad starten →
🔥

Production

Was du misst und wo es brennt, wenn echte User ankommen.

  1. 1Halluzinationen trotz Kontext
  2. 2Evaluation
  3. 3Lost in the Middle
Pfad starten →

Die ganze Landkarte

Grundlagen

Was RAG löst und wann es nicht passt.

Vorverarbeitung

Wie aus Dokumenten durchsuchbare Stücke werden.

Retrieval

Die ähnlichsten Stücke aus der Wissensbasis holen.

Re-Ranking

Aus 50 Kandidaten die wirklich besten 5 machen.