RAG
Retrieval-Augmented Generation – LLMs mit eigenem Wissen erweitern.
Lektion starten →RAG kombiniert Information Retrieval mit Sprachmodellen: Statt das LLM raten zu lassen, suchst du erst die relevanten Dokumente und gibst sie als Kontext mit. Wirkt simpel — die Tücken stecken in Chunking, Embedding-Wahl, Retrieval-Qualität und Re-Ranking.
Wo soll ich anfangen?
Drei Reisen durch das Material – such dir aus, was zu dir passt.
🌱
Einstieg
Was RAG ist, wie die Pipeline läuft, wo es klemmt.
- 1Was ist RAG?
- 2Die Pipeline
- 3Chunking
- 4Embeddings
💻
Engineer
Was du baust, wenn das Skelett steht.
- 1Vector Databases
- 2Hybrid: BM25 + Vektor
- 3Cross-Encoder
- 4Metadaten & Filter
🔥
Production
Was du misst und wo es brennt, wenn echte User ankommen.
- 1Halluzinationen trotz Kontext
- 2Evaluation
- 3Lost in the Middle
Die ganze Landkarte
Vorverarbeitung
Wie aus Dokumenten durchsuchbare Stücke werden.
Retrieval
Die ähnlichsten Stücke aus der Wissensbasis holen.
Anwendung
Wo es in echten Systemen wehtut.