•  
InfoDay Generative AI für Developer
Wie sich Generative AI sinnvoll und effizient
in Business-Anwendungen implementieren lässt
18. – 20. November 2024 | Online
menu

Konferenzprogramm

Advanced RAG: AI-basierte Retriever-Auswahl mit Turbo

Retrieval Augmented Generation (RAG) nutzt Retriever wie Vector-DBs, um relevante Informationen zur Beantwortung von Anfragen zu finden. In komplexen RAG-Szenarien werden oft mehrere Datenquellen genutzt. Die Auswahl des passenden Retrievers kann durch eine MultiRoute-Chain erfolgen, wobei ein LLM dynamisch die semantisch beste Datenquelle wählt. Dieser Ansatz ist jedoch zeit- und kostenintensiv. Eine schnellere und günstigere Alternative ist der Einsatz eines Semantic Router, der statt eines LLMs ein Embedding-Modell zur Retrieverwahl verwendet. Dieser Ansatz bietet vergleichbare Qualität bei deutlich geringeren Kosten. Mit Live-Coding wird eine MultiRoute-Chain implementiert und anschließend auf den Semantic Router optimiert.

Zielpublikum: Developer, IT-Manager, GenAI-Enthusiasten
Voraussetzungen: Keine
Level: Advanced

Marco Frodl ist Principal Consultant für Generative AI bei der Thinktecture AG und konzentriert sich im Bereich der künstlichen Intelligenz auf Generative AI. Ihn fasziniert die Vision, in natürlicher Sprache mit Apps und Devices kommunizieren zu können. Sein Beratungsfokus ist die Entwicklung von AI-Workflows unter Verwendung von LLMs von OpenAI, Anthropic oder Mistral. Er ist Fan von Streamlit, LangChain und LangFuse, weil sich damit komplexe AI-Abläufe kompakt implementieren und fantastisch tracen lassen.

Marco Frodl
Track: Vortrag
09:00 - 09:45
Vortrag: Mi 1.1

Vortrag Teilen