Session 10: Working on projects¶
Date: 2025-12-04
Overview¶
Personal reflection session combined with project status presentations.
Plan¶
Working on the practical projects using generative AI tools. Each student presents their current project status, challenges faced, and next steps.
- (Athanasios) Eigener Chatbot mit RAG --> Botkit, evtl. Ollama
- (Alyssa) Grenzen des Image captioning? --> Montagsmaler
- (Flavio) Warum können Modelle bestimmte Bilder nicht generieren? z.B. "Randvolles Weinglas" --> Versuch es mit einer AMD Grafikkarte zum Laufen zu bringen, lokal mit ComfyUI
- (Leon) Video Generatoren vergleichen, lokales Modell (WAN-2) mit Cloud-Anbietern? --> WAN 2.2 läuft lokal fast, warten auf erste Ergebnisse
- (Isabell) Freie, lokale Tools ausprobieren, --> depthAnything 3 läuft, Formate und Beispiele ausprobieren
- (Chantal) Voice cloning, elevenlabs ? --> OpenVoice von myshell.ai (chinesisches Startup)
- (Ali) Mittelgroßes SW Projekt generieren, Vibe coden ? --> nicht anwesend
- (Uwe) Manim oder 3D Avatar oder 3D Szenen --> Manim läuft, erste Animationen erstellt
Results¶
- (Athanasios) Eigener Chatbot mit RAG --> Ollama läuft, kleiner Chatbot mit tinyllama als Modell (das kleinste verfügbare Modell) läuft jetzt lokal.
- (Alyssa) Grenzen des Image captioning? --> Montagsmaler --> Lösungen gefunden (Mattel, Quick draw Google), eine Pictionary Lösung gefunden, auf die man aufsetzen kann.
- (Flavio) Warum können Modelle bestimmte Bilder nicht generieren? z.B. "Randvolles Weinglas" --> Versuch es mit einer AMD Grafikkarte zum Laufen zu bringen, lokal mit ComfyUI --> ComfyUI läuft jetzt, aber wir warten noch auf die ersten Bilder
- (Leon) Video Generatoren vergleichen, lokales Modell (WAN-2) mit Cloud-Anbietern? --> WAN 2.2 läuft lokal fast, warten auf erste Ergebnisse --> WAN 2.2 doch nicht zum Laufen gebracht, es benötigt vermutlich CUDA-Unterstützung.
- (Isabell) Freie, lokale Tools ausprobieren, --> depthAnything 3 läuft, Formate und Beispiele ausprobieren
- (Chantal) Voice cloning, elevenlabs ? --> OpenVoice von myshell.ai (chinesisches Startup) --> OpenVoice ging nicht, auf VALL-E-X umgestiegen
- (Ali) Mittelgroßes SW Projekt generieren, Vibe coden ? --> nicht anwesend
- (Uwe) Manim oder 3D Avatar oder 3D Szenen