Skip to content

Session 10: Working on projects

Date: 2025-12-04

Overview

Personal reflection session combined with project status presentations.

Plan

Working on the practical projects using generative AI tools. Each student presents their current project status, challenges faced, and next steps.

  • (Athanasios) Eigener Chatbot mit RAG --> Botkit, evtl. Ollama
  • (Alyssa) Grenzen des Image captioning? --> Montagsmaler
  • (Flavio) Warum können Modelle bestimmte Bilder nicht generieren? z.B. "Randvolles Weinglas" --> Versuch es mit einer AMD Grafikkarte zum Laufen zu bringen, lokal mit ComfyUI
  • (Leon) Video Generatoren vergleichen, lokales Modell (WAN-2) mit Cloud-Anbietern? --> WAN 2.2 läuft lokal fast, warten auf erste Ergebnisse
  • (Isabell) Freie, lokale Tools ausprobieren, --> depthAnything 3 läuft, Formate und Beispiele ausprobieren
  • (Chantal) Voice cloning, elevenlabs ? --> OpenVoice von myshell.ai (chinesisches Startup)
  • (Ali) Mittelgroßes SW Projekt generieren, Vibe coden ? --> nicht anwesend
  • (Uwe) Manim oder 3D Avatar oder 3D Szenen --> Manim läuft, erste Animationen erstellt

Results

  • (Athanasios) Eigener Chatbot mit RAG --> Ollama läuft, kleiner Chatbot mit tinyllama als Modell (das kleinste verfügbare Modell) läuft jetzt lokal.
  • (Alyssa) Grenzen des Image captioning? --> Montagsmaler --> Lösungen gefunden (Mattel, Quick draw Google), eine Pictionary Lösung gefunden, auf die man aufsetzen kann.
  • (Flavio) Warum können Modelle bestimmte Bilder nicht generieren? z.B. "Randvolles Weinglas" --> Versuch es mit einer AMD Grafikkarte zum Laufen zu bringen, lokal mit ComfyUI --> ComfyUI läuft jetzt, aber wir warten noch auf die ersten Bilder
  • (Leon) Video Generatoren vergleichen, lokales Modell (WAN-2) mit Cloud-Anbietern? --> WAN 2.2 läuft lokal fast, warten auf erste Ergebnisse --> WAN 2.2 doch nicht zum Laufen gebracht, es benötigt vermutlich CUDA-Unterstützung.
  • (Isabell) Freie, lokale Tools ausprobieren, --> depthAnything 3 läuft, Formate und Beispiele ausprobieren
  • (Chantal) Voice cloning, elevenlabs ? --> OpenVoice von myshell.ai (chinesisches Startup) --> OpenVoice ging nicht, auf VALL-E-X umgestiegen
  • (Ali) Mittelgroßes SW Projekt generieren, Vibe coden ? --> nicht anwesend
  • (Uwe) Manim oder 3D Avatar oder 3D Szenen