Skip to content

Session 12: Final presentation of projects

Date: 2026-06-15

Overview

Students present their completed practical projects.

Plan

Project presentations should cover:

  • Selected tool and its capabilities
  • Project implementation
  • Results and findings
  • Lessons learned

Then the class will continue with critics and reflections about the use of AI. We will read and discuss several articles.

Project presentations

Joshua: Voice cloning

Ergebnis

Notizen

  • alles nur mit Hilfe des Agenten umgesetzt.
  • Zunächst nur auf der CPU gearbeitet. F5TTS als Tool, Ergebnis klingt nach einem Holländer, aber die Stimme ist erkennbar.
  • Dann auf der VM mit GPU gearbeitet, GPT-SO-VITSv2 als Modell, erstes Ergebnis nur Rauschen, weil nur 30 Sekunden der Audiodaten verwendet wurden.
  • Dann Verbesserung mit anderen zero-shot Modellen:
  • Dann cosy voice, aber deutsche Texte klingen weiterhin nicht gut.
  • Als Trainingsdaten wurden die Vorlesungsvideos von Uwe Hahne verwendet, daraus wurden Audio und Text extrahiert, um die Stimme zu trainieren. Es gab keinen Kontrollschritt um zu überprüfen, ob die extrahierten Texte richtig transkribiert wurden.

Sebastian Regelmann: ComfyUI: Text-to-Image & LoRA Training

Ergebnis

Notizen

  • ComfyUI als das Standard Tool identifiziert, um Text-to-Image und LoRA Training zu machen.
  • es war schwierig die richtigen Modelle auf HuggingFace zu finden
  • Ein Flux1 basiertes LoRA wuerde trainiert, richtige CUDA Version zu finden war schwierig, hier konnte der Agent helfen
    • es gab noch Probleme mit den richtigen Modellversionen, fp8 vs fp16 usw.
    • es dauerte ungefährt 3,5h für 20 Epochen (Rank 64 für das LoRA)
  • LoRA Training für SD3.5 lief nicht, weil es Fehler beim U-Net gab. Vom Speicherbedarf sollte es gehen.
  • LoRA Training für Flux2.dev ging nicht, es kam ein Out-of-memory Fehler. Vermutlich ist eine Grafikkarte mit 80GB notwendig.
  • Ergebnis nicht optimal, vermutlich weil die Eingabebilder recht verpixelt und nicht in der optimalen Auflösung von 1024x1024 vorlagen.
  • Keine Live-Demo, weil die VM nicht verfügbar war am 15.6. - für die ersten Ergebnisse wurden nur die Standard-Parameter verwendet

Sebastian Bauer: GenAI Educational Media Pipeline

Ergebnis

Notizen

  • Pipeline erstellt, um Stimme und Bilder zusammen zu fügen und ein Lehrvideo zu erstellen
  • Agent konnte eigenständig fast alles installieren und einrichten
  • Endergebnis sieht merkwürdig aus und der Avatar liest nur die Folientexte vor. Englische Stimme klingt gut, aber nicht nach Uwe Hahne.
    • das finale Video (100 Sekunden) wurde in ungefähr 3 Stunden generiert, die meisten Zeit verbrauchte die Generierung der einzelnen Frames des Avatars mit der richtigen Lippenbewegung (Hallo2 von Baidu).

First reading

The machines are fine. I'm worried about us. (Published by Minas Karamanis,archived version)

  • What do you think about the article? Do you agree with the author?
  • Do you think that the article is too optimistic or too pessimistic about the future of AI?
  • What are the main risks and benefits of AI that you see in the article?

Second reading

The machines are not, in fact, fine. by Boxo Barks

  • What do you think now?

Further reading:

Videos

We watch this video. Is it real or fake? How can you tell?

Resolution

The video is obviously fake. See this explanation at mimikama.org and check out their page for further exaamples of fake news.

Articles for discussion

GenAI in art (Joshua)

GenAI and cyber security (Sebastian Bauer)

GenAI and deep fakes (Sebastian Regelmann)

Homework

Read the articles of your topic (including provided links) thoroughly and prepare answers to the following questions:

  • Who is the author, and what is their background and affiliation?
  • What is the main argument or thesis of the article?
  • What evidence or examples does the author provide to support their claims?
  • Does the author address potential counterarguments or alternative perspectives?
  • Which other sources confirm or contradict the author's points?
  • What is your personal stance on the issues raised in the article?

Results

tbd