Session 12: Final presentation of projects¶

Date: 2026-06-15

Overview¶

Students present their completed practical projects.

Plan¶

Project presentations should cover:

Selected tool and its capabilities
Project implementation
Results and findings
Lessons learned

Then the class will continue with critics and reflections about the use of AI. We will read and discuss several articles.

Project presentations¶

Joshua: Voice cloning¶

Ergebnis ¶

Notizen¶

alles nur mit Hilfe des Agenten umgesetzt.
Zunächst nur auf der CPU gearbeitet. F5TTS als Tool, Ergebnis klingt nach einem Holländer, aber die Stimme ist erkennbar.
Dann auf der VM mit GPU gearbeitet, GPT-SO-VITSv2 als Modell, erstes Ergebnis nur Rauschen, weil nur 30 Sekunden der Audiodaten verwendet wurden.
Dann Verbesserung mit anderen zero-shot Modellen:
Dann cosy voice, aber deutsche Texte klingen weiterhin nicht gut.
Als Trainingsdaten wurden die Vorlesungsvideos von Uwe Hahne verwendet, daraus wurden Audio und Text extrahiert, um die Stimme zu trainieren. Es gab keinen Kontrollschritt um zu überprüfen, ob die extrahierten Texte richtig transkribiert wurden.

Sebastian Regelmann: ComfyUI: Text-to-Image & LoRA Training¶

Ergebnis ¶

Notizen¶

ComfyUI als das Standard Tool identifiziert, um Text-to-Image und LoRA Training zu machen.
es war schwierig die richtigen Modelle auf HuggingFace zu finden
Ein Flux1 basiertes LoRA wuerde trainiert, richtige CUDA Version zu finden war schwierig, hier konnte der Agent helfen
- es gab noch Probleme mit den richtigen Modellversionen, fp8 vs fp16 usw.
- es dauerte ungefährt 3,5h für 20 Epochen (Rank 64 für das LoRA)
LoRA Training für SD3.5 lief nicht, weil es Fehler beim U-Net gab. Vom Speicherbedarf sollte es gehen.
LoRA Training für Flux2.dev ging nicht, es kam ein Out-of-memory Fehler. Vermutlich ist eine Grafikkarte mit 80GB notwendig.
Ergebnis nicht optimal, vermutlich weil die Eingabebilder recht verpixelt und nicht in der optimalen Auflösung von 1024x1024 vorlagen.
Keine Live-Demo, weil die VM nicht verfügbar war am 15.6. - für die ersten Ergebnisse wurden nur die Standard-Parameter verwendet

Sebastian Bauer: GenAI Educational Media Pipeline¶

Ergebnis ¶

Notizen¶

Pipeline erstellt, um Stimme und Bilder zusammen zu fügen und ein Lehrvideo zu erstellen
Agent konnte eigenständig fast alles installieren und einrichten
Endergebnis sieht merkwürdig aus und der Avatar liest nur die Folientexte vor. Englische Stimme klingt gut, aber nicht nach Uwe Hahne.
- das finale Video (100 Sekunden) wurde in ungefähr 3 Stunden generiert, die meisten Zeit verbrauchte die Generierung der einzelnen Frames des Avatars mit der richtigen Lippenbewegung (Hallo2 von Baidu).

First reading¶

The machines are fine. I'm worried about us. (Published by Minas Karamanis,archived version)

What do you think about the article? Do you agree with the author?
Do you think that the article is too optimistic or too pessimistic about the future of AI?
What are the main risks and benefits of AI that you see in the article?

Second reading¶

The machines are not, in fact, fine. by Boxo Barks

What do you think now?

Videos¶

We watch this video. Is it real or fake? How can you tell?

Resolution¶

The video is obviously fake. See this explanation at mimikama.org and check out their page for further exaamples of fake news.

Articles for discussion¶

GenAI in art (Joshua)¶

AI Art and its Impact on Artists by Harry Jiang et al.
Let's talk about AI art by Mathew Inman

GenAI and cyber security (Sebastian Bauer)¶

When AI builds itself, blog post by Anthropic AI
- Bluesky thread about the blog post from Anthropic by Elaine Burke
Claude Mythos, ChatGPT-5.5 und die Cybersicherheit veröffentlicht durch die Max-Planck-Gesellschaft auf Basis eines Interviews mit Prof. Dr. Thorsten Holz, dem Direktor des Max-Planck-Instituts für Sicherheit und Privatsphäre, Bochum (28. Mai 2026)
Additional information about Claude Mythos resp. rumors and fake news about Anthropic at mimikama.org

GenAI and deep fakes (Sebastian Regelmann)¶

Tagesschau - Hubig legt Gesetzentwurf gegen digitale Gewalt vor
Gesetzentwurf März 2026 der Abgeordneten Dr. Lena Gumnior, Helge Limburg, Dr. Till Steffen, Lukas Benner, Awet Tesfaiesus, Dr. Franziska Brantner, Stefan Schmidt und der Fraktion BÜNDNIS 90/DIE GRÜNEN. Entwurf eines Gesetzes zur Änderung des Strafgesetzbuches – Strafbarkeit bildbasierter sexualisierter Gewalt
Epik, Aziz: Deepfakes und die Strafrechtsfalle: Weshalb die Diskussion um eine Kriminalisierung sexualisierter Deepfakes zu kurz greift, VerfBlog, 2026/3/24, DOI: 10.59704/3f827f8be3f7d68a.
Gesetzentwurf August 2025 des Bundesrates. Entwurf eines Gesetzes zum strafrechtlichen Schutz von Persönlichkeitsrechten vor Deepfakes.

Homework¶

Read the articles of your topic (including provided links) thoroughly and prepare answers to the following questions:

Who is the author, and what is their background and affiliation?
What is the main argument or thesis of the article?
What evidence or examples does the author provide to support their claims?
Does the author address potential counterarguments or alternative perspectives?
Which other sources confirm or contradict the author's points?
What is your personal stance on the issues raised in the article?

Results¶

tbd

Session 12: Final presentation of projects¶

Overview¶

Plan¶

Project presentations¶

Joshua: Voice cloning¶

Ergebnis¶

Notizen¶

Sebastian Regelmann: ComfyUI: Text-to-Image & LoRA Training¶

Ergebnis¶

Notizen¶

Sebastian Bauer: GenAI Educational Media Pipeline¶

Ergebnis¶

Notizen¶

First reading¶

Second reading¶

Videos¶

Resolution¶

Articles for discussion¶

GenAI in art (Joshua)¶

GenAI and cyber security (Sebastian Bauer)¶

GenAI and deep fakes (Sebastian Regelmann)¶

Homework¶

Results¶

Ergebnis ¶

Ergebnis ¶

Ergebnis ¶