more translation

This commit is contained in:
Aron Petau 2025-10-06 18:01:45 +02:00
parent 2ce9ca50b5
commit a41be821c1
997 changed files with 33247 additions and 32490 deletions

View file

@ -1,20 +1,20 @@
+++
title = "Übersetzung: Local Diffusion"
excerpt = "Empower your own Stable Diffusion Generation: InKüLe supported student workshop: Local Diffusion by Aron Petau"
title = "Lokale Diffusion"
excerpt = "Empower your own Stable Diffusion Generation: InKüLe unterstützter studentischer Workshop von Aron Petau"
date = 2024-04-11
authors = ["Aron Petau"]
banner = "images/local-diffusion/local-diffusion.png"
banner = "images/local-diffusion/local-diffusion.png"
description = "Ein praxisorientierter Workshop zur ethischen KI-Bilderzeugung durch lokale Stable Diffusion, bei dem Studierende lernen, Graphic Novels zu erstellen und die Bedeutung von lokalem Computing und Datensouveränität zu verstehen."
[taxonomies]
tags = [
"automatic1111",
"stable diffusion",
"comfyui",
"diffusionbee",
"inküle",
"Local Computing",
"Stable Diffusion",
"Workshop",
"university of the arts berlin"
"workshop",
"university of the arts berlin",
]
[extra]
@ -22,23 +22,147 @@ show_copyright = true
show_shares = true
+++
## Local Diffusion
## Kernfragen
[The official call for the Workshop](https://www.udk-berlin.de/universitaet/online-lehre-an-der-universitaet-der-kuenste-berlin/inkuele/11-april-24-aron-stable-diffusion/)
Ist es möglich, eine Graphic Novel mit generativer KI zu erstellen?
Was bedeutet es, diese neuen Medien in Zusammenarbeit mit anderen zu nutzen?
Und warum sind ihre lokalen und offline-Anwendungen wichtig?
Is it possible to create a graphic novel with generative A.I.?
What does it mean to use these emerging media in collaboration with others?
And why does their local and offline application matter?
[Offizielle Workshop-Dokumentation](https://www.inkuele.de/dokumentation/details/lokale-diffusion-br-empower-your-own-em-stable-diffusion-generation-em) | [Workshop-Ausschreibung](https://www.udk-berlin.de/universitaet/online-lehre-an-der-universitaet-der-kuenste-berlin/inkuele/11-april-24-aron-stable-diffusion/)
With AI becoming more and more democratised and GPT-like Structures increasingly integrated into everyday life, the black-box notion of the mysterious all-powerful Intelligence hinders insightful and effective usage of emerging tools. One particularly hands-on example is AI generated images. Within the proposed Workshop, we will dive into Explainable AI, explore Stable Diffusion, and most importantly, understand the most important parameters within it. We want to steer outcomes in a deliberate manner. Emphasis here is on open and accessible technology, to increase user agency and make techno-social dependencies and power relations visible.
## Workshop-Ziele & Struktur
Empower yourself against readymade technology!
Do not let others decide on what your best practices are. Get involved in the modification of the algorithm and get surprised by endless creative possibilities. Through creating a short graphic novel with 4-8 panels, participants will be able to utilise multiple flavours of the Stable Diffusion algorithm, and will have a non-mathematical understanding of the parameters and their effects on the output within some common GUIs. They will be able to apply several post-processing techniques to their generated images, such as upscaling, masking, inpainting and pose redrawing. Further, participants will be able to understand the structure of a good text prompt, be able to utilise online reference databases and manipulate parameters and directives of the Image to optimise desired qualities. Participants will also be introduced to ControlNet, enabling them to direct Pose and Image composition in detail.
### Fokus: Theoretische und spielerische Einführung in A.I.-Tools
## Workshop Evaluation
Der Workshop verfolgte ein doppeltes Ziel:
Over the course of 3 hours, I gave an introductory workshop in local stable diffusion processing and introduced participants to the server available to UdK Students for fast remote computation that circumvents the unethicality of continuously using a proprietary cloud service for similar outputs. There is not much we can do on the data production side and many ethical dilemmas surrounding digital colonialism remain, but local computation takes one step towards a critical and transparent use of AI tools by Artists.
1. **Niedrigschwelliger Einstieg**: Anfänger*innen einen zugänglichen Einstieg in die Text-to-Image-KI ermöglichen
2. **Kritische Diskussion**: Eine differenzierte politische Diskussion über die ethischen Auswirkungen dieser Tools anstoßen und bewusste Entscheidungsoptionen aufzeigen (wie lokal installierte Tools)
The Workshop format was rathert open and experimental, which was welcomed by the participants and they tried the collages enthusiastically. We also had a refreshing discussion on different positions regarding the ethicalities and whether a complete block of these tools is called for and feasible.
Das Lernformat wurde offen, praxisnah und experimentell gestaltet, wobei der Schwerpunkt auf dem kreativen Output der Teilnehmer*innen lag. Konkret wurden sie aufgefordert, in Gruppen zu arbeiten und gemeinsam mit der KI eine kurze Graphic Novel mit 4-8 Panels zu erstellen. Dabei mussten sie den Algorithmus aktiv verändern und sich mit den verschiedenen Funktionen und Schnittstellen vertraut machen.
I am looking forward to round 2 with the next iteration, where we are definitely diving deeper into the depths of comfyui, an interface that i absolutely adore, while its power also terrifies me sometimes.
### Workshop-Ablauf
Der Workshop war in zwei Hauptteile gegliedert:
#### Teil 1: Theoretische Einführung (45 Min.)
- Entmystifizierung der Prozesse, die im Hintergrund ablaufen
- Einführung in den Stable Diffusion Algorithmus
- Verständnis des Diffusionsprozesses und der Noise Reduction
- Unterschiede zu älteren Generative Adversarial Networks (GANs)
- Ethische Implikationen des Einsatzes von KI-Tools
#### Teil 2: Praktische Übungen (2+ Stunden)
- "Stadt-Land-Fluss"-Spiel zur Prompt-Konstruktion
- Erstellung einer Graphic Novel mit 4-8 Panels
- Experimentieren mit Parametern und Schnittstellen
- Nachbearbeitungstechniken (Upscaling, Maskieren, Inpainting, Pose Redrawing)
- Gruppenpräsentationen und Diskussion
### Das "Stadt-Land-Fluss"-Aufwärmspiel
Um die anfängliche Angst vor dem Prompting zu überwinden, spielten die Teilnehmer*innen eine Runde "Stadt-Land-Fluss" (Kategorien). Sie mussten vordefinierte Prompting-Unterkategorien wie "Thema", "Farbe", "Stil" und "Auflösung" mit Worten füllen, die mit bestimmten Buchstaben beginnen. Dieses Spiel fordert die Teilnehmenden heraus, sich in die kreative Gestaltung eines Prompts hineinzudenken, jenseits von vorgefertigten Sätzen, wie sie online zu finden sind.
## Warum lokale KI-Tools verwenden?
### Bewusst ethische und datenschutzrechtliche Faktoren miteinbeziehen
Eine zentrale Idee des Workshops war, die ethischen Implikationen des Einsatzes von KI-Tools in den Fokus zu rücken und Konsequenzen von lokaler Rechenleistung im Gegensatz zum Cloud-Computing hervorzuheben. Der Workshop thematisierte zwei wesentliche Unterschiede bei der Anwendung derselben KI-Modelle und -Algorithmen:
#### Option 1: Proprietäre Cloud-Dienste
- Populäre Plattformen wie Midjourney
- Schnittstelle von privaten Unternehmen bereitgestellt
- Oft gebührenpflichtig
- Ergebnisse auf Unternehmensservern gespeichert
- Daten für weiteres KI-Modell-Training verwendet
- Begrenzte Benutzerkontrolle und Transparenz
#### Option 2: Lokale Installation
- Selbst installierte Apps auf privaten Computern
- Selbst installierte GUIs oder Front-Ends über Browser zugänglich
- Vollständige Datensouveränität
- Keine Datenweitergabe an Dritte
- Offline-Fähigkeit
#### Option 3: Universitäts-gehostete Dienste
- Transparente Anbieter (z.B. UdK Berlin Server)
- Schneller und zuverlässiger als proprietäre Cloud-Dienste
- Daten weder an Dritte weitergegeben noch für Training verwendet
- Besser als proprietäre Dienste bei gleichzeitiger Zugänglichkeit
**Aus Perspektive des Datenschutzes sind lokale und universitäts-gehostete Lösungen bei weitem die bewussteren Wahlen.** Auch wenn UdK-Dienste technisch gesehen ebenfalls Cloud-Dienste mit auf einem Server gespeicherten Daten sind, stellen sie einen großen Unterschied zur Nutzung proprietärer Dienste wie OpenAI dar.
## Visuelles Erzählen mit Stable Diffusion
Die Teilnehmer*innen haben sich mit großer Begeisterung auf den Workshop-Prozess eingelassen. Sie probierten viele verschiedene Prompts und Einstellungen aus und produzierten Ergebnisse mit einer großen Vielfalt an ästhetischen und visuellen Erzählungen.
Der Workshop endete mit einer abschließenden Diskussion über:
- Die ethischen Implikationen des Einsatzes von KI-Tools
- Die Auswirkungen auf die verschiedenen kreativen Disziplinen
- Die Frage, ob eine vollständige Abschaffung dieser Tools notwendig oder überhaupt machbar ist
## Technischer Rahmen
Mit zunehmender Demokratisierung von KI und der Integration GPT-ähnlicher Strukturen in den Alltag behindert die Black-Box-Vorstellung der mysteriösen allmächtigen Intelligenz die aufschlussreiche und effektive Nutzung aufkommender Tools. Ein besonders praxisnahes Beispiel sind KI-generierte Bilder.
### Vorgestellte Tools & Schnittstellen
- **Stable Diffusion**: Der Kern-Algorithmus
- **ComfyUI**: Node-basiertes Front-End für Stable Diffusion
- **automatic1111**: GUI verfügbar auf UdK Berlin Servern
- **DiffusionBee**: Lokale Anwendungsoption
- **ControlNet**: Für detaillierte Pose- und Kompositionskontrolle
### Lernergebnisse
Die Teilnehmer*innen erlangten die Fähigkeit:
- Mehrere Varianten des Stable Diffusion Algorithmus zu nutzen
- Ein nicht-mathematisches Verständnis von Parametern und deren Effekten zu entwickeln
- Nachbearbeitungstechniken anzuwenden (Upscaling, Maskieren, Inpainting, Pose Redrawing)
- Effektive Text-Prompts zu konstruieren
- Online-Referenzdatenbanken zu nutzen
- Parameter zu manipulieren, um gewünschte Qualitäten zu optimieren
- ControlNet für detaillierte Pose- und Kompositionssteuerung zu verwenden
## Erfahrungsbericht von Aron Petau
### Die Student-als-Lehrer Perspektive
#### Über Vorbereitung und Herausforderungen
"Die Vorbereitung eines Workshops fühlte sich definitiv wie eine große Aufgabe an, weil ich das Bedürfnis hatte, Fragen zu Tools zu beantworten, die ich selbst gerade erst entdecke. Eine Sorge war, dass ich die Antwort auf ein fortgeschrittenes technisches Problem nicht geben kann. Dies stellte sich letztendlich als kein großes Problem heraus, was wahrscheinlich an der begrenzten Dauer des Workshops lag.
Was die Erfahrung mit einem KI-Workshop angeht, so bin ich der Meinung, dass es mehr als 3 Stunden braucht, um gemeinsam mit den Menschen in solche komplexen Werkzeuge einzutauchen. Selbst durch die Ausweitung des erklärenden/theoretischen Teils habe ich es nicht geschafft, alle Konzepte abzudecken, die ich im Vorfeld für wertvoll eingestuft habe... Dennoch erscheint mir die Dauer von 34 Stunden für einen Einführungsworkshop angemessen, da sich bei längeren Zeitspannen Fehler im Zeitmanagement summieren und hier vielleicht auch mehr Lehrerfahrung nötig wäre."
#### Über Workshop-Format und Atmosphäre
"Gut gefallen hat mir der eher hierarchiearme Rahmen des Workshops, bei dem klar war, dass es sich eher um ein Skillsharing und nicht um ein Vorlesungsformat handelt. Vor allem bei so praktischen Dingen wie der Bilderzeugung konnte ich, wenn ich die Wirkung eines Promptes oder von einem Parameter nicht kannte wie auch, das ist ja Sinn der Sache den Effekt einfach gemeinsam mit den Workshop-Teilnehmer*innen ausprobieren und dann die Ergebnisse untersuchen.
Die Teilnehmer*innen schienen das gewählte Format und den Schwierigkeitsgrad zu mögen, bei dem nicht zu viel Mathematik und Formeln vermittelt wurden, sondern eine Intuition für den zugrunde liegenden Prozess. Die Teilnehmer*innen beteiligten sich auch aktiv an der kritischen Diskussion über den ethischen Einsatz von KI und brachten Perspektiven aus ihren eigenen Bereichen ein, was ich sehr zu schätzen wusste."
#### Über das Erlernen didaktischer Praxis
"Während der Vorbereitung dieses Workshops hatte ich die Möglichkeit, selbständig zu arbeiten und meine Workshop-Termine selbst zu bestimmen und zu organisieren. Diese Freiheit und Autorität habe ich sehr geschätzt, aber ein etwas stärkerer Druck auf einen endgültigen Termin hätte mir geholfen, die Bedenken bezüglich der Lehrsituation schneller zu verlieren.
Jetzt freue ich mich auf eine mögliche Runde 2 eine nächste Iteration, in der wir tiefer in die Tiefen von ComfyUI eintauchen können, einer Schnittstelle, die ich absolut liebe, während ihre Macht mir manchmal auch Angst macht."
## Empowerment durch Verständnis
**Empower yourself against readymade technology!**
Lass nicht andere darüber entscheiden, was deine Best Practices sind. Beteilige dich an der Modifikation des Algorithmus und lass dich von endlosen kreativen Möglichkeiten überraschen. Durch die Erkundung lokaler KI-Tools können wir:
- Schritte hin zu einer kritischen und transparenten Nutzung von KI-Tools durch Künstler*innen gehen
- Die Handlungsmacht der Nutzer*innen erhöhen
- Techno-soziale Abhängigkeiten und Machtverhältnisse sichtbar machen
- Fragen des digitalen Kolonialismus ansprechen
- Datensouveränität und Privatsphäre bewahren
Während wir auf der Datenproduktionsseite nicht viel tun können und viele ethische Dilemmata rund um den digitalen Kolonialismus bestehen bleiben, ist lokales Computing ein Schritt hin zu einer kritischen und transparenten Nutzung von KI-Tools durch Künstler*innen.