April 29, 2025 (4:00 PM - 5:00 PM)
Wir wollen verschiedene Transkriptions, LLM Experimente zusammentragen, um zu sehen welche Tools vielversprechend sind.
Notizen vom ersten Treffen 👇
___
**Termin 15.04.**
**Anwesend: Jenny, Damian, Julius, Lena**
**1\. Problemstellung & Zielsetzung**
- Dokumentation bei Barcamps oft lästig – dokumentierende Person kann nicht richtig teilnehmen
- Ziel: smarter Weg über Einsatz von Sprachmodellen
- Großes Interesse, eine sinnvolle Dokumentationsform zu finden
- Herausforderungen: Datenschutz muss beachtet werden, nur EU-gehostete Tools
- Wichtig: Auswirkungen der Aufzeichnung auf Teilnehmende mitdenken
**2\. Rahmenbedingungen & Anforderungen**
- Doku soll nicht zwingend am selben Tag fertig sein – kein Zeitdruck
- Fokus auf Nachbereitung → Möglichkeit, über Prompts gute Ergebnisse zu erzielen
- Soll möglichst wenig mit Barcamp-Ablauf interferieren
- Ergänzend zur klassischen Dokumentation
- Session-Zusammenfassungen im Plenum durch Teilnehmende bleiben bestehen
- Consent der Teilnehmenden nötig? → Klärung, ob schriftlich erforderlich
- Transparenz:
- Audio wird nicht angehört, nur maschinell verarbeitet
- Keine Namen im Endprodukt
**3\. Technisches Konzept & Setup**
- Idee: ein Raum mit Technik-Setup für Audioaufzeichnung (voraussichtlich der kleinere Session-Raum)
- Dort gezielt Sessions einplanen, die sich für das Experiment eignen
- Keine Frontalvorträge oder Workshops, in denen mehrere Kleingruppen arbeiten
- Fokus auf Diskussionsformate/Roundtables mit Beteiligung aller
- Herausforderung: leise Sprecher:innen werden schlecht erkannt → muss technisch abgefangen werden
- Hochwertige Audiofiles sind Voraussetzung
- Handys grundsätzlich geeignet, aber:
- mehrere Einzelaufnahmen nötig
- hoher Aufwand beim Zusammenführen
**4\. Tools & Erfahrungen**
- Damian: Transkription oft schlecht, LLM glättet erstaunlich gut
- Tool-Vorschlag: **Argdown** ([https://argdown.org/sandbox/map](https://argdown.org/sandbox/map))
- Ziel: Argumente strukturiert und nachvollziehbar darstellen
- Idee von Damian, aber: aufwendig & nicht für jede Diskussion geeignet
- Damian: Sprecher:innen-Erkennung besonders wichtig bei Diskussionen
- **Parrot Park**
- Gehostet von CorrelAid und D64
- Keine Transkription, aber Weiterverarbeitung von Transkripten möglich
- Frage: Gibt’s eine API?
- **Whisper**
- Julius hat Erfahrung → öfter „Kauderwelsch“
- Damian möchte **Whishper** testen ([https://whishper.net/](https://whishper.net/))
- Jenny: **Apple Voice Memo** ausprobiert – besser als OLLAMA
- Tools für Übersetzung:
- [https://de.libretranslate.com/](https://de.libretranslate.com/)
- [https://www.argosopentech.com/](https://www.argosopentech.com/)
**5\. Datenschutz & Akzeptanz**
- Datenschutzkritisch: besonders der Teil, wo Audio verarbeitet wird
- Bedenken: Aufzeichnungsraum könnte Teilnahme für manche einschränken
- Gefahr: „Teilnahme nur mit Aufzeichnung“ → intransparent
- Idee: **Umfrage auf Humhub**, um Akzeptanz und Bereitschaft vorab einzuschätzen
**6\. Nächste Schritte / Orga**
- In den nächsten 2 Wochen Transkribierungstools testen
- Julius stellt über GitHub eine absichtlich „schlechte“ Audio zur Verfügung → Test mit versch. Tools
- Ziel: Transkribieren + Zusammenfassen ausprobieren
- Lena fragt nach guten Mikros → Gibt es welche bei GI? Caritas? Wo ist aktuell unser Podcast-Equipment?
- Beim Barcamp Jenny und Damian versuchen früher zur Location zu kommen
nächster Termin: **29\.04., 16:00 Uhr**
Julius Falk ·
Julius Falk ·