Civic Data Cafe

Willkommen im Civic Data Lab Community space

113
Posts
2
Members
0
Followers
Julius Falk · ·
Last updated Apr 16, 2025 - 2:00 PM Visible also to unregistered users

April 29, 2025 (4:00 PM - 5:00 PM)

Wir wollen verschiedene Transkriptions, LLM Experimente zusammentragen, um zu sehen welche Tools vielversprechend sind. Notizen vom ersten Treffen 👇 ___ **Termin 15.04.** **Anwesend: Jenny, Damian, Julius, Lena** **1\. Problemstellung & Zielsetzung** - Dokumentation bei Barcamps oft lästig – dokumentierende Person kann nicht richtig teilnehmen - Ziel: smarter Weg über Einsatz von Sprachmodellen - Großes Interesse, eine sinnvolle Dokumentationsform zu finden - Herausforderungen: Datenschutz muss beachtet werden, nur EU-gehostete Tools - Wichtig: Auswirkungen der Aufzeichnung auf Teilnehmende mitdenken **2\. Rahmenbedingungen & Anforderungen** - Doku soll nicht zwingend am selben Tag fertig sein – kein Zeitdruck - Fokus auf Nachbereitung → Möglichkeit, über Prompts gute Ergebnisse zu erzielen - Soll möglichst wenig mit Barcamp-Ablauf interferieren - Ergänzend zur klassischen Dokumentation - Session-Zusammenfassungen im Plenum durch Teilnehmende bleiben bestehen - Consent der Teilnehmenden nötig? → Klärung, ob schriftlich erforderlich - Transparenz: - Audio wird nicht angehört, nur maschinell verarbeitet - Keine Namen im Endprodukt **3\. Technisches Konzept & Setup** - Idee: ein Raum mit Technik-Setup für Audioaufzeichnung (voraussichtlich der kleinere Session-Raum) - Dort gezielt Sessions einplanen, die sich für das Experiment eignen - Keine Frontalvorträge oder Workshops, in denen mehrere Kleingruppen arbeiten - Fokus auf Diskussionsformate/Roundtables mit Beteiligung aller - Herausforderung: leise Sprecher:innen werden schlecht erkannt → muss technisch abgefangen werden - Hochwertige Audiofiles sind Voraussetzung - Handys grundsätzlich geeignet, aber: - mehrere Einzelaufnahmen nötig - hoher Aufwand beim Zusammenführen **4\. Tools & Erfahrungen** - Damian: Transkription oft schlecht, LLM glättet erstaunlich gut - Tool-Vorschlag: **Argdown** ([https://argdown.org/sandbox/map](https://argdown.org/sandbox/map)) - Ziel: Argumente strukturiert und nachvollziehbar darstellen - Idee von Damian, aber: aufwendig & nicht für jede Diskussion geeignet - Damian: Sprecher:innen-Erkennung besonders wichtig bei Diskussionen - **Parrot Park** - Gehostet von CorrelAid und D64 - Keine Transkription, aber Weiterverarbeitung von Transkripten möglich - Frage: Gibt’s eine API? - **Whisper** - Julius hat Erfahrung → öfter „Kauderwelsch“ - Damian möchte **Whishper** testen ([https://whishper.net/](https://whishper.net/)) - Jenny: **Apple Voice Memo** ausprobiert – besser als OLLAMA - Tools für Übersetzung: - [https://de.libretranslate.com/](https://de.libretranslate.com/) - [https://www.argosopentech.com/](https://www.argosopentech.com/) **5\. Datenschutz & Akzeptanz** - Datenschutzkritisch: besonders der Teil, wo Audio verarbeitet wird - Bedenken: Aufzeichnungsraum könnte Teilnahme für manche einschränken - Gefahr: „Teilnahme nur mit Aufzeichnung“ → intransparent - Idee: **Umfrage auf Humhub**, um Akzeptanz und Bereitschaft vorab einzuschätzen **6\. Nächste Schritte / Orga** - In den nächsten 2 Wochen Transkribierungstools testen - Julius stellt über GitHub eine absichtlich „schlechte“ Audio zur Verfügung → Test mit versch. Tools - Ziel: Transkribieren + Zusammenfassen ausprobieren - Lena fragt nach guten Mikros → Gibt es welche bei GI? Caritas? Wo ist aktuell unser Podcast-Equipment? - Beim Barcamp Jenny und Damian versuchen früher zur Location zu kommen nächster Termin: **29\.04., 16:00 Uhr**  
Participants
2 Attending · 0 Undecided · 0 Declined · 1 Invited