Kristallkugel auf Tisch in der Innenstadt von Jena

Datenwerkstatt Jena 2024

Information on the Data Literacy Datathon at the University Jena
Kristallkugel auf Tisch in der Innenstadt von Jena
Image: Volker Schwartze (based on DeinJena from Pixabay)

Here you can find detailed information about the "Datenwerkstatt Jena 2024" which will take place at the University Jena 5 - 7 March.

Organisational Points

Challenges

Workshops

Organisational Points

Date: March 5th - 7th, 2024 
Location: Seminar Room 206, Carl-Zeiß-Straße 3
Registration: Registration FormExternal link

As part of the event, participants will work in interdisciplinary teams on one of the provided challenges. The seminar room will be available from 10 am to 6 pm during the event. Here's what we offer:

  • Workplace for the groups,
  • Support from mentors for technical or methodological questions,
  • Accompanying workshops,
  • Refreshments (coffee, tea, water).

Groups are not restricted to this time frame for working on the challenges and can organize their project work independently. There are only a few agenda items where attendance is mandatory, which you can find in the following schedule.

Grafische Darstellung des Zeitplans der Datenwerkstatt Jena 2024

Image: Volker Schwartze

Day 1 (March 5th)

Time Event

10:00 – 10:15 Uhr

Start of the event

Welcome Address

10:15 – 10:30 Uhr

Event Logistics

Agenda & Schedule

10:30 – 11:20 Uhr Presentation of Challenges by the Challenge Hosts
11:20 – 11:45 Uhr

Group Formation

Start of Working Phase

Day 2 (March 6th)

Time Event

10:00 – 10:15 Uhr

Start Day 2
10:15 – 10:45 Uhr Feedback Session with Challenge Hosts regarding Project Status and Further Planning

Day 3 (March 6th)

Time Event

13:30 – 16:00 Uhr

Project Presentations by the Teams
Discussion with Participants and Challenge Hosts                
16:00 – 16:30 Uhr     

Closing Remarks and Farewell

16:30 Uhr

End of the event

Challenges

Here are descriptions of the different challenges. Categories are provided to help you better understand the nature of each challenge.

Classic: Data and questions are provided by our partners and are to be solved through data analysis.

Conceptual: Development of concepts for answering questions (What data is needed? How can it be obtained? How can it be made usable for others?)

Creative: Development of, for example, visualizations, infographics, or dashboards on various topics.

  • Entscheidungsgründe – Warum entscheiden sich Studierende für die Universität Jena? (Universität Jena)

    Challengetyp: konzeptionell

    Die FSU Jena verzeichnet heute geringere Studierendenzahlen als noch vor einigen Jahren. Die Ursachen hierfür sind vielfältig und werden in verschiedenen Struktureinheiten analysiert. Für diese Analyse ist es u.a. von besonderer Bedeutung zu wissen, wieso – d.h. vor welchen Hintergründen und aus welchem Gründen – sich Studienanfänger/innen für ein Studium an der FSU Jena entscheiden.

    In der Vergangenheit wurden diese Entscheidungsgründe über sog. Erstsemesterbefragungen erhoben. Die letzte Erstsemesterbefragung fand im Wintersemester 2019/2020 statt ohne umfangreiche Auswertung, sodass davon ausgegangen wird, dass sich die Entscheidungsgründe grundsätzlich verändert haben und auch das Befragungsdesign der tatsächlichen Komplexität einer heutigen Studienentscheidung nicht mehr gerecht wird. Es wird unterstellt, dass ein differenziertes Zusammenspiel aus Fach-, Standort- und Sozialfaktoren zur Studienentscheidung führt; dieses Zusammenspiel unterscheidet sich erheblich entlang von Fachkulturen, Zulassungsbeschränkungen, Studienabschlüssen usw. – und zudem zwischen nationalen und internationalen Studierenden. Auch die Relevanz der für eine Entscheidung wichtigen Ansprache- und Kontaktwege – vom Schulbesuch und Hochschulinformationstag bis zu Plakat- und Social-Media-Ansprache – dürfte sich im Vergleich zur Erhebung vor der Corona-Pandemie inzwischen verschoben haben. Vor dem Hintergrund dieser Komplexität wird als Challenge eine Neukonzeption einer Erhebung der Hintergründe einer Studienaufnahme an der FSU Jena vorgeschlagen.

  • Woher kommen die Studierenden der Universität Jena? (Universität Jena)

    Challengetyp: kreativ

    Die Universität Jena verzeichnet heute geringere Studierendenzahlen als noch vor einigen Jahren. Die Ursachen hierfür sind vielfältig und werden in verschiedenen Struktureinheiten analysiert. Für diese Analysen und zur Ableitung geeigneter Marketingaktivitäten ist es von besonderer Bedeutung zu wissen, woher die Studierenden an der Universität Jena kommen und dies nicht nur tabellarisch und graphisch, sondern auch kartographisch darzustellen. Diese Karten und damit die Sichtbarmachung der Herkunftsregionen der Studierenden auf einen Blick können insbesondere in den universitären Gremien eine wichtige Entscheidungsgrundlage sein. Zusätzlich gibt es einen fortlaufenden Bedarf an interessant und ansprechend gestalteten Materialien für Zwecke der internen und externen Öffentlichkeitsarbeit.

    Im Rahmen der Challenge sollen entsprechende Visualisierungen erarbeitet werden, die auch nach dem Projekt nachhaltig für die Universität nachgenutzt und weiterentwickelt werden können.

  • Kulturhistorisch bedeutsame Bauwerke (in Jena): Entwicklung von generischen Workflows zur Analyse und Anreicherung mit OpenStreetMap und Wikidata (ThULB)

    Challengetyp: konzeptionell

    Für die Vernetzung von Kulturdaten sind die Orte und Institutionen wichtig, mit denen diese Daten verbunden sind. Doch manchmal liegt darin nur eine Adresse vor, manchmal nur ein Gebäudename. Mit zentralen, offenen Datendiensten wie OpenStreetMap und Wikidata kann man solche Informationen miteinander verknüpfen und anreichern. Doch wie können effektive Prozesse zur Datenanalyse und -anreicherung aussehen, um fehlende Daten zu ergänzen oder falsche Angaben zu erkennen und zu korrigieren?

    Am Beispiel von kulturhistorisch bedeutsamen Gebäuden und Denkmälern in Jena wollen wir Workflows zur Arbeit mit OpenStreetmap und Wikidata entwickeln. Welche Bauwerke sind in welchem System vorhanden, wo fehlen Identifier, wo ganze Datensätze? Welche Werkzeuge erlauben es, die Daten zu pflegen? Geht das auch mobil – etwa bei einem Spaziergang durch die Stadt? Wie nutzt man die Query-Services sowie lesende und schreibende APIs dieser so wichtigen OpenData-Infrastrukturen?

  • Automatisierte Erkennung historischer Universitätsprogramme in Bibliothekskatalogen (ThULB)

    Challengetyp: konzeptionell/klassisch

    Das Projekt zielt darauf ab, die Zugänglichkeit historischer Universitätsprogramme aus dem 16.-18. Jahrhundert zu verbessern. Mit einer Sammlung von ca. 15.000 Originaldokumenten aus Bibliotheken und Archiven der Thüringer Universitäten beabsichtigen die Historischen Sammlungen der ThULB Jena und das Universitätsarchiv Jena, diese bisher wenig erforschten Universitätsprogramme als wichtige Quelle zu erschließen.

    Das Hauptproblem liegt in der Identifizierung dieser Programme, da sie in Bibliothekskatalogen unzureichend erfasst sind. Die Textanfänge, die formelhaft mit Begriffen wie "Rector et Senatus", "Rector Academiae", oder ähnlichem beginnen, könnten helfen, diese Programme zu identifizieren. Durch die Kombination dieser Anfänge mit weiteren Parametern wie Erscheinungsdatum und -ort sollen automatisierte Methoden entwickelt werden, um die Programme in Katalogen zu identifizieren und als eigenständige Textgattung zu definieren. Dabei soll insbesondere auch festgestellt werden, inwieweit Methoden des maschinellen Lernens ("KI") hierbei helfen können.

  • Kindergartenkinder in Jena (Smart City Projekt Jena)

    Challengetyp: klassisch/ kreativ

    Die Stadt Jena hat das „Luxusproblem“, dass jedes Kind im Kindergartenalter garantiert einen Kindergartenplatz erhalten kann. Bis zum Jahr 2030 läuft das wegen rückgehender Geburten auf eine Überkapazität von rund 1000 Kindergartenplätzen hinaus. Aus diesem Grund wurde von der Integrativen Sozialplanung ein Prozess zu Bewertung von Kindertagestätten angestoßen. Damit werden die Kindergärten bezüglich verschiedener Indikatoren bewertet und in ein Ranking gebracht.

    Aufgabe ist die Weiterentwicklung des Kindergartenerreichbarkeitstool der Stadt Jena. Das ist eine R-Flexdashboard Entwicklung mit Shiny Komponenten. Durch das Dashboard soll es möglich werden verschiedene Szenarien durchzuspielen. Dies kann einerseits durch unterschiedliche Gewichtung der Indikatoren geschehen, anderseits durch einen (historischen) Zeitverlauf. Die einzelnen Szenarien sollten gespeichert werden können (z.B. in einer SQLite-Datenbank) und gegebenenfalls in übersichtlichen Fact-Sheet ausgedruckt werden können (z.B. im HTML-, PDF-Format). Fact-Sheet wie Dashboard sollten eine Grafik enthalten, in der die Ergebnisse visuell dargestellt werden. Auch eine Kartendarstellung könnte diese Lösung bieten.

Accompanying Workshops

Here you'll find information about the accompanying workshops for the Datathon. The list is currently under construction and will be further revised until the event.

Date Time Topic Trainer
March, 5th 12:00 - 13:00 Projekt Management tba
  14:00 - 15:30 OpenRefine zur Datenbereinigung Volker Schwartze
  15:30 - 17:00

OpenRefine & Linked Open Data

Michael Markert
March, 7th 11:00 - 12:30 tba tba
  14:00 - 15:30 Maschinelles Lernen für Einsteiger*innen tba