[DHd-blog] Einreichungen zur DHd 2019

[德语国家数字人文协会DHd-blog网站消息]

Die DHd 2019 findet dieses Jahr unter dem Motto ‚multimedial und multimodal‘ vom 25. bis zum 29. März in Frankfurt und Mainz statt. Der für diesen Beitrag genutzte Datensatz basiert auf Informationen aus dem Konferenz-Managementsystem Conftool, über das alle Einreichungen angemeldet wurden. Der Beitrag orientiert sich an dem Blogeintrag von Ulrike Henny-Krahmer und Prof. Dr. Sahle aus dem letzten Jahr, welche die Daten der DHd 2018 ausgewertet haben.

Allgemeine Daten

Abb.1: Einreichungen nach Annahmestatus in Prozent
Abb.2: Anteile am Programm in Prozent

Die DHd setzt sich generell aus Vorträgen, Postern, Panels und Workshops zusammen. In diesem Jahr gab es insgesamt 189 Beiträge, von denen 135 angenommen und acht zurückgezogen wurden – damit ergibt sich die in Abb. 1 dargestellte Verteilung. Die Mehrheit der akzeptierten Einreichungen machen Poster (57) und Vorträge (56) aus, während Workshops (16) und Panel (6) nur einen kleinen Teil des Programms stellen (Abb. 2).

Ab diesem Punkt beziehen sich alle präsentierten Zahlen und Grafiken nur auf angenommene Beiträge für die DHd 2019.

Die AutorInnen

Im letzten Jahr lag der Anteil der Einreichungen mit nur einem Autor bei 27,3%, während dieser 2019 auf 21% gefallen ist (Abb. 3). Dies bedeutet im Umkehrschluss, dass die Zahl der Gruppeneineichungen gewachsen ist, weshalb man davon ausgehen kann, dass das gemeinsame, teils interinstitutionelle Arbeiten immer verbreiteter ist.

Abb.3: Einzel- vs. Gruppeneinreichungen in Prozent

Diese Zahlen bestärken die von Sahle und Henny-Krahmer aufgestellte These vom letzten Jahr:

„Eine mögliche Erklärung [für den hohen Anteil an Gruppeneinreichungen] liegt wohl darin, dass Poster häufiger auf Projekte bezogen sind, die in den DH meistens in Teamarbeit durchgeführt werden. Dagegen sollten Vorträge eher einzelne Forschungsfragen behandeln. Dass selbst dabei die Quote der Einzelbeiträger nur ein Drittel beträgt, zeigt wie das Muster kollaborativer Forschung sich auch auf diesen Bereich erstreckt.“

Alle angenommenen Workshops sind in Teamarbeit entstanden. Erfolgreiche Vorschläge für Poster wurden von einzelnen Autoren oder Gruppen mit bis zu zehn Mitgliedern eingereicht. Die Grafik zu Einreichungsformen verdeutlicht die Verteilung der Anzahl von AutorInnen (s. Abb. 4).

Abb. 4: Verteilung von Einzel- und Gruppenarbeiten nach Einreichungsform
Abb. 4: Geschlechterverteilung nach Prozent

Die Geschlechterverteilung der akzeptierten Einreichungen setzt sich wie folgt zusammen: Insgesamt gab es in diesem Jahr 135 angenommene Einreichungen von 386 Autoren und Autorinnen. Diese Zahl entsteht durch die Addition aller genannten Autoren und Co-Autoren jeder Einreichung. Insgesamt sind 127 Beiträge von weiblichen (Co-)Autorinnen. Damit ergibt sich die in Abb. 5 dargestellte Verteilung.

Lokale Zentren für die DHd 2019?

Im Folgenden sollen die Länder und Städte genauer betrachtet werden, aus denen Einreichungen für die Konferenz eingereicht wurde. Gibt es Hot Spots der Digital Humanities und wenn ja, wo befinden sich diese? Auch hier gilt, wie bei den Autoren, dass die Zahlen durch die Addition der genannten Institute, bzw. deren Standorte entstanden sind. Wenn beispielsweise ein Vortrag von mehreren Autoren aus der gleichen Stadt eingereicht wurde, so wurde diese Stadt nur einmal gezählt, da hier die ‚Herkunft‘ der Einreichung und nicht der Autoren im Vordergrund steht.

Die Frage nach Hot Spots in den DH lässt sich durch die Auswertung der Einreichungen nicht beantworten, da die eingereichten Beiträge nicht als Repräsentation der gesamten DH Community gesehen werden kann.

Abb. 6: DHd International nach Anzahl der Einreichungen
Tabelle 1: Länder nach Einreichungen

In Abb. 6 wird ersichtlich, dass es auch Einreichungen außerhalb der DACH-Länder gibt. Die genauen Zahlen sind in Tabelle 1 nachzulesen.

Obwohl es insgesamt zwölf Einreichungen aus nicht-deutschsprachigen Ländern gibt, sind im Programm nur fünf Beiträge in englischer Sprache zu finden, viele von diesen sind jedoch von Autoren aus deutschen Institutionen eingereicht worden.
In Tabelle 2 sind die Top 10 der vertretenen Städte nach Anzahl der Einreichungen aufgelistet – zu beachten ist hier, dass manche Plätze von mehreren Städten belegt sind.

Top 10 Städte nach Einreichungen

Mit 21 Einreichungen ist Berlin auf Platz eins im Rahmen der DHd 2019 gelandet. Für ein Gesamtbild aller Einreichungsorte ist Abb. 7 zu betrachten. Hier gilt: je größer und oranger eine Stadt dargestellt ist, desto mehr Beiträge wurden von dieser angenommen.

Abb. 7: Gesamtheit aller Einreichungsstädte

Die Inhalte

Eine Besonderheit in diesem Jahr ist die Visualisierung der Textanalysedaten jeder Einreichung auf der Homepage der Konferenz. Die Auswertung der Daten der DHd 2019 und die Homepage der Veranstaltung liegen dieses Jahr im Aufgabenbereich des mainzed (Mainzer Zentrum für Digitalität in den Geistes- und Kulturwissenschaften) und somit auch bei mir. Das für die Website entwickelte Tool konnte somit auch für die vorliegende Auswertung eingesetzt werden.

Wie bereits auf der Homepage unter ‚Was ist das?‘ erklärt, berechnet das Skript ‚hinter‘ dem Tool die Werte für Sentiment und Flesch-Reading-Ease aus den eingereichten Abstracts. Beide Werte haben eine Skala von 0 bis 100. Während ein Wert von 50 in der Sentimentanayse zeigt, dass der Text neutral gehalten ist, weisen alle Werte unter 50 auf eine negative und alle über 50 auf eine positive Stimmung im Text hin. Für den Flesch-Reading-Ease gilt, dass die Komplexität des Textes mit dem steigendem berechneten Wert sinkt. Als Grundlage dienten die Abstracts jeder Einreichung. Um die Logik hinter den erzeugten Visualisierungen aufzugreifen, lautet die Fragestellung hier, welche Einreichungsform im Durchschnitt welche emotionale Färbung hat, und wie komplex die eingereichten Abstracts durchschnittlich geschrieben sind.

Abb. 8: Durchschnittliche Werte für Sentimentanalyse und Flesch-Reading-Ease

Insgesamt erreichten alle Programmpunkte einen gemeinsamen Sentimentwert von 57,5. Es gibt zwar leichte Ausreißer nach oben, trotzdem ist ersichtlich, dass die Abstracts insgesamt neutral mit sehr schwacher, positiver Färbung geschrieben wurden. Die Flesch-Werte liegen zwischen 7 und 100. Im Mittel ergibt das einen Wert von 43,9 – dies entspricht laut Algorithmus einem ’schwer zu lesenden‘ Text. In Abb. 8 sind die durchschnittlichen Werte aller Einreichungsformen plus Flesch-Wert im Vergleich dargestellt. Hier zeigt sich, dass die Abstracts für Poster den höchsten Flesch-Wert (45,7) haben, was bedeutet, dass diese Texte am wenigsten komplex formuliert sind. Mit einem Sentiment-Wert von 61,4 bewegen sich die Einreichungen der Workshops im positivsten Stimmungsbereich der Beiträge.

Tab. 3: Topics Top 20

Inhaltlich ist zu beobachten, dass bei der Analyse der von den Autorinnen und Autoren angegebenen Topics ‚Text‘, ‚Annotieren‘ und ‚Visualisierung‘ auf den ersten Plätzen vertreten sind. Eine genaue Verteilung der Werte ist in Tabelle 3 zu finden.

Es zeigt sich hier, dass im Vergleich zum letzten Jahr der Begriff der Modellierung von 60 Angaben auf 23 gefallen ist. Das Thema der Visualisierung hat die Inhaltsanalyse zwar überholt, jedoch sind die angegebenen Werte 2018 für alle Topics höher als in diesem Jahr.

Für eine visuell ansprechendere Übersicht wurde eine Wortwolke mit den Top 20 Topics erstellt (Abb. 9) – je größer und dunkler ein Begriff, desto öfter wurde dieser als Topic bzw. Keyword angegeben.

Abb. 9: Wortwolke der Top 20 Topics, die von den Autoren der Einreichungen gewählt wurden.
Erstellt mit https://wordart.com/.

Diese Farbgebung und Größe sind auch in Abb. 10 Indikatoren für die Häufigkeit der Worte. Hierfür wurden alle akzeptierten Abstracts genutzt und eine Stop-Word-Liste eingesetzt, die Begriffe wie ‚digital‘ und ‚humanities‘ enthielt. Auf das Aussortieren von englischen Stop-Words wurde verzichtet – hier zeigt sich, dass Begriffe wie ‚the‘, ‚to‘ oder ‚data‘ mehrfach vertreten sind, obwohl (wie bereits erwähnt) nur wenige Einreichungen in Englisch formuliert wurden. Eine Erklärung hierfür könnte sein, dass das technische Vokabular, dass in den Abstracts häufig genutzt wird, sich weitestgehend englischer Worte bedient.

Abb. 10: Wortwolke der Top 50 meisten Wörter aus allen Abstracts, erstellt mit https://wordart.com/.

Abschließende Gedanken

Es wurde deutlich, dass sich in Bezug auf Geschlechterverteilung in den DH im Vergleich zum letzten Jahr nicht viel getan hat – auch hier lag der Anteil an Autorinnen bei ungefähr einem Drittel. Ein weiteres Fazit ist in Bezug auf gemeinsame Einreichungen zu ziehen – ca. 4/5 der Einreichungen wurden von zwei oder mehreren Autorinnen und Autoren erarbeitet.
Wie bereits im vorherigen Abschnitt erwähnt, ist durch die Auswertung der Top 20 vergebenen Topics eine Änderung in den Themengebieten der eingereichten Beiträge zu beobachten. In den kommenden Jahren und Auswertungen wird sich zeigen, wie sich verschiedene Trends (z.B. die ‚absteigende‘ Modellierung) weiter entwickeln.