[DHd-blog] Vorstellung der DARIAH-DE-Fellows 2015: Canan Hastik

[德语国家数字人文协会DHd-blog网站消息]

Das DARIAH-DE Fellowship-Programm fördert NachwuchswissenschaftlerInnen, die in ihren Forschungsvorhaben innovative digitale Ansätze und Methoden einsetzen und so einen Beitrag zur Weiterentwicklung der Digital Humanities leisten. Im DHd-Blog stellen die DARIAH-Fellows ihre Projekte vor.

Canan Hastik

canan2013_fellowCanan studierte Wissensmanagement und Informationswissenschaften mit Schwerpunkt Bibliothekswissenschaften an der Hochschule Darmstadt. Seit 2011 ist Canan PHD Kandidatin am Cork Institute (Irland) im Bereich Informatik. In ihrer Promotion beschäftigt Sie sich mit der Erforschung von digitalen Kulturphänomenen im Internet, der Entwicklung von Semantik Web Technologien und in diesem Zusammenhang mit digitalen Sammlungen, Ontologien und fachwissenschaftlicher Annotation.

 

Worum geht es in dem Projekt?

Projektposter_Canan_Hastik_kl

Projektposter Canan Hastik (PDF, 1 MB)

Mein Fellowship-Projekt ist im Bereich des fachwissenschaftlichen digitalen Annotierens angesiedelt. In meinem Projekt geht es um die linguistische Analyse von webbasierten natürlichsprachlichen Kommunikationstexten aus Sozialen Medien in Englischer Sprache und der darauf aufbauenden ontologiebasierten Klassifikation relevanter Aspekte. Für Texte aus sozialen Medien gibt es bisher nur wenige Initiativen, die sich mit der Erforschung webbasierter Diskussionskulturen beschäftigen; auch gibt es keine etablierten Standards für die morphosyntaktische Analyse. Die vermehrte Relevanz und das gestiegene Interesse an diesen Themen macht es zwingend notwendig, diese Korpora näher zu erforschen um Probleme in der Verarbeitung beispielsweise von Sprachwandel, Emoticons, Schreib- und Syntaxfehlern zu ermitteln.

Wie gestaltet sich die Zusammenarbeit mit DARIAH-DE ?

Das DARIAH-DE-Fellowship ermöglicht es mir, meine Kenntnisse im Bereich Digital Humanities praxisnah weiter auszubauen. Die DARIAH-DE Infrastruktur bietet mir hierfür beste Möglichkeiten der Vernetzung, des wissenschaftlichen Austauschs und der künftigen Zusammenarbeit.

Welche Ergebnisse erwarten Sie und für welche Forschungsthemen sind diese anschlussfähig?

Die Studie liefert einen Beitrag zur automatischen linguistischen Erforschung webbasierter Diskussionskulturen und sprachlicher Besonderheiten sowie damit verbunden der Optimierung und Anpassung von Annotationstechniken und -methoden zur korpusgestützten Sprachanalyse.

Mit welchen Materialien und Daten arbeiten Sie?

Datengrundlage bildet eine Stichprobe aus der Grundgesamtheit von über 600.000 Kommentaren eines szenespezifischen Onlineforums.

Gibt es Methoden, Theorien und Tools, welche für diese Aufgabe besonders interessant sind?

In diesem Projekt kommen insbesondere Methoden der Natürlichen Sprachverarbeitung und des Maschinellen Lernens zum Einsatz. Hierfür wird das Natural Language Processing Toolkit (NLTK) verwendet und der vorliegende Kommentarkorpus relativ neutral basierend auf dem PennTreebank WordTokenizer und POS-Tagger automatisch annotiert, danach manuell überprüft und korrigiert, um Gesetzmäßigkeiten zu definieren, welche schließlich auf den Gesamtkorpus angewendet werden können. Ziel ist es, aus dem annotierten Korpus relevante Stichworte zu extrahieren und somit einen Korpus aufzubauen, welcher dann zur ontologiebasierten Annotation genutzt werden kann.

Wie haben Sie begonnen, sich mit digitalen Geisteswissenschaften zu beschäftigen?

Als Informationswissenschaftlerin habe ich eine enge Verbindung zur Informatik sowie zu geistes-, kultur- und sozialwissenschaftlichen Disziplinen. Stark praxisorientiert habe ich mich seit meinem Studium auf die Gestaltung und Entwicklung von Anwendungen zur Erschließung, Bereitstellung, Suche, Verarbeitung und Vermittlung von Information und Wissen spezialisiert. Im Rahmen meines Dissertationsprojektes habe ich mich dann intensiv mit den Prozessen und Methoden der digitalen Geisteswissenschaften beschäftigt.

Welche Angebote der digitalen Geisteswissenschaften fänden Sie für Ihre Forschungsprojekte in Zukunft besonders hilfreich?

Mein Forschungsinteresse gilt der Entwicklung von Werkzeugen zur Erschließung, Repräsentation, Annotation und Auswertung von Quellen. Daher habe ich großes Interesse daran, selbst an der Gestaltung und Umsetzung von webbasierten Angeboten mit geeignetem Anforderungscharakter mitzuwirken. Wichtig in diesem Zusammenhang ist die Spezifikation, Dokumentation und Standardisierung von Verfahren und Techniken. Diese Aspekte sehe ich als besonders relevant für die Weiterentwicklung der digitalen Geisteswissenschaften an.

Weitere Informationen

Webseite von Canan Hastik

Projektposter (DH Summit 2015)

DARIAH-DE Fellowship-Programm

DARIAH-DE Logo mit deutscher Unterschrift CMYK 1.1

DARIAH-DE unterstützt mit digitalen Ressourcen und Methoden arbeitende Geistes- und KulturwissenschaftlerInnen in Forschung und Lehre. Dafür baut das Projekt eine digitale Forschungsinfrastruktur für Werkzeuge und Forschungsdaten auf und entwickelt Materialien für Lehre und Weiterbildung im Bereich der Digital Humanities (DH). DARIAH-DE ist der deutsche Beitrag von DARIAH-EU und arbeitet in diesem Kontext mit einer Vielzahl von europäischen Partnern und Projektverbündeten zusammen.