@phdthesis{Heidt, type = {Bachelor Thesis}, author = {Christian M. Heidt}, title = {Aufbau einer Graphdatenbank zur effizienten Abbildung medizinischer Konzepte aus Wikipedia}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:840-opus4-1518}, pages = {VII, 49, III Seiten}, abstract = {Die Online-Enzyklop{\"a}die Wikipedia kann f{\"u}r die Analyse der Beziehungen zwischen Konzepten als wertvolle Datenquelle dienen. Aus ihren klar deffinierten Strukturen, wie z.B. der baumartigen Kategorisierung, Weiterleitungen, Infoboxen und Links zwischen Artikeln ergibt sich die M{\"o}glichkeit, ausgehend von einem bestimmten Konzept eine F{\"u}lle enzyklop{\"a}dischen Wissens zu extrahieren, das f{\"u}r viele Anwendungszwecke in der medizinischen Informatik genutzt werden kann. Trotz der einfachen Verf{\"u}gbarkeit von Wikipedia-MySQL-Backups ist es weder besonders intuitiv noch effizient, diese Beziehungen direkt aus diesen relationalen Datenbanken abzuleiten. Stattdessen w{\"a}re ein weitaus intuitiverer Ansatz f{\"u}r die Datenanalyse, die genannten Strukturen und ihre Beziehungen zueinander als Knoten und Kanten in einem Graphen abzubilden. Ausgehend von einem bestehenden Wikipedia-Graph-API zielte diese Arbeit darauf ab, ein effizientes System zu entwickeln, das Wikipediastrukturen aus einem MySQL-Backup extrahiert, diese verarbeitet und in eine Graphdatenbank speichert. Eine Analyse von Graphdatenbank-Managementsystemen im Rahmen dieser Arbeit ergab, dass Neo4j f{\"u}r diesen Anwendungszweck optimal geeignet ist, da seine Anfragesprache Cypher eine intuitive M{\"o}glichkeit darstellt, Graphdaten zu analysieren. Das Ergebnis dieser Arbeit ist NeoWiki, ein System, das sowohl eine M{\"o}glichkeit zur Generierung von strukturellen Wikipedia-Graphen bietet als auch als Java Library die Arbeit mit den erstellten Graph-Entit{\"a}ten als Java-Objekten unterst{\"u}tzt. Obgleich derzeit noch Raum f{\"u}r Verbesserungen hinsichtlich der Performance bei der Graphgenerierung besteht, stellt NeoWiki doch bereits jetzt ein Tool zur intuitiven Analyse von Wikipedia-Daten dar.}, language = {de} }