@phdthesis{Sailer, type = {Bachelor Thesis}, author = {Fabian Sailer}, title = {Analyse von {\"U}berlebenszeiten bei Tumporpatienten anhand Methoden des Data Minings}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:840-opus-806}, abstract = {Behandlungen von Tumoren zielen in erster Linie auf eine Verl{\"a}ngerung der {\"U}berlebenszeit des Patienten ab. Es ist f{\"u}r {\"A}rzte eine Hilfe, wenn zu Beginn der Behandlung die voraussichtliche {\"U}berlebenszeit abgesch{\"a}tzt werden kann. Dies geschieht aktuell oftmals mit Hilfe einer manuellen Einteilung in Risikoklassen. F{\"u}r diese sind aus Erfahrungswerten typische {\"U}berlebenszeiten bekannt. In Zeiten der zunehmenden Digitalisierung ist es nur logisch den Versuch zu starten, die Klassifizierung automatisch vorzunehmen. In dieser explorativen Grundlagenarbeit werden zwei Data Mining–Verfahren — namentlich „naiver Bayes Klassifikator“ und „k–means Clustering“ — auf ihre F{\"a}higkeit bez{\"u}glich der {\"U}berlebenszeitprognose hin untersucht. Dazu werden verschiedene Feature Selection Verfahren (Information Gain, Expertenselektion, Forward Selection, Backward Elimination und No Selection) getestet. Nach dem k–means Clustering k{\"o}nnen Kaplan–Meier–Kurven der einzelnen Cluster gezeichnet werden. Aus diesen kann eine Prognose der {\"U}berlebenszeit abgelesen werden. Der naive Bayes Klassifikator errechnet nach einer ({\"a}quifrequenten oder {\"a}quidistanten) Diskretisierung der {\"U}berlebenszeit f{\"u}r jeden Patienten individuell eine {\"U}berlebens–Wahrscheinlichkeits Verteilung. Das Training der Data Mining–Verfahren erfolgte auf der Basis von Datens{\"a}tzen kolorektaler Tumorpatienten des Tumorregisters des Tumorzentrums Heilbronn–Franken.}, language = {de} }