Title (eng): Data scraping, database implementation and visualization for analyzability of flow cytometry data related to pediatric stem cell transplantation

Author: Winkler, J. (Jakob)

Description (deu): Masterarbeit, Fachhochschule St. Pölten, Studiengang Digital Healthcare, 2017

Description (eng): Flow cytometry is a commonly used technique to analyze different cell types of human blood cells by their specific surface characteristics. Furthermore, it is used to monitor cell development (engraftment) after allogenic stem cell transplantation (allo-HSCT). Since 1995, these analyses have been performed at the St. Anna Children’s Cancer Research, but data has been stored with undefined data structure in multiple Excel tables. Therefore analyzability and error detection of the datasets were difficult. Relational databases facilitate structured data storage and web applications open doors for platformindependent interactive visualizations. Literature has shown that supportive interactive data visualization techniques of health care records can help to uncover trends and patterns.
This thesis describes the software development and database design for the data scraping process of 26462 historical (1995 - 2016) human-readable data sets, related to allo-HSCT cell monitoring. Furthermore an interactive line chart, based on the java class C3.js, was designed, to visualize the engraftment process, as well as to identify outliers and date input errors. As a field of application for these datasets, an explorative retrospective analysis of the naïve CD4+ T-cells, which build an important part of the adaptive immune system, were performed to test cell counts on days 30, 100, 180 and 365 after HSCT, in relation to graft material, donor’s age and recipient age. Trends of inverse correlation between donor’s age and count of naïve CD4+ T-cells, as well as between recipient’s age and count of naïve CD4+ T-cells have been shown. It can be expected, that this structured database and visualization represents the base for better analyzability in order to answer research questions for engraftment characteristics of patients undergoing hematopoietic stem cells transplantation at the St. Anna Children’s hospital.

Description (eng): Das Verfahren der Durchflusszytometrie, zur Bestimmung von unterschiedlichen Erkennungsmerkmalen auf menschlichen Blutzellen ist ein etabliertes Verfahren zur Bestimmung der Zellentwicklung (Engraftment) nach hämatopoietischer Stammzelltransplantation (HSZT). Seit 1995, werden diese, auf Durchflusszytometrie basierenden, Analysen in der St. Anna Kinderkrebsforschung in Wien durchgeführt. Jedoch wurden die Messergebnisse in unstrukturierter Form, in multiplen Excel Tabellen, abgelegt, sodass die Möglichkeit einer Datenanalyse, erschwert war. Relationale Datenbanken ermöglichen eine strukturierte Ablage von Daten. Plattformunabhängige webbasierte Visualisierungstechniken erleichtern das Erkennen von Mustern und Trends in Verlaufsdaten. In dieser Masterthesis wird die Entwicklung und Anwendung einer Software für die Datenextraktion von 26462 Datensets (von 1995 bis 2016) aus Aufzeichnungen von Durchflusszytometriedaten, sowie das Design für eine Datenbank zur strukturierten Speicherung dieser Daten, präsentiert. Ein interaktives Liniendiagramm ermöglicht den Engraftmentprozess nach HSZT darzustellen und Dateneingabefehler und Ausreißer zu erkennen. Ein Anwendungsfall dieser Datenbank, sowie Visualisierungsmöglichkeiten wurde mit einer explorativen, retrospektiven Analyse der Anzahl von naiven CD4+ T-Zellen an den Tagen 30, 100, 180 und 365 nach HSZT und deren Zusammenhang zu Spendermaterial, Spenderalter und Empfängermaterial, präsentiert. Diese Zellen stellen einen wichtigen Teil des adaptiven Immunsystems dar. Es konnte der Trend zu einer negative Korrelation zwischen Spenderalter und Anzahl der naiven CD4+ T-Zellen, sowie zwischen Empfängeralter und naiven CD4+ T-Zellen entdeckt werden. Zusammenfassend kann gesagt werden, dass diese strukturierte Datenbankanwendung und die darauf basierende Visualisierungstechniken eine breite Basis darstellen, um weitere Forschungsfragen über das Zell-Engraftment von PatientInnen nach HSZT im St. Anna Kinderspital zu generieren und zu beantworten.

Object languages: English

Date: 2017

Rights: © All rights reserved

Classification: data scraping ; visualization ; flow cytometry ; HSCT ; engraftment ; naïve CD4+ T-cells

Permanent Identifier