Evaluierung unterschiedlicher Methoden zur Imputation fehlender Werte in Messdaten von Umweltproben mit R
Das Helmholtz-Zentrum für Umweltforschung – UFZ hat sich mit seinen 1100 Mitarbeiterinnen und Mitarbeitern als internationales Kompetenzzentrum für Umweltwissenschaften einen hervorragenden Ruf erworben. Wir sind Teil der größten Wissenschaftsorganisation Deutschlands – der Helmholtz- Gemeinschaft. Unsere Mission: Wir forschen für eine Balance zwischen gesellschaftlicher Entwicklung und langfristigem Schutz unserer Lebensgrundlagen – für eine nachhaltige Entwicklung.
The missing data problem is a common challenge in many empirial and experimental sciences.
Incomplete datasets due to missing values derived from experiments affect the robustness of multi-variate statistical methods and bias the results. The latter may have a significant impact on the correctness of the hypotheses testing and conclusions. In our department, high resolution mass spectrometry is used for the targeted and non-targeted analysis of environmental samples (e.g. sediments, water, biota). The results often contain missing values hampering downstream data analysis.
Ihre Aufgaben:
The aims of the master thesis are (1) the theoretical discussion of missing data related to mass spectral information and environmental samples, (2) the implemenation of missing data imputation workflows in R, (3) the cross-validation of the robustness of the missing data impution methods for example by probalistic approaches, and (4) the impact of iterations steps on the quality of data (computation time versus robustness / quality). Additionally, the deployment of parallelised computation on HPC clusters for time intensive imputations and the development of a R package could be outcomes of the master thesis.
Weitere Informationen
- Unternehmen
- Helmholtz Gemeinschaft
- Abschlussart
- Masterarbeit
- Branche
- Forschung und Entwicklung
- Anforderungen
- Ihr Profil:
Die Masterarbeit setzt fundierte Programmierkenntnisse in der Programmiersprache R und ggf. weiteren Programmiersprachen voraus. Die Zielgruppe sind Studierende der Bioinformatik, Chemoinformatik, Statistik, Mathematik.
Wir bieten:
Eine enge und gute Betreuung
Spannende Einblicke in die Arbeit eines führenden Forschungsinstituts
Eine hervorragende technische Ausstattung, die ihresgleichen sucht
Die Mitarbeit in interdisziplinären, multinationalen Teams
Die Möglichkeit, eigene Ideen und Impulse von Anfang an einzubringen - Zusatzinformationen
- Chancengleichheit ist Bestandteil unserer Personalpolitik, daher begrüßen wir ausdrücklich die Bewerbung von qualifizierten Frauen. Schwerbehinderte werden bei gleicher Eignung bevorzugt.
Fragen zur Stelle beantwortet Ihnen gerne:
Dr. Tobias Schulze
tobias.schulze@ufz.de
Einsendeschluss:
31. Juli 2016
Arbeitsort: Leipzig
Bitte bewerben Sie sich ausschließlich über unser Online-Portal.
https://recruitingapp-5128.de.umantis.com/Vacancies/789/Application/New/1
TIPP: Dein Profil wird dem Unternehmen übermittelt. Erziele einen besseren Eindruck, indem Du es vollständig ausfüllst.