Prof. Dr. Jana Schor

(geb. Hertel)

Leitung Data Science in der Bioinformatik

Helmholtz Zentrum für Umweltforschung - UFZ
Department Integrative Bioinformatik
Permoserstr. 15
04318 Leipzig
Gebäude: Gebäude 4.1 und 4.2
Raum: Raum 238
Phone: +49 341 6025 4779
Email: jana.schor@ufz.de


Curriculum Vitae

Aktuelle Position


Leitung Bio-Data Science Gruppe, Department Computational Biology & Chemistry

Professur


Bio-Data Science, Fakultät für Mathematik und Informatik, Universität Leipzig, Deutschland

Vergangene Position


Leitung Bioinformatik Gruppe, Department Integrative Bioinformatik

Wissenschaftliche Abschlüsse


  • Professur für Bio-Data Science (2024)
  • Dr. rer. nat. Informatik / Bioinformatik (2008)
  • Diplom Informatik (2005)

Forschung:

Meine Forschung konzentriert sich auf die Weiterentwicklung von Datenwissenschafts-Methoden—wie Statistik, maschinelles Lernen, Deep Learning sowie Datenanalyse und -integration—um tiefere Einblicke aus großen Datenmengen im Bereich der menschlichen und Umweltgesundheit zu gewinnen. Durch die Entwicklung und Anwendung fortschrittlicher rechnergestützter Techniken möchte ich breit angelegte neue Hypothesen und prädiktive Modelle generieren, insbesondere in den Bereichen Ökologie und Gesundheitsforschung. Ein zentraler Fokus meiner Arbeit liegt darauf, die Glaubwürdigkeit KI-gestützter Analysen zu stärken, indem Erklärbarkeit und quantifizierbare Unsicherheitsmaße in jede Anwendung integriert werden. Zudem lege ich großen Wert auf reproduzierbare Forschung, um sicherzustellen, dass die Ergebnisse transparent, konsistent und für die wissenschaftliche Gemeinschaft wertvoll sind.

  • Datenintegration und -analyse mit Graph Datenbanken
  • Graph neural networks, Erklärbarkeit und Quantifizierung von Unsicherheit zur Verbesserung der Glaubwürdigkeit von Prediktionen durch KI Modelle
  • Grounding von LLMs mit domain-spezifischem Wissen aus Wissensgraphen und zur Verbesserung des Zugangs zu Wissensgraphen und Daten für Wissenschaftler aus anderen Bereichen und Stakeholder

Infrastruktur, Programme und Ansätze:

  • Hochleistungsrechencluster für die großskalige Datenverarbeitung.
  • KI-Training auf GPUs zur Beschleunigung der Modellleistung.
  • Graph- und andere neuronale Netzwerke für komplexe, vernetzte Datenstrukturen (für überwachte, unüberwachte und verstärkende Lernaufgaben).
  • Wissensgraphen und Graphdatenbanken zur Datenorganisation und semantischen Beziehungen.
  • Große Sprachmodelle zur Verbesserung der Interpretierbarkeit und Anwendungen in der Forschung.
  • Programmiersprachen wie R, Python, Shell-Scripting, Awk, Cypher und SQL für vielseitige Datenmanipulation und -analyse.

Lehre und Bildungsangebote:

Zusätzlich zu meiner Forschung widme ich mich der Ausbildung zukünftiger Datenwissenschaftler und Informatikstudierender. An der Universität Leipzig biete ich Kurse in statistischem Lernen, R-Programmierung und ein interaktives Data-Science-Curriculum an, das darauf abzielt, die Studierenden umfassend auf das Fachgebiet vorzubereiten. Diese Kurse umfassen:

  • Praktische Schulungen in R und Python,
  • Versionskontrolle mit Git,
  • Agile Projekt- und Selbstmanagement-Praktiken,
  • Storytelling mit Daten,
  • Erstellung überzeugender und repräsentativer Visualisierungen und
  • Entwicklung starker Präsentationsfähigkeiten.
  • Mein Ziel ist es, die Studierenden mit einem soliden, praxisorientierten Kompetenzset auszustatten, das sie auf eine erfolgreiche Karriere in realen Data-Science-Rollen vorbereitet.


Helmholtz AI - Artificial intelligence cooperation unit
Helmholtz AI associates extend the network for applied AI researchers within the Helmholtz Association to leverage the breadth of activities and strengths of our AI research.
HIDA - HH information & data science academy
The Helmholtz Information and Data Science Academy (HIDA) offers extensive training in Information and Data Science to doctoral researchers and postdocs.


Publikationen

Meine fünf wichtigen rezenten Publikationen sind nach Relevanz sortiert:

Inhalt:

Weiterführende Recherchen können Sie in unserem Publikationsverzeichnis durchführen.

2025 (3)

zum Inhalt

2024 (4)

zum Inhalt

2023 (2)

zum Inhalt

2022 (4)

zum Inhalt

Inhalt:

Weiterführende Recherchen können Sie in unserem Publikationsverzeichnis durchführen.

2021 (2)

zum Inhalt

2020 (3)

zum Inhalt

2019 (3)

zum Inhalt

2018 (1)

zum Inhalt

2017 (2)

zum Inhalt

2016 (5)

zum Inhalt

Für ältere Publikationen entstanden an der Uni Leipzig und/oder Uni Wien unter meinem Mädchennamen Jana Hertel

Professur für Bioinformatik
Institut für Informatik
Universität Leipzig
Härtelstr. 16-18
D-04107 Leipzig

Institut für Theoretische Chemie
Universität Wien
Währinger Straße 17
A-1090 Wien

schauen Sie bitte in meinem ORCID Profil.