TRA-Förderung für innovative Forschung: "Automatic construction of gene regulatory networks from scientific literature with LLMs"
Das Projekt wird in Abstimmung mit Dr. Christiane Hellweg (DLR, Deutsches Zentrum für Luft- und Raumfahrt) und Prof. Dr. Holger Fröhlich (b-it) durchgeführt. Prof. Fröhlich forscht im Bereich des statistischen Data Mining und des maschinellen Lernens mit besonderem Fokus auf Anwendungen in der Biomedizin. Dr. Hellweg erforscht die Auswirkungen von Strahlung auf Organismen, ihre Einsatzmöglichkeiten in der Krebstherapie und die dadurch verursachte Störung der Genregulation.
Genregulatorische Netzwerke beschreiben die Interaktionen von Genen in Proteinen in lebenden Organismen. Eine Störung dieser Netze kann eine Vielzahl von Gesundheitsproblemen verursachen. Das am weitesten verbreitete ist Krebs, der immer auf einer Störung der Genregulation beruht.
Die biomedizinische Forschergemeinschaft erforscht Krebs und die zugrunde liegenden genetischen Ursachen, die sich je nach Krebsart stark unterscheiden können, in großem Umfang. Es werden so viele Arbeiten veröffentlicht, dass es unmöglich wird, den Überblick zu behalten. Außerdem werden in vielen Arbeiten nur die Verbindungen zwischen einigen wenigen Genen unter bestimmten Versuchsbedingungen untersucht, nicht aber vollständige Netzwerke. Ziel ist es, die Textverständnisfähigkeit von LLMs zu nutzen, um die in den Artikeln beschriebenen Teilnetzwerke auf der Grundlage übereinstimmender experimenteller Bedingungen zu extrahieren und dann zu kombinieren.