Neue Standards in der Bioinformatik machen biologische Experimente nachvollziehbar – überall und jederzeit

15.02.17

LCSB
University of Luxembourg
Diesen Artikel drucken

Forscher der Uni Luxemburg haben das Werkzeug IMP entwickelt, mit dem sich die Auswertung biologischer und biomedizinischer Experimente wiederholen lässt.

Biologische Versuche erzeugen immer größere und komplexere Datensätze. So ist es schwieriger geworden, Experimente in anderen Forschungslaboren zu wiederholen, um die Ergebnisse zu bestätigen – oder zu widerlegen. Neben der hohen Komplexität der Daten sind anspruchsvolle, computerbasierte Auswerteverfahren ein Grund für diese Schwierigkeit.

Der Grund für die Datenflut biologischer und biomedizinischer Forschung sind immer komplexere Untersuchungsobjekte – etwa die Zusammensetzung aller Mikroorganismen im Darm –, aber auch automatisierte Experimentiertechniken, die so genannte Hochdurchsatz-Versuche ermöglichen: Versuchsansätze, die noch vor wenigen Jahren langwierig von Hand ausgeführt werden mussten, können jetzt in kürzester Zeit nahezu beliebig oft und standardisiert wiederholt werden. Diesem Trend konnten die Auswerteverfahren noch nicht in vollem Umfang folgen:

„Wenn man sich so komplexe Systeme mit unterschiedlichen Methoden anschaut, kommt immer etwas anderes dabei heraus”, sagt Paul Wilmes vom Luxembourg Centre for Systems Biomedicine (LCSB) der Universität Luxemburg.

Die Lösung: R3 – Reproducible Research Results

Jedes Labor nutzt zudem seine eigenen Rechenprogramme, die oft geheim gehalten werden. Außerdem ändern sich die Rechenverfahren schnell, allein schon, wenn sie auf einem Computer mit einem anderen Betriebssystem ablaufen. „Deshalb ist es äußerst schwierig und oftmals sogar unmöglich, bestimmte Ergebnisse in einem anderen Labor zu reproduzieren“, so Wilmes, Leiter der LCSB-Gruppe Eco-Systems Biology. „Das ist aber das Fundament der Wissenschaft: Ein Versuch muss jederzeit an jedem beliebigen Ort wiederholbar sein und zu den gleichen Ergebnissen führen. Ansonsten lassen sich daraus keine allgemeingültigen Schlussfolgerungen ziehen.“

Diesem Missstand helfen die LCSB-Wissenschaftler nun ab. In der LCSB-Bioinformatics Core Unit ist dafür eine Initiative entstanden, die sich „R3 – Reproducible Research Results“ nennt. „Mit R3 wollen wir Wissenschaftler weltweit in die Lage versetzen, die Reproduzierbarkeit und die Transparenz ihrer Forschung zu erhöhen – durch systematisches Training, durch die Entwicklung von Methoden und Werkzeugen und durch die Etablierung der erforderlichen Infrastruktur“, sagt Dr. Reinhard Schneider, Leiter der Bioinformatics Core Unit.

Computerprogramme werden „konserviert“

Die Ergebnisse der R3-Initiative fließen dann in Projekte wie IMP ein: „IMP ist eine reproduzierbare Pipeline für die Analyse hochkomplexer Daten“, sagt Dr. Shaman Narayanasamy aus der Arbeitsgruppe von Paul Wilmes. Er ist Mitautor der Studie und hat sich mit dem Thema gerade promoviert: „Wir konservieren Computerprogramme in exakt dem Zustand, in dem sie bestimmte Experimentdaten verrechnet haben. Aus diesem quasi eingefrorenen Zustand können wir die Programme später wieder auftauen, wenn die Bearbeitung der Daten wiederholt oder neue Daten auf die gleiche Weise ausgewertet werden sollen.“ Außerdem fassen die Wissenschaftler verschiedene Komponenten der Auswertesoftware in so genannten Containern zusammen. Diese können in unterschiedlicher Reihenfolge kombiniert werden, ohne dass es zu Wechselwirkungen mit anderen Programmteilen kommt.

„Die Teilprogramme in den Containern können je nach Bedarf hintereinander geschaltet werden“, sagt der Erstautor der Studie, Yohan Jarosz von der Bioinformatics Core Uni. Es entsteht eine Pipeline, durch die die Daten hindurchfließen. Dadurch, dass die Rechenoperatoren in den Containern anschließend eingefroren werden, braucht man keine Referenzdaten, also Daten darüber, unter welchen Bedingungen – Art des Betriebssystems oder des Computerprozessors – die Auswertung erfolgen muss. „Dabei ist das ganze Verfahren vollkommen offen und transparent”, sagt Jarosz: Somit kann jeder Wissenschaftler jeden beliebigen Programmschritt verändern. Allerdings gibt es ein Logbuch, in dem die einzelnen Schritte festgehalten werden und dadurch nachvollziehbar bleiben.

Besonders wichtig ist für Paul Wilmes der Einsatz dieses Verfahrens bei der Analyse metagnomischer und metatransskriptorischer Daten. Solche Daten fallen an, wenn die Forscher beispielsweise ganze Bakteriengesellschaften etwa im menschlichen Darm oder in Kläranlagen untersuchen. Aus dem gesamten Genmaterial, das in der Probe enthalten ist, und den gesamten Genprodukten können sie herauslesen, welche Bakterienarten sich im Darm oder in der Kläranlage befinden. Aber nicht nur das: Die Wissenschaftler können auch sagen, wie viele Bakterien welcher Art vorhanden und aktiv sind, was für Stoffe sie zu einem bestimmten Zeitpunkt produzieren, und wie sich die Organismen gegenseitig beeinflussen.

Neue Technik im Internet frei zugänglich

Der Haken war bisher, dass entsprechende Untersuchungsergebnisse kaum von Forschern in anderen Laboren nachvollzogen werden können. Das hat sich mit IMP nun geändert. Wilmes: „Wir haben bereits Daten aus anderen Laboren ersten Tests mit IMP unterzogen. Dabei wurde klar: Wir können die Ergebnisse nachvollziehen – und unsere Berechnungen in IMP fördern deutlich mehr Details ans Licht, als es bei der ursprünglichen Untersuchung der Fall war; etwa bei der Identifizierung von Genen, die im Stoffwechsel der Bakteriengesellschaften eine besonders wichtige Rolle spielen.“

„Dank IMP kommen am LCSB in der Mikrobiomforschung jetzt ausschließlich standardisierte und reproduzierbare Methoden vom Wet-Lab, also dem Experimentallabor, bis hin zu Dry-Lab in dem vor allem Computersimulationen und -modellierungen laufen zu Einsatz. Wir haben hier international eine Vorreiterrolle“, sagt Wilmes. „IMP setzt auch dank R3 Standards, deren Anwendung auch für andere Institute als dem LCSB von größtem Interesse sein dürfte“, ergänzt Reinhard Schneider von der Bioinformatics Core Unit: „Wir machen die Technik anderen Forschern deshalb frei zugänglich – der Standard soll sich schnell durchsetzen. Denn nur reproduzierbare Ergebnisauswertungen bringen die Biomedizin langfristig voran.“

Die Arbeit ist jetzt im renommierten Open Access-Fachjournal Genome Biology veröffentlicht worden. Das neue bioinformatische Werkzeug IMP ist für Forscher im Internet verfügbar.

Autor: Universität Luxembourg
Foto: Paul Wilmes © Universität Luxemburg

Diaporama

Auch in dieser Rubrik

Science Festival 2017: Mit Goodyear einen Reifen backen

09.11.17 Beim Science Festivals mit dabei ist auch das Innovation Center von Goodyear. Chemiker Laurent Poorters erklärt, was Reifen mit Wissenschaft zu tun haben. > Ganzen Artikel lesen

FNR Awards 2017: Für einen Roboter, der Kindern mit Autismus hilft

26.10.17 "QT", ein Roboter als therapeutische Hilfe für autistische Kinder, der einfach niedlich ist. > Ganzen Artikel lesen

ICT meets cultural heritage: Take a walk through the history of Esch-Belval with the CrossCult mobile App

18.10.17 On 26 October 2017, you have the unique opportunity to test the city exploration App co-developed by LIST researchers and discover Belval’s secrets! > Ganzen Artikel lesen

Vom Radsport ins Chemielabor: Pit Losch auf der Suche nach Alternativen zu fossilen Brennstoffen

17.10.17 Die Endlichkeit fossiler Brennstoffe zwingt uns zur Suche nach Alternativen. Für den Forscher Pit Losch spielen Zeolithe dabei eine wichtige Rolle. > Ganzen Artikel lesen

End-to-End-Verschlüsselung: Forscher schließt Datenschutzlücken bei WhatsApp & Co

11.10.17 Exzellente End-to-End-Verschlüsselungsmethoden für Messaging-Dienste gibt es schon länger. Doch was ist, wenn ein Angreifer das Gerät knackt? > Ganzen Artikel lesen

Verwandte Themen