Projektbeispiele
[cdf_page_title]
Die Zusammenführung verschiedener Datenbanken mit vielen hundert in der medizinischen Forschung verwendeten Zelllinien machte eine Überprüfung und Verifizierung der darin enthaltenen Informationen erforderlich.
Projektlaufzeit: 3 Monate
Für ein führendes Pharmaunternehmen wurden viele hundert Datensätze auf ihre Richtigkeit überprüft und fehlende Informationen ergänzt. Jeder Datensatz charakterisierte eine in der medizinischen Forschung verwendete Zelllinie. Die Verifizierung der Daten war in diesem Fall notwendig, da Datensätze aus mehreren unabhängigen Datenbanken zusammengeführt wurden und somit inhaltliche Inkonsistenzen entstanden. Geprüft wurden die korrekte Bezeichnung der Linie und entsprechende Synonyme, Spezies und Geschlecht der Zellen, Gewebe oder Organ der entnommenen Proben sowie das Alter des Spenderorganismus und gegebenenfalls die zugrundeliegende Erkrankung. Hierbei kam das fundierte Fachwissen der Biologinnen und Biologen bei GIMD zum Tragen. In manchen Fällen erwies sich die Zuordnung als eindeutig. In anderen Fällen mussten falsch zugeordnete und vielfach widersprüchliche Angaben zu einzelnen Parametern abgeglichen und entsprechend der vorgegebenen Zelllinie einheitlich beschrieben werden. Die Bearbeitung erfolgte überwiegend durch Internetrecherchen in einem Zeitrahmen, der durch die Budgetierung des Auftraggebers vorgegeben war. Eindeutig falsche Zuordnungen wurden entfernt und verifizierte Daten als solche gekennzeichnet. Zusätzlich wurde auf nicht aufzulösende Widersprüche (z.B. literatur-bekannte Verunreinigungen von ehemals etablierten Zelllinien) und Verwechslungsgefahren hingewiesen (z.B. identische Bezeichnungen für Zelllinien unterschiedlicher Spezies oder Zelllinien, die im Laufe der Forschung irrtümlicherweise einer falschen Spezies zugeordnet wurden). Nach Datenabgleich und abschließender Aufbereitung wurden die Datensätze dem Auftraggeber im gewünschten digitalen Format übergeben.
Dieses Projekt zeigt einmal mehr die große Flexibilität von GIMD bei der Prozessierung (Auswertung, Dokumentation, Umwandlung) von Daten(-sätzen) in unterschiedlichen Fachbereichen.