Zum Inhalt springen

TRANSFAC

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 10. Juni 2025 um 05:54 Uhr durch imported>SchlurcherBot (Bot: http → https).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

TRANSFAC (TRANScription FACtor database) ist eine manuell kuratierte Datenbank über eukaryote Transkriptionsfaktoren, deren genomische Bindungsstellen und DNA-Bindungsprofile. Die Inhalte der Datenbank können mithilfe entsprechender Software zur Vorhersage potentieller Transkriptionsfaktor-Bindungsstellen (TFBS) verwendet werden.

Geschichte

Die der Datenbank zugrunde liegende Datensammlung wurde erstmals 1988 von Edgar Wingender veröffentlicht. Sie umfasste im Wesentlichen drei Tabellen: über Transkriptionsfaktor-Bindungsstellen (TFBS) in Genen, über Transkriptionsfaktoren (TF) und über DNA-Bindungsdomänen vom Zinkfinger-Typ.<ref>E. Wingender: Compilation of transcription regulating proteins. In: Nucleic Acids Research. Band 16, 1988, S. 1879–1902, PMC 338188 (freier Volltext).</ref> Daraus wurde zunächst eine lokal lauffähige Datenbank mit dem Namen TRANSFAC erstellt.<ref name="Wingender91">E. Wingender, T. Heinemeyer, D. Lincoln: Regulatory DNA sequences: predictability of their function. In: Genome Analysis - From Sequence to Function; BioTechForum - Advances in Molecular Genetics (J. Collins, A.J. Driesel, eds.). Band 4, 1991, S. 95–108.</ref> Im Rahmen eines der ersten öffentlich geförderten Bioinformatikprojekte in Deutschland an der damaligen Gesellschaft für Biotechnologische Forschung (GBF, dem heutigen Helmholtz-Zentrum für Infektionsforschung, HZI) in Braunschweig wurde daraus eine über das Internet verfügbare Ressource entwickelt.<ref>E. Wingender, P. Dietze, H. Karas, R. Knüppel: TRANSFAC: a database on transcription factors and their DNA binding sites. In: Nucleic Acids Res. Band 24, 1996, S. 238–241, PMC 145586 (freier Volltext).</ref> Zur Sicherung einer langfristigen Finanzierung erfolgte 1997 die Übertragung der Datenbank an ein dazu gegründetes Unternehmen (BIOBASE GmbH). Es gibt aber weiterhin ältere, für nicht-kommerzielle Nutzer frei zugängliche Versionen der Datenbank.<ref>TRANSFAC Public auf dem Genregulations-Portal der BIOBASE GmbH</ref><ref><templatestyles src="Webarchiv/styles.css" />Zugang zu TRANSFAC Public über TESS (Memento vom 24. Juli 2012 im Internet Archive) am Computational Biology and Informatics Laboratory (CBIL) der University of Pennsylvania (Penn)</ref>

Inhalte und Struktur der Datenbank

Datei:TRANSFAC structure.png
Grundstruktur der TRANSFAC-Datenbank mit den Primärdaten über Transkriptionsfaktoren (FACTOR) und Transkriptionsfaktor-Bindungsstellen (SITE), aus denen Abstraktionen über TF-Klassen (CLASS) bzw. Nukleotidverteilungsmatrizen (MATRIX) erstellt werden.

Im Zentrum der Datenbank steht die Beziehung zwischen Transkriptionsfaktoren (TF) und ihren DNA-Bindungsstellen (TFBS). Für jeden TF werden, soweit in der wissenschaftlichen Literatur belegt, seine strukturellen und funktionellen Eigenschaften beschrieben. TF werden anhand der Eigenschaften ihrer DNA-Bindungsdomänen zu Familien, Klassen und Überklassen zusammengefasst. Daraus ergibt sich ein Klassifizierungsschema für Transkriptionsfaktoren.<ref>E. Wingender: Classification of eukaryotic transcription factors. In: Mol Biol Engl Tr (Mosk). 31, 1997, S. 483–497. PMID 9340487 (russisch)</ref><ref></ref><ref></ref><ref>E. Wingender: The classification of transcription factors</ref> Die Bindung eines TF an eine bestimmte Bindungsstelle eines Gens wird mitsamt der genauen Lokalisation dieser Bindungsstelle, ihrer Nukleotid-Sequenz sowie der Methodik, die zu ihrem Nachweis geführt hat, dokumentiert. Auf einen TF (oder eine Gruppe eng verwandter TF) bezogene Bindungsstellen werden aliniert und zu Nukleotidverteilungs-Matrizen (count matrices; position-specific scoring matrices, PSSM) zusammengefasst. Viele Matrizen in der Matrix-Bibliothek von TRANSFAC wurden vom Annotationsteam erstellt, andere aus der wissenschaftlichen Literatur übernommen.

Einsatzgebiete

Die Datenbank TRANSFAC wird u. a. als Enzyklopädie für eukaryote Transkriptionsfaktoren verwendet. Die Zielsequenzen und regulierten Gene können für jeden TF aufgelistet und so umfassende Datensätze für Bindungssequenzen einzelner TF zusammengestellt werden, etwa als Test- oder Trainingssequenzen für TFBS-Erkennungsalgorithmen.<ref></ref> Die TF-Klassifizierung ermöglicht, solche Datensätze in Zusammenhang mit den Eigenschaften der DNA-Bindungsdomäne zu analysieren.<ref></ref> Umgekehrt können für die regulierten Gene diejenigen TF abgerufen werden, für die TFBS in diesen Genen dokumentiert sind. Aus den in TRANSFAC dokumentierten TF-Zielgen-Beziehungen wurden im Zusammenhang mit systembiologischen Untersuchungen auch transkriptionsregulatorische Netzwerke konstruiert und analysiert.<ref></ref><ref></ref> Die mit Abstand am weitesten verbreitete Anwendung von TRANSFAC beruht jedoch auf der Computer-gestützten Vorhersage potentieller Transkriptionsfaktor-Bindestellen. Verschiedene Algorithmen verwenden dazu die einzelnen TF-Bindungsstellen oder die Matrix-Bibliothek.

Auf TRANSFAC-Inhalten basierende Tools zur Vorhersage von Transkriptionsfaktor-Bindungsstellen sind:

  • Patch – analysiert Sequenzähnlichkeiten mit den in TRANSFAC dokumentierten Bindungsstellen; wird zusammen mit der Datenbank bereitgestellt.<ref>Patch auf dem freien Portal von BIOBASE</ref><ref></ref>
  • SiteSeer – analysiert Sequenzähnlichkeiten mit den in TRANSFAC dokumentierten Bindungsstellen.<ref><templatestyles src="Webarchiv/styles.css" />SiteSeer (Memento vom 25. Juni 2011 im Internet Archive) von der University of Manchester</ref><ref></ref>
  • Match – identifiziert potentielle TFBS mithilfe der Matrix-Library; wird zusammen mit der Datenbank bereitgestellt.<ref>Match auf dem freien Portal von BIOBASE</ref><ref></ref>
  • TESS (Transcription Element Search System) – analysiert Sequenzähnlichkeiten mit Bindungsstellen aus TRANSFAC sowie potentielle Bindungsstellen mithilfe der Matrix-Libraries aus TRANSFAC und drei weiteren Quellen.<ref><templatestyles src="Webarchiv/styles.css" />Vorlage:Webarchiv/Wartung/TodayDer Wert des Parameters archive-today muss ein Datum der Form YYYYMMDD oder Zeitstempel der Form YYYY.MM.DD-hhmmss bzw. YYYYMMDDhhmmss sein. am CBIL der University of Pennsylvania</ref><ref><templatestyles src="Webarchiv/styles.css" />Site Search bei TESS (Memento vom 24. Juli 2012 im Internet Archive)</ref> TESS stellt auch ein Programm zur Identifizierung von cis-regulatorischen Modulen (CRMs, charakteristische Kombinationen von TFBS) bereit, das TRANSFAC-Matrizen nutzt.<ref><templatestyles src="Webarchiv/styles.css" />AnGEL CRM Searches (Memento vom 24. Juli 2012 im Internet Archive) im TESS-System</ref>
  • PROMO – Matrix-basierte TFBS-Vorhersage mithilfe der kommerziellen Datenbank-Version<ref>PROMO auf dem ALGGEN-Server der Universitat Politècnica de Catalunya (UPC)</ref><ref></ref>
  • TFM Explorer – Identifizierung gemeinsamer potentieller TFBS in einem Satz von Genen<ref>TFM Explorer auf dem Bioinformatics Software Server der SEQUOIA-Gruppe</ref><ref></ref>
  • MotifMogul – Matrix-basierte Sequenzanalyse mit verschiedenen Algorithmen<ref>MotifMogul vom Institute for Systems Biology in Seattle</ref>
  • ConTra – Matrix-basierte Sequenzanalyse in konservierten Promotorbereichen<ref>ConTra von der Universität Gent</ref><ref></ref>
  • PMS (Poly Matrix Search) – Matrix-basierte Sequenzanalyse in konservierten Promotorbereichen<ref><templatestyles src="Webarchiv/styles.css" />Vorlage:Webarchiv/Wartung/TodayDer Wert des Parameters archive-today muss ein Datum der Form YYYYMMDD oder Zeitstempel der Form YYYY.MM.DD-hhmmss bzw. YYYYMMDDhhmmss sein. entwickelt an der Nanjing University</ref><ref>G. Su, B. Mao, J. Wang: A web server for transcription factor binding site prediction. In: Bioinformation. 1, 2006, S. 156–157. PMID 17597879</ref>
  • ModuleMaster – Identifikation von angenommenerweise regulierenden Transkriptionsfaktoren für beliebige Gene und anschließende Identifizierung von cis-regulatorischen Modulen (CRMs).<ref>ModuleMaster TF and CRM searches</ref>

Abgleich von Matrizen mit denen der Matrix-Bibliotheken aus TRANSFAC und anderen Quellen:

  • T-Reg Comparator<ref><templatestyles src="Webarchiv/styles.css" />Vorlage:Webarchiv/Wartung/TodayDer Wert des Parameters archive-today muss ein Datum der Form YYYYMMDD oder Zeitstempel der Form YYYY.MM.DD-hhmmss bzw. YYYYMMDDhhmmss sein. auf dem Server des Max-Planck-Instituts für molekulare Genetik</ref> zum Vergleich von einzelnen oder Gruppen von Matrices mit denen der TRANSFAC oder anderer Matrix-Bibliotheken.
  • MACO (Poly Matrix Search)<ref><templatestyles src="Webarchiv/styles.css" />Vorlage:Webarchiv/Wartung/TodayDer Wert des Parameters archive-today muss ein Datum der Form YYYYMMDD oder Zeitstempel der Form YYYY.MM.DD-hhmmss bzw. YYYYMMDDhhmmss sein. entwickelt an der Nanjing University</ref><ref></ref> – Matrix-Vergleich mit Matrix-Bibliotheken

Mithilfe von TRANSFAC vorberechnete genomische Annotationen werden von verschiedenen Servern bereitgestellt.<ref><templatestyles src="Webarchiv/styles.css" />PReMOD (Memento vom 28. Dezember 2008 im Internet Archive): Menschliches und Maus-Genom aus den Jahren 2004 & 2005; IRCM / McGill University, Montreal</ref><ref>PRIMA: Menschliches Genom von 2004; Tel-Aviv University</ref>

Verwandte Datenquellen

Die folgenden Quellen bieten verwandte oder mit Teilen der TRANSFAC-Datenbank überlappende Inhalte an:

  • JASPAR – Sammlung von Transkriptionsfaktor-Bindungsprofilen (Matrizen) und Sequenzanalyseprogramm
  • PLACE – cis-regulatorische DNA-Elemente in Pflanzen; bis Februar 2007.
  • PlantCARE – cis-regulatorische Elemente und Transkriptionsfaktoren in Pflanzen (2002).
  • PRODORIC – ein ähnliches Konzept wie TRANSFAC- aber für Prokaryoten
  • RegulonDB – Fokus auf das Bakterium Escherichia coli
  • SCPD – spezifische Daten- und Toolsammlung für Hefe (Saccharomyces cerevisiae) (1998).
  • TFe – The transcription factor encyclopedia
  • TRDD – Transcription Regulatory Regions Database, hauptsächlich über regulatorische Regionen und TF-Bindungsstellen

Einzelnachweise

<references />

Literatur

Weblinks