Bioinformatik-Harvester
aus Wikipedia, der freien Enzyklopädie
Der Bioinformatik-Harvester (englisch harvester, „die Erntemaschine, -arbeiterin“) ist eine Bioinformatik-Meta-Suchmaschine über Gene und Proteine von Mensch, Maus und Ratte. Der Harvester vereint oder verlinkt den Inhalt von ca. 16 häufig verwendeten Bioinformatik-Ressourcen. Ein spezielles "ranking"-Verfahren (ähnlich dem Google-Pagerank) sortiert vorab die Informationen und präsentiert dem Benutzer die relevantesten Suchergebnisse in sehr kurzer Zeit.
Inhaltsverzeichnis |
[Bearbeiten] Wie funktioniert der Bioinformatik-Harvester?
Harvester sammelt Informationen von Protein-/Gen-Datenbanken und sogenannten Vorhersage- oder "prediction"-Servern. Dazu simuliert der Harvester einen menschlichen Benutzer, ruft die entsprechende externe Datenbankseite auf und speichert diese auf lokalen Festplatten ab. Als Basis zum Sammeln der Informationen dienten die Uniprot-Protein-Datenbank des Uniprot-Konsortiums. Die Uniprot-Proteinsammlung umfasst ~ 72.000 (Stand: 2006-01) menschliche, ~ 65.000 Proteine der Maus und ~ 15.000 Proteine der Ratte.
Harvester sammelt zwei Arten von Informationen:
A) Textbasierte Informationen von den folgenden Datenbanken:
- Uniprot, weltweit größte Protein-Datenbank
- SOURCE, übersichtliche Darstellung von Geninformationen
- Simple Modular Architecture Research Tool (SMART),
- SOSUI, untersucht Transmembrandomänen
- PSORT, Vorhersage für Protein-Lokalisierung
- Homologene, vergleicht Proteine verschiedener Spezies
- gfp-cdna, Protein-Lokalisierung mit Hilfe von Fluoreszenzmikroskopie
- International Protein Index (IPI).
- OMIM, Online Mendelian Inheritance in Man
B) Datenbanken, welche reich an graphischen Elementen sind, werden nicht "gesammelt", sondern in sogenannten iframes verlinkt. Iframes sind eine Art durchsichtiges Fenster auf einer HTML-Seite. Durch dieses Fenster kann man in Echtzeit auf entsprechende externe Datenbanken "hindurchsehen". Mehrere solcher iframe-Fenster werden auf einer Harvester-Protein-Seite kombiniert. Diese Methode erlaubt es, alle Informationen der verschiedenen Datenbanken auf einen Blick zu betrachten und zu vergleichen.
Derzeit werden folgende Server mittels iframes auf Harvester-Seiten vereint:
- NCBI-BLAST, findet lokale Sequenzübereinstimmungen
- Genome-Browser, übersichtliche Darstellung aktueller Genome von der UCSC
- Ensembl, Automatische Genannotation. Ein Projekt von EMBL-EBI und Sanger-Institute
- RZPD, Deutsches Ressourcenzentrum für Genomforschung in Berlin/Heidelberg
- STRING, Server für die Darstellung von interagierenden Genen und Proteinen am EMBL
- iHOP, verlinkt Literatur (pubmed) mit Hilfe von Gen- und Protein-Synonymen
Weiterhin verlinkt der Harvester zu Metasuchmaschinen, wie z. B. NCBI-Entrez.
[Bearbeiten] Was finde ich mit dem Harvester?
Harvester ermöglicht sowohl die Kombination verschiedenster Suchbegriffe als auch die Verwendung einzelner Wörter.
Beispiele:
- Gen-Name: "golga3"
- Gen-Aliase: "ADAP-S ADAS ADHAPS ADPS" (ein Name genügt)
- Gen-Ontologien: "Enzyme linked receptor protein signaling pathway"
- Unigene-Cluster: "Hs.449360"
- Go-Annotation: "intra-Golgi transport"
- Molekulare Funktion: "Protein kinase binding"
- Protein: "Q9NPD3"
- Protein-Domäne: "SH2 sar"
- Protein-Lokalisierung: "endoplasmic reticulum"
- Chromosomenband: "2q31"
- Krankheitsrelevant: "diseaselink"
- Kombination: "golgi diseaselink" (findet alle kranksheitsassoziierten Golgi-Proteine)
- mRNA: "AL136897"
- Schlagwort: "Cancer"
- Kommentar: "highly expressed in heart"
- Author: "Bush, Schroeder"
- Publikation oder project: "cDNA sequencing project"
Uniprot | SOURCE | SMART | SOSUI | PSORT | HomoloGene | gfp-cdna | IPI | OMIM | NCBI-BLAST | Genome-Browser | Ensembl | RZPD | STRING | iHOP | NCBI-Entrez
[Bearbeiten] Literatur
- Liebel,U., & Kindler,B.,Pepperkok,R. (2004) 'Harvester': a fast meta search engine of human protein resources. Bioinformatics. 2004 Aug 12;20(12):1962-3. Epub 2004 Feb 26.[1]
- Liebel,U., & Kindler,B.,Pepperkok,R. (2005) Bioinformatic "Harvester": a search engine for genome-wide human, mouse, and rat protein resources. Methods Enzymol. 2005;404:19-26[2]
[Bearbeiten] Weblinks
- Harvester search engine
- Harvester database id converter
- Harvester Wiki Gene & Protein annotations feedback.
- Harvester Tips&Trick "HowTo"-Tricks des Harvesters und anderer Bioinformatik-Ressourcen.
- Bioinformatik-Datenbanken-Sammlung