Privacy Policy Cookie Policy Terms and Conditions Bioinformatik-Harvester - Wikipedia

Bioinformatik-Harvester

aus Wikipedia, der freien Enzyklopädie

Der Bioinformatik-Harvester (englisch harvester, „die Erntemaschine, -arbeiterin“) ist eine Bioinformatik-Meta-Suchmaschine über Gene und Proteine von Mensch, Maus und Ratte. Der Harvester vereint oder verlinkt den Inhalt von ca. 16 häufig verwendeten Bioinformatik-Ressourcen. Ein spezielles "ranking"-Verfahren (ähnlich dem Google-Pagerank) sortiert vorab die Informationen und präsentiert dem Benutzer die relevantesten Suchergebnisse in sehr kurzer Zeit.

Inhaltsverzeichnis

[Bearbeiten] Wie funktioniert der Bioinformatik-Harvester?

Harvester sammelt Informationen von Protein-/Gen-Datenbanken und sogenannten Vorhersage- oder "prediction"-Servern. Dazu simuliert der Harvester einen menschlichen Benutzer, ruft die entsprechende externe Datenbankseite auf und speichert diese auf lokalen Festplatten ab. Als Basis zum Sammeln der Informationen dienten die Uniprot-Protein-Datenbank des Uniprot-Konsortiums. Die Uniprot-Proteinsammlung umfasst ~ 72.000 (Stand: 2006-01) menschliche, ~ 65.000 Proteine der Maus und ~ 15.000 Proteine der Ratte.

Harvester sammelt zwei Arten von Informationen:

A) Textbasierte Informationen von den folgenden Datenbanken:

  • Uniprot, weltweit größte Protein-Datenbank
  • SOURCE, übersichtliche Darstellung von Geninformationen
  • Simple Modular Architecture Research Tool (SMART),
  • SOSUI, untersucht Transmembrandomänen
  • PSORT, Vorhersage für Protein-Lokalisierung
  • Homologene, vergleicht Proteine verschiedener Spezies
  • gfp-cdna, Protein-Lokalisierung mit Hilfe von Fluoreszenzmikroskopie
  • International Protein Index (IPI).
  • OMIM, Online Mendelian Inheritance in Man

B) Datenbanken, welche reich an graphischen Elementen sind, werden nicht "gesammelt", sondern in sogenannten iframes verlinkt. Iframes sind eine Art durchsichtiges Fenster auf einer HTML-Seite. Durch dieses Fenster kann man in Echtzeit auf entsprechende externe Datenbanken "hindurchsehen". Mehrere solcher iframe-Fenster werden auf einer Harvester-Protein-Seite kombiniert. Diese Methode erlaubt es, alle Informationen der verschiedenen Datenbanken auf einen Blick zu betrachten und zu vergleichen.

Derzeit werden folgende Server mittels iframes auf Harvester-Seiten vereint:

  • NCBI-BLAST, findet lokale Sequenzübereinstimmungen
  • Genome-Browser, übersichtliche Darstellung aktueller Genome von der UCSC
  • Ensembl, Automatische Genannotation. Ein Projekt von EMBL-EBI und Sanger-Institute
  • RZPD, Deutsches Ressourcenzentrum für Genomforschung in Berlin/Heidelberg
  • STRING, Server für die Darstellung von interagierenden Genen und Proteinen am EMBL
  • iHOP, verlinkt Literatur (pubmed) mit Hilfe von Gen- und Protein-Synonymen

Weiterhin verlinkt der Harvester zu Metasuchmaschinen, wie z. B. NCBI-Entrez.

[Bearbeiten] Was finde ich mit dem Harvester?

Harvester ermöglicht sowohl die Kombination verschiedenster Suchbegriffe als auch die Verwendung einzelner Wörter.

Beispiele:

  • Gen-Name: "golga3"
  • Gen-Aliase: "ADAP-S ADAS ADHAPS ADPS" (ein Name genügt)
  • Gen-Ontologien: "Enzyme linked receptor protein signaling pathway"
  • Unigene-Cluster: "Hs.449360"
  • Go-Annotation: "intra-Golgi transport"
  • Molekulare Funktion: "Protein kinase binding"
  • Protein: "Q9NPD3"
  • Protein-Domäne: "SH2 sar"
  • Protein-Lokalisierung: "endoplasmic reticulum"
  • Chromosomenband: "2q31"
  • Krankheitsrelevant: "diseaselink"
  • Kombination: "golgi diseaselink" (findet alle kranksheitsassoziierten Golgi-Proteine)
  • mRNA: "AL136897"
  • Schlagwort: "Cancer"
  • Kommentar: "highly expressed in heart"
  • Author: "Bush, Schroeder"
  • Publikation oder project: "cDNA sequencing project"


[Bearbeiten] Literatur

  • Liebel,U., & Kindler,B.,Pepperkok,R. (2004) 'Harvester': a fast meta search engine of human protein resources. Bioinformatics. 2004 Aug 12;20(12):1962-3. Epub 2004 Feb 26.[1]
  • Liebel,U., & Kindler,B.,Pepperkok,R. (2005) Bioinformatic "Harvester": a search engine for genome-wide human, mouse, and rat protein resources. Methods Enzymol. 2005;404:19-26[2]

[Bearbeiten] Weblinks

Andere Sprachen

Static Wikipedia 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -