BRENDA Tissue Ontology
Die BTO[1] (BRENDA Tissue Ontology) ist eine Enzyklopädie, die Begriffe und Bezeichnungen für Gewebe, Organe, anatomische Strukturen, Pflanzenteile, Zellkulturen, Zelltypen und Zelllinien in Organismen aus allen taxonomischen Gruppen (Tieren, Pflanzen, Pilzen und Einzellern), aus denen die Enzyme isoliert bzw. in denen sie nachgewiesen wurden, beschreibt.
Die BTO ist eine der ersten gewebespezifischen Ontologien im Bereich der Lebenswissenschaften, die sich nicht auf einen Organismus oder eine Organismengruppe konzentriert und somit einen leichten Zugang zu den umfassenden Informationen ermöglicht. Sie wird von anderen Datenbanken als Datenquelle verwendet oder in deren Suchfunktionen integriert, beispielsweise vom Ontology Lookup Service und MIRIAM Registry des EBI-EMBL oder von der TissueDistributionDB mit einer Tissue Synonym Library am Deutschen Krebsforschungszentrum Heidelberg oder auf den Webseiten des Bioportal (National Center for Biomedical Ontology, Stanford, USA). Die Nutzer der BTO kommen aus den Bereichen Medizin und Pharmazie, die sich mit dem Vorkommen und histologischen Nachweis von krankheitsrelevanten Enzymen in Geweben beschäftigen, die eine wichtige Rolle in der Diagnose und Behandlung sowie in der Medikamentenentwicklung spielen. In der biochemischen und biotechnologischen Forschung dient der gewebespezifische Nachweis von Enzymen dazu, um Stoffwechselvorgänge, Regulationen und Funktionen besser verstehen zu können. Mit Hilfe von strukturiertem und kontrolliertem Vokabular[2] sind Ontologien ein wichtiges Werkzeug, um die evolutionären Zusammenhänge bildlich darzustellen und miteinander zu verknüpfen.
Die Entwicklung der BTO begann 2003 mit dem Ziel, die biochemischen und molekularbiologischen Enzymdaten von BRENDA („BRaunschweig ENzyme DAtabase“[3]) mit einer hierarchischen und standardisierten Sammlung an gewebespezifischen Begriffen zu verbinden. Die enzymspezifischen Daten und Informationen in BRENDA werden von Biochemikern, Biologen und Chemikern manuell aus wissenschaftlicher Literatur annotiert. Derzeit (Stand Oktober 2019) enthält die BTO 6042 Begriffe, denen 5173 Synonyme und 5074 Definitionen zugeordnet sind; jeder Begriff ist jeweils mindestens einer Literaturstelle und einem Enzym zugeordnet. Die sogenannten Terme (= Begriffe) sind nach den allgemeinen Kategorien, Regeln und Formaten des Gene Ontology Konsortiums (GO,[4]) klassifiziert. Die Terme werden nicht als klassische Hierarchie, sondern in Form eines gerichteten azyklischen Graphen (DAG, directed acyclic graph) dargestellt und mit Hilfe des Editors (Bearbeitungsprogramms) OBO-Edit erstellt.[5] Von jeder Ebene der Hierarchie ist ein direkter Zugriff auf die funktionellen Enzymdaten in BRENDA möglich. Viele Enzyme werden gewebespezifisch exprimiert, so dass die BTO geeignet ist, diese voneinander zu unterscheiden.
Inhalt und Funktionalität
Die BTO greift auf die umfangreichen enzymspezifischen Daten des BRENDA-Enzyminformationssystems zu. Derzeit (Oktober 2019) sind 112.200 Enzym-Organismus-Gewebe-spezifische Daten für über 11.000 Proteine in BRENDA enthalten. Diese wurden aus über 150.000 Literaturreferenzen manuell annotiert. Alle BTO-Terme werden evaluiert und in der Ontologie klassifiziert, im sogenannten OBO-Format, wobei jeder Term eine definierte Beziehung zu einem anderen Term besitzt. Jeder Term kommt nur genau einmal in der Ontologie vor und wird automatisch einer eindeutigen BTO-Identifikationsnummer zugeordnet (BTO-ID). Diese BTO-IDs dienen dazu, die Informationen mit weiteren Datenbanken verbinden zu können. Zusätzlich wurden Begriffe aus externen Quellen in die BTO integriert, z. B. UniProt.
Die Terme werden in vier Hauptkategorien, den sogenannten Subgraphen klassifiziert:
- animal
- plant
- fungus
- other sources
Unterhalb dieser Kategorien (= Knoten) befinden sich die weiteren Ebenen, in denen die „Kinder“, „Geschwister“ und „Enkel“ etc. definiert werden. Diese Kategorien sind über definierte Beziehungen (= Kanten) miteinander verknüpft:
- „ist“ („is_a“, z. B. skeletal muscle fibre is_a muscle fibre)
- „Teil von“ („part_of“, z. B. muscle fibre part_of muscle)
- „entwickelt aus“ („develops/derives_from“, z. B. myoma cell develops/derives_from muscle fibre)
- „ähnlich“ („related_to“, beschreibt allgemeine Beziehungen, die nicht über „is_a“, „part_of“ oder „develops/derives_from“ erfasst werden).
Viele Terme in der BTO können spezifischen Organismen, Organen, Geweben oder Zelltypen zugeordnet werden. Diese werden in der Hierarchie in der entsprechenden Definition genannt. Bei nicht eindeutigen Ausdrücken, wie z. B. Epidermis, die sowohl Tieren als auch Pflanzen zugehörig sein können, wird zur Unterscheidung ein Präfix eingeführt, z. B. „plant epidermis“.
Viele der Definitionen stammen aus spezifischen Fachwörterbüchern aus dem Bereich der Medizin, Zelllinien-Datenbanken etc. (z. B. Webster’s Dictionary, DSMZ).
Verfügbarkeit
Die Einträge in der BTO werden halbjährlich parallel zu BRENDA aktualisiert und sind über die BRENDA-Webseite im „Ontology Explorer“ frei zugänglich. Der Nutzer kann die BTO über eine einfache Suchmaske durchsuchen und über die Ergebnisausgabe direkt auf die Enzymdaten in BRENDA zugreifen. Eine weitere Möglichkeit, die BTO zu durchsuchen, ergibt sich über den Quick-Search-Modus „Source Tissue“ auf der BRENDA-Website ("Classic View"). Die Einträge in der Ergebnisliste sind direkt mit der Suche in der BTO verknüpft.
Die Benutzung der BTO und somit auch von BRENDA ist für akademische Nutzer kostenlos. Die BTO lässt sich über „Obofoundry“ herunterladen. Kommerzielle Nutzer können über die biobase GmbH Lizenzen erwerben.
Literaturreferenzen
- Gremse, M., Chang, A., Schomburg, I., Grote, A., Scheer, M., Ebeling, C., Schomburg, D. (2011): „The BRENDA Tissue Ontology (BTO): the first all-integrating ontology of all organisms for enzyme sources“, Nucleic Acids Res., 39 (Database issue): D507–D513
- Schomburg, I., Chang, A., Schomburg, D. (2014): „Standardization in enzymology—Data integration in the world’s enzyme information system BRENDA“, Perspectives in Science, 1: 15–23
- Schomburg, I., Chang, A., Placzek, S., Söhngen, C., Rother. M., Lang, M., Munaretto, C., Ulas, S., Stelzer, M., Grote, A., Scheer, M., Schomburg, D. (2013): „BRENDA in 2013: integrated reactions, kinetic data, enzyme function data, improved disease classification: new options and contents in BRENDA“, Nucleic Acids Res., 41 (Database issue): D764–D772
- Roncaglia, P., Martone, M.E., Hill, D.P., Berardini, T.Z., Foulger, R.E., Imam, F.T., Drabkin, H., Mungall, C.J., Lomax, J. (2013): „The Gene Ontology (GO) Cellular Component Ontology: integration with SAO (Subcellular Anatomy Ontology) and other recent developments“, J. Biomed. Semantics, 4: 20
- Smith, B., Ashburner, M., Rosse, C., Bard, J., Bug, W., Ceusters, W., Goldberg, L.J., Eilbeck, K., Ireland, A., Mungall, C.J.; OBI Consortium, Leontis, N., Rocca-Serra, P., Ruttenberg, A., Sansone, S.A., Scheuermann, R.H., Shah, N., Whetzel, P. L., Lewis, S. (2010): „The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration“, Nat. Biotechnol., 25: 1251–1255