ENA API
Das European Nucleotide Archive (ENA) als API, betrieben von EMBL-EBI – einem der drei INSDC-Partner neben NCBI GenBank und DDBJ und dem umfassenden öffentlichen Archiv der weltweiten Nukleotidsequenzdaten. ENA enthält rohe Sequenzierungs-Reads, assemblierte und annotierte Genome, einzelne Sequenzen, biologische Proben und die zugrunde liegenden Studien für alle Bereiche des Lebens – die grundlegende Ressource für Genomik, Mikrobiologie, Ökologie, Evolution und klinische Forschung. Diese API bietet einen klaren dreistufigen Workflow über dieses Archiv. Zunächst löst /v1/taxon einen Organismennamen (z. B. „Homo sapiens“) in seine NCBI-Taxon-ID, den wissenschaftlichen Namen, den taxonomischen Rang und die vollständige Abstammungslinie auf – oder sucht ein Taxon direkt anhand der ID. Dann durchsucht /v1/search das Archiv nach den Datensätzen dieses Taxons eines gewählten Typs: Genomassemblierungen (mit Assemblierungsname, -stufe und Basenzahl), Sequenzierungsläufe (mit Plattform, Instrument und Read-Zahlen), biologische Proben (mit Sammeldatum und Land), annotierte Sequenzen, Read-Experimente, Analysen, kodierende und nicht-kodierende Sequenzen sowie Studien – standardmäßig einschließlich aller abgeleiteten Taxa oder auf das genaue Taxon beschränkt. Schließlich gibt /v1/record eine Zusammenfassung für jede ENA-Accession zurück – Assemblierungen (GCA_…), Studien und Projekte (PRJ…), Proben (SAM…/ERS…), Sequenzierungsläufe (ERR…/SRR…) und Sequenzen – mit Titel, Datentyp, Taxon, wissenschaftlichem Namen, Basis- und Sequenzzahlen sowie öffentlichem Status. Ideal für Bioinformatik-Pipelines, Genomdaten-Entdeckung, Ernte von Sequenzierungsmetadaten, Biodiversitäts- und Metagenomik-Tools sowie Forschungsreproduzierbarkeit. Taxon-IDs sehen aus wie 9606 (Mensch); Accessions wie GCA_000001405. Daten von EMBL-EBI ENA, einem INSDC-Archiv, kostenlos nutzbar.
api.oanor.com/ena-api