#datasets — oanor

Gene Expression API

Funktionelle Genomik-Experimente als API — unterstützt von NCBI GEO (Gene Expression Omnibus), dem größten öffentlichen Repository für Genexpressionsdaten. GEO archiviert Expressionsserien und kuratierte Datensätze aus Microarray- und Hochdurchsatz-Sequenzierungsexperimenten aller Organismen. Durchsuchen Sie Experimente nach Stichwort und optional nach Organismus, und rufen Sie jede Serie oder jeden Datensatz ab, um deren Metadaten zu erhalten: Titel, Zusammenfassung, Assay-Typ (Expressionsprofilierung durch Array oder durch Sequenzierung), Organismus, Anzahl der Proben, Plattform und die zugrunde liegende Publikation. Von β-Zell-Stress-Studien bis hin zur Krebs-Transkriptomik bei Mensch und Maus verwandelt es das GEO-Archiv in eine einfache Such- und Abruf-API für Transkriptomik, Bioinformatik und Forschungsdaten-Entdeckung. Ein Repository für Genexpressions-/funktionelle Genomik-Datensätze — abgegrenzt von Sequenz- (ENA), Varianten- (ClinVar, dbVar), Struktur- (PDB) und Ontologie-Datenbanken. Offene Daten von NCBI GEO (Public Domain).

api.oanor.com/geodatasets-api

DataCite API

DataCite als API – das globale Register von DOIs (Digital Object Identifiers) für Forschungsergebnisse. Während Crossref DOIs für Zeitschriftenartikel registriert, registriert und beschreibt DataCite DOIs für Forschungsdaten, Software, Proben, Dissertationen, Preprints, Modelle, Bilder und andere Ergebnisse aus Repositorien wie Zenodo, Dryad und Tausenden von Institutionen. /v1/search?query=climate durchsucht das Register im Volltext und kann nach Ressourcentyp eingegrenzt werden (type=dataset, software, text, image, audiovisual, collection, model und mehr) und gibt jeden DOI mit Titel, Typ, Erstellern, Verlag und Veröffentlichungsjahr zurück. /v1/doi?id=10.5281/zenodo.3509134 gibt die vollständigen Metadaten eines einzelnen DOIs zurück – Titel, Ressourcentyp, Ersteller, Verlag, Veröffentlichungsjahr, Beschreibung, Themen, Version, Lizenz und Registrierungsdatum. DOIs sehen aus wie 10.5281/zenodo.3509134 (Zenodo) oder 10.5061/dryad.xxxx (Dryad). Ideal für die Entdeckung und Zitierung von Forschungsdaten, Datenrepositorien und Referenzmanagement-Tools, Software-Zitierungsfunktionen und Reproduzierbarkeits-Workflows. Metadaten sind CC0 von DataCite. Dies ist das Register für Forschungsdaten- und Software-DOIs – unterschieden vom Zeitschriftenartikel-DOI-Index (Crossref) und von Preprint- und Open-Access-Diensten.

api.oanor.com/datacite-api

BioStudies API

BioStudies als API, bereitgestellt von EMBL-EBI – die Datenbank, die die Beschreibungen biologischer Studien enthält und ihre Daten über EBI-Ressourcen hinweg verknüpft, einschließlich Bildgebung (BioImage Archive), funktioneller Genomik (ArrayExpress), Proteomik und der Literatur (Europe PMC). Jede Studie hat eine Accession, einen Titel und ein Abstract, die Sammlung, zu der sie gehört, sowie Links zu ihren zugrunde liegenden Daten und Publikationen. /v1/search?query=covid durchsucht die Studien und gibt für jede Übereinstimmung die Accession (z. B. S-EPMC8017430), den Titel, den Autor, den Studientyp, das Veröffentlichungsdatum und die Anzahl der Links/Dateien zurück. /v1/study?id=S-EPMC8017430 gibt die Metadaten einer Studie zurück – ihre Accession, die Sammlung, zu der sie gehört (wie EuropePMC, ArrayExpress oder BioImages), Titel, Abstract, Veröffentlichungsdatum, Autoren und die Anzahl der verknüpften Ressourcen. Accessions sehen aus wie S-EPMC8017430 oder S-BSST123; eine davon erhalten Sie vom Such-Endpunkt. Ideal für die Entdeckung von Forschungsdaten, die Verknüpfung von Literatur mit ihren zugrunde liegenden Datensätzen, systematische Übersichtsarbeiten und Reproduzierbarkeits-Tools. Daten von EMBL-EBI BioStudies (öffentlich). Dies ist ein Index für Studien- und Datensatz-Metadaten – unterscheidet sich von den Sequenz- (UniProt, ENA), Struktur- (PDB, EMDB), Varianten- (ClinVar) und Ontologie-Datenbanken.

api.oanor.com/biostudies-api

Hugging Face API

Der Hugging Face Hub als API – das zentrale, offene Register für maschinelle Lernmodelle und Datensätze, das einen Großteil des modernen KI-Ökosystems antreibt. Diese API verpackt den öffentlichen huggingface.co Hub in sauberes JSON. /v1/models durchsucht die Modelle des Hubs und ermöglicht die Filterung nach Aufgabe (pipeline_tag – z. B. text-generation, text-to-image, image-classification, automatic-speech-recognition, sentence-similarity) und nach Bibliothek (transformers, diffusers, sentence-transformers, …), sortiert nach Downloads, Likes, letzter Änderung, Erstellungsdatum oder Trend-Score – jedes Modell wird mit seiner ID, Autor, Aufgabe, Bibliothek, Download- und Like-Zahlen, Lizenz, Tags und Zeitstempeln zurückgegeben. /v1/model?id=google-bert/bert-base-uncased gibt die vollständigen Metadaten eines einzelnen Modells zurück. /v1/datasets durchsucht ML-Datensätze auf die gleiche Weise, und /v1/dataset?id=ILSVRC/imagenet-1k gibt die Metadaten eines einzelnen Datensatzes zurück. IDs liegen im Format org/name vor (entnehmen Sie sie den Such-Endpunkten). Ideal für ML- und MLOps-Tools, Modellentdeckungs- und Vergleichsseiten, KI-Bestenlisten und Dashboards sowie KI-Assistenten, die Modelle empfehlen. Die Daten stammen vom öffentlichen Hugging Face Hub (kostenlos nutzbar). Dies ist der KI/ML-Modell- und Datensatz-Hub – abzugrenzen von Software-Paketregistern (npm, PyPI, Maven, NuGet) und akademischen Paper-Indizes (arXiv).

api.oanor.com/huggingface-api

MGnify API

MGnify als API, betrieben von EMBL-EBI – der weltweit größten kostenlosen Ressource für die Analyse und Archivierung von Mikrobiom-Sequenzierungsdaten und der metagenomischen Schwester von PRIDE (Proteomik) und MetaboLights (Metabolomik). MGnify enthält Zehntausende öffentlicher Metagenomik- und Metabarcoding-Studien, die das menschliche Darmmikrobiom, Meeres- und Süßwasserumgebungen, Böden, Abwasser, die gebaute Umwelt und wirtsassoziierte Gemeinschaften abdecken. Durchsuchen Sie die Studien nach Stichworten und erhalten Sie die MGnify-Zugangsnummer (MGYS...), den Namen, die Zusammenfassung, das Biom, die Probenanzahl und das zugrunde liegende Sequenzierungs-BioProject jeder Studie; lesen Sie die vollständigen Metadaten einer Studie, einschließlich Name und Zusammenfassung, Biom-Klassifizierung, Anzahl der Proben, einreichendes Zentrum, öffentlicher Status, Datenherkunft und Datum der letzten Aktualisierung; und durchsuchen Sie den GOLD-ähnlichen Biom-Klassifizierungsbaum – von root:Host-associated:Human:Digestive system bis root:Environmental:Aquatic:Marine – mit Proben- und Studienanzahlen pro Biom, zur Entdeckung nach Umgebung. Ideal für Mikrobiom- und Umweltgenomik-Forschung, Datennutzung und Metaanalyse, Bioinformatik-Pipelines und Lehre. Studienzugänge sehen aus wie MGYS00006862. Daten von EMBL-EBI MGnify.

api.oanor.com/mgnify-api

EU Open Data API

Das Open-Data-Portal der Europäischen Union als API, betrieben von data.europa.eu — dem offiziellen zentralen Zugang zu über 1,8 Millionen offenen Datensätzen, die von den EU-Institutionen veröffentlicht und von den nationalen Open-Data-Portalen aller 27 Mitgliedstaaten (einschließlich data.gov.uk, data.gouv.fr und GovData Germany) geerntet wurden. Durchsuchen Sie Datensätze zu allen Themen — Energie, Gesundheit, Verkehr, Umwelt, Landwirtschaft, Wirtschaft, Justiz und mehr — mit optionalen Filtern nach Dateiformat und veröffentlichendem Land, und erhalten Sie die Kennung, den englischen Titel und die Beschreibung, den Herausgeber, das Quellportal, das Land, die verfügbaren Formate, die Anzahl der Ressourcen, das Datum der letzten Änderung und die Lizenz jedes Datensatzes; lesen Sie die vollständigen Metadaten eines Datensatzes zusammen mit allen herunterladbaren Distributionen (Titel, Format und direkte URL jeder Distribution) sowie Kategorien, Schlüsselwörter, Sprachen und zeitliche Abdeckung; und erkunden Sie Discovery-Facetten für jede Abfrage — die häufigsten Dateiformate und die Länder, die passende Datensätze veröffentlichen. Ideal für Datenjournalismus, Civic-Tech- und GovTech-Anwendungen, Forschung, Markt- und Politikanalyse sowie jedes Tool, das europäische öffentliche Informationen finden und herunterladen muss. Datensatzkennungen stammen aus Suchergebnissen; Titel und Beschreibungen werden in englischer Sprache zurückgegeben, sofern verfügbar. Daten von data.europa.eu (Lizenzen variieren pro Datensatz; die meisten sind CC-BY oder gemeinfrei).

api.oanor.com/eudata-api

MetaboLights API

MetaboLights als API, bereitgestellt von EMBL-EBI — dem weltweit führenden offenen Repositorium für Metabolomik-Experimente (NMR-Spektroskopie und Massenspektrometrie) und einer Schwesterressource zu PRIDE für Proteomik. Durchsuchen Sie die öffentlichen Metabolomik-Studien nach Stichwort (Rückgabe der Zugangsnummer, des Titels, der Beschreibung und des Organismus jeder Studie); lesen Sie die vollständigen Metadaten einer Studie einschließlich ihrer Zusammenfassung, ihres Status, ihrer Einreichungs- und Veröffentlichungsdaten, der Studiendesign-Deskriptoren, der experimentellen Faktoren, der analytischen Assays mit ihrem Messtyp, ihrer Technologie und Plattform, der Mitwirkenden und ihrer Rollen, der verknüpften Publikationen mit DOI- und PubMed-Identifikatoren, der Einreicher, der Probenanzahl, der FTP-Download-URL und der Datenlizenz; überprüfen Sie den analytischen Workflow — jedes Protokoll mit seinem Namen, Typ, Beschreibung und Parametern (Probenahme, Extraktion, Chromatographie, NMR/MS-Spektroskopie, Datentransformation und Metabolitenidentifikation); und listen Sie die untersuchten Organismen und Organismusteile mit ihren Ontologiebegriffen auf. Ideal für Metabolomik- und Systembiologie-Forschung, Datennutzung und Metaanalyse, Bioinformatik-Pipelines und Tools, die experimentelle Evidenz integrieren. Studienzugangsnummern sehen aus wie MTBLS1. Daten von EMBL-EBI MetaboLights.

api.oanor.com/metabolights-api

PRIDE API

Das PRIDE-Proteomik-Archiv als API, betrieben vom EMBL-EBI PRIDE Archive – dem weltweit größten öffentlichen Repository für Massenspektrometrie-Proteomikdaten und Gründungsmitglied von ProteomeXchange. Durchsuchen Sie öffentliche Proteomik-Experimente nach Stichwort (Rückgabe der Zugangsnummer, des Titels, der Organismen, Krankheiten und Instrumente jedes Projekts); lesen Sie die vollständigen Metadaten eines Projekts, einschließlich seiner Beschreibung, Schlüsselwörter, Organismen und Organismusteile, Massenspektrometrie-Instrumente, Software, identifizierte Proteinmodifikationen, Proben- und Datenverarbeitungsprotokolle, Einreicher, Zugehörigkeiten und die verknüpfte Publikation (DOI und PubMed); listen Sie die Datendateien eines Projekts mit ihrer Kategorie, ihrem Format, ihrer Größe und einem direkten Download-Link auf; und erkunden Sie Facetten – die Krankheiten, Organismen, Instrumente, Experimenttypen, Software und Länder, die in übereinstimmenden Projekten vertreten sind – zur Entdeckung. Ideal für Proteomik- und Systembiologie-Forschung, Datensatz-Wiederverwendung und Metaanalyse, Bioinformatik-Pipelines und Tools, die experimentelle Evidenz integrieren. Projektzugangsnummern sehen aus wie PXD000001. Daten von EMBL-EBI.

api.oanor.com/pride-api