#datasets
8 APIs met deze tag
Gene Expression API
Functionele-genomica-experimenten als een API — aangedreven door NCBI GEO (Gene Expression Omnibus), de grootste openbare repository van genexpressiegegevens. GEO archiveert expressieseries en samengestelde datasets van microarray- en high-throughput-sequencing-experimenten voor elk organisme. Zoek experimenten op trefwoord en optioneel op organisme, en raadpleeg elke serie of dataset om de metadata te krijgen: titel, samenvatting, assaytype (expressieprofilering door array of door sequencing), organisme, aantal monsters, platform en de publicatie erachter. Van β-celstressstudies tot kankertranscriptomics bij mens en muis, het verandert het GEO-archief in een eenvoudige zoek-en-ophaal-API voor transcriptomics, bio-informatica en onderzoeksgegevensontdekking. Een genexpressie / functionele-genomica-datasetrepository — te onderscheiden van sequentie- (ENA), variant- (ClinVar, dbVar), structuur- (PDB) en ontologiedatabases. Open data van NCBI GEO (publiek domein).
api.oanor.com/geodatasets-api
DataCite API
DataCite als API — het wereldwijde register van DOI's (Digital Object Identifiers) voor onderzoeksoutputs. Waar Crossref DOI's registreert voor tijdschriftartikelen, registreert en beschrijft DataCite DOI's voor onderzoeksdata, software, monsters, dissertaties, preprints, modellen, afbeeldingen en andere outputs, van repositories zoals Zenodo, Dryad en duizenden instellingen. /v1/search?query=climate doorzoekt het register op volledige tekst en kan worden verfijnd op brontype (type=dataset, software, text, image, audiovisual, collection, model en meer), waarbij elke DOI wordt geretourneerd met zijn titel, type, makers, uitgever en publicatiejaar. /v1/doi?id=10.5281/zenodo.3509134 retourneert de volledige metadata van een enkele DOI — titel, brontype, makers, uitgever, publicatiejaar, beschrijving, onderwerpen, versie, licentie en registratiedatum. DOI's zien eruit als 10.5281/zenodo.3509134 (Zenodo) of 10.5061/dryad.xxxx (Dryad). Ideaal voor het ontdekken en citeren van onderzoeksdata, tools voor datarepositories en referentiebeheer, softwarecitatie-functies en reproduceerbaarheidswerkstromen. Metadata is CC0 van DataCite. Dit is het register van onderzoeksdata en software-DOI's — te onderscheiden van de DOI-index voor tijdschriftartikelen (Crossref) en van preprint- en open-accessdiensten.
api.oanor.com/datacite-api
BioStudies API
BioStudies als API, aangedreven door EMBL-EBI — de database die de beschrijvingen van biologische studies bevat en hun gegevens verbindt over EBI-bronnen heen, waaronder beeldvorming (BioImage Archive), functionele genomica (ArrayExpress), proteomics en de literatuur (Europe PMC). Elke studie heeft een accession, een titel en samenvatting, de collectie waartoe het behoort en links naar de onderliggende gegevens en publicaties. /v1/search?query=covid doorzoekt de studies en retourneert de accession (bijv. S-EPMC8017430), titel, auteur, studietype, releasedatum en link/bestandtellingen van elke overeenkomst. /v1/study?id=S-EPMC8017430 retourneert de metadata van een studie — de accession, de collectie waartoe het behoort (zoals EuropePMC, ArrayExpress of BioImages), titel, samenvatting, releasedatum, auteurs en het aantal gekoppelde bronnen. Accessions zien eruit als S-EPMC8017430 of S-BSST123; haal er een uit het zoekendpoint. Ideaal voor onderzoeksgegevensontdekking, het koppelen van literatuur aan de onderliggende datasets, systematische reviews en reproduceerbaarheidstools. Gegevens van EMBL-EBI BioStudies (openbaar). Dit is een index van studies en datasets metadata — verschillend van de sequentie- (UniProt, ENA), structuur- (PDB, EMDB), variant- (ClinVar) en ontologiedatabases.
api.oanor.com/biostudies-api
Hugging Face API
De Hugging Face Hub als API — de centrale, open registry van machine-learning modellen en datasets die een groot deel van het moderne AI-ecosysteem aandrijft. Deze API verpakt de openbare huggingface.co Hub in schone JSON. /v1/models doorzoekt de modellen van de Hub en laat je filteren op taak (pipeline_tag — bijv. text-generation, text-to-image, image-classification, automatic-speech-recognition, sentence-similarity) en op bibliotheek (transformers, diffusers, sentence-transformers, …), gesorteerd op downloads, likes, last-modified, created of trending score — elk model wordt geretourneerd met zijn id, auteur, taak, bibliotheek, download- en like-aantallen, licentie, tags en tijdstempels. /v1/model?id=google-bert/bert-base-uncased retourneert de volledige metadata van één model. /v1/datasets doorzoekt ML-datasets op dezelfde manier, en /v1/dataset?id=ILSVRC/imagenet-1k retourneert de metadata van één dataset. Id's hebben de vorm org/naam (haal ze uit de zoekendpoints). Ideaal voor ML- en MLOps-tooling, modelontdekkings- en vergelijkingssites, AI-leaderboards en dashboards, en AI-assistenten die modellen aanbevelen. Gegevens komen van de openbare Hugging Face Hub (gratis te gebruiken). Dit is de AI/ML-model- en dataset-hub — te onderscheiden van softwarepakketregisters (npm, PyPI, Maven, NuGet) en academische artikelindexen (arXiv).
api.oanor.com/huggingface-api
MGnify API
MGnify als API, aangedreven door EMBL-EBI — 's werelds grootste gratis bron voor de analyse en archivering van microbiomsequencinggegevens, en de metagenomische zuster van PRIDE (proteomics) en MetaboLights (metabolomics). MGnify bevat tienduizenden openbare metagenomische en metabarcodingstudies die het menselijke darmmicrobioom, mariene en zoetwateromgevingen, bodems, afvalwater, de gebouwde omgeving en gastheer-geassocieerde gemeenschappen omvatten. Doorzoek de studies op trefwoord en verkrijg de MGnify-toegang (MGYS...), naam, samenvatting, bioom, aantal monsters en het bronsequencing BioProject van elke studie; lees de volledige metadata van een studie, inclusief naam en samenvatting, bioomclassificatie, aantal monsters, indienend centrum, openbare status, gegevensherkomst en datum van laatste update; en blader door de GOLD-stijl bioomclassificatieboom — van root:Host-associated:Human:Digestive system tot root:Environmental:Aquatic:Marine — met per-bioom monster- en studietellingen, voor ontdekking per omgeving. Ideaal voor microbiom- en omgevingsgenomica-onderzoek, hergebruik van datasets en meta-analyse, bioinformatica-pijplijnen en onderwijs. Studie-toegangen zien eruit als MGYS00006862. Gegevens van EMBL-EBI MGnify.
api.oanor.com/mgnify-api
EU Open Data API
Het open-data portaal van de Europese Unie als API, aangedreven door data.europa.eu — het officiële centrale toegangspunt voor meer dan 1,8 miljoen open datasets gepubliceerd door de EU-instellingen en geoogst van de nationale open-data portalen van alle 27 lidstaten (waaronder data.gov.uk, data.gouv.fr en GovData Germany). Doorzoek datasets over elk thema — energie, gezondheid, transport, milieu, landbouw, economie, justitie en meer — met optionele filters op bestandsformaat en publicerend land, waarbij u de identifier, Engelse titel en beschrijving, uitgever, bronportaal, land, beschikbare formaten, aantal bronnen, laatste wijzigingsdatum en licentie van elke dataset krijgt; lees de volledige metadata van een dataset samen met al zijn downloadbare distributies (titel, formaat en directe URL van elke distributie), plus categorieën, trefwoorden, talen en temporele dekking; en verken ontdekkingsfacetten voor elke query — de meest voorkomende bestandsformaten en de landen die overeenkomende datasets publiceren. Ideaal voor datajournalistiek, civic-tech en govtech-toepassingen, onderzoek, markt- en beleidsanalyse, en elke tool die Europese publieke sectorinformatie moet vinden en downloaden. Dataset-identifiers komen uit zoekresultaten; titels en beschrijvingen worden in het Engels geretourneerd waar beschikbaar. Gegevens van data.europa.eu (licenties variëren per dataset; de meeste zijn CC-BY of publiek domein).
api.oanor.com/eudata-api
MetaboLights API
MetaboLights als API, aangedreven door EMBL-EBI — 's werelds belangrijkste open repository voor metabolomics-experimenten (NMR-spectroscopie en massaspectrometrie) en een zusterbron van PRIDE voor proteomics. Doorzoek de openbare metabolomics-studies op trefwoord (met terugkeer van elke studie's toegangscode, titel, beschrijving en organisme); lees de volledige metadata van een studie inclusief de samenvatting, status, inzendings- en releasedatums, studiedesign-beschrijvingen, experimentele factoren, de analytische assays met hun meettype, technologie en platform, de bijdragers en hun rollen, de gelinkte publicaties met DOI- en PubMed-identificaties, indieners, aantal monsters, FTP-download-URL en datalicentie; inspecteer de analytische workflow — elk protocol met zijn naam, type, beschrijving en parameters (monsterverzameling, extractie, chromatografie, NMR/MS-spectroscopie, datatransformatie en metabolietidentificatie); en vermeld de bestudeerde organismen en organismendelen met hun ontologieteremen. Ideaal voor metabolomics- en systeembiologie-onderzoek, hergebruik van datasets en meta-analyse, bioinformatica-pijplijnen en tools die experimenteel bewijs integreren. Studie-toegangscodes zien eruit als MTBLS1. Gegevens van EMBL-EBI MetaboLights.
api.oanor.com/metabolights-api
PRIDE API
Het PRIDE-proteomicsarchief als API, aangedreven door het EMBL-EBI PRIDE Archive — 's werelds grootste openbare repository van massaspectrometrie-proteomicsgegevens en een oprichtend lid van ProteomeXchange. Doorzoek de openbare proteomics-experimenten op trefwoord (met terugkeer van elk project's toegangsnummer, titel, organismen, ziekten en instrumenten); lees de volledige metadata van een project inclusief de beschrijving, trefwoorden, organismen en orgaandelen, massaspectrometrie-instrumenten, software, de geïdentificeerde eiwitmodificaties, monster- en dataverwerkingsprotocollen, indieners, affiliaties en de gekoppelde publicatie (DOI en PubMed); toon de gegevensbestanden van een project met hun categorie, formaat, grootte en een directe downloadlink; en verken facetten — de ziekten, organismen, instrumenten, experimenttypen, software en landen die vertegenwoordigd zijn in overeenkomende projecten — voor ontdekking. Ideaal voor proteomics- en systeembiologieonderzoek, hergebruik van datasets en meta-analyse, bioinformatica-pijplijnen en tools die experimenteel bewijs integreren. Projecttoegangsnummers zien eruit als PXD000001. Gegevens van EMBL-EBI.
api.oanor.com/pride-api