#genomics — oanor

API des assemblages de génomes

Assemblages de génomes de référence sous forme d'API — alimentée par NCBI Assembly, le registre des constructions de génomes pour les organismes de l'arbre de la vie. Recherchez des assemblages par organisme (ou texte libre) et consultez les métadonnées de tout assemblage : son accession (GCF_… RefSeq ou GCA_… GenBank), son nom (par exemple GRCh38.p14), l'organisme et l'identifiant taxonomique, le niveau d'assemblage (génome complet, chromosome, échafaudage ou contig), les statistiques de contiguïté (N50 des contigs et des échafaudages), la couverture de séquençage, la catégorie RefSeq, les noms UCSC et Ensembl, l'organisation soumettrice, la date de publication et les chemins de téléchargement FTP. Du génome de référence humain à tout microbe, plante ou animal séquencé, il transforme le registre des assemblages de génomes en une API propre de recherche et de récupération. Un registre d'assemblages de génomes — distinct des bases de données de séquences (ENA), d'annotation de génomes (Ensembl), de variants (ClinVar, dbVar) et d'expression génique (GEO). Données ouvertes de NCBI Assembly (domaine public).

api.oanor.com/genomes-api

API d'expression génique

Expériences de génomique fonctionnelle sous forme d'API — propulsée par NCBI GEO (Gene Expression Omnibus), le plus grand référentiel public de données d'expression génique. GEO archive des séries d'expression et des ensembles de données organisés provenant d'expériences de puces à ADN et de séquençage à haut débit pour chaque organisme. Recherchez des expériences par mot-clé et éventuellement par organisme, et consultez toute série ou ensemble de données pour obtenir ses métadonnées : titre, résumé, type de test (profilage d'expression par puce ou par séquençage), organisme, nombre d'échantillons, plateforme et publication associée. Des études sur le stress des cellules β à la transcriptomique du cancer chez l'humain et la souris, il transforme l'archive GEO en une API simple de recherche et de récupération pour la transcriptomique, la bioinformatique et la découverte de données de recherche. Un référentiel de données d'expression génique / génomique fonctionnelle — distinct des bases de données de séquences (ENA), de variants (ClinVar, dbVar), de structures (PDB) et d'ontologies. Données ouvertes de NCBI GEO (domaine public).

api.oanor.com/geodatasets-api

API des Variants Structuraux

Variation structurelle génomique humaine sous forme d'API — alimentée par NCBI dbVar, l'archive des variants structuraux (SV) : variants du nombre de copies (CNV), grandes délétions, duplications, insertions, inversions et translocations, généralement de plus de 50 paires de bases. Il s'agit de la contrepartie structurelle des bases de données de variants nucléotidiques uniques : recherchez les variants structuraux chevauchant un gène (ou par texte libre) et obtenez pour chaque variant son accession dbVar, l'étude dont il provient, son type, les gènes qu'il chevauche, son placement génomique sur GRCh38 et sa signification clinique ; puis consultez n'importe quel variant pour obtenir l'enregistrement complet — placements sur les assemblages GRCh37 et GRCh38, type de variant, gènes, signification clinique, type d'étude, méthodes et comptages de variants. Des CNV de BRCA1 aux délétions du Cri-du-chat, c'est idéal pour la génomique, la cytogénétique, les maladies rares et la bioinformatique. Une ressource de variation structurelle / CNV — distincte de l'interprétation clinique des variants nucléotidiques uniques (ClinVar), des fréquences alléliques de population (gnomAD) et des associations de traits (GWAS). Données ouvertes de NCBI dbVar (domaine public).

api.oanor.com/dbvar-api

API Interactions Protéiques

Réseaux d'interactions protéine-protéine sous forme d'API — propulsé par STRING, la base de données d'associations protéiques connues et prédites qui combine des preuves issues d'expériences de laboratoire, de bases de données de voies organisées, de co-expression génique, de contexte génomique et de fouille de texte automatisée en un seul score de confiance, à travers des milliers d'organismes. Obtenez les principaux partenaires d'interaction d'une protéine (chacun avec le score de confiance combiné et les sept sous-scores des canaux de preuve), le réseau d'interaction entre n'importe quel ensemble de protéines sous forme d'arêtes notées, et l'enrichissement fonctionnel pour un ensemble de gènes — les termes GO sur-représentés, les voies KEGG, les domaines Pfam et plus encore, chacun avec sa valeur p, son FDR et ses gènes membres. Passez des symboles de gènes (TP53) ou des identifiants STRING/Ensembl, pour l'humain (par défaut) ou toute espèce par identifiant taxonomique NCBI. C'est une pierre angulaire de la biologie des systèmes — idéal pour l'analyse de réseaux, la génomique fonctionnelle, les voies et les outils bioinformatiques. Une ressource de réseau d'interactions protéiques — distincte des voies biologiques (Reactome), des complexes protéiques organisés (Complex Portal) et des annotations Gene Ontology (QuickGO). Données ouvertes de STRING (CC BY 4.0).

api.oanor.com/stringdb-api

API de scores polygéniques

Scores polygéniques (de risque) sous forme d'API — propulsée par le NHGRI-EBI PGS Catalog, la base de données ouverte des scores polygéniques publiés : combinaisons pondérées de variants génétiques utilisées pour estimer la prédisposition génétique d'une personne à un trait ou une maladie. Recherchez des traits par nom pour trouver leurs identifiants d'ontologie, listez chaque score polygénique développé pour un trait, et lisez les métadonnées complètes d'un score — les traits rapportés et mappés (EFO/MONDO), le nombre de variants dans le score, la méthode de développement, la version du génome, la distribution d'ascendance des échantillons sur lesquels il a été construit et évalué, la publication associée (titre, revue, date, identifiant PubMed), la date de publication, la licence et un lien direct vers le fichier de scoring. Du cancer du sein et de la maladie coronarienne au diabète de type 2 et à l'IMC, il est idéal pour la génétique statistique, la génomique, la recherche en prédiction de risque et les outils bioinformatiques. Une ressource de scores polygéniques / prédiction de risque génétique — distincte des études d'association à variant unique (GWAS Catalog), des fréquences alléliques de population (gnomAD) et de l'interprétation clinique des variants (ClinVar). Données ouvertes du NHGRI-EBI PGS Catalog (CC BY 4.0).

api.oanor.com/pgs-api

API Gene Ontology

Fonction des gènes sous forme d'API — propulsée par QuickGO d'EMBL-EBI et l'Ontologie des Gènes (GO), le vocabulaire standard qui décrit ce que font les produits des gènes selon trois aspects : fonction moléculaire, processus biologique et composant cellulaire. Étant donné un gène ou une protéine (un identifiant UniProt), lister chaque annotation GO qui lui est attribuée — le terme GO, son aspect, le qualificatif, le code de preuve, la référence justificative (par exemple un identifiant PubMed), l'organisme et qui l'a assignée — éventuellement filtré par aspect ou organisme. Consulter n'importe quel terme GO pour obtenir sa définition, son aspect, ses synonymes et le nombre de termes enfants ; et rechercher l'ontologie par nom pour trouver les termes GO appropriés. Les noms des termes GO sont résolus automatiquement sur les annotations. De TP53 à n'importe quelle protéine de n'importe quelle espèce, c'est l'épine dorsale de la génomique fonctionnelle — idéal pour l'analyse d'enrichissement, les pipelines d'annotation, la bioinformatique et les outils de recherche. Une ressource d'annotation de fonction des gènes (quels gènes ont quelles fonctions, avec preuves) — distincte de la consultation générique de termes d'ontologie. Données ouvertes provenant de QuickGO d'EMBL-EBI et du Consortium GO (CC BY 4.0).

api.oanor.com/quickgo-api

API du catalogue GWAS

Associations de traits génétiques humains sous forme d'API — propulsée par le catalogue GWAS NHGRI-EBI, la référence organisée des études d'association pangénomiques publiées. Elle répond à la question centrale de la génétique statistique : quels variants génétiques (SNP) sont associés à quels traits et maladies, et avec quelle force. Recherchez un SNP pour obtenir sa classe fonctionnelle, sa localisation génomique et les gènes cartographiés ; extrayez chaque association de trait rapportée pour celui-ci — le trait, la valeur p, la taille d'effet (odds ratio ou bêta), l'allèle à risque et sa fréquence, et les gènes rapportés par l'auteur ; et lisez l'étude derrière la preuve — trait, tailles d'échantillon, ascendances, technologie de génotypage et la publication (identifiant PubMed, auteurs, revue, date). Du diabète de type 2 et la maladie de Crohn au lupus érythémateux disséminé et à des centaines de milliers d'associations, elle est idéale pour la génomique, la bioinformatique, la génétique statistique et les outils de recherche biomédicale. Une base de preuves d'association génétique publiée — distincte des fréquences alléliques de population (gnomAD), de l'interprétation des variants cliniques (ClinVar) et de l'annotation du génome (Ensembl). Données ouvertes du catalogue GWAS NHGRI-EBI (EMBL-EBI).

api.oanor.com/gwas-api

API UCSC Genome

Le navigateur de génome UCSC en tant qu'API — données de génome de référence pour des centaines d'espèces, du célèbre navigateur de génome UCSC à l'Université de Californie à Santa Cruz. /v1/genomes répertorie les 220+ assemblages de génome hébergés par UCSC, chacun avec son identifiant d'assemblage (tel que hg38 pour l'humain, mm39 pour la souris, danRer11 pour le poisson zèbre), organisme, description et source de données. /v1/chromosomes?genome=hg38 retourne les chromosomes et séquences d'un assemblage avec leurs tailles en paires de bases, du plus grand au plus petit. /v1/sequence?genome=hg38&chrom=chrM&start=0&end=100 récupère la séquence brute d'ADN de toute région génomique (début basé sur 0, fin demi-ouverte ; les régions sont limitées à 100 000 bases par appel). Les identifiants d'assemblage proviennent de /v1/genomes et les noms de chromosomes ressemblent à chr1, chrX ou chrM. Idéal pour les pipelines bioinformatiques, les outils de visualisation de génome et de conception d'amorces, les recherches de régions et de séquences, la génomique comparative et l'enseignement. Données du navigateur de génome UCSC (gratuit pour usage académique, à but non lucratif et personnel). Il s'agit des assemblages et de la séquence de référence brute du navigateur de génome — distinct des bases de données d'annotation de gènes et de séquences protéiques telles qu'Ensembl, UniProt et ENA.

api.oanor.com/ucsc-api

API ENA

L'European Nucleotide Archive (ENA) en tant qu'API, propulsé par EMBL-EBI — l'un des trois partenaires INSDC aux côtés de NCBI GenBank et DDBJ, et l'archive publique complète des données de séquences nucléotidiques mondiales. ENA contient des lectures de séquençage brutes, des génomes assemblés et annotés, des séquences individuelles, des échantillons biologiques et les études qui les sous-tendent, pour chaque domaine du vivant — la ressource fondamentale pour la génomique, la microbiologie, l'écologie, l'évolution et la recherche clinique. Cette API offre un flux de travail propre en trois étapes sur cette archive. D'abord, /v1/taxon résout un nom d'organisme (par exemple "Homo sapiens") en son identifiant taxonomique NCBI, nom scientifique, rang taxonomique et lignée complète — ou recherche un taxon directement par son identifiant. Ensuite, /v1/search interroge l'archive pour les enregistrements de ce taxon d'un type choisi : assemblages de génomes (avec nom d'assemblage, niveau et nombre de bases), runs de séquençage (avec plateforme, instrument et nombres de lectures), échantillons biologiques (avec date de collecte et pays), séquences annotées, expériences de lecture, analyses, séquences codantes et non codantes, et études — par défaut incluant tous les taxons descendants, ou restreint au taxon exact. Enfin, /v1/record retourne un résumé pour tout accession ENA — assemblages (GCA_…), études et projets (PRJ…), échantillons (SAM…/ERS…), runs de séquençage (ERR…/SRR…) et séquences — avec son titre, type de données, taxon, nom scientifique, nombre de bases et de séquences, et statut public. Idéal pour les pipelines bioinformatiques, la découverte de données génomiques, la récolte de métadonnées de séquençage, les outils de biodiversité et de métagénomique, et la reproductibilité de la recherche. Les identifiants de taxon ressemblent à 9606 (humain) ; les accessions comme GCA_000001405. Données provenant d'EMBL-EBI ENA, une archive INSDC, libre d'utilisation.

api.oanor.com/ena-api

API Ensembl

La base de données du génome Ensembl sous forme d'API, propulsée par le service REST officiel d'Ensembl de l'EMBL-EBI. Recherchez n'importe quel gène par symbole ou identifiant stable Ensembl pour son biotype, sa localisation génomique, son brin, sa description et ses transcrits ; résolvez n'importe quelle caractéristique (gène, transcrit, exon) par identifiant stable ; récupérez les références croisées de bases de données externes ; extrayez les variants de séquence par rsID avec leurs allèles, la conséquence la plus grave, la fréquence de l'allèle mineur, la signification clinique et les correspondances génomiques ; listez les gènes, transcrits, exons, variations ou répétitions chevauchant n'importe quelle région génomique ; récupérez les séquences génomiques, ADNc, CDS ou protéiques par identifiant ; et lisez les métadonnées d'assemblage du génome, y compris le caryotype et les longueurs des chromosomes. Pour l'humain, la souris et plus de 300 espèces de vertébrés. Idéal pour les pipelines bioinformatiques, les navigateurs de génome et les outils d'annotation de variants, les applications de recherche en génétique, les tableaux de bord de génomique clinique et les chatbots en sciences de la vie.

api.oanor.com/ensembl-api