#bioinformatics

API de température de fusion de l'ADN

Calculs d'ADN-oligo et d'amorce PCR sous forme d'API, calculés localement et de manière déterministe. Le point de terminaison tm calcule la température de fusion d'une séquence d'amorce de trois manières : la règle de Wallace 2·(A+T) + 4·(G+C) pour les oligos courts jusqu'à 13 nt, la formule GC de Marmur–Wallace 64.9 + 41·(nGC − 16.4)/N pour les plus longs, et la formule ajustée au sel 81.5 + 0.41·%GC − 675/N + 16.6·log10[Na+] pour une concentration de sodium donnée, et recommande la méthode appropriée pour la longueur — un ATGCATGC de huit bases fond à 24 °C selon Wallace, une amorce de 20 bases à 50 % de GC à environ 51.8 °C selon Marmur. Le point de terminaison gc-content rapporte les pourcentages GC et AT, les comptes par base et le poids moléculaire simple brin. Le point de terminaison reverse-complement renvoie le complément, l'inverse et le complément inverse d'un brin. Les séquences utilisent A/C/G/T (insensible à la casse, les espaces ignorés) et [Na+] est en mol/L. Tout est calculé localement et de manière déterministe, donc instantané et privé. Idéal pour les développeurs d'applications en biologie moléculaire, biotechnologie, PCR, conception d'amorces, bioinformatique et automatisation de laboratoire, les calculateurs d'oligo et d'amorce, et les logiciels LIMS. Formules d'estimation pour la conception d'amorces, ne remplace pas la thermodynamique des plus proches voisins. Calcul local pur — pas de clé, pas de service tiers, instantané. En direct, rien n'est stocké. 3 points de terminaison. Ceci est la température de fusion des oligos ; pour les fréquences alléliques en génétique des populations, utilisez une API de génétique.

api.oanor.com/dnamelt-api

API de séquence ADN

Mathématiques d'analyse de séquences ADN/ARN sous forme d'API, calculées localement et de manière déterministe. Le point de terminaison analyze rapporte la longueur et la composition en bases d'une séquence, le contenu GC et AT, le complément, l'inverse et le complément inverse (le brin opposé lu 5'→3'), et le poids moléculaire approximatif simple brin. Le point de terminaison translate transcrit l'ADN en ARNm (T→U) et le traduit en protéine avec le code génétique standard dans le cadre de lecture 1, 2 ou 3, donnant la séquence d'acides aminés en une lettre, la longueur de la protéine et le nombre de codons stop. Le point de terminaison melting estime la température de fusion d'une amorce avec la règle de Wallace, 4·(G+C) + 2·(A+T), pour les oligos courts et une formule de base ajustée au sel pour les plus longs. Les séquences sont insensibles à la casse et aux espaces et acceptent A, C, G, T pour l'ADN ou U pour l'ARN. Tout est calculé localement et de manière déterministe, donc instantané et privé. Idéal pour la bioinformatique, la biologie moléculaire, la génomique et les développeurs d'applications de laboratoire, les outils de conception d'amorces et d'inspection de séquences, et l'enseignement de la biologie. Calcul local pur — pas de clé, pas de service tiers, instantané. En direct, rien n'est stocké. 3 points de terminaison. Ceci est une analyse de séquence ; pour les données d'assemblage de génome, utilisez une API génomes.

api.oanor.com/dna-api

API des assemblages de génomes

Assemblages de génomes de référence sous forme d'API — alimentée par NCBI Assembly, le registre des constructions de génomes pour les organismes de l'arbre de la vie. Recherchez des assemblages par organisme (ou texte libre) et consultez les métadonnées de tout assemblage : son accession (GCF_… RefSeq ou GCA_… GenBank), son nom (par exemple GRCh38.p14), l'organisme et l'identifiant taxonomique, le niveau d'assemblage (génome complet, chromosome, échafaudage ou contig), les statistiques de contiguïté (N50 des contigs et des échafaudages), la couverture de séquençage, la catégorie RefSeq, les noms UCSC et Ensembl, l'organisation soumettrice, la date de publication et les chemins de téléchargement FTP. Du génome de référence humain à tout microbe, plante ou animal séquencé, il transforme le registre des assemblages de génomes en une API propre de recherche et de récupération. Un registre d'assemblages de génomes — distinct des bases de données de séquences (ENA), d'annotation de génomes (Ensembl), de variants (ClinVar, dbVar) et d'expression génique (GEO). Données ouvertes de NCBI Assembly (domaine public).

api.oanor.com/genomes-api

API d'expression génique

Expériences de génomique fonctionnelle sous forme d'API — propulsée par NCBI GEO (Gene Expression Omnibus), le plus grand référentiel public de données d'expression génique. GEO archive des séries d'expression et des ensembles de données organisés provenant d'expériences de puces à ADN et de séquençage à haut débit pour chaque organisme. Recherchez des expériences par mot-clé et éventuellement par organisme, et consultez toute série ou ensemble de données pour obtenir ses métadonnées : titre, résumé, type de test (profilage d'expression par puce ou par séquençage), organisme, nombre d'échantillons, plateforme et publication associée. Des études sur le stress des cellules β à la transcriptomique du cancer chez l'humain et la souris, il transforme l'archive GEO en une API simple de recherche et de récupération pour la transcriptomique, la bioinformatique et la découverte de données de recherche. Un référentiel de données d'expression génique / génomique fonctionnelle — distinct des bases de données de séquences (ENA), de variants (ClinVar, dbVar), de structures (PDB) et d'ontologies. Données ouvertes de NCBI GEO (domaine public).

api.oanor.com/geodatasets-api

API des Variants Structuraux

Variation structurelle génomique humaine sous forme d'API — alimentée par NCBI dbVar, l'archive des variants structuraux (SV) : variants du nombre de copies (CNV), grandes délétions, duplications, insertions, inversions et translocations, généralement de plus de 50 paires de bases. Il s'agit de la contrepartie structurelle des bases de données de variants nucléotidiques uniques : recherchez les variants structuraux chevauchant un gène (ou par texte libre) et obtenez pour chaque variant son accession dbVar, l'étude dont il provient, son type, les gènes qu'il chevauche, son placement génomique sur GRCh38 et sa signification clinique ; puis consultez n'importe quel variant pour obtenir l'enregistrement complet — placements sur les assemblages GRCh37 et GRCh38, type de variant, gènes, signification clinique, type d'étude, méthodes et comptages de variants. Des CNV de BRCA1 aux délétions du Cri-du-chat, c'est idéal pour la génomique, la cytogénétique, les maladies rares et la bioinformatique. Une ressource de variation structurelle / CNV — distincte de l'interprétation clinique des variants nucléotidiques uniques (ClinVar), des fréquences alléliques de population (gnomAD) et des associations de traits (GWAS). Données ouvertes de NCBI dbVar (domaine public).

api.oanor.com/dbvar-api

API Interactions Protéiques

Réseaux d'interactions protéine-protéine sous forme d'API — propulsé par STRING, la base de données d'associations protéiques connues et prédites qui combine des preuves issues d'expériences de laboratoire, de bases de données de voies organisées, de co-expression génique, de contexte génomique et de fouille de texte automatisée en un seul score de confiance, à travers des milliers d'organismes. Obtenez les principaux partenaires d'interaction d'une protéine (chacun avec le score de confiance combiné et les sept sous-scores des canaux de preuve), le réseau d'interaction entre n'importe quel ensemble de protéines sous forme d'arêtes notées, et l'enrichissement fonctionnel pour un ensemble de gènes — les termes GO sur-représentés, les voies KEGG, les domaines Pfam et plus encore, chacun avec sa valeur p, son FDR et ses gènes membres. Passez des symboles de gènes (TP53) ou des identifiants STRING/Ensembl, pour l'humain (par défaut) ou toute espèce par identifiant taxonomique NCBI. C'est une pierre angulaire de la biologie des systèmes — idéal pour l'analyse de réseaux, la génomique fonctionnelle, les voies et les outils bioinformatiques. Une ressource de réseau d'interactions protéiques — distincte des voies biologiques (Reactome), des complexes protéiques organisés (Complex Portal) et des annotations Gene Ontology (QuickGO). Données ouvertes de STRING (CC BY 4.0).

api.oanor.com/stringdb-api

API de scores polygéniques

Scores polygéniques (de risque) sous forme d'API — propulsée par le NHGRI-EBI PGS Catalog, la base de données ouverte des scores polygéniques publiés : combinaisons pondérées de variants génétiques utilisées pour estimer la prédisposition génétique d'une personne à un trait ou une maladie. Recherchez des traits par nom pour trouver leurs identifiants d'ontologie, listez chaque score polygénique développé pour un trait, et lisez les métadonnées complètes d'un score — les traits rapportés et mappés (EFO/MONDO), le nombre de variants dans le score, la méthode de développement, la version du génome, la distribution d'ascendance des échantillons sur lesquels il a été construit et évalué, la publication associée (titre, revue, date, identifiant PubMed), la date de publication, la licence et un lien direct vers le fichier de scoring. Du cancer du sein et de la maladie coronarienne au diabète de type 2 et à l'IMC, il est idéal pour la génétique statistique, la génomique, la recherche en prédiction de risque et les outils bioinformatiques. Une ressource de scores polygéniques / prédiction de risque génétique — distincte des études d'association à variant unique (GWAS Catalog), des fréquences alléliques de population (gnomAD) et de l'interprétation clinique des variants (ClinVar). Données ouvertes du NHGRI-EBI PGS Catalog (CC BY 4.0).

api.oanor.com/pgs-api

API Gene Ontology

Fonction des gènes sous forme d'API — propulsée par QuickGO d'EMBL-EBI et l'Ontologie des Gènes (GO), le vocabulaire standard qui décrit ce que font les produits des gènes selon trois aspects : fonction moléculaire, processus biologique et composant cellulaire. Étant donné un gène ou une protéine (un identifiant UniProt), lister chaque annotation GO qui lui est attribuée — le terme GO, son aspect, le qualificatif, le code de preuve, la référence justificative (par exemple un identifiant PubMed), l'organisme et qui l'a assignée — éventuellement filtré par aspect ou organisme. Consulter n'importe quel terme GO pour obtenir sa définition, son aspect, ses synonymes et le nombre de termes enfants ; et rechercher l'ontologie par nom pour trouver les termes GO appropriés. Les noms des termes GO sont résolus automatiquement sur les annotations. De TP53 à n'importe quelle protéine de n'importe quelle espèce, c'est l'épine dorsale de la génomique fonctionnelle — idéal pour l'analyse d'enrichissement, les pipelines d'annotation, la bioinformatique et les outils de recherche. Une ressource d'annotation de fonction des gènes (quels gènes ont quelles fonctions, avec preuves) — distincte de la consultation générique de termes d'ontologie. Données ouvertes provenant de QuickGO d'EMBL-EBI et du Consortium GO (CC BY 4.0).

api.oanor.com/quickgo-api

API du catalogue GWAS

Associations de traits génétiques humains sous forme d'API — propulsée par le catalogue GWAS NHGRI-EBI, la référence organisée des études d'association pangénomiques publiées. Elle répond à la question centrale de la génétique statistique : quels variants génétiques (SNP) sont associés à quels traits et maladies, et avec quelle force. Recherchez un SNP pour obtenir sa classe fonctionnelle, sa localisation génomique et les gènes cartographiés ; extrayez chaque association de trait rapportée pour celui-ci — le trait, la valeur p, la taille d'effet (odds ratio ou bêta), l'allèle à risque et sa fréquence, et les gènes rapportés par l'auteur ; et lisez l'étude derrière la preuve — trait, tailles d'échantillon, ascendances, technologie de génotypage et la publication (identifiant PubMed, auteurs, revue, date). Du diabète de type 2 et la maladie de Crohn au lupus érythémateux disséminé et à des centaines de milliers d'associations, elle est idéale pour la génomique, la bioinformatique, la génétique statistique et les outils de recherche biomédicale. Une base de preuves d'association génétique publiée — distincte des fréquences alléliques de population (gnomAD), de l'interprétation des variants cliniques (ClinVar) et de l'annotation du génome (Ensembl). Données ouvertes du catalogue GWAS NHGRI-EBI (EMBL-EBI).

api.oanor.com/gwas-api

API BioSamples

BioSamples en tant qu'API, propulsé par EMBL-EBI — la base de données qui stocke et lie les métadonnées des échantillons biologiques, les spécimens physiques derrière les expériences biologiques. Un échantillon dans BioSamples porte un accession stable (tel que SAMEA3231268) et un riche ensemble de caractéristiques — organisme, tissu ou partie d'organisme, type cellulaire, sexe, maladie, stade de développement, souche et tout attribut fourni par le soumissionnaire — et est référencé par d'autres archives de l'EBI, notamment l'European Nucleotide Archive (ENA), ArrayExpress et PRIDE. /v1/search?q=liver recherche des échantillons par texte libre et renvoie l'accession, le nom, l'organisme et la date de publication de chaque correspondance. /v1/sample?id=SAMEA3231268 renvoie les métadonnées d'un échantillon — son accession, son nom, son identifiant taxonomique NCBI, son organisme, ses dates de publication et de mise à jour, le nombre de relations avec d'autres échantillons, et ses caractéristiques aplaties en une carte clé→valeur propre. Les accessions ressemblent à SAMEA…, SAMN… ou SAMD… ; obtenez-en un à partir du point de terminaison de recherche. Idéal pour l'intégration de données en sciences de la vie, le suivi des échantillons, l'harmonisation des métadonnées et la liaison des données de séquençage ou d'expression à leur spécimen source. Données provenant d'EMBL-EBI BioSamples (publiques). Il s'agit d'un registre de métadonnées d'échantillons biologiques — distinct des bases de données d'études (BioStudies), de séquences (ENA), de variants (ClinVar) et de structures.

api.oanor.com/biosamples-api

API BioStudies

BioStudies en tant qu'API, propulsé par EMBL-EBI — la base de données qui contient les descriptions d'études biologiques et relie leurs données à travers les ressources de l'EBI, y compris l'imagerie (BioImage Archive), la génomique fonctionnelle (ArrayExpress), la protéomique et la littérature (Europe PMC). Chaque étude possède un identifiant, un titre et un résumé, la collection à laquelle elle appartient et des liens vers ses données sous-jacentes et ses publications. /v1/search?query=covid recherche les études et renvoie l'identifiant de chaque correspondance (par exemple S-EPMC8017430), le titre, l'auteur, le type d'étude, la date de publication et les comptes de liens/fichiers. /v1/study?id=S-EPMC8017430 renvoie les métadonnées d'une étude — son identifiant, la collection à laquelle elle appartient (telle que EuropePMC, ArrayExpress ou BioImages), le titre, le résumé, la date de publication, les auteurs et le nombre de ressources liées. Les identifiants ressemblent à S-EPMC8017430 ou S-BSST123 ; obtenez-en un à partir du point de terminaison de recherche. Idéal pour la découverte de données de recherche, la liaison de la littérature à ses ensembles de données sous-jacents, les revues systématiques et les outils de reproductibilité. Données provenant d'EMBL-EBI BioStudies (publiques). Il s'agit d'un index de métadonnées d'études et d'ensembles de données — distinct des bases de données de séquences (UniProt, ENA), de structures (PDB, EMDB), de variants (ClinVar) et d'ontologies.

api.oanor.com/biostudies-api

API EMDB

La Banque de données de microscopie électronique (EMDB) en tant qu'API, propulsée par EMBL-EBI — l'archive publique de cartes de densité tridimensionnelles de microscopie électronique de protéines, acides nucléiques et grands complexes macromoléculaires. EMDB est l'équivalent en microscopie électronique de la Protein Data Bank, contenant des cartes résolues par cryo-ME à particule unique, tomographie électronique et cristallographie électronique, la technique derrière la récente « révolution de la résolution » en biologie structurale. /v1/search?q=ribosome recherche dans l'archive et renvoie pour chaque entrée correspondante son identifiant EMDB (par exemple EMD-1010), son titre, la méthode de microscopie électronique et la résolution en ångströms. /v1/entry?id=EMD-1010 renvoie les métadonnées d'une entrée — son titre, la méthode ME (particule unique, tomographie, …), l'état d'agrégation, la résolution, l'échantillon biologique étudié, les mots-clés de classification, les dates de dépôt, de publication de la carte et de dernière mise à jour, ainsi que les auteurs du dépôt. Les identifiants EMDB ressemblent à EMD-1010, et vous pouvez passer uniquement le numéro. Idéal pour les outils de biologie structurale et de cryo-ME, les applications de comparaison de structures et de visualisation, et l'éducation. Données provenant d'EMBL-EBI EMDB (domaine public). Il s'agit de l'archive des cartes expérimentales de microscopie électronique — distincte des structures de coordonnées atomiques (PDB), des structures prédites (AlphaFold) et des bases de données de séquences protéiques (UniProt).

api.oanor.com/emdb-api

API BioModels

BioModels en tant qu'API, propulsé par EMBL-EBI — le plus grand référentiel mondial de modèles mathématiques curatés et publiés de systèmes biologiques. BioModels collecte des modèles computationnels (principalement en SBML, le langage de balisage de biologie des systèmes) du métabolisme, de la signalisation cellulaire, des réseaux de régulation génique, du cycle cellulaire, des processus pathologiques et de la physiologie, chacun lié à la publication évaluée par les pairs dont il est issu. /v1/search?query=glycolysis recherche dans le référentiel et renvoie l'identifiant de chaque modèle correspondant (tel que BIOMD0000000012), son nom, son format, son soumetteur et ses dates de soumission/modification. /v1/model?id=BIOMD0000000012 renvoie les métadonnées d'un modèle — son nom et sa description, le format d'encodage, l'approche de modélisation (par exemple, modèle d'équation différentielle ordinaire), le statut de curation, la publication sous-jacente (titre, revue, année, auteurs) et les fichiers du modèle. Les identifiants de modèle ressemblent à BIOMD0000000012 pour les modèles curatés ou MODEL1234567890 pour les soumissions non curatées ; obtenez-les à partir du point de terminaison de recherche. Idéal pour les outils de biologie des systèmes et de modélisation computationnelle, les flux de travail de recherche reproductible et de réutilisation de modèles, et l'enseignement. Données provenant d'EMBL-EBI BioModels (CC0). Il s'agit d'un référentiel de modèles computationnels / biologie des systèmes — distinct des bases de données de séquences (UniProt, ENA), de structures (PDB, AlphaFold), de voies et de variants (ClinVar).

api.oanor.com/biomodels-api

API UCSC Genome

Le navigateur de génome UCSC en tant qu'API — données de génome de référence pour des centaines d'espèces, du célèbre navigateur de génome UCSC à l'Université de Californie à Santa Cruz. /v1/genomes répertorie les 220+ assemblages de génome hébergés par UCSC, chacun avec son identifiant d'assemblage (tel que hg38 pour l'humain, mm39 pour la souris, danRer11 pour le poisson zèbre), organisme, description et source de données. /v1/chromosomes?genome=hg38 retourne les chromosomes et séquences d'un assemblage avec leurs tailles en paires de bases, du plus grand au plus petit. /v1/sequence?genome=hg38&chrom=chrM&start=0&end=100 récupère la séquence brute d'ADN de toute région génomique (début basé sur 0, fin demi-ouverte ; les régions sont limitées à 100 000 bases par appel). Les identifiants d'assemblage proviennent de /v1/genomes et les noms de chromosomes ressemblent à chr1, chrX ou chrM. Idéal pour les pipelines bioinformatiques, les outils de visualisation de génome et de conception d'amorces, les recherches de régions et de séquences, la génomique comparative et l'enseignement. Données du navigateur de génome UCSC (gratuit pour usage académique, à but non lucratif et personnel). Il s'agit des assemblages et de la séquence de référence brute du navigateur de génome — distinct des bases de données d'annotation de gènes et de séquences protéiques telles qu'Ensembl, UniProt et ENA.

api.oanor.com/ucsc-api

API ClinVar

ClinVar en tant qu'API, alimentée par la Bibliothèque nationale de médecine des États-Unis via les E-utilities du NCBI. ClinVar est l'archive publique des relations entre les variants génétiques humains et la santé, enregistrant la signification clinique (interprétation) de chaque variant — qu'il soit pathogène, probablement pathogène, de signification incertaine, probablement bénin ou bénin — ainsi que les conditions auxquelles il est associé. /v1/search?gene=BRCA1 recherche dans ClinVar par symbole de gène, ou par texte libre avec q= (par exemple une maladie ou une expression HGVS), renvoyant le nombre total de variants correspondants et une liste d'identifiants de variants ClinVar. /v1/variant?id=4852102 renvoie un résumé d'un variant : son accession ClinVar (VCV…), son titre, son type de variant, les noms du variant et de l'ADNc, la classification clinique et le statut de révision, la ou les conditions associées, le ou les gènes et le gène principal, le chromosome et l'emplacement, le changement protéique et la conséquence moléculaire, ainsi qu'un lien vers l'enregistrement ClinVar. Obtenez un identifiant de variant depuis /v1/search, puis récupérez ses détails. Idéal pour les pipelines de génomique clinique et d'annotation de variants, les outils de maladies rares et de conseil génétique, et les tableaux de bord de recherche. Données provenant de NCBI ClinVar (domaine public). Il s'agit d'une interprétation de variants cliniques — distincte des bases de données de fréquence allélique de population (telles que gnomAD) et des bases de données de protéines/séquences. Veuillez maintenir des taux de requêtes modestes conformément à l'utilisation équitable du NCBI.

api.oanor.com/clinvar-api

API ENA

L'European Nucleotide Archive (ENA) en tant qu'API, propulsé par EMBL-EBI — l'un des trois partenaires INSDC aux côtés de NCBI GenBank et DDBJ, et l'archive publique complète des données de séquences nucléotidiques mondiales. ENA contient des lectures de séquençage brutes, des génomes assemblés et annotés, des séquences individuelles, des échantillons biologiques et les études qui les sous-tendent, pour chaque domaine du vivant — la ressource fondamentale pour la génomique, la microbiologie, l'écologie, l'évolution et la recherche clinique. Cette API offre un flux de travail propre en trois étapes sur cette archive. D'abord, /v1/taxon résout un nom d'organisme (par exemple "Homo sapiens") en son identifiant taxonomique NCBI, nom scientifique, rang taxonomique et lignée complète — ou recherche un taxon directement par son identifiant. Ensuite, /v1/search interroge l'archive pour les enregistrements de ce taxon d'un type choisi : assemblages de génomes (avec nom d'assemblage, niveau et nombre de bases), runs de séquençage (avec plateforme, instrument et nombres de lectures), échantillons biologiques (avec date de collecte et pays), séquences annotées, expériences de lecture, analyses, séquences codantes et non codantes, et études — par défaut incluant tous les taxons descendants, ou restreint au taxon exact. Enfin, /v1/record retourne un résumé pour tout accession ENA — assemblages (GCA_…), études et projets (PRJ…), échantillons (SAM…/ERS…), runs de séquençage (ERR…/SRR…) et séquences — avec son titre, type de données, taxon, nom scientifique, nombre de bases et de séquences, et statut public. Idéal pour les pipelines bioinformatiques, la découverte de données génomiques, la récolte de métadonnées de séquençage, les outils de biodiversité et de métagénomique, et la reproductibilité de la recherche. Les identifiants de taxon ressemblent à 9606 (humain) ; les accessions comme GCA_000001405. Données provenant d'EMBL-EBI ENA, une archive INSDC, libre d'utilisation.

api.oanor.com/ena-api

API MGnify

MGnify en tant qu'API, propulsé par EMBL-EBI — la plus grande ressource gratuite au monde pour l'analyse et l'archivage des données de séquençage du microbiome, et la sœur métagénomique de PRIDE (protéomique) et MetaboLights (métabolomique). MGnify contient des dizaines de milliers d'études publiques de métagénomique et de métabarcodage couvrant le microbiome intestinal humain, les environnements marins et d'eau douce, les sols, les eaux usées, l'environnement bâti et les communautés associées à l'hôte. Recherchez les études par mot-clé, obtenant pour chaque étude son accession MGnify (MGYS...), son nom, son résumé, son biome, le nombre d'échantillons et le BioProject de séquençage source ; lisez les métadonnées complètes d'une étude, y compris son nom et son résumé, la classification du biome, le nombre d'échantillons, le centre de soumission, le statut public, l'origine des données et la date de dernière mise à jour ; et parcourez l'arbre de classification des biomes de style GOLD — de racine:Associé à l'hôte:Humain:Système digestif à racine:Environnemental:Aquatique:Marin — avec des comptes d'échantillons et d'études par biome, pour la découverte par environnement. Idéal pour la recherche sur le microbiome et la génomique environnementale, la réutilisation des ensembles de données et la méta-analyse, les pipelines bioinformatiques et l'enseignement. Les accessions d'étude ressemblent à MGYS00006862. Données provenant d'EMBL-EBI MGnify.

api.oanor.com/mgnify-api

API Cellosaurus

Cellosaurus en tant qu'API, propulsé par l'Institut Suisse de Bioinformatique SIB — l'encyclopédie de référence des lignées cellulaires utilisées dans la recherche biomédicale. Avec plus de 150 000 entrées couvrant les lignées de cellules cancéreuses, les hybridomes, les cellules souches pluripotentes induites et les lignées de centaines d'espèces, Cellosaurus est le catalogue faisant autorité que les chercheurs utilisent pour identifier et valider les lignées cellulaires derrière les expériences publiées. Recherchez les lignées cellulaires par nom ou mot-clé, obtenant pour chaque lignée son accession Cellosaurus (CVCL_…), son nom, sa catégorie, son espèce et sa maladie ; et lisez l'enregistrement complet d'une lignée cellulaire — son nom et ses synonymes, sa catégorie (par exemple, lignée de cellules cancéreuses, hybridome, cellule souche), son espèce avec l'identifiant taxonomique NCBI, le sexe, l'âge, la maladie dont elle dérive avec les identifiants d'ontologie NCIt, le tissu ou site anatomique d'origine, sa lignée parentale et le nombre de lignées filles dérivées, le nombre de références bibliographiques et les nombreuses références croisées (vers ATCC, DSMZ, ECACC, Wikidata et plus), les pages web pertinentes, et — de manière critique pour la reproductibilité de la recherche — si la lignée est signalée comme PROBLÉMATIQUE, ce qui signifie qu'elle a été mal identifiée ou contaminée de manière croisée, avec les notes explicatives. Idéal pour le contrôle qualité en laboratoire et l'authentification des lignées cellulaires, la recherche biomédicale et sur le cancer, la curation des données et les vérifications de reproductibilité. Les accessions ressemblent à CVCL_0030 (HeLa). Données de Cellosaurus (CC-BY 4.0).

api.oanor.com/cellosaurus-api

API AlphaFold

La base de données de structures protéiques AlphaFold sous forme d'API, propulsée par EMBL-EBI et Google DeepMind. AlphaFold prédit la structure tridimensionnelle d'une protéine à partir de sa séquence d'acides aminés avec une précision de niveau expérimental, et la base de données couvre désormais plus de 200 millions de protéines — presque toutes les séquences d'UniProt. Recherchez le modèle AlphaFold pour n'importe quelle protéine par son accession UniProt et obtenez sa description de gène et de protéine, son organisme et sa longueur de séquence, la version du modèle et sa date de création, la métrique de confiance globale, la séquence complète d'acides aminés, et des liens de téléchargement directs vers la structure prédite au format mmCIF, PDB et BinaryCIF ainsi que l'image et les données du tracé de l'erreur alignée prédite (PAE) ; et lisez la couverture structurale d'une protéine — le(s) modèle(s) prédit(s) par AlphaFold et toute structure liée avec leur fournisseur, catégorie de modèle, méthode et la plage de résidus UniProt couverte. Idéal pour la biologie structurale, la découverte de médicaments et l'évaluation de cibles, l'ingénierie des protéines, la visualisation moléculaire et l'enseignement. Les protéines sont identifiées par l'accession UniProt (par exemple P00520 ou P38398). Données provenant de la base de données AlphaFold (CC-BY 4.0). Pour les structures 3D déterminées expérimentalement, voir l'API PDB, pour les séquences protéiques et l'annotation fonctionnelle, l'API UniProt, et pour les familles et domaines, InterPro.

api.oanor.com/alphafold-api

API du Complex Portal

Le Complex Portal en tant qu'API, propulsé par EMBL-EBI — une base de données encyclopédique et organisée manuellement de complexes macromoléculaires stables : assemblages de deux protéines ou plus (et parfois d'acides nucléiques, de ligands ou de petites molécules) qui fonctionnent ensemble comme une unité fonctionnelle unique, tels que les ribosomes, les protéasomes, les ARN et ADN polymérases, le spliceosome, les complexes de la chaîne respiratoire et des milliers d'autres à travers de nombreuses espèces. Recherchez les complexes par mot-clé et éventuellement par organisme, obtenant pour chaque complexe son accession Complex Portal (CPX-…), son nom, son organisme, sa description et s'il est prédit par calcul ; lisez l'enregistrement complet d'un complexe, y compris ses noms recommandés et systématiques, synonymes, espèces, fonction biologique, les sous-unités participantes avec chacune son identifiant de molécule (par exemple une accession UniProt) et sa stœchiométrie, les ligands et maladies associés, le type de preuve et les références croisées vers UniProt, Gene Ontology, Reactome, Wikidata et plus encore ; et extrayez simplement la composition en sous-unités d'un complexe. Idéal pour la biologie structurale et des systèmes, l'analyse des voies et des réseaux, la recherche sur la fonction des protéines et les pipelines bioinformatiques. Les accessions de complexes ressemblent à CPX-6036. Données du Complex Portal d'EMBL-EBI (consortium IMEx, CC-BY). Pour les réseaux d'interactions protéine-protéine, voir l'API STRING, pour les séquences protéiques UniProt, pour les voies biologiques Reactome et pour les familles et domaines InterPro.

api.oanor.com/complexes-api

API Rfam

La base de données Rfam des familles d'ARN non codants sous forme d'API, propulsée par EMBL-EBI. Rfam regroupe les ARN fonctionnels partageant une origine évolutive commune en familles, chacune modélisée par un modèle de covariance construit à partir d'un alignement de référence et d'une structure secondaire. Recherchez les familles par nom, description ou type d'ARN — riboswitches et autres éléments cis-régulateurs, ribozymes, familles de microARN, ARN ribosomiques, ARN de transfert, petits ARN nucléaires et petits ARN nucléolaires, longs ARN non codants et répétitions CRISPR — en obtenant l'accession Rfam, le nom, la description, le type d'ARN et les conservateurs de chaque famille ; lisez l'enregistrement complet d'une famille, y compris sa description, sa classification par type d'ARN, les conservateurs qui l'ont construite, le nombre de séquences dans ses alignements complets et de référence, la source de la structure, le commentaire du conservateur, le clan (groupe de familles apparentées) auquel elle appartient et la version de Rfam ; et parcourez les familles par classe d'ARN. Idéal pour la biologie de l'ARN, les pipelines bioinformatiques, l'annotation des ARN non codants, la génomique comparative et l'enseignement. Les accessions de famille ressemblent à RF00005 (ARN de transfert). Données provenant d'EMBL-EBI Rfam. Pour les familles et domaines de protéines, voir l'API InterPro, pour les séquences protéiques UniProt, pour les ensembles de données protéomiques PRIDE et pour la métabolomique MetaboLights.

api.oanor.com/rfam-api

API MetaboLights

MetaboLights en tant qu'API, propulsé par EMBL-EBI — le premier référentiel ouvert au monde pour les expériences de métabolomique (spectroscopie RMN et spectrométrie de masse) et une ressource sœur de PRIDE pour la protéomique. Recherchez les études de métabolomique publiques par mot-clé (retournant l'accession, le titre, la description et l'organisme de chaque étude) ; lisez les métadonnées complètes d'une étude, y compris son résumé, son statut, ses dates de soumission et de publication, les descripteurs de conception d'étude, les facteurs expérimentaux, les analyses analytiques avec leur type de mesure, technologie et plateforme, les contributeurs et leurs rôles, les publications liées avec DOI et identifiants PubMed, les soumetteurs, le nombre d'échantillons, l'URL de téléchargement FTP et la licence des données ; inspectez le flux de travail analytique — chaque protocole avec son nom, son type, sa description et ses paramètres (collecte d'échantillons, extraction, chromatographie, spectroscopie RMN/MS, transformation des données et identification des métabolites) ; et listez les organismes et parties d'organismes étudiés avec leurs termes d'ontologie. Idéal pour la recherche en métabolomique et en biologie des systèmes, la réutilisation des ensembles de données et la méta-analyse, les pipelines bioinformatiques et les outils qui intègrent des preuves expérimentales. Les accessions d'étude ressemblent à MTBLS1. Données provenant d'EMBL-EBI MetaboLights.

api.oanor.com/metabolights-api

API PRIDE

L'archive protéomique PRIDE sous forme d'API, propulsée par l'archive PRIDE de l'EMBL-EBI — le plus grand dépôt public mondial de données de protéomique par spectrométrie de masse et membre fondateur de ProteomeXchange. Recherchez les expériences protéomiques publiques par mot-clé (renvoyant l'accession, le titre, les organismes, les maladies et les instruments de chaque projet) ; lisez les métadonnées complètes d'un projet, y compris sa description, ses mots-clés, ses organismes et parties d'organismes, ses instruments de spectrométrie de masse, ses logiciels, les modifications protéiques identifiées, les protocoles de traitement des échantillons et des données, les soumetteurs, les affiliations et la publication liée (DOI et PubMed) ; listez les fichiers de données d'un projet avec leur catégorie, format, taille et un lien de téléchargement direct ; et explorez les facettes — les maladies, organismes, instruments, types d'expériences, logiciels et pays représentés parmi les projets correspondants — pour la découverte. Idéal pour la recherche en protéomique et en biologie des systèmes, la réutilisation d'ensembles de données et la méta-analyse, les pipelines bioinformatiques et les outils intégrant des preuves expérimentales. Les accessions de projet ressemblent à PXD000001. Données de l'EMBL-EBI.

api.oanor.com/pride-api

API InterPro

Familles de protéines, domaines et sites fonctionnels sous forme d'API, propulsée par la base de données InterPro de l'EBI. InterPro classe les protéines en familles et identifie les domaines, répétitions et sites importants qu'elles contiennent, en combinant les signatures prédictives de nombreuses bases de données membres (Pfam, SMART, PROSITE, CDD, PANTHER, SUPERFAMILY, NCBIfam et plus) en une ressource intégrée unique. Recherchez une entrée InterPro — une famille, un domaine, une répétition, un site conservé/de liaison/actif ou une modification post-traductionnelle — avec sa description, ses termes Gene Ontology et les signatures des bases de données membres qui la définissent ; recherchez des entrées par nom et type ; lisez les métadonnées d'une protéine ; et, surtout, listez les entrées InterPro trouvées sur une protéine avec leurs positions de début et de fin, afin de visualiser l'architecture des domaines d'une protéine. Idéal pour l'annotation des protéines et la prédiction de fonctions, la génomique comparative, les pipelines de biologie structurale et de bioinformatique, ainsi que les outils de recherche et d'enseignement. Les identifiants d'entrée sont IPR suivis de six chiffres ; les identifiants de protéines sont des accessions UniProt. Données provenant d'EMBL-EBI.

api.oanor.com/interpro-api

API Open Targets

Associations cible médicamenteuse–maladie sous forme d'API, propulsées par la plateforme Open Targets. Open Targets intègre la génétique humaine, la génomique, la transcriptomique, les médicaments connus, les modèles animaux et la littérature scientifique pour évaluer systématiquement la force de l'association entre une cible (gène/protéine) et une maladie — les preuves qui sous-tendent la découverte moderne de médicaments. Recherchez parmi les cibles, les maladies et les médicaments ; consultez une cible pour son symbole approuvé, son biotype, sa fonction, sa localisation génomique et ses identifiants UniProt ainsi que les maladies auxquelles elle est le plus fortement associée et leurs scores d'association globaux ; consultez une maladie pour sa description, ses domaines thérapeutiques et ses principales cibles associées avec scores ; et consultez un médicament pour sa modalité, son stade clinique maximal, ses noms commerciaux, ses synonymes et ses mécanismes d'action. Idéal pour les pipelines de découverte de médicaments et d'identification de cibles, la recherche par domaine thérapeutique, la science des données biomédicales et les outils de veille pharmaceutique. Les identifiants de cibles sont les identifiants de gènes Ensembl, les identifiants de maladies sont les identifiants EFO/MONDO/Orphanet, les identifiants de médicaments sont les identifiants ChEMBL. Les données sont ouvertes (CC0).

api.oanor.com/opentargets-api

API KEGG

La base de données moléculaires KEGG sous forme d'API, propulsée par le service REST officiel de KEGG. KEGG (l'Encyclopédie de Kyoto des Gènes et des Génomes) relie les génomes, la chimie et les maladies. Récupérez n'importe quelle entrée KEGG analysée en JSON — un composé métabolique, un groupe d'orthologie KEGG (KO), une enzyme (numéro EC), une réaction, un module, un médicament, une maladie, un glycan, un gène ou une carte de voie métabolique ; recherchez n'importe quelle base de données KEGG par nom ; listez les entrées d'une base de données ; créez des liens croisés entre les entrées des bases de données (un gène vers ses voies métaboliques, une voie métabolique vers ses composés, une enzyme vers ses réactions) ; et convertissez les identifiants KEGG vers et depuis des espaces de noms externes (NCBI Gene/Protein, UniProt, ChEBI, PubChem). Idéal pour les pipelines de biologie des systèmes et de métabolomique, le mappage d'enzymes et d'orthologie, la recherche sur les médicaments et les maladies, l'annotation gène-voie métabolique et la conversion d'identifiants bioinformatiques. Les identifiants KEGG sont préfixés par une lettre (C composé, K orthologie, D médicament, H maladie, M module, R réaction, G glycan) ou codés par organisme (hsa humain, eco E. coli).

api.oanor.com/kegg-api

API gnomAD

Génétique des populations en tant qu'API, propulsée par le gnomAD (Genome Aggregation Database) du Broad Institute — fréquences alléliques et contrainte génique agrégées à partir de plus de 800 000 exomes et génomes humains. Recherchez les scores de contrainte d'un gène (pLI, LOEUF, observé vs attendu perte de fonction, missense Z) et sa localisation génomique ; obtenez les fréquences alléliques d'un variant ventilées par population d'ascendance (Africaine/Afro-Américaine, Américaine mixte, Juive ashkénaze, Asiatique de l'Est, Finlandaise, Européenne non finlandaise, Asiatique du Sud, Moyen-Orientale…) à travers les ensembles d'appels génomiques et exomiques, avec rsID, comptes d'homozygotes et conséquence prédite ; recherchez des gènes par symbole ; lisez la contrainte d'un transcrit ; et listez les variants dans une petite région génomique. Prend en charge GRCh38 et GRCh37 ainsi que les ensembles de données gnomAD v4/v3/v2. Idéal pour la génétique clinique et des populations, l'interprétation et la priorisation des variants, la recherche sur les maladies rares et la pharmacogénomique, et les pipelines bioinformatiques. Les identifiants de variants sont chrom-pos-ref-alt.

api.oanor.com/gnomad-api

API STRING

La base de données d'interactions protéine-protéine STRING sous forme d'API — le réseau curé et prédit d'associations fonctionnelles entre protéines, propulsé par l'API STRING officielle. Résolvez les noms de gènes ou de protéines en identifiants STRING avec annotations ; obtenez les principaux partenaires d'interaction d'une protéine avec un score de confiance combiné et des preuves par canal (expérimental, bases de données curées, co-expression, text-mining, fusion de gènes, voisinage et co-occurrence) ; construisez le réseau d'interactions entre un ensemble de protéines sous forme d'arêtes pondérées ; exécutez l'enrichissement fonctionnel d'un ensemble de gènes sur Gene Ontology, KEGG, Reactome, Pfam, InterPro et plus avec des valeurs p et des taux de fausses découvertes ; et évaluez l'homologie entre protéines. Couvre plus de 12 000 organismes (humain par défaut, taxon NCBI 9606). Idéal pour les pipelines de biologie des systèmes et de biologie des réseaux, l'analyse de jeux de gènes et de voies, la recherche de cibles médicamenteuses et de gènes de maladies, et les tableaux de bord bioinformatiques.

api.oanor.com/string-api

API Reactome

La base de connaissances des voies de signalisation Reactome sous forme d'API — la base de données ouverte et évaluée par les pairs des voies biologiques et des réactions, propulsée par le service officiel Reactome ContentService. Recherchez dans l'archive organisée des voies, réactions et molécules ; lisez toute entité par son identifiant stable Reactome (une voie, une réaction, un complexe ou une protéine : nom, type, espèce, compartiments, résumé et indicateur de maladie) ; listez les événements (sous-voies et réactions) contenus dans une voie ; listez les molécules participant à une voie ou réaction avec leurs identifiants de référence ; obtenez les voies de premier niveau pour tout organisme modèle ; mappez une protéine UniProt aux voies auxquelles elle participe ; et listez les espèces prises en charge. Couvre l'humain et plus de 15 organismes modèles dans le métabolisme, la transduction du signal, le cycle cellulaire, le système immunitaire, les maladies et plus encore. Idéal pour les pipelines de biologie des systèmes et de bioinformatique, les outils d'enrichissement de voies et de cibles médicamenteuses, les applications de recherche biomédicale, les ressources pédagogiques et les chatbots en sciences de la vie.

api.oanor.com/reactome-api

API PDB

La RCSB Protein Data Bank en tant qu'API — structures macromoléculaires 3D de protéines, acides nucléiques et complexes, alimentées par les données et services de recherche officiels de la RCSB PDB. Récupérez une entrée de structure par son identifiant PDB à 4 caractères pour son titre, sa méthode expérimentale (rayons X, cryo-ME, RMN), sa résolution, ses mots-clés, ses dates de dépôt et de publication, ses auteurs, sa citation principale et les comptes d'entités et d'assemblages ; effectuez une recherche en texte intégral dans l'ensemble des archives, renvoyant les identifiants PDB correspondants et le nombre total de résultats ; lisez une entité polymère pour son nom de protéine ou d'acide nucléique, sa séquence en une lettre, sa longueur, son organisme source, ses chaînes et les identifiants UniProt liés ; lisez un assemblage biologique pour son état oligomérique, sa symétrie et les comptes de chaînes et d'atomes ; listez les ligands liés dans une structure avec leurs identifiants de composants et leurs noms ; et recherchez tout composant chimique (ligand) par code pour sa formule, son poids, son SMILES et son InChIKey. Idéal pour les outils de biologie structurale et de découverte de médicaments, les visualiseurs moléculaires, les pipelines bioinformatiques, les applications éducatives et les tableaux de bord de recherche.

api.oanor.com/pdb-api

API Ensembl

La base de données du génome Ensembl sous forme d'API, propulsée par le service REST officiel d'Ensembl de l'EMBL-EBI. Recherchez n'importe quel gène par symbole ou identifiant stable Ensembl pour son biotype, sa localisation génomique, son brin, sa description et ses transcrits ; résolvez n'importe quelle caractéristique (gène, transcrit, exon) par identifiant stable ; récupérez les références croisées de bases de données externes ; extrayez les variants de séquence par rsID avec leurs allèles, la conséquence la plus grave, la fréquence de l'allèle mineur, la signification clinique et les correspondances génomiques ; listez les gènes, transcrits, exons, variations ou répétitions chevauchant n'importe quelle région génomique ; récupérez les séquences génomiques, ADNc, CDS ou protéiques par identifiant ; et lisez les métadonnées d'assemblage du génome, y compris le caryotype et les longueurs des chromosomes. Pour l'humain, la souris et plus de 300 espèces de vertébrés. Idéal pour les pipelines bioinformatiques, les navigateurs de génome et les outils d'annotation de variants, les applications de recherche en génétique, les tableaux de bord de génomique clinique et les chatbots en sciences de la vie.

api.oanor.com/ensembl-api

API UniProt

La base de connaissances protéiques UniProt sous forme d'API, propulsée par le service REST officiel d'UniProt, organisé par EMBL-EBI, SIB et PIR. Recherchez n'importe quelle protéine par son accession UniProt pour obtenir les noms de protéines et de gènes, l'organisme, la longueur, la masse, la fonction, les mots-clés, les termes Gene Ontology (GO) et les structures 3D PDB liées ; effectuez des recherches en texte intégral de protéines filtrées par organisme (identifiant taxonomique NCBI) et par statut de révision Swiss-Prot ; récupérez les séquences d'acides aminés avec FASTA, le poids moléculaire et la somme de contrôle CRC64 ; listez les caractéristiques de séquence telles que les peptides signaux, les chaînes, les domaines, les sites actifs et de liaison, les résidus modifiés et les variants naturels, avec une répartition par type ; résolvez les nœuds de taxonomie NCBI avec leur lignée complète ; et extrayez les protéomes de référence avec les comptes de protéines et les identifiants d'assemblage du génome. Dans tous les règnes du vivant, de l'humain aux bactéries. Idéal pour les pipelines bioinformatiques, les outils de découverte de médicaments et de protéomique, les tableaux de bord d'analyse de séquences, les applications de recherche académique et les chatbots en sciences de la vie.

api.oanor.com/uniprot-api