API HTML
Une boîte à outils HTML rapide et entièrement locale : extrayez des données structurées du HTML fourni (titre, méta-description, lien canonique, langue, balises Open Graph et Twitter Card, liens, images, titres et comptes de mots), convertissez le HTML en texte brut lisible, listez tous les liens résolus par rapport à une URL de base, et nettoyez le HTML avec une liste blanche stricte (les scripts, iframes, gestionnaires d'événements en ligne, URLs javascript: et les balises inconnues sont supprimés). Cela fonctionne sur le HTML que vous envoyez et ne récupère jamais d'URLs (pour les aperçus de liens en direct, voir l'API oanor URL Tools). Entrée via la chaîne de requête ou le corps de la requête, jusqu'à 2 Mo. Calcul pur côté serveur, sans tiers en amont, donc les réponses sont instantanées et toujours disponibles. Idéal pour les scrapers et les pipelines de données, le nettoyage des commentaires et des e-mails, l'extraction de contenu RAG et les outils CMS.
api.oanor.com/html-api