DiffBot

DiffBot

* Obtenez automatiquement les données des pages Web: les API de vision par ordinateur de Diffbot transforment le Web en votre base de données.* API AUTOMATIC: extraire automatiquement le contenu structuré à partir d'articles, de produits et d'autres types de page familiers.
Pourquoi Diffbot?Nous nous concentrons exclusivement sur l'amélioration de vos données Web.Certaines des raisons pour lesquelles des centaines de clients passent (des centaines de) millions d'appels chaque mois: #Le meilleur extracteur de contenu du Web: Diffbot fonctionne automatiquement, sans règles ni formation.Il n'y a pas de meilleur moyen d'extraire des données de pages Web.Découvrez comment Diffbot se compare à d'autres méthodes d'extraction de contenu: Comparaison des fonctionnalités Shootout de qualité d'extraction de texte #Identifier les pages automatiquement: utilisez l'API Analyze pour rechercher et extraire automatiquement tous les produits, articles, discussions ou images tout en explorant n'importe quel site.Analyze API #Detailed product data: L'API produit renvoie automatiquement des informations complètes sur le produit, y compris toutes les données de prix, les ID produit, la marque et les tableaux de spécifications complètes.API du produit # Texte propre et html: les articles, les fils de discussion, les descriptions de produits et les légendes d'images sont renvoyés en texte pur et en HTML purifié.Commencez à tester dès aujourd'hui #Structured Search: recherchez du contenu structuré à partir de n'importe quelle exploration à la volée à l'aide de notre API de recherche, en renvoyant uniquement les résultats correspondants.De plus ... ¤ Toutes les API exécutent Javascript afin que le contenu soit analysé comme un navigateur normal.¤ Fonctionne sur la plupart des pages non anglaises grâce au traitement visuel.¤ Normalisation de la date: les horodatages sont normalisés et présentés au format standard RFC 1123 (HTTP / 1.1).¤ Les articles multipages sont automatiquement réunis dans une seule réponse API.¤ Extraction d'entités: le balisage automatique identifie les principaux sujets et entités dans le texte de l'article.¤ Corrigez tous les problèmes en temps réel avec l'API Toolkit.¤ L'API Bulk permet l'extraction de centaines à des centaines de milliers de pages.¤ Accédez aux données des travaux Crawlbot et Bulk au format JSON ou CSV complet.¤ Exploration facultative à l'aide d'un éventail diversifié d'adresses IP.
diffbot

Site Internet:

traits

Les catégories

Alternatives à DiffBot pour Node.JS

artoo.js

artoo.js

artoo.js est un morceau de code JavaScript destiné à être exécuté dans la console de votre navigateur pour vous fournir des utilitaires de grattage.