5
DiffBot
* Obtenez automatiquement les données des pages Web: les API de vision par ordinateur de Diffbot transforment le Web en votre base de données.* API AUTOMATIC: extraire automatiquement le contenu structuré à partir d'articles, de produits et d'autres types de page familiers.
- Payante
- Web
Pourquoi Diffbot?Nous nous concentrons exclusivement sur l'amélioration de vos données Web.Certaines des raisons pour lesquelles des centaines de clients passent (des centaines de) millions d'appels chaque mois: #Le meilleur extracteur de contenu du Web: Diffbot fonctionne automatiquement, sans règles ni formation.Il n'y a pas de meilleur moyen d'extraire des données de pages Web.Découvrez comment Diffbot se compare à d'autres méthodes d'extraction de contenu: Comparaison des fonctionnalités Shootout de qualité d'extraction de texte #Identifier les pages automatiquement: utilisez l'API Analyze pour rechercher et extraire automatiquement tous les produits, articles, discussions ou images tout en explorant n'importe quel site.Analyze API #Detailed product data: L'API produit renvoie automatiquement des informations complètes sur le produit, y compris toutes les données de prix, les ID produit, la marque et les tableaux de spécifications complètes.API du produit # Texte propre et html: les articles, les fils de discussion, les descriptions de produits et les légendes d'images sont renvoyés en texte pur et en HTML purifié.Commencez à tester dès aujourd'hui #Structured Search: recherchez du contenu structuré à partir de n'importe quelle exploration à la volée à l'aide de notre API de recherche, en renvoyant uniquement les résultats correspondants.De plus ... ¤ Toutes les API exécutent Javascript afin que le contenu soit analysé comme un navigateur normal.¤ Fonctionne sur la plupart des pages non anglaises grâce au traitement visuel.¤ Normalisation de la date: les horodatages sont normalisés et présentés au format standard RFC 1123 (HTTP / 1.1).¤ Les articles multipages sont automatiquement réunis dans une seule réponse API.¤ Extraction d'entités: le balisage automatique identifie les principaux sujets et entités dans le texte de l'article.¤ Corrigez tous les problèmes en temps réel avec l'API Toolkit.¤ L'API Bulk permet l'extraction de centaines à des centaines de milliers de pages.¤ Accédez aux données des travaux Crawlbot et Bulk au format JSON ou CSV complet.¤ Exploration facultative à l'aide d'un éventail diversifié d'adresses IP.
diffbot
Site Internet:
https://www.diffbot.com/traits
Les catégories
Alternatives à DiffBot pour JavaScript
0
artoo.js
artoo.js est un morceau de code JavaScript destiné à être exécuté dans la console de votre navigateur pour vous fournir des utilitaires de grattage.
- Gratuite
- Chrome
- JavaScript
- Node.JS
- Web
- Self-Hosted