DiffBot

DiffBot

* Obtenez automatiquement les données des pages Web: les API de vision par ordinateur de Diffbot transforment le Web en votre base de données.* API AUTOMATIC: extraire automatiquement le contenu structuré à partir d'articles, de produits et d'autres types de page familiers.
Pourquoi Diffbot?Nous nous concentrons exclusivement sur l'amélioration de vos données Web.Certaines des raisons pour lesquelles des centaines de clients passent (des centaines de) millions d'appels chaque mois: #Le meilleur extracteur de contenu du Web: Diffbot fonctionne automatiquement, sans règles ni formation.Il n'y a pas de meilleur moyen d'extraire des données de pages Web.Découvrez comment Diffbot se compare à d'autres méthodes d'extraction de contenu: Comparaison des fonctionnalités Shootout de qualité d'extraction de texte #Identifier les pages automatiquement: utilisez l'API Analyze pour rechercher et extraire automatiquement tous les produits, articles, discussions ou images tout en explorant n'importe quel site.Analyze API #Detailed product data: L'API produit renvoie automatiquement des informations complètes sur le produit, y compris toutes les données de prix, les ID produit, la marque et les tableaux de spécifications complètes.API du produit # Texte propre et html: les articles, les fils de discussion, les descriptions de produits et les légendes d'images sont renvoyés en texte pur et en HTML purifié.Commencez à tester dès aujourd'hui #Structured Search: recherchez du contenu structuré à partir de n'importe quelle exploration à la volée à l'aide de notre API de recherche, en renvoyant uniquement les résultats correspondants.De plus ... ¤ Toutes les API exécutent Javascript afin que le contenu soit analysé comme un navigateur normal.¤ Fonctionne sur la plupart des pages non anglaises grâce au traitement visuel.¤ Normalisation de la date: les horodatages sont normalisés et présentés au format standard RFC 1123 (HTTP / 1.1).¤ Les articles multipages sont automatiquement réunis dans une seule réponse API.¤ Extraction d'entités: le balisage automatique identifie les principaux sujets et entités dans le texte de l'article.¤ Corrigez tous les problèmes en temps réel avec l'API Toolkit.¤ L'API Bulk permet l'extraction de centaines à des centaines de milliers de pages.¤ Accédez aux données des travaux Crawlbot et Bulk au format JSON ou CSV complet.¤ Exploration facultative à l'aide d'un éventail diversifié d'adresses IP.
diffbot

Site Internet:

traits

Les catégories

Alternatives à DiffBot pour toutes les plateformes avec n'importe quelle licence

UI.Vision Kantu

UI.Vision Kantu

Outil d'automatisation des tâches et des tests open source moderne et Selenium IDE.Kantu est une extension de navigateur, mais il peut également faire de l'automatisation de bureau!Utilisez-le pour l'automatisation Web, les tests Web, le remplissage de formulaires, le grattage d'écran et l'automatisation de processus robotique (RPA)..
ScrapeHero

ScrapeHero

Un service de grattage Web pour collecter des données à partir de sites Web, sans aucun outil de programmation ou de bricolage..
Webhose.io

Webhose.io

Nous explorons le Web pour que vous n'ayez pas à le faire.Nos robots d'exploration téléchargent et structurent des millions de publications par jour, nous stockons et indexons les données de sorte que tout ce que vous avez à faire est de définir la partie des données dont vous avez besoin.
PromptCloud

PromptCloud

PromptCloud est un fournisseur de services de grattage Web répondant aux besoins des entreprises en matière de Big Data..
Product API by Fetchee

Product API by Fetchee

L'API automatique de produit fournit aux startups et aux entreprises un service d'extraction de données de commerce électronique précis à la demande.
Aggregatus

Aggregatus

Aggregatus est un service qui vous aide à regrouper des informations de même signification mais provenant de différents sites Web et à les rendre consultables, filtrables et triables comme si elles provenaient toutes d'un seul site Web.
SummarizeBot API

SummarizeBot API

Synthèse multilingue, extraction de mots clés, analyse de sentiment, exploration de texte, détection de visage, reconnaissance d'image et outils d'extraction de données Web.
Lead Bunnies

Lead Bunnies

Le logiciel d'extraction d'emails Leadbunnies est une puissante extension chromée qui automatise le processus de génération de leads pour une entreprise en grattant et validant des milliers d'adresses e-mail de divers répertoires d'entreprises en ligne et réseaux de médias sociaux.
Agenty

Agenty

Agents pour Machine Intelligence: agents basés sur le cloud pour le grattage des données Web, l'extraction de texte, l'ocr, la catégorisation, la détection des modifications, l'analyse des sentiments, etc.