Disco MapReduce

Disco MapReduce

Disco est un framework open-source léger pour l'informatique distribuée basé sur le paradigme MapReduce et écrit en Python.
Disco est une implémentation de mapreduce pour l'informatique distribuée.Disco prend en charge les calculs parallèles sur de grands ensembles de données, stockés sur un cluster d'ordinateurs peu fiable, comme dans le cadre d'origine créé par Google.Cela en fait un outil parfait pour analyser et traiter de grands ensembles de données, sans avoir à se soucier des aspects techniques difficiles liés à la distribution tels que les protocoles de communication, l'équilibrage de charge, le verrouillage, la planification des travaux et la tolérance aux pannes, qui sont gérés par Disco.
disco-mapreduce

Site Internet:

traits

Les catégories

Alternatives à Disco MapReduce pour toutes les plateformes avec n'importe quelle licence

Apache Hadoop

Apache Hadoop

Apache Hadoop est un cadre logiciel open source qui prend en charge les applications distribuées gourmandes en données sous licence Apache v2.
Apache Spark

Apache Spark

Apache Spark ™ est un moteur rapide et général pour le traitement de données à grande échelle. Des programmes SpeedRun jusqu'à 100 fois plus rapides que Hadoop MapReduce en mémoire, ou 10 fois plus vite sur disque.
Amazon Kinesis

Amazon Kinesis

Les services Amazon Kinesis facilitent l'utilisation des données de streaming en temps réel dans le cloud AWS.
dispy

dispy

dispy est un framework Python pour l'exécution parallèle de calculs en les répartissant sur plusieurs processeurs sur une seule machine (SMP), entre plusieurs machines d'un cluster ou ...