9
Apache Spark ™ est un moteur rapide et général pour le traitement de données à grande échelle.Programmes Speed Run jusqu'à 100 fois plus rapides que Hadoop MapReduce en mémoire ou 10 fois plus rapides sur le disque.Spark dispose d'un moteur d'exécution DAG avancé qui prend en charge le flux de données cyclique et le calcul en mémoire.
Site Internet:
http://spark.apache.orgLes catégories
Alternatives à Apache Spark pour Linux
18
Apache Hadoop
Apache Hadoop est un cadre logiciel open source qui prend en charge les applications distribuées gourmandes en données sous licence Apache v2.
1
Disco MapReduce
Disco est un framework open-source léger pour l'informatique distribuée basé sur le paradigme MapReduce et écrit en Python.