Apache Spark ist eine schnelle und allgemeine Engine für die Verarbeitung von sehr großen Datenmengen. Sie ist um ein Vielfaches schneller als Hadoop MapReduce, kann verschiedene Datenquellen anzapfen, darunter SQL-Datenbanken und weitere und kann Daten als Datenströme senden. Es stehen Schnittstellen in verschiedenen Programmiersprachen zur Verfügung, um die Daten zu verarbeiten. (non)