ᐅ Apache Kudu » Definition, Erklärung mit Zusammenfassung u. Beispiel

Was ist Apache Kudu?
Apache Kudu ist ein Mitglied des Open-Source Apache Hadoop-Ökosystems. Es handelt sich um eine Open-Source-Speicher-Engine für strukturierte Daten, die einen wahlfreien Zugriff mit geringer Latenz und effiziente analytische Zugriffsmuster unterstützt. Es wurde entwickelt und implementiert, um die Lücke zwischen dem weit verbreiteten Hadoop Distributed File System (HDFS) und der HBase NoSQL-Datenbank zu schließen. Obwohl sich diese Systeme immer noch als vorteilhaft erweisen können, kann Apache Kudu viele übliche Arbeitslasten bewältigen, da es ihre Architektur drastisch vereinfachen kann.

Apache Kudu wurde hauptsächlich als Projekt bei Cloudera entwickelt. Die meisten der bisherigen Beiträge stammen von Cloudera-Entwicklern. Während der Veröffentlichung wurden nur Convenience-Binaries in die Cloudera-Repositories aufgenommen, jedoch wurde der Source-Release-Prozess der Apache Software Foundation (ASF) beim Beitritt zum Inkubator übernommen. Es wurde speziell für Anwendungsfälle entwickelt, die eine schnelle Analyse schneller Daten erfordern. Es wurde entwickelt, um die Vorteile der Hardware- und In-Memory-Verarbeitung der nächsten Generation zu nutzen. Es reduziert die Abfrage-Latenz signifikant für Apache Impala und Apache Spark. Es verteilt Daten über die Speicher-Engine oder durch horizontale Partitionierung und repliziert dann jede Partition unter Verwendung der Raft-Konsensprognose, wodurch eine niedrige mittlere Zeit bis zur Wiederherstellung und niedrige Tail-Latenzzeiten bereitgestellt werden.

Obwohl Kudu ein Produkt ist, das im Kontext des Apache Hadoop-Ökosystems entwickelt wurde, unterstützt es auch die Integration mit anderen Datenanalyseprojekten innerhalb und außerhalb des ASF.

Apache Kudu erweist sich als effizient, da es analytische Echtzeit-Workloads über eine einzige Speicherebene hinweg verarbeiten kann. Dadurch erhalten die Architekten die Flexibilität, eine Vielzahl von Anwendungsfällen ohne exotische Problemumgehungen zu bearbeiten.

Apache Kudu

Weitere Erklärungen zu