Apache Nutch

What is Apache Nutch?
Apache Nutch is a web crawler software product that can be used to aggregate data from the Internet. It is used in conjunction with other Apache tools such as Hadoop for data analysis.

Apache Nutch ist ein Open-Source-Produkt, das von der Apache Software Foundation lizenziert wird. Diese Entwicklergemeinschaft hält Lizenzen für eine Reihe von Apache-Softwaretools, die Daten sortieren und analysieren können. Eine der zentralen Technologien ist Apache Hadoop, ein großes Datenanalyse-Tool, das in der Geschäftswelt sehr beliebt ist.

Along with tools like Apache Hadoop and file storage, analysis, and more, Nutch's job is to collect and store data from the Internet through the use of web crawling algorithms.

Benutzer können einfache Befehle in Apache Nutch nutzen, um Informationen unter URLs zu sammeln. Benutzer verwenden Apache Nutch normalerweise zusammen mit einem anderen Open-Source-Tool, einem Framework namens Apache Solr, das als Repository für die mit Apache Nutch gesammelten Daten dienen kann.

Was the explanation to "Apache Nutch"Helpful? Rate now:

Weitere Erklärungen zu Anfangsbuchstabe A