Hadoop

Hadoop è un framework software, sotto una licenza libera, concepito per scrivere facilmente applicazioni che elaborano  petabyte di dati in parallelo, su cluster di grandi dimensioni (costituiti da migliaia di nodi) assicurando un’elevata affidabilità e disponibilità (fault-tolerant). Per garantire queste caratteristiche, Hadoop utilizza numerosi macro-sistemi tra cui HDFS, un file system distribuito. Ispirato dalla MapReduce di Google e dal Google File System, è un progetto Apache di alto livello, costruito e usato da una comunità globale di contributori, che usano i linguaggi di programmazione Java e, per gli strumenti più recenti, Scala. Yahoo! è il più grande contributore a questo progetto, e ne fa fortemente uso. È usato anche da: AOL, Ebay, Facebook, IBM, ImageShack, Joost, Linkedin, Spotify, The New York Times e Twitter. Il nome del progetto è stato scelto dal suo creatore Doug Cutting, il quale ha scelto Hadoop, il nome dell’elefante di pezza di suo figlio. In origine fu sviluppato per supportare la distribuzione per il progetto del motore di ricerca Nutch.geeksacademy-big-data-framework-hadoop

Condividi su:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *