HBase è un database distribuito non relazionale open source modellato sulla Bigtable di Google e scritto in Java . Si è sviluppato come parte di Apache Software Foundation, progetto Apache Hadoop e viene eseguito sulla parte superiore della HDFS (Hadoop Distributed File System) o Alluxio , fornendo funzionalità Bigtable simile per Hadoop. Cioè, fornisce un modo Fault tolerance (tollerante ai guasti) per immagazzinare grandi quantità di rado dati (piccole quantità di informazioni catturate all’interno di una vasta raccolta di dati vuoti o non importanti, come trovare i 50 articoli più grandi in un gruppo di 2 miliardi di record o trovare gli elementi diversi da zero che rappresentano meno dello 0,1% di una vasta raccolta).
HBase funziona su HDFS ed è adatto per operazioni di lettura e scrittura più veloci su set di dati di grandi dimensioni con throughput elevato e bassa latenza di input / output.
La HBase sta attualmente servendo diversi siti Web basati sui dati ma la piattaforma di messaggistica di Facebook è recentemente migrata da HBase a MyRocks. A differenza dei database relazionali e tradizionali, HBase non supporta gli script SQL; invece l’equivalente è scritto in Java, usando la somiglianza con un’applicazione MapReduce.