Kibana

Kibana è un plug-in di visualizzazione dei dati open source per Elasticsearch. Gli utenti possono creare grafici a barre, a linee e a dispersione, o grafici a torta e mappe su grandi volumi di dati. kibana non richiede abilità di programmazione, quindi lo sviluppatore può facilmente creare una visualizzazione per le informazioni in modo che possano facilmente tenere traccia dei processi. La combinazione di Elasticsearch, Logstash e Kibana, denominata “Elastic Stack” (precedentemente “stack ELK”), è disponibile come prodotto o servizio.

geeks-academy-corso-big-data-streaming-analytics-kibana-elasticsearch-logstash
Condividi su:

Logstash

Logstash è un motore di raccolta dati open source con funzionalità di pipeling in tempo reale. Logstash può unificare dinamicamente i dati da fonti disparate e normalizzare i dati in una destinazioni di tua scelta. Pulisce e democratizza tutti i tuoi dati per diversi casi di utilizzo avanzati di analisi e visualizzazione a valle. Qualsiasi tipo di evento può essere arricchito e trasformato con un’ampia gamma di plug-in di input, filtro e output, con molti codec nativi che semplificano ulteriormente il processo di importazione. La combinazione di Elasticsearch, Logstash e Kibana, denominata “Elastic Stack” (precedentemente “stack ELK”), è disponibile come prodotto o servizio.

geeks-academy-corso-big-data-streaming-analytics-kibana-elasticsearch-logstash
Condividi su:

Data Enrichment

Data Enrichment consiste in un insieme di processi specifici attuati al fine di verificare, integrare e migliorare i dati grezzi e le informazioni presenti nei database aziendali e renderli dati utilizzabili strategicamente. Grazie all’arricchimento dei dati si possono eliminare errori, unificare i dati per compararli fra loro. Inoltre, è possibile integrare i dati di cui si è già in possesso con altri provenienti da database esterni. geeks-academy-big-data-junior-expert

Condividi su:

Data warehouse

Il Data Warehouse  è un tipo di sistema di data management  che integra e riorganizza i dati provenienti da sorgenti di varia natura. Le strutture dati del data warehouse consentono di effettuare analisi di basi di dati complessi, svolte con metodi statistici di esplorazione e di modellazione dei dati. Le tecniche di data mining, in particolare, permettono di sviluppare modelli comportamentali della clientela che aiutano ad individuare il profilo dei potenziali clienti che si vogliono raggiungere.

geeks-academy-logo-scudo social

Condividi su:

Hadoop

Hadoop è un framework software, sotto una licenza libera, concepito per scrivere facilmente applicazioni che elaborano  petabyte di dati in parallelo, su cluster di grandi dimensioni (costituiti da migliaia di nodi) assicurando un’elevata affidabilità e disponibilità (fault-tolerant). Per garantire queste caratteristiche, Hadoop utilizza numerosi macro-sistemi tra cui HDFS, un file system distribuito. Ispirato dalla MapReduce di Google e dal Google File System, è un progetto Apache di alto livello, costruito e usato da una comunità globale di contributori, che usano i linguaggi di programmazione Java e, per gli strumenti più recenti, Scala. Yahoo! è il più grande contributore a questo progetto, e ne fa fortemente uso. È usato anche da: AOL, Ebay, Facebook, IBM, ImageShack, Joost, Linkedin, Spotify, The New York Times e Twitter. Il nome del progetto è stato scelto dal suo creatore Doug Cutting, il quale ha scelto Hadoop, il nome dell’elefante di pezza di suo figlio. In origine fu sviluppato per supportare la distribuzione per il progetto del motore di ricerca Nutch.geeksacademy-big-data-framework-hadoop

Condividi su:

Excel

Excel è un programma prodotto da Microsoft, dedicato alla produzione ed alla gestione di fogli elettronici. È parte della suite di software di produttività personale Microsoft Office, ed è disponibile per i sistemi operativi Windows e Macintosh. È uno strumento informatico pensato per la pianificazione finanziaria personale e non solo. Attualmente, è il foglio elettronico più usato, sebbene, ora come ora, la sola definizione di foglio elettronico appare riduttiva. Infatti, se in passato aveva ancora senso distinguere i fogli elettronici dai word processor, dai desktop publishing e dai database, oggi, un software come Excel condensa in se stesso tante e diverse funzionalità presenti anche nei programmi qui citati.

geeks-academy-business-intelligence-excel
Condividi su:

ACID

Nell’ambito dei database, ACID deriva dall’acronimo inglese Atomicity, Consistency, Isolation, e Durability (Atomicità, Coerenza, Isolamento e Durabilità) ed indica le proprietà logiche che devono avere le transazioni.

geeks-academy-managing-data-sql

Condividi su:

Streaming Analytics

Lo Streaming analytics si occupa di un’ampia gamma di dati – testo non strutturato, video, audio, geospaziale e di sensore – in tempo reale. Gli eventi che si verificano come risultato di un’azione o di una serie di azioni, ad esempio una transazione finanziaria, un guasto dell’apparecchiatura o un altro trigger, possono essere molto granulari, come qualcosa che accade all’interno di un sistema in un determinato momento: un clic, una lettura del sensore, un tweet o qualche altra attività misurabile. Il crescente numero di dispositivi connessi, IoT, aumenterà esponenzialmente il volume di eventi che circondano l’attività aziendale. Maggiore è il numero di dati generati dalla tua azienda, maggiori saranno i potenziali benefici derivanti dallo  streaming analytics.geeks-academy-corso-big-data-streaming-analytics

Condividi su:

Scala

Scala è un linguaggio di programmazione per scopi generici altamente scalabile che combina aspetti della programmazione orientata agli oggetti e funzionale. È diventato sempre più importante nel mondo della data science, rivaleggiando con linguaggi più affermati come Java e Python . Uno dei principali driver dell’ascesa alla Scala è stata la crescita esplosiva di Apache Spark (che è scritto in Scala), che ha dato a Scala una meritata reputazione come un potente linguaggio per l’elaborazione dei dati, l’apprendimento automatico e la streaming analytics.

Condividi su: