Apache Sqoop

Sqoop è un’applicazione a riga di comando che permette di trasferire dati da basi di dati relazionali a Hadoop.  Oggigiorno, nelle aziende i dati vengono solitamente salvati in database relazionali, quindi Sqoop consente uno scambio efficiente tra questi sistemi di archiviazione e il cluster. Supporta caricamenti incrementali di una singola tabella o query SQL, o job salvati che possono essere eseguiti più volte per importare aggiornamenti fatti alla base di dati rispetto all’ultimo importo. Le importazioni possono essere usate per popolare tabelle in Apache Hive o HBase. Le esportazioni possono essere usate per inserire dati da Hadoop a basi di dati relazionali. Sqoop è diventato un progetto Apache di massima importanza nel marzo 2012.

Condividi su:

NoSQL

NoSQL è un movimento che promuove sistemi software dove la persistenza dei dati è in generale caratterizzata dal fatto di non utilizzare il modello relazionale, di solito usato dalle basi di dati tradizionali (RDBMS). L’espressione “NoSQL” fa riferimento al linguaggio SQL, che è il più comune linguaggio di interrogazione dei dati nei database relazionali, qui preso a simbolo dell’intero paradigma relazionale.

Questi archivi di dati il più delle volte non richiedono uno schema fisso (schemaless), evitano spesso le operazioni di giunzione (join) e puntano a scalare in modo orizzontale. Gli accademici e gli articoli si riferiscono a queste basi di dati come memorizzazione strutturata (structured storage).

geeks-academy-aree-corsi-coding-cybersecurity-big-data-gaming

Condividi su:

MongoDB

MongoDB (da “humongous”, enorme) è un database NoSQL orientato ai documenti, che nasce nel 2007 in California come un componente di un prodotto di platform as a service, ma che presto è diventato un prodotto indipendente ed open-source. Esso memorizza i documenti in JSON, formato basato su JavaScript e più semplice di XML, ma comunque dotato di una buona espressività.

Condividi su:

Small data

Gli Small Data, al contrario dei loro fratelli Big, sono, come dice il nome, piccoli dati ma ben strutturati, che possono fornire informazioni puntuali basate sull’analisi dei dettagli.

Gli Small Data sono i dettagli comportamentali capaci di rivelare molto di una persona.

La LEGO evito il fallimento nel 2002 andando a visitare e parlare direttamente con alcuni consumatori. Gli Small Data, in altre parole, hanno permesso all’azienda di capire come avvicinare a sé le nuove generazioni. 

Condividi su:

Data Science

La scienza dei dati (in inglese data science) è l’insieme di principi metodologici (basati sul metodo scientifico) e tecniche multidisciplinari volto a interpretare ed estrarre conoscenza dai dati (Big Data) attraverso la relativa fase di analisi da parte di un esperto (Data Scientist). I metodi della scienza dei dati si basano su tecniche provenienti da varie discipline, principalmente da matematica, statistica, scienza dell’informazione e informatica, in particolar modo nei seguenti sottodomini: basi di dati e visualizzazione dati o business intelligence, intelligenza artificiale o machine learning .

geeks-academy-data-science-with-python-machine-learning-ai
Condividi su:

Motore di ricerca

Un motore di ricerca (in inglese search engine) è un sistema automatico che analizza un insieme di dati spesso da esso stesso raccolti e restituisce un indice dei contenuti disponibili classificandoli in base a formule statistico-matematiche che ne indichino il grado di rilevanza data una determinata chiave di ricerca. Uno dei campi in cui i motori di ricerca trovano maggiore utilizzo è quello dell’information retrieval e nel web.geeks-academy-logo-scudo social

Condividi su: