Analisi dei big data con Python. Le migliori tecniche per aggregare i dati (L')

Riferimento: 9788848140614

Editore: Tecniche nuove
Autore: Marin Ivan; Shukla Ankit; Sarang VK
Collana: Tecnologie
In commercio dal: 31 Ottobre 2019
Pagine: 218 p., Libro in brossura
EAN: 9788848140614
27,90 €
Quantità
Non disponibile

Descrizione

Una delle professioni più emergenti nel campo tecnologico è quella del Data Scientist. Ovvero il professionista che è in grado di aggregare e analizzare la grande mole di informazioni di cui oggi una azienda dispone in modo da poterle usare nell'ambito decisionale. Il linguaggio di programmazione Python è molto utilizzato come strumento software per questa analisi. Questo testo, scritto da specialisti, mostra diversi tool e tecniche per gestire i dati provenienti da varie fonti e database allo scopo di renderli fruibili per successive analisi statistiche e computazionali. I capitoli sono brevi, centrati su ogni singola tecnica operativa e sempre conclusi con esercizi e codici di esempio. Oltre a Python vengono quindi descritti una serie di tool e strumenti specifici, perlopiù open source, che supportano il lavoro di sviluppo del software. Imparerete a: utilizzare Python per leggere e trasformare i dati in diversi formati; utilizzare strumenti avanzati come Jupiter, Spark, Parquet, Pandas e Hadoop; generare statistiche e metriche di base utilizzando i dati su disco; svolgere elaborazioni distribuite su cluster; convertire dati da varie fonti in formati di archiviazione o query; preparare i dati per analisi statistiche, visualizzazioni e machine learning; presentare i dati sotto forma di grafici efficaci.