Cos'è l'elaborazione analitica online?

L'elaborazione analitica online (OLAP) è una tecnologia software che è possibile utilizzare per analizzare i dati aziendali da diversi punti di vista. Le organizzazioni raccolgono e archiviano dati da più origini dati, come siti Web, applicazioni, contatori intelligenti e sistemi interni. OLAP combina e raggruppa questi dati in categorie per fornire informazioni utili per la pianificazione strategica. Ad esempio, un rivenditore memorizza i dati su tutti i prodotti che vende, come colore, dimensioni, costo e posizione. Il rivenditore raccoglie anche i dati di acquisto dei clienti, come il nome degli articoli ordinati e il valore totale delle vendite, in un sistema diverso. OLAP combina i set di dati per rispondere a domande come quali prodotti a colori sono più popolari o in che modo il posizionamento dei prodotti influisce sulle vendite.

Perché l'OLAP è importante?

L'elaborazione analitica online (OLAP) aiuta le organizzazioni a elaborare e utilizzare al meglio la quantità sempre maggiore di informazioni digitali di cui dispongono o a cui hanno accesso. Alcuni dei vantaggi dell'OLAP includono quanto segue.

Processo decisionale più veloce

Le aziende si affidano all'OLAP per poter rendere il loro processo decisionale più rapido e accurato, così da restare competitive in un'economia e in un mercato che si muovono a ritmi sempre più frenetici. L'esecuzione di query analitiche su un gran numero di database relazionali richiede molto tempo perché il sistema informatico è obbligato a eseguire le ricerche in più tabelle di dati. I sistemi OLAP, invece, eseguono un calcolo preliminare e integrano i dati in modo che gli analisti aziendali possano generare più velocemente i report richiesti.

Facilità d'uso anche per utenti non esperti

I sistemi OLAP semplificano l'analisi di dati anche particolarmente complessi e questo permette anche agli utenti aziendali con competenze tecniche limitate o nulle di creare calcoli analitici complessi e generare report, senza dover dedicare il loro tempo a studiare e capire come utilizzare i database.

Visione integrata dei dati

L'OLAP fornisce una piattaforma unificata per varie unità operative aziendali, così che possano accedervi utenti di diversi settori, quali marketing, finanza, produzione e così via. I manager e i decision maker possono vedere il quadro generale e agire in modo più efficace quando si tratta di risolvere i problemi. Possono eseguire analisi what-if, che mostrano l'impatto che le decisioni prese da un reparto avranno su altri settori aziendali.

Cos'è l'architettura OLAP?

I sistemi di elaborazione analitica online (OLAP) archiviano i dati multidimensionali rappresentando le informazioni in più di due dimensioni o categorie. I dati bidimensionali prevedono righe e colonne, mentre i dati multidimensionali hanno molteplici caratteristiche. Ad esempio, i dati multidimensionali relativi alle vendite di un prodotto potrebbero essere costituiti dalle seguenti dimensioni:

  • Tipo di prodotto
  • Luogo
  • Durata

I data engineer creano un sistema OLAP multidimensionale costituito dai seguenti elementi. 

Data warehouse

Un data warehouse raccoglie le informazioni da diverse fonti, tra cui applicazioni, file e database. Quindi, elabora queste informazioni utilizzando vari strumenti, in modo che i dati siano pronti per poter essere analizzati. Ad esempio, il data warehouse potrebbe raccogliere informazioni da un database relazionale in cui i dati sono archiviati in tabelle con righe e colonne. 

Strumenti ETL

Gli strumenti di estrazione, trasformazione e caricamento (ETL) sono processi di database che recuperano, modificano e preparano automaticamente i dati in un formato adatto per l'analisi. I data warehouse utilizzano gli strumenti ETL per convertire e standardizzare le informazioni provenienti da varie fonti prima di renderle disponibili per gli strumenti OLAP.

Server OLAP

Un server OLAP è la macchina alla base del sistema OLAP. Utilizza gli strumenti ETL per trasformare le informazioni presenti nei database relazionali e prepararle per le operazioni OLAP. 

Database OLAP

Un database OLAP è un database separato che si connette al data warehouse. I data engineer a volte utilizzano un database OLAP per evitare che il data warehouse debba gestire un carico di lavoro eccessivo a seguito dell'analisi OLAP. Inoltre, utilizzano un database OLAP per semplificare la creazione di modelli di dati OLAP.

Cubi OLAP

Un cubo di dati è un modello che rappresenta una serie multidimensionale di informazioni. Sebbene sia più facile visualizzarlo come un modello di dati tridimensionale, la maggior parte dei cubi di dati ha più di tre dimensioni. Con il termine "cubo OLAP" (o ipercubo) si indicano i cubi di dati in un sistema OLAP. I cubi OLAP sono rigidi perché, una volta modellati, non è possibile modificarne dimensioni e dati. Ad esempio, se si desidera aggiungere la dimensione warehouse a un cubo con dimensioni prodotto, luogo e tempo, è necessario rimodellare l'intero cubo. 

Strumenti analitici OLAP

Gli analisti aziendali utilizzano gli strumenti OLAP per interagire con il cubo OLAP. A questo scopo, eseguono operazioni come il frazionamento, la suddivisione e la rotazione per ottenere informazioni più approfondite su specifici dati nel cubo OLAP. 

Come funziona il sistema OLAP?

Come funziona il sistema OLAP?

Un sistema di elaborazione analitica online (OLAP) raccoglie, organizza, aggrega e analizza i dati utilizzando i seguenti passaggi: 

  1. Il server OLAP raccoglie i dati da più origini, inclusi database relazionali e data warehouse.
  2. Quindi, gli strumenti di estrazione, trasformazione e caricamento (ETL) puliscono e aggregano i dati, eseguono un calcolo preliminare e infine memorizzano le informazioni in un cubo OLAP, strutturato in base al numero di dimensioni specificato.
  3. Gli analisti aziendali utilizzano gli strumenti OLAP per eseguire query e generare report dai dati multidimensionali nel cubo OLAP.

OLAP utilizza espressioni multidimensionali (MDX) per interrogare il cubo OLAP. MDX è una query, come SQL, che fornisce una serie di istruzioni per la manipolazione dei database.

Quali sono le tipologie di sistemi OLAP?

I sistemi di elaborazione analitica online (OLAP) prevedono tre modalità principali di funzionamento.

MOLAP

L'elaborazione analitica online multidimensionale (MOLAP) comporta la creazione di un cubo di dati che rappresenta i dati multidimensionali da un data warehouse. Il sistema MOLAP memorizza nell'ipercubo i dati oggetto di calcolo preliminare. I data engineer utilizzano MOLAP perché questo tipo di tecnologia OLAP fornisce un'analisi rapida. 

ROLAP

Invece di utilizzare un cubo di dati, l'elaborazione analitica online relazionale (ROLAP) consente ai data engineer di eseguire l'analisi dei dati multidimensionali in un database relazionale. In altre parole, i data engineer utilizzano le query SQL per cercare e recuperare specifiche informazioni in base alle dimensioni richieste. ROLAP è adatto per l'analisi di dati estesi e dettagliati. Con ROLAP, però, l'esecuzione delle query risulta più lenta rispetto a MOLAP. 

HOLAP

L'elaborazione analitica online ibrida (HOLAP) combina i sistemi MOLAP e ROLAP per offrire il meglio di queste due architetture. HOLAP consente ai data engineer di recuperare rapidamente i risultati analitici da un cubo di dati ed estrarre informazioni dettagliate dai database relazionali. 

Che cos'è la modellazione dei dati in OLAP?

La modellazione dei dati è la rappresentazione dei dati presenti nei data warehouse o nei database OLAP. La modellazione dei dati è fondamentale nell'elaborazione analitica online relazionale (ROLAP) perché analizza i dati direttamente dal database relazionale. Memorizza i dati multidimensionali come schema a stella o a fiocco di neve. 

Schema a stella

Lo schema a stella è costituito da una tabella dei fatti e da più tabelle delle dimensioni. La tabella dei fatti è una tabella di dati che contiene valori numerici correlati a un processo aziendale, mentre la tabella delle dimensioni contiene i valori che descrivono i singoli attributi presenti nella tabella dei fatti. La tabella dei fatti referenzia le tabelle delle dimensioni con chiavi esterne, cioè identificatori univoci che si correlano alle corrispondenti informazioni nella tabella delle dimensioni. 

In uno schema a stella, una tabella dei fatti si collega a diverse tabelle delle dimensioni in modo che il modello di dati assomigli a una stella. Di seguito è riportato un esempio di tabella dei fatti per le vendite di prodotti: 

  • ID prodotto
  • ID luogo
  • ID venditore
  • Importo vendite

L'ID prodotto indica al sistema di database che deve recuperare le informazioni dalla tabella delle dimensioni dei prodotti, che potrebbe contenere quanto segue:

  • ID prodotto
  • Nome del prodotto
  • Tipo di prodotto
  • Costo del prodotto

Analogamente, l'ID luogo punta a una tabella delle dimensioni dei luoghi, che potrebbe contenere quanto segue:

  • ID luogo
  • Paese
  • Città

La tabella dei venditori potrebbe contenere quanto segue:

  • ID venditore
  • Nome
  • Cognome
  • E-mail

Schema a fiocco di neve

Lo schema a fiocco di neve è un'estensione dello schema a stella. Alcune tabelle delle dimensioni possono portare a una o più tabelle secondarie. Ciò si traduce in una forma simile a quella di un fiocco di neve quando le tabelle delle dimensioni vengono collegate tra loro. 

Ad esempio, la tabella delle dimensioni dei prodotti potrebbe contenere quanto segue:

  • ID prodotto
  • Nome del prodotto
  • ID tipo di prodotto
  • Costo del prodotto

L'ID del tipo di prodotto si collega a un'altra tabella delle dimensioni, come illustrato nell'esempio che segue:

  • ID tipo di prodotto
  • Nome del tipo
  • Versione
  • Variante 

Cosa sono le operazioni OLAP?

Gli analisti aziendali eseguono diverse operazioni di analisi di base con un cubo MOLAP. 

Roll up

Nel roll up, il sistema di elaborazione analitica online (OLAP) riepiloga i dati per gli specifici attributi. In altre parole, visualizza dati meno dettagliati. Ad esempio, potresti voler visualizzare le vendite dei prodotti suddivise in base al luogo, come New York, California, Londra e Tokyo. Un'operazione di roll up ti fornirà una visione dei dati di vendita suddivisi per paese, come Stati Uniti, Regno Unito e Giappone. 

Drill down

Il drill down è l'opposto dell'operazione di roll up. Gli analisti aziendali disaggregano i dati muovendo una dimensione verso il basso della gerarchia dei concetti così da poter estrarre i dettagli di cui hanno bisogno. Nel caso dei dati di vendita, ad esempio, possono passare dalla visualizzazione per anno alla visualizzazione per mese.

Slice

I data engineer utilizzano l'operazione di slice per creare una vista bidimensionale dal cubo OLAP. Un cubo MOLAP, ad esempio, ordina i dati in base a prodotti, città e mesi. Eseguendo un'operazione di slice sul cubo, i data engineer possono creare una tabella simile a un foglio di calcolo composta, ad esempio, da prodotti e città per uno specifico mese. 

Dice

I data engineer utilizzano l'operazione di dice per creare un sottocubo più piccolo da un cubo OLAP. Determinano le dimensioni richieste e costruiscono un cubo più piccolo dall'ipercubo originale.

Pivot

L'operazione di pivot prevede la rotazione del cubo OLAP lungo una delle sue dimensioni per ottenere una prospettiva diversa sul modello di dati multidimensionali. Un cubo OLAP tridimensionale può, ad esempio, avere le seguenti dimensioni sui rispettivi assi:

  • Asse X: prodotto 
  • Asse Y: luogo
  • Asse Z: tempo

In seguito a un'operazione di pivot, il cubo OLAP ha la seguente configurazione:

  • Asse X: luogo
  • Asse Y: tempo
  • Asse Z: prodotto

Come si posiziona OLAP rispetto ad altri metodi di analisi dei dati?

Data mining

Il data mining è una tecnologia di analisi che elabora grandi volumi di dati storici per individuare pattern e informazioni utili. Gli analisti aziendali utilizzano gli strumenti di data mining per scoprire le relazioni tra i dati e riuscire a fare previsioni precise su quelle che possono essere le tendenze future.

OLAP e data mining

L'elaborazione analitica online (OLAP) è una tecnologia di analisi del database che prevede l'interrogazione, l'estrazione e lo studio di dati di riepilogo. Il data mining, invece, implica uno studio approfondito delle informazioni non elaborate. Ad esempio, gli esperti di marketing potrebbero utilizzare strumenti di data mining per analizzare i comportamenti degli utenti partendo dai record di ogni visita al sito Web. Potrebbero poi utilizzare il software OLAP per analizzare tali comportamenti da varie angolazioni, come durata, dispositivo, paese, lingua e tipo di browser. 

OLTP

L'elaborazione delle transazioni online (OLTP) è una tecnologia di dati che memorizza in modo rapido e sicuro le informazioni in un database. I data engineer utilizzano gli strumenti OLTP per archiviare in un database relazionale i dati transazionali, come registri finanziari, abbonamenti ai servizi e feedback dei clienti. I sistemi OLTP prevedono la creazione, l'aggiornamento e l'eliminazione dei record nelle tabelle relazionali. 

OLAP e OLTP

OLTP è ideale per gestire e archiviare più flussi di transazioni nei database. Tuttavia, non può eseguire query complesse dal database. Pertanto, gli analisti aziendali preferiscono utilizzare un sistema OLAP quando si tratta di analizzare dati multidimensionali. Ad esempio, i data scientist collegano un database OLTP a un cubo OLAP basato su cloud per eseguire query a elaborazione intensiva sui dati storici.

In che modo AWS può essere utile per OLAP?

I database AWS forniscono vari database su cloud gestiti, con l'obiettivo di aiutare le organizzazioni ad archiviare ed eseguire operazioni di elaborazione analitica online (OLAP). Gli analisti di dati utilizzano i database AWS per creare dei database sicuri che risultino conformi e in linea con i requisiti della loro organizzazione. Le organizzazioni eseguono la migrazione dei dati aziendali nei database AWS di cui apprezzano convenienza e scalabilità. 

  • Amazon Redshift è un data warehouse su cloud progettato specificamente per l'elaborazione analitica online.
  • Amazon Relational Database Service (Amazon RDS) è un database relazionale con funzionalità OLAP. I data engineer utilizzano Amazon RDS con Oracle OLAP per eseguire query complesse su cubi dimensionali.
  • Amazon Aurora è un database relazionale su cloud compatibile con MySQL e PostgreSQL. È ottimizzato per l'esecuzione di carichi di lavoro OLAP complessi.


Inizia oggi stesso a utilizzare OLAP su AWS creando un account AWS.

Fasi successive dell'elaborazione analitica online

Scopri ulteriori risorse correlate al prodotto
Ulteriori informazioni sui servizi di Analytics 
Registrati per creare un account gratuito

Ottieni accesso istantaneo al piano gratuito di AWS. 

Registrati 
Inizia subito nella console

Inizia subito a costruire con AWS nella Console di gestione AWS.

Accedi