In cosa consistono i flussi di dati in tempo reale?
I flussi di dati in tempo reale implicano la raccolta e l'acquisizione di una sequenza di dati da varie origini dati e l'elaborazione di tali dati in tempo reale per estrarne significato e informazioni.
Esempi di flussi di dati possono essere file di log generati dai clienti che utilizzano applicazioni Web o su dispositivi mobili, acquisti effettuati su siti di e-commerce, eventi all'interno di videogiochi, informazioni provenienti da social network, dati di transazioni finanziarie, servizi di geolocalizzazione e di telemetria relativi a dispositivi connessi o strumentazioni in data center.
I flussi di dati in tempo reale consentono di analizzare ed elaborare i dati in tempo reale anziché attendere ore, giorni o settimane per ottenere risposte.
Quali sono i componenti dei flussi di dati in tempo reale?
Origine: fino a centinaia e migliaia di dispositivi o applicazioni che producono elevati volumi di dati continui ad alta velocità. Alcuni esempi sono i dispositivi mobili, le applicazioni Web (clickstream), i log delle applicazioni, i sensori IoT, i dispositivi intelligenti e le applicazioni di gioco.
Acquisizione di flussi: semplice integrazione con oltre 15 servizi AWS (Amazon API Gateway, AWS IoT Core, Amazon Cloudwatch e molti altri) che consente di catturare dati continui prodotti da migliaia di dispositivi in modo durevole e sicuro.
Archiviazione di flussi: scegli una soluzione che soddisfi le tue esigenze di archiviazione in base a requisiti di dimensionamento, latenza ed elaborazione come Amazon Kinesis Data Streams, Amazon Kinesis Data Firehose e Streaming gestito da Amazon per Apache Kafka (Amazon MSK).
Elaborazione di flussi: puoi scegliere tra vari servizi, dai più semplici che richiedono solo un paio di clic per trasformare e consegnare dati continuamente a destinazioni come Amazon Kinesis Data Firehose, a soluzioni più avanzate che permettono la creazione di applicazioni personalizzate in tempo reale e l'integrazione del machine learning, utilizzando servizi come Servizio gestito da Amazon per Apache Flink e AWS Lambda.
Destinazione: fornisci flussi di dati a una selezione di data lake, data warehouse e servizi di analisi completamente integrati per ulteriori analisi o archiviazione a lungo termine, come Amazon S3, Amazon Redshift, servizio OpenSearch di Amazon e Amazon EMR.
Quali sono i casi d'uso dei flussi di dati in tempo reale?
Spostamento dati in tempo reale
Grazie allo streaming di dati da centinaia di migliaia di dispositivi e all'esecuzione in tempo reale di trasformazioni ETL su volumi elevati di dati continui e ad alta velocità, gli utenti possono analizzare i dati non appena vengono prodotti e quindi archiviarli in modo duraturo in un data lake, un data warehouse o un database per analisi successive.
Scopri come WalkMe affronta le sfide del sequenziamento mentre trasmette i dati in un data lake
Scopri come John Deere esegue lo streaming ETL nel proprio data lake in tempo reale
Analisi in tempo reale
Analizza i dati non appena vengono prodotti e consenti di prendere decisioni in tempo reale all'interno dell'organizzazione per capitalizzare le opportunità, migliorare l'esperienza dei clienti, prevenire guasti di rete o aggiornare le metriche aziendali critiche in tempo reale.
Log: acquisisci, elabora e analizza i log delle tue applicazioni in tempo reale.
Scopri come analizzare il comportamento degli utenti in tempo reale
Scopri come analizzare e visualizzare il traffico di rete VPC
Scopri come gestire i log centralizzati del server Microsoft Exchange
Scopri di più sull'analisi dei log »
Aggiornamenti in tempo reale: interagisci con consumatori, giocatori, operatori finanziari e altri utenti fornendo aggiornamenti in tempo reale alle metriche decisionali critiche, ai consigli sulle offerte e alle esperienze dei clienti.
Scopri come utilizzare l'analisi dei giochi in tempo reale per soddisfare al meglio i tuoi giocatori
Scopri come fornire notizie personalizzate e che riscuotono maggiore successo, in tempo reale
Clickstream: ottieni una visione in tempo reale delle prestazioni del contenuto Web e dell'interazione tra gli utenti e le applicazioni e i siti Web, inclusi il comportamento degli utenti, la quantità di tempo impiegato, i contenuti popolari e altro ancora.
IoT: connettiti a centinaia di migliaia di dispositivi IoT e raccogli, elabora e analizza i flussi di dati in tempo reale.
Elaborazione di flussi di eventi
Cattura e rispondi agli eventi man mano che si verificano in tempo reale su più applicazioni. I casi d'uso più comuni riguardano la comunicazione tra centinaia di microservizi disaccoppiati e il mantenimento di un sistema di registrazione tramite Change Data Capture (cattura dei cambiamenti apportati ai dati).
Comunicazione tra microservizi disaccoppiati: quando viene attivato un microservizio, un evento può essere inviato a un flusso di dati in tempo reale e altri microservizi possono "guardare" il flusso per vedere se si è verificato un evento che ha attivato l'azione richiesta.
Scopri come Lyft comunica tra centinaia di microservizi in tempo reale
Change Data Capture: tutte le modifiche apportate ai dati in diverse applicazioni e database possono essere trasmesse a un sistema di registrazione centrale in tempo reale.
Scopri come caricare i dati Change Data Capture dai database relazionali
Quali servizi di streaming sono disponibili su AWS?
AWS offre varie opzioni per lavorare con i flussi di dati in tempo reale.
- Flusso di dati Amazon Kinesis è un servizio dimensionabile e durevole per i flussi di dati in tempo reale che può acquisire gigabyte di dati al secondo in modo costante da centinaia di migliaia di origini dati.
- Amazon Kinesis Data Firehose acquisisce, trasforma e carica flussi di dati in datastore AWS per analisi quasi in tempo reale con gli strumenti di business intelligence esistenti, in pochi clic.
- Servizio gestito da Amazon per Apache Flink trasforma e analizza dati in streaming in tempo reale utilizzando Apache Flink, un motore e framework open source per l'elaborazione dei flussi di dati.
- Amazon Managed Streaming for Apache Kafka è un servizio completamente gestito che semplifica la creazione e l’esecuzione di applicazioni che si servono di Apache Kafka per l’elaborazione dello streaming dei dati.
Inizia a utilizzare i flussi di dati in tempo reale su AWS creando un account oggi stesso.
Fasi successive su AWS
Ottieni accesso istantaneo al Piano gratuito di AWS.