Caratteristiche di Amazon Athena

Perché Athena?

Amazon Athena è un servizio interattivo di esecuzione di query che semplifica l'analisi di dati in Amazon S3 con SQL standard. Athena è serverless, quindi non è necessaria alcuna infrastruttura da configurare o gestire e puoi scegliere di pagare in base alle query eseguite o all'elaborazione richiesta dalle tue query. Athena può essere utilizzato per elaborare log, eseguire analisi dei dati ed eseguire query interattive. Athena ridimensiona automaticamente le risorse, eseguendo anche query in parallelo, in modo da ottenere risultati rapidi anche in caso di set di dati di grandi dimensioni e query complesse.  

Page Topics

Vantaggi principali

Vantaggi principali

Amazon Athena è un servizio serverless, quindi non è presente alcuna infrastruttura da gestire. Non è più necessario preoccuparsi per configurazione, aggiornamenti software, errori o ricalibrazione delle risorse quando set di dati e utenti aumentano. Di tutto questo si occupa Athena automaticamente; sarà possibile concentrare la propria attenzione sui dati.

Per iniziare, accedi alla console di Athena, definisci uno schema utilizzando la procedura guidata oppure immettendo istruzioni DDL, quindi inizia a inoltrare query con l'editor di query integrato. Puoi anche utilizzare AWS Glue per scansionare automaticamente i dati, individuarne gli schemi e compilare il catalogo con definizioni di tabella e partizione nuove e modificate. I risultati vengono visualizzati nella console in pochi secondi e trascritti automaticamente in un percorso personalizzato in S3. Potrai anche scaricarli in locale. Con Athena non sono necessarie complesse attività ETL per preparare i dati per l'analisi. In questo modo è ancora più semplice analizzare set di dati di grandi dimensioni con competenze SQL.

Amazon Athena si basa su Trino e Presto, motori SQL open source, distribuiti e ottimizzati per l'analisi interattiva dei dati a bassa latenza. Sarà quindi possibile eseguire query su grandi set di dati in Amazon S3 utilizzando SQL ANSI, con supporto completo per join, funzioni finestra e array. Athena supporta un'ampia gamma di formati, tra cui CSV, JSON, ORC, Avro e Parquet. Con i connettori di origine dati federati di Athena, puoi eseguire query su archivi dati aggiuntivi e unire i dati ai dati archiviati in Simple Storage Service (Amazon S3). Puoi accedere ad Athena ed eseguire query dalla console Athena, API, CLI, SDK AWS e applicazioni di business intelligence e sviluppo SQL supportate tramite i driver JDBC e ODBC di Athena.

Amazon Athena offre due modelli di prezzo flessibili. Per impostazione predefinita, le query vengono fatturate in base ai dati scansionati per query in terabyte (TB). Ciò consente di inviare domande senza pianificare in anticipo l'elaborazione. Se preferisci pagare in base all'elaborazione utilizzata dalle tue query o desideri controllare la concorrenza e dare priorità ai carichi di lavoro, utilizza i prezzi basati sulla capacità disponibili con Capacità assegnata. Per una maggiore flessibilità, puoi utilizzare contemporaneamente la fatturazione per query e i prezzi basati sulla capacità nello stesso account.

Con Amazon Athena non sono più necessarie interventi manuali per gestire e ottimizzare i cluster e ottenere le migliori prestazioni. Il servizio è ottimizzato per ottenere prestazioni elevate con Amazon S3. Inoltre esegue automaticamente query in parallelo per ottenere risultati in pochi secondi anche su set di dati di grandi dimensioni.  

Amazon Athena è un servizio con disponibilità elevata che esegue query utilizzando risorse di calcolo che si trovano in diverse strutture e, in base alla disponibilità di queste, instrada automaticamente le query. Athena usa Amazon S3 come datastore, rendendo i dati altamente disponibili e durevoli. Amazon S3 fornisce un'infrastruttura durevole per memorizzare i dati più importanti ed è progettato per garantire una durabilità degli oggetti pari al 99,999999999%. I dati vengono archiviati in modo ridondante in più strutture e in più dispositivi all'interno di ogni struttura.

Amazon Athena consente di controllare l'accesso ai dati mediante le policy di AWS Identity and Access Management (IAM), le liste di controllo degli accessi (ACL) e le policy dei bucket Amazon S3. Con le policy di IAM, è possibile fornire agli utenti di IAM controllo granulare sui bucket S3. Controllando l'accesso ai dati in S3, è possibile limitare il numero di utenti che possono eseguire le query con Athena. Inoltre, Athena consente di eseguire query sui dati crittografati in Amazon S3 e di riscrivere i risultati, sempre crittografati, nel bucket S3. Supporta la crittografia sul lato server e lato client.

Amazon Athena si integra di default con AWS Glue. Grazie al catalogo dati di AWS Glue, è possibile creare un repository di metadati unificato su più servizi, scansionare automaticamente i dati per individuarne gli schemi e compilare il catalogo con definizioni di tabella e partizione nuove e modificate e conservare le varie versioni degli schemi. Inoltre, è possibile utilizzare le funzionalità ETL completamente gestite di AWS Glue per eseguire la trasformazione dei dati o convertirli in formato a colonne per ottimizzare le prestazioni delle query e ridurre i costi. Scopri di più su AWS Glue.

Athena fornisce connettori integrati a 30 datastore su AWS, on-premise e in altri cloud, compresi Amazon Redshift, Amazon DynamoDB, Google BigQuery, Google Cloud Storage, Azure Synapse, Azure Data Lake Storage, Redis, Snowflake e SAP Hana. Grazie ai connettori di origine dati di Athena, puoi generare informazioni dettagliate da più origini dati utilizzando la sintassi SQL di Athena senza la necessità di trasferire o trasformare i dati. I connettori dati vengono eseguiti come funzioni AWS Lambda e possono essere abilitati per l'accesso multi-account per scalare le query SQL a centinaia di utenti finali. Per un elenco delle origini supportate, consulta Connettori di origine dati disponibili. Per maggiori informazioni su come creare un connettore di origine dati personalizzato, consulta l'SDK del connettore di Athena.

È possibile richiamare i modelli SageMaker Machine Learning in una query Athena SQL per eseguire l'inferenza. La possibilità di utilizzare il modello ML nelle query SQL consente di completare attività complesse, quali il rilevamento delle anomalie, l'analisi della coorte dei clienti e le previsioni di vendita, con semplici operazioni come la scrittura di una query SQL. Athena consente di eseguire facilmente modelli ML distribuiti su Amazon SageMaker per chiunque abbia esperienza con SQL.