Archivia dati tabulari su larga scala in S3
Le tabelle Amazon S3 offrono il primo archivio di oggetti cloud con supporto Apache Iceberg integrato e semplificano l'archiviazione di dati tabulari su larga scala. L'ottimizzazione continua delle tabelle scansiona e riscrive automaticamente i relativi dati in background, ottenendo prestazioni delle query fino a 3 volte più veloci rispetto alle tabelle Iceberg non gestite. Queste ottimizzazioni delle prestazioni continueranno a migliorare nel tempo. Inoltre, le tabelle S3 includono ottimizzazioni specifiche per i carichi di lavoro Iceberg che forniscono transazioni al secondo fino a 10 volte superiori rispetto alle tabelle Iceberg archiviate in bucket S3 generici. Per maggiori dettagli sui miglioramenti delle prestazioni di query relative alle tabelle S3, consulta il blog.
Con il supporto delle tabelle S3 per lo standard Apache Iceberg, i dati tabulari possono essere facilmente sottoposti a query con i più diffusi motori di query di AWS e di terze parti, tra cui Amazon Athena, Redshift, EMR e Apache Spark. Usa le tabelle S3 per archiviare dati tabulari come transazioni di acquisto giornaliere, dati dei sensori di streaming o impressioni degli annunci come una tabella Iceberg in S3 e ottimizzare prestazioni e costi man mano che i dati si evolvono utilizzando la manutenzione automatica della tabella. Leggi il blog per ulteriori informazioni.
Vantaggi
Come funziona
Le tabelle S3 forniscono uno spazio S3 dedicato per l'archiviazione di dati strutturati nel formato Apache Parquet. All'interno di un bucket di tabelle, puoi creare tabelle come risorse di prima classe direttamente in S3. Queste tabelle possono essere protette con autorizzazioni a livello di tabella definite in policy basate sull'identità o sulle risorse e sono accessibili da applicazioni o strumenti che supportano lo standard Apache Iceberg. Quando crei una tabella nel tuo bucket di tabelle, i dati sottostanti in S3 vengono archiviati come dati Parquet. Quindi, S3 mantiene i metadati necessari per fare in modo che i dati Parquet possano essere sottoposti a query da parte delle tue applicazioni. I bucket di tabelle includono una libreria client utilizzata dai motori di query per navigare e aggiornare i metadati Iceberg delle tabelle nel bucket di tabelle. Questa libreria, insieme alle API S3 aggiornate per le operazioni sulle tabelle, consente a più client di leggere e scrivere dati nelle tabelle in modo sicuro. Nel tempo, S3 ottimizza automaticamente i dati Parquet sottostanti riscrivendo o “compattando” gli oggetti. La compattazione ottimizza i dati su S3 per migliorare le prestazioni delle query e ridurre al minimo i costi. Consulta la guida per l'utente per ulteriori informazioni
Clienti
-
Genesys
Genesys è un leader globale nel cloud nell'Experience Orchestration basata sull'intelligenza artificiale. Grazie a funzionalità avanzate di gestione dell'intelligenza artificiale, del digitale e del coinvolgimento della forza lavoro, Genesys aiuta più di 8.000 organizzazioni in oltre 100 paesi a fornire esperienze personalizzate ed empatiche a clienti e dipendenti, beneficiando al contempo di una maggiore agilità e di risultati aziendali.
-
SnapLogic
SnapLogic è un pioniere nell'integrazione basata sull'intelligenza artificiale. La piattaforma SnapLogic per l'integrazione generativa accelera la trasformazione digitale in tutta l'azienda per progettare, implementare e gestire agenti e integrazioni di intelligenza artificiale che automatizzano le attività, prendono decisioni in tempo reale e si integrano facilmente nei flussi di lavoro esistenti.
-
Zus Health
Zus è una piattaforma condivisa di dati sanitari progettata per accelerare l'interoperabilità di tali dati fornendo informazioni sui pazienti facili da usare tramite API, componenti integrati e integrazioni dirette EHR.