Amazon Data Firehose を選ぶべき理由

Amazon Data Firehose では、このサービスに取り込むデータ量に対して料金が発生します。セットアップ料金や前払いの義務はありません。Data Firehoseのオンデマンド利用には、インジェスト、フォーマット変換、VPC配信、ダイナミック・パーティショニングの4種類があります。追加のデータ転送料がかかる場合があります。

ソース取り込みとしての Direct PUT および KDS

Firehose ストリームの基本機能は取り込みと配信です。取り込みの料金は階層別であり、5 KB 単位で取り込まれた GB ごとに請求されます (3 KB のレコードは 5 KB、12 KB のレコードは 15 KB として請求されるなど)。オプション機能を使用しない限り、配信に Data Firehose の追加料金はかかりません。

MSK をソースとする取り込み

Firehose ストリームの基本機能は取り込みと配信です。インジェスト価格は段階制で、インジェストされた GB ごとに課金され、5KB 単位ではありません。料金は段階的に設定され、取り込まれたバイト数と配信されたバイト数の間の値が大きい方に基づいて GB 単位で請求されます。請求はデータ量に基づいており、レコードサイズの四捨五入はありません。

Vended Logs をソースとする取り込み

Vended Logs から生成されたレコードの場合、取り込みの料金は階層別であり、取り込まれた GB あたりの料金が請求されます (5 KB の増分なし)。

形式の変換 (オプション)

5 KB の増分で取り込まれる GB に基づく GB 単位の料金で、JSON から Apache Parquet または Apache ORC への形式の変換を有効にすることができます。

VPC 配信 (オプション)

配信先が Amazon VPC に存在する Firehose ストリームの場合、VPC 内の配信先に配信されたデータ量と、各 AZ で Firehose ストリームがアクティブな時間ごとに課金されます。1 時間に満たない時間は 1 時間として請求されます。

Amazon S3 配信の動的パーティショニング (オプション)

動的パーティショニングを有効にすると、レコードのキー (「customer_id」など) をパーティショニングすることでデータを継続的にグループ化し、パーティショニングキーでグループ化されたデータを対応する Amazon S3 プレフィックスに配信できます。ダイナミックパーティショニングでは、ダイナミックパーティショニングによって処理されたデータ量と、Amazon S3 に配信されたオブジェクトごとにお支払いいただきます。動的パーティショニングに JQ パーサーを使用する場合、JQ 解析の 1 時間あたりの料金が発生します。

CloudWatch ログの解凍 (オプション)

CloudWatch Logs から生成されたレコードの場合、解凍が有効になっていると、解凍料金は解凍された GB 単位で請求されます。

送信先としての Snowflake

Snowflake が送信先として設定されている Firehose ストリームの場合、送信先へ処理されたデータ量に対して請求されます。料金は、取り込んだ GB 単位で請求され、5 KB 単位の増分はありません。料金は、取り込まれたバイト数と配信されたバイト数のうちいずれか大きい方の値に基づいて請求されます。 

送信先としての Apache Iceberg テーブル

Apache Iceberg テーブルを送信先に指定して設定されている Firehose ストリームの場合、送信先に対して処理されたデータの量の対価がお客様に請求されます。料金は、取り込んだ GB 単位で請求され、5 KB 単位の増分はありません。Lambda におけるカスタム処理が原因で、配信前に処理されたデータのバイト数が取り込まれたバイト数よりも大きくなる場合は、追加のバイト数についても課金されます。追加のバイト数は、Direct PUT を含むすべての取り込みソースの送信先としての Apache Iceberg テーブルへのソースとしての Kinesis データストリームに示されるレートと同じレートで課金されます。

  • Direct PUT
    • 送信先としての Apache Iceberg テーブル
    • 送信先としての Snowflake
    • その他の送信先
  • 送信元としての Kinesis データストリーム
    • 送信先としての Apache Iceberg テーブル
    • 送信先としての Snowflake
    • その他の送信先
  • Vended Logs をソースとする
    • 送信先としての Apache Iceberg テーブル
    • その他の送信先
  • ソースとしての MSK
    • 送信先としての Apache Iceberg テーブル
    • その他の送信先

料金の例

Direct PUT および KDS (ソースとして) の取り込み料金

3 KB のレコードサイズを 5 KB の倍数の取り込みに切り上げる = 5 KB

最初の 500 TB/月の料金 = 0.029 USD/GB

取り込みで請求される GB = (100 レコード/秒 * 5 KB/レコード) / 1,048,576 KB/GB * 30 日間/月 * 86,400 秒間/日 = 1235.96 GB

1 か月あたりの取り込み料金 = 1,235.96 GB * 0.029 USD/GB = 35.84 USD

ソースとしての MSK の取り込み料金

2 KB のレコードサイズ (5 KB の増分なし)

最初の 500 TB/月の料金 = 0.055 USD/GB

取り込みデータに対して請求される GB (配信データと同じデータ量を想定) = (100 レコード/秒 x 2 KB/レコード)/1,048,576 KB/GB * 30 日/月 * 86,400 秒/日 = 494.38 GB

月間データボリューム料金 = 494.38 GB * 0.055 USD/GB = 27.19 USD

ソースとしての Vended Logs の取り込み料金

0.5 KB のレコードサイズ (500 バイト) = 0.5 KB (5 KB の増分はなし)

最初の 500 TB/月の料金 = 0.13 USD/GB

取り込みで請求される GB = (100 レコード/秒 × 0.5 KB/レコード) / 1,048,576 KB/GB × 30 日/月 × 86,400 秒/日 = 123.59 GB

月間の取り込み料金 = 123.59 GB × 0.13 USD/GB = 16.06 USD

送信先としての Snowflake の料金

0.5 KB のレコードサイズ (500 バイト) = 0.5 KB (5 KB の増分はなし)

Snowflake に送信される GB あたりの料金 = 1 GB あたり 0.071 USD

取り込みで請求される GB = (100 レコード/秒 × 0.5 KB/レコード) / 1,048,576 KB/GB × 30 日/月 × 86,400 秒/日 = 123.59 GB

月間の取り込み料金 = 123.59 GB × 0.13 USD/GB = 8.77 USD

Apache Iceberg テーブルを送信先とする場合の料金

0.5 KB のレコードサイズ (500 バイト) = 0.5 KB (5 KB の増分はなし)

ソースとしての Kinesis データストリームから Apache Iceberg テーブルに配信されるデータ 1 GB あたりの料金 = 1 GB あたり 0.045 USD

取り込みで請求される GB = (100 レコード/秒 × 0.5 KB/レコード) / 1,048,576 KB/GB × 30 日/月 × 86,400 秒/日 = 123.59 GB

月間の取り込み料金 = 123.59 GB × 0.045 USD/GB = 5.56 USD

形式の変換の料金: JSON から Parquet または ORC への変換 (オプション)

0.5 KB のレコードサイズ (500 バイト) = 0.5 KB (5 KB の増分はなし)

最初の 500 TB/月の料金 = 0.13 USD/GB

取り込みで請求される GB = (100 レコード/秒 × 0.5 KB/レコード) / 1,048,576 KB/GB × 30 日/月 × 86,400 秒/日 = 123.59 GB

月間の取り込み料金 = 123.59 GB × 0.13 USD/GB = 16.06 USD

データ形式の変換は、データインジェストにオプションのアドオンで、コストの計算には取り込みで請求された GB を使用します。 

取り込み GB あたりの料金変換= 0.018 USD

月間の形式変換料金 = 1,235.96 GB * 0.018 USD/GB 変換 = 22.25 USD

VPC 配信の料金 (オプション)

VPC への配信はデータインジェストのオプションのアドオンで、VPC 内の宛先に配信された GB を使用してコストを計算します。

VPC でデスティネーションに配信される GB あたりの料金 = 0.01 USD

VPC 配信する AZ 時間あたりの料金 = 0.01 USD

月間の VPC 処理料金 = 1,235.96 GB * 0.01 USD/GB 処理 = 12.35 USD

月間の VPC 時間料金 = 24 時間 * 30 日/月 * 3AZ = 2,160 時間 * 0.01 USD/時間 = 21.60 USD 月間 VPC 料金合計 = 33.95 USD

動的パーティショニングの料金 (オプション)

動的パーティショニングは、データインジェストに対するオプションのアドオンで、動的パーティショニングで処理された GB、S3 に配信されたオブジェクト数、オプションで JQ の処理時間を使用してコストを計算します。この例では、Firehose ストリームのバッファヒント設定の結果として、64 MB のオブジェクトが配信されると想定しています。

Firehose ストリームでオプション機能 (Lambda を使用したデータ変換、フォーマット変換、圧縮など) を使用する場合、動的パーティショニングによって処理されるデータ量は、ソースから取り込まれたデータ量または宛先に配信されるデータ量と異なる場合があります。動的パーティショニングの前後に実行されるこれらの追加のデータ処理ステップが違いを生む可能性があります。

動的パーティショニングによる処理量 1 GB あたりの料金 = 0.020 USD
配信された 1,000 S3 オブジェクトあたりの料金 0.005 USD = 0.005 USD
JQ 処理時間あたりの料金 = 0.07 USD

動的パーティショニングによって処理される月次ギガバイト = (3 KB × 100 レコード/秒)/1,048,576 KB/GB * 86,400 秒/日 * 30 日/月 = 741.58 GB

動的パーティショニングによって処理された GB の月額料金 = 741.58 GB 動的パーティショニングで処理した GB あたり 0.02 USD = 14.83 USD

配信されたオブジェクト数 = 741.58 GB * 1024 MB/GB / 64MB オブジェクトサイズ = 11,866 オブジェクト

S3 に配信されたオブジェクトの月額料金 = 11,866 オブジェクト * 0.005 USD/1000 オブジェクト = 0.06 USD

JQ の月額料金 (有効な場合) = JQ 消費時間 70 時間/月 * 0.07 USD/JQ 処理時間 = 4.90 USD

CloudWatch Logs の解凍

CloudWatch Logs は gzip 圧縮形式でデータを送信します。Data Firehose 解凍機能はデータを解凍し、解凍されたデータの GB ごとに課金されます。

月間使用量 = 10 TB の CloudWatch Logs データを解凍しました

解凍した 1 GB あたりの価格 = IAD で 1 GB あたり 0.00325 USD

毎月の解凍料金 = 10240 GB * 0.00325 USD/GB = 33.28 USD
 

サービスレベルアグリーメント

Amazon Data Firehose サービスレベルアグリーメントの詳細については、よくある質問にアクセスしてください。