Amazon Bedrock 요금

요금 개요

Amazon Bedrock은 단일 API를 통해 고성능 파운데이션 모델(FM) 중에서 선택할 수 있고, 보안, 프라이버시, 책임 있는 AI 원칙을 적용한 생성형 AI 애플리케이션을 구축하는 데 필요한 다양한 기능 세트를 제공하는 완전관리형 서비스입니다.

Amazon Bedrock을 사용하면 모델 추론 및 사용자 지정에 대한 비용이 청구됩니다. 추론용으로 선택할 수 있는 요금제에는 다음 두 가지가 있습니다. 1. 온디맨드 및 배치: 이 모드를 사용하면 기간을 기준으로 약정하지 않고도 FM을 사용한 만큼만 지불하는 방식으로 사용할 수 있습니다. 2. 프로비저닝된 처리량: 이 모드를 사용하면 기간 기준 약정의 대가로 애플리케이션의 성능 요구 사항을 충족하기에 충분한 처리량을 프로비저닝할 수 있습니다.

요금 모델

온디맨드 및 배치

온디맨드 모드에서는 기간 약정 없이 사용한 만큼만 비용을 지불하면 됩니다. 텍스트 생성 모델의 경우 처리된 모든 입력 토큰과 생성된 모든 출력 토큰에 대해 요금이 부과됩니다. 임베딩 모델의 경우 처리된 모든 입력 토큰에 대해 요금이 부과됩니다. 토큰은 몇몇 문자로 구성되며 모델이 사용자 입력과 프롬프트를 이해하기 위해 학습하는 기본 텍스트 단위를 나타냅니다. 이미지 생성 모델의 경우 생성된 모든 이미지에 대해 요금이 부과됩니다.

교차 리전 추론: 온디맨드 모드는 일부 모델의 교차 리전 추론도 지원합니다. 이를 통해 개발자는 여러 AWS 리전에서 컴퓨팅을 활용하여 트래픽 버스트를 원활하게 관리하고 처리량 한도와 복원력을 높일 수 있습니다. 교차 리전 추론 사용에 따른 추가 요금은 없으며 요금은 요청한 리전(소스 리전)을 기준으로 계산됩니다.

배치 모드에서는 프롬프트 세트를 단일 입력 파일로 제공하고 응답을 단일 출력 파일로 수신하여 대규모 예측을 동시에 수행할 수 있습니다. 응답은 처리된 후 Amazon S3 버킷에 저장되므로 나중에 액세스할 수 있습니다. Amazon Bedrock은 Anthropic, Meta, Mistral AI, Amazon 같은 주요 AI 제공업체가 제공하는 배치 추론용 일부 파운데이션 모델(FM)을 온디맨드 추론 요금 대비 50% 저렴한 가격으로 제공합니다. 여기의 모델 목록을 참조하세요.

지연 시간 최적화(공개 평가판)

Amazon Bedrock의 기본 모델에 대한 지연 시간 최적화 추론을 통해 모델의 응답 시간을 단축하고 생성형 AI 애플리케이션의 응답성을 개선할 수 있습니다. Anthropic의 Claude 3.5 Haiku 모델과 Meta의 Llama 3.1 405B 및 70B 모델에는 지연 시간 최적화 추론을 사용할 수 있습니다. Anthropic에서 검증한 바와 같이 Amazon Bedrock에서 지연 시간 최적화 추론을 통해 Claude 3.5 Haiku는 다른 어느 곳보다 AWS에서 더 빠르게 실행됩니다. 또한 Llama 3.1 405B 및 70B는 Bedrock의 지연 시간 최적화 추론을 통해 다른 주요 클라우드 공급자보다 AWS에서 더 빠르게 실행됩니다. 여기에서 자세히 알아보세요.

프로비저닝된 처리량

프로비저닝된 처리량 모드에서는 특정 기본 모델이나 사용자 지정 모델의 모델 단위를 구매할 수 있습니다. 프로비저닝된 처리량 모드는 주로 보장된 처리량이 필요한 대규모의 일관된 추론 워크로드를 위해 설계되었습니다. 사용자 지정 모델은 프로비저닝된 처리량을 사용해야만 액세스할 수 있습니다. 모델 단위는 분당 처리되는 입력 또는 출력 토큰의 최대 수로 측정되는 특정 처리량을 제공합니다. 프로비저닝된 처리량 요금제에서는 시간 단위로 요금이 청구되므로 1개월 또는 6개월 약정 기간 중에서 유연하게 선택할 수 있습니다.

사용자 지정 모델 가져오기

사용자 지정 모델 가져오기를 사용하면 이전에 투자한 사용자 지정 모델을 Amazon Bedrock 내에서 활용하고 Bedrock의 기존 호스팅된 파운데이션 모델과 동일한 완전관리형 방식으로 사용할 수 있습니다. 지원되는 모델 아키텍처의 사용자 지정 가중치를 가져오고 온디맨드 모드를 사용하여 사용자 지정 모델을 제공할 수 있습니다. 사용자 지정 모델을 Bedrock으로 가져오는 데는 비용이 들지 않습니다. 모델을 가져오면 컨트롤 플레인 작업을 수행할 필요 없이 온디맨드로 모델에 액세스할 수 있습니다. 추론 볼륨을 처리하는 데 필요한 사용자 지정 모델의 사본 수와 각 모델 사본이 활성화된 기간을 기준으로 모델 추론 비용만 청구되며, 요금은 5분 단위로 청구됩니다. 모델 사본은 추론 요청을 처리할 준비가 된 가져온 모델의 단일 인스턴스입니다. 모델 사본의 분당 요금은 아키텍처, 컨텍스트 길이, AWS 리전, 컴퓨팅 유닛 버전(하드웨어 세대)과 같은 요소에 따라 달라지며 모델 사본 크기에 따라 계층화됩니다.

Marketplace 모델

Amazon Bedrock Marketplace를 통해 Bedrock에서 100개 이상의 인기 파운데이션 모델, 새로운 파운데이션 모델 및 전문 파운데이션 모델을 검색, 테스트 및 사용할 수 있습니다. Amazon Bedrock Marketplace 모델은 원하는 인스턴스 수와 인스턴스 유형을 선택하고 워크로드 수요에 맞게 자동 규모 조정 정책을 구성할 수 있는 엔드포인트에 배포됩니다. 독점 모델의 경우 모델 공급업체가 설정한 소프트웨어 요금(시간당, 초당 단위 또는 요청당 청구 가능)과 선택한 인스턴스에 따른 인프라 요금이 부과됩니다. 이러한 요금은 공급업체 모델을 구독하기 전에 확인할 수 있으며 AWS Marketplace의 모델 목록에서도 확인할 수 있습니다. 공개적으로 사용 가능한 모델의 경우 선택한 인스턴스에 따른 인프라 요금만 청구됩니다. 여기에서 자세히 알아보세요.

사용자 지정 및 최적화

모델 사용자 지정

Amazon Bedrock을 사용하면 데이터로 FM을 사용자 지정하여 특정 작업 및 비즈니스 상황에 맞는 맞춤형 응답을 제공할 수 있습니다. 레이블링된 데이터로 모델을 미세 조정하거나 레이블링되지 않은 데이터를 사용한 지속적인 사전 훈련에서 모델을 미세 조정할 수 있습니다. 텍스트 생성 모델을 사용자 지정하는 경우 모델에서 처리한 총 토큰 수(훈련 데이터 코퍼스의 토큰 수에 에포크 수를 곱한 값) 및 모델당 월별 모델 스토리지 요금이 부과됩니다. 에포크는 미세 조정 또는 지속적인 사전 훈련 중에 훈련 데이터세트를 한 번 완전히 통과하는 것을 말합니다. 사용자 지정 모델을 사용한 추론은 프로비저닝된 처리량 플랜에 따라 요금이 부과되며 프로비저닝된 처리량을 구매해야 합니다. 사용자 지정 모델에 대한 추론을 위해 약정 기간 없이 하나의 모델 단위를 사용할 수 있습니다. 사용자 지정 모델 추론에서 첫 번째 모델 단위에 사용한 시간에 대해 요금이 부과됩니다. 한 모델 단위 이상으로 처리량을 늘리려면 1개월 또는 6개월 약정 기간을 구매해야 합니다.

모델 증류

Amazon Bedrock Model Distillation의 경우 사용한 만큼만 비용을 지불하면 됩니다. 합성 데이터 생성은 선택한 교사 모델의 온디맨드 요금으로 청구됩니다. 학생 모델의 미세 조정에는 모델 사용자 지정 요금이 부과됩니다. 증류된 모델은 사용자 지정 모델이므로 사용자 지정 모델을 사용한 추론은 프로비저닝된 처리량 요금제에 따라 요금이 부과되며 고객은 프로비저닝된 처리량을 구매해야 합니다.

프롬프트 캐싱

Amazon Bedrock의 프롬프트 캐싱을 사용하면 API 직접 호출 전반에서 반복되는 컨텍스트를 캐시하여 비용과 응답 지연 시간을 줄일 수 있습니다. 프롬프트에는 흔히 공통적인 컨텍스트나 접두사(예: 연속되는 긴 대화, 다양한 예 및 모델 동작을 개선하는 세부 지침)가 포함됩니다. 기존 Amazon Bedrock API를 사용하여 AWS 계정별 캐시에 5분 동안 캐시하려는 프롬프트 접두사를 지정할 수 있습니다. 이 시간 동안 접두사가 일치하는 요청은 캐시된 토큰에서 최대 90% 할인을 받고 지연 시간이 최대 85% 개선됩니다. 요금 및 성능 개선은 모델 및 프롬프트 길이에 따라 다르지만 캐시는 항상 AWS 계정으로 분리됩니다.

도구

가드레일

Amazon Bedrock 가드레일을 사용하면 생성형 AI 애플리케이션을 위한 사용자 지정 보호 및 책임 있는 AI 정책을 구현할 수 있습니다. FM이 제공하는 기본 보호 기능 외에 사용자 지정 가능한 추가 안전 보호 기능도 제공합니다. 주요 클라우드 공급업체가 제공하는 유일한 책임 있는 AI 기능으로, 고객이 단일 솔루션에서 생성형 AI 애플리케이션에 대한 안전성, 개인정보 보호 및 진실성 보장을 구축하고 사용자 지정할 수 있도록 지원하며, Amazon Bedrock의 모든 FM 및 미세 조정된 모델과 함께 작동합니다. Bedrock 가드레일을 Amazon Bedrock 에이전트 및 Amazon Bedrock 기술 자료와 통합하여 책임 있는 AI 정책에 부합하는 생성형 AI 애플리케이션을 구축할 수도 있습니다. 또한 Bedrock 외부의 사용자 지정 또는 서드 파티 FM에서 생성된 사용자 입력 및 모델 응답을 평가하는 데 도움이 되는 ApplyGuardrail API를 제공합니다.

Knowledge Bases 및 Data Automation

Amazon Bedrock Knowledge Bases는 고객이 자체 데이터 소스의 컨텍스트 정보를 통합하여 매우 정확하고 지연 시간이 짧고 안전한 사용자 지정 생성형 AI 애플리케이션을 생성할 수 있도록 하는 완전 관리형 검색 증강 생성(RAG) 워크플로입니다. S3, Confluence, Salesforce, SharePoint 등 다양한 데이터 소스를 평가판으로 지원합니다. 또한 스트리밍 데이터를 위한 문서 수집 기능도 제공합니다. Bedrock Knowledge Base는 비정형 데이터를 임베딩으로 변환하고 벡터 데이터베이스에 저장하며 다양한 데이터 저장소에서 검색할 수 있도록 합니다. 또한 관리형 검색을 위해 Kendra와 통합되며 SQL에 대한 자연어 정형 데이터 검색을 지원합니다.

Amazon Bedrock Data Automation은 지능적인 문서 처리, 동영상 분석, RAG 등의 사용 사례에 맞게 비정형 멀티모달 콘텐츠를 정형 데이터 형식으로 변환합니다. Bedrock Data Automation은 동영상의 장면별 설명, 오디오 대본 또는 자동화된 문서 분석과 같이 양식에 따라 미리 정의된 기본값을 사용하여 표준 출력 콘텐츠를 생성할 수 있습니다. 고객은 기존 데이터베이스 또는 데이터 웨어하우스에 쉽게 로드할 수 있는 자체 데이터 스키마를 기반으로 블루프린트에서 출력 요구 사항을 지정하여 사용자 지정 출력을 추가로 생성할 수 있습니다. Knowledge Bases와의 통합을 통해 Bedrock Data Automation은 RAG 애플리케이션의 콘텐츠를 분석하는 데도 사용될 수 있으며, 이미지와 텍스트 모두에 들어 있는 정보를 포함함으로써 결과의 정확성과 관련성을 개선할 수 있습니다.

에이전트

Amazon Bedrock Agents는 애플리케이션 내에서 자율 에이전트를 빌드하고 구성하는 기능을 제공합니다. 이러한 에이전트는 회사의 데이터 소스에 안전하게 연결하고 올바른 정보로 사용자 요청을 보강하여 정확한 응답을 생성합니다. 몇 단계만 거치면 단일 및 다중 에이전트 애플리케이션을 생성할 수 있으므로 생성형 AI 애플리케이션을 빌드하는 데 걸리는 시간을 단축할 수 있습니다. 이러한 에이전트는 코드를 동적으로 생성 및 실행하는 코드 해석과 제어 반환을 지원합니다. 이를 통해 작업 스키마를 정의하고 에이전트가 작업을 간접 호출할 때마다 제어권을 다시 가져올 수 있습니다. 또한 Amazon Bedrock 에이전트는 상호 작용 전반에 걸쳐 메모리를 유지할 수 있어 보다 개인화되고 원활한 사용자 경험을 제공합니다.

Flows

Amazon Bedrock Flows는 생성형 AI 애플리케이션을 위한 Bedrock의 워크플로 작성 및 실행 기능입니다. 이 기능은 직관적인 시각적 빌더와 API 세트를 통해 사용자 정의 생성형 AI 워크플로의 생성, 테스트, 배포를 가속화합니다. 이를 통해 최신 파운데이션 모델, 프롬프트, 에이전트, 기술 자료, 가드레일, AWS 서비스(예: Amazon Lex, AWS Lambda, Amazon S3)를 비즈니스 로직과 함께 원활하게 연결하여 생성형 AI 워크플로를 구축할 수 있습니다. 자체 인프라를 구축할 필요 없이 시각적 인터페이스나 API를 통해 워크플로를 간편하게 테스트하고 버전을 지정하고 안전한 서버리스 환경에서 실행할 수 있습니다.

평가

모델 평가: Amazon Bedrock 모델 평가를 사용하면 프롬프트 또는 응답 수에 대한 최소 볼륨 약정 없이 사용한 만큼만 요금이 부과됩니다. 자동 프로그래밍 방식 평가의 경우 평가에서 선택한 모델의 추론에 대한 비용만 지불하면 됩니다. 자동으로 생성된 알고리즘 점수는 추가 비용 없이 제공됩니다. 자동(Model/LLM-as-a-Judge) 평가를 위한 공개 평가판 기간에는 선택한 생성기 모델과 평가자 모델의 추론에 대해서만 비용을 지불하면 됩니다. LLM-as-a-Judger 모델 평가 작업에서 내장된 지표는 각 지표에 고유한 시스템 심사 프롬프트 템플릿과 토큰 사용의 일부로 청구되는 사용 가능한 심사자 모델을 사용합니다. 심사자 프롬프트는 투명성을 위해 공개 AWS 설명서에서 사용할 수 있습니다. 자체 작업 팀을 데려오는 인간 기반 평가의 경우 평가의 모델 추론에 대한 비용이 청구되며, 완료된 인간 태스크당 0.21 USD의 요금이 부과됩니다. 인간 태스크는 인간 작업자가 인간 평가 사용자 인터페이스에서 단일 프롬프트 및 이와 관련된 추론 응답에 대한 평가를 제출하는 경우로 정의됩니다. 평가 작업의 모델 수가 한 개든 두 개든 상관없이 요금은 동일하며, 포함하는 평가 지표 및 평가 방법의 수와 관계없이 동일합니다. 인간 태스크에 대한 요금은 AWS 청구서의 Amazon SageMaker 섹션 아래에 표시되며 모든 AWS 리전에서 동일합니다. 인력은 고객이 공급하므로 인력에 대한 별도의 비용은 없습니다. AWS 관리형 평가의 경우 AWS의 전문가 평가 팀과 협력하는 동안 비공개 계약을 통해 평가 요구 사항에 맞게 요금이 사용자 지정됩니다.

Amazon Bedrock Knowledge Bases 평가(RAG 평가): Amazon Bedrock Knowledge Bases 평가(RAG 평가)에서는 프롬프트 또는 응답 수에 대한 최소 볼륨 약정 없이 사용한 만큼만 비용을 지불합니다. 공개 평가판 기간에는 선택한 생성기 모델 및 평가자 모델(평가 작업에서는 LLM-as-a-Judge 사용)의 추론에 대해서만 비용을 지불하고 Amazon Bedrock Knowledge Bases 요금에 따라 평가 작업에서 기술 자료를 사용하여 발생하는 모든 비용만 지불하면 됩니다. Knowledge Bases 평가(RAG 평가) 작업에서 내장된 지표는 각 지표에 고유한 시스템 심사 프롬프트 템플릿과 토큰 사용의 일부로 청구되는 사용 가능한 심사자 모델을 사용합니다. 심사자 프롬프트는 투명성을 위해 공개 AWS 설명서에서 사용할 수 있습니다. 일부 지표에는 각 지표와 관련된 비용에 영향을 주는 입력 프롬프트 외에도 Knowledge Base 또는 Ground Truth 답변에서 검색한 컨텍스트에 대한 심사자 모델 추론을 수행하는 것이 포함됩니다. 각 지표에 대한 자세한 내용은 평가용 공개 AWS 설명서에서 확인할 수 있습니다.

요금 세부 정보

요금은 전달 방식, 공급자, 모델에 따라 다릅니다. 자세한 요금을 보려면 모델 공급자를 선택하세요.

Amazon Bedrock은 Anthropic, Meta, Mistral AI, Amazon 같은 주요 AI 제공업체가 제공하는 엄선된 배치 추론용 파운데이션 모델(FM)을 온디맨드 추론 요금 대비 50% 저렴한 가격으로 제공합니다. 여기의 모델 목록을 참조하세요.

AI21 Labs

AI21 Labs

온디맨드 요금

AI21 Labs 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금
Jamba 1.5 Large	0.002 USD	0.008 USD
Jamba 1.5 Mini	0.0002 USD	0.0004 USD
Jurassic-2 Mid	0.0125 USD	0.0125 USD
Jurassic-2 Ultra	0.0188 USD	0.0188 USD
Jamba-Instruct	0.0005 USD	0.0007 USD

Amazon
- Amazon Nova
- Amazon Titan
- 기타 Amazon
- Amazon Nova
- Amazon Nova
  
  모델 이해를 위한 요금
  
  크리에이티브 콘텐츠 생성 모델 요금
- Amazon Titan
- Amazon Titan
- 기타 Amazon
Anthropic

Anthropic

온디맨드 및 배치 요금

리전: 미국 동부(버지니아 북부) 및 미국 서부(오레곤)

Anthropic 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금	입력 토큰 1,000개당 요금(배치)	출력 토큰 1,000개당 요금(배치)	입력 토큰 1,000개당 요금(캐시 쓰기)	입력 토큰 1,000개당 요금(캐시 읽기)
Claude 3.5 Sonnet**	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD	0.00375 USD	0.0003 USD
Claude 3.5 Haiku	0.0008 USD	0.004 USD	0.0005 USD	0.0025 USD	0.001 USD	0.00008 USD
Claude 3 Opus*	0.015 USD	0.075 USD	0.0075 USD	0.0375 USD	해당 사항 없음	해당 사항 없음
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD	해당 사항 없음	해당 사항 없음
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD	해당 사항 없음	해당 사항 없음
Claude 2.1	0.008 USD	0.024 USD	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
Claude 2.0	0.008 USD	0.024 USD	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
Claude Instant	0.0008 USD	0.0024 USD	해당 사항 없음	해당 사항 없음	해당 사항 없음	해당 사항 없음
*Claude 3 Opus는 현재 미국 서부(오리건) 리전에서 사용할 수 있음
**Claude 3.5 Sonnet 요금은 Claude 3.5 Sonnet의 각 버전(v1 및 v2)에 적용됨 - Claude 3.5 Sonnet v2는 현재 미국 서부(오리건) 리전에서 사용할 수 있음

Anthropic 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금	입력 토큰 1,000개당 요금(배치)	출력 토큰 1,000개당 요금(배치)	입력 토큰 1,000개당 요금(캐시 쓰기)	입력 토큰 1,000개당 요금(캐시 읽기)
Claude 3.5 Sonnet**	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD	0.00375 USD	0.0003 USD
Claude 3.5 Haiku	0.001 USD	0.005 USD	0.0005 USD	0.0025 USD	0.001 USD	0.00008 USD
Claude 3 Opus*	0.015 USD	0.075 USD	0.0075 USD	0.0375 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 2.1	0.008 USD	0.024 USD	해당 사항 없음	해당 사항 없음
Claude 2.0	0.008 USD	0.024 USD	해당 사항 없음	해당 사항 없음
Claude Instant	0.0008 USD	0.0024 USD	해당 사항 없음	해당 사항 없음
*Claude 3 Opus는 현재 미국 서부(오리건) 리전에서 사용할 수 있음
**Claude 3.5 Sonnet 요금은 Claude 3.5 Sonnet의 각 버전(v1 및 v2)에 적용됨 - Claude 3.5 Sonnet v2는 현재 미국 서부(오리건) 리전에서 사용할 수 있음

리전: 유럽(런던)

Anthropic 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금	입력 토큰 1,000개당 요금(배치)	출력 토큰 1,000개당 요금(배치)
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD

리전: 유럽(취리히)

Anthropic 모델

입력 토큰 1,000개당 요금

출력 토큰 1,000개당 요금

입력 토큰 1,000개당 요금(배치)

출력 토큰 1,000개당 요금(배치)

Claude 3.5 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

리전: 남아메리카(상파울루)

Anthropic 모델

입력 토큰 1,000개당 요금

출력 토큰 1,000개당 요금

입력 토큰 1,000개당 요금(배치)

출력 토큰 1,000개당 요금(배치)

Claude 3 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

리전: 캐나다(중부)

Anthropic 모델

입력 토큰 1,000개당 요금

출력 토큰 1,000개당 요금

입력 토큰 1,000개당 요금(배치)

출력 토큰 1,000개당 요금(배치)

Claude 3 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

리전: 아시아 태평양(뭄바이)

Anthropic 모델

입력 토큰 1,000개당 요금

출력 토큰 1,000개당 요금

입력 토큰 1,000개당 요금(배치)

출력 토큰 1,000개당 요금(배치)

Claude 3 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

리전: 아시아 태평양(시드니)

Anthropic 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금	입력 토큰 1,000개당 요금(배치)	출력 토큰 1,000개당 요금(배치)
Claude 3.5 Sonnet v2	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD

리전: 아시아 태평양(도쿄)

Anthropic 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금	입력 토큰 1,000개당 요금(배치)	출력 토큰 1,000개당 요금(배치)
Claude Instant	0.0008 USD	0.0024 USD	해당 사항 없음	해당 사항 없음
Claude 2.0/2.1	0.008 USD	0.024 USD	해당 사항 없음	해당 사항 없음
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD
Claude 3.5 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD

리전: 아시아 태평양(싱가포르)

Anthropic 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금	입력 토큰 1,000개당 요금(배치)	출력 토큰 1,000개당 요금(배치)
Claude Instant	0.0008 USD	0.0024 USD	0.0004 USD	0.0012 USD
Claude 2.0/2.1	0.008 USD	0.024 USD	0.004 USD	0.012 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD
Claude 3.5 Sonnet	0.003 USD	0.015 USD	해당 사항 없음	해당 사항 없음

리전: 유럽(파리)

Anthropic 모델

입력 토큰 1,000개당 요금

출력 토큰 1,000개당 요금

입력 토큰 1,000개당 요금(배치)

출력 토큰 1,000개당 요금(배치)

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

Claude 3 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

리전: 유럽(프랑크푸르트)

Anthropic 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금	입력 토큰 1,000개당 요금(배치)	출력 토큰 1,000개당 요금(배치)
Claude Instant	0.0008 USD	0.0024 USD	해당 사항 없음	해당 사항 없음
Claude 2.0/2.1	0.008 USD	0.024 USD	해당 사항 없음	해당 사항 없음
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3.5 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD

리전: 아시아 태평양(서울)

Anthropic 모델

입력 토큰 1,000개당 요금

출력 토큰 1,000개당 요금

입력 토큰 1,000개당 요금(배치)

출력 토큰 1,000개당 요금(배치)

Claude 3.5 Sonnet

0.003 USD

0.015 USD

해당 사항 없음

Claude 3 Haiku

0.00025 USD

0.00125 USD

해당 사항 없음

리전: 미국 동부(오하이오)

Anthropic 모델

입력 토큰 1,000개당 요금

출력 토큰 1,000개당 요금

입력 토큰 1,000개당 요금(배치)

출력 토큰 1,000개당 요금(배치)

Claude 3.5 Sonnet

0.003 USD

0.015 USD

해당 사항 없음

Claude 3 Haiku

0.00025 USD

0.00125 USD

해당 사항 없음

리전: AWS GovCloud(미국 서부) 및 AWS GovCloud(미국 동부)

Anthropic 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금
Claude 3.5 Sonnet	0.0036 USD	0.018 USD
Claude 3 Haiku	0.0003 USD	0.0015 USD

지연 시간 최적화 추론

리전: 미국 동부(오하이오)

	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금
Claude 3.5 Haiku	0.001 USD	0.005 USD

리전: 미국 동부(버지니아 북부)

	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금
Claude 3.5 Haiku	0.001 USD	0.005 USD

리전: 미국 서부(오레곤)

	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금
Claude 3.5 Haiku	0.001 USD	0.005 USD

프로비저닝된 처리량 요금

리전: 미국 동부(버지니아 북부) 및 미국 서부(오레곤)

Anthropic 모델	무약정 시 모델별 시간당 요금	1개월 약정 시 모델 단위당 시간당 요금	6개월 약정 시 모델 단위당 시간당 요금
Claude Instant	44.00 USD	39.60 USD	22.00 USD
Claude 2.0/2.1	70.00 USD	63.00 USD	35.00 USD

Anthropic 모델	무약정 시 모델별 시간당 요금	1개월 약정 시 모델 단위당 시간당 요금	6개월 약정 시 모델 단위당 시간당 요금
Claude Instant	44.00 USD	39.60 USD	22.00 USD
Claude 2.0/2.1	70.00 USD	63.00 USD	35.00 USD

리전: 아시아 태평양(도쿄)

Anthropic 모델	1개월 약정 시 모델 단위당 시간당 요금	6개월 약정 시 모델 단위당 시간당 요금
Claude 인스턴트	53.00 USD	29.00 USD
Claude 2.0/2.1	86.00 USD	48.00 USD

리전: 유럽(프랑크푸르트)

Anthropic 모델	1개월 약정 시 모델 단위당 시간당 요금	6개월 약정 시 모델 단위당 시간당 요금
Claude 인스턴트	49.00 USD	27.00 USD
Claude 2.0/2.1	79.00 USD	44.00 USD

모델 단위에 대한 자세한 내용은 AWS 계정 팀에 문의하세요.

Cohere

Cohere

온디맨드 요금

Cohere 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금	이미지당 요금
Command	0.0015 USD	0.0020 USD	해당 사항 없음
Command-Light	0.0003 USD	0.0006 USD	해당 사항 없음
Command R+	0.0030 USD	0.0150 USD	해당 사항 없음
Command R	0.0005 USD	0.0015 USD	해당 사항 없음
Embed 3 영어	0.0001 USD	해당 사항 없음	0.0001 USD
Embed 3 다국어	0.0001 USD	해당 사항 없음	0.0001 USD

Cohere 모델	1,000개의 쿼리당 요금**
Rerank 3.5	2.00 USD
** 쿼리에 최대 100개의 문서 청크를 포함할 수 있는 쿼리 수에 대해 요금이 부과됩니다. 쿼리에 100개가 넘는 문서 청크가 포함된 경우 여러 쿼리로 계산됩니다. 예를 들어 350개의 문서가 포함된 요청은 4개의 쿼리로 처리됩니다. 각 문서는 최대 500개의 토큰(쿼리 및 문서의 총 토큰 포함)만 포함할 수 있으며, 토큰 길이가 512개 토큰보다 크면 여러 문서로 분류된다는 점에 유의하세요.

사용자 지정(미세 조정) 요금

Cohere 모델	1,000개의 토큰을 훈련하기 위한 요금	각 사용자 지정 모델의 월별 저장 요금	사용자 지정 모델에서 시간당 모델 단위당 추론 요금(약정이 없는 프로비저닝 처리량 요금 포함)
Cohere Command	0.004 USD	1.95 USD	49.50 USD
Cohere Command-Light	0.001 USD	1.95 USD	8.56 USD

*훈련된 총 토큰 = 훈련 데이터 코퍼스의 토큰 수 x 에포크 수

프로비저닝된 처리량 요금

Cohere 모델	무약정 시 모델별 시간당 요금	1개월 약정 시 모델 단위당 시간당 요금	6개월 약정 시 모델 단위당 시간당 요금
Cohere Command	49.50 USD	39.60 USD	23.77 USD
Cohere Command - Light	8.56 USD	6.85 USD	4.11 USD
Embed 3 영어	7.12 USD	6.76 USD	6.41 USD
Embed 3 다국어	7.12 USD	6.76 USD	6.41 USD

모델 단위에 대한 자세한 내용은 AWS 계정 또는 영업팀에 문의하세요.

Luma AI

온디맨드 요금

Luma AI 모델	비디오 해상도	생성된 비디오의 초당 요금
Luma Ray2	720p, 24fps	1.50 USD
Luma Ray2	540p, 24fps	0.75 USD

Meta Llama

Meta Llama

Llama 3.3

온디맨드 및 배치 요금

Llama 3.2

온디맨드 및 배치 요금

Llama 3.1

온디맨드 및 배치 요금

모델 사용자 지정(미세 조정)을 위한 요금

프로비저닝된 처리량 요금

Llama 3

온디맨드 요금

Llama 2

온디맨드 요금

리전: 미국 동부(버지니아 북부) 및 미국 서부(오리건)

메타 모델	입력 토큰 1,000개당 요금	출력 토큰 1,000개당 요금
Llama 2 Chat(13B)	0.00075 USD	0.001 USD
Llama 2 Chat(70B)	0.00195 USD	0.00256 USD

모델 사용자 지정(미세 조정)을 위한 요금

메타 모델	1,000개의 토큰을 훈련하기 위한 요금	*각 사용자 지정 모델을 저장하는 데 드는 요금(월별)**	사용자 지정 모델에서 시간당 모델 단위 1개당 추론 요금(약정이 없는 프로비저닝 처리량 요금 포함)
Llama 2 Pretrained(13B)	0.00149 USD	1.95 USD	23.50 USD
Llama 2 Pretrained(70B)	0.00799 USD	1.95 USD	23.50 USD

*사용자 지정 모델 스토리지 = 1.95 USD

프로비저닝된 처리량 요금

메타 모델	1개월 약정 시 모델 단위당 시간당 요금	6개월 약정 시 모델 단위당 시간당 요금
Llama 2 Pretrained 및 Chat(13B)	21.18 USD	13.08 USD
Llama 2 Pretrained(70B)	21.18 USD	13.08 USD

*Llama 2 Pre-trained 모델은 사용자 지정 후 프로비저닝된 처리량으로만 사용할 수 있습니다.

모델 단위에 대한 자세한 내용은 AWS 계정 또는 영업팀에 문의하세요.

Mistral AI
Mistral AI
Stability AI

Stability AI

온디맨드 요금

Stability AI 모델	생성된 이미지당 요금
Stable Diffusion 3.5 Large	0.08 USD
Stable Image Core	0.04 USD
Stable Diffusion 3 Large	0.08 USD
Stable Image Ultra	0.14 USD

Stability AI에서 제공하는 이전 세대 이미지 모델은 단계 수 및 이미지 해상도에 따라 이미지당 요금이 책정됩니다.

Stability AI 모델	이미지 해상도	표준 품질로 생성된 이미지당 요금(<=50단계)	프리미엄 품질로 생성된 이미지당 요금(50단계 초과)
SDXL 1.0	최대 1024 x 1024	0.04 USD	0.08 USD

프로비저닝된 처리량 요금

Stability AI 모델	1개월 약정 시 모델 단위당 시간당 요금*	6개월 약정 시 모델 단위당 시간당 요금*
SDXL 1.0	49.86 USD	46.18 USD

*기본 및 사용자 지정 모델에 대한 추론이 포함됨

모델 단위에 대한 자세한 내용은 AWS 계정 또는 영업팀에 문의하세요.

현재 Amazon Bedrock의 Stability AI 모델에는 모델 사용자 지정(미세 조정)이 지원되지 않습니다.

사용자 지정 모델 가져오기