Amazon DocumentDB(MongoDB 호환) FAQ

일반

Amazon DocumentDB(MongoDB 호환)는 네이티브 JSON 워크로드를 지원하는 빠르고 확장 가능하며, 가용성이 뛰어난 완전관리형 엔터프라이즈 도큐먼트 데이터베이스 서비스입니다. Amazon DocumentDB 도큐먼트 데이터베이스를 사용하면 JSON 데이터를 손쉽게 저장, 쿼리 및 인덱싱할 수 있습니다. 개발자는 Amazon DocumentDB에서 워크로드를 실행, 관리 및 크기 조정할 때 사용하는 것과 동일한 MongoDB 애플리케이션 코드, 드라이버 및 도구를 사용할 수 있습니다. 기본 인프라 관리에 대한 우려 없이 개선된 성능, 확장성 및 가용성을 활용하세요.

고객은 AWS Database Migration Service(DMS)를 사용하여 사실상 가동 중단 없이 온프레미스 또는 Amazon Elastic Compute Cloud(EC2) MongoDB 비관계형 데이터베이스를 Amazon DocumentDB로 손쉽게 마이그레이션할 수 있습니다. Amazon DocumentDB는 선불 투자 없이 사용할 수 있으며 사용한 용량에 대해서만 요금을 지불하면 됩니다.

문서 지향 데이터베이스는 가장 빠르게 성장하고 있는 NoSQL 데이터베이스 범주 중 하나입니다. 주된 이유는 도큐먼트 데이터베이스가 유연한 스키마와 광범위한 쿼리 기능을 모두 제공하기 때문입니다. 문서 모델은 임시 쿼리, 인덱싱 및 집계가 필요한 동적 데이터 세트가 포함된 사용 사례에 탁월한 선택입니다. Amazon DocumentDB는 이 서비스가 제공하는 규모 덕에 다양한 고객의 콘텐츠 관리, 개인화, 카탈로그, 모바일 및 웹 애플리케이션, IoT 및 프로필 관리와 같은 사용 사례에 사용됩니다.

MongoDB 호환’이란 Amazon DocumentDB가 Apache 2.0 오픈 소스 MongoDB 3.6, 4.0 및 5.0 API와 상호 작용을 주고받는다는 뜻입니다. 따라서 Amazon DocumentDB에서 동일한 MongoDB 드라이버, 애플리케이션 및 도구를 거의 또는 전혀 변경하지 않고 사용할 수 있습니다. Amazon DocumentDB는 고객이 실제로 사용하는 MongoDB API 중 대다수를 지원하지만, MongoDB API라면 모두 지원하는 것은 아닙니다. 그간 AWS에서는 고객이 실제로 사용하고 필요로 하는 기능을 제공하는 데 주안점을 두었습니다.

출시 이후, 종점인 고객을 출발점으로 삼아 거꾸로 작업하여 추가로 80여 가지 기능을 제공해왔으며, MongoDB 4.0 및 5.0 호환, 트랜잭션 및 샤딩이 좋은 예입니다. 지원되는 MongoDB API에 관한 자세한 내용은 호환 설명서를 참조하세요. 최근 출시된 Amazon DocumentDB 제품에 관한 자세한 내용은 Amazon DocumentDB 리소스 페이지에 있는 ‘Amazon DocumentDB 공지 사항’에서 확인하실 수 있습니다.

아니요. Amazon DocumentDB는 MongoDB SSPL 코드를 활용하지 않으므로 이 라이선스로 인한 제한을 받지 않습니다. 대신, Amazon DocumentDB는 Apache 2.0 오픈 소스 MongoDB 3.6, 4.0 및 5.0 API와 상호 작용을 주고받습니다. AWS에서는 앞으로도 고객의 의견에 귀를 기울이고 고객에게서 역방향으로 작업하여 고객에게 필요한 기능을 제공하고자 합니다. 지원되는 MongoDB API에 관한 자세한 내용은 호환 설명서를 참조하세요. 최근 출시된 Amazon DocumentDB 제품에 관한 자세한 내용은 Amazon DocumentDB 리소스 페이지에 있는 ‘Amazon DocumentDB 공지 사항’에서 확인하실 수 있습니다.

AWS Database Migration Service(DMS)를 사용하면 사실상 가동 중단 없이 온프레미스 또는 Amazon Elastic Compute Cloud(EC2) MongoDB 데이터베이스를 Amazon DocumentDB로 손쉽게 마이그레이션할 수 있습니다. DMS를 사용하면 MongoDB 복제본 세트 또는 샤딩된 클러스터에서 Amazon DocumentDB로 마이그레이션할 수 있습니다. 또한 mongodump/mongorestore, mongoexport/mongoimport, 그리고 oplog를 통해 변경 데이터 캡처(CDC)를 지원하는 서드 파티 도구를 비롯해 대부분의 기존 도구를 사용하여 MongoDB 데이터베이스에서 Amazon DocumentDB로 데이터를 마이그레이션할 수 있습니다. 자세한 내용은 Amazon DocumentDB로 마이그레이션을 참조하세요.

아니요. Amazon DocumentDB는 MongoDB 3.4 이상과 호환되는 대부분의 MongoDB 드라이버와 연동됩니다.

예. 이제 MongoDB 4.0 호환성 지원이 출시되면서 Amazon DocumentDB는 여러 문서, 명령문, 컬렉션 및 데이터베이스에서 원자성, 일관성, 격리, 내구성(ACID) 트랜잭션을 수행하는 있는 기능을 지원합니다.

아니요. Amazon DocumentDB는 MongoDB의 동일한 지원 수명 주기를 따르지 않으며 MongoDB의 EOL 일정은 Amazon DocumentDB에 적용되지 않습니다.

Amazon DocumentDB 클러스터는 고객의 Amazon VPC(VPC) 내에 배포되며, 동일한 VPC 내에 배포된 Amazon Elastic Compute Cloud(EC2) 인스턴스 또는 다른 AWS 서비스에서 직접 액세스할 수 있습니다. 또한, Amazon DocumentDB는 동일한 리전이나 기타 리전의 서로 다른 VPC에 있는 Amazon EC2 인스턴스 또는 기타 AWS 서비스에서 VPC 피어링을 통해서도 액세스할 수 있습니다. Amazon DocumentDB 클러스터 대한 액세스는 mongo shell 또는 MongoDB 드라이버를 통해 수행되어야 합니다. Amazon DocumentDB를 사용하려면 클러스터에 연결할 때 인증 과정을 거쳐야 합니다. 추가 옵션은 Amazon VPC 외부에서 Amazon DocumentDB 클러스터에 연결을 참조하세요.

인스턴스 수명 주기 관리, Amazon Key Management Service(KMS)를 사용한 저장 중 암호화, 보안 그룹 관리와 같은 특정 관리 기능을 위해 Amazon DocumentDB는 Amazon Relational Database Service(RDS) 및 Amazon Neptune과 공유되는 운영 기술을 활용합니다. describe-db-instances 및 describe-db-clusters AWS CLI API를 사용하는 경우 "--filter Name=engine,Values=docdb" 파라미터를 사용하여 Amazon DocumentDB 리소스를 필터링하는 것이 좋습니다.

리전별로 사용 가능한 인스턴스 유형에 대한 최신 정보는 Amazon DocumentDB 요금 페이지를 참조하세요.

Amazon DocumentDB를 사용해 보려면 시작 가이드를 참조하세요.

예. 자세한 내용은 Amazon DocumentDB(MongoDB 호환) 서비스 수준 계약을 참조하세요.

성능

스토리지에 작성할 때 Amazon DocumentDB는 미리 쓰기 로그만 유지하며, 전체 버퍼 페이지 동기화를 작성할 필요가 없습니다. 안정성을 저하하지 않는 이러한 최적화 덕분에 Amazon DocumentDB 쓰기 속도는 일반적으로 기존 데이터베이스보다 더 빠릅니다. Amazon DocumentDB 클러스터는 최대 15개의 읽기 전용 복제본을 통해 초당 수백만 건의 읽기를 처리할 수 있는 규모로 스케일 아웃할 수 있습니다.

요금

리전과 요금에 대한 최신 정보는 Amazon DocumentDB 요금 페이지를 참조하세요.

예. 1개월 무료 평가판을 사용하여 Amazon DocumentDB를 무료로 사용해 볼 수 있습니다. 이전에 Amazon DocumentDB를 사용한 적이 없다면 1개월 무료 평가판을 사용할 수 있습니다. 월별 750시간의 t3.medium 인스턴스 사용량, 3천만 단위의 IO, 5GB의 스토리지, 5GB의 백업 스토리지를 30일 동안 무료로 이용할 수 있습니다. 1개월의 무료 평가판이 만료되거나 사용량이 무료 허용량을 초과하면 요금이 발생하지 않도록 클러스터를 종료하거나 표준 온디맨드 요금으로 계속 실행할 수 있습니다. 자세히 알아보려면 DocumentDB 무료 평가판 페이지를 참조하세요.

Amazon DocumentDB I/O-Optimized는 비용을 예측할 수 있어야 하거나 I/O 집약적 애플리케이션이 있는 경우에 적합한 선택입니다. I/O 비용이 전체 Amazon DocumentDB 데이터베이스 비용의 25%를 초과할 것으로 예상되는 경우 이 옵션을 선택하면 가격 대비 성능이 향상됩니다. 시작 방법을 비롯한 자세한 내용은 Amazon DocumentDB I/O-Optimized 설명서를 참조하세요.

기존 데이터베이스 클러스터를 30일 간격으로 Amazon DocumentDB I/O-Optimized로 전환할 수 있습니다. 언제든지 Amazon DocumentDB Standard 스토리지 구성으로 다시 전환할 수 있습니다.

예. 리전 간에 데이터를 복제하는 데 필요한 I/O 작업에 대한 요금은 계속 적용됩니다. Amazon DocumentDB I/O-Optimized는 데이터 복제와 달리 읽기 및 쓰기 I/O 작업에 대한 요금을 부과하지 않습니다. 자세한 내용은 Amazon DocumentDB I/O-Optimized 설명서를 참조하세요.

Elastic Clusters

Amazon DocumentDB Elastic Clusters는 페타바이트 용량의 스토리지에서 초당 수백만 개의 쓰기 및 읽기 요청을 처리할 수 있도록 도큐먼트 데이터베이스의 크기를 탄력적으로 조정할 수 있습니다. Elastic Clusters는 기본 인프라를 자동으로 관리하고 인스턴스 생성, 제거, 업그레이드, 크기 조정 필요성을 제거하여 고객과 Amazon DocumentDB의 상호 작용을 간소화합니다.

Amazon DocumentDB API, SDK, CLI, CloudFormation(CFN), AWS Console을 사용하여 Elastic Clusters를 생성할 수 있습니다. 클러스터를 프로비저닝할 때 사용자의 워크로드에 필요한 샤드와 샤드당 컴퓨팅 수를 지정할 수 있습니다. 클러스터를 생성하고 나면 Elastic Clusters의 탄력적 확장성을 활용할 준비가 된 것입니다. 이제 Elastic Clusters 클러스터와 사용자 애플리케이션의 읽기 또는 쓰기 데이터를 연결할 수 있습니다. Elastic Clusters는 탄력적입니다. 워크로드의 요구 사항에 따라 AWS Console, API, CLI, SDK를 이용해서 샤드 수 또는 샤드당 컴퓨팅을 수정하여 컴퓨팅 용량을 늘리거나 줄일 수 있습니다. Elastic Clusters는 기본 인프라를 자동으로 프로비저닝하거나 프로비저닝 해제하고 데이터를 리밸런싱합니다.

Elastic Clusters는 샤딩을 사용하여 Amazon DocumentDB의 분산 스토리지 시스템 간의 데이터를 파티셔닝합니다. 샤딩(파티셔닝이라고도 부름)은 다수의 노드에 걸친 대형 데이터 세트를 작은 데이터 세트로 분할하여 고객이 단일 데이터베이스의 수직 확장 제한을 넘어 데이터베이스를 스케일 아웃할 수 있도록 합니다. Elastic Clusters는 Amazon DocumentDB의 컴퓨팅 및 스토리지 분리를 활용합니다. Elastic Clusters는 컴퓨팅 노드 간의 작은 데이터 청크를 이동하여 컬렉션을 재파티셔닝하는 대신 분산 스토리지 시스템 내에서 데이터를 효율적으로 복사할 수 있습니다.

Elastic Clusters는 해시 기반 파티셔닝을 지원합니다.

Elastic Clusters를 사용하면 데이터 크기를 불문하고 애플리케이션 가동 중단이나 성능에 영향을 주는 일이 거의 없이 Amazon DocumentDB상의 워크로드를 쉽게 스케일 아웃 또는 스케일 인할 수 있습니다. MongoDB에서의 비슷한 작업은 애플리케이션 성능에 영향을 주고 몇 시간, 어떤 경우에는 며칠이 걸립니다. Elastic Clusters는 또한 백업에 영향 없이 빠른 지정 시간 복원과 같은 차별화된 관리 기능을 제공하여 고객이 데이터베이스 관리보다는 애플리케이션에 더 오래 집중할 수 있도록 합니다.

아니요. Elastic Clusters를 사용하기 위해 애플리케이션을 변경할 필요는 없습니다.

아니요. 가까운 시일 내에 AWS Database Migration Service(DMS)를 활용하여 기존 Amazon DocumentDB 클러스터의 데이터를 Elastic Clusters 클러스터로 마이그레이션할 수 있습니다.

Elastic Clusters용으로 최적의 샤드 키를 선택하는 것은 다른 데이터베이스와 다를 바가 없습니다. 훌륭한 샤드 키는 높은 빈도와 카디널리티라는 두 가지 특성을 가지고 있습니다. 예를 들어 애플리케이션이 user_orders를 DocumentDB에 저장한다면, 일반적으로 데이터를 사용자별로 검색해야 합니다. 따라서 주어진 사용자와 관련된 모든 명령이 한 샤드에 있도록 하는 것이 좋습니다. 이런 경우 user_id는 훌륭한 샤드 키가 됩니다. 자세한 정보를 읽어 보세요

  • Elastic Clusters: 사용자 워크로드의 처리량(throughput)을 초당 수백만 개의 읽기/쓰기로 확장하고 스토리지를 페타바이트로 확장할 수 있는 Amazon DocumentDB 클러스터입니다. Elastic Cluster 클러스터는 컴퓨팅 및 스토리지 볼륨을 위한 하나 이상의 샤드로 구성되며 기본적으로 여러 가용 영역에 걸쳐 고가용성을 유지합니다.
  • 샤드: 샤드는 Elastic Clusters 클러스터에 컴퓨팅 리소스를 제공합니다. 기본적으로 샤드는 1개의 라이터 노드와 2개의 리더 노드와 같이 총 3개의 노드를 가집니다. 최대 32개의 샤드를 보유할 수 있으며, 각 샤드에는 최대 64개의 vCPU가 지원됩니다.
  • 샤드 키: 샤드 키는 Elastic Clusters가 일치하는 샤드로 읽기 및 쓰기 트래픽을 배포하기 위해 사용하는 JSON 문서 내 선택적 필드입니다. 고유한 값이 많이 포함된 키를 선택하는 것이 좋습니다. 훌륭한 샤드 키는 기본 샤드 간의 데이터를 균일하게 파티셔닝하여 워크로드에 최고의 처리량과 성능을 제공합니다. 
  • 샤딩된 컬렉션: Elastic Clusters 클러스터에 분산된 데이터의 컬렉션입니다.

Elastic Clusters는 현재 DocumentDB와 동일한 방식으로 다른 AWS 서비스와 통합됩니다. 먼저, AWS Database Migration Service(DMS)를 사용하여 MongoDB 및 기타 관계형 데이터베이스를 Elastic Clusters로 마이그레이션할 수 있습니다. 두 번째로, Amazon CloudWatch를 사용하여 Elastic Clusters 클러스터의 상태와 성능을 모니터링할 수 있습니다. 세 번째로, AWS IAM 사용자 및 역할을 통해 인증 및 권한 부여를 설정하고 안전한 VPC 전용 연결을 위해 AWS VPC를 사용할 수 있습니다. 마지막으로, AWS Glue를 사용하여 S3, Redshift 및 OpenSearch와 같은 다른 AWS 서비스의 데이터를 가져오거나 내보낼 수 있습니다.

예. 기존 MongoDB 샤딩된 워크로드를 Elastic Clusters로 마이그레이션할 수 있습니다. AWS Database Migration Service 또는 mongodump 및 mongorestore와 같은 네이티브 MongoDB 도구를 사용하여 MongoDB 워크로드를 Elastic Clusters로 마이그레이션할 수 있습니다. Elastic Clusters는 또한 shardCollection()과 같이 MongoDB에서 일반적으로 사용되는 API를 지원하여 기존 도구 및 스크립트를 Amazon DocumentDB에서 재사용할 수 있는 유연성을 제공합니다.

하드웨어, 규모 조정 및 스토리지

최소 스토리지는 10GB입니다. Amazon DocumentDB 스토리지는 클러스터 사용량을 기준으로, 성능에 영향을 미치지 않고 최대 128TiB까지 10GB 단위로 자동으로 증가합니다. Amazon DocumentDB Elastic Clusters를 사용하면 자동으로 스토리지가 최대 4PB까지 10GB 단위로 증가합니다. 두 경우 모두 스토리지를 미리 프로비저닝할 필요가 없습니다.

Amazon DocumentDB는 스토리지와 컴퓨팅이라는 두 가지 차원에서 스케일 인됩니다. Amazon DocumentDB의 스토리지는 인스턴스 기반 클러스터에서 10GB에서 128TiB까지, Amazon DocumentDB Elastic Clusters의 경우 최대 4PB까지 자동으로 조정됩니다. Amazon DocumentDB의 컴퓨팅 용량은 더 큰 인스턴스를 생성하여 확장하거나, 읽기 처리량을 늘리도록 클러스터에 복제본 인스턴스를 더 추가하여 스케일 업할 수 있습니다.

AWS Management Console에서 원하는 인스턴스를 선택하고 Modify(수정) 버튼을 클릭하면 해당 인스턴스에 할당된 컴퓨팅 리소스를 조정할 수 있습니다. 메모리와 CPU 리소스를 수정하려면 인스턴스 클래스를 변경합니다.

인스턴스 클래스를 수정하는 경우 요청한 변경 사항은 지정된 유지 관리 기간에 적용됩니다. 또는 'Apply Immediately' 플래그를 사용하면 규모 조정 요청을 즉시 적용할 수 있습니다. 이 두 옵션을 사용하면 조정 작업이 수행되는 몇 분 동안 가용성에 영향을 미칩니다. 처리되지 않은 다른 시스템 변경 내용도 함께 적용됩니다.

백업 및 복원

Amazon DocumentDB 클러스터에는 자동 백업이 항상 사용됩니다. Amazon DocumentDB의 단순한 데이터베이스 백업 기능을 사용하여 클러스터를 특정 시점으로 복구할 수 있습니다. 특정 시점 복원을 위해 백업 기간을 최대 35일까지 늘릴 수 있습니다. 백업은 데이터베이스 성능에 영향을 미치지 않습니다.

예. 수동 스냅샷은 백업 기간을 초과하여 보존될 수 있으며 스냅샷 생성 시 성능에 영향을 미치지 않습니다. 클러스터 스냅샷에서 데이터를 복원하려면 새 클러스터를 생성해야 합니다.

Amazon DocumentDB는 리전 내 3개의 가용 영역(AZ)에 데이터를 안정적으로 유지하며, 데이터가 손실되지 않은 정상 AZ의 인스턴스를 자동으로 복구합니다. 드물지만 Amazon DocumentDB 스토리지 내에서 데이터를 사용할 수 없는 경우 클러스터 스냅샷에서 복원하거나 새 클러스터로 특정 시점 복원 작업을 수행할 수 있습니다. 특정 시점으로 복원 작업의 경우 최대 5분 전에 수행된 작업까지만 복원할 수 있습니다.

인스턴스를 삭제할 때 최종 스냅샷을 생성하도록 선택할 수 있습니다. 스냅샷을 생성하는 경우 나중에 이 스냅샷을 사용하여 삭제된 인스턴스를 복원할 수 있습니다. Amazon DocumentDB는 인스턴스가 삭제된 후에도 사용자가 생성한 이 최종 스냅샷을 수동으로 생성한 모든 다른 스냅샷과 함께 보관합니다. 인스턴스가 삭제된 후에는 스냅샷만 유지됩니다. 즉, 특정 시점 복원을 위해 생성한 자동 백업은 유지되지 않습니다.

AWS 계정을 삭제하면 계정에 포함된 모든 자동 백업과 스냅샷 백업이 삭제됩니다.

예. Amazon DocumentDB는 클러스터 스냅샷을 생성하는 기능을 제공하며, 이 스냅샷은 나중에 클러스터를 복원하는 데 사용할 수 있습니다. 다른 AWS 계정과 스냅샷을 공유할 수 있으며, 수신 계정의 소유자는 사용자의 스냅샷을 사용하여 사용자의 데이터가 포함된 클러스터를 복원할 수 있습니다. 스냅샷을 퍼블릭으로 설정할 수도 있습니다. 즉, 누구나 사용자의 데이터(퍼블릭)가 포함된 클러스터를 복원할 수 있습니다. 이 기능을 사용하면 AWS 계정이 서로 다른 다양한 환경(프로덕션, 개발/테스트, 스테이징 등) 간에 데이터를 공유할 수 있고, 기본 AWS 계정이 손상될 경우에 대비하여 별도의 계정에 모든 데이터 백업을 안전하게 유지할 수 있습니다.

계정 간에 스냅샷을 공유하는 데는 비용이 부과되지 않습니다. 하지만 스냅샷 자체와 공유된 스냅샷에서 복원하는 클러스터에는 비용이 부과될 수 있습니다.

자동 클러스터 스냅샷 공유 기능은 지원하지 않습니다. 자동 스냅샷을 공유하려면 수동으로 스냅샷 복사본을 생성한 다음, 해당 복사본을 공유해야 합니다.

아니요. 공유된 Amazon DocumentDB 스냅샷은 이를 공유하는 계정과 같은 리전에 있는 계정에서만 액세스할 수 있습니다.

예. 암호화된 Amazon DocumentDB 스냅샷은 공유할 수 있습니다. 공유된 스냅샷의 수신자는 해당 스냅샷을 암호화하는 데 사용된 KMS 키에 대한 액세스 권한이 있어야 합니다.

아니요. Amazon DocumentDB 스냅샷은 서비스 내부에서만 사용할 수 있습니다.

클러스터를 삭제할 때 최종 스냅샷을 생성하도록 선택할 수 있습니다. 스냅샷을 만들면, 나중에 이를 사용하여 삭제된 클러스터를 복원할 수 있습니다. Amazon DocumentDB는 클러스터가 삭제된 후에도 사용자가 생성한 이 최종 스냅샷을 수동으로 생성한 모든 다른 스냅샷과 함께 보관합니다.

고가용성 및 복제

Amazon DocumentDB는 스토리지 볼륨을 자동으로 10GB 세그먼트로 나누어 여러 디스크에 분산합니다. 스토리지 볼륨의 각 10GB 청크가 3개의 가용 영역(AZ)에 걸쳐 6가지 방법으로 복제됩니다. Amazon DocumentDB는 쓰기 가용성에 영향을 주지 않고 최대 2개의 데이터 사본 손실을 처리하고 읽기 가용성에 영향을 주지 않고 최대 3개의 사본 손실을 투명하게 처리하도록 설계되었습니다. Amazon DocumentDB의 스토리지 볼륨 또한 자가 복구형입니다. 데이터 블록과 디스크에 오류가 있는지 계속 스캔하고 오류가 있는 경우 자동으로 복구됩니다.

다른 데이터베이스와 달리 Amazon DocumentDB에서는 데이터베이스 충돌이 발생한 후 데이터베이스를 다시 작업에 사용하기 전에 최종 데이터베이스 체크포인트의 재실행 로그를 재생하여(대개 5분) 모든 변경 사항이 적용되었는지 확인할 필요가 없습니다. 따라서 대부분의 경우 데이터베이스 재시작 시간이 60초 미만으로 줄어듭니다. Amazon DocumentDB는 데이터베이스 프로세스에서 캐시를 제외하여 재시작 시 즉시 사용할 수 있도록 합니다. 이렇게 하면 캐시가 다시 채워질 때까지는 액세스를 제한할 필요가 없어 중단이 방지됩니다.

Amazon DocumentDB는 기본 인스턴스와 동일한 기본 스토리지 볼륨을 공유하는 읽기 전용 복제본을 지원합니다. 기본 인스턴스에서 수행한 업데이트는 모든 Amazon DocumentDB 복제본에 표시됩니다.

  • 기능: Amazon DocumentDB 읽기 전용 복제본
  • 복제본 수: 최대 15개
  • 복제본 유형: 비동기식(일반적으로 수 밀리초)
  • 기본 인스턴스에 미치는 성능 영향: 낮음
  • 장애 조치 대상으로 작동: 예(데이터 손실 없음)
  • 자동 장애 조치:

예. 글로벌 클러스터 기능을 사용하여 여러 리전에서 데이터를 복제할 수 있습니다. 글로벌 클러스터는 여러 AWS 리전에 걸쳐 있습니다. 글로벌 클러스터는 성능에 거의 또는 전혀 영향을 미치지 않으면서 최대 5개 리전의 클러스터에 데이터를 복제합니다. 글로벌 클러스터는 전체 리전에서 발생하는 가동 중단으로부터의 재해 복구를 제공하고 지연 시간이 짧은 글로벌 읽기를 지원합니다. 자세한 내용은 블로그 게시물을 참조하세요.

예. 클러스터의 각 인스턴스에 승격 우선순위 티어를 지정할 수 있습니다. 기본 인스턴스에 장애가 발생하면, Amazon DocumentDB는 가장 우선순위가 높은 복제본을 기본 인스턴스로 승격시킵니다. 같은 우선순위 티어에 있는 2개 이상의 복제본 간에 일관성이 없는 경우, Amazon DocumentDB는 기본 인스턴스와 같은 크기의 복제본을 승격시킵니다.

언제든 인스턴스에 대한 우선순위 티어를 수정할 수 있습니다. 우선순위 티어를 수정하는 것만으로 장애 조치가 트리거되지 않습니다.

기본 인스턴스로 승격되기를 원하지 않는 복제본에 낮은 우선순위 티어를 지정하면 됩니다. 하지만 클러스터에서 우선순위가 더 높은 복제본이 비정상이거나 어떤 이유로 사용할 수 없는 경우에는 Amazon DocumentDB가 우선순위가 낮은 복제본을 승격시키게 됩니다.

Amazon DocumentDB는 여러 AWS 가용 영역의 복제본 인스턴스를 장애 조치 대상으로 사용함으로써 고가용성 구성으로 배포될 수 있습니다. 기본 인스턴스에 장애가 발생하는 경우, 서비스 중단을 최소화하면서 복제본 인스턴스가 자동으로 새로운 기본 인스턴스로 승격됩니다.

더 많은 Amazon DocumentDB 복제본을 추가할 수 있습니다. Amazon DocumentDB 복제본은 기본 인스턴스와 동일한 기본 스토리지를 공유합니다. 모든 Amazon DocumentDB 복제본은 데이터 손실 없이 승격되어 기본 복제본이 될 수 있으므로 기본 인스턴스에 장애가 발생하는 경우 내결함성 향상에 사용될 수 있습니다. 클러스터 가용성을 높이려면 여러 AZ에 1~15개의 복제본을 만들면 됩니다. 그러면 인스턴스가 중단되는 경우 Amazon DocumentDB가 자동으로 이러한 복제본을 장애 조치 기본 선택에 포함합니다.

Amazon DocumentDB가 자동으로 장애 조치를 처리하므로 관리자가 직접 개입하지 않아도 애플리케이션이 최대한 신속하게 데이터베이스 작업을 재개할 수 있습니다.

  • Amazon DocumentDB 복제본 인스턴스가 동일한 가용 영역 또는 다른 가용 영역에 있는 경우, 장애 조치가 진행될 때 Amazon DocumentDB에서는 인스턴스의 Canonical Name Record(CNAME)가 정상적인 복제본을 가리키도록 전환하고, 이에 따라 해당 복제본은 승격되어 새로운 기본 복제본이 됩니다. 일반적으로 장애 조치는 처음부터 끝까지 30초 이내에 완료됩니다. 
  • Amazon DocumentDB 복제본 인스턴스(즉, 단일 인스턴스 클러스터)가 없는 경우, Amazon DocumentDB는 원래 인스턴스와 동일한 가용 영역에 새 인스턴스를 생성하려고 시도합니다. 이와 같은 원래 인스턴스 대체가 최선의 방법이며, 가용 영역에 크게 영향을 주는 문제가 발생하는 경우 등에는 성공하지 못할 수도 있습니다. 

데이터베이스 연결이 끊어지는 경우 애플리케이션에서 연결을 다시 시도해야 합니다.

Amazon DocumentDB가 기본 인스턴스의 문제를 자동으로 감지하고 Amazon DocumentDB 복제본 인스턴스로 읽기/쓰기 트래픽을 라우팅하기 시작합니다. 평균적으로 이러한 장애 조치는 30초 이내에 완료됩니다. 또한, Amazon DocumentDB 복제본에서 제공하던 읽기 트래픽이 일시적으로 중단됩니다.

Amazon DocumentDB 복제본은 기본 인스턴스와 동일한 데이터 볼륨을 공유하므로 사실상 복제 지연이 없습니다. 일반적인 지연 시간은 10밀리초 이내입니다.

보안 및 규정 준수

예. 모든 Amazon DocumentDB 클러스터는 VPC에서 생성되어야 합니다. Amazon VPC를 사용하면 사용자의 데이터 센터에서 운영하는 기존 네트워크와 매우 유사한 가상 네트워크 토폴로지를 정의할 수 있습니다. 이를 통해 Amazon DocumentDB 클러스터에 액세스할 수 있는 사용자를 완벽하게 제어할 수 있습니다.

Amazon DocumentDB에서는 기본 제공 역할을 통한 RBAC를 지원합니다. RBAC를 사용하면 사용자가 수행할 수 있는 작업을 제한하여 가장 낮은 수준의 권한을 모범 사례로 적용할 수 있습니다. 자세한 내용은 Amazon DocumentDB 역할 기반 액세스 제어를 참조하세요.

Amazon DocumentDB는 VPC의 엄격한 네트워크 및 권한 부여 경계를 활용합니다. Amazon DocumentDB 관리 API에 대한 인증과 권한 부여는 IAM 사용자, 역할 및 정책에 의해 제공됩니다. Amazon DocumentDB 데이터베이스에 대한 인증은 MongoDB용 기본 인증 메커니즘인 SCRAM(Salted Challenge Response Authentication Mechanism)이 지원되는 표준 MongoDB 도구 및 드라이버를 통해 수행됩니다.

예. Amazon DocumentDB를 사용하면 사용자가 AWS Key Management Service(KMS)를 통해 관리하는 키를 사용해 클러스터를 암호화할 수 있습니다. Amazon DocumentDB 암호화를 실행 중인 클러스터에서는 동일한 클러스터에 있는 자동 백업, 스냅샷 및 복제본과 마찬가지로 기본 스토리지에 저장된 데이터가 암호화됩니다. 암호화와 복호화는 원활하게 처리됩니다. Amazon DocumentDB에서 KMS를 사용하는 방법에 관한 자세한 내용은 Amazon DocumentDB 저장 데이터 암호화를 참조하세요.

암호화되지 않은 기존 Amazon DocumentDB 클러스터를 암호화하는 기능은 현재 지원되지 않습니다. 암호화되지 않은 기존 클러스터에 Amazon DocumentDB 암호화를 사용하려면 암호화가 활성화된 새로운 클러스터를 생성하고, 데이터를 이 클러스터로 마이그레이션합니다.

Amazon DocumentDB는 가장 엄격한 보안 표준을 충족하며 사용자가 손쉽게 AWS의 보안을 확인하고 자체 규제 및 규정 요구 사항을 충족할 수 있도록 설계되었습니다. Amazon DocumentDB는 HIPAA 적격이며 PCI DSS, ISO 9001, 27017, 2701827001, SOC 1, 2, 3Health Information Trust Alliance(HITRUST) Common Security Framework(CSF) 인증을 준수하는 것으로 평가되었습니다. AWS 규정 준수 보고서는 AWS Artifact에서 다운로드할 수 있습니다.

메이저 버전 업그레이드

인플레이스 주 버전 업그레이드(MVU)를 사용하면 AWS Console, 소프트웨어 개발 키트(SDK) 또는 명령줄 인터페이스(CLI)를 사용하여 Amazon DocumentDB 3.6 또는 4.0 클러스터를 Amazon DocumentDB 5.0으로 업그레이드할 수 있습니다. 인플레이스 MVU를 사용하면 새 클러스터를 생성하거나 엔드포인트를 변경할 필요가 없습니다. 인플레이스 MVU는 Amazon DocumentDB 5.0이 가능한 모든 리전에서 사용할 수 있습니다. 인플레이스 MVU를 시작하려면 인플레이스 MVU 설명서를 검토하세요.

인플레이스 MVU를 사용하면 다른 클러스터로 백업 및 복원을 수행하거나 다른 데이터 마이그레이션 도구를 사용하지 않고도 Amazon DocumentDB 3.6 또는 4.0 클러스터를 버전 5.0으로 원활하게 업그레이드할 수 있습니다. 이렇게 하면 소스 및 대상 엔드포인트 구성, 인덱스 및 데이터 마이그레이션, 애플리케이션 코드 변경 등을 수반하는 일반적인 업그레이드 프로세스와 관련된 시간과 작업을 줄일 수 있습니다.

업그레이드 후에 애플리케이션의 엔드포인트를 변경할 필요가 없습니다. 데이터가 동일한 클러스터에 유지되므로 기능을 사용하여 업그레이드하는 데 추가 비용이 들지 않습니다.

가동 중지 시간은 컬렉션, 인덱스, 데이터베이스 및 인스턴스의 수에 따라 클러스터별로 다를 수 있습니다. 프로덕션 클러스터에서 인플레이스 주 버전 업그레이드를 실행하기 전에 더 낮은 환경에서 실행하여 가동 중지 시간과 성능을 테스트함으로써 업그레이드 후 애플리케이션이 예상대로 작동하는지 확인하는 것이 좋습니다.

Amazon DocumentDB의 빠른 복제 기능을 활용하여 테스트용 클러스터 데이터를 복제할 수도 있습니다. 기존 Amazon DocumentDB 구현의 복잡성에 따라 Database Solutions Architect에게 추가 지원을 요청할 수 있습니다.

인플레이스 MVU는 Amazon DocumentDB 3.6 또는 4.0을 소스로 사용하고 버전 5.0을 대상으로 사용하는 경우에만 지원됩니다. Amazon DocumentDB 글로벌 클러스터 또는 Elastic Clusters에는 지원되지 않으며 DocumentDB 4.0을 대상으로 사용하는 경우에도 지원되지 않습니다.

기계 학습

Amazon DocumentDB를 Amazon SageMaker Canvas와 통합하면 코드를 한 줄도 작성하지 않고도 기계 학습(ML) 모델을 손쉽게 구축하고 Amazon DocumentDB에 저장된 데이터를 사용하여 파운데이션 모델을 사용자 지정할 수 있습니다. Amazon DocumentDB와 SageMaker Canvas 간의 ML 파이프라인과 사용자 지정 데이터를 개발할 필요가 없습니다. Amazon DocumentDB 콘솔 내에서 SageMaker Canvas를 시작하고 기존 Amazon DocumentDB 데이터베이스를 데이터 소스로 추가하여 기계 학습 모델 구축을 시작할 수 있습니다. SageMaker Canvas에서 DocumentDB의 데이터를 사용하여 고객 이탈을 예측하고, 사기를 탐지하고, 유지 관리 장애를 예측하고, 재무 지표 및 판매를 예측하고, 재고를 최적화하고, 콘텐츠를 요약하며, 콘텐츠를 생성하는 모델을 구축할 수 있습니다.

생성형 AI 및 기계 학습

Amazon SageMaker Canvas는 Amazon DocumentDB를 비롯한 다양한 데이터 소스의 데이터를 사용하여 기계 학습 모델을 구축할 수 있는 노코드 인터페이스를 제공합니다. SageMaker Canvas 사용 요금과 SageMaker Canvas에서 Amazon DocumentDB 인스턴스의 데이터를 읽을 때 발생하는 I/O에 대한 요금이 청구됩니다. DocumentDB를 Amazon SageMaker Canvas의 데이터 소스로 사용하는 데 드는 추가 비용은 없습니다. 자세한 내용은 Amazon DocumentDB 요금 페이지SageMaker Canvas 요금 페이지를 참조하세요.

Amazon DocumentDB용 벡터 검색은 JSON 기반 문서 데이터베이스의 유연성 및 풍부한 쿼리 기능과 벡터 검색 기능을 결합합니다. 기존 Amazon DocumentDB 데이터 또는 유연한 문서 데이터 구조를 사용하여 시맨틱 검색 경험, 제품 추천, 개인화, 챗봇, 사기 탐지 및 이상 탐지 같은 기계 학습 및 생성형 AI 사용 사례를 구축할 수 있습니다. 자세한 내용은 Amazon DocumentDB에 대한 벡터 검색 설명서를 참조하세요.

Amazon DocumentDB의 벡터 검색을 사용하면 시맨틱 검색을 사용할 수 있으므로 데이터의 의미, 컨텍스트 및 의도를 캡처할 수 있습니다. 키워드 검색은 실제 텍스트 또는 사전 정의된 동의어 매핑을 기반으로 문서를 찾습니다. 예를 들어 기존 전자 상거래 애플리케이션에서는 빨간색 드레스의 설명에 ‘빨간색’과 ‘드레스’라는 단어가 포함된 제품을 반환할 수 있습니다. 시맨틱 검색은 다양한 빨간색 음영의 드레스에 대한 결과를 검색하므로 사용자 경험을 개선할 수 있습니다.  

Amazon DocumentDB에서 벡터 검색을 사용하는 데는 추가 비용이 들지 않습니다. Amazon DocumentDB에서 벡터를 저장, 인덱싱 및 검색할 때 표준 컴퓨팅, I/O, 스토리지 및 백업 요금이 적용됩니다. 자세한 내용은 Amazon DocumentDB 요금 페이지를 참조하세요.

Amazon DocumentDB는 Amazon SageMaker Canvas와 통합되므로 Amazon DocumentDB에 저장된 데이터를 사용하여 생성형 인공 지능(AI) 및 기계 학습(ML) 애플리케이션을 쉽게 구축할 수 있습니다. Amazon DocumentDB와 SageMaker Canvas 간의 ML 파이프라인과 사용자 지정 데이터를 개발할 필요가 없습니다. 콘솔 내에서 통합할 수 있으므로 데이터 연결 및 액세스에 대한 획일적인 부담을 없애고 로우 코드 노코드(LCNC) 환경을 통해 ML 개발을 가속화합니다. Amazon DocumentDB 콘솔 내에서 SageMaker Canvas를 시작하고 기존 Amazon DocumentDB 데이터베이스를 데이터 소스로 추가할 수 있습니다.

제로 ETL 통합

Amazon OpenSearch Service와의 제로 ETL 통합은 Amazon DocumentDB 컬렉션에서 Amazon OpenSearch 관리형 클러스터 또는 서버리스 컬렉션으로 데이터를 추출, 변환, 로드하는 작업의 복잡성을 줄여줍니다. 이 통합을 통해 더 이상 데이터 파이프라인을 구축하거나 관리하거나 데이터를 변환할 필요가 없습니다.

MongoDB API를 사용하려면 Amazon DocumentDB의 기본 데이터베이스 기능을 사용하여 문서에서 벡터 검색을 수행해야 합니다. Amazon OpenSearch Service와의 Amazon DocumentDB 제로 ETL 통합은 여러 컬렉션을 검색하고 차원이 2,000개 이상인 벡터를 저장 및 인덱싱하는 데 적합합니다.

Amazon DocumentDB와 Amazon OpenSearch Service의 제로 ETL 통합은 Amazon OpenSearch Ingestion을 사용해 운영 데이터를 Amazon DocumentDB에서 Amazon OpenSearch Service로 원활하게 이동합니다. 시작하려면 복제해야 하는 Amazon DocumentDB 컬렉션에서 변경 스트림 기능을 사용 설정합니다. 제로 ETL 통합 기능은 계정에 Amazon OpenSearch 수집 파이프라인을 설정하여 데이터를 Amazon OpenSearch Service 관리형 클러스터 또는 서버리스 컬렉션에 자동으로 복제합니다.

Amazon OpenSearch 수집은 Amazon DocumentDB 컬렉션의 데이터 형식을 자동으로 이해하고 가장 성능이 우수한 검색 결과를 산출하기 위해 데이터를 Amazon OpenSearch Service에 매핑합니다. 여러 파이프라인을 통해 여러 Amazon DocumentDB 컬렉션의 데이터를 하나의 Amazon OpenSearch 관리형 클러스터 또는 서버리스 컬렉션으로 동기화하여 여러 애플리케이션에 걸쳐 종합적인 인사이트를 제공할 수 있습니다. 선택 사항으로, Amazon OpenSearch Service에서 수집 구성을 정의할 때 사용자 정의 데이터 프로세서를 지정할 수 있습니다. DocumentDB 컬렉션에 대한 후속 업데이트도 별도의 수동적인 개입 없이 Amazon OpenSearch Service에 복제됩니다.

이 제로 ETL은 Amazon OpenSearch 수집 파이프라인의 기본 데이터 변환 기능을 활용하여 데이터가 이동하는 동안 데이터를 집계하고 필터링합니다.

맞춤형 변환 기능을 원하는 경우 사용자 정의 변환 로직을 작성할 수도 있으며, Amazon OpenSearch Ingestion이 변환 프로세스를 관리합니다. 또는 사용자 정의 없이 전체 데이터를 소스에서 싱크로로 이동하려는 경우, 몇 번의 버튼 클릭만으로 통합을 수행할 수 있는 기본 제공 청사진을 제공하는 Amazon OpenSearch 수집을 사용할 수 있습니다.

Amazon OpenSearch 수집이 Amazon DocumentDB에서 데이터를 복제하는 데 필요한 권한을 갖도록 하기 위해, 제로 ETL 통합 기능은 Amazon DocumentDB 컬렉션에서 데이터를 읽고 Amazon OpenSearch 도메인 또는 컬렉션에 쓰는 데 필요한 권한을 가진 IAM 역할을 생성합니다. 그런 다음 Amazon OpenSearch Ingestion 파이프라인에서 해당 역할을 맡아 데이터를 소스에서 대상으로 이동할 때 항상 올바른 보안 태세를 유지하도록 합니다.

Amazon DocumentDB 및 OpenSearch Ingestion 파이프라인에서 제공하는 콘솔 대시보드에서 Amazon DocumentDB와의 제로 ETL 통합과 관련된 모든 지표를 확인할 수 있습니다. 또한 Amazon CloudWatch에서 실시간 로그를 쿼리하고 사용자 정의 임계값을 위반할 때 트리거되는 사용자 지정 알림을 Amazon CloudWatch를 사용하여 설정할 수 있습니다.