Perguntes frequentes do Amazon Textract

Geral

O Amazon Textract é um serviço de análise de documento que detecta e extrai texto impresso e manuscrito, dados estruturados (como campos e valores de interesse) e tabelas de imagens e digitalizações de documentos. Os modelos de machine learning do Amazon Textract foram treinados com milhões de documentos para que praticamente qualquer tipo de documento carregado seja reconhecido automaticamente e processado para extração de texto. Ao extrair as informações de documentos, o serviço retorna uma pontuação de confiança para cada elemento que ele identificar, o que permite tomar decisões conscientes sobre como usar os resultados. Por exemplo, ao extrair informações de documentos fiscais, é possível definir um conjunto de regras personalizadas para indicar qualquer informação extraída com uma pontuação de confiança menor que 95%. Além disso, todos os dados extraídos retornam com coordenadas da caixa delimitadora, que é uma estrutura retangular que envolve completamente cada parte dos dados identificados para que seja possível identificar rapidamente onde uma palavra ou número aparece em um documento. É possível acessar esses recursos com a API do Amazon Textract, no Console de Gerenciamento da AWS ou usando a interface da linha de comando da AWS (CLI).

Os casos de uso mais comuns do Amazon Textract incluem:

  • Importação de documentos e formulários em aplicações comerciais
  • Criação de índices de pesquisa inteligentes 
  • Criação de fluxos de trabalho de processamento automático de documentos
  • Manutenção da conformidade em arquivos de documentos
  • Extração de texto para processamento de linguagem natural (PLN)
  • Extração de texto para classificação de documentos

O Amazon Textract pode detectar texto impresso e manuscrito em alfabeto padrão inglês e símbolos ASCII. O Amazon Textract pode extrair texto impresso, formulários e tabelas em inglês, alemão, francês, espanhol, italiano e português. O Amazon Textract também extrai dados explicitamente rotulados, dados implícitos e itens de linha de lista detalhada de bens ou serviços de quase todas as faturas ou recibos em inglês sem nenhum modelo ou configuração. O Amazon Textract também pode extrair dados específicos ou implícitos como nomes e endereços de documentos de identidade em inglês, como passaportes e carteiras de habilitação dos EUA, sem precisar de modelos ou configuração. Por fim, o Amazon Textract pode extrair qualquer dado específico de documentos sem se preocupar com a estrutura ou as variações dos dados no documento usando queries em inglês.

No momento, o Amazon Textract é compatível com os formatos PNG, JPEG, TIFF e PDF. Para APIs síncronas, é possível enviar imagens como objetos do S3 ou como matriz de byte. Para APIs assíncronas, é possível enviar objetos do S3. Caso o documento já esteja em um dos formatos de arquivo compatíveis com o Amazon Textract (PDF, TIFF, JPG e PNG), não converta ou reduza a resolução antes de carregá-lo no Amazon Textract.

Para começar a usar o Amazon Textract, clique no botão “Começar a usar o Amazon Textract” na página do Amazon Textract. É preciso ter uma conta no Amazon Web Services. Se ainda não tiver uma, será solicitado que você crie uma durante o processo. Uma vez logado na conta da AWS, experimente o Amazon Textract com as suas próprias imagens ou documentos PDF usando o Console de Gerenciamento do Amazon Textract. Também é possível baixar os SDKs do Amazon Textract para começar a criar suas próprias aplicações. Consulte o nosso Guia de conceitos básicos, onde está o passo a passo para obter mais informações.

O Amazon Textract faz o OCR usando a API Detect Document Text, mas dá um passo além no processo de análise de documento e também faz a detecção de par chave-valor para que as extrações permaneçam organizadas na estrutura desejada. A API Analyze Document pode detectar texto impresso, manuscrito, campos, valores, suas relações, tabelas e outras entidades dentro de um documento junto com as pontuações de confiança associadas. Com a API Analyze Document, os desenvolvedores podem capturar os dados estruturados automaticamente de uma grande variedade de documentos, inclusive formulários fiscais, relatórios financeiros, registros médicos e solicitações de empréstimo. A API Analyze Document também oferece aos desenvolvedores a flexibilidade para especificar os dados necessários para extração a partir de documentos usando consultas sem se preocupar com a estrutura dos dados ou as variações pelas quais os dados estão organizados em diferentes formatos e versões dos documentos. Usando consultas personalizadas, o recurso de consultas pode ser personalizado para melhorar a precisão da extração em documentos comerciais específicos. A API Analyze Expense pode localizar o nome do prestador de serviço em um recibo, mesmo se ele só for indicado em um logo na página, sem um rótulo explícito chamado “prestador de serviço”. Também é possível localizar e extrair item, quantidade e preços que não estejam identificados com cabeçalhos de coluna para items de linha. Com a API Analyze Expense, os desenvolvedores podem usar nomes de chaves e cabeçalhos de colunas normalizados ao extrair os dados de faturas e recibos para que aplicações downstream possam comparar facilmente a saída de muitos documentos. A API Analyze ID compreende o contexto dos documentos de identidade, como passaporte e carteira de habilitação dos EUA, sem a necessidade de recorrer a modelos ou configuração. Ao usar a Analyze ID, negócios que oferecem serviços de verificação de identidade, e aqueles das áreas de finanças, saúde e seguros, podem automatizar facilmente a criação de contas, agendamento de compromissos, candidaturas a emprego, e muito mais, ao permitir que os clientes enviem uma foto ou digitalização do documento de identidade. Para obter mais detalhes, consulte a referência da API do Amazon Textract.

A API Analyze Document tem os seguintes recursos: formulários, tabelas, consultas, consultas personalizadas, assinaturas e layout. É possível usar esses três recursos independentemente ou usar qualquer combinação deles. Use o recurso Formulários para extrair dados como pares de chave-valor (por exemplo, “Nome” e valor associado “Jane Smith”). Use o recurso Tabelas para extrair dados tabulares ou de tabela organizados em colunas e linhas. Use o recurso Queries para especificar as informações necessárias do documento na forma de perguntas em linguagem natural (por exemplo, “Qual é o nome do cliente?”) e receber a resposta (por exemplo, “Jane Doe”) como parte da resposta. Use consultas personalizadas para personalizar os recursos de consultas em documentos específicos da empresa. Você pode usar assinaturas para detectar assinaturas em documentos e usar o layout para identificar elementos de layout em um documento.

Publicamos um guia detalhado sobre as melhores práticas para criar queries como parte da Documentação de API na página de recursos do Textract. Em geral, os clientes devem tentar fazer uma pergunta em linguagem natural utilizando palavras do documento para construir uma query.

As queries são processadas por página e as informações podem ser extraídas usando as queries via operações síncronas e assíncronas. Para as operações síncronas, o máximo é de 15 queries por página. Para as operações assíncronas, o máximo é de 30 queries por página.

O Amazon Textract usa machine learning para ler praticamente todos os tipos de documento para extrair texto impresso, manuscrito e informações estruturadas. Tenha em mente as seguintes dicas para obter os melhores resultados:

  • Garante que o documento usa um idioma compatível com o Amazon Textract (atualmente, inglês, espanhol, italiano, português, francês e alemão. O processamento de manuscritos, faturas, recibos e documentos de identidade está disponível apenas em inglês).
  • Forneça imagens com a qualidade mais alta possível. Idealmente, de pelo menos 150 DPI.
  • Caso o documento já esteja em um dos formatos de arquivo compatíveis com o Amazon Textract (PDF, JPG e PNG), não converta ou diminua a resolução antes de carregá-lo no Amazon Textract.
  • O recurso de tabela do Amazon Textract trabalha melhor quando as tabelas no documento são separadas visualmente dos elementos ao redor delas na página (por exemplo, sem estar sobreposta a uma imagem ou padrão complexo), e o texto dentro da tabela está na vertical (por exemplo, não rotacionado em relação a outro texto na página).

Comece a analisar seus próprios documentos com o Amazon Textract em apenas alguns cliques no Console de Gerenciamento do Amazon Textract. Caso tenha problemas para obter uma alta precisão em recibos, identidades ou diagramas industriais, entre em contato conosco em [email protected] para obter assistência.

A pontuação de confiança é um número entre 0 e 100 que indica a probabilidade de determinada predição estar correta. Com o Amazon Textract, todo texto impresso, manuscrito e dados estruturados extraídos retornam com coordenadas de caixa delimitadora, que é uma estrutura retangular que envolve completamente cada parte dos dados identificados. Isso permite identificar a pontuação de cada entidade extraída para que seja possível tomar decisões conscientes sobre como usar os resultados.

Atualmente, o Amazon Textract está disponível nas regiões Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Oeste dos EUA (N. da Califórnia), AWS GovCloud (Oeste dos EUA), AWS GovCloud (Leste dos EUA), Canadá (Central), Europa (Irlanda), Europa (Londres), Europa (Frankfurt), Europa (Paris), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Seul) e Ásia-Pacífico (Mumbai).

Sim. O Amazon Textract é compatível com o registro em log das seguintes ações como eventos do CloudTrail: DetectDocumentText, AnalyzeDocument, StartDocumentTextDetection, StartDocumentAnalysis, GetDocumentTextDetection e GetDocumentAnalysis. Para saber mais detalhes, consulte Registro em log de chamadas de API do Amazon Textract com o AWS CloudTrail.

Você pode visualizar e gerenciar suas contas de serviço do Amazon Textract (anteriormente chamadas de limites de serviço) no console de Service Quotas da AWS. Você também pode estimar os requisitos de cota para seu caso de uso usando a calculadora de cotas de serviço do Textract. Para criar uma solicitação de aumento de cota de serviço:

1. Faça login no console da AWS, navegue até o console de Service Quotas da AWS e selecione “Textract” nos serviços da AWS.
2. Selecione a cota desejada e clique em “Solicitar aumento de cota” na página subsequente.
3. Insira o valor da cota desejada e clique em “Solicitar”.

Recomendamos a seguinte abordagem para mitigar o controle de utilização:

1. Implemente a lógica de repetição. Siga as diretrizes de tratamento de erros para configurar novas tentativas para erros de controle de utilização.
2. Configure o recuo exponencial e jitter. Configurar o recuo exponencial e a instabilidade à medida que você configura novas tentativas permite melhorar o throughput alcançável. Consulte Novas tentativas de erro e recuo exponencial na AWS.
3. Suavize seu fluxo de tráfego. O tráfego intenso afeta o throughput. Para obter o throughput máximo das transações alocadas por segundo (TPS), use uma arquitetura sem servidor de enfileiramento ou outro mecanismo para “suavizar” o tráfego e torná-lo mais consistente.
4. Comece com amostras que aplicam as melhores práticas.  Experimente usar nossos exemplos de IDP CDK usando estruturas de CDK.
5. Use a calculadora de cotas de serviço do Textract para estimar os requisitos de cota para seu caso de uso e enviar uma solicitação de aumento de cotas a partir do console de Service Quotas da AWS.

Faturamento

Uma imagem (PNG, TIFF ou JPEG) conta como uma página. Para PDFs, cada página no documento é contada como uma página processada.

Visite a página de definição de preço do Amazon Textract para saber mais sobre definição de preços.

O Amazon Textract é cobrado de acordo com o número de páginas e imagens processadas. Para obter mais informações, consulte a página de definição de preço.

Sim. Como parte do nível gratuito da AWS, é possível começar a usar o Amazon Textract gratuitamente. O nível gratuito dura três meses e novos clientes da AWS podem analisar até:

API Detect Document Text: mil páginas por mês
API Analyze Document:

  • 1.000 páginas por mês ao usar somente o recurso Signatures
  • 100 páginas por mês ao usar os recursos de formulários, tabelas e layout
  • 100 páginas por mês cada para consultas, formulários + consultas, tabelas + consultas, formulários + tabelas + consultas
  • Não há nível gratuito para consultas personalizadas

API Analyze Expense: 100 páginas por mês
API Analyze ID: 100 páginas por mês
API Analyze Lending: 2.000 páginas por mês

Para obter detalhes fiscais, consulte a ajuda sobre impostos da Amazon Web Services.

Privacidade de dados

O Amazon Textract pode armazenar e usar entradas de documento e imagem processadas pelo serviço exclusivamente para oferecer e manter o serviço e para aprimorar e desenvolver a qualidade do Amazon Textract e de outras tecnologias de machine learning/inteligência artificial da Amazon. O uso do seu conteúdo é necessário para uma melhoria contínua da experiência do cliente do Amazon Textract, inclusive o desenvolvimento e o treinamento de tecnologias relacionadas. Não usamos nenhuma informação de identificação pessoal contida no conteúdo para direcionar produtos, serviços ou marketing para você ou para seus usuários finais. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte https://aws.amazon.com/compliance/data-privacy-faq/ para saber mais. É possível optar por não ter suas entradas de documento e imagem usadas para aprimorar ou desenvolver a qualidade do Amazon Textract e de outras tecnologias de machine learning/inteligência artificial da Amazon, usando uma política de desativação da AWS Organizations. Para obter informações sobre como optar por não participar, consulte Gerenciando a política de desativação de serviços de IA.

Todo o conteúdo processado pelo Amazon Textract é criptografado e armazenado quando ocioso na região da AWS onde o Amazon Textract é usado. A menos que opte por não participar, conforme especificado abaixo, algumas partes do conteúdo processado pelo Amazon Textract poderão ser armazenadas em outra região da AWS exclusivamente para o aprimoramento e o desenvolvimento contínuos da experiência do cliente do Amazon Textract e de outras tecnologias de machine learning/inteligência artificial da Amazon. É possível solicitar a exclusão de entradas de imagem e de vídeo associadas à sua conta entrando em contato com o AWS Support. A sua confiança, a sua privacidade e a segurança do seu conteúdo são a nossa maior prioridade. Para isso, implementamos controles técnicos e físicos adequados e sofisticados, incluindo a criptografia de dados ociosos e em trânsito, projetados para evitar acesso ou divulgação de conteúdo sem a sua autorização e garantir que o nosso uso seja compatível com os compromissos que assumimos com você. Consulte https://aws.amazon.com/compliance/data-privacy-faq/ para saber mais. O conteúdo não será armazenado em outra região da AWS se você optar por não ter seu conteúdo usado para melhorar e desenvolver a qualidade do Amazon Textract e de outras tecnologias de machine learning/inteligência artificial da Amazon. Para obter informações sobre como optar por não participar, consulte Gerenciando a política de desativação de serviços de IA.

Sim. É possível solicitar a exclusão de entradas de documento e imagem associados à sua conta entrando em contato com o AWS Support. A exclusão de entradas de documento e imagem pode prejudicar a experiência com o Amazon Textract.

Sim. Você sempre mantém a propriedade do conteúdo. Somente usaremos o seu conteúdo com o seu consentimento.

Qualquer conteúdo usado para gerar adaptadores é processado internamente no Amazon Textract durante o treinamento. O conteúdo é criptografado em repouso e em trânsito. O conteúdo é armazenado e processado na região da AWS em que você está treinando o adaptador e é excluído após a conclusão do treinamento. Consulte https://docs.aws.amazon.com/textract/latest/dg/data-protection.html para obter mais informações.

Sim. A AWS expandiu seu programa de conformidade com a HIPAA para incluir o Amazon Textract como um serviço qualificado pela HIPAA. Caso tenha assinado um Acordo de associado comercial (BAA) com a AWS, você pode usar o Amazon Textract para extrair texto, inclusive informações de saúde protegidas (PHI) de imagens.

Saiba mais sobre a conformidade com a HIPAA

O Textract está qualificado para HIPAA e está em conformidade com PCI, ISO e SOC. Para obter mais informações, acesse o AWS Artifact no Console de Gerenciamento da AWS, ou visite https://aws.amazon.com/compliance/services-in-scope/. O Textract também oferece suporte a endpoints da Amazon Virtual Private Cloud (Amazon VPC) por meio do AWS PrivateLink, permitindo que os clientes iniciem chamadas de API para o Amazon Textract em suas VPCs e evitem usar a Internet pública.