Detectar texto - Amazon Rekognition

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Detectar texto

O Amazon Rekognition pode detectar texto em imagens e vídeos. Depois, é possível converter o texto detectado em texto legível por máquina. Você pode usar a detecção de texto legível por máquina em imagens para implementar soluções como:

  • Pesquisa visual. Por exemplo, recuperar e exibir imagens que contêm o mesmo texto.

  • Insights de conteúdo. Por exemplo, fornecer informações sobre temas que ocorrem em textos reconhecidos em quadros de vídeo extraídos. O aplicativo pode pesquisar conteúdo relevante em texto reconhecido, como notícias, placares esportivos, números de atletas e legendas.

  • Navegação. Por exemplo, desenvolver um aplicativo móvel com recurso de fala para pessoas com deficiência visual que reconheça nomes de restaurantes, lojas ou placas de rua.

  • Segurança pública e suporte de transporte. Por exemplo, detectar números de placas de carros a partir de imagens de câmeras de trânsito.

  • Filtrando. Por exemplo, filtrar informações de identificação pessoal (PII) de imagens.

Para a detecção de texto em vídeos, é possível implementar soluções como:

  • Pesquisar vídeos em busca de clipes com palavras-chave de texto específicas, como o nome de um convidado em um gráfico em um programa de notícias.

  • Moderar o conteúdo para conformidade com os padrões organizacionais, detectando texto acidental, palavrões ou spam.

  • Encontrar todas as sobreposições de texto na linha do tempo do vídeo para processamento adicional, como substituir texto por texto em outro idioma para internacionalização do conteúdo.

  • Encontrar locais de texto, para que outros gráficos possam ser alinhados adequadamente.

Para detectar texto em imagens no formato JPEG ou PNG, use a operação DetectText . Para detectar texto em vídeo de forma assíncrona, use as operações StartTextDetection e GetTextDetection. As operações de detecção de texto em imagem e vídeo suportam a maioria das fontes, inclusive as altamente estilizadas. Depois de detectar o texto, o Amazon Rekognition cria uma representação das palavras e linhas de texto detectadas, mostra a relação entre elas e informa onde o texto está em um quadro de imagem ou vídeo.

As operações GetTextDetection e DetectText detectam palavras e linhas. Uma palavra é um ou mais caracteres de script que não estão separados por espaços. DetectText pode detectar até 100 palavras em uma imagem. GetTextDetection também pode detectar até 100 palavras por quadro de vídeo.

Uma palavra é um ou mais caracteres de script que não estão separados por espaços. O Amazon Rekognition foi projetado para detectar palavras em inglês, árabe, russo, alemão, francês, italiano, português e espanhol.

Uma linha é uma sequência de palavras igualmente espaçadas. Uma linha não é necessariamente uma frase completa (os pontos não indicam o final de uma linha). Por exemplo, o Amazon Rekognition detecta o número da carteira de motorista como uma linha. Uma linha termina quando não há texto alinhado depois dela ou quando há uma grande lacuna entre as palavras, em relação ao comprimento das palavras. Dependendo da lacuna entre as palavras, o Amazon Rekognition pode detectar várias linhas no texto alinhadas na mesma direção. Se uma frase tiver várias linhas, a operação retornará várias linhas.

Considere a imagem a seguir.

As caixas azuis representam informações sobre o texto detectado e a localização do texto retornado pela operação DetectText. Neste exemplo, o Amazon Rekognition detecta "É", "SEGUNDA-FEIRA", "mas", "continue" e "Sorrindo" como palavras. O Amazon Rekognition detecta "É", "SEGUNDA-FEIRA", "mas continue" e "Sorrindo" como linhas. Para ser detectado, o texto deve estar na orientação de +/- 90 graus do eixo horizontal.

Para ver um exemplo, consulte Detectar texto em uma imagem.