Pular para o conteúdo
VoltarVoltar
Data augmentation: o que é e como usar essa técnica?

Data augmentation: o que é e como usar essa técnica?

11 de maio de 2023
6 minutos de leitura
time

Artigo atualizado em 11 de maio de 2023

Você já ouviu falar em data augmentation? Esse é um conjunto de técnicas utilizadas para ampliar a quantidade de dados tendo como base informações já existentes. É um método que utiliza a tecnologia emergente do machine learning (“aprendizado da máquina”) para melhorar modelos de aprendizado e muito mais.

Ficou curioso para conhecer mais sobre o data augmentation? Então, continue conosco e confira o que é essa técnica, como funciona, suas principais aplicações, desafios e mais!

O que é data augmentation?

O data augmentation é um conjunto de técnicas cujo objetivo é melhorar a qualidade dos dados, dessa forma, melhorando o desempenho dos modelos de aprendizado. De modo geral, ele processa imagens e aumenta a quantidade de dados de treinamento disponíveis para um modelo, através da criação de novas amostras a partir das já existentes.

Então, podemos definir o data augmentation como um processo que aumenta a quantidade e diversidade de dados de um dataset através da tecnologia de machine learning. Ou seja, para não precisarmos coletar milhares de dados novos para cada projeto ou problema que surge, recorremos a esse método.

Como funciona na prática?

A técnica de data augmentation pode ser aplicada de várias maneiras, incluindo o aumento da escala, rotação, corte, espelhamento, mudança de contraste, e outras transformações nas imagens originais. O objetivo é melhorar a capacidade do modelo em reconhecer e generalizar padrões, aumentando a variedade e a diversidade dos dados de treinamento.

Essa técnica é muito útil em problemas de classificação de imagens, onde a disponibilidade de dados de treinamento é limitada ou desbalanceada. A aplicação do data augmentation pode reduzir o risco de overfitting (modelo estatístico que se ajusta muito bem ao conjunto de dados anteriormente observado) e aumentar a precisão do modelo, tornando-o mais robusto e conciso.

Além disso, pode ser aplicada em diversos tipos de dados, como imagens, áudios, tabulares e textos. Para isso, existem duas abordagens principais. Veja quais são elas:

  • Warping (distorção): preserva o rótulo e transforma os dados presentes;

  • Oversampling (síntese): com o aprendizado extraído dos dados, gera novas amostras sintéticas.

Para que esse processo aconteça, existem scripts prontos que são utilizados para gerar esses novos dados. A tecnologia vai analisar os dados existentes e alterá-los, criando novas informações.

Você sabe quais são as tendências tecnológicas atuais? Confira agora mesmo!

Tipos de aplicação de data augmentation

Existem algumas técnicas específicas utilizadas no data augmentation, afinal, não existe apenas uma maneira de gerar novos dados tendo como base informações existentes. Venha ver quais são os principais tipos de aplicação:

Técnicas tradicionais

As técnicas tradicionais produzem amostras de dados que auxiliam os modelos a identificarem elementos independentes de suas características, como: ângulo, ruídos, saturação, iluminação e outros. Além disso, nesse tipo de aplicação também estão inclusas as mudanças fotométricas e geométricas. Entre elas temos:

  • Rotação: girar a imagem original em um determinado ângulo;

  • Espelhamento: virar a imagem horizontal ou verticalmente;

  • Zoom: ampliar ou reduzir a imagem original;

  • Translação: deslocar a imagem original em uma direção específica;

  • Corte aleatório: cortar aleatoriamente uma parte da imagem original;

  • Alteração de cores: alterar a saturação, o brilho, o contraste ou outras propriedades de cor da imagem original para gerar novas imagens.

As técnicas tradicionais podem ser usadas individualmente ou combinadas para criar conjuntos de dados de treinamento maiores e mais variados.

Image erasing

O image erasing (traduzindo livremente para o português, “apagamento de imagem”) consiste na remoção aleatória de uma pequena parte da imagem para substituí-las por valores diferentes. O objetivo dessa técnica é incentivar o aprendizado das máquinas para que ela possa identificar características mais descritivas.

Essa é um método complementar às técnicas de aumento de dados comumente utilizadas, as técnicas tradicionais, tais como o corte e viragem aleatória. Ele produz uma melhoria significativa nas linhas de base da classificação de imagens, detecção de objetos e re-identificação de pessoas.

Meta-aprendizado

O meta-aprendizado busca aprender automaticamente quais serão as melhores modificações e transformações para um conjunto de dados específicos. Ou seja, ele aprende uma rede para se adaptar facilmente a novas tarefas com dados ilimitados. Para isso, simula procedimentos de adaptações e avaliações durante o meta-treinamento.

A técnica pode ser particularmente útil em situações em que os conjuntos de dados são muito grandes ou complexos para serem facilmente processados por métodos tradicionais de aumento de informação. Ele pode ajudar a melhorar a precisão dos modelos de aprendizado de máquina, ao mesmo tempo, reduzindo a quantidade de dados de treinamento necessários.

Modelos generativos profundo

Esse é um conjunto de técnicas usadas para gerar novos dados a partir de um conjunto de informações já existentes. Nesta abordagem, o modelo gerativo profundo aprende a modelar a distribuição de probabilidade dos dados existentes, portanto, será capaz de gerar novos dados que são similares aos originais.

Uma técnica comum para isso é o uso de redes adversas generativas (do inglês, Generative Adversarial Networks — GANs), onde uma rede gera novos dados e outra rede os avalia para determinar se são verdadeiros ou falsos.

Confira o nosso post sobre a transformação digital e entenda o porquê investir em tecnologias inovadoras como o data augmentation!

Quais são os principais desafios da área?

Apesar da técnica do data augmentation já estar bem desenvolvida e desempenhar um ótimo trabalho em suas tarefas, ainda existem diversas melhorias que podem ser feitas. Veja quais são elas:

  • Aumento excessivo: ao aplicar as técnicas do data augmentation, é possível gerar dados sintéticos que não representam adequadamente a variabilidade dos dados reais;

  • Dificuldade em identificar as melhores técnicas de data augmentation: existem várias técnicas disponíveis, mas nem todas elas funcionam igualmente bem para todos os tipos de dados;

  • Necessidade de mais poder computacional e tempo de treinamento: ao aumentar a quantidade de dados no conjunto de treinamento, o modelo levará mais tempo para treinar, o que pode exigir mais poder computacional. Além disso, algumas técnicas de data augmentation, como o aumento de imagem, podem exigir mais recursos de armazenamento;

Em resumo, o data augmentation é uma técnica valiosa para melhorar o desempenho dos modelos de aprendizado de máquina, mas é importante considerar os desafios associados a ele e aplicar as técnicas de forma cuidadosa e criteriosa. Esperamos que esse post tenha tirado todas as suas dúvidas a respeito do assunto.

Continue acompanhando o blog do Distrito para mais conteúdos como esse. Ah, aproveite e confira nosso texto sobre o cenário dos investimentos em tecnologias emergentes na América Latina. Até a próxima!