A visão computacional caminha para um novo salto


Um princípio básico para o desenvolvimento inteligência artificial é o uso de um dataset diversificado, vasto e estruturado. Numa analogia simples, para ensinar alguém sobre modelos de carros e suas características, é fundamental que a pessoa veja fotos e dados tanto de Volkswagens quanto Fords, veículos vermelhos, pretos e brancos. Com bastante experiência e familiaridade com os estilos e tendências dos fabricantes, será possível dizer que um automóvel pertence a tal montadora mesmo sem se ter visto aquele modelo anteriormente.


No treinamento de aprendizado de máquina (machine learning) a ideia é similar à supracitada. Entretanto, a construção desses datasets pode ser tornar um grande desafio. Colocando em perspectiva o desenvolvimento de visão computacional, área do conhecimento que aplica também técnicas de I.A. para extração de dados de imagens, podemos exemplificar da seguinte forma:


Se o algoritmo precisa classificar entre caminhões e carros, talvez um punhado de fotos de cada um desses tipos de veículos seja suficiente. Pode-se ter várias fotos do mesmo modelo de carro, do mesmo modelo de caminhão, as características são tão diferentes, que possivelmente a rede irá classificá-los de forma relativamente rápida e precisa. Entretanto, se o objetivo é classificar hatches compactos quanto a cor, fabricante e modelo, será necessário outro nível de dataset. Provavelmente centenas de fotos de Chevrolets Onix pretos, VW Gol prata, Ford Ka branco. Uma boa amostra de imagens de cada modelo, de cada montadora com suas variações de cores.

Assim fica a pergunta, como gerar esse dataset de forma ágil e custos competitivos? A Pix Force tem trabalhado com seus parceiros de forma colaborativa. O exemplo automotivo não foi dado em vão, juntamente com a Porto Seguro Seguradora (PS) foi desenvolvido um trabalho ímpar para criação de dataset.


A PS tinha interesse em classificar características específicas em alguns modelos de automóveis, no entanto, para reconhecer e classificar essas características, fazia-se necessário grande conhecimento na área. O caminho tradicional seria a PS ensinar para Pix Force como classificar os pontos de interesse e disponibilizar o banco de dados. Entretanto algo diferente foi realizado, a Pix Force treinou a equipe da PS a usar o software proprietário de anotação (etapa de estruturação de dados em imagens) e os próprios peritos da PS incorporaram essa etapa ao seu processo por algumas semanas. Esta foi a forma mais ágil e precisa de se construir um banco de dados estruturado.

Outro exemplo de cooperação na anotação de imagens é a RedSoft, joint venture da Pix Force e iBeef. A RedSoft classifica carcaça de bovinos em frigoríficos quanto a sua qualidade, o que impacta diretamente em seu valor. Além disso, o sistema rastreia a carne ao longo do processo de beneficiamento. De forma similar ao que foi feito com a Porto Seguro, o time de zootecnistas e veterinários da iBeef, sob orientação da Pix Force, classificou mais de 100 mil imagens de carcaças, criando um dataset robusto para que os algoritmos possam ser treinados e que atinjam altíssima precisão.


Nas imagens abaixo é possível notar a evolução dos sistemas de classificação automática à medida que o dataset é cada vez mais diverso, vasto e estruturado.


Grande parte dos custos de implantação de I.A. estão ligados ao desenvolvimento, sendo que em alguns casos, a construção do dataset é significativo. Desta forma, novos métodos que facilitem a geração de dados estruturados são imprescindíveis para expansão do uso de I.A. e aumento da competitividade da indústria nacional.