Visão Computacional: Um Guia Completo para tirar suas dúvidas

Popularizada nos anos 1970, a Visão Computacional vem se expandindo através dos anos, e está longe de estagnar sua evolução. Considerada mais segura do que a visão humana, a técnica hoje é capaz de solucionar dores da indústria de modo prático e eficiente, fazendo com que empresas consigam escalar exponencialmente e estar a frente em seus setores.



Por definição, Visão Computacional (V.C.) é a vertente da Inteligência Artificial (I.A.) que captura e interpreta imagens, replicando funções condicionadas à visão humana.


De forma prática, isso quer dizer que a tecnologia é capaz não apenas de capturar imagens, mas também de distingui-las, classificá-las e agrupá-las, de acordo com um padrão previamente estipulado.

Imagem didática classificando gatos, cachorros e gatos e cachorros
Exemplo didático de como a Visão Computacinal pode capturar, classificar e agrupar

Porém, para que evoluísse e chegasse aos dias de hoje transformando padrões, a Visão Computacional (V.C.) passou por vários processos. O primeiro registro de uso de sistemas de VC aconteceu nos anos 1950 e, na época, os recursos conseguiam classificar objetos em categorias simples, como redondos e quadrados, detectando seus limites.


O que é visão computacional: a história do conceito


Para saber o que é visão computacional, precisamo de recorrer à História. Em 1972 a empresa Texas Instruments criou a primeira câmera digital do mundo e, três anos depois, em 1975 a Cromemco Cyclops tornou-se a primeira câmera digital vendida no mercado capaz de se conectar a um computador. A partir daí, e com a criação dos primeiros sensores, começou a ser possível interpretar as imagens.


Imagem da 1º Câmera Digital - 1975 | Cromemco Cyclops
Imagem da 1º Câmera Digital - 1975 | Cromemco Cyclops

Os primeiros projetos de V.C. tiveram como objetivo reconhecer e interpretar textos, tanto manuscritos quanto digitados, através do reconhecimento óptico dos caracteres. A ideia surgiu para que pessoas cegas fossem melhor inseridas no mercado e, até os dias de hoje, a vertente da I.A. tem um papel importante neste setor.


São muitas as formas que a Visão Computacional (V.C.) atua para auxiliar na inclusão e qualidade de vida das pessoas cegas. A Tecnologia Assistiva, nome utilizado para denominar o grupo de recursos e serviços que proporciona a pessoas com pouca ou nenhuma visão o acesso a produtos, recursos, metodologias, estratégias, práticas e serviços, tem a Visão Computacional (V.C.) como grande aliada.


Um exemplo disso são os jogos desenvolvidos para entretenimento e até mesmo avaliação de pessoas cegas. Como a vertente da I.A. ainda é um ramo em evolução, a maioria deles segue em fase de pesquisa e testes, mas já podem ser considerados um exemplo claro de como a tecnologia caminha em auxílio de diversos pilares sociais, como saúde e educação.


Os jogos - feitos inicialmente para pessoas não atípicas - tiveram uma grande importância na evolução da V.C., já que o boom dos games ajudou a popularizar a tecnologia.


A popularização da internet e dos vídeo games nos anos 1990 trouxe grande avanço para a tecnologia e, sobretudo, para a Visão Computacional (V.C.).


Deep Fake: Ultrapassando a realidade


A partir da primeira década dos anos 2000, o avanço tecnológico passou a escalar de forma rápida, trazendo recursos à população que antes pareciam impossíveis. Uma das técnicas que melhor exemplifica o avanço tremendo que processos de Visão Computacional (V.C.) vem ganhando é o Deep Fake.


Popularizado em 2020, o recurso é capaz de substituir a imagem de uma pessoa por outra, ou até mesmo criar a imagem de uma pessoa inexistente, em gravações de vídeos.


O termo mistura as expressões “Deep Learning” e “Fake”, o que quer dizer que utiliza-se do modelo hierárquico criado pelo Deep Learning para fazer com que máquinas aprendam padrões de comportamento humanos e produzam uma situação falsa, ou fake.


O produto do Deep Fake é um vídeo capaz de reproduzir expressões, aparência e até a voz de uma pessoa. Em geral, eles são criados em três etapas, sendo a primeira delas responsável por captar o máximo de imagens possível de uma pessoa, com expressões, iluminação variados - aqui, quanto mais, melhor.


Em seguida, são gravados os movimentos de uma segunda pessoa, que servirá de base para o vídeo. Por fim, acontece a junção do material capturado, nascendo o vídeo “que nunca aconteceu”.


Deep learing e inteligência artificial


Em todo o longo caminho percorrido pela Visão Computacional (V.C.) até aqui, um grande paradoxo se cria na evolução da função daquele que é responsável pela operação. Quando os primeiros funcionários operadores de V.C. surgiram, sua função era, acima de tudo, pesquisar. Era de responsabilidade do funcionário ser também um pesquisador, que coletasse manualmente todos os dados a serem utilizados no processo.


A diferença entre ele e o funcionário de hoje em dia é que, através de diversas vertentes da Inteligência Artificial (I.A.), as próprias máquinas tornam-se capazes de pensar, utilizando Datasets para alimentar automaticamente Redes Neurais responsáveis por definirem padrões. O operador, então, passa a ter a função de manusear a tecnologia, que pode ser aplicada em indústrias de diversos setores, sem que haja a necessidade de um especialista.

“A partir da segunda década dos anos 2000, começou a surgir uma nova revolução, e estamos agora surfando nesta onda: é a revolução do Deep learning, uma área da Inteligência Artificial"

disse Horácio Fortunato, Coordenador de Pesquisa e Desenvolvimento da Pix Force.

"Encontrou-se formas de poder treinar Redes Neurais, que são tecnologias já usadas há muito tempo, mas que a partir de agora juntando-se o hardware disponível com um grupo de imagens disponíveis e uma melhoria nos algoritmos de processamento, consegue-se começar a treinar redes neurais que consigam aprender a partir de exemplos.”

complementou Horacio Fortunato.


Sobre as constantes mudanças em I.A., Horacio ainda acrescenta:

"O treinamento de Redes Neurais é uma revolução que continua ainda hoje. A grande diferença entre o que se fazia antes e o que se faz agora é que antes o programador tinha que pensar em como extrair informações da imagem a partir de operações minuciosas. A partir da evolução das Redes Neurais, é a própria rede que aprende por exemplos”.

Visão computacional resolvendo os problemas das empresas


Existem alguns casos que exemplificam perfeitamente como a Visão Computacional (V.C.) tem participado ativamente de processos evolutivos dentro de vários nichos de negócios.


A análise de sentimentos, também conhecida como mineração de emoções, é uma tecnologia que consegue interpretar como clientes reagem em relação aos produtos de uma vitrine, por exemplo. Tudo isso acontece em tempo real, através das expressões que eles demonstram.


Uma análise deste tipo passa a ser mais segura, assim como outros tantos projetos de VC, do que a avaliação feita através de mão de obra humana, já que a presença de um funcionário pode fazer com que as pessoas se sintam inibidas. Além disso, uma pessoa pode interferir ou mal interpretar a reação de outra.


Outra das funções de reconhecimento facial que vem sendo bastante explorada existe dentro da área médica, mais especificamente para auxiliar pessoas com grandes limitações físicas.


A Revista da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) publicou recentemente uma matéria sobre um sistema de V.C. que consegue fazer possível que movimentos de uma cadeira de rodas possam ser comandados através do reconhecimento de expressões faciais brandas, como o arquear das sobrancelhas e o piscar dos olhos.


Detectar anomalias também é um trabalho que tem recebido grande investimento de tecnologias de V.C., já que precisão e segurança são, neste caso, de suma importância. Os desastres naturais, como barragens de mineração que transbordam por conta de enchentes, são um exemplo disso.


Para que a Rede Neural possa desempenhar seu papel, são coletadas imagens da barragem em seu estado natural e identificado como fora do padrão tudo o que seja diferente disso.


Como a visão computacional e a inteligência artificial ajudam as indústrias?


Um modelo de solução de Visão Computacional (V.C.) criado para atuar na área biológica é outro exemplo de solução de sucesso. Chamada U-Net, a Rede Neural foi desenvolvida pela Pix Force, e trabalha com um conjunto de imagens no Departamento de Ciência da Computação da Universidade de Freiburg, na Alemanha. Sua função é detectar precocemente doenças como o câncer, através da segmentação de células.


Muitos setores têm recebido benefícios diversos com a vertente da I.A. que tem revolucionado a indústria. Sistemas de rastreio dentro de uma cadeia de produção, por exemplo, podem garantir a qualidade de um produto, assim como agilizar sua identificação em casos de recall.


Da mesma forma, interpretações de exames médicos têm tido maior precisão, assim como a contagem de animais em grandes áreas, cálculo de volumetria, autenticação e reconhecimento facial e sistemas de robótica.

É inegável o quanto aplicar soluções de Inteligência Artificial (I.A.) dentro da indústria pode fazer com que ela escale rapidamente em relação à concorrência. Da mesma forma, a tecnologia tem facilitado, ou até mesmo viabilizado, processos que antes pareciam irreais.


Abaixo, mostraremos alguns cases desenvolvidos pela empresa Pix Force que utilizam da visão computacional para solucionar diversos problemas do setor industrial.


Pix Counter: mais avanço nas linhas de produção


Exemplo de tecnologia disruptiva que otimiza os processos industriais, o Pix Counter atua dentro de cadeias de produção. Através de sensores e câmeras RGB, a solução de Visão Computacional (V.C.) tem a função de fazer a contagem de itens em grande velocidade, operando com acurácia acima de 98%. Em relação a confiabilidade dos números, a solução chega a superar a capacidade humana, já que é automatizada.



A unidade piracicabana da ArcelorMittal, produtora multinacional de aço, realizava o processo de contagem de feixes de barra de aço através de mão de obra humana. Com a implementação da solução da Pix Force em sua linha de produção, a empresa passou a contar com um meio de contagem automatizado, rápido e preciso.


Um único feixe de barras de aço, que levava antes entre duas e três horas para ter sua contagem concluída, agora pode ser contado em cerca de um minuto, garantindo agilidade e segurança ao processo.


Além disso, a solução também traz precisão para a conferência de itens vendidos, já que as barras de aço são produzidas por peso, mas vendidas por unidade. Isso obrigava a multinacional a estimar a quantidade de barras enviadas para distribuição com base no peso dos feixes, sem conseguir obter o número exato de itens que estavam sendo destinados ao mercado internacional.


Deeptrack: salto na indústria mineradora com a ajuda de drones


Outro exemplo de solução que otimiza processos acontece, desta vez, na indústria mineradora. Chamada Deeptrack, ela introduz drones na inspeção da logística realizada pelas correias transportadoras, superando a capacidade humana para realização da tarefa. Veja no vídeo abaixo:



As aeronaves equipadas com sensores infravermelho e RGB são capazes de apontar as temperaturas individuais e a localização georreferenciada de cada rolo das correias, evitando o superaquecimento e consequentes paradas nas operações, que podem causar incêndios de maior porte.


Sistemas de visão computacional: melhor custo benefício para as empresas


Ao pensar em soluções tão tecnológicas, a maioria das pessoas tende a se perguntar se o custo benefício é eficaz. Para isso, é importante entender o quanto esse investimento pode gerar de benefícios para a empresa em questão.


Projetos de Visão Computacional (V.C.) costumam fazer com que as indústrias possam funcionar com um time de funcionários mais enxuto, desonerando aqueles que desempenhavam funções extremamente cansativas e perigosas e construindo um time mais estratégico. Da mesma forma, processos demorados passam a ser feitos rapidamente, e com precisão superior à mão de obra humana.


Sabemos o quanto os pilares segurança, tempo, precisão e bom aproveitamento do quadro de funcionários pode ser benéfico para que uma empresa escale exponencialmente. A ideia de aplicar V.C. dentro de setores industriais é justamente sanar dores latentes, relacionadas a processos que costumam ser lentos, pouco seguros e ineficazes.


Mesmo assim, é importante entender que um novo projeto só faz sentido se ele trouxer vantagens. A ideia é que o sistema seja capaz de realmente reduzir os custos, principalmente os que são ligados à manutenção preditiva.


Para que haja um custo benefício eficiente, a aplicação precisa trazer resultados visíveis ao longo do tempo, e não apenas de forma pontual. Da mesma forma, gestores e demais funcionários devem estar alinhados com a nova forma de trabalho.


Pix Force: tecnologia mais acessível para o mercado


Oficialmente no mercado desde 2016, a Pix Force surge para desenvolver soluções através de Inteligência Artificial (I.A.) e Machine Learning, gerando soluções para diferentes setores através da aquisição e interpretação automática de imagens e vídeos.



A empresa, que assume desafios do mundo real, está voltada para o desenvolvimento de novas tecnologias capazes de solucionar dores latentes dos clientes que atende.


As empresas que chegam até a Pix Force em busca de soluções de V.C., são aquelas que procuram não apenas deixar processos mais eficazes, mas também tornar os meios de produção mais seguros, já que com o uso de máquinas, funcionários são poupados de tarefas perigosas.


A partir daí, o setor consegue também englobar mecanismos de maior alcance da tecnologia, tornando viáveis passos maiores rumo ao crescimento em grande escala.


O cofundador da startup, Daniel Moura, explica a importância de trabalhar em parceria com clientes que investem em inovação, fazendo a diferença no fomento à competitividade e crescimento econômico.


“Os clientes com os quais temos trabalhado, além de serem referência em seus setores, são empresas que têm muito mérito no aspecto de inovação"

afirma Daniel Moura - Cofundador da Pix Force


Por quatro anos consecutivos, a Pix Force foi destaque no Ranking da 100 Open Startups, plataforma que apoia corporações e startups a gerarem negócios em inovação. Patrocinada por empresas globais, a 100 Open avalia e classifica startups que atuam em diferentes segmentos, oferecendo a grandes empresas a oportunidade de se conectarem com novos modelos de negócios.



O processo, chamado Matchmaking, viabiliza que empresas de negócio nascente se conectem a corporações já estabelecidas no mercado, gerando projetos de inovação de alto impacto que sejam interessantes e atrativos.


A startup gaúcha já se consolidou por meio de contratos com gigantes da indústria do aço, mineração, energia elétrica, entre outros segmentos de mercado. Os investimentos em projetos que resultaram em soluções tecnológicas ultrapassam a casa dos R$ 7 milhões.


E aí, o que você achou do nosso Guia Completo sobre Visão Computacional? Quer conhecer o trabalho da Pix Force? Escreva para gente no formulário!..