A visão computacional (CV) é um subdomínio do campo da Inteligência Artificial que visa ajudar as máquinas a identificar e compreender o conteúdo em vídeo ou imagens digitais. Simplificando, o CV permitiu que as máquinas “vessem” o mundo como nós, humanos, e usássemos esse conhecimento para aumentar os esforços humanos. Essa tecnologia usa câmeras e computadores em vez do olho humano para identificar, rastrear e medir alvos para posterior processamento de imagem.
Exemplos de aplicativos de visão computacional incluem carros autônomos que usam várias câmeras para perceber o ambiente ao seu redor, como outros carros, ciclistas, pedestres, obstáculos etc. para identificar que é realmente você para desbloquear o telefone. A Visão Computacional é uma área ativa de pesquisa e desenvolvimento em todo o mundo, com melhores algoritmos de CV e processadores de hardware e ambientes de hospedagem sendo lançados quase toda semana!
Como mencionado acima, o CV permite que as máquinas percebam o mundo como os humanos, mas por serem máquinas, elas podem operar sem parar 24 horas por dia, 7 dias por semana e em velocidades extremamente altas, muito mais rápido do que os humanos, e fazê-lo objetivamente, sem qualquer preconceito ou descuido humano. e até mesmo fazê-lo com maior precisão. E com o avanço da tecnologia, a execução de aplicativos CV em dispositivos de ponta também se tornou barata e amplamente adotada em todo o mundo.
O CV está sendo usado em uma ampla variedade de aplicativos (o restante do artigo é um mergulho profundo nos casos de uso), com mais aplicativos se tornando possíveis assim que a tecnologia amadurece. De acordo com um relatório de 2021 da Verified Market Research , o tamanho do mercado de IA em visão computacional foi avaliado em US$ 7 bilhões em 2020 e está projetado para atingir US$ 144 bilhões até 2028, crescendo a um CAGR impressionante de 45% de 2021 a 2028!
As empresas podem usar o CV para reduzir custos e aumentar a eficiência operacional, automatizando tarefas repetitivas, demoradas, subjetivas, trabalhosas e tediosas e transformando-as em tarefas que podem ser bem tratadas por máquinas de maneira objetiva e não invasiva e executadas 24 horas por dia, 7 dias por semana, sem qualquer necessidade de parar a qualquer momento para qualquer intervalo e implantado em qualquer escala. As empresas podem implementar melhores processos de controle de qualidade em um ritmo e escala que os humanos nunca conseguirão realizar. Usando o CV, as empresas podem gerar ganhos maciços de produtividade, aumentar a receita e realizar mais em um tempo exponencialmente menor com recursos significativamente menores.
O Edge CV está simplesmente executando a computação CV em dispositivos de borda. Ao contrário da computação em nuvem, a computação de borda aproxima as cargas de trabalho dos usuários e da fonte de dados. Isso oferece enormes vantagens: processamento e análise de dados em tempo real (já que os dados não precisam percorrer todo o caminho até os servidores em nuvem e vice-versa, economizando preocupações com a latência da rede), minimiza o consumo de largura de banda da rede, reduz o consumo de energia, melhora a eficiência da computação , e melhora a postura de segurança cibernética. Tradicionalmente, os dispositivos de borda não eram poderosos o suficiente para computação CV e, portanto, a maior parte do processamento deve ser delegada a clusters de máquinas na nuvem. Mas com os recentes avanços nas tecnologias de ponta, o poder de processamento aumentou tremendamente, sendo energeticamente eficiente. Além disso, a Visão Computacional na borda pode resolver qualquer problema de privacidade, garantindo que os dados nunca saiam do dispositivo de borda, ajudando na mudança do cenário de regulamentação de privacidade em todo o mundo.
O setor de varejo físico está sempre procurando oferecer a seus clientes a melhor experiência na loja para maximizar o tamanho da cesta, adquirir e reter clientes e, por fim, aumentar a fidelidade do cliente. O CV pode ser usado para gerar insights e análises críticas de maneira automatizada, sem a necessidade de técnicas demoradas, empregando observadores humanos ou dispositivos físicos caros de rastreamento, e fazendo isso 24 horas por dia, sem tempo de inatividade ou erros. Adquirir repetição tem necessidades... os donos de lojas querem saber o tráfego, tipo de clientes (idade, sexo, tamanho do grupo, etc.) e correlacionar para que possam maximizar o tempo gasto na loja e maximizar o tamanho da cesta
Contagem de pessoas: detecte e rastreie pessoas individuais no vídeo em tempo real para análise do tráfego de clientes. A contagem de pessoas tornou-se especialmente popular com a pandemia de COVID-19, com as lojas restringindo o número de pessoas dentro para evitar a propagação da pandemia. A contagem de pessoas também pode ser usada para contar o número de pessoas esperando na fila e notificar os gerentes para alocar mais pessoas para verificar as estações.
Análise do comportamento do cliente: rastreie o tempo que os clientes passam em uma seção específica da loja e olhando para itens específicos (também conhecido como tempo de permanência). Aplicativos baseados em currículo também podem ser usados para anotar regiões de interesse ou limites e rastrear quantas pessoas cruzam o limite, quanto tempo as pessoas passam na região de interesse e rastrear para onde as pessoas estão indo para uma visualização de como as pessoas se movem pela loja . Esses insights também podem revelar horários de pico e gargalos. Uma vez que essas métricas existam para todas as lojas, o gerenciamento pode começar a comparar as principais métricas em diferentes locais para identificar e melhorar o desempenho da loja.
Mapas de calor de pessoas: refere-se à visualização do movimento dos indivíduos em espaços físicos ao longo do tempo. Ao atribuir cores a áreas que veem mais movimento em relação a outras e visualizá-las como um gráfico de contorno, os proprietários das lojas podem entender melhor os pontos de interesse, quais seções veem mais tráfego de pedestres em comparação com outras e usar essas informações para otimizar a colocação do produto ou atenuar gargalos
Segurança ocupacional: Os locais de trabalho de fabricação consistem em máquinas, equipamentos e pessoas em movimento e são um ponto crítico de acidentes. Os aplicativos CV podem ajudar a aumentar a segurança do trabalhador, identificar situações perigosas e prevenir acidentes em tempo real, aumentando a produtividade e a eficiência e reduzindo o risco de interrupções nos negócios. Por exemplo, o CV pode ajudar a detectar posturas humanas inadequadas para que possam ser notificadas e corrigidas para evitar lesões.
Detecção de EPI (equipamento de proteção individual): o CV pode ser usado para detectar e monitorar o uso de capacetes, equipamento de proteção ocular, detecção de colete e muito mais.
Localize equipamentos pesados de construção , como escavadeiras, guindastes, geradores ou tratores, e detecte quando os trabalhadores estiverem operando nessas áreas perigosas. Essas detecções automatizadas podem ser documentadas e quaisquer violações registradas para que os infratores recorrentes possam ser melhor treinados ou demitidos e os protocolos de segurança nas fábricas ou nos canteiros de obras possam ser atualizados
Governos de todo o mundo estão tentando usar a tecnologia para manter as pessoas seguras, detectar criminosos e perpetradores e tornar as comodidades e serviços públicos mais fáceis e convenientes de usar.
License Plate Recognition (LPR): usa a tecnologia CV para ler as placas dos veículos a partir de feeds de vídeo em tempo real. Os últimos avanços na tecnologia LPR permitiram a leitura de placas mesmo para veículos em alta velocidade sob cenários e iluminação complexos. O LPR já é amplamente utilizado em sistemas de cobrança de pedágio e gerenciamento de estacionamentos, detectando e identificando infrações de trânsito, aplicação da lei com mais aplicativos e soluções de alto desempenho, escaláveis e de baixo custo sendo desenvolvidas em todo o mundo.
Semáforos otimizados: em vez de confiar na lógica baseada em cronômetro, o CV pode ser usado para sobrecarregar o movimento do tráfego, detectando automaticamente o movimento do tráfego e contando os veículos em uma fila para que os semáforos possam ser otimizados dinamicamente para aumentar a taxa de tráfego durante o pico, bem como fora do horário de pico. horas de pico.
Detecção de objetos abandonados e suspeitos: as tecnologias CV podem ser usadas para identificar objetos suspeitos que foram deixados para trás em locais públicos e as autoridades alertadas para que as pessoas possam ser evacuadas se necessário e a área protegida sem perda de vidas humanas e propriedades. Armas, incluindo revólveres e facas, também podem ser detectadas em tempo real e as autoridades são alertadas instantaneamente para resposta rápida e perda de vidas humanas.
Ocupação do estacionamento: Usando a tecnologia CV para a contagem de veículos, as vagas de estacionamento podem ser disponibilizadas on-line para que a disponibilidade em um estacionamento seja conhecida antes que os carros entrem nele, evitando loops intermináveis e incontáveis minutos gastos procurando uma vaga, especialmente durante os horários de pico. Essas informações podem ser retransmitidas e pesquisáveis pelo público e levarão a fluxos de tráfego mais eficientes e transporte previsível.
Monitorar os espaços físicos para segurança de pessoas e pessoal, infraestrutura crítica e proteção de equipamentos tem sido uma das aplicações mais antigas dos sistemas de câmeras de vigilância CFTV. O CV sobrecarregou a capacidade do sistema detectando e respondendo autonomamente a invasões em tempo real, sem qualquer intervenção humana. Os modernos sistemas de segurança física são inteligentes o suficiente para chamar o envio de serviços de emergência automaticamente ou, em casos de confusão, solicitar verificação humana.
Detecção de pessoas e veículos: O algoritmo CV executado na câmera (ou nuvem) pode detectar e marcar automaticamente todos os objetos (pessoas ou veículos) vistos pela câmera, incluindo o armazenamento de um instantâneo das pessoas. O operador pode marcar uma ou mais pessoas ou veículos como Pessoas de interesse (PoI) ou Veículos de interesse (VoI). Na próxima vez que a pessoa ou veículo for visto pela câmera, o operador pode ser alertado automaticamente para uma resposta adequada.
Pesquisa baseada em atributos: Ser capaz de pesquisar pessoas pela cor das roupas, sexo, acessórios e veículos por cor, marca e modelo torna exponencialmente fácil encontrar as pessoas nas imagens gravadas em vez de percorrer dias de filmagens.
Pesquisa em várias câmeras: a tecnologia CV pode permitir que pessoas e veículos sejam revistados em todas as câmeras em um local que é inestimável na criação de uma linha do tempo forense de eventos para resolução rápida de investigação.
Correspondência facial: os modelos de CV podem ser usados para combinar rostos para determinar a semelhança e identificar se 2 fotos são da mesma pessoa. Isso pode ser usado para encontrar todas as instâncias em que uma determinada pessoa foi flagrada por câmeras CCTV em vários dias.
Desfoque de rosto: O desfoque de rosto inteligente pode ser usado para detectar e desfocar os rostos de todas as pessoas não relevantes em uma fita de segurança, protegendo sua privacidade
O CV desempenha um papel crítico na habilitação de fazendas e ranchos inteligentes, especificamente para detecção, rastreamento e até monitoramento de gado de gado! Há uma pressão crescente sobre a terra e os recursos limitados para continuar alimentando a população mundial em expansão. Ao mesmo tempo, a demanda por produtos pecuários sustentáveis, juntamente com o custo crescente da mão de obra e a escassez de trabalhadores, aumentou drasticamente a demanda por tecnologias que possam oferecer maior eficiência operacional, viz. aumentar a produtividade com uma base de trabalhadores significativamente menor e a um custo menor. Pode-se usar várias câmeras estáticas ou usar UAVs também. Isso depende do tamanho da área a ser monitorada
O CV tem enormes benefícios em uma ampla gama de aplicações de saúde - desde o monitoramento da saúde do paciente até a análise ambiental e usos comerciais, como condicionamento físico, treinamento e treinamento de exercícios. Os benefícios são que isso pode ser feito 24 horas por dia, 7 dias por semana, sem se preocupar com atendentes dormindo, supervisão humana e trabalho noturno. O melhor de tudo é que a privacidade dos pacientes pode ser protegida por meio do processamento no dispositivo, sem imagens saindo da câmera a qualquer momento.
Detecção de quedas: As quedas são um grande problema em todo o mundo, com 30% das quedas causando lesões graves, portanto, não é surpresa que a detecção de quedas esteja tendo uma rápida adoção na população idosa de hoje. As câmeras colocadas nos espaços dos pacientes podem monitorar os movimentos dos pacientes, incluindo mudanças repentinas, como quedas e escorregões. Quando uma queda é detectada, a equipe pode ser notificada imediatamente, em vez de depender de informações humanas e check-ins de rotina para detectar o acidente, levando a um tratamento rápido e uma recuperação mais rápida. O melhor de tudo é que a detecção de queda baseada em CV não precisa de nenhuma configuração nem de nenhum wearable caro ou se preocupa com esses dispositivos serem invasivos ou precisarem ser carregados ou simplesmente esquecidos.
Reconhecimento de postura: detecta o corpo humano em diferentes posturas, como deitado, dormindo, sentado, andando, em pé, etc. A detecção de postura pode ser usada para identificar comportamentos suspeitos, como violência ou agressão, incidentes como detecção de queda ou ferimentos e diversos aplicativos de assistência médica que precisam medir o tempo gasto em diferentes atividades, como caminhar, sentar e ficar em pé, para relatórios abrangentes de saúde e atividades.
Monitoramento de distanciamento social e detecção de máscara: com a recente pandemia, a maioria dos órgãos governamentais e reguladores recomendou manter uma distância de 2 metros e usar máscaras em espaços públicos. As tecnologias baseadas em CV podem detectar facilmente violações humanas desses regulamentos e alertar as pessoas envolvidas ou alertar automaticamente as autoridades.
Treino de exercícios físicos e on-line: uma onda de dispositivos de exercícios domésticos recentes depende do CV para detectar a postura durante diferentes exercícios e recomendar correções para evitar lesões e aproveitar ao máximo o treino
Detectar e desfocar rostos em tempo real: o CV pode ser usado para detectar rostos humanos e desfocá-los seletivamente para proteger sua privacidade. Essas ferramentas são inestimáveis para uma resposta a incidentes ao compartilhar vídeos e evidências com as autoridades, de modo que a privacidade daqueles que não estão envolvidos no incidente seja protegida.
Também publicado aqui.