Alguns anos atrás, fiz uma pergunta simples ao Google Assistant (não me lembro o que era) e trouxe uma resposta não relacionada. Eu perguntei novamente, e trouxe uma resposta diferente. Eu tive que digitar minha pergunta.
Meu inglês falado e minha sotaque melhoraram devido ao desenvolvimento e exposição pessoal, mas também posso dizer que muitos aplicativos e softwares de reconhecimento de voz estão se tornando mais adaptáveis aos falantes africanos (em termos de sotaque). No entanto, a verdade é que o reconhecimento de voz para os africanos tem um caminho muito mais longo a percorrer.
Ainda me pergunto por que não temos muitos aplicativos que podem ser solicitados com os principais idiomas africanos locais, dos quais existem mais de 10 milhões de falantes nativos. Então, decidi falar com um linguista de campo e pesquisador acadêmico sobre a situação atual da inteligência artificial e do processamento de linguagem natural em contextos e línguas africanas.
Olá, sou Olanrewaju Samuel.
Estou interessado em fonologia computacional, construção de conjunto de dados, anotação e curadoria, processamento de linguagem natural e linguística de campo.
Meu principal mentor é
Ainda não sou rigoroso com meus objetivos de pesquisa, mas estou focado em desenvolver meus conhecimentos e explorar minhas possibilidades por enquanto. Não pelas certificações em si, mas pelo autodesenvolvimento. Então, estou buscando me desenvolver ao mesmo tempo em que tento concluir meu programa aqui e passar para outras coisas.
Colaborei com diferentes grandes indivíduos para fazer parte de diferentes publicações. Um dos meus artigos linguísticos recentes é “
Isso inclui:
Estou ministrando um curso intitulado “Processamento de Linguagem Natural para Linguistas”. Basicamente, estou ensinando processos linguísticos de linguagem natural dentro dos contextos africanos em Kigali, Ruanda.
Tenho a tarefa de fornecer e demonstrar as nuances da construção, anotação, curadoria, análise e publicação de conjuntos de dados multilíngues para diferentes tarefas de NLP, como na construção de modelos de linguagem grandes (LLM). Um grande modelo de linguagem significa trazer vários sistemas de linguagem para funcionar dentro de um único fluxo. Tentamos conseguir isso por lateralização, que é uma espécie de treinamento do sistema de IA com um padrão ou modelo. O padrão então se torna a base para suas outras aplicações.
Além da IA conversacional, estamos procurando fazer algo significativo no campo da IA generativa, que ainda faz parte da lateralização da capacidade do modelo de permutar dados e gerar resultados por computação matemática, como probabilidade.
A PNL tem sido usada em muitos casos em toda a África, alguns dos quais incluem robótica e IA conversacional. Um exemplo típico de IA conversacional é o Alaye de Lagos, que ajuda os turistas naturais (nigerianos de outros estados) a se orientarem em Lagos —uma megacidade e estado— e a identificar locais como restaurantes, clubes, lojas, e até situações de trânsito usando o popular pidgin nigeriano (Naija pidgin).
Estamos desenvolvendo modelos de IA que podem ser treinados para executar tarefas – um sistema ou processo complexo é reduzido a uma simples sequência de comandos (modelagem). Essa é a aplicação prática da PNL na robótica como está na África, no momento.
Atualmente, na lingüística, a aplicação da IA é principalmente na automação, embora existam modelos linguísticos infundidos em diferentes aplicações de IA, como em robôs e chatbots, entre outros.
Temos algumas pessoas fazendo coisas realmente boas, como
Um grande desafio para a paisagem da África em encontrar relevância global na indústria de IA é a limitação dos recursos linguísticos (dados). A África é multilíngue, portanto, existem
Se alguma coisa acontecer com a IA, acontecerá com as linguagens de alto recurso. Mesmo que isso aconteça com as línguas africanas, não temos os sistemas para capacitá-las. Portanto, estamos ficando para trás porque não temos o suficiente para trabalhar, e o problema tem sido um problema de quase toda a vida de nossa falta de documentação.
Veja a Nigéria, por exemplo, com mais de 200 tribos, mas apenas três idiomas são os mais populares. Ao contrário de Yoruba, Igbo e Hausa, tribos e idiomas menores têm poucos dados (dados de poucos recursos). Isso é o que estamos tentando fazer em
Os técnicos de IA e PNL não estão investindo porque não acreditam nisso ou acham que não há dados suficientes para explorar para seu ROI. Portanto, esperamos que nossos trabalhos subterrâneos atuais sejam o avanço.
Além disso, a África é marginalizada no mercado global de IA linguística e PNL porque os mecanismos de busca mais populares são asiáticos e ocidentais (americanos, especialmente). Além disso, para alguns de nossos trabalhos aqui, não podemos receber crédito por eles como africanos por causa do patrocínio.
Os países africanos que causaram o maior impacto incluem África do Sul, Quênia e Ruanda – esses caras são loucos! A Nigéria também está tentando, mas a maioria das pessoas que deveriam estar explorando o espaço não está buscando desenvolvimento, mas as gratificações de certificações acadêmicas. Valorizamos nosso(s) idioma(s), mas não estamos construindo conjuntos de dados com eles. Preferimos falar ou privatizar nossa língua como patrimônio quando deveríamos estar investindo em documentação para preservar e proteger a língua.
Honestamente, não há muito, além do negócio de vender conjuntos de dados. Mesmo assim, quem injeta dinheiro nos projetos dá muito, mas o valor que chega aos agentes de campo é muito pouco em comparação com o valor original.
Não há nenhuma lei contra a coleta de dados. O mais importante é que os dados sejam coletados voluntariamente dos falantes nativos e eles sejam recompensados pelo seu tempo. No entanto, todas as atividades devem estar alinhadas com os objetivos da União Africana
E para a sua segunda pergunta, não há nada que alguém possa fazer sobre a quantidade de dinheiro que eventualmente chega às pessoas envolvidas nesses campos. O mais importante é que todos se comprometam com o projeto de boa vontade. As pessoas são informadas de que serão registradas e recompensadas e, desde que aceitem o preço, não há “injustiça”.
É um campo amplo. Muitos já têm alicerces e estão em fase de construção, mas ainda temos mais aspectos que mal são fundamentais. O que recomendo a todos é que se envolvam com a coleta e análise de dados linguísticos. Precisamos de análise de dados para conjuntos de dados tanto quanto precisamos de dados.
Portanto, recomendo ingressar ou ser voluntário em grupos entusiasmados orientados a dados; voluntário para coleta e análise de dados, aprendizado de nomenclatura e outros.
A África continua a ser representada de forma inadequada no software de reconhecimento de voz com comandos ou prompts para diferentes AI e NLP. A narrativa se tornará diferente quando os africanos começarem a construir conjuntos de dados, divulgar sua linguagem e continuar a investir em documentação. No entanto, você ficará impressionado com algumas das criações vindas da África sobre aplicações de IA e PNL.
Em minhas pesquisas e seguindo pistas, vi robôs sendo solicitados com idiomas africanos locais, estamos tendo mais chatbots locais adequados para diferentes contextos africanos (turismo, exploração), alguns idiomas estão sendo usados para IoT para eletrodomésticos. No entanto, acredito que deveríamos estar fazendo mais, considerando a revolução massiva da IA e da PNL acontecendo no mundo agora. Por enquanto, temos mais