Fator 1: Interoperabilidade de Dados.
Este é o terceiro artigo da série “Corrupção: como avançar nessa agenda?”, que vem abordando como o Brasil tem progredido no combate à corrupção a partir do uso de inteligência artificial (IA). As análises são frutos das pesquisas realizadas recentemente pela autora, ao longo do mestrado em políticas públicas na London School of Economics and Political Science (LSE). A partir de estudos qualitativos, buscou-se ampliar a compreensão acerca do uso de IA no combate à corrupção, bem como reconhecer os esforços protagonizados por servidores públicos brasileiros na geração de significativo impacto e no avanço dessa agenda.
Leia o primeiro e segundo artigo dessa série.
Neste artigo, a autora examina o promissor uso de IA a partir da bem-sucedida implementação do robô Alice (Analisador de Licitações, Contratos e Editais) pelo Tribunal de Contas da União (TCU). Quatro fatores merecem destaque e, nos próximos parágrafos, um deles será analisado: a importância da interoperabilidade de dados.
Índice
Introdução
A disponibilidade e a interoperabilidade dos dados
O caso do robô Alice
Introdução
Na atual conjuntura de crescimento acelerado na geração de dados, as condições mostram-se propícias para o investimento em ferramentas tecnológicas a exemplo da inteligência artificial. Tecnologias como essa viabilizam análises de grandes volumes de dados, geração de informações oportunas, promoção de mais transparência, identificação de irregularidades, prevenção da má alocação de recursos públicos e maior participação e colaboração social no combate à corrupção (Schatsky et al, 2014; Davies et al., 2019).
Nesse contexto, vem ganhando destaque nos debates acadêmicos a iniciativa inovadora da Controladoria-Geral da União (CGU) e do Tribunal de Contas da União (TCU) de utilizar o sistema Alice (Analisador de Licitações, Contratos e Editais). Trata-se de uma inteligência artificial que vem auxiliando os controladores e auditores no acompanhamento de licitações, que é a etapa do processo de contratação pública durante a qual ocorrem os maiores riscos de fraude e desfalque.
Portanto, é altamente relevante investigar os fatores que vêm contribuindo para o sucesso na implementação do sistema Alice na identificação de irregularidades, possibilitando ao Brasil avançar no uso de IA no combate à corrupção na área de compras públicas.
A disponibilidade e a interoperabilidade dos dados
Segundo a literatura, uma das pré-condições para que uma política pública seja bem implementada diz respeito à utilização dos inputs certos, ou seja, ao acesso a recursos que sejam adequados (Hogwood & Gunn, 1997). No contexto da implementação de sistemas anticorrupção baseados no uso de inteligência artificial, essa condição conecta-se diretamente com um tema central na literatura de dados abertos, que diz respeito à visão amplamente difundida de que a abertura de dados no setor público leva automaticamente ao seu crescente uso e à criação de valor público (Jetzek et al., 2014; Davies et al., 2019).
Desta forma, a disponibilidade de dados abertos é considerada um ponto de partida e um ativo fundamental para implementar tecnologias anticorrupção baseadas em IA. Isso se deve à capacidade da inteligência artificial de acessar grandes quantidades de dados, identificar padrões, trazer à luz relacionamentos suspeitos, chamar a atenção para sinais de corrupção e realizar previsões (Adam & Fazekas, 2018; OCDE, 2019a; Köbis et al., 2021). Isso significa que dados governamentais devem estar disponíveis às equipes à frente de projetos de implementação dessa tecnologia, sendo considerados inputs centrais para a realização das análises necessárias e o alcance do impacto desejado (Freuler & Iglesias, 2018).
No entanto, conforme discutido no primeiro artigo desta série, é relevante considerar que a corrupção constitui um fenômeno altamente complexo e geralmente envolve redes dinâmicas estabelecidas por diferentes stakeholders. Além disso, no que tange especificamente ao processo de compras públicas, é importante ter em mente que esquemas de irregularidades podem ser encontrados em diferentes departamentos e níveis de governo, e os dados abertos geralmente não cobrem todas as fases do processo (OCDE, 2016).
Dessa maneira, para que os dados possam desempenhar um papel fundamental no desmantelamento de redes de corrupção, é fundamental que os governos garantam não só a sua disponibilização, mas também a sua interoperabilidade (OCDE, 2015). Em outras palavras, além de estarem disponíveis, os dados devem ser fornecidos em formato legível por máquina e ser suficientemente granulares. Isso é imprescindível na consolidação das bases necessárias para que tecnologias baseadas em IA estabeleçam um sistema interoperável, possibilitando o cruzamento de diferentes bases de dados, a realização de comparações no âmbito governamental, e a geração de análises pertinentes em tempo hábil.
O caso do robô Alice
No Brasil, desde 2016, o TCU implanta o Alice, uma inteligência artificial que interpreta dados de compras públicas e identifica indícios de corrupção na fase de licitação. Para tanto, essa tecnologia acessa diariamente o portal de compras do governo federal e realiza o download dos dados, os quais, em geral, encontram-se disponíveis em diversos formatos e são de difícil obtenção.
A partir de então, essa tecnologia realiza o download dos dados e documentos de todas as licitações celebradas e realiza nove análises de texto e 23 cruzamentos de dados, visando identificar indícios de irregularidades e riscos nos editais, tais como restrição de competitividade, favorecimento de fornecedores, ausência de informações necessárias no edital, e superfaturamento de preços.
Para ilustrar, uma das análises realizadas pelo Alice refere-se ao fator de materialidade, o qual corresponde ao valor estimado apresentado nos editais. Tais documentos, no entanto, são normalmente compartilhados em PDF e não seguem uma uniformidade textual. Portanto, diante da falta de dados abertos em formato legível por máquina, antes de realizar as análises necessárias, o TCU utiliza o sistema Alice para executar um algoritmo (Random Forest Classifier) que classifica todos os valores numéricos dos textos dos editais e extrai os valores monetários das licitações.
Considerando que apenas 80% dos editais publicam o valor estimado e que 94% dos valores estimados são corretamente detectados pelo modelo de classificação, por meio do citado algoritmo, é possível estimar a materialidade de 75% dos editais no mesmo dia em que são publicados (Sandes, 2016).
Além disso, conforme mencionado anteriormente, a corrupção constitui um fenômeno altamente complexo que geralmente envolve inúmeras atividades, bem como a participação de atores distintos. Portanto, com vistas a identificar vestígios de irregularidades e, assim, desmantelar essas redes dinâmicas de ações ilegais, torna-se necessário cruzar dados abertos com outros bancos de dados. A este respeito, Köbis et al. (2021) enfatizam que o sucesso da implementação da inteligência artificial como ferramenta anticorrupção depende do uso de dados de entrada de alta qualidade, que também abrangem outros dados governamentais não públicos.
Assim, para identificar irregularidades na fase de licitação, após acessar os dados não estruturados disponibilizados no portal de compras, o TCU também executa algoritmos, visando a extração dos dados abertos que sejam necessários para realizar suas análises, e salvando-os no repositório do Alice em formato legível por máquina, de forma que possam ser cruzadas com bases de dados governamentais de acesso restrito à sociedade, mas que o Tribunal tenha acesso.
Nos próximos artigos desta série, serão analisados outros três fatores determinantes para a implementação bem-sucedida do Sistema Alice na luta contra a corrupção.
Bibliografia
ADAM, I.; FAZEKAS M. Are emerging technologies helping win the fight against corruption in developing countries? Pathways for Prosperity Commission Background Paper Series, v. 21, p. 1–34, dez. 2018.
DAVIES, T.; WALKER, S. B.; RUBINSTEIN M.; PERINI F. The State of Open Data: Histories and Horizons. IDRC – International Development Research Centre, 2019 Disponível em: <https://www.idrc.ca/en/book/state-open-data-histories-and-horizons>.
FREULER, J. O.; IGLESIAS, C. Algorithms and artificial intelligence in Latin America: A study of implementation by governments in Argentina and Uruguay. World Wide Web Foundation, 2018. Disponível em: <http://webfoundation.org/docs/2018/09/WF_AI-in-LA_Report_Screen_AW.pdf>.
HOGWOOD, B.; GUNN, L. Why ‘Perfect Implementation’ is Unattainable. In M. J. Hill (Ed.), The policy process: A reader. Prentice Hall/Harvester Wheatsheaf, v. 2, p. 217-225, 1997.
JETZEK, T.; AVITAL, M.; BJORN-ANDERSEN, N. Data-Driven Innovation through Open Government Data. Journal of Theoretical and Applied Electronic Commerce Research, v. 9, p. 100–120, 2014.
KÖBIS, N.; STARKE, C.; RAHWAN, I. Artificial Intelligence as an Anti-Corruption Tool (AI-ACT) — Potentials and Pitfalls for Top-down and Bottom-up Approaches. 2021.
OECD. G20/OECD Compendium of good practices on the use of open data for Anti-corruption. 2015. Disponível em: <https://www.oecd.org/corruption/g20-oecd-compendium-open-data-anti-corruption.htm>.
OECD. Preventing Corruption in Public Procurement. 2015. Disponível em: <https://baselgovernance.org/publications/preventing-corruption-public-procurement>.
PETHERAM, A., PASQUARELLI, W.; STIRLING, R. The Next Generation of Anti-Corruption Tools: Big Data, Open Data & Artificial Intelligence. [Research Report]. Oxford Insights, p. 19, 2019.
SANDES, E. 2º Seminário Brasil 100% digital. Brasil, ago. 2016. 1 vídeo (194 minutos). Publicado pelo Canal Tribunal de Contas da União. Disponível em: <https://www.youtube.com/watch?v=IsduSZAds7w>.
SCHATSKY, D.; MURASKIN, C.; GURUMURTHY, R. Demystifying artificial intelligence. Deloitte Insights, 2014. Disponível em: <https://www2.deloitte.com/us/en/insights/focus/cognitive-technologies/what-is-cognitive-technology.html>.
Esta nota é de responsabilidade dos respectivos autores e não traduz necessariamente a opinião da República.org nem das instituições às quais os autores estão vinculados.