Deep Blue da IBM
Em 1997, Garry Kasparov, então campeão mundial de xadrez, protagonizou um episódio marcante ao enfrentar o computador Deep Blue, da IBM. Em uma partida amplamente divulgada, Kasparov levantou-se em indignação e reconheceu a derrota para a máquina, uma clara ilustração da evolução da inteligência artificial (IA) em jogos estratégicos. Recentemente, em um podcast, Magnus Carlsen, considerado o maior enxadrista da história, declarou que não teria chances de vencer uma partida contra seu próprio celular, reforçando a ideia de que os computadores se tornaram imbatíveis em xadrez. Essa transformação não se deve apenas à velocidade computacional, mas, fundamentalmente, aos avanços em IA. Um estudo discutido anteriormente sugere que a análise do xadrez pode ser relacionada à Pesquisa Operacional, uma abordagem fundamental na otimização e na tomada de decisões.
A quantidade de configurações possíveis em um tabuleiro de xadrez após apenas cinco movimentos de cada jogador é imensa: 69.352.859.712.417, ou quase 70 trilhões de combinações. Isso demonstra que é impraticável listar todas as sequências possíveis, mesmo usando supercomputadores. Para jogadas mais longas, são utilizados números de Shannon, que representam estimativas do total de possibilidades em uma partida de xadrez. O Deep Blue não recorreu a algoritmos de IA para derrotar Kasparov, mas utilizou poder computacional e estratégias específicas, desenvolvidas em colaboração com enxadristas experientes. O conceito de “Deep” no nome refere-se à profundidade da árvore de decisões que o computador consegue calcular, semelhante ao que é aplicado na Programação Dinâmica.
Atualmente, os softwares de xadrez se valem predominantemente de redes neurais, que são compostas por múltiplas camadas de funções matemáticas interconectadas, transformando uma posição no tabuleiro em uma jogada. O programa Stockfish, por exemplo, utiliza uma rede neural de atualização eficiente (NNUE) que permite decisões rápidas baseadas nas últimas jogadas. Embora essa rede possua uma estrutura relativamente rasa, os conceitos de profundidade nas redes neurais são essenciais na técnica de Deep Learning, que é aplicada em sistemas como o Leela Chess Zero. Este software, derivado do projeto Alpha Zero, é baseado em uma rede neural profunda e possui milhões de parâmetros que ajustam sua performance no jogo.
Durante o treinamento, o Stockfish aprende com dados de jogos passados, por meio de um método de aprendizado supervisionado que utiliza um vasto conjunto de posições de tabuleiro junto a suas melhores jogadas. Dessa forma, ao encontrar uma nova posição, consegue prever a jogada ideal utilizando seu “painel de controle” otimizado. Em contraste, o Leela aprende jogando de maneira independente, recebendo recompensas por movimentos corretos e penalizações por decisões erradas, configurando um aprendizado por reforço (Reinforcement Learning).
Recentemente, o aprendizado por reforço recebeu destaque com o Deep Seek, um modelo de linguagem (LLM) supostamente treinado de forma extensiva com esse método. Porém, o Deep Seek enfrenta críticas relacionadas à privacidade de dados e suas opiniões enviesadas quanto ao Partido Comunista Chinês, levando a restrições em diversos países. Atualmente, a evolução da IA está cada vez mais presente em diferentes setores, desde streaming de conteúdo até comércio eletrônico e finanças.
O impacto que a IA exerce no cotidiano é irreversível. A revolução em Pesquisa Operacional e tomada de decisões traz consigo desafios bem como oportunidades. A IA, conforme se desenvolve, passa a ser vista como uma extensão da capacidade humana de raciocínio e decisão, reforçando o papel fundamental do pensamento crítico humano em um ambiente dominado por automatizações.
Referências