Estudo do MIT Revela Método Eficiente para Aprendizado de Máquina com Simetria

Quando você gira uma imagem de uma estrutura molecular, um ser humano consegue perceber que a imagem girada ainda representa a mesma molécula. No entanto, um modelo de aprendizado de máquina pode pensar que é um novo ponto de dados. Em termos de ciência da computação, dizemos que a molécula é “simétrica”, ou seja, a estrutura fundamental dessa molécula permanece a mesma, mesmo após certas transformações, como a rotação.

Assista ao vídeo completo aqui:

Clique para ver o vídeo

Se um modelo de descoberta de medicamentos não entende a simetria, pode fazer previsões imprecisas sobre as propriedades moleculares. Apesar de alguns sucessos empíricos, não estava claro se existia um método computacionalmente eficiente para treinar um bom modelo que respeitasse a simetria.

Um novo estudo de pesquisadores do MIT responde a essa questão e apresenta o primeiro método de aprendizado de máquina com simetria que é provadamente eficiente em termos de computação e dados necessários.

Esses resultados esclarecem uma questão fundamental e podem auxiliar pesquisadores no desenvolvimento de modelos de aprendizado de máquina mais poderosos, projetados para lidar com simetria. Esses modelos seriam úteis em diversas aplicações, desde a descoberta de novos materiais até a identificação de anomalias astronômicas e a análise de padrões climáticos complexos.

“Essas simetrias são importantes porque representam informações que a natureza nos transmite sobre os dados, e devemos levá-las em conta em nossos modelos de aprendizado de máquina. Agora mostramos que é possível realizar aprendizado de máquina com dados simétricos de maneira eficiente”, afirma Behrooz Tahmasebi, estudante de graduação do MIT e coautor principal do estudo.

Ele é acompanhado no artigo por Ashkan Soleymani, também estudante de graduação do MIT; Stefanie Jegelka, professora associada de engenharia elétrica e ciência da computação (EECS) e membro do Instituto de Dados, Sistemas e Sociedade (IDSS) e do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL); e Patrick Jaillet, professor Dugald C. Jackson de Engenharia Elétrica e Ciência da Computação, e investigador principal no Laboratório para Sistemas de Informação e Decisão (LIDS). A pesquisa foi recentemente apresentada na Conferência Internacional sobre Aprendizado de Máquina.

Estudando a Simetria

Dados simétricos aparecem em muitos domínios, especialmente nas ciências naturais e na física. Um modelo que reconhece simetrias é capaz de identificar um objeto, como um carro, independente da posição em que esse objeto é colocado em uma imagem, por exemplo.

Se um modelo de aprendizado de máquina não for projetado para lidar com simetria, pode ser menos preciso e propenso a falhas quando confrontado com novos dados simétricos em situações do mundo real. Por outro lado, modelos que aproveitam a simetria podem ser mais rápidos e exigir menos dados para treinamento.

No entanto, treinar um modelo para processar dados simétricos não é uma tarefa fácil.

  • Uma abordagem comum é chamada de aumento de dados, onde pesquisadores transformam cada ponto de dado simétrico em múltiplos pontos para ajudar o modelo a generalizar melhor a novos dados. Por exemplo, pode-se girar uma estrutura molecular várias vezes para produzir novos dados de treinamento, mas se os pesquisadores desejam que o modelo respeite a simetria, isso pode ser computacionalmente proibitivo.
  • Uma alternativa é codificar a simetria na arquitetura do modelo. Um exemplo bem conhecido disso é uma rede neural gráfica (GNN), que lida intrinsecamente com dados simétricos devido ao seu design.

“As redes neurais gráficas são rápidas e eficientes, e lidam bem com simetria, mas ninguém realmente sabe o que esses modelos estão aprendendo ou por que funcionam. Entender as GNNs é uma das principais motivações do nosso trabalho, então começamos com uma avaliação teórica do que acontece quando os dados são simétricos”, diz Tahmasebi.

Os pesquisadores exploraram o trade-off estatístico-computacional no aprendizado de máquina com dados simétricos. Esse trade-off significa que métodos que requerem menos dados podem ser mais caros computacionalmente, então os pesquisadores precisam encontrar o equilíbrio certo.

Construindo sobre a Avaliação Teórica

Baseando-se nessa avaliação teórica, os pesquisadores projetaram um algoritmo eficiente para aprendizado de máquina com dados simétricos.

Para fazer isso, eles pegaram ideias da álgebra para reduzir e simplificar o problema. Em seguida, reformularam o problema usando conceitos da geometria que capturam efetivamente a simetria.

Finalmente, combinaram a álgebra e a geometria em um problema de otimização que pode ser resolvido de maneira eficiente, resultando em seu novo algoritmo.

“A maior parte da teoria e das aplicações focava em álgebra ou geometria. Aqui, nós apenas combinamos os dois”, afirma Tahmasebi.

O algoritmo requer menos amostras de dados para treinamento do que as abordagens clássicas, o que melhoraria a precisão de um modelo e sua capacidade de se adaptar a novas aplicações.

Ao provar que cientistas podem desenvolver algoritmos eficientes para aprendizado de máquina com simetria, e demonstrar como isso pode ser feito, esses resultados podem levar ao desenvolvimento de novas arquiteturas de redes neurais que possam ser mais precisas e menos intensivas em recursos do que os modelos atuais.

Cientistas também poderiam usar essa análise como ponto de partida para examinar o funcionamento interno das GNNs e como suas operações diferem do algoritmo desenvolvido pelos pesquisadores do MIT.

“Uma vez que entendemos isso melhor, podemos projetar arquiteturas de redes neurais mais interpretáveis, robustas e eficientes”, acrescenta Soleymani.

Essa pesquisa é financiada, em parte, pela National Research Foundation de Singapura, pelos DSO National Laboratories de Singapura, pelo Escritório de Pesquisa Naval dos EUA, pela National Science Foundation dos EUA e por uma Cátedra Alexander von Humboldt.

Siga nosso canal @canalsegredosdodigital no Instagram e TikTok para dicas diárias sobre IA, automações e marketing digital.

Conheça a ferramenta apresentada no vídeo:

Acesse aqui

Perguntas Frequentes sobre a ferramenta

Como usar essa ferramenta de IA no dia a dia?
Para utilizar essa ferramenta, você pode integrá-la em seus processos de análise de dados, ajudando a identificar padrões e simetrias de forma mais eficiente.

Essa plataforma é gratuita ou paga?
A ferramenta oferece diferentes planos, incluindo uma versão gratuita com funcionalidades limitadas e planos pagos com recursos avançados.

Qual a principal vantagem dessa ferramenta?
A principal vantagem é a sua capacidade de lidar com dados simétricos de maneira eficiente, o que acelera o processo de aprendizado e melhora a precisão nas previsões.

Palavras-chave: aprendizado de máquina, simetria, modelo de IA, redes neurais gráficas, eficiência computacional.

Categoria: [2] Novidades

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *