Estudo do MIT Revela Método Eficiente para Aprendizado de Máquina com Simetria
Quando você gira uma imagem de uma estrutura molecular, um ser humano consegue perceber que a imagem girada ainda representa a mesma molécula. No entanto, um modelo de aprendizado de máquina pode pensar que é um novo ponto de dados. Em termos de ciência da computação, dizemos que a molécula é “simétrica”, ou seja, a estrutura fundamental dessa molécula permanece a mesma, mesmo após certas transformações, como a rotação.
Assista ao vídeo completo aqui:
Se um modelo de descoberta de medicamentos não entende a simetria, pode fazer previsões imprecisas sobre as propriedades moleculares. Apesar de alguns sucessos empíricos, não estava claro se existia um método computacionalmente eficiente para treinar um bom modelo que respeitasse a simetria.
Um novo estudo de pesquisadores do MIT responde a essa questão e apresenta o primeiro método de aprendizado de máquina com simetria que é provadamente eficiente em termos de computação e dados necessários.
Esses resultados esclarecem uma questão fundamental e podem auxiliar pesquisadores no desenvolvimento de modelos de aprendizado de máquina mais poderosos, projetados para lidar com simetria. Esses modelos seriam úteis em diversas aplicações, desde a descoberta de novos materiais até a identificação de anomalias astronômicas e a análise de padrões climáticos complexos.
“Essas simetrias são importantes porque representam informações que a natureza nos transmite sobre os dados, e devemos levá-las em conta em nossos modelos de aprendizado de máquina. Agora mostramos que é possível realizar aprendizado de máquina com dados simétricos de maneira eficiente”, afirma Behrooz Tahmasebi, estudante de graduação do MIT e coautor principal do estudo.
Ele é acompanhado no artigo por Ashkan Soleymani, também estudante de graduação do MIT; Stefanie Jegelka, professora associada de engenharia elétrica e ciência da computação (EECS) e membro do Instituto de Dados, Sistemas e Sociedade (IDSS) e do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL); e Patrick Jaillet, professor Dugald C. Jackson de Engenharia Elétrica e Ciência da Computação, e investigador principal no Laboratório para Sistemas de Informação e Decisão (LIDS). A pesquisa foi recentemente apresentada na Conferência Internacional sobre Aprendizado de Máquina.
Estudando a Simetria
Dados simétricos aparecem em muitos domínios, especialmente nas ciências naturais e na física. Um modelo que reconhece simetrias é capaz de identificar um objeto, como um carro, independente da posição em que esse objeto é colocado em uma imagem, por exemplo.
Se um modelo de aprendizado de máquina não for projetado para lidar com simetria, pode ser menos preciso e propenso a falhas quando confrontado com novos dados simétricos em situações do mundo real. Por outro lado, modelos que aproveitam a simetria podem ser mais rápidos e exigir menos dados para treinamento.
No entanto, treinar um modelo para processar dados simétricos não é uma tarefa fácil.
- Uma abordagem comum é chamada de aumento de dados, onde pesquisadores transformam cada ponto de dado simétrico em múltiplos pontos para ajudar o modelo a generalizar melhor a novos dados. Por exemplo, pode-se girar uma estrutura molecular várias vezes para produzir novos dados de treinamento, mas se os pesquisadores desejam que o modelo respeite a simetria, isso pode ser computacionalmente proibitivo.
- Uma alternativa é codificar a simetria na arquitetura do modelo. Um exemplo bem conhecido disso é uma rede neural gráfica (GNN), que lida intrinsecamente com dados simétricos devido ao seu design.
“As redes neurais gráficas são rápidas e eficientes, e lidam bem com simetria, mas ninguém realmente sabe o que esses modelos estão aprendendo ou por que funcionam. Entender as GNNs é uma das principais motivações do nosso trabalho, então começamos com uma avaliação teórica do que acontece quando os dados são simétricos”, diz Tahmasebi.
Os pesquisadores exploraram o trade-off estatístico-computacional no aprendizado de máquina com dados simétricos. Esse trade-off significa que métodos que requerem menos dados podem ser mais caros computacionalmente, então os pesquisadores precisam encontrar o equilíbrio certo.
Construindo sobre a Avaliação Teórica
Baseando-se nessa avaliação teórica, os pesquisadores projetaram um algoritmo eficiente para aprendizado de máquina com dados simétricos.
Para fazer isso, eles pegaram ideias da álgebra para reduzir e simplificar o problema. Em seguida, reformularam o problema usando conceitos da geometria que capturam efetivamente a simetria.
Finalmente, combinaram a álgebra e a geometria em um problema de otimização que pode ser resolvido de maneira eficiente, resultando em seu novo algoritmo.
“A maior parte da teoria e das aplicações focava em álgebra ou geometria. Aqui, nós apenas combinamos os dois”, afirma Tahmasebi.
O algoritmo requer menos amostras de dados para treinamento do que as abordagens clássicas, o que melhoraria a precisão de um modelo e sua capacidade de se adaptar a novas aplicações.
Ao provar que cientistas podem desenvolver algoritmos eficientes para aprendizado de máquina com simetria, e demonstrar como isso pode ser feito, esses resultados podem levar ao desenvolvimento de novas arquiteturas de redes neurais que possam ser mais precisas e menos intensivas em recursos do que os modelos atuais.
Cientistas também poderiam usar essa análise como ponto de partida para examinar o funcionamento interno das GNNs e como suas operações diferem do algoritmo desenvolvido pelos pesquisadores do MIT.
“Uma vez que entendemos isso melhor, podemos projetar arquiteturas de redes neurais mais interpretáveis, robustas e eficientes”, acrescenta Soleymani.
Essa pesquisa é financiada, em parte, pela National Research Foundation de Singapura, pelos DSO National Laboratories de Singapura, pelo Escritório de Pesquisa Naval dos EUA, pela National Science Foundation dos EUA e por uma Cátedra Alexander von Humboldt.
Siga nosso canal @canalsegredosdodigital no Instagram e TikTok para dicas diárias sobre IA, automações e marketing digital.
Conheça a ferramenta apresentada no vídeo:
Perguntas Frequentes sobre a ferramenta
Como usar essa ferramenta de IA no dia a dia?
Para utilizar essa ferramenta, você pode integrá-la em seus processos de análise de dados, ajudando a identificar padrões e simetrias de forma mais eficiente.
Essa plataforma é gratuita ou paga?
A ferramenta oferece diferentes planos, incluindo uma versão gratuita com funcionalidades limitadas e planos pagos com recursos avançados.
Qual a principal vantagem dessa ferramenta?
A principal vantagem é a sua capacidade de lidar com dados simétricos de maneira eficiente, o que acelera o processo de aprendizado e melhora a precisão nas previsões.
Palavras-chave: aprendizado de máquina, simetria, modelo de IA, redes neurais gráficas, eficiência computacional.
Categoria: [2] Novidades
