Últimas

Search Suggest

Sobre a utilização de machine learning em Engenharia Química, e o potencial de modelos de linguagem (estilo GPT) para resolver questões químicas



A engenharia química (EQ) já experimentou duas grandes ondas de aplicações de machine learning (ML) entre as décadas de 1980 e 2008, ou seja, sistemas especialistas e redes neurais artificiais (RNAs) (superficiais) [7,  8]. Essas ondas tiveram impacto limitado devido a vários motivos [7]: i) falta de dados, de acessibilidade aos dados, de poder de computação e de ambientes/paradigmas de programação, ii) tecnologias emergentes bem-sucedidas concorrentes para EQ, em particular, modelação mecanicista, otimização e controlo preditivo do modelo.

(...) Desde a década de 1990, RNAs superficiais têm sido amplamente utilizadas. RNAs superficiais podem, teoricamente, aproximar qualquer função suave e não linear, dado um número suficiente de neurônios, para qualquer precisão positiva em um conjunto de dados de treinamento [48].

(...) Hoje, existe computação barata e poderosa, ambientes de programação fáceis de usar (por exemplo, Python e TensorFlow) e uma grande comunidade de código aberto em ML. Ao mesmo tempo, o ML sofreu um aumento na aprendizagem automático por meio de RNAs profundas [9, 10].

A EQ passa atualmente por uma transformação rumo à digitalização e à automação total da indústria e da investigação. Isto leva a uma disponibilidade cada vez maior de dados e à necessidade de uma tomada de decisão otimizada automatizada com base em dados, permitindo operações de processo mais sustentáveis [16].


(...) A tomada de decisão ótima (Optimal decision making) é um tópico proeminente em EQ para síntese, processos, controlo, seleção de solvente, catalisador ou adsorvente. Todas essas decisões precisam de ser tomadas com base em informações existentes, que podem estar na forma de dados e conhecimento mecanicista, por exemplo, em modelos.

(...) A fisicalidade dos modelos de ML é um desenvolvimento frequentemente solicitado em EQ. Em muitas disciplinas, a aprendizagem supervisionada é aplicada diretamente numa abordagem black box. No entanto, estas abordagens  apresentam graves desvantagens em termos de interpretabilidade, extrapolação, necessidade de dados e confiabilidade. Estas desvantagens podem limitar as aplicações do ML e levar a erros fatais quando aplicado na indústria sem as verificações necessárias. 

Por outro lado, modelos físico-químicos mecanicistas podem fornecer conhecimento estrutural que pode ser combinado com modelos baseados em dados. A combinação de modelos mecanicistas e baseados em dados é chamada de modelação híbrida (semiparamétrica). (...) A modelação híbrida tem inúmeras aplicações em EQ e biotecnologia desde o início da década de 1990, por exemplo, em processos [69, 70] e modelação de reatores [71], polimerização [72], cristalização, destilação, e processos de secagem [73], e controle de processo [74, 75].

(...) No geral, a EQ é um campo onde novos projetos de processos, produtos e materiais só podem ser encontrados ou descobertos por tentativa e erro experimental ou por projeto humano. Apoiar isto com técnicas criativas de ML pode permitir descobertas ainda inimagináveis e a investigação nesta direção é, portanto, altamente desejável.

No futuro, é esperado que os métodos de ML resolvam tarefas criativas, desde a escala dos fenômenos termodinâmicos até fluxogramas e empresas inteiras.

Fonte: Schweidtmann, A.M., Esche, E., Fischer, A., Kloft, M., Repke, J.-U., Sager, S. and Mitsos, A. (2021), Machine Learning in Chemical Engineering: A Perspective. Chemie Ingenieur Technik, 93: 2029-2039.


Aproveitando grandes modelos de linguagem para química preditiva



Um dos avanços fascinantes em machine learning foi o desenvolvimento de grandes modelos de linguagem (LLMs), os chamados modelos fundacionais 1–6. Esses modelos são atraentes devido à sua simplicidade; dada uma frase, eles retornam um texto que completa as frases em linguagem natural de tal forma que, em muitos casos, não é possível dizer que foi uma máquina que a escreveu.

Investigadores do Laboratório de Simulação Molecular (LSMO), Institut des Sciences et Ingénierie Chimiques, École Polytechnique Fédérale de Lausanne (EPFL), Sion, Suíça mostraram que o GPT-3, um grande modelo de linguagem treinado em grandes quantidades de texto extraído da Internet, pode ser facilmente adaptado para resolver várias tarefas em química e ciência dos materiais, ajustando-o para responder a questões químicas em linguagem natural com respostas corretas. Compararam essa abordagem com modelos de machine learning dedicados para muitas aplicações, abrangendo desde propriedades de moléculas e materiais até ao rendimento de reações químicas.

Surpreendentemente, a versão ajustada do GPT-3 pode ter um desempenho comparável ou até mesmo superar as técnicas convencionais de machine learning, em particular no limite baixo de dados. Além disso, podemos realizar o design inverso simplesmente invertendo as questões. A facilidade de uso e o alto desempenho, especialmente para pequenos conjuntos de dados, podem impactar a abordagem fundamental para o uso de machine learning nas ciências químicas e de materiais.

Fonte: Jablonka, K.M., Schwaller, P., Ortega-Guerrero, A. et al. Leveraging large language models for predictive chemistry. Nat Mach Intell (2024).


Lacunas e dificuldades a superar para potenciar impacto em EQ

Em EQ, apenas uma pequena fração do conhecimento e da informação é acessível para métodos de ML, enquanto a maioria está disponível apenas em formato analógico ou digital não padronizado. Atualmente, as técnicas de ML geralmente processam dados de cálculos, sensores e medições. No entanto, dados moleculares, fluxogramas de processos, P&IDs, publicações, livros de laboratório, etc. nem sempre são acessíveis às técnicas padrão de ML. Este é um grande obstáculo para encontrar e explorar relacionamentos mais complexos por meio de técnicas de ML.



(...) A heterogeneidade dos dados em EQ tem muitas fontes (por exemplo, livros de laboratório, medições, dados de propriedades, simulações moleculares, publicações, arquivos de simulação), e o processamento de dados heterogéneos é um grande obstáculo. Em EQ a heterogeneidade decorre, por exemplo, de (1) múltiplas escalas no tempo e no espaço (por exemplo, mili segundos a meses em controlo e programação, ou nm a m em difusão de poros e adsorção por oscilação de pressão), (2) uma variedade de fontes de dados, que precisam ser combinados para compreender processos químicos (por exemplo, dados de processo, alarmes, dados de propriedade, especificações de equipamentos), (3) frequências de dados altamente diferentes (por exemplo, dados de medição contínua aparecem uma vez por ms, enquanto dados de qualidade são recolhidos a cada duas horas ou a cada dia). Tudo isto é agravado pela frequente elevada dimensionalidade dos conjuntos de dados [20].

(...) Em EQ, uma falha pode equivaler a uma reação descontrolada causando danos ao equipamento. A segurança e a confiança nas aplicações de ML estão relacionadas com o apelo à introdução de leis físicas nas técnicas de ML, mas vão muito além. É bem sabido que a capacidade de extrapolação dos modelos baseados em dados sobre o seu domínio de treino inicial é limitada [77, 99, 118]. Assim, o desenvolvimento de modelos que descrevem o domínio de validade dos modelos baseados em dados é desejado [77, 99, 118]. No entanto, ao treinar modelos de dados baseados em dados da indústria, definir e modelar o domínio de validade é um tema importante [99].

Fonte: Schweidtmann, A.M., Esche, E., Fischer, A., Kloft, M., Repke, J.-U., Sager, S. and Mitsos, A. (2021), Machine Learning in Chemical Engineering: A Perspective. Chemie Ingenieur Technik, 93: 2029-2039.