Acelerando a pesquisa de um dos mais respeitados institutos de tecnologia do mundo

Contexto

O ITA - Instituto Tecnológico da Aeronáutica, é uma das instituições mais respeitadas no ensino de engenharia do mundo. Além disso, o instituto tem alta relevância na pesquisa científica internacional, com seus docentes atuando em áreas distintas – da pesquisa de base ao desenvolvimento de novas tecnologias. 

O Programa de Pós-Graduação em Física (PG-Fis) do ITA é um dos cursos de pós-graduação com maiores índices de produtividade científica internacional da instituição, com docentes atuando em diferentes áreas, dentre elas, a astrofísica, área que vem trazendo informações cada vez mais relevantes e precisas sobre o Universo, graças ao advento de detectores cada vez mais precisos e tecnológicos. 

Atualmente, os projetos que vêm sendo desenvolvidos fazem parte do contexto de duas teses de Doutorado, que investigam a microestrutura nuclear de estrelas nêutrons. Nestes casos, os estudantes estão analisando dados observacionais de detectores, tais como NICER (https://www.nasa.gov/nicer) e LIGO (https://ligo.calthec.gov), buscando determinar os parâmetros de diferentes modelos de Equações de Estado (EdEs) para melhor descrição da matéria nuclear. 

Desafio e objetivos

A parceria entre o ITA e a PowerOfData surge, então, com o objetivo de trazer à instituição a tecnologia necessária para aumentar a precisão e diminuir o tempo de simulações computacionais, análises e processamento de uma grande quantidade de dados. Para isso era necessário implementar um ambiente com alguns requisitos básicos, tais como:

  • Infraestrutura: Simulações com dados massivos requerem muita infraestrutura computacional e cada tarefa de processamento de Big Data e Analytics tem potencial de aumentar ainda mais este consumo.
  • Escalabilidade: Para lidar com volumes grandes e variáveis de dados, é necessário um ambiente facilmente escalável. A escalabilidade só se torna economicamente viável com alto grau de automação. Assim, uma tecnologia auto-escalável permite atingir qualquer nível de processamento a um custo previsível e acessível. 
  • Automação e low-code: Liberar cientistas para trabalhar focados na resolução do problema computacional aplicado e permitir o encapsulamento das funções desenvolvidas acelerou em meses a geração de resultados concretos sem as dificuldades corriqueiras de ambientes com baixa automação.
  • Técnicas de modelagem: É necessário um conhecimento profundo e muito tempo para treinar e testar diferentes técnicas de modelagem para comparação posterior. As inovações desenvolvidas pelo ITA em benchmark contra todas as inovações do mundo open-source e um clique de distância.  
  • Ferramentas: A integração das diferentes ferramentas open-source necessárias para cada etapa é um esforço que demanda muito tempo e atenção aos detalhes. Uma plataforma pronta trouxe essa integração de forma fácil e rápida. 

Em suma, o objetivo deste projeto era implementar uma plataforma de Big Data e Analytics capaz de colaborar com o mais elevado grau de inovação científica de nosso país, liberando os cientistas para usarem sua inteligência sem qualquer dificuldade com infraestrutura, tecnologia, processos, open-source de mais atividades que consomem, em média, 80% do esforço de engenheiros e cientistas de dados do mundo.

 

 

Solução e resultados

"O uso da tecnologia PowerOfData, aplicada na minha área de atuação no ITA, astrofísica, aumentou a precisão dos nossos resultados científicos, com drástica redução do tempo de processamento, viabilizando resultados nunca antes alcançados." 

- Prof. Dr. César Lenzi, coordenador da Pós Graduação do Instituto de Física do ITA 

Para atingir os objetivos do projeto e superar os desafios da instituição, impactando o dia a dia dos pesquisadores e elevando o nível da pesquisa acadêmica do país, a PowerOfData disponibilizou a PoD Platform, criando um ambiente dedicado para o ITA, facilmente escalonável, permitindo também a aceleração do treinamento de milhares de modelos para encontrar a melhor para cada caso.

O PoD Playground, um ambiente de programação full-code e low-code, proporcionou liberdade de modelagem e alta capacidade de processamento, acelerando a pesquisa, que normalmente é realizada em supercomputadores, com aumento de precisão dos resultados e drástica diminuição de tempo e esforço. O benchmarking percebido pelo ITA foi uma redução de 48h para 20 minutos por atividade.

O PoD AutoML possibilita a comparação dos algoritmos e inovações do ITA com o estado da arte em Machine Learning, para benchmarking de resultados. Além disso, funcionalidades tradicionais de corporações privadas estão trazendo a disponibilidade dos resultados e fácil interpretação para outras instituições de pesquisa, com o PoD Data Management.

Os ganhos são muito e se revertem diretamente para a qualidade dos resultados da pesquisa nacional. Entre eles, podemos citar: 

  • Resultados acadêmicos inéditos: Com todo esse suporte, a equipe de pesquisa tem acesso a resultados mais precisos, com menos tempo de processamento e muito mais foco no avanço tecnológico. 
  • Drástica diminuição de tempo: Com a PoD Platform, a instituição diminuiu drasticamente o tempo de processamento de dados e treinamento de modelos, permitindo que seus pesquisadores possam dedicar seus esforços no que importa.
  • Aumento de performance: Com o aumento da capacidade computacional, a precisão aumentou, entregando resultados melhores e mais confiáveis, garantindo escalabilidade, capacidade de processamento, segurança e economia.

Atualmente esta parceria já foi citada em artigos internacionais e em breve serão publicadas duas teses de doutorado que utilizaram a PoD Platform em sua pesquisa.