O Núcleo de pesquisa DATAS será organizado nas seguintes áreas temáticas definidas por temas de pesquisa. Os pesquisadores dessas áreas que interagem entre si para alcançar os objetivos propostos.
Modelagem Computacional
Algoritmos utilizados em Ciência de Dados necessitam de uma base estatística sólida. Além de gerar resultados acurados e úteis, algoritmos devem permitir a extração de explicações para suas predições e gerar resultados menos enviesados, entre outras características desejáveis.O foco desta área temática é desenvolver e entender o comportamento de algoritmos estatísticos e computacionais nas diferentes classes de problemas onde eles podem ser aplicados. Além disso, serão avaliadas técnicas para a modelagem de dados, também chamada de engenharia de atributos, de modo a atingir os objetivos em cada domínio de aplicação.
Sistemas Computacionais
Com o aumento da disponibilidade de dados, sistemas de computação que sejam capazes de capturar, processar e armazenar vastas quantidades de dados de modo paralelo e distribuído passaram a ser de grande importância na área de ciência de dados. Além disso, a disponibilização de ferramentas computacionais que permitam o uso de algoritmos de aprendizado de máquina e estatísticos em problemas reais é fundamental para a adoção destas técnicas.O foco nesta temática é no desenvolvimento e avaliação de ferramentas e sistemas computacionais que permitam o processamento destas vastas.
Sociedades Inteligentes
O uso de técnicas de ciência de dados tem o potencial de gerar importantes impactos positivos na sociedade. Políticas públicas podem ser definidas a partir de dados consolidados com o uso de ferramentas de ciência de dados. Já a qualidade de vida da população pode ter grandes avanços com melhorias na mobilidade e acessibilidade proporcionadas por tecnologias de cidades inteligentes. Finalmente, a análise de interações em redes sociais permitem a obtenção de conhecimentos de como as pessoas se comunicam e relacionam.Nesta área temática o foco será em aplicar a ciência de dados de modo a melhorar a vida das pessoas em sociedades e melhor compreender o seu funcionamento.
Natureza Aumentada
Diversas áreas do conhecimento em ciências naturais (física, química, biologia), da saúde (medicina), ou interações, como em nanociências e materiais avançados e biotecnologia, tem se beneficiado do uso de técnicas de aprendizado de máquina. Entre as aplicações estão a geração de algoritmos mais eficientes para a predição de enovelamento de proteínas, decodificação de atividade cerebral, auxílio a diagnóstico médico, projeto de novos polímeros e entendimento de redes de interação celular.Nesta área iremos explorar a aplicação das técnicas de ciência de dados nas ciências naturais, da saúde e outras aplicações.