MAC500 - Trabalho de Formatura Supervisionado

Dimensionalidade e Escala em Aprendizado de Máquina:
Uma Análise Teórica e Experimental da Redução de Dimensionalidade

Aluno: Felipe Pereira Ramos Barboza
Supervisora: Prof.ª Dr.ª Nina S. T. Hirata
Curso: Bacharelado em Ciência da Computação — IME-USP

Resumo

O crescimento exponencial na quantidade e complexidade dos dados modernos impõe desafios significativos ao aprendizado de máquina, especialmente em contextos de alta dimensionalidade. Este trabalho apresenta uma análise teórica e experimental da redução de dimensionalidade, explorando tanto os fundamentos matemáticos que garantem sua viabilidade quanto métodos contemporâneos utilizados na prática.

Inicialmente, discute-se o Lema de Johnson–Lindenstrauss como base teórica para projeções com distorção controlada. Em seguida, são analisados métodos não lineares de visualização amplamente utilizados, em especial o t-SNE e o UMAP, destacando suas formulações conceituais, diferenças e implicações práticas. Por fim, realiza-se uma avaliação experimental em diferentes conjuntos de dados, combinando métricas quantitativas e análise visual das projeções obtidas.

Palavras-chave: redução de dimensionalidade, Johnson–Lindenstrauss, t-SNE, UMAP, visualização de dados.