El gran volumen de datos generados por los surveys astronómicos modernas ofrece una oportunidad interesante para la aplicación de machine learning. Es esencial explorar todas las herramientas existentes y determinar cuáles son adecuadas para generar conocimiento científico a partir de la observación disponible.
El objetivo principal de esta tesis es explorar la aplicación de algoritmos de aprendizaje automático para el estudio Apache Point Galactic Evolution Experiment (APOGEE). A pesar de nuestro enfoque en APOGEE, esta tesis proporciona una guía para la aplicación de los mismos algoritmos a otros conjuntos de datos similares.
A lo largo de la tesis, utilizamos dos problemas astrofísicos para probar diferentes algoritmos de aprendizaje automático. Primero, abordamos la clasificación espectral de más de 150,000 estrellas con K-means. Proporcionamos un análisis detallado de las virtudes y limitaciones del algoritmo, y una descripción extensa de las clases generadas con K-means. En segundo lugar, nos centramos en el análisis de abundancias químicas probando ocho algoritmos de agrupación para explorar la viabilidad de una búsqueda a ciegas de poblaciones estelares en el espacio químico. Usando pruebas estadísticas, demostramos que algunos cúmulos de estrellas son indistinguibles entre sí en el espacio de abundancia de APOGEE. Con este resultado, ampliamos la noción de etiquetado químico a la búsqueda de poblaciones estelares a un nivel más allá de los cúmulos estelares, a la cual llamamos familias de estrellas. Finalmente, utilizamos el algoritmo t-distributed stochastic neighbor embedding (t-SNE) para proyectar el espacio de 13 dimensiones de las abundancias químicas de APOGEE en 2 dimensiones. Clasificamos las estrellas en esta proyección usando Density-Based Spatial Clustering of Applications with Noise (DBSCAN) y mostramos que la clasificación puede identificar familias de estrellas relacionadas con poblaciones estelares conocidas.
Esta tesis ofrece una visión general del conjunto de datos APOGEE y también una guía para la aplicación de algunos algoritmos de agrupación no supervisados.
Bibcode
Rafael Augusto Garcia Dias
Director de tesis
Carlos
Allende Prieto
Jorge Francisco
Sánchez Almeida
Fecha de publicación:
9
2018
Descripción