Descripción:
Las redes neuronales son modelos matemáticos con una capacidad de generalización extraordinaria y misteriosa.
Son capaces de resolver tareas complejas como reconocer actividades en un video, clasificar imágenes, o traducir de un lenguaje a otro. Sin embargo, el fundamento de los modelos suele ser empírico y no matemático.
Este proyecto se desvía de la tendencia y propone una red neuronal recurrente para reconocer actividades en un video; pero justificada en intuiciones matemáticas. La arquitectura propuesta (denominada D-RNN) logra resultados de clasificación comparables a una LSTM (arquitectura recurrente más común para reconocer actividades), pero con 0.68% de los parámetros. Convirtiendose en una alternativa viable cuando el porcentaje de error puede sacrificarse por un modelo más liviano.
Adicionalmente, se desmitifica a las redes neuronales y a TensorFlow. El capítulo dos y los anexos elaboran en los temas respectivamente, y cada uno construye una base teórica para sustentar las ideas que se plantean.
En resumen, el capítulo uno da una visión general del problema a resolver, el capítulo dos explica las redes neuronales y las redes neuronales recurrentes, el capítulo tres explica la solución propuesta, y el capítulo cuatro analiza los resultados. En los anexos se explica TensorFlow.