Visión General del Proyecto: Detección de Comentarios Tóxicos con IA

El Problema

YouTube, como una de las plataformas de contenido más grandes del mundo, enfrenta un desafío monumental: el crecimiento exponencial de comentarios de odio, spam y toxicidad. La moderación manual es ineficaz a esta escala, resultando costosa, lenta y psicológicamente agotadora para los moderadores. La necesidad de una solución automatizada, precisa y escalable es imperativa.

Nuestra Solución

Este proyecto aborda directamente este problema mediante el diseño, desarrollo y despliegue de una solución integral de Inteligencia Artificial para la detección automática de comentarios tóxicos. Hemos construido una aplicación web full-stack que no solo sirve como una herramienta de demostración, sino como un prototipo funcional y práctico que productiviza modelos avanzados de Procesamiento del Lenguaje Natural (NLP).

Objetivos Clave Alcanzados

Análisis y Preprocesamiento de Datos: Se ha realizado un análisis exhaustivo de los datos de comentarios de YouTube, seguido de la implementación de un robusto pipeline de limpieza y normalización de texto.
Entrenamiento de Modelos Diversos: Se han entrenado y evaluado rigurosamente tres familias de modelos, cubriendo diferentes niveles de complejidad y rendimiento:
1. Machine Learning Clásico (Naive Bayes, SVM).
2. Redes Neuronales Densas (Keras y PyTorch).
3. Modelos Transformer de Vanguardia (BERT, RoBERTa, DeBERTa).
Productivización en una Aplicación Web: Se ha desarrollado una aplicación con un frontend en React y un backend en FastAPI que permite:
- Analizar comentarios individuales en tiempo real.
- Analizar los comentarios de un vídeo de YouTube a partir de su URL.
Persistencia de Datos: Todos los resultados de los análisis se almacenan en una base de datos Supabase para su seguimiento y futura explotación.
Documentación Exhaustiva: Creación de una documentación técnica completa y navegable utilizando MkDocs.

Navegación de la Documentación

Esta documentación está estructurada para guiarte a través de todos los aspectos del proyecto. Utiliza el menú de navegación para explorar las diferentes secciones:

Guía de Instalación: Instrucciones para configurar y ejecutar el proyecto en tu entorno local.
Guía de Uso: Cómo interactuar con la aplicación web.
Arquitectura: Un desglose detallado del frontend y el backend.
API Endpoints: Documentación técnica de la API del servidor.
Modelos de IA: Un análisis profundo de cada modelo entrenado.
Gestión de Datos y Experimentación: Información sobre los datasets y los notebooks de Jupyter utilizados.