- Generar y entrenar un modelo de machine learning para determinar si una noticia es falsa o no.
- Buscar y obtener una base de datos de fake news.
- Hacer limpieza de texto de las noticias para obtener palabras raíz.
- Vectorizar palabras raíz para entrenar modelo.
- Verificar efectividad del modelo
- Comprobar utilidad del modelo con ejemplos reales.
Realizar un modelo de Machine Learning con la libreria de Sci-Kit Learn para Guassian Naive Bayes con el fin de realizar la clasificación de noticias. [Dataset] (https://www.kaggle.com/clmentbisaillon/fake-and-real-news-dataset)
De acuerdo a Revista Panamericana de Salud Publica, el 35% de la población en México usa mucho las redes sociales, lo que significa que es su fuente principal para consulta de noticias. Adicionalmente, el 66% de la población no tiene la capacidad de reconocer noticias falsas. Por lo tanto, es importate generar un modelo de Machine Learning con el fin de obtener un modelo con la mayor efectividad posible, para contrarrestar una esparción desenfrenada de desinformación.
https://docs.google.com/presentation/d/1IVhFt6s1AgwLDWs15ibMnkcJ4u9kikptBJvIr_S_Pik/edit?usp=sharing