Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.utmachala.edu.ec/handle/48000/17867
Título : | Minería de datos y análisis de sentimientos en redes sociales, caso de estudio: percepción del covid-19 en el Ecuador. |
Autor : | Simbaña Cruz, Henry Vinicio |
Director(es): | Mazón Olivo, Bertha Eugenia |
Palabras clave : | MINERIA DE DATOS;ANALISIS DE SENTIMIENTO;RED SOCIAL TWITTER;COVID-19 |
Fecha de publicación : | 2021 |
Editorial : | Machala: Universidad Técnica de Machala |
Citación : | Simbaña Cruz, Henry Vinicio. (2021) Minería de datos y análisis de sentimientos en redes sociales, caso de estudio: percepción del covid-19 en el Ecuador. (trabajo de titulación). UTMACH, Facultad de Ingeniería Civil, Machala, Ecuador. |
Descripción : | El análisis de sentimientos, SA, Sentiment Analysis) es de gran importancia para determinar las actitudes, emociones, opiniones y comentarios de las personas. Hay varios casos de aplicación de SA; por ejemplo, en el caso de las empresas, puede ser útil para determinar las preferencias de sus clientes a un determinado producto o servicio, en el sector gubernamental SA puede usarse para estudiar la satisfacción de los ciudadanos respecto a su gestión, otro caso de aplicación de SA es en la industria del ocio y espectáculo como el cine, y puede servir para analizar las opiniones del público. El análisis de sentimientos comúnmente se realiza mediante comentarios de redes sociales como, Facebook, Instagram, Twitter, YouTube, etc. El propósito de este trabajo consistió en el análisis de comentarios recuperados de la red social Twitter en el contexto de COVID-19 en Ecuador, desde abril del 2020 hasta julio del 2021. La metodología aplicada para desarrollar este proyecto se basó en las mejores prácticas de Cross Industry Standard Process for Data Mining , CRISP-DM, de IBM y Team Data Science Process, TDSP, de Microsoft, las fases y actividades desarrolladas son, 1, Comprensión empresarial, que consiste en el establecimiento de herramientas y repositorios de comentarios a obtener de Twitter. 2 Adquisición y comprensión de datos, que se refiere al preprocesamiento y limpieza de los datos. 4 El modelado, implica la exploración, procesamiento, análisis y visualización de los datos. 5 La evaluación, consiste en la comparación de modelos mediante el cálculo y análisis de las métricas. Y finalmente, 6 El despliegue que trata de tomar la decisión de elegir el método más adecuado de análisis de sentimientos. Los primeros resultados obtenidos fueron de las palabras más frecuentes, se analizó por segmentos de tiempo, 1 En el periodo comprendido entre abril y julio del 2020, las palabras más frecuentes fueron, COVID y miedo, dando a entender que la población estaba entrando en una etapa de pánico. 2 Luego en el periodo entre agosto y noviembre del 2020, se destacaron las palabras, Pandemia, Casos, Funerarias, desbordadas, putrefactos, lo que denota que se estaba viviendo momentos muy difíciles de pérdidas humanas y una fuerte incertidumbre en el país. 3 Posteriormente, el periodo analizado entre diciembre del 2020 y marzo del 2021, las palabras más relevantes fueron, Ecuador, Suma, Casos, al comparar con las estadísticas en ese período, efectivamente se elevaron los casos de COVID-19 en el país. 4 Finalmente en el periodo de abril a julio del 2021, las palabras que más mencionadas fueron, vacuna, COVID, lo que coincide con el proceso de vacunación que se llevó a cabo en este periodo. |
Resumen : | Sentiment Analysis, SA, Sentiment Analysis is of great importance in determining people's attitudes, emotions, opinions and comments. There are several cases of application of SA; For example, in the case of companies, it can be useful to determine the preferences of their customers for a certain product or service, In the government sector SA can be used to study the satisfaction of citizens with respect to its management, Another case of application of SA is in the entertainment and entertainment industry such as the cinema, and it can be used to analyze the opinions of the public. Sentiment analysis is commonly done through comments from social networks such as, Facebook, Instagram, Twitter, YouTube, etc. The purpose of this work consisted in the analysis of comments retrieved from the social network Twitter in the context of COVID-19 in Ecuador, from April 2020 to July 2021. The methodology applied to develop this project was based on the best practices of Cross Industry Standard Process for Data Mining, CRISP-DM, from IBM and Team Data Science Process, TDSP from Microsoft, The phases and activities developed are, 1 Business understanding, which consists of establishing tools and repositories of comments to be obtained from Twitter. 2 Data acquisition and understanding, which refers to the pre-processing and cleaning of data. 4 Modeling involves the exploration, processing, analysis and visualization of data. 5 The evaluation consists of the comparison of models through the calculation and analysis of the metrics. And finally, 6 The deployment that tries to make the decision to choose the most appropriate method of sentiment analysis. The first results obtained were for the most frequent words, It was analyzed by time segments, 1 In the period between April and July 2020, the most frequent words were, COVID and fear, implying that the population was entering a stage of panic. 2 Then in the period between August and November 2020, the words, Pandemic, Cases, Funeral homes, overflowing, rotten stood out, which denotes that very difficult moments of losses were being experienced human rights and a strong uncertainty in the country. 3 Subsequently, the period analyzed between December 2020 and March 2021, the most relevant words were, Ecuador, Sum, Cases, when comparing with the statistics in that period, COVID cases actually rose -19 in the country. 4) Finally, in the period from April to July 2021, the most frequently mentioned words were, vaccine, COVID, which coincides with the vaccination process that was carried out in this period. |
URI : | http://repositorio.utmachala.edu.ec/handle/48000/17867 |
Aparece en las colecciones: | Trabajo de Titulación Ingeniería de sistemas |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TTFIC-2021-IS-DE00035.pdf | TRABAJO DE TITULACION | 2,57 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons