Repositorio Dspace

Minería de datos y análisis de sentimientos en redes sociales, caso de estudio: percepción del covid-19 en el Ecuador.

Mostrar el registro sencillo del ítem

dc.contributor.advisor Mazón Olivo, Bertha Eugenia
dc.contributor.author Simbaña Cruz, Henry Vinicio
dc.date.accessioned 2021-10-20T15:06:03Z
dc.date.available 2021-10-20T15:06:03Z
dc.date.issued 2021
dc.identifier.citation Simbaña Cruz, Henry Vinicio. (2021) Minería de datos y análisis de sentimientos en redes sociales, caso de estudio: percepción del covid-19 en el Ecuador. (trabajo de titulación). UTMACH, Facultad de Ingeniería Civil, Machala, Ecuador. es_ES
dc.identifier.other TTFIC-2021-IS-DE00035
dc.identifier.uri http://repositorio.utmachala.edu.ec/handle/48000/17867
dc.description El análisis de sentimientos, SA, Sentiment Analysis) es de gran importancia para determinar las actitudes, emociones, opiniones y comentarios de las personas. Hay varios casos de aplicación de SA; por ejemplo, en el caso de las empresas, puede ser útil para determinar las preferencias de sus clientes a un determinado producto o servicio, en el sector gubernamental SA puede usarse para estudiar la satisfacción de los ciudadanos respecto a su gestión, otro caso de aplicación de SA es en la industria del ocio y espectáculo como el cine, y puede servir para analizar las opiniones del público. El análisis de sentimientos comúnmente se realiza mediante comentarios de redes sociales como, Facebook, Instagram, Twitter, YouTube, etc. El propósito de este trabajo consistió en el análisis de comentarios recuperados de la red social Twitter en el contexto de COVID-19 en Ecuador, desde abril del 2020 hasta julio del 2021. La metodología aplicada para desarrollar este proyecto se basó en las mejores prácticas de Cross Industry Standard Process for Data Mining , CRISP-DM, de IBM y Team Data Science Process, TDSP, de Microsoft, las fases y actividades desarrolladas son, 1, Comprensión empresarial, que consiste en el establecimiento de herramientas y repositorios de comentarios a obtener de Twitter. 2 Adquisición y comprensión de datos, que se refiere al preprocesamiento y limpieza de los datos. 4 El modelado, implica la exploración, procesamiento, análisis y visualización de los datos. 5 La evaluación, consiste en la comparación de modelos mediante el cálculo y análisis de las métricas. Y finalmente, 6 El despliegue que trata de tomar la decisión de elegir el método más adecuado de análisis de sentimientos. Los primeros resultados obtenidos fueron de las palabras más frecuentes, se analizó por segmentos de tiempo, 1 En el periodo comprendido entre abril y julio del 2020, las palabras más frecuentes fueron, COVID y miedo, dando a entender que la población estaba entrando en una etapa de pánico. 2 Luego en el periodo entre agosto y noviembre del 2020, se destacaron las palabras, Pandemia, Casos, Funerarias, desbordadas, putrefactos, lo que denota que se estaba viviendo momentos muy difíciles de pérdidas humanas y una fuerte incertidumbre en el país. 3 Posteriormente, el periodo analizado entre diciembre del 2020 y marzo del 2021, las palabras más relevantes fueron, Ecuador, Suma, Casos, al comparar con las estadísticas en ese período, efectivamente se elevaron los casos de COVID-19 en el país. 4 Finalmente en el periodo de abril a julio del 2021, las palabras que más mencionadas fueron, vacuna, COVID, lo que coincide con el proceso de vacunación que se llevó a cabo en este periodo. es_ES
dc.description.abstract Sentiment Analysis, SA, Sentiment Analysis is of great importance in determining people's attitudes, emotions, opinions and comments. There are several cases of application of SA; For example, in the case of companies, it can be useful to determine the preferences of their customers for a certain product or service, In the government sector SA can be used to study the satisfaction of citizens with respect to its management, Another case of application of SA is in the entertainment and entertainment industry such as the cinema, and it can be used to analyze the opinions of the public. Sentiment analysis is commonly done through comments from social networks such as, Facebook, Instagram, Twitter, YouTube, etc. The purpose of this work consisted in the analysis of comments retrieved from the social network Twitter in the context of COVID-19 in Ecuador, from April 2020 to July 2021. The methodology applied to develop this project was based on the best practices of Cross Industry Standard Process for Data Mining, CRISP-DM, from IBM and Team Data Science Process, TDSP from Microsoft, The phases and activities developed are, 1 Business understanding, which consists of establishing tools and repositories of comments to be obtained from Twitter. 2 Data acquisition and understanding, which refers to the pre-processing and cleaning of data. 4 Modeling involves the exploration, processing, analysis and visualization of data. 5 The evaluation consists of the comparison of models through the calculation and analysis of the metrics. And finally, 6 The deployment that tries to make the decision to choose the most appropriate method of sentiment analysis. The first results obtained were for the most frequent words, It was analyzed by time segments, 1 In the period between April and July 2020, the most frequent words were, COVID and fear, implying that the population was entering a stage of panic. 2 Then in the period between August and November 2020, the words, Pandemic, Cases, Funeral homes, overflowing, rotten stood out, which denotes that very difficult moments of losses were being experienced human rights and a strong uncertainty in the country. 3 Subsequently, the period analyzed between December 2020 and March 2021, the most relevant words were, Ecuador, Sum, Cases, when comparing with the statistics in that period, COVID cases actually rose -19 in the country. 4) Finally, in the period from April to July 2021, the most frequently mentioned words were, vaccine, COVID, which coincides with the vaccination process that was carried out in this period. es_ES
dc.format.extent 80 p. es_ES
dc.language.iso es es_ES
dc.publisher Machala: Universidad Técnica de Machala es_ES
dc.rights openAccess es_ES
dc.rights.uri https://creativecommons.org/licenses/by-nc-sa/3.0/ec/ es_ES
dc.subject MINERIA DE DATOS es_ES
dc.subject ANALISIS DE SENTIMIENTO es_ES
dc.subject RED SOCIAL TWITTER es_ES
dc.subject COVID-19 es_ES
dc.title Minería de datos y análisis de sentimientos en redes sociales, caso de estudio: percepción del covid-19 en el Ecuador. es_ES
dc.type bachelorThesis es_ES
dc.email hsimbana_est@utmachala.edu.ec es_ES
dc.cedula 0704265099 es_ES
dc.utmachtitulacion.titulacion Propuestas tecnológicas es_ES
dc.utmachbibliotecario.bibliotecario Peralta Mercy es_ES
dc.utmachproceso.proceso PT-170521 (2021-1) es_ES


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

openAccess Excepto si se señala otra cosa, la licencia del ítem se describe como openAccess

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta

Estadísticas