DSpace logo

Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.utmachala.edu.ec/handle/48000/19919
Título : Diseño de un modelo para la predicción de ataques cardíacos mediante técnicas de aprendizaje automático
Autor : Murillo Vivanco, Carlos Alfredo
Director(es): Rivas Asanza, Wilmer Braulio
Palabras clave : APRENDIZAJE AUTOMATICO;ENFERMEDAD CARDIOVASCULAR;INTELIGENCIA ARTIFICIAL;ALGORITMO
Fecha de publicación : 2022
Editorial : Machala: Universidad Tëcnica de Machala
Citación : Murillo Vivanco, Carlos Alfredo (2022) Diseño de un modelo para la predicción de ataques cardíacos mediante técnicas de aprendizaje automático (trabajo de titulación). UTMACH, Facultad de Ingeniería Civil, Machala, Ecuador.
Descripción : Un ataque al corazón es la necrosis isquémica del corazón, la cual es causada normalmente cuando las arterias que lo irrigan se encuentran obstruidas. La detección temprana de esta enfermedad cardiovascular permite aumentar las posibilidades de salvar las vidas de muchas personas y permitiendo que se pueda tomar medidas en el cuidado de su salud. Con el paso de los años con la ayuda de la tecnología se han dado grandes avances dentro del área de salud, como es el caso de la Inteligencia Artificial (IA), la cual ha permitido mejorar la atención de los pacientes al agilizar los procesos y obtener una mayor precisión en los diagnósticos médicos. Las radiografías, las preparaciones con respecto a la anatomía patológica y los exámenes médicos están siendo utilizados para ayudar en el proceso de diagnóstico y tratamiento de los pacientes mediante el uso del aprendizaje automático. Permitiendo que de esta manera existan proyectos dedicados a explorar las aplicaciones de la Inteligencia Artificial en algunas áreas sanitarias como son: la asistencial que se encarga de la prevención de enfermedades, el diagnóstico, tratamiento y seguimiento de la salud del paciente, el área de formación continua que permite a los especialistas interactuar con entornos virtuales de entrenamiento y aprendizaje; el área de investigación, que permite buscar pruebas de la utilidad de la IA en la salud mediante el uso de información médica, ayudando a que se desarrollen programas para numerosas enfermedades, y por último el área de gestión, en la cual se analizan grandes cantidades de datos históricos, lo que facilita tratar los recursos tanto como materiales y humanos de una mejor manera, frente a alguna situación específica. Este trabajo se encuentra orientado dentro del campo de la ciencia de datos, y consiste en el desarrollo de un modelo de predicción de ataques cardíacos, a partir de un dataset de datos clínicos recopilados de pacientes, que fue conseguido en el sitio Kaggle, el cual cuenta con 65535 registros y está compuesto de 13 variables como son: edad, género, peso, estatura, índice de masa corporal, presión arterial sistólica (alta), presión arterial diastólica (baja), colesterol, glucosa, fumar, beber, ejercitar y cardio. Y haciendo uso de técnicas de aprendizaje automático, ya que dichas técnicas permiten la identificación de patrones en los datos, lo cual permitirá que el modelo aprenda de las observaciones y lo más importante permita hacer las predicciones. Se utilizaron algunos algoritmos de Machine Learning como por ejemplo. Logistic Regression, Random Forest, MultiLayer Perceptron, Extreme Gradient Boosting, Gaussian Naive Bayes, Support Vector Machine, Decision Tree, Gradient Boosting y Light Gradient Boosted Machine, para determinar cuál realiza una mejor predicción, para escoger el algoritmo se hizo uso de las métricas de rendimiento las cuales fueron, matriz de confusión, exactitud, precisión, sensibilidad, puntuación F1 y el área bajo la curva, dándonos mejores resultados el algoritmo de Gradient boosting, teniendo los siguientes resultados: exactitud 72,33%, precisión 74,10%, sensibilidad 69,83%, puntuación F1 71,90% y área bajo la curva 72,36%. El cual se la guardo en un archivo de extensión .pkl para utilizarlo en la creación de un dashboard en una página web, que permite el ingreso de los datos acorde a las variables del dataset que se mencionaron con anterioridad, y predecir si una persona puede padecer una enfermedad cardiaca o no, y a su vez teniendo en cuentas los datos de las variables realizar recomendaciones al paciente.
Resumen : A heart attack is ischemic necrosis of the heart, which is usually caused when the arteries supplying the heart are obstructed. Early detection of this cardiovascular disease increases the chances of saving the lives of many people and allows them to take measures to take care of their health. Over the years, with the help of technology, great advances have been made in the area of healthcare, such as Artificial Intelligence (AI), which has made it possible to improve patient care by streamlining processes and obtaining greater precision in medical diagnoses. X-rays, preparations with respect to pathological anatomy and medical examinations are being used to assist in the process of diagnosis and treatment of patients through the use of machine learning. Allowing in this way that there are projects dedicated to explore the applications of Artificial Intelligence in some healthcare areas such as, the care area, which is responsible for disease prevention, diagnosis, treatment and monitoring of patient health; the area of continuing education, which allows specialists to interact with virtual training and learning environments; the research area, which allows the search for evidence of the usefulness of AI in health through the use of medical information, helping to develop programs for numerous diseases, and finally the management area, in which large amounts of historical data are analyzed, which facilitates the treatment of both material and human resources in a better way, against a specific situation. This work is oriented within the field of data science, and consists of the development of a prediction model of heart attacks, from a dataset of clinical data collected from patients, which was obtained from the Kaggle site, which has 65535 records and is composed of 13 variables such as, age, gender, weight, height, body mass index, systolic blood pressure (high), diastolic blood pressure (low), cholesterol, glucose, smoking, drinking, exercise and cardio. And making use of machine learning techniques, since these techniques allow the identification of patterns in the data, which will allow the model to learn from the observations and most importantly to make predictions. Some Machine Learning algorithms were used such as; Logistic Regression, Random Forest, MultiLayer Perceptron, Extreme Gradient Boosting, Gaussian Naive Bayes, Support Vector Machine, Decision Tree, Gradient Boosting and Light Gradient Boosted Machine, to determine which one performs a better prediction, to choose the algorithm the performance metrics were used which were: Confusion matrix, accuracy, precision, sensitivity, F1 score and the area under the curve, giving us better results the Gradient boosting algorithm, having the following results: accuracy 72.33%, precision 74.10%, sensitivity 69.83%, F1 score 71.90% and area under the curve 72.36%. Which was saved in a .pkl extension file to be used in the creation of a dashboard on a web page, which allows the entry of data according to the variables of the dataset mentioned above, and predict whether a person may have a heart disease or not, and in turn taking into account the data of the variables to make recommendations to the patient.
URI : http://repositorio.utmachala.edu.ec/handle/48000/19919
Aparece en las colecciones: Trabajo de Titulación Ingeniería de sistemas

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TTFIC-2022-IS-DE00046.pdfTRABAJO DE TITULACION1,82 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons