DSpace logo

Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.utmachala.edu.ec/handle/48000/16912
Título : Remasterización de videos mediante el uso de visión artificial
Autor : Labanda Fares, Amelia Lilibeth
Director(es): Rivas Asanza, Wilmer Braulio
Palabras clave : DETECCION DE OBJETO;REMASTERIZACION;PYTHON;CNN
Fecha de publicación : 2021
Editorial : Machala: Universidad Técnica de Machala
Citación : Labanda Fares, Amelia Lilibeth (2021) Remasterización de videos mediante el uso de visión artificial (trabajo de titulación). UTMACH, Facultad de Ingeniería Civil, Machala, Ecuador.
Descripción : En la actualidad la gran parte de la implementación se encuentra aplicada en procesos de grandes empresas industriales, debido a esto han surgido ideas de que la visión artificial solo era para esos usos, pero se ha ido demostrando con el pasar del tiempo, que también puede ser aplicada a distintos campos como; la medicina, seguridad y fotografía. Conforme a estos indicios, se realizó investigaciones del uso e implementación de visión artificial en la remasterización de videos, ya que, los videos es la colección de imágenes, audio y otros datos, que serán de ayuda para el propósito de este proyecto. El presente trabajo tiene como finalidad desarrollar e implementar técnicas de visión artificial necesarias para la remasterización de videos en blanco y negro. Para el proceso de remasterización se combina el modelo de red neuronal convolucional pre entrenada con la visión artificial, este modelo obtiene información mediante la realización de un proceso de análisis para identificar características importantes de los objetos. Estas redes pre entrenadas ahorran tiempo y recursos al momento de ejecutar, ya que, si se lo emplearía desde un aprendizaje inicial de cero esto podría tardar semanas y no se podría obtener resultados óptimos, la red neuronal convolucional que se utiliza será la del modelo VGG que cuenta con profundidad de 16 o 19 capas, está entrenado con más de un millón de imágenes, permitiendo ser importado. La red pre entrenada identificará y detectará los objetos a los cuales se le aplicaran la visión artificial. Por otra parte, la visión artificial será la encargada de realizar el proceso de colorización y escalabilidad del video. Las herramientas de trabajo para el desarrollo de este prototipo serán en el lenguaje de programación Python. Además, del uso de importaciones de librerías como OpenCV, Numpy, Keras y Torch las cuales son necesarias para la realización de visión artificial. Por otra parte, se desarrolló una página web intuitiva con el framework Flask permitiendo usarla de una forma ágil y rápida. La página web permite subir un archivo de video con extensión .mp4 como entrada para el proceso y como salida mostrara el resultado del video remasterizado.
Resumen : At present, most of the implementation is applied in processes of large industrial companies, due to this ideas have arisen that artificial vision was only for those uses, but it has been demonstrated over time that it can also be applied to different fields such as medicine, security and photography. According to these indications, research was carried out on the use and implementation of artificial vision in the remastering of videos, since the videos is the collection of images, audio and other data, which will be helpful for the purpose of this project. The present work aims to develop and implement artificial vision techniques necessary for the remastering of black and white videos. For the remastering process, the pre-trained convolutional neural network model is combined with artificial vision, this model obtains information by performing an analysis process to identify important characteristics of the objects. These pre-trained networks save time and resources at the time of execution, since, if it were used from an initial learning of zero this could take weeks and optimal results could not be obtained, the convolutional neural network that is used will be that of the model VGG that has depth of 16 or 19 layers, is trained with more than a million images, allowing it to be imported. The pre-trained network will identify and detect the objects to which the artificial vision will be applied. On the other hand, artificial vision will be in charge of carrying out the video colorization and scalability process. The working tools for the development of this prototype will be in the Python programming language. In addition, the use of imports from libraries such as OpenCV, Numpy, Keras and Torch which are necessary for the realization of artificial vision. On the other hand, an intuitive web page was developed with the Flask framework, allowing it to be used in an agile and fast way. The website allows you to upload a video file with an .mp4 extension as input for the process and as output it will show the result of the remastered video.
URI : http://repositorio.utmachala.edu.ec/handle/48000/16912
Aparece en las colecciones: Trabajo de Titulación Ingeniería de sistemas

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TTFIC-2021-IS-DE-00010.pdfTRABAJO DE TITULACION2,8 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons