Overview
Este curso te brindará los conocimientos introductorios sobre el procesamiento de lenguaje natural y las diversas tareas relacionadas al pre procesamiento de grandes volúmenes de texto.
Te encontrarás con situaciones cotidianas que se enfrentan al trabajar con proyectos de NLP, para poder poner en juego todo lo aprendido.
Para desarrollar aplicaciones se va a utilizar Pyhon 3.6 o superior. Alternativamente se puede utilizar el entorno de Anaconda con la misma versión de Python.
Como editor de código, los ejemplos van a ser editados en el Notebook de Anaconda, pero el alumno puede utilizar cualquier editor de texto que reconozca notebooks de Anaconda.
Librerías que es necesario tener instaladas para realizar el curso: NLTK, Pandas, SCIKIT-learn.
Syllabus
- ¿Qué es el Procesamiento de Lenguaje Natural?
- ¡Bienvenidos al primer módulo del curso! En este módulo se presentarán los rudimentos básicos del procesamiento del lenguaje natural (NLP), origen del mismo, principales características, usos frecuentes y problemas apropiados para la resolución mediante esta técnica.
- Detalle de las etapas del procesamiento del lenguaje natural
- En esta etapa se describen un conjunto de tareas comunes a al procesamiento del lenguaje natural. Al iniciar un proyecto de lenguaje natural ciertas tareas son realizadas, el objetivo de este apartado es entender cuáles son y cómo se deben llevar a cabo.
- Evaluar el sentimiento de un texto en forma automática
- Uno de los aspectos donde más esfuerzos se han dedicado NLP es poder evaluar la dimensión sentimiento de un texto. En este módulo se definirán las diversas formas de evaluar el sentimiento de un texto, como relacionar este sentimiento a una acción concreta que este alineado a alcanzar algún objetivo de negocio.
- Encadenamiento de tareas y control de trabajo
- Un aspecto que no es tenido en cuenta en el NLP en términos generales es cómo orquestar un proceso repetitivo para ejecutar las tareas necesarias para el proyecto que se deba implementar. Aquí es importante destacar que en muchos casos se deben manejar gigas de archivos en diversos formatos. Por lo antes expuesto es que en este curso se definirán arquitecturas y técnicas para solucionar el problema en cuestión.
- Construcción de entorno para pre procesamiento
- En este módulo se unirán todos los conocimientos adquiridos en el curso para generar un modelo de extracción de información en forma automática.
Taught by
Hernán Daniel Merlino