Taller de manejo y extracción de datos con Python
Tabla de contenidos
FECHA Y LUGAR
Desde 26-04-2018 Hasta 26-04-2018
Aulario Pérez Quintero, Aula1.2,, Campus del Carmen, Huelva
ACERCA DEL EVENTO
Cada día más se busca que los alumnos, docentes e investigadores sean capaces de desarrollar labores transversales de manejo de datos. Para trabajar con datos, lo esencial es disponer de datos. A veces esa información se encuentra estructurada y, en otras ocasiones, está desestructurada. Hoy en día existen numerosas herramientas o procesos por los cuáles un desarrollador puede extraer datos de formatos complejos como un PDF o bien de una o varias páginas web, lo que se conoce como web scraping. El objetivo habitual es tener los datos para poder visualizar y entender su contenido. Tradicionalmente se han utilizado herramientas de ofimática, tales como Excel u open office para almacenar, editar, representar información proveniente de otros ficheros.
Hoy en día una gran parte de la información que manejan el entorno universitario, tanto en la docencia como en la investigación se encuentra en sitios webs.
Se plantea por tanto la necesidad de extraer datos de este entorno y analizarlo de una forma más flexible y reutilizable. Para ello se plantea el uso de lenguajes de scripting de amplia utilización por la comunidad de usuarios que facilita la modificación de scripts existentes para adaptarlos a nuestras propias necesidades.
Python es un lenguaje de programación interpretado, cuya filosofía hace hincapié en una sintaxis muy limpia y un código legible. Se propone un taller de este lenguaje que iniciando desde cero sea capaz de dotar de capacidades básicas de extracción de información de sitios webs y su posterior manejo en Python.
La asistencia al taller se certificará con un documento acreditativo.
PROGRAMA
- Introducción e instalación Python (60 minutos)
- Usos y transformación de datos desde Excel/CSV (90 minutos)
- Herramientas de transformación básica en Python
- Librerías Gráficas
- Exportación de datos
- Uso de Python para la extracción de datos (web scraping) (120 minutos)
- Introducción a la extracción de datos
- Pasos
- Reto
- Ejemplos reales de uso de scraping
- Datos abiertos, reutilización y ecosistema del conocimiento abierto (30 minutos)
PONENTES
El taller será impartido por Pablo Martín Muñoz (@pr3ssh), Ingeniero en Informática, Master Oficial en Tecnologías Informáticas Avanzadas con especialización en Minería de Datos y Aprendizaje Automático. Se define como Hacker Cívico. Co-Fundador de openkratio.org y enreda.coop, lleva años liderando la trasparencia y el conocimiento abierto en varios proyectos con la administración y las universidades andaluzas.
PATROCINADORES
- Escuela técnica superior de ingeniería
ORGANIZACIÓN
Concurso Universitario de Software Libre (CUSL)
Organizado por Vicerrectorado Informática, Comunicaciones e Infraestructuras. Dirección de Software Libre y Conocimiento Abierto.