- Curs d'especialització UAB
- Codi de l'estudi: 4316/1
- 1a edició
- Modalitat: Semipresencial
- Crèdits: 10 ECTS
- Inici: 09/04/2021
- Final: 27/06/2021
- Places: 35
- Orientació: Professional
- Preu: 950 ¤
- Idioma de docència: Castellà
-
Lloc: Institut Universitari Parc Tauli Parc Del Tauli, 1. 08208 Sabadell
Horaris: Divendres: 16:00 – 20:00 i Dissabtes 9:00-13:00h
La necessitat de processament massiu de dades és una realitat que aprofita la potencia de les infraestructures de còmput distribuït i la disponibilitat creixent de dades no estructurats o semi estructurats. Aquesta unió permet disposar de capacitat d’anàlisi fent servir els algoritmes apropiats per extraure conclusions a partir de grans volums de dades en períodes raonables de temps.
Aquest mòdul presenta una estructura equilibrada entre els conceptes més importants del tema i casos d’ús pràctics orientats a realitzar experiències significatives sobre infraestructures reals.
Així, l’estudiant aprèn els conceptes bàsics sobre el processament distribuït de grans volums de dades i rep una introducció pràctica a algunes de les tecnologies i eines utilitzades actualment en aquest camp.
- Característiques del Big Data, adquisició i emmagatzematge.
- Entorns per al processament distribuït de BD: tecnologia i infraestructura (des del clúster al cloud).
- Processament, emmagatzematge i visualització: eines i entorns de treball.
- Casos d'ús: Cloudera, HortonWorks, MapR, AWS, Google, Azure.
- Models d'emmagatzematge de dades: jeràrquic, relacional, objectes, declaratiu, grafs, no estructurats.
- Models de processament de dades: Map-Reduce, Spark, Tuples, Graph, Batch, ...
- Models de visualització de dades.
- Cas d'estudi: entorn integrat de processament i visualització de dades (OpenML)
- Casos d'ús sobre dades mèdiques: Text-Analytics, Data Processing & Visualization, Search & Classify.
Aquest mòdul presenta una estructura equilibrada entre els conceptes més importants del tema i casos d’ús pràctics orientats a realitzar experiències significatives sobre infraestructures reals.
Així, l’estudiant aprèn els conceptes bàsics sobre el processament distribuït de grans volums de dades i rep una introducció pràctica a algunes de les tecnologies i eines utilitzades actualment en aquest camp.
Continguts
- Big Data: impacte de les dades en la societat actual.- Característiques del Big Data, adquisició i emmagatzematge.
- Entorns per al processament distribuït de BD: tecnologia i infraestructura (des del clúster al cloud).
- Processament, emmagatzematge i visualització: eines i entorns de treball.
- Casos d'ús: Cloudera, HortonWorks, MapR, AWS, Google, Azure.
- Models d'emmagatzematge de dades: jeràrquic, relacional, objectes, declaratiu, grafs, no estructurats.
- Models de processament de dades: Map-Reduce, Spark, Tuples, Graph, Batch, ...
- Models de visualització de dades.
- Cas d'estudi: entorn integrat de processament i visualització de dades (OpenML)
- Casos d'ús sobre dades mèdiques: Text-Analytics, Data Processing & Visualization, Search & Classify.
Itineraris
Aquest curs pertany al Màster en Intel.ligència Artificial i Big Data en Salut (4291/1)Beques i ajuts
Consulta la informació a la pàgina de beques, ajuts i convocatòries UAB.
Centres responsables
Departament de Telecomunicació i d'Enginyeria de Sistemes
Institut Universitari Fundació Parc Taulí
Contacte
Jose Antonio Ibeas Lopez