Consejo Directivo Nacional

Moreno 1332
4383-6061
9:30 a 18:00 hs

PRUEBA

CAMPUS VIRTUAL

BIBLIOTECA

CIPER

FUNDACION UNIÓN

Profesionales

BIG DATA Y LA REVOLUCI�N DIGITAL

24/08/2018 4491

BIG DATA Y LA REVOLUCI�N DIGITAL:

El uso de datos masivos y sus t�cnicas anal�ticas para eldise�o e implementaci�n de pol�ticas p�blicas en Latinoam�rica y el Caribe Lanota t�cnica en que se basa este resumen fue realizada por el BancoInteramericano de Desarrollo y estuvo a cargo de Patricio Rodr�guez, NormaPalomino y Javier Mondaca.

Introducci�n Los datos han crecido de manera exponencial enlos �ltimos a�os. Los datos masivos (muchas veces llamados por su t�rmino eningl�s, Big Data) se refieren a conjuntos de datos cuyo tama�o excede al quepueden manejar los programas y equipos est�ndares disponibles para capturarlos,almacenarlos y analizarlos. Su an�lisis est� creando valor en muchos sectoresde la econom�a y el gobierno; y suele requerir la presencia de personas conhabilidades en estad�stica y programaci�n, as� como hardware o servicios de nube(cloud computing) para el procesamiento de la informaci�n. Las t�cnicasavanzadas de an�lisis de datos masivos mejoran la toma de decisiones de losgobiernos, al aportar informaci�n que permite dise�ar, implementar ymonitorizar en tiempo real las pol�ticas p�blicas.

El acceso a los datosmasivos y el uso de t�cnicas anal�ticas adecuadas permite identificar y medirproblemas que hasta hace poco estaban ocultos. Las aplicaciones de Big Datapueden beneficiar no solo a las empresas privadas, sino tambi�n a lasadministraciones p�blicas, mejorando las econom�as de cada pa�s. Estosbeneficios mejoran la productividad, como se 1 Estimaciones de McKinsey GlobalInstitute (2017); McAffee (2012) y Forbes (2017) espera en el caso de Uruguaycon un aumento de productividad entre 0.8% y 1.4% anual (2015- 2065),aumentando el valor de la econom�a mundial.

1 Marco conceptual Las llamadas �Tres V�s� �volumen,velocidad y variedad� sirven como caracter�sticas que definen el t�rmino BigData. Sin embargo, con el continuo avance de la tecnolog�a, el modelo tiene queser revisado. Por lo tanto, el estudio propone incorporar cuatro dimensionescualitativas respecto a los datos: 1. Variabilidad: en el mundo de datosmasivos, la cantidad de anomal�as es tan abundante que forman parte delfen�meno a analizar. Es decir, es importante no solo estudiar los patrones;sino tambi�n las excepciones a la regla.

2. Complejidad: nace de la m�ltiple y variada cantidad defuentes de datos existentes.

3. Veracidad: la calidad, confiabilidad y la certezaasociada a los datos.

4. Representaci�n: cuando se trabaja con muestras, esfundamental considerar responsablemente la representatividad de las mismasrespecto a la poblaci�n en general. Los datos masivos aportan valor cuando sonprocesados. La disciplina que trata con el procesamiento y el an�lisis de losdatos masivos, a base de la interacci�n entre la programaci�n y la estad�stica,se denomina Ciencia de Datos. El ciclo de vida del procesamiento y an�lisis dedatos no es lineal. Procesamiento de los datos masivos. En t�rminos generaleshay dos etapas principales del procesamiento de los datos masivos: la gesti�nde los datos y la anal�tica de los datos. La gesti�n de los datos est�compuesta por tres pasos cruciales:

1. La adquisici�n y el almacenamiento de los datos 2. Lalimpieza y la depuraci�n de los datos 3. La preparaci�n para su an�lisis Setrabaja sobre datos nuevos que var�an en formato y origen: texto, audio, video,redes sociales, etc. Por su parte, la anal�tica de los datos trata de respondera las preguntas y/o hip�tesis formuladas a trav�s de t�cnicas de modelamiento yobservaci�n. Para cada conjunto de datos (texto, audio, video, etc.) se aplicanmetodolog�as particulares de an�lisis. M�todos. Hay varios m�todos paraanalizar los datos masivos. Uno de ellos es el an�lisis espacial o los sistemasde informaci�n geogr�fica (SIG), con el que se examinan las propiedadesgeom�tricas, topol�gicas y geogr�ficas de un conjunto de datos. Este m�todo esel que utiliza aplicaciones como Google Maps o Uber. Otro m�todo, que es unasubespecialidad de la Ciencia de la Computaci�n, es el aprendizaje autom�tico(Machine Learning).

Esta subespecialidad se compone de t�cnicas de programaci�nde algoritmos que aprenden a desarrollar tareas, sin necesariamente recibirindicaciones espec�ficas en el c�digo. Dicho aprendizaje puede ser supervisadoy se basa en dar al algoritmo una serie de ejemplos positivos y negativos dealgo para que identifique los patrones que caracterizan a cada uno (porejemplo: un algoritmo que aprende a distinguir un humano en una foto). A suvez, el aprendizaje puede ser no supervisado, tal que los algoritmos noaprenden a base de ejemplos positivos y negativos, sino que identifican gruposde unidades o patrones por su cuenta (por ejemplo: un algoritmo que analiza ungrupo poblacional para identificar subgrupos y las caracter�sticas que loshacen afines).

Tambi�n se usa la inteligencia territorial, un an�lisisespacial que a trav�s de tecnolog�as de informaci�n combina enfoques cualitativos,cuantitativos y espaciales. Por ejemplo, puede usarse para analizar equidad deacceso espacial a servicios p�blicos y privados seg�n variables socioecon�micasy demogr�ficas. Otros m�todos detallados en el documento incluyen: laoptimizaci�n (localizaci�n �ptima de hospitales, escuelas, centros productivos,bodegas), pruebas A/B (probar la efectividad de un tratamiento m�dico o un tipode educaci�n), simulaci�n (pron�sticos bajo circunstancias de El an�lisis delos datos masivos aumenta la productividad y habilita nuevos modelos denegocio, optimizando procesos y mejorando capacidades de monitoreo ypredicci�n. incertidumbre), an�lisis de redes (modelamiento del sistema detransporte) y la visualizaci�n de datos (infograf�as y tableros de mando o dashboards).Tecnolog�a.

El procesamiento de los datos masivos tambi�n requiere detecnolog�a, software y hardware, que puede analizar grandes vol�menes deinformaci�n. La inteligencia de negocios es un tipo de aplicaci�n dise�ada parareportar, analizar y presentar datos. Mashup es otra aplicaci�n que utiliza ycombina la presentaci�n de datos o la funcionalidad de dos o m�s fuentes paracrear nuevos servicios. Tambi�n se usa el software de MapReduce para procesarenormes conjuntos de datos sobre ciertos tipos de problemas en un sistemadistribuido. Datos masivos en Latinoam�rica y el Caribe Caso 1: Movilidadurbana sostenible en Argentina En Rosario, Argentina, usaron los datos masivoscapturados a trav�s de dispositivos de georreferenciaci�n (GPS) para analizarlos movimientos de los ciclistas en la ciudad. El objetivo del proyecto eraentender la relaci�n entre los ciclistas, la infraestructura vial existente ylos siniestros de tr�nsito con el fin de mejorar la infraestructura delsistema. Se obtuvieron datos relativos a la cantidad de viajes, los tiempos,las distancias o velocidad promedio y las calles m�s usadas. Los datos seexploraron visualmente, creando mapas que muestran los principales corredoresutilizados por ciclistas, la velocidad del tr�nsito de bicicletas, los lugaresdonde se concentraban los siniestros y la gravedad de los mismos.

El an�lisis de losdatos ha permitido al gobierno, por ejemplo, identificar las callesespecialmente problem�ticas. En este caso, el procesamiento y an�lisis de losdatos fue realizado externamente, lo cual puede reflejar un d�ficit deinfraestructura de procesamiento o capital humano especializado dentro delgobierno que impide al mismo afrontar este tipo de proyectos. Caso 2: Ciudadesinteligentes en Argentina y Brasil Un estudio del BID (Townsend &ZambranoBarragan, 2016) evalu� la capacidad de algunas ciudades de Argentina yBrasil para implementar iniciativas innovadoras basadas en el an�lisis de datosmasivos. En Bah�a Blanca, Argentina, el gobierno instal� sensores queinformaban sobre los �ndices de contaminaci�n del aire y contaminaci�n ac�sticaproducida por las plantas industriales y puso esta informaci�n a disposici�ndel p�blico en una plataforma online y una aplicaci�n m�vil.

En C�rdoba, Argentina, se desarroll� un sistema deseguimiento de la flota del transporte p�blico que es operado por diferentesempresas privadas. Con ello, se mejor� la exactitud de la informaci�n a lospasajeros y aument� el uso del transporte p�blico.

En S�o Bernardo do Campo, Brasil, se cre� Vo?e SBC unaaplicaci�n m�vil que permite recolectar quejas y sugerencias de los ciudadanosrelacionadas de servicios no-urgentes (e.g., baches, ruidos molestos, �rboles apunto de caer, basura) para la infraestructura detr�s de los servicios. � La anal�tica de datosmasivos ofrece una tremenda oportunidad para mejorar la toma de decisiones ygenerar evidencia para el dise�o, desarrollo y evaluaci�n de pol�ticasp�blicas. � Hayque desarrollar un marco conceptual y una inteligencia de valor p�blica en losdistintos niveles de gobierno para instalar una cultura de toma de decisionesbasada en evidencia. �Los casos en Argentina y Brasil y el proyecto de las PTF de empresas sirvencomo ejemplos del uso de datos masivos.

Demuestran la importancia de desarrollar unainstitucionalidad para la anal�tica de datos masivos, que tiene en cuenta larepresentatividad de los datos. En Fortaleza, Brasil, se llev� a cabo elproyecto �Fortaleza Inteligente� para mejorar la gobernanza de la ciudad. Comoparte del proyecto, se cre� CITINOVA, una fundaci�n p�blica cuya misi�n espromover la ciencia, tecnolog�a e innovaci�n en el gobierno para mejorar losservicios entregados a los ciudadanos. Estas experiencias de ciudadesinteligentes ofrecen tres lecciones importantes para el uso de los datosmasivos en el mejoramiento de un pa�s:

1. La construcci�n de una institucionalidad permitegenerar y administrar los recursos para la infraestructura y el personaldedicado a la inteligencia de valor p�blico. 2. Es necesario lograr unacomunicaci�n transparente y fluida entre el sector p�blico, el sector privado yla ciudadan�a de cada pa�s. 3. Hace falta personas preparadas para trabajar condatos, especialmente los cient�ficos de datos. Caso 3: La utilizaci�n de datosmasivos para estudiar el crecimiento y dispersi�n de la productividad Elproyecto utiliza datos masivos para estimar el crecimiento y dispersi�n en laproductividad total de los factores (PTF) en empresas de diversos pa�ses. LaPTF es la proporci�n de la producci�n que no est� explicada por las cantidadesde insumos que necesita para ser producida; y su nivel estar� determinado porcu�n eficiente e intensivamente se usan los insumos en la producci�n.

Se revis� la PTF de cerca de 20 millones de empresas en alrededor de 30pa�ses durante ocho a�os, entregando un panorama m�s general respecto al estadoy evoluci�n de dicho indicador. Los resultados demuestran que no hay unarelaci�n clara con la combinaci�n entre PTF promedio y pa�ses. Sin embargo,respecto a las perspectivas de evoluci�n futura del PTF, se observa que en casitodas las medidas muestran una tendencia a disminuir. Este caso abre unadiscusi�n sobre un desaf�o importante en el trabajo con datos: larepresentatividad. Pese al gran crecimiento de los datos disponibles, alanalizarlos es importante tener en mente que muchos siguen sin representar atodas las empresas existentes. Este es un resumen ejecutivo adaptado de notat�cnica �

El uso de datos masivos y sus t�cnicas anal�ticas para el dise�o eimplementaci�n de pol�ticas p�blicas en Latinoam�rica y el Caribe� escrito porPatricio Rodr�guez, Norma Palomino y Javier Mondaca. Puedes leerlo en su totalidad aqu�: Using BigData and its Analytical Techniques for Public Policy Design and Implementationin Latin America and the Caribbean

Consejo Directivo Nacional

BIG DATA Y LA REVOLUCI�N DIGITAL

NOTICIAS MÁS LEÍDAS

Publicaciones