Introducción

El API de Junar es la base para varias iniciativas de Datos Abiertos en Latino América y los EEUU. El paquete junr facilita el acceso a estos datos desde R. El objetivo es fomentar el uso de los datos disponibles haciendo el acceso lo mas fácil. Algunos ejemplos de implementaciones se pueden encontrar en el sitio web de Junar.

Ejemplos de uso

Como ejemplo vamos a usar los datos de la casa presidencial de Costa Rica. Lo primero es ir al sitio correspondiente para encontrar el URL base (base_url) y obtener un API Key para obtener acceso al API de Junar en la página de Datos Abiertos Costa Rica.

Miremos primero cuales datos hay disponibles en este URL.

get_index(url_base, api_key)

No mostramos los resultados aquí porque el indice es la lista completa con todos los meta-datos incluidos como una hoja de datos (data frame) en R.

Para tener solo una lista de los GUID la instrucción es:

list_guid(url_base, api_key)

Y solo un listado de los títulos.

list_titles(url_base, api_key)

Tanto list_guid() como list_titles() fueron escritos para hacernos la vida mas fácil ya que los resultados tienden a ajustarse a una ventana de consola, lo cual lo hace mas fácil leerlos. Ayudan para tener una sobrevista rápida de los datos que hay disponibles.

Bajar datos a R

Necesitas conocer el Identificador Global Único (GUID) de los datos que son de tu interés para poder bajar los datos a tu sesión de R. Puedes buscar el GUID en la página web. Por ejemplo para en la pagina de compras publicas del sitio de Datos Abiertos de Costa Rica hay una tabla con el titulo “Compras Públicas del Ministerio de la Presidencia”. En el menu debajo de la tabla existe la opción “obtener GUID”. Esta última abre una ventana con el GUID “COMPR-PUBLI-DEL-MINIS” que vamos a usar aquí abajo.

Con View(datos_compras) podrás comprobar que los datos han sido bajado desde la plataforma Junar y han sido convertidos a una hoja de datos (data frame) en R (mira mas abajo para convertir datos de divisas a números).

Observa que no necesitamos ir a la interfaz para buscar los GUID de los conjuntos de datos que nos interesan. Con la función list_guid() como la usamos arriba obtuvimos la misma información.

## [1] "ABRIL-2019-SALAR-PRESI-DE"

Obtenemos el GUID que queremos indicando que es el tercero en la lista (mira la lista completa mas arriba). Y el mismo índice se puede usar en una lista de los títulos completos que podemos crear con la función list_titles().

Determinar la cantidad de datos disponibles

En las plataformas que corren en Junar se encuentran muchos datos que no son mas que tablas (datos ya trabajados y resumidos). Por eso es útil poder ver de una vez cuantos filas hay detrás de cada GUID en el URL disponible.

En junr lo puedes hacer rápidamente usando la función get_dimensions para obtener una tabla con todos los GUID y las dimensiones de los datos:

get_dimensions(url_base, api_key)

Limpiar valores de divisas

Por lo menos en los datos ejemplo arriba, pero posiblemente en mas implementaciones de Junar, hay que limpiar todos los datos que corresponden a divisas. En nuestro caso hay que buscar todos los símbolos de la divisa (Colon Costarricense), y todas las comas ya que estas hacen que para R son valores de Texto y no números.

Hay un para de utilidades para hacerlo clean_currency y get_currency_symbol. Por ejemplo:

datos_con_divisas <- get_data(url_base, api_key, "LICIT-ADJUD-POR-LOS-MINIS")
datos_con_divisas$`Monto Adjudicado` <- clean_currency(datos_con_divisas$`Monto Adjudicado`)