Saltar a contenido

Descubriendo conjuntos de datos del WIS2 Global Discovery Catalogue

¡Resultados de aprendizaje!

Al final de esta sesión práctica, serás capaz de:

  • usar pywiscat para descubrir conjuntos de datos del Global Discovery Catalogue (GDC)

Introducción

En esta sesión aprenderás cómo descubrir datos del WIS2 Global Discovery Catalogue (GDC) utilizando pywiscat, una herramienta de línea de comandos para buscar y recuperar metadatos de un WIS2 GDC.

Actualmente, los siguientes GDCs están disponibles:

Durante las sesiones de capacitación local, se configura un GDC local para permitir que los participantes consulten el GDC por los metadatos que publicaron desde sus instancias de wis2box. En este caso, los instructores proporcionarán la URL del GDC local.

Preparación

Note

Antes de comenzar, por favor inicia sesión en tu VM de estudiante.

Instalando pywiscat

Utiliza el instalador de paquetes de Python pip3 para instalar pywiscat en tu VM:

pip3 install pywiscat

Note

Si encuentras el siguiente error:

WARNING: The script pywiscat is installed in '/home/username/.local/bin' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.

Entonces ejecuta el siguiente comando:

export PATH=$PATH:/home/$USER/.local/bin

...donde $USER es tu nombre de usuario en tu VM.

Verifica que la instalación fue exitosa:

pywiscat --version

Encontrando datos con pywiscat

Por defecto, pywiscat se conecta al Global Discovery Catalogue (GDC) alojado por Environment and Climate Change Canada (ECCC).

Cambiando la URL del GDC

Si estás realizando este ejercicio durante una sesión de capacitación local, puedes configurar pywiscat para consultar el GDC local estableciendo la variable de entorno PYWISCAT_GDC_URL:

export PYWISCAT_GDC_URL=http://gdc.training.wis2dev.io

Para ver las opciones disponibles, ejecuta:

pywiscat search --help

Puedes buscar en el GDC todos los registros:

pywiscat search

Question

¿Cuántos registros se devuelven de la búsqueda?

Haz clic para revelar la respuesta

El número de registros depende del GDC que estás consultando. Al usar el GDC de capacitación local, deberías ver que el número de registros es igual al número de conjuntos de datos que se han ingresado en el GDC durante las otras sesiones prácticas.

Intentemos consultar el GDC con una palabra clave:

pywiscat search -q observations

Question

¿Cuál es la política de datos de los resultados?

Haz clic para revelar la respuesta

Todos los datos devueltos deberían especificar "core" data.

Prueba consultas adicionales con -q

Tip

La bandera -q permite la siguiente sintaxis:

  • -q synop: encuentra todos los registros con la palabra "synop"
  • -q temp: encuentra todos los registros con la palabra "temp"
  • -q "observations AND oman": encuentra todos los registros con las palabras "observations" y "oman"
  • -q "observations NOT oman": encuentra todos los registros que contienen la palabra "observations" pero no la palabra "oman"
  • -q "synop OR temp": encuentra todos los registros con "synop" o "temp"
  • -q "obs*": búsqueda difusa

Cuando busques términos con espacios, encierra en comillas dobles.

Obtengamos más detalles sobre un resultado de búsqueda específico que nos interese:

pywiscat get <id>

Tip

Usa el valor de id del resultado de búsqueda anterior.

Conclusión

¡Felicidades!

En esta sesión práctica, aprendiste cómo:

  • usar pywiscat para descubrir conjuntos de datos del WIS2 Global Discovery Catalogue