Перейти к содержанию

Обнаружение наборов данных из WIS2 Global Discovery Catalogue

Результаты обучения!

К концу этой практической сессии вы сможете:

  • использовать pywiscat для обнаружения наборов данных из Global Discovery Catalogue (GDC)

Введение

В этой сессии вы научитесь находить данные из WIS2 Global Discovery Catalogue (GDC) с помощью pywiscat, инструмента командной строки для поиска и извлечения метаданных из WIS2 GDC.

На данный момент доступны следующие GDC:

Во время локальных тренировочных сессий настраивается локальный GDC, чтобы участники могли запрашивать метаданные, опубликованные из их экземпляров wis2box. В этом случае тренеры предоставят URL-адрес локального GDC.

Подготовка

Note

Перед началом, пожалуйста, войдите в вашу виртуальную машину (VM) студента.

Установка pywiscat

Используйте установщик пакетов Python pip3 для установки pywiscat на вашу виртуальную машину:

pip3 install pywiscat

Note

Если вы столкнулись со следующей ошибкой:

WARNING: The script pywiscat is installed in '/home/username/.local/bin' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.

Тогда выполните следующую команду:

export PATH=$PATH:/home/$USER/.local/bin

...где $USER — это ваше имя пользователя на виртуальной машине.

Убедитесь, что установка прошла успешно:

pywiscat --version

Поиск данных с помощью pywiscat

По умолчанию pywiscat подключается к Global Discovery Catalogue (GDC), размещенному Environment and Climate Change Canada (ECCC).

Изменение URL-адреса GDC

Если вы выполняете это упражнение во время локальной тренировочной сессии, вы можете настроить pywiscat для запроса локального GDC, установив переменную окружения PYWISCAT_GDC_URL:

export PYWISCAT_GDC_URL=http://gdc.training.wis2dev.io/collections/wis2-discovery-metadata

Чтобы увидеть доступные опции, выполните:

pywiscat search --help

Вы можете выполнить поиск всех записей в GDC:

pywiscat search

Question

Сколько записей возвращается в результате поиска?

Нажмите, чтобы увидеть ответ

Количество записей зависит от GDC, который вы запрашиваете. При использовании локального тренировочного GDC вы должны увидеть, что количество записей равно количеству наборов данных, загруженных в GDC во время других практических сессий.

Попробуем выполнить запрос к GDC с использованием ключевого слова:

pywiscat search -q observations

Question

Какова политика данных в результатах?

Нажмите, чтобы увидеть ответ

Все возвращенные данные должны указывать на "core" данные.

Попробуйте дополнительные запросы с использованием -q.

Tip

Флаг -q поддерживает следующий синтаксис:

  • -q synop: найти все записи с словом "synop"
  • -q temp: найти все записи с словом "temp"
  • -q "observations AND oman": найти все записи с словами "observations" и "oman"
  • -q "observations NOT oman": найти все записи, содержащие слово "observations", но не содержащее слово "oman"
  • -q "synop OR temp": найти все записи с "synop" или "temp"
  • -q "obs*": нечеткий поиск

При поиске терминов с пробелами заключайте их в двойные кавычки.

Давайте получим больше информации о конкретном результате поиска, который нас интересует:

pywiscat get <id>

Tip

Используйте значение id из предыдущего поиска.

Заключение

Поздравляем!

В этой практической сессии вы научились:

  • использовать pywiscat для обнаружения наборов данных из WIS2 Global Discovery Catalogue