Перейти к содержанию

Обнаружение наборов данных из WIS2 Global Discovery Catalogue

Результаты обучения!

К концу этой практической сессии вы сможете:

  • использовать pywiscat для обнаружения наборов данных из Global Discovery Catalogue (GDC)

Введение

В этой сессии вы научитесь находить данные из WIS2 Global Discovery Catalogue (GDC) с помощью pywiscat, инструмента командной строки для поиска и извлечения метаданных из WIS2 GDC.

На данный момент доступны следующие GDC:

Во время локальных учебных сессий настраивается локальный GDC, чтобы участники могли запрашивать GDC для получения метаданных, опубликованных из их экземпляров wis2box. В этом случае тренеры предоставят URL для локального GDC.

Подготовка

Note

Перед началом, пожалуйста, войдите в свою виртуальную машину (VM) для студентов.

Установка pywiscat

Используйте установщик пакетов Python pip3 для установки pywiscat на вашу виртуальную машину (VM):

pip3 install pywiscat

Note

Если вы столкнулись со следующей ошибкой:

WARNING: The script pywiscat is installed in '/home/username/.local/bin' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.

Тогда выполните следующую команду:

export PATH=$PATH:/home/$USER/.local/bin

...где $USER — это ваше имя пользователя на вашей виртуальной машине.

Убедитесь, что установка прошла успешно:

pywiscat --version

Поиск данных с помощью pywiscat

По умолчанию pywiscat подключается к Global Discovery Catalogue (GDC), размещенному Environment and Climate Change Canada (ECCC).

Изменение URL GDC

Если вы выполняете это упражнение во время локальной учебной сессии, вы можете настроить pywiscat для запроса локального GDC, установив переменную окружения PYWISCAT_GDC_URL:

export PYWISCAT_GDC_URL=http://gdc.training.wis2dev.io

Чтобы увидеть доступные параметры, выполните:

pywiscat search --help

Вы можете выполнить поиск всех записей в GDC:

pywiscat search

Question

Сколько записей возвращается в результате поиска?

Нажмите, чтобы увидеть ответ

Количество записей зависит от GDC, который вы запрашиваете. При использовании локального учебного GDC вы должны увидеть, что количество записей равно количеству наборов данных, которые были загружены в GDC во время других практических сессий.

Попробуем выполнить запрос к GDC с использованием ключевого слова:

pywiscat search -q observations

Question

Какова политика данных для результатов?

Нажмите, чтобы увидеть ответ

Все возвращенные данные должны быть помечены как "core" (основные данные).

Попробуйте дополнительные запросы с использованием -q.

Tip

Флаг -q поддерживает следующий синтаксис:

  • -q synop: найти все записи с словом "synop"
  • -q temp: найти все записи с словом "temp"
  • -q "observations AND oman": найти все записи с словами "observations" и "oman"
  • -q "observations NOT oman": найти все записи, содержащие слово "observations", но не слово "oman"
  • -q "synop OR temp": найти все записи с "synop" или "temp"
  • -q "obs*": нечеткий поиск

При поиске терминов с пробелами заключайте их в двойные кавычки.

Получим больше информации о конкретном результате поиска, который нас интересует:

pywiscat get <id>

Tip

Используйте значение id из предыдущего поиска.

Заключение

Поздравляем!

В этой практической сессии вы научились:

  • использовать pywiscat для обнаружения наборов данных из WIS2 Global Discovery Catalogue