Обнаружение наборов данных из WIS2 Global Discovery Catalogue
Результаты обучения!
К концу этой практической сессии вы сможете:
- использовать pywiscat для обнаружения наборов данных из Global Discovery Catalogue (GDC)
Введение
В этой сессии вы научитесь находить данные из WIS2 Global Discovery Catalogue (GDC) с помощью pywiscat, инструмента командной строки для поиска и извлечения метаданных из WIS2 GDC.
На данный момент доступны следующие GDC:
- Environment and Climate Change Canada, Meteorological Service of Canada: https://wis2-gdc.weather.gc.ca/collections/wis2-discovery-metadata
- China Meteorological Administration: https://gdc.wis.cma.cn/collections/wis2-discovery-metadata
- Deutscher Wetterdienst: https://wis2.dwd.de/gdc/collections/wis2-discovery-metadata
Во время локальных тренировочных сессий настраивается локальный GDC, чтобы участники могли запрашивать метаданные, опубликованные из их экземпляров wis2box. В этом случае тренеры предоставят URL-адрес локального GDC.
Подготовка
Note
Перед началом, пожалуйста, войдите в вашу виртуальную машину (VM) студента.
Установка pywiscat
Используйте установщик пакетов Python pip3 для установки pywiscat на вашу виртуальную машину:
pip3 install pywiscat
Note
Если вы столкнулись со следующей ошибкой:
WARNING: The script pywiscat is installed in '/home/username/.local/bin' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.
Тогда выполните следующую команду:
export PATH=$PATH:/home/$USER/.local/bin
...где $USER — это ваше имя пользователя на виртуальной машине.
Убедитесь, что установка прошла успешно:
pywiscat --version
Поиск данных с помощью pywiscat
По умолчанию pywiscat подключается к Global Discovery Catalogue (GDC), размещенному Environment and Climate Change Canada (ECCC).
Изменение URL-адреса GDC
Если вы выполняете это упражнение во время локальной тренировочной сессии, вы можете настроить pywiscat для запроса локального GDC, установив переменную окружения PYWISCAT_GDC_URL:
export PYWISCAT_GDC_URL=http://gdc.training.wis2dev.io/collections/wis2-discovery-metadata
Чтобы увидеть доступные опции, выполните:
pywiscat search --help
Вы можете выполнить поиск всех записей в GDC:
pywiscat search
Question
Сколько записей возвращается в результате поиска?
Нажмите, чтобы увидеть ответ
Количество записей зависит от GDC, который вы запрашиваете. При использовании локального тренировочного GDC вы должны увидеть, что количество записей равно количеству наборов данных, загруженных в GDC во время других практических сессий.
Попробуем выполнить запрос к GDC с использованием ключевого слова:
pywiscat search -q observations
Question
Какова политика данных в результатах?
Нажмите, чтобы увидеть ответ
Все возвращенные данные должны указывать на "core" данные.
Попробуйте дополнительные запросы с использованием -q.
Tip
Флаг -q поддерживает следующий синтаксис:
-q synop: найти все записи с словом "synop"-q temp: найти все записи с словом "temp"-q "observations AND oman": найти все записи с словами "observations" и "oman"-q "observations NOT oman": найти все записи, содержащие слово "observations", но не содержащее слово "oman"-q "synop OR temp": найти все записи с "synop" или "temp"-q "obs*": нечеткий поиск
При поиске терминов с пробелами заключайте их в двойные кавычки.
Давайте получим больше информации о конкретном результате поиска, который нас интересует:
pywiscat get <id>
Tip
Используйте значение id из предыдущего поиска.
Заключение
Поздравляем!
В этой практической сессии вы научились:
- использовать pywiscat для обнаружения наборов данных из WIS2 Global Discovery Catalogue