Обнаружение наборов данных из WIS2 Global Discovery Catalogue
Результаты обучения!
К концу этой практической сессии вы сможете:
- использовать pywiscat для обнаружения наборов данных из Global Discovery Catalogue (GDC)
Введение
В этой сессии вы научитесь находить данные из WIS2 Global Discovery Catalogue (GDC) с помощью pywiscat, инструмента командной строки для поиска и извлечения метаданных из WIS2 GDC.
На данный момент доступны следующие GDC:
- Environment and Climate Change Canada, Meteorological Service of Canada: https://wis2-gdc.weather.gc.ca
- China Meteorological Administration: https://gdc.wis.cma.cn
- Deutscher Wetterdienst: https://wis2.dwd.de/gdc
Во время локальных учебных сессий настраивается локальный GDC, чтобы участники могли запрашивать GDC для получения метаданных, опубликованных из их экземпляров wis2box. В этом случае тренеры предоставят URL для локального GDC.
Подготовка
Note
Перед началом, пожалуйста, войдите в свою виртуальную машину (VM) для студентов.
Установка pywiscat
Используйте установщик пакетов Python pip3 для установки pywiscat на вашу виртуальную машину (VM):
pip3 install pywiscat
Note
Если вы столкнулись со следующей ошибкой:
WARNING: The script pywiscat is installed in '/home/username/.local/bin' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.
Тогда выполните следующую команду:
export PATH=$PATH:/home/$USER/.local/bin
...где $USER — это ваше имя пользователя на вашей виртуальной машине.
Убедитесь, что установка прошла успешно:
pywiscat --version
Поиск данных с помощью pywiscat
По умолчанию pywiscat подключается к Global Discovery Catalogue (GDC), размещенному Environment and Climate Change Canada (ECCC).
Изменение URL GDC
Если вы выполняете это упражнение во время локальной учебной сессии, вы можете настроить pywiscat для запроса локального GDC, установив переменную окружения PYWISCAT_GDC_URL:
export PYWISCAT_GDC_URL=http://gdc.training.wis2dev.io
Чтобы увидеть доступные параметры, выполните:
pywiscat search --help
Вы можете выполнить поиск всех записей в GDC:
pywiscat search
Question
Сколько записей возвращается в результате поиска?
Нажмите, чтобы увидеть ответ
Количество записей зависит от GDC, который вы запрашиваете. При использовании локального учебного GDC вы должны увидеть, что количество записей равно количеству наборов данных, которые были загружены в GDC во время других практических сессий.
Попробуем выполнить запрос к GDC с использованием ключевого слова:
pywiscat search -q observations
Question
Какова политика данных для результатов?
Нажмите, чтобы увидеть ответ
Все возвращенные данные должны быть помечены как "core" (основные данные).
Попробуйте дополнительные запросы с использованием -q.
Tip
Флаг -q поддерживает следующий синтаксис:
-q synop: найти все записи с словом "synop"-q temp: найти все записи с словом "temp"-q "observations AND oman": найти все записи с словами "observations" и "oman"-q "observations NOT oman": найти все записи, содержащие слово "observations", но не слово "oman"-q "synop OR temp": найти все записи с "synop" или "temp"-q "obs*": нечеткий поиск
При поиске терминов с пробелами заключайте их в двойные кавычки.
Получим больше информации о конкретном результате поиска, который нас интересует:
pywiscat get <id>
Tip
Используйте значение id из предыдущего поиска.
Заключение
Поздравляем!
В этой практической сессии вы научились:
- использовать pywiscat для обнаружения наборов данных из WIS2 Global Discovery Catalogue