从WIS2全球发现目录中发现数据集
学习目标!
完成本实践课程后,您将能够:
- 使用pywiscat从Global Discovery Catalogue (GDC)中发现数据集
介绍
在本课程中,您将学习如何从WIS2 Global Discovery Catalogue (GDC)中发现数据。
目前,以下GDC可用:
- Environment and Climate Change Canada, Meteorological Service of Canada: https://wis2-gdc.weather.gc.ca
- China Meteorological Administration: https://gdc.wis.cma.cn
- Deutscher Wetterdienst: https://wis2.dwd.de/gdc
在本地培训课程中,会设置一个本地GDC,让参与者可以查询他们从wis2box实例发布的元数据。在这种情况下,培训师将提供本地GDC的URL。
准备工作
Note
开始之前请登录您的学员虚拟机。
安装pywiscat
使用pip3
Python包安装器在您的虚拟机上安装pywiscat:
pip3 install pywiscat
Note
如果您遇到以下错误:
WARNING: The script pywiscat is installed in '/home/username/.local/bin' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.
那么运行以下命令:
export PATH=$PATH:/home/$USER/.local/bin
其中$USER
是您在虚拟机上的用户名。
验证安装是否成功:
pywiscat --version
使用pywiscat查找数据
默认情况下,pywiscat连接到加拿大的Global Discovery Catalogue。让我们通过设置PYWISCAT_GDC_URL
环境变量来配置pywiscat以查询培训GDC:
export PYWISCAT_GDC_URL=http://gdc.wis2.training:5002
让我们使用pywiscat来查询作为培训一部分设置的GDC。
pywiscat search --help
现在搜索GDC中的所有记录:
pywiscat search
Question
搜索返回了多少条记录?
点击查看答案
记录数量取决于您查询的GDC。当使用本地培训GDC时,您应该看到记录数量等于在其他实践课程中已导入GDC的数据集数量。
让我们尝试使用关键词查询GDC:
pywiscat search -q observations
Question
结果的数据政策是什么?
点击查看答案
所有返回的数据都应指定为"core"数据
尝试使用-q
进行其他查询
Tip
-q
标志允许以下语法:
-q synop
:查找所有包含"synop"这个词的记录-q temp
:查找所有包含"temp"这个词的记录-q "observations AND oman"
:查找所有包含"observations"和"oman"这两个词的记录-q "observations NOT oman"
:查找所有包含"observations"但不包含"oman"这个词的记录-q "synop OR temp"
:查找所有包含"synop"或"temp"的记录-q "obs*"
:模糊搜索
当搜索包含空格的术语时,请用双引号括起来。
让我们获取我们感兴趣的特定搜索结果的更多详细信息:
pywiscat get <id>
Tip
使用之前搜索中的id
值。
结论
恭喜!
在本实践课程中,您学会了如何:
- 使用pywiscat从WIS2 Global Discovery Catalogue中发现数据集