跳转至

从WIS2全球发现目录中发现数据集

学习目标!

完成本实践课程后,您将能够:

  • 使用pywiscat从Global Discovery Catalogue (GDC)中发现数据集

介绍

在本课程中,您将学习如何从WIS2 Global Discovery Catalogue (GDC)中发现数据。

目前,以下GDC可用:

在本地培训课程中,会设置一个本地GDC,让参与者可以查询他们从wis2box实例发布的元数据。在这种情况下,培训师将提供本地GDC的URL。

准备工作

Note

开始之前请登录您的学员虚拟机。

安装pywiscat

使用pip3 Python包安装器在您的虚拟机上安装pywiscat:

pip3 install pywiscat

Note

如果您遇到以下错误:

WARNING: The script pywiscat is installed in '/home/username/.local/bin' which is not on PATH.
Consider adding this directory to PATH or, if you prefer to suppress this warning, use --no-warn-script-location.

那么运行以下命令:

export PATH=$PATH:/home/$USER/.local/bin

其中$USER是您在虚拟机上的用户名。

验证安装是否成功:

pywiscat --version

使用pywiscat查找数据

默认情况下,pywiscat连接到加拿大的Global Discovery Catalogue。让我们通过设置PYWISCAT_GDC_URL环境变量来配置pywiscat以查询培训GDC:

export PYWISCAT_GDC_URL=http://gdc.wis2.training:5002

让我们使用pywiscat来查询作为培训一部分设置的GDC。

pywiscat search --help

现在搜索GDC中的所有记录:

pywiscat search

Question

搜索返回了多少条记录?

点击查看答案

记录数量取决于您查询的GDC。当使用本地培训GDC时,您应该看到记录数量等于在其他实践课程中已导入GDC的数据集数量。

让我们尝试使用关键词查询GDC:

pywiscat search -q observations

Question

结果的数据政策是什么?

点击查看答案

所有返回的数据都应指定为"core"数据

尝试使用-q进行其他查询

Tip

-q标志允许以下语法:

  • -q synop:查找所有包含"synop"这个词的记录
  • -q temp:查找所有包含"temp"这个词的记录
  • -q "observations AND oman":查找所有包含"observations"和"oman"这两个词的记录
  • -q "observations NOT oman":查找所有包含"observations"但不包含"oman"这个词的记录
  • -q "synop OR temp":查找所有包含"synop"或"temp"的记录
  • -q "obs*":模糊搜索

当搜索包含空格的术语时,请用双引号括起来。

让我们获取我们感兴趣的特定搜索结果的更多详细信息:

pywiscat get <id>

Tip

使用之前搜索中的id值。

结论

恭喜!

在本实践课程中,您学会了如何:

  • 使用pywiscat从WIS2 Global Discovery Catalogue中发现数据集