Hive Metastore
借助 PyCharm,您可以监控您的 Hive Metastore。
典型工作流程:
连接到 Hive Metastore 服务器
在 Big Data Tools 窗口中,点击
,然后选择 Hive 元存储。
在打开的 Big Data Tools 对话框中,指定连接参数:

名称 :连接名称,用于将其与其他连接区分开来。
配置源 :选择指定 Hive 配置属性的方式:
自定义 :在 URL 框中,输入您的 Hive Metastore 服务器的 URL(
metastore.thrift.uris属性的值)。 如果使用 Kerberos 控制对您的 Hive Metastore 服务器的访问,请在 身份验证 下选择 Kerberos。配置文件夹 :指定 Hive conf 目录的路径, hive-site.xml 、 hive-metastoresite.xml 或 metastore-site.xml 位于该目录中。
可选:您可以设置:
按项目 :选择后仅为当前项目启用这些连接设置。 如果希望此连接在其他项目中可见,请清除此复选框。
启用连接 :如果要禁用此连接,请清除此复选框。 默认情况下,新建的连接处于启用状态。
启用隧道 :创建到远程主机的 SSH 隧道。 如果目标服务器位于专用网络中,但可以通过 SSH 连接到该网络中的主机,则此功能会很有用。
选中该复选框并指定 SSH 连接的配置(点击 ... 可创建新的 SSH 配置)。
使用 筛选器 部分仅显示特定数据:
:输入任何其他 Hive 配置属性。 在您输入时,PyCharm 会显示属性名称建议。 对于每个属性,还会显示快速文档和默认值。
填写完设置后,点击 测试连接 以确保所有配置参数均正确。 然后点击 确定。
在编辑器中查看数据库
您可以在编辑器的单独选项卡中打开 Hive Metastore 或其特定目录、数据库和表(类似于 其他存储)。
在 Big Data Tools 工具窗口中,选择到您的 Hive Metastore 的连接,或展开以打开目录、数据库或表。
右键点击所选元素,然后选择 在编辑器中打开。 或者,点击
。
这会在您的编辑器中以单独选项卡打开所选存储、目录、数据库或表。
在已打开选项卡的右侧,使用
显示和隐藏所选元素的详细信息。

监控数据库
一旦与 Hive 服务器建立连接, Hive 元存储 工具窗口即可使用。 您可以使用其监控数据库、查看架构和分区,并配置数据的显示方式:
在 过滤器 字段中开始输入名称,以按名称筛选数据库。
点击
以按存储类型筛选数据。
点击
以在数据库视图中显示或隐藏列。

在 位置 列中,您可以点击数据库 URL,以便快速在 HDFS 或 S3 查看器中打开目录。 如果所需的连接不存在,这将打开创建连接的表单。