PyCharm 2025.3 Help

Hive Metastore

借助 PyCharm,您可以监控您的 Hive Metastore。

典型工作流程:

  1. 建立与 Hive 服务器的连接

  2. 在编辑器中预览存储

  3. 在专用工具窗口中预览数据库和分区

连接到 Hive Metastore 服务器

  1. Big Data Tools 窗口中,点击 添加连接 ,然后选择 Hive 元存储

  2. 在打开的 Big Data Tools 对话框中,指定连接参数:

    配置 Hive 连接
    • 名称 :连接名称,用于将其与其他连接区分开来。

    • 配置源 :选择指定 Hive 配置属性的方式:

      • 自定义 :在 URL 框中,输入您的 Hive Metastore 服务器的 URL(metastore.thrift.uris 属性的值)。 如果使用 Kerberos 控制对您的 Hive Metastore 服务器的访问,请在 身份验证 下选择 Kerberos

      • 配置文件夹 :指定 Hive conf 目录的路径, hive-site.xml hive-metastoresite.xml metastore-site.xml 位于该目录中。

    可选:您可以设置:

    • 按项目 :选择后仅为当前项目启用这些连接设置。 如果希望此连接在其他项目中可见,请清除此复选框。

    • 启用连接 :如果要禁用此连接,请清除此复选框。 默认情况下,新建的连接处于启用状态。

    • 启用隧道 :创建到远程主机的 SSH 隧道。 如果目标服务器位于专用网络中,但可以通过 SSH 连接到该网络中的主机,则此功能会很有用。

      选中该复选框并指定 SSH 连接的配置(点击 ... 可创建新的 SSH 配置)。

    • 使用 筛选器 部分仅显示特定数据:

      • 数据库模式 :如果您只想在 编辑器选项卡中 查看部分 Hive 数据库,请在此字段中输入用于数据库名称的正则表达式。

      • 表模式 :如果您只想在 编辑器选项卡中 查看部分数据库表,请在此字段中输入用于表名称的正则表达式。

    • 扩展连接设置 | 高级属性 :输入任何其他 Hive 配置属性。 在您输入时,PyCharm 会显示属性名称建议。 对于每个属性,还会显示快速文档和默认值。

  3. 填写完设置后,点击 测试连接 以确保所有配置参数均正确。 然后点击 确定

在编辑器中查看数据库

您可以在编辑器的单独选项卡中打开 Hive Metastore 或其特定目录、数据库和表(类似于 其他存储)。

  1. Big Data Tools 工具窗口中,选择到您的 Hive Metastore 的连接,或展开以打开目录、数据库或表。

  2. 右键点击所选元素,然后选择 在编辑器中打开。 或者,点击 在编辑器中打开按钮

    这会在您的编辑器中以单独选项卡打开所选存储、目录、数据库或表。

  3. 在已打开选项卡的右侧,使用 打开编辑器预览按钮 显示和隐藏所选元素的详细信息。

Hive Metastore 选项卡

监控数据库

一旦与 Hive 服务器建立连接, Hive 元存储 工具窗口即可使用。 您可以使用其监控数据库、查看架构和分区,并配置数据的显示方式:

  • 过滤器 字段中开始输入名称,以按名称筛选数据库。

  • 点击 以按存储类型筛选数据。

  • 点击 显示和隐藏列图标 以在数据库视图中显示或隐藏列。

Hive Metastore 工具窗口

位置 列中,您可以点击数据库 URL,以便快速在 HDFS 或 S3 查看器中打开目录。 如果所需的连接不存在,这将打开创建连接的表单。

最后修改日期: 2025年 12月 2日