DataSpell 2025.2 Help

AWS S3

连接到 AWS S3 服务器

  1. Big Data Tools 窗口中,点击 添加连接 并选择 AWS S3

  2. 在打开的 Big Data Tools 对话框中,指定连接参数:

    配置 S3 连接
    • 名称 :用于区分其他连接的连接名称。

    • 请选择存储类型: AWS S3 或自定义 与S3 兼容的存储

    • 指定存储位置:

      • 对于 AWS S3 存储,请在 区域 列表中选择您的存储区域。

      • 对于自定义的 S3 兼容存储,请在 端点 字段中输入端点 URL,并根据需要输入存储区域,例如 us-east-2

    • 选择获取桶的方法:

      • 若仅获取特定的存储桶,请选择 自定义根 ,并在 根目录 字段中指定存储桶的名称或存储桶中目录的路径。 您可以使用逗号分隔指定多个名称或路径。

      • 若要获取所有存储桶,请选择 帐户中的所有存储桶。 然后您可以使用 bucket 过滤器只显示具有特定名称的 bucket。 您还可以选择 仅限所选区域中的存储桶 ,然后选择一个区域,如果您只想显示来自特定区域的 bucket。

    • 认证类型 让您选择身份验证方法:

      • 默认凭据提供程序链 :使用来自默认提供链的凭证。 如需了解有关链的更多信息,请参阅 使用默认凭证提供程序链

      • 来自凭据文件的配置文件 :请从您的 凭据 文件中选择一个配置文件。

      • 显式访问密钥和密钥 :请手动输入您的凭证。

      • 匿名 :如果您不想限制对公开可见的 bucket 的访问。

    选择了 默认凭据提供程序链来自凭据文件的配置文件 选项后,您可以点击 打开凭据 来定位凭证文件存储的目录。 如果您使用默认位置,通常是在 Linux 或 macOS 上的 ~/.aws/credentials ,或 Windows 上的 C:\Users\<USERNAME>\.aws\credentials 。 或者可以是您的自定义位置,如果您已选择 使用自定义配置

    此外,您可以设置:

    • 启用连接 :如果希望禁用此连接,请取消选中复选框。 默认情况下,新建的连接是启用的。

    您还可以设置 扩展连接设置:

    • HTTP 代理 :选择此项以使用 IDE 代理设置 ,或指定自定义代理设置。

    • 启用隧道. 此选项会创建一个到远程主机的 SSH 隧道。 如果目标服务器在一个私有网络中,但可以通过 SSH 连接到网络中的主机,这将非常有用。

    • 操作超时时间(秒) :输入对远程存储执行的操作(例如获取文件信息、列出或删除对象)的超时时间(秒)。 默认值为 15 秒。

    • 信任所有 SSL 证书 :如果您信任用于此连接的 SSL 证书并且不想验证它,请选择它。 这在开发过程中非常有用,如果您有一个带有自签名证书的主机——验证它可能会导致错误。

  3. 填写设置后,点击 测试连接 以确保所有配置参数正确。 然后点击 确定

一旦建立连接,您就可以查看存储并在其中 处理数据文件

最后修改日期: 2025年 9月 27日