创建并配置 dbt 项目
在开始之前
确保满足以下前提条件:
创建 dbt 项目
要创建项目,请执行以下操作之一:
单击 项目小部件 ,然后选择
新建项目。

在 欢迎屏幕上,选择 项目 ,然后单击 新建项目。
在 新建项目 对话框中,选择 dbt 项目类型。

在 名称 字段中指定项目名称,并在 Location 字段中指定位置。 DataSpell 将在提供的位置创建项目目录。
要使用 dbt,您需要一个 profiles.yml 文件 ,其中包含您的数据平台的连接设置。
如果您已有 profiles.yml 文件,请指定 配置文件位置 并选择 要加载的配置文件。
点击 创建。
探索项目结构
新创建的项目包含特定于 dbt 的文件和目录。
项目的结构在 工作区工具窗口 (Alt+1 )中可见:

分析 目录用于存储临时 SQL 查询或不属于主要数据转换逻辑的分析。 这些查询通常用于探索性分析或一次性调查。
宏 目录是您可以存储定义可重用 SQL 代码片段(称为宏)的 SQL 文件的地方。 宏可以用于封装常用的 SQL 模式,使您的代码更加模块化且易于维护。
模型 目录是 dbt 项目中最重要的目录之一。 在这里,您可以定义 dbt 模型,这些模型是包含数据转换和整形逻辑的 SQL 文件。 模型是 dbt 项目的核心构建块。
种子 目录是您可以在 dbt 项目中存储种子数据的地方。 种子是您手动创建和管理的静态数据集。 与 dbt 通常直接从数据仓库读取的源表不同,种子是用户定义的表,您将其作为输入提供给 dbt 模型。
快照 目录用于创建增量模型或数据快照。 快照在您希望捕获数据随时间变化时非常有用。
测试 目录是您为 dbt 模型定义测试的地方。 测试通过检查预期结果(例如验证某些列不为空或某列是唯一的)来确保数据转换的质量。
dbt_project.yml 是 dbt 项目的主要配置文件。 它包含设置,例如您的项目名称、源配置和目标配置。
README.md 文件提供了一个介绍性欢迎信息和有用资源的列表。
这些目录和文件共同提供了一个结构化的环境,用于使用 dbt 开发、测试和记录您的数据转换。
配置 profiles.yml 文件
当您运行 dbt 命令时,dbt 会读取 dbt_project.yml 文件以识别项目名称,然后在 profiles.yml 文件中查找具有相同名称的配置文件。
在您的主目录(~/.dbt)中创建一个 profiles.yml 文件,并使用必要的信息配置它以连接到您的数据仓库:
配置数据源
根据数据库供应商,您需要配置相应的数据源以使用它连接到您的数据平台。
请导航至 。

点击 添加数据源。
选择 数据源 并选择数据库供应商。
在 数据源与驱动程序 对话框中配置连接设置。

点击 确定。
检查数据仓库连接
要检查与数据仓库的连接,请运行 dbt debug 命令。
可能的错误 | 解决方案 |
|---|---|
| 创建并配置 profiles.yml 文件。 如果您已有 profiles.yml 文件,请为您正在处理的项目将新配置文件添加到该文件中。 |
| 安装并升级适配器以支持您的数据平台。 例如,要安装 postgres 适配器,请运行 |