Esse é um template para um pacote DBT a ser importado no repositório principal, que irá gerar um servidor RPC para execução dos projetos.
- Faça um fork desse repositório (docs).
- Modifique o nome do repositório, caso deseje.
- Configure os seguintes secrets no repositório:
GKE_PROJECT
: identificador do projeto no GCP.GKE_CLUSTER_NAME
: nome do cluster no GKE.GKE_CLUSTER_ZONE
: zona do cluster no GKE.GKE_SA_KEY
: credenciais para uma conta de serviço com pleno acesso ao GKE, GCR e GCS. Preencher com o resultado decat sua-credencial.json | base64
.
- Modifique o nome do pacote em
dbt_project.yml
para o nome do seu projeto. Aproveite esse momento para ler, com calma, os comentários desse arquivo de configuração. - Crie contas de serviço para seus projetos de desenvolvimento e produção. Caso tenha somente um projeto, pode usar a mesma conta para ambos os propósitos. Nota: Jamais faça commit de suas credenciais
- Acesse o arquivo
profiles.yml
e se atente aos comentários, eles indicam os campos que devem ser alterados. - Usando os arquivos de credencial, crie os secrets
credentials-dev
ecredentials-prod
usando a flag--from-file
. - Faça o upload das alterações realizadas em seu repositório.
- Toda vez que houver uma alteração de código na branch
master
, uma instância atualizada do servidor RPC do DBT será criada em seu cluster, no devido namespace.
- Learn more about dbt in the docs
- Check out Discourse for commonly asked questions and answers
- Join the chat on Slack for live discussions and support
- Find dbt events near you
- Check out the blog for the latest news on dbt's development and best practices
-
Caso seja um
dataset-id
já existente, acessemodels/<dataset-id>
e pule para o passo 5. -
Caso seja um novo
dataset-id
, crie um novo diretóriomodels/<dataset-id>
. -
No arquivo
dbt_project.yml
registre odataset-id
junto aos já existentes, conforme exemplo abaixo:
models:
emd:
dataset-id:
+materialized: view # Materialization type (view, table or incremental)
+schema: dataset-id # Overrides the default schema (defaults to what is set on profiles.yml)
- No diretório
models/<dataset-id>
, crie um arquivoschema.yml
para preencher metadados de suas tabelas. Exemplo abaixo:
version: 2
models:
- name: my_first_dbt_model
description: "A starter dbt model"
columns:
- name: id
description: "The primary key for this table"
- Desenvolva seus modelos (que corresponderão a tabelas) no diretório
models/<dataset-id>
.