Questões de ETL (Extract Transform Load) (Banco de Dados)

Limpar Busca

As informações analiticamente úteis das fontes de dados operacionais (das operações do dia a dia do negócio) são carregadas no Data Warehouse por meio do processo de ETL. Um dos recursos úteis em um DW é poder observar um mesmo item de dimensão em vários instantes de tempo (timestamps), como, por exemplo, observar o preço de venda de um produto ao longo dos anos.
Assinale a opção que indica a técnica que torna possível a disposição desse recurso.

  • A A supressão, no Data Warehouse, das chaves primárias do bando de dados operacional.
  • B A criação de chaves primárias compostas por um atributo de chave substituta e um de chave primária do banco de dados operacional.
  • C A substituição, e consequente supressão, das chaves primárias do banco de dados operacional por chaves substitutas no Data Warehouse.
  • D A criação de chaves primárias substitutas no Data Warehouse, mantendo as chaves primárias do banco de dados operacional como atributos únicos no Data Warehouse.
  • E A criação de chaves primárias substitutas no Data Warehouse, mantendo as chaves primárias do banco de dados operacional como atributos não chave no Data Warehouse.
Os processos ELT (Extract, Load, Transform) e ETL (Extract, Transform, Load) lidam com tratamento de dados através da integração de dados de diversas fontes. Sobre os processos ELT e ETL, assinale a afirmativa correta.
  • A Assim como no ETL, também para o ELT é na etapa “transformação” que há agregação de valor.
  • B ETL é usado especificamente em Data Lake (DL), enquanto o ELT é usado em Data Warehouse (DW).
  • C Na abordagem ELT, a transformação é a única etapa automática, ou seja, não é realizada sob demanda.
  • D No ELT, o mesmo artefato responsável pela extração não se encarrega da carga dos dados no destino, já que as etapas de Extração e Carga (EL) são distintas.
  • E Via de regra, sistemas de ETL são pequenos e simples e não demandam grande esforço, tempo e conhecimentos especializados, para construção e manutenção.
Pentaho Data Integration (PDI), também conhecido por Kettle (Kettle Extraction, Transport, Transformation and Loading Environment), é o conjunto de ferramentas open source responsável pelos processos de ETL da Pentaho Business Intelligence Suite. No PDI, os componentes de ligação entre os steps que definem a direção da execução da transformação são conhecidos como:
  • A Hops.
  • B Spoon.
  • C Tables input.
  • D Tables output.
  • E Transformações.

No contexto da implementação de tecnologias para data mining e apresentação de dados, a sigla ETL refere-se

  • A ao processamento de transações on line em ambientes de produção.
  • B ao processo de identificação de dados e relacionamentos numa interface de exploração de dados.
  • C aos processos de criação de índices full text.
  • D aos processos de extração, transformação e carga de dados.
  • E às manobras para visualização de dados sobre cubos dimensionais.

No Pentaho Data Integrator (PDI), uma transformação é uma rede lógica de tarefas formando um fluxo de dados, conforme implementado na transformação “Calcula Classe A” ilustrada a seguir.
Imagem relacionada à questão do Questões Estratégicas

No PDI, para implementar tarefas, como Carrega Salário, Calcula Classe e Armazena Classe, deve-se usar:

  • A Hops;
  • B Jobs;
  • C Steps;
  • D Entry;
  • E Kitchen.