Questões de Banco de Dados Multidimensionais (Banco de Dados)

Limpar Busca

Ao fazer a preparação para analisar dados em um banco de dados típico de Big Data, um profissional de TI percebeu que o número de atributos, ou colunas, era muito maior do que poderia processar com a ferramenta de análise disponível, sendo necessário, portanto, utilizar uma técnica de redução de dados para prepará-los para análise.
Uma técnica indicada, nesse caso, é a

  • A Amostragem Aleatória
  • B Amostragem Estratificada
  • C Análise de Componentes Principais
  • D Deduplicação
  • E Imputação

Uma rede de lojas de departamentos usa o modelo dimensional estrela conforme o seguinte diagrama:
Imagem relacionada à questão do Questões Estratégicas  (Os atributos sublinhados denotam chave primária)
Observando o aumento na quantidade de reclamações dos clientes nas lojas, os analistas de BI resolveram incluir as informações analiticamente úteis da base de reclamações no Data Warehouse.
Para que a criação da constelação de fatos (também chamada de galáxia) contemple o fato RECLAMAÇÃO, os analistas devem adicionar

  • A uma tabela de fato RECLAMAÇÕES, contendo apenas um atributo descritivo, sem a necessidade de conectar a qualquer dimensão.
  • B uma tabela de fato RECLAMAÇÕES, contendo um atributo descritivo e três chaves estrangeiras, uma para cada uma das dimensões existentes.
  • C uma tabela de fato RECLAMAÇÕES, contendo um atributo descritivo e três atributos que receberão os valores das chaves estrangeiras de Loja, Cliente e RegistroReclamação diretamente do banco de dados operacional.
  • D três tabelas de dimensão (CalendárioReclamação, ClienteReclamação e LojaReclamação) mais uma tabela de fato RECLAMAÇÕES, contendo um atributo descritivo e três chaves estrangeiras, uma para cada uma das dimensões recém-criadas.
  • E duas tabelas de dimensão (ClienteReclamação e LojaReclamação) mais uma tabela de fato RECLAMAÇÕES, contendo um atributo descritivo e três chaves estrangeiras, duas para cada uma das dimensões recém-criadas e uma para referenciar o registro da reclamação diretamente do banco de dados operacional.

Suponha que, dado um problema em que os dados são bidimensionais e executamos o algoritmo PCA (Principal Component Analysis – Análise de Componentes Principais) nesses dados para redução de dimensionalidade, o resultado do PCA produza dois autovalores de valores iguais.
A respeito desse resultado, assinale a afirmativa correta.

  • A As dimensões dos dados não são igualmente importantes; o uso do PCA para a redução de dimensionalidade vai produzir um excelente resultado pois as dimensões possuem 100% da informação.
  • B As dimensões dos dados são igualmente importantes; o uso do PCA para a redução de dimensionalidade vai produzir um resultado ruim, pois as dimensões são iguais.
  • C As dimensões dos dados são igualmente importantes; o uso do PCA para redução de dimensionalidade vai produzir um resultado ruim, pois perdemos 100% da explicação dos dados.
  • D As dimensões dos dados são igualmente importantes; o uso do PCA para redução de dimensionalidade vai produzir um resultado ruim, pois perdemos 50% da explicação dos dados.
  • E As dimensões dos dados não são igualmente importantes; o uso do PCA para redução de dimensionalidade vai produzir um excelente resultado pois as dimensões possuem 50% da informação.

Sobre a proposta geral do modelo dimensional em um Data Warehouse, não é correto afirmar que o modelo dimensional

  • A cobre tanto dados detalhados quanto dados sumarizados.
  • B cobre toda a empresa, e não apenas departamentos.
  • C é escalável, podendo entregar relatórios com trilhões de registros.
  • D é arquitetado apenas para um uso previsível, geralmente cobrindo os 10 relatórios mais acessados.
  • E pode integrar diversas fontes de dados operacionais da empresa, inclusive fontes externas.

A determinação de quais fatos irão constar na tabela de fatos é uma etapa fundamental no processo de concepção de um modelo dimensional (a partir de Kimball, 2013).
Em relação a essa etapa, é incorreto afirmar que

  • A a definição da granularidade suporta o desenho da tabela de fatos.
  • B a observação dos “pontos de venda” denota os possíveis atributos que poderão compor uma tabela de fato VENDAS.
  • C nos estágios iniciais de concepção de um modelo dimensional é sempre útil estimar a quantidade de linhas das maiores tabelas, as tabelas de fato.
  • D a tabela de fato que representa transações de negócio pode ser expressa de forma sucinta com uma linha por transação ou detalhada com uma linha por linha da transação.
  • E sobre os fatos derivados, tais como o LUCRO BRUTO sobre o fato VENDAS, a recomendação geral é para que o cálculo sempre seja feito no momento da chamada, quando o usuário pede a informação.