Questões de Clusters (Sistemas Operacionais)

Limpar Busca

O objetivo principal do uso de técnicas de Agrupamento (Clustering) em Análise de Dados é dividir um grande conjunto de dados em subconjuntos, agrupando elementos similares em categorias distintas.
Assinale a opção que indica o tipo de algoritmo que não se enquadra nessa descrição.

  • A K-Means.
  • B Gaussian Mixture Models (GMM).
  • C DBSCAN.
  • D K-Medoids.
  • E Regressão Linear.

Um cluster pode ser definido como um aglomerado de computadores que utilizam um tipo especial de sistema operacional. Selecione o tipo de cluster que garante que uma rede permaneça sempre ativa

  • A Cluster de balanceamento de carga
  • B Cluster de processamento paralelo
  • C Cluster de alta disponibilidade
  • D Cluster de alto desempenho
  • E Cluster de backup

Os clusters são parte importante na nova arquitetura de datacenters. A virtualização resolve o problema da sobra de recursos em servidores físicos. A clusterização resolve o problema da falta de recursos em servidores físicos. Assinale a alternativa que indica o tipo de cluster que endereçam redundância com capacidade de failover automático, destinando-se aos aplicativos que têm estado de execução demorada na memória ou que têm estado de dados frequentemente atualizados.

  • A Cluster HPC
  • B Cluster HTC
  • C Cluster HA
  • D Cluster LB
  • E Cluster HF

O Docker é uma plataforma de código aberto para criar, implantar e gerenciar aplicativos em contêiner.
Em relação ao armazenamento em contêiners Docker, assinale a afirmativa incorreta.

  • A Quando o contêiner finaliza os dados dentro do contêiner não são persistidos e pode ser difícil retirar os dados do contêiner se outro processo precisar deles.
  • B A camada gravável de um contêiner está fortemente acoplada à máquina host em que o contêiner está sendo executado.
  • C Escrever na camada gravável de um contêiner requer um driver de armazenamento para gerenciar o sistema de arquivos. O driver de armazenamento fornece um Union FileSystem, usando o kernel do Linux. Essa abstração extra reduz o desempenho em comparação ao uso de volumes de dados, que gravam diretamente no host.
  • D Docker tem três opções para os contêineres armazenar em arquivos na máquina host; assim, os arquivos são persistidos mesmo após parar o contêiner: “volumes”, “bind” e “tmpfs mount”.
  • E Volumes são criados e gerenciados pelo Docker; para criar um volume utilizamos o comando docker volume create.

O Apache Spark é um framework para processamento paralelo e oferece suporte ao processamento na memória para aumentar o desempenho de aplicações de big data.
Em relação aos RDDs e a suas operações, assinale a afirmativa incorreta.

  • A Os RDDs suportam dois tipos de operações: transformações, que criam um novo conjunto de dados a partir de um existente, e ações, que retornam um valor ao Driver Program após executar uma computação no conjunto de dados.
  • B Map é uma transformação que passa cada elemento do conjunto de dados por uma função e retorna um novo RDD representando os resultados.
  • C Reduce é uma ação que agrega todos os elementos do RDD usando alguma função e retorna o resultado final ao Driver Program.
  • D Todas as transformações no Spark são lazy, pois não calculam seus resultados imediatamente. Em vez disso, eles apenas lembram as transformações aplicadas a algum conjunto de dados.
  • E As transformações só são computadas quando uma ação ou determinadas transformações exigem que um resultado seja retornado Driver Program.