Questões – Hadoop

Juliana Jenny Kolb

Home >Simulados on-line > Questões de Concursos > Tecnologia da Informação(TI)

Questões – Hadoop

Questões extraí­das de concursos públicos e/ou provas de certificação. Cada teste apresenta no máximo 30 questões.

Results

#1. (FGV - CGU/2022) A ingestão de dados é o processo de absorver dados de uma variedade de fontes e transferi-los para um local de destino onde podem ser depositados e analisados. Sobre o tema, marque a alternativa correta:

#2. (CESPE - DPF/2021) O HDFS é o sistema de arquivos do Hadoop.

#3. (CESGRANRIO - BB/2021) A ingestão de dados tem inúmeros benefícios para organizações, pois essa prática permite:

#4. (CESPE - SEFAZ-CE/2021) O Hadoop pode ser configurado em clusters de servidores para implementação de projetos de big data, podendo o ZooKeeper ser utilizado nesse caso como provedor de serviço centralizado para fornecer informações de configuração, sincronização e serviços de grupo nesses clusters.

#5. (CESPE - SERPRO/2021) Apesar de ser uma tecnologia de código aberto disponibilizada pela ASF (Apache Software Foundation), o Hadoop também é oferecido por distribuidores comerciais, de maneira que fornecedores oferecem distribuições específicas que incluem não só ferramentas administrativas adicionais, mas também suporte técnico.

#6. (CESPE - SERPRO/2021) Ao serem armazenados no HDFS (Hadoop Distributed File System), os dados do Hadoop são divididos em blocos e distribuídos em discos distintos de um mesmo servidor, o que acelera o seu processamento, já que são pesquisados de forma simultânea, e não de forma sequencial.

#7. (CESPE - SEFAZ-CE/2021) Hive e Sqoop são subprojetos do Hadoop destinados a queries e data warehousing, respectivamente.

  • Camada de acesso aos dados:  são disponibilizadas ferramentas como Pig, Hive (data warehouse), Sqoop (queries),  ZooKeeper (provedor de serviço centralizado para fornecer informações de configuração, sincronização e serviços de grupo), Avro, Mahout, entre outras.

#8. (CESPE - SEFAZ-AL/2021) O objetivo da alta disponibilidade HDFS (Hadoop Distributed File System) é reduzir o tempo de ciclo necessário para trazer de volta um novo namenode primário após a falha do primário existente.

Ver Resultado