Juliana Jenny Kolb
Home > Simulados on-line > Questões de Concursos > Tecnologia da Informação (TI) > Questões Big Data
Materiais de Estudo disponíveis
Apostila on-line |
Teste 2: Big Data
Questões extraídas de concursos públicos e/ou provas de certificação. Cada teste apresenta no máximo 30 questões.
O correto seria IaaS. IaaS (Infraestrutura como serviço) é uma infraestrutura de computação instantânea, provisionada e gerenciada pela Internet. É um dos quatro tipos de serviços de nuvem, junto com o SaaS (software como serviço), PaaS (plataforma como serviço) e sem servidor. A Questão inverteu os conceitos, o correto seria que a etapa da mineração de dados é uma fase do KDD (knowledge-discovery), a seguir temos a definição do KDD: “O processo de KDD identifica padrões e descobre informações relevantes que auxiliam na formação de posturas estratégicas de marketing, na busca e conquista de clientes, na descoberta de falhas em linhas de produção, entre outras. Nesse processo, na etapa de mineração de dados, algoritmos têm a função de gerar regras de associação, descrevendo assim, padrões de relacionamento entre itens de uma base de dados. “ Dados não estruturado são aqueles que não possuem uma estrutura bem definidas e esses dados são o equivalente de 80% de todos os dados do mundo [2] esses dados são encontrados em redes sociais, jogos, mensagens de texto e etc. Portanto, temos a afirmação da questão errada, pois inverteu os conceitos, sendo que os dados estruturados são a minoria e os dados não estruturados são a maioria. Data-as-a-service (DaaS) é uma estratégia de gerenciamento de dados e modelo de implantação que se concentra na nuvem para fornecer uma variedade de serviços relacionados a dados, como armazenamento, processamento e análise. O DaaS aproveita o popular paradigma de software como serviço (SaaS), por meio do qual os clientes podem usar aplicativos de software baseados em nuvem em vez de implantar servidores dedicados para um conjunto específico de tarefas em um conjunto específico de dados. A ingestão de dados é definida como o processo de absorver dados de uma variedade de fontes e transferi-los para um local de destino onde podem ser depositados e analisados. De modo geral, os destinos podem ser um banco de dados, data warehouse, armazenamento de documentos, data mart, etc. Por outro lado, existem várias opções de origem, como planilhas, extração de dados da web ou web scrapping, aplicativos internos e SaaS dados. A mineração de dados, dentro do processo de descoberta do conhecimento KDD, é uma etapa, porém em forma de subprocesso, pois existem várias etapas dentro do processo de mineração e isso pode ser visto no próprio CRISP-DM. Neste processo de KDD, os dados podem ser obtidos de diversa fontes, sejam estruturadas ou não estruturadas. No caso dos textos, estes são categorizados como não estruturados, do ponto de vista de dados. Durante as etapas de seleção e pré-processamento do KDD, os dados, sejam eles estruturados ou não estruturados, passam por uma formatação adequada para utilização das técnicas de mineração de dados sobre eles. A partir desta etapa de mineração, as técnicas de mineração existentes podem ser usadas, onde não há exclusividade de aplicação de técnicas em mineração de textos, uma vez que estes textos já sofreram adequação nas sua formatação para serem utilizados juntamente com os demais dados que são estruturados, ou seja, os dados estão em uma estrutura comum. A questão erra ao afirmar que neste caso serão utilizadas técnicas diferentes de mineração de dados para mineração de textos. O Objeto denominado k-means é o que representa a mediana do grupo do conjunto. Esse objeto é composto por quatro etapas: Inicialização, Atribuição ao Cluster, Movimentação de Centroids e Otimização do K-médias.
Results
#1. (CESPE - Prefeitura de João Pessoa-PE/2018) Situação hipotética: Um órgão público pretende fazer uma análise de big data com o objetivo de realizar mineração em grandes conjuntos de dados corporativos para localizar ou encontrar padrões ocultos, o que exigirá uma grande quantidade de processamento. Assertiva: Nesse caso, há necessidade de contratação de um SaaS (software como serviço), que acrescentará uma camada adicional de integração com frameworks de desenvolvimento de aplicativos, recursos de middleware e funções como bancos de dados.
#2. (AOCP - PRODEB/2018) Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas ordens de magnitude. O valor real do Big Data está no insight que ele produz quando analisado — buscando padrões, derivando significado, tomando decisões e, por fim, respondendo ao mundo com inteligência. Referente ao Big Data, é correto afirmar que o termo variedade refere-se
#3. (AOCP - PRODEB/2018) Big Data requer clusters de servidores de apoio às ferramentas que processam grandes volumes, alta velocidade e formatos variados de Big Data. Nesse sentido, é correto afirmar que Hadoop refere-se a
#4. (IADES - APEX Brasil/2018) Assinale a alternativa que apresenta o conceito de Big Data.
#5. (CESPE - TCE-SC/2022) Big data necessitam de algoritmos de computação mais robustos em comparação aos algoritmos tradicionais de banco de dados, que não são capazes de lidar com os volumes de dados representados em big data.
#6. (CESPE - TCE-SC/2022) O big data, inicialmente caracterizado por três Vs, em 2001, atualmente inclui mais dois Vs. Um dos Vs que caracteriza o big data é
#7. (CESPE - SEFAZ-CE/2021) Um dos três Vs de big data refere-se à variedade, que está relacionada a métodos para identificar se um conjunto de dados pode ser considerado big data.
#8. (CESPE - SERPRO/2021) O Hadoop consiste em um único produto, ou seja, um software monolítico, que possibilita análise de logs e outros dados da Web.
#9. (CESPE - SERPRO/2021) Uma das principais características de big data é que seu custo de armazenamento de dados é relativamente baixo se comparado a um data warehouse.
#10. (CESPE - Prefeitura de Aracaju/2021) Big data ajudou a sedimentar o cargo de cientista de dados. Entre as funções desse cargo inclui-se
#11. (CESPE - SERPRO/2021) Big data caracteriza-se, principalmente, por volume, variedade e velocidade, o que se justifica devido ao fato de os dados serem provenientes de sistemas estruturados, que são maioria, e de sistemas não estruturados, os quais, embora ainda sejam minoria, vêm, ao longo dos anos, crescendo consideravelmente.
#12. (CESGRANRIO - BB/2021) Na etapa de preparação de dados em um ambiente de Big Data, pode ocorrer o aparecimento de dados ruidosos, que são dados fora de sentido no ambiente do Big Data e que não podem ser interpretados pelo sistema. Uma forma de reduzir esse efeito, e até eliminá-lo, é utilizar um método de suavização de dados, que minimiza os efeitos causados pelos dados ruidosos. Esse método consiste em
#13. (CESPE - SEFAZ-CE/2021) A coleta de dados por inferência ocorre quando uma nova informação é gerada a partir de uma informação já existente, através de dispositivos eletrônicos.
#14. (FGV - TJ-RO/2021) João é um cientista de dados que iniciou o processo de estudo dos dados de sua empresa com o objetivo de identificar um diferencial competitivo diante de seus concorrentes. Como resultado, João decidiu implementar um Big Data e hospedá-lo em um ambiente de nuvem. Diante das possibilidades dos serviços, considerando os requisitos de escalabilidade e elasticidade, em caso de aumento de demanda pontual, aliados à tecnologia de Big Data, a alternativa que melhor descreve o tipo de serviço em nuvem a ser contratado por João é:
#15. (CESPE - TCE-RJ/2021) Em Big Data, a premissa volume refere-se à capacidade de processar, em um ambiente computacional, diferentes tipos e formatos de dados, como fotos, vídeos e geolocalização.
#16. (CESPE - TCE-RJ/2021) Os fatores críticos de sucesso da análise de Big Data incluem uma sólida infraestrutura de dados, além de ferramentas analíticas e pessoal habilitado para lidar com elas.
#17. (CESPE - SERPRO/2021) No que se refere aos três Vs do big data, o termo volume refere-se a dados que, atualmente, não são estruturados nem armazenados em tabelas relacionais, o que torna sua análise mais complexa.
#18. (CESPE - SERPRO/2021) No ambiente de ingestão de dados, CDC refere-se ao controle distribuído de computação de dados coletados remotamente para o ambiente de análise.
#19. (CESGRANRIO - BB/2021) Uma empresa precisa implementar um sistema Big Data para controlar a movimentação dos produtos que a empresa oferece. Esse sistema precisa estar com a configuração de dados como sendo um fato, que seria um evento de ocorrência, como, por exemplo: as compras de um determinado insumo, em um determinado fornecedor e em um determinado instante. Para tal finalidade, esse sistema a ser implementado deverá estar organizado segundo a configuração de
#20. (CESPE - Ministério da Economia/2020) A análise de regressão em mineração de dados tem como objetivos a sumariação, a predição, o controle e a estimação.
#21. (CESPE - Ministério da Economia/2020) O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.
#22. (CESPE - Ministério da Economia/2020) No processo de agrupamento, o objeto denominado medoide é aquele que representa a mediana do grupo do conjunto. C Certo
#23. (SSPM - Marinha/2019) Com relação à análise em Big Data, analise as afirmativas abaixo. I- Modelagem preditiva são algoritmos e técnicas que utilizam dados para determinar resultados futuros. II- A análise de texto é o processo de analisar texto desestruturado, extrair dados relevantes e transformá-los em informação estruturada, que pode, então, ser aproveitada de diversas formas. III- São técnicas da Mineração de dados: Árvores de classificação e Redes Neurais. IV- Vídeos, diferentemente de Imagens, não são fontes de dados para análise em Big Data. Assinale a opção correta.
#24. (SSPM - Marinha/2019) No contexto de Big Data, computação em nuvem é um método que fornece um conjunto de recursos computacionais compartilhados. Assinale a opção que apresenta característica da nuvem e que são importantes no ecossistema de Big Data.
#25. (IADES - APEX Brasil/2018) Assinale a alternativa que apresenta o conceito de Big Data.
#26. (CESPE - FUNPRESP-JUD/2016) Uma big data não engloba dados não estruturados, mas inclui um imenso volume de dados estruturados suportado por tecnologias como o DataMining e o DataWarehouse para a obtenção de conhecimento a partir da manipulação desses dados.
#27. (ESAF - Ministério da Fazenda/2015) Um dos grandes desafios atualmente na área de tecnologia da informação é a manipulação e processamento de grande quantidade de dados no contexto de Big Data. Analise as seguintes afirmações neste contexto e classifique-as como verdadeiras (V) ou falsas (F). Em seguida assinale a opção correta. I. Além de lidar com volumes extremamente grandes de dados dos mais variados tipos, soluções de Big Data também precisam trabalhar com distribuição de processamento e elasticidade. II. Alguns exemplos de bancos de dados NoSQL são o Cassandra, o MongoDB, o HBase, o CouchDB e o Redis. III. As quatro propriedades de um banco de dados (atomicidade, consistência, isolamento e durabilidade) são a base para aplicações de Big Data implementadas no NoSQL. IV. O Hadoop é uma plataforma open source desenvolvida especialmente para processamento e análise de grandes volumes de dados, sejam eles estruturados ou não estruturados. As afirmações I, II, III e IV são, respectivamente:
#28. (ESAF - Ministério da Fazenda/2015) Em relação a Big Data e NoSQL, é correto afirmar que
#29. (FGV - AL-BA/2014) A expressão Big Data é utilizada para descrever o contexto da informação contemporânea, caracterizada pelo volume, velocidade e variedade de dados disponíveis, em escala inédita. Com relação às características do Big Data, analise as afirmativas a seguir. I. O volume da informação se refere ao fato de que certas coleções de dados atingem a faixa de gigabytes (bilhões de bytes), terabytes (trilhões), petabytes (milhares de trilhões) ou mesmo exabytes (milhões de trilhões). II. A velocidade está relacionada à rapidez com a qual os dados são produzidos e tratados para atender á demanda, o que significa que não é possível armazená‐los todos, de modo que somos obrigados a escolher dados para guardar e outros para descartar. III. A variedade significa que os dados de hoje aparecem em todos os tipos de formatos, como, por exemplo, arquivos de texto, e‐mail, medidores e sensores de coleta de dados, vídeo, áudio, dados de ações do mercado ou transações financeiras. Assinale:
#30. (CESPE - EBSERH/2018) As soluções de Big Data focalizam dados que já existem, descartam dados não estruturados e disponibilizam os dados estruturados