Juliana Jenny Kolb
Home > Simulados on-line > Questões de Concursos > Tecnologia da Informação (TI) > Questões Big Data
Materiais de Estudo disponíveis
Apostila on-line |
Teste 1: Big Data
Questões extraídas de concursos públicos e/ou provas de certificação. Cada teste apresenta no máximo 30 questões.
Results
#1. (Instituto AOCP – Instituto AOCP – MJ – Cientista de Dados – Big Data/2020) Um dos desafios do Big Data é o volume de dados. Sabendo que um profissional de tecnologia da informação necessita utilizar um Big Data, assinale a alternativa que apresenta um tipo de banco de dados que é utilizado em soluções baseadas em Big Data.
#2. (Instituto AOCP – Instituto AOCP – MJ – Cientista de Dados – Big Data/2020) O Big Data é definido como coleções de dados cuja sua quantidade é tão grande que é difícil armazenar, gerenciar, processar e analisar esses dados por meio de bancos de dados tradicionais. Nos últimos anos, houve um crescimento exponencial nos dados estruturados e não estruturados gerados pela tecnologia da informação da indústria e saúde por meio da internet das coisas (IoT), por exemplo. Sabendo disso, assinale a alternativa que apresenta corretamente as cinco características, também conhecidas como os cinco “vês”, de um big data.
#3. (Instituto AOCP – Instituto AOCP – MJ – Cientista de Dados – Big Data/2020) Um dos desafios em se trabalhar com grandes volumes de dados de diferentes regiões do mundo é realizar o tratamento em dados do tipo data e hora. Com base nessa informação, os profissionais de tecnologia da informação que precisam trabalhar com a função SYSDATETIMEOFFSET da T-SQL sabem que o papel dessa função é
#4. (Instituto AOCP – Instituto AOCP – MJ – Cientista de Dados – Big Data/2020) Assinale a alternativa que apresenta corretamente a terminologia de ‘classificador’ para a mineração de dados.
#5. (Instituto AOCP – Instituto AOCP – MJ – Cientista de Dados – Big Data/2020) A linguagem R é uma poderosa linguagem para se trabalhar com dados. Assinale a alternativa que apresenta somente funções da Linguagem R
#6. (Instituto AOCP – Instituto AOCP – MJ – Cientista de Dados – Big Data/2020) Assinale a alternativa que apresenta o comando que informa à Linguagem R em qual pasta ela deve ler os arquivos de dados.
#7. (Instituto AOCP – Instituto AOCP – MJ – Cientista de Dados – Big Data/2020) Os grafos são importantes para os modelos de BI. Sabendo disso, assinale a alternativa que apresenta corretamente a justificativa da importância no uso das estruturas de grafos pelos modelos de BI.
#8. (Instituto AOCP – Instituto AOCP – MJ – Cientista de Dados – Big Data/2020) Considerando que um profissional de tecnologia da informação necessita definir um argumento em T-SQL que se comporta como uma variável local para a entrada de parâmetros para uma rotina, assinale a alternativa que apresenta corretamente a forma de declaração que esse profissional deve fazer para esse argumento.
#9. (AOCP - Instituto AOCP - MJ - Cientista de Dados/2020) Na mineração de dados, existem as regras de associação. Regras desse tipo representam uma associação entre os valores de certos atributos e os valores de outros atributos. Assinale a alternativa que apresenta corretamente o nome do processo de extração dessas regras de um determinado conjunto de dados.
#10. (AOCP - Instituto AOCP - MJ - Cientista de Dados/2020) Um dos desafios do Big Data é o volume de dados. Sabendo que um profissional de tecnologia da informação necessita utilizar um Big Data, assinale a alternativa que apresenta um tipo de banco de dados que é utilizado em soluções baseadas em Big Data.
#11. (AOCP - Instituto AOCP - MJ - Cientista de Dados/2020) Um cientista de dados necessita estimar a precisão preditiva de um classificador medindo essa precisão para uma amostra de dados ainda não utilizada. Quais são as três estratégias principais, comumente usadas para isso, que o cientista de dados pode utilizar?
#12. (CESPE - TCE/RJ/2021) A descoberta de conhecimento em bases de dados, ou KDD (knowledge-discovery), é a etapa principal do processo de mineração de dados.
#13. (CESPE - TCE/RJ/2021) Volume, variedade e visualização são as três características, conhecidas como 3 Vs, utilizadas para definir Big Data.
#14. (CESPE - TCE/RJ/2021) Em Big Data, a premissa volume refere-se à capacidade de processar, em um ambiente computacional, diferentes tipos e formatos de dados, como fotos, vídeos e geolocalização.
#15. (CESPE - TCE/RJ/2021) Os fatores críticos de sucesso da análise de Big Data incluem uma sólida infraestrutura de dados, além de ferramentas analíticas e pessoal habilitado para lidar com elas.
#16. (CESPE - TCE/RJ/2021) A fase de implantação do CRISP-DM (cross industry standard process for data mining) só deve ocorrer após a avaliação do modelo construído para atingir os objetivos do negócio.
#17. (AOCP - MJ/2020) José está enfrentando problemas relacionados ao armazenamento em vários formatos, com estrutura de dados geralmente inconsistente, e à dificuldade de integração. Esses problemas, conhecidos em Qualidade de Dados para Big Data, podem ser respectivamente classificados como
#18. (CESPE - Ministério da Economia/2020) O objetivo da técnica de sequência de tempo é identificar a ocorrência de dois eventos diferentes no mesmo momento.
#19. (COMPERVE UFRN - TJ-RN/2020) Embora Big Data tenha diferentes definições, há um consenso sobre o modelo dos 3 V’s que correspondem a 3 características. Duas dessas características são:
#20. (AOCP - MJ/2020) O MJSP possui uma coleção de conjuntos de dados cujo volume, velocidade e variedade é grande e difícil de armazenar, gerenciar, processar e analisar. Esse conjunto de dados é definido atualmente como
#21. (COMPERVE UFRN - TJ-RN/2020) Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com isso, novos conceitos foram introduzidos, como o Data Lake, que
#22. (CESPE - Ministério da Economia/2020) O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos.
#23. (CESPE - Ministério da Economia/2020) O ciclo de vida da informação compreende as fases de produção, manuseio, armazenamento, transporte e descarte.
#24. (CESPE - Ministério da Economia/2020) Em se tratando da técnica de correlação, utiliza-se uma escala de 1 a -1 para indicar o grau de similaridade entre duas variáveis distintas.
Na técnica de correlação utiliza-se a escala de 1 a -1 em que 1 indica que as variáveis estão fortemente correlacionadas, ou seja, há uma relação linear positiva, -1 indica uma correlação linear negativa e o 0 indica que não há correlação entre as variáveis.
Dessa forma, a assertiva está correta.
#25. (FCC - ALE-AP/2020) Atualmente, diversos dados são coletados pelos sistemas digitais de empresas na internet para constituir Big Data com conteúdo sobre os resultados alcançados por seus produtos e serviços, prestígio da imagem da organização e seus representantes. Porém, parte desses dados pode ser falsa ou manipulada por internautas. O tratamento dos dados, a fim de qualificá-los antes de disponibilizá-los para a tomada de decisão na empresa, segundo o conceito das cinco dimensões “V” de avaliação de um Big Data, se refere
O V de Veracidade corresponde à capacidade do big data selecionar dados que sejam úteis e verídicos para serem utilizados. Com a quantidade enorme de diferentes estruturas, é importante identificar quais dos dados recebidos são úteis e confiáveis. Portanto, dados falsos ou manipulados serão filtrados.