Simulado Cientista de Dados (Big Data)

É uma área interdisciplinar voltada para o estudo e a análise de dados financeiros, sociais e econômicos, estruturados ou não, que visa a extração de conhecimento. Preparamos este simulado com questões que caíram em provas para Concursos Públicos, responda

Questão 1

Um dos fenômenos mais significativos em mineração de dados nos últimos anos foi o enorme aumento na disponibilidade de dados que chegam em grandes quantidades e advindos de algum processo automático por um período de tempo. Assinale a alternativa que apresenta corretamente o nome que se dá a esse aumento de disponibilidade de dados.

Questão 2

A linguagem R é uma poderosa linguagem para se trabalhar com dados. Assinale a alternativa que apresenta somente funções da Linguagem R.

Questão 3

Considerando o que dispõe a Lei nº 13.709/2018, que trata da Proteção de Dados, quanto aos princípios e sua conceituação legal, que, juntamente com o princípio da boa-fé, deverão ser observados nas atividades de tratamento de dados pessoais, analise as assertivas e assinale a alternativa que aponta as corretas.

I. Livre acesso: garantia, aos titulares, de exatidão, clareza, relevância e atualização dos dados, de acordo com a necessidade e para o cumprimento da finalidade de seu tratamento.
II. Prevenção: adoção de medidas para prevenir a ocorrência de danos em virtude do tratamento de dados pessoais.
III. Adequação: demonstração, pelo agente, da adoção de medidas eficazes e capazes de comprovar a observância e o cumprimento das normas de proteção de dados pessoais e, inclusive, da eficácia dessas medidas.
IV. Não discriminação: impossibilidade de realização do tratamento para fins discriminatórios ilícitos ou abusivos.

Questão 4

O Cassandra DB permite que sejam criados tipos definidos pelo desenvolvedor. Por exemplo, pode-se criar colunas de tipos definidos pelo usuário, chamadas userdefined types (UDTs). Sabendo que um cientista de dados necessita criar tipos no Cassandra DB, é correto afirmar que um exemplo de código que esse cientista deve executar no banco de dados em questão é

Questão 5

Assinale a alternativa que apresenta o código Python que implementa corretamente uma função para o cálculo da área de um retângulo, bem como o código que imprime o seu resultado.

Questão 6

Assinale a alternativa que apresenta corretamente o nome de um tipo de gráfico de colunas juntas em que os dados são ordenados do menor valor para o maior valor a fim de facilitar a sua análise.

Questão 7

Em um BI, existem grandes desafios para descrição e visualização dos dados. Assinale a alternativa que apresenta o principal desses desafios.

Questão 8

Um cientista de dados necessita estimar a precisão preditiva de um classificador medindo essa precisão para uma amostra de dados ainda não utilizada. Quais são as três estratégias principais, comumente usadas para isso, que o cientista de dados pode utilizar?

Questão 9

Na estatística, há diferentes tipos de medidas. Sabendo disso, assinale a alternativa que apresenta corretamente somente as medidas estatísticas de tendência central.

Questão 10

Os grafos são importantes para os modelos de BI. Sabendo disso, assinale a alternativa que apresenta corretamente a justificativa da importância no uso das estruturas de grafos pelos modelos de BI.

Tempo de simulado:

um comentário

  1. Enio Cardoso do Amaral
    Muito bom simulado, poderia gerar perguntas com mais modos randômicos ou seja após terminar o teste e iniciar um novo poderia apresentar perguntas diferenciadas ou até as alternativas serem aleatórias, para não ficar muito decorativa obrigando assim quem estaria fazendo o simulado a ler toda a pergunta e as alternativas.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *