Simulado Cientista de Dados (Big Data)

É uma área interdisciplinar voltada para o estudo e a análise de dados financeiros, sociais e econômicos, estruturados ou não, que visa a extração de conhecimento.
Preparamos este simulado com questões que caíram em provas para Concursos Públicos, responda

Questão 1

A linguagem R é uma poderosa linguagem para se trabalhar com dados. Assinale a alternativa que apresenta somente funções da Linguagem R.

Questão 2

Os formatos de tabela OLAP referem-se a estruturas de tabela multidimensionais, normalmente empregadas em sistemas de Data Warehouse. Assim, os dados são representados em estruturas. Um profissional de tecnologia da informação necessita montar uma dessas estruturas as quais recebem o nome de

Questão 3

Os grafos são importantes para os modelos de BI. Sabendo disso, assinale a alternativa que apresenta corretamente a justificativa da importância no uso das estruturas de grafos pelos modelos de BI.

Questão 4

O Cassandra DB é um banco NoSQL baseado em um esquema flexível. Sabendo disso, assinale a alternativa que apresenta o nome do elemento do Cassandra DB que seja equivalente ao ‘esquema’ de um banco de dados relacional.

Questão 5

Um cientista de dados utiliza uma técnica de mineração de dados complexa e baseada nos neurônios humanos, em que um conjunto de entrada é utilizado para prever uma ou mais saídas. Qual é o nome dessa técnica utilizada pelo cientista de dados?

Questão 6

Um dos fenômenos mais significativos em mineração de dados nos últimos anos foi o enorme aumento na disponibilidade de dados que chegam em grandes quantidades e advindos de algum processo automático por um período de tempo. Assinale a alternativa que apresenta corretamente o nome que se dá a esse aumento de disponibilidade de dados.

Questão 7

Um cientista de dados necessita estimar a precisão preditiva de um classificador medindo essa precisão para uma amostra de dados ainda não utilizada. Quais são as três estratégias principais, comumente usadas para isso, que o cientista de dados pode utilizar?

Questão 8

Um cientista de dados necessita apresentar a quantidade de documentos em uma coleção do MongoDB. Sabendo disso, assinale a alternativa que apresenta corretamente o operador que o cientista precisa utilizar.

Questão 9

Na mineração de dados, existem as regras de associação. Regras desse tipo representam uma associação entre os valores de certos atributos e os valores de outros atributos. Assinale a alternativa que apresenta corretamente o nome do processo de extração dessas regras de um determinado conjunto de dados.

Questão 10

O Cassandra DB permite que sejam criados tipos definidos pelo desenvolvedor. Por exemplo, pode-se criar colunas de tipos definidos pelo usuário, chamadas userdefined types (UDTs). Sabendo que um cientista de dados necessita criar tipos no Cassandra DB, é correto afirmar que um exemplo de código que esse cientista deve executar no banco de dados em questão é

Questão 11

Assinale a alternativa que apresenta o comando que informa à Linguagem R em qual pasta ela deve ler os arquivos de dados.

Questão 12

Assinale a alternativa que apresenta corretamente a terminologia de ‘classificador’ para a mineração de dados.

Questão 13

Assinale a alternativa que apresenta o código Python que implementa corretamente uma função para o cálculo da área de um retângulo, bem como o código que imprime o seu resultado.

Questão 14

Analise o seguinte código Python, escrito por um cientista de dados, e assinale a alternativa correta.
In [01]: num = 88

In [02]: print ('par' if

num%2 == 0 else 'ímpar')

Questão 15

Um profissional de tecnologia da informação necessita restringir o tempo em que a sessão aguarda um bloqueio em algumas transações T-SQL. Qual alternativa apresenta o comando correto, em T-SQL, para que esse profissional restrinja o tempo de uma sessão ativa em 10 segundos?

Questão 16

Um desenvolvedor implementou um programa para exibir a média de um dado retirado de uma grande base de dados. Para isso, foi utilizada a linguagem Python. O trecho do código que mostra o resultado é apresentado a seguir. Assinale a alternativa correta acerca desse trecho de código sabendo que a média do usuário foi 75.

print('Sua média foi
{}.'.format(med))

Questão 17

Um profissional de tecnologia da informação necessita implementar um projeto de BI. Sabendo que um dos pré-requisitos de projetos de BI é o processo de provisionamento de dados, é necessário que esse profissional tenha conhecimento de que a sequência correta desse processo é:

Questão 18

A PL/SQL contém diversos tipos de objetos armazenados no banco de dados. Um profissional de tecnologia da informação necessita utilizar um desses objetos que é um bloco de código PL/SQL disparado automaticamente mediante uma ação do usuário ou da aplicação dentro do banco de dados. Qual é o nome desse objeto?

Questão 19

Um dos desafios do Big Data é o volume de dados. Sabendo que um profissional de tecnologia da informação necessita utilizar um Big Data, assinale a alternativa que apresenta um tipo de banco de dados que é utilizado em soluções baseadas em Big Data.

Questão 20

Um cientista de dados deve utilizar uma técnica de mineração de dados que não usa regras ou árvore de decisão ou qualquer outra representação explícita do classificador, mas que usa o ramo da matemática conhecido como teoria das probabilidades para encontrar a mais provável das possíveis classificações. Sabendo disso, assinale a alternativa que apresenta corretamente o nome da técnica a ser utilizada pelo cientista de dados.

Tempo de simulado:

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *