## Resolução provas AB1 Estatística
### Prova 1
#### 1- Sobre a estatística descritiva, responda:
a. Como podemos utilizar as ferramentas da estatística descritiva para realizar a análise de dados?
- As ferramentas da estatística descritiva ajudam a compreender melhor os dados, mostrando o que é mais comum (média, mediana, moda), quão diferentes os dados são entre si (desvio padrão) e como eles se distribuem (gráficos). Isso facilita ver padrões, diferenças ou coisas fora do comum nos dados, ajudando a tomar decisões mais informadas. É como tirar uma foto rápida dos dados para pegar o essencial deles.
b. Como uma amostra está relacionada com a população?
- Uma amostra está relacionada com a população porque ela é um pequeno grupo selecionado dessa população maior, com o objetivo de representá-la. A ideia é que, ao estudar essa amostra, podemos entender características, tendências ou comportamentos da população inteira sem precisar analisar cada indivíduo ou elemento dela.
#### 2- Segundo um radar, a velocidade de 10 carros numa perimetral de São Paulo no início de uma noite foram: 77,69,82,76,69,66,77,73,80 e 89 quilômetros por hora.
a. Construa a tabela de frequência para o conjunto de dados, sendo 3 o número de classes
- Uma tabela de frequência organiza dados em grupos ou intervalos, mostrando quantas vezes cada grupo ocorre. É como um resumo que ajuda a ver padrões nos dados.
1. **Defina o número de classes**: A questão pediu 3 classes.
2. **Calcule o intervalo de classe**: A menor velocidade é 66 km/h e a maior é 89 km/h. A diferença (89 - 66 = 23) dividida por 3 classes dá um intervalo de aproximadamente 8 km/h por classe.
3. **Crie os intervalos**: Com o intervalo de 8 km/h, os limites de cada categoria são:
- Primeira classe: 66 a 74 km/h
- Segunda classe: 74 a 82 km/h
- Terceira classe: 82 a 90 km/h
4. **Conte as ocorrências**: Contando quantos dados se encaixam em cada intervalo:
- **[66, 74)**: 4 carros
- **[74, 82)**: 4 carros
- **[82, 90)**: 2 carros
5. **Organize a tabela**: A tabela final ficaria assim:
- **[66, 74)**: 4 carros
- **[74, 82)**: 4 carros
- **[82, 90)**: 2 carros
b. Encontre a média, mediana e moda dos dados
- Média: É a soma de todos os valores dividida pelo número de valores. Você soma todas as velocidades dos carros e divide pelo total de carros.
- **Nesse caso, 75.8**
- Mediana: É o valor que divide o conjunto de dados ao meio quando ordenado. Se você ordenar as velocidades dos carros, a mediana será o valor no meio da lista (ou a média dos dois valores do meio, se a lista tiver um número par de elementos).
- **Nesse caso, 77**
- Moda: É o valor que aparece com mais frequência no conjunto de dados. No caso, a velocidade que mais carros registraram.
- **Nesse caso, 69**
c. Encontre uma amplitude, variância e desvio padrão do conjunto
- Amplitude: 23 km/h. A amplitude é a diferença entre a maior e a menor velocidade registrada, mostrando a extensão total dos dados.
- Variância: 42.16 (km/h)².
- Desvio Padrão: 6.49 km/h. O desvio padrão é a raiz quadrada da variância.
#### 3. Um estudo feito em uma determinada região apontou que a probabilidade de os pais terem um filho com cabelo loiro foi de 1/4. Se houverem 6 crianças em uma família dessa região, qual a probabilidade de que 2 delas tenham cabelo loiro?
Para calcular a probabilidade de que 2 das 6 crianças em uma família tenham cabelo loiro, utilizamos a distribuição binomial. A fórmula da distribuição binomial é:
P(X=k) = C(n,k) * (p^k) * ((1-p)^(n-k))
onde:
- P(X=k) é a probabilidade de ter exatamente k sucessos em n tentativas,
- C(n,k) é o número de combinações de n itens tomados k a k,
- p é a probabilidade de sucesso (neste caso, a probabilidade de uma criança ter cabelo loiro, 1/4),
- n é o número total de tentativas (neste caso, o número total de crianças, 6), e
- k é o número de sucessos desejados (neste caso, 2 crianças com cabelo loiro).
Calculando isso, obtemos que a probabilidade de que exatamente 2 das 6 crianças tenham cabelo loiro é aproximadamente 0.296 ou 29.6%.
#### 4. Casos de insuficiência cardíaca podem ocorrer devido a ocorrências naturais (87%) ou fatores externos (13%). Fatores externos estão relacionados a substâncias induzidas ou objetos estranhos. Ocorrências naturais são causadas por bloqueio arterial, doenças e infecções. Suponha que 5 pacientes irão visitar uma emergência com insuficiência cardíaca.
##### a) Qual é a probabilidade de que três indivíduos tenham condições causadas por fatores externos?
Para calcular esta probabilidade, utilizamos a distribuição binomial, cuja fórmula é:
P(X=k) = C(n,k) * (p^k) * ((1-p)^(n-k))
Onde:
- P(X=k) é a probabilidade de ter exatamente k sucessos (pacientes com condições causadas por fatores externos) em n tentativas (pacientes visitando a emergência),
- C(n,k) é o número de combinações de n itens tomados k a k,
- p é a probabilidade de sucesso (neste caso, a probabilidade de um paciente ter uma condição causada por fatores externos, 0.13),
- n é o número total de tentativas (neste caso, o número total de pacientes, 5),
- k é o número de sucessos desejados (neste caso, 3 pacientes com condições causadas por fatores externos).
A probabilidade de que exatamente três indivíduos tenham condições causadas por fatores externos é aproximadamente 1.66%.
##### b) Qual é a probabilidade de que três ou mais indivíduos tenham condições causadas por fatores externos?
Para calcular esta probabilidade, somamos as probabilidades de ter três, quatro e cinco sucessos, utilizando a mesma fórmula da distribuição binomial. Alternativamente, podemos usar a função de sobrevivência, que é 1 menos a função de distribuição cumulativa até k-1.
A probabilidade de que três ou mais indivíduos tenham condições causadas por fatores externos é aproximadamente 1.79%.
##### c) Qual é a média e o desvio padrão do número de indivíduos com condições causadas por fatores externos?
A média e o desvio padrão de uma distribuição binomial podem ser calculados pelas fórmulas:
- Média: média = n * p
- Desvio padrão: desvio padrão = sqrt(n * p * (1-p))
Substituindo n = 5 e p = 0.13:
- A média do número de indivíduos com condições causadas por fatores externos é 0.65.
- O desvio padrão do número de indivíduos com condições causadas por fatores externos é 0.75.
### Prova 2
#### Questão 1
Um fabricante de baterias sabe, por experiência passada, que as baterias de sua fabricação têm vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem aproximadamente distribuição normal. Ele oferece uma garantia de 360 dias, trocando as baterias que apresentarem falhas nesse período. A questão é calcular a probabilidade de uma bateria falhar em até 312 dias e, dado que o fabricante produz 10.000 baterias mensalmente, quantas ele espera trocar pelo uso da garantia, mensalmente.
Para calcular a probabilidade de uma bateria falhar dentro do período de garantia, utilizamos a fórmula da variável normal padronizada `Z`:
Z = (X - μ) / σ
onde:
- `μ` é a média da vida das baterias (600 dias),
- `σ` é o desvio padrão da vida das baterias (100 dias),
- `X` é o valor de garantia oferecido (360 dias).
A probabilidade de falha dentro do período de garantia é calculada utilizando a função de distribuição cumulativa (CDF) da distribuição normal para o valor de `Z` correspondente a `X = 360`. O resultado dessa probabilidade é aproximadamente **0.82%**.
#### Questão 2
Uma fábrica de telas de TV estabeleceu, através de estudos anteriores, que a vida média das telas de sua produção é de 800 horas de uso contínuo e que esta duração segue uma distribuição normal com desvio padrão de 100 horas. A empresa oferece uma garantia de 600 horas de uso para suas telas. A questão pede para calcular a probabilidade de a fábrica ter que substituir uma tela gratuitamente, com base na garantia oferecida.
Para determinar essa probabilidade, aplicamos a fórmula da variável normal padronizada `Z`:
Z = (X - μ) / σ
onde:
- `μ` é a média da vida útil das telas (800 horas),
- `σ` é o desvio padrão (100 horas),
- `X` é a duração da garantia oferecida (600 horas).
A probabilidade calculada de que a fábrica tenha de substituir uma tela gratuitamente, com base na garantia de 600 horas de uso, é aproximadamente **2.28%**.
#### Questão 3
A experiência com trabalhadores de uma certa indústria indica que o tempo necessário para que um trabalhador, aleatoriamente selecionado, realize uma tarefa segue uma distribuição aproximadamente normal, com desvio padrão de 12 minutos. Uma amostra de 25 trabalhadores apresentou uma média de 140 minutos para a realização da tarefa. O objetivo é determinar o intervalo de confiança de 95% para a média (u) da população de todos os trabalhadores que fazem aquele determinado serviço.
Para calcular o intervalo de confiança, utilizamos a seguinte fórmula, considerando o desvio padrão (σ) de 12 minutos e o tamanho da amostra (n) de 25 trabalhadores:
Erro Padrão = σ / sqrt(n)
O erro padrão da média é calculado, e então, o z-score correspondente ao nível de confiança de 95% é utilizado para determinar a margem de erro. O intervalo de confiança é encontrado como:
Intervalo de Confiança = Média da Amostra ± (Z-score * Erro Padrão)
Com base nos cálculos, o intervalo de confiança de 95% para a média da população é aproximadamente de 135.3 minutos a 144.7 minutos. Isso indica que, com 95% de confiança, a média do tempo necessário para a realização da tarefa por todos os trabalhadores está dentro desse intervalo.
#### Questão 4
O Departamento de Agricultura dos EUA reporta que o custo médio para se criar um filho até a idade de 2 anos na zona rural é de US$ 10.460,00. Uma amostra aleatória de 900 crianças revelou que a média dos custos para essa amostra foi de US$ 10.345, com um desvio padrão de US$ 1.540,00. A questão pede para determinar o intervalo de confiança de 95% para essa média.
Para calcular o intervalo de confiança, usamos a seguinte fórmula, com base no desvio padrão (σ) de US$ 1.540,00 e no tamanho da amostra (n) de 900 crianças:
Erro Padrão = σ / sqrt(n)
O erro padrão da média é calculado, e então, o z-score correspondente ao nível de confiança de 95% é utilizado para determinar a margem de erro. O intervalo de confiança é encontrado como:
Intervalo de Confiança = Média da Amostra ± (Z-score * Erro Padrão)
Com base nos cálculos, o intervalo de confiança de 95% para a média dos custos de criação de um filho até a idade de 2 anos na zona rural é aproximadamente de US$ 10.244,39 a US$ 10.445,61. Isso indica que, com 95% de confiança, a média dos custos para a população total está dentro desse intervalo.