Estatística para Cursos de Engenharia e Informática, 3ª edição

Visualizações: 582
Classificação: (0)

Este livro enfatiza a relação dos métodos estatísticos com o planejamento e desenvolvimento de pesquisas em Engenharia e Informática, o que diferencia da maioria dos livros-texto de Estatística, que tem uma preocupação excessiva com os aspectos matemáticos dos métodos estatísticos. Aqui, os métodos estatísticos são apresentados com muitas ilustrações, de forma simples e intuitiva. Os exemplos de motivação e exercícios são usualmente associados a problemas típicos de Engenharia e Informática, tornando o aprendizado mais agradável e motivador aos estudantes dessas áreas.

O texto mostra como a estatística é importante na vida do engenheiro ou do profissional em informática, apresenta alguns conceitos básicos e oferece visão geral dos planos amostrais e projetos de experimentos. Também desenvolve os tópicos clássicos da Estatística: análise exploratória de dados, modelos probabilísticos, teoria da estimação e testes de hipóteses. Os três últimos capítulos descrevem as análises estatísticas para comparação de tratamentos, procedimentos não paramétricos e análise de regressão, ilustrando com problemas reais de pesquisa.

Livro-texto para a disciplina Estatística dos cursos de graduação e pós-graduação em Engenharia (todas as áreas), Ciência da Computação e Sistemas de Informação. Material de consulta para pós-graduandos, pesquisadores, estatísticos, engenheiros e profissionais de informática.

FORMATOS DISPONíVEIS

14 capítulos

Formato Comprar item avulso Adicionar à Pasta

1 - Introdução

PDF Criptografado

Color profile: Disabled

Composite Default screen

1

Introdução

1.1

A ESTATÍSTICA

No desenvolvimento científico e em nosso próprio dia a dia, estamos sempre fazendo observações de fenômenos, gerando dados. Os engenheiros estão frequentemente analisando dados de propriedades dos materiais; os profissionais da informática estão avaliando dados de desempenho de novos sistemas computacionais; e todos nós, ao lermos jornais e revistas, estamos vendo resultados estatísticos provenientes do censo demográfico, de pesquisas eleitorais etc.

Os dados podem provir de estudos observacionais ou de experimentos planejados. Ao acompanhar o desempenho de um processo produtivo em sua forma natural, estamos fazendo um estudo observacional; ao alterar de forma proposital as variáveis do processo para verificar seus efeitos nos resultados, estamos realizando um experimento.

A estatística envolve técnicas para coletar, organizar, descrever, analisar e interpretar dados, ou provenientes de experimentos, ou vindos de estudos observacionais.

 

2 - O Planejamento de uma Pesquisa

PDF Criptografado

Color profile: Disabled

Composite Default screen

2

O Planejamento de uma Pesquisa

2.1

ASPECTOS GERAIS

Para que os resultados de uma análise estatística de dados produzam informações úteis, os dados precisam ser coletados de forma planejada. A Figura

2.1 ilustra as principais etapas de uma pesquisa, enfatizando que os métodos estatísticos precisam ser pensados ainda na fase do planejamento da pesquisa.

Definição do problema e objetivos

Planejamento da pesquisa

Execução da pesquisa

Metodologia da área de estudo

Dados

Metodologia estatística

Análise dos dados

Resultados

Conclusões

Figura 2.1

Etapas usuais de uma pesquisa empírica.

Embora a Figura 2.1 ilustre as etapas da pesquisa em sequência, na fase do planejamento é necessário também pensar na forma de análise dos dados, pois,

C:\ATLAS\ESTATISTICA\EST2.vp segunda-feira, 5 de julho de 2010 07:34:42

Color profile: Disabled

 

3 - Análise Exploratória de Dados

PDF Criptografado

Color profile: Disabled

Composite Default screen

3

Análise Exploratória de Dados

Com o advento da informática, o mundo encheu-se de dados. As empresas têm dados de suas atividades, de seus funcionários, de seus clientes etc. Mas para que esses dados sejam informativos, necessitamos organizá-los, resumi-los e apresentá-los de forma adequada. Este é o papel da estatística descritiva.

Como ilustração, considere o problema da pasteurização de leite em um laticínio, em que os engenheiros estão preocupados com a variação da temperatura do pasteurizador. Para se conhecer o nível dessa variação, foram empregadas 1.389 leituras de temperatura, realizadas durante dois meses.1 A Figura 3.1 mostra parte do conjunto das observações e um gráfico que apresenta a distribuição de frequências das 1.389 observações.2 Note que o gráfico é mais informativo do que os dados brutos!

Na análise exploratória de dados, além de descrever os dados, buscamos conhecer algumas características do processo, com base nos dados. Com o uso adequado de tabelas, gráficos e medidas, podemos descobrir certas estruturas que não eram evidentes nos dados brutos. Hoje também se usa a expressão mineração de dados (data mining), que significa a busca por relacionamentos não triviais, que podem estar escondidos em grandes massas de dados. Em geral, numa mineração de dados, são aplicadas técnicas estatísticas e computacionais.

 

4 - Probabilidade

PDF Criptografado

Color profile: Disabled

Composite Default screen

4

Probabilidade

No capítulo anterior, procuramos conhecer a variabilidade de algum processo com base em observações das variáveis pertinentes. Nestes três próximos capítulos, continuaremos a estudar os processos que envolvem variabilidade, aleatoriedade ou incerteza, mas procuraremos construir modelos matemáticos para facilitar a análise. Esses modelos normalmente são construídos a partir de suposições sobre o processo, mas podem também basear-se em dados observados no passado.

O leitor já deve ter ouvido falar de probabilidade ou de modelos probabilísticos. Há dois aspectos a considerar. O primeiro é que intuitivamente as pessoas procuram tomar decisões em função dos fatos que têm maior probabilidade de ocorrer. Veja os seguintes exemplos: a) se o céu está nublado, então há chance considerável de chover.

Deve-se levar um guarda-chuva ao sair de casa!; b) se um inspetor de qualidade está observando as peças produzidas por uma máquina, e verifica que elas estão saindo fora do padrão, então ele pode deduzir que existe alta chance de essa máquina continuar produzindo peças fora do padrão. Logo, a máquina deverá receber atenção especial; c) se em determinada família há muitos casos de doença cardíaca, então há maior chance de pessoas daquela família serem afetadas; portanto, os exames preventivos precisam ser feitos mais frequentemente.

 

5 - Variáveis Aleatórias Discretas

PDF Criptografado

Color profile: Disabled

Composite Default screen

5

Variáveis Aleatórias Discretas

5.1

VARIÁVEL ALEATÓRIA

Um conceito de fundamental importância para a estatística indutiva é o de variáveis aleatórias. Para entender esse conceito, imagine que um dado comum vai ser lançado. Tente dizer qual será o número resultante. É claro que, antes do lançamento, não podemos dizer qual é o número que ocorrerá, pois o resultado depende do fator sorte e, por isso, é uma variável aleatória.

Uma variável aleatória pode ser entendida como variável quantitativa, cujo resultado (valor) depende de fatores aleatórios.

Outros exemplos de variáveis aleatórias são: a) número de coroas obtido no lançamento de duas moedas; b) número de itens defeituosos em uma amostra retirada, aleatoriamente, de um lote; c) número de defeitos em um azulejo que sai da linha de produção; d) número de pessoas que visitam um determinado site, num certo período de tempo; e) volume de água perdido por dia, num sistema de abastecimento; f) resistência ao desgaste de um tipo de aço, num teste padrão;

 

6 - Variáveis Aleatórias Contínuas

PDF Criptografado

Color profile: Disabled

Composite Default screen

6

Variáveis Aleatórias Contínuas

6.1

CARACTERIZAÇÃO DE UMA VARIÁVEL ALEATÓRIA

CONTÍNUA

Muitas variáveis aleatórias que surgem na vida de um engenheiro ou de um profissional da informática têm natureza eminentemente contínua, tais como:

· tempo de resposta de um sistema computacional;

· rendimento de um processo químico;

· tempo de vida de um componente eletrônico;

· resistência de um material etc.

Outras vezes, há variáveis aleatórias discretas, com grande número de possíveis resultados, em que é preferível usar um modelo aproximado contínuo no lugar do modelo exato discreto. É o caso de:

· número de transações por segundo de uma CPU;

· número de defeitos numa amostra de 5.000 itens etc.

Para entender as peculiaridades das variáveis aleatórias contínuas, imagine o seguinte experimento.

C:\ATLAS\ESTATISTICA\EST6.vp segunda-feira, 5 de julho de 2010 07:50:05

 

7 - Distribuições Amostrais e Estimação de Parâmetros

PDF Criptografado

Color profile: Disabled

Composite Default screen

7

Distribuições Amostrais e

Estimação de Parâmetros

Este capítulo apresenta a base para aprendermos a estatística indutiva, a qual fornece procedimentos formais para tirar conclusões sobre uma população, a partir dos dados de uma amostra. Para isso, veremos como se relacionam estatísticas (características dos elementos de uma amostra) com parâmetros (características dos elementos de uma população).

7.1

PARÂMETROS E ESTATÍSTICAS

Relembremos alguns conceitos básicos:

População: conjunto de elementos que formam o universo de nosso estudo e que são passíveis de ser observados, sob as mesmas condições.

Amostra: uma parte dos elementos de uma população.

Amostragem: o processo de seleção da amostra.

Amostragem aleatória simples: o processo de seleção é feito por sorteio, fazendo com que todos os elementos da população tenham a mesma chance de serem escolhidos e, além disso, todo subconjunto de n elementos tenha a mesma chance de fazer parte da amostra.

 

8 - Testes de Hipóteses

PDF Criptografado

Color profile: Disabled

Composite Default screen

8

Testes de Hipóteses

Muitas vezes o pesquisador tem alguma ideia, ou conjetura, sobre o comportamento de uma variável, ou de uma possível associação entre variáveis.

Nesses casos, o planejamento da pesquisa deve ser de tal forma que permita, com os dados amostrais, testar a veracidade de suas ideias sobre a população

(ou as populações) em estudo. Adotamos que a população seja o mundo real e as ideias sejam as hipóteses de pesquisa, que poderão ser testadas por técnicas estatísticas denominadas testes de hipóteses ou testes de significância.

8.1

AS HIPÓTESES

Exemplo 8.1

Seguem alguns exemplos de hipóteses:

a) substituindo o processador A pelo processador B, altera-se o tempo de resposta de um computador; b) aumentando a dosagem de cimento, aumenta-se a resistência do concreto; c) uma campanha publicitária produz efeito positivo nas vendas; d) a implementação de um programa de melhoria da qualidade em uma empresa prestadora de serviços melhora a satisfação de seus clientes.

 

9 - Comparação Entre Tratamentos

PDF Criptografado

Color profile: Disabled

Composite Default screen

9

Comparação Entre Tratamentos

É muito comum o interesse em comparar dois ou mais tratamentos, como, por exemplo, dois processos de têmpera na produção de aço, três tipos de cimento-e-cola para fixar azulejos, dois sistemas computacionais para a informatização de um processo etc. Para realizar as comparações, podemos planejar experimentos com amostras submetidas a cada tratamento. Em cada ensaio, observamos uma resposta adequada. Por exemplo, no caso do aço, a resposta pode ser a resistência mecânica; no cimento-e-cola, o grau de aderência; no sistema computacional, o tempo de resposta; e assim por diante.

Na comparação dos tratamentos, é natural o interesse em verificar se há evidência de diferenças entre os efeitos dos tratamentos, o que pode ser feito através de testes estatísticos. Neste capítulo, apresentaremos testes paramétricos, os quais se caracterizam por suporem certa distribuição de probabilidades para a variável resposta. Em consequência, a comparação entre os efeitos dos tratamentos pode ser feita em termos dos parâmetros da distribuição de probabilidades suposta. Nós nos restringiremos à comparação de parâmetros de distribuições normais, com ênfase em testes de médias.

 

10 - Testes Não Paramétricos

PDF Criptografado

Color profile: Disabled

Composite Default screen

10

Testes Não Paramétricos

Os testes descritos no Capítulo 9 são ditos paramétricos, porque supõem que os dados seguem determinada distribuição de probabilidades – no caso, a distribuição normal. Imagine que as suposições necessárias para a aplicação dos testes paramétricos não sejam satisfeitas. Suponha que ocorram alguns dos casos abaixo:

1. Os dados sob análise têm um nível de mensuração qualitativo: ordinal ou nominal.

2. Os dados sob análise têm nível de mensuração quantitativo, mas há indícios de que a distribuição populacional não é normal.

3. Há interesse em realizar inferência sobre outras características da população, além dos parâmetros de sua distribuição, como a própria forma da distribuição.

Uma alternativa para essas situações é a utilização dos testes não paramétricos, ou testes livres de distribuição. As suposições necessárias para a aplicação desses testes são menos rígidas que as dos paramétricos, possibilitando uma aplicação mais generalizada. Obviamente, suposições mais relaxadas significam que o poder estatístico de um teste não paramétrico é inferior ao teste paramétrico equivalente, mas, em muitos casos, é a única alternativa disponível para análise dos dados e realização da inferência estatística.

 

11 - Correlação e Regressão

PDF Criptografado

Color profile: Disabled

Composite Default screen

11

Correlação e Regressão

11.1

CORRELAÇÃO

Numa população de pessoas, podemos dizer que as variáveis peso e altura são correlacionadas positivamente, pois a maioria dos indivíduos altos também é pesada, enquanto a maioria dos indivíduos baixos é leve. De forma análoga, o faturamento de uma empresa e o nível de utilização do seu sistema computacional devem ter correlação positiva. Já a quantidade de memória RAM e o tempo de processamento devem ter correlação negativa.

Dizemos que duas variáveis, X e Y, estão positivamente correlacionadas quando elas caminham num mesmo sentido, ou seja, elementos com valores pequenos de X tendem a ter valores pequenos de Y e elementos com valores grandes de X tendem a ter valores grandes de Y. Estão negativamente correlacionadas quando elas caminham em sentidos opostos, ou seja, elementos com valores pequenos de X tendem a ter valores grandes de Y e elementos com valores grandes de X tendem a ter valores pequenos de Y.

 

Anexo

PDF Criptografado

Color profile: Disabled

Composite Default screen

CORRELAÇÃO E REGRESSÃO

351

EXERCÍCIOS

11. Com o auxílio de um computador, refaça o Exemplo 13.7, mas considerando como variável dependente o log(Y), onde Y = valor de revenda do automóvel. Observe o gráfico dos resíduos. Exclua as três observações que aparecem como discrepantes. Refaça novamente a análise.

12. Considerando novamente os dados de 397 apartamentos em Criciúma, realizou-se uma regressão múltipla, onde Y = log10(valor em $), X1 = idade

(em anos), X2 = gasto com energia elétrica dos moradores do apartamento

(kw), X3 = log10(área em m2) e X4 = local (1 = centro e bairros nobres,

0 = outros bairros). A equação ajustada, com R2 = 0,92, foi:

Y = 1,982 – (0,0073)X1 – (0,0002)X2 + (1,228)X3 + (0,108)X4

(p < 0,01) (p = 0,30) (p < 0,01) (p < 0,01)

Os valores p abaixo da equação estão associados aos testes de significância de cada coeficiente. Esses testes indicam que alguma variável pode ser excluída do modelo sem prejuízos? Interprete os coeficientes significativos.

 

Respostas de exercícios

PDF Criptografado

Color profile: Disabled

Composite Default screen

354

ESTATÍSTICA

Auto Modelo

Preço de rev.

Preço novo

Tempo de uso

Km Auto Modelo

Preço de rev.

Preço novo

Tempo de uso

Km

64

Gol

9.920 15.945

4

62

135

Vectra

20.300 32.995

3

58

65

Gol

0.320 15.945

4

59

136

Vectra

20.500 32.995

3

49

66

Gol

9.950 15.945

4

58

137

Vectra

19.880 32.995

3

43

67

Gol

9.680 15.945

4

55

138

Vectra

21.050 32.995

2

40

68

Gol

10.500 15.945

3

63

139

Vectra

20.810 32.995

2

36

69

Gol

10.860 15.945

3

50

140

Vectra

19.400 32.995

2

29

70

Gol

10.780 15.945

3

50

141

 

Apêndice: Tabelas estatísticas

PDF Criptografado

C:\ATLAS\ESTATISTICA\EST12.vp segunda-feira, 5 de julho de 2010 07:49:33

5

4

3

2

0,2

0,25

0,3

0,35

0,4

0,45

p

0,5

0,55

0,6

0,65

0,7

0,75

0,8

0,85

0,9

0,95

1 0,2036 0,3281 0,3915 0,4096 0,3955 0,3602 0,3124 0,2592 0,2059 0,1563 0,1128 0,0768 0,0488 0,0284 0,0146 0,0064 0,0022 0,0005 0,0000

0 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313 0,0185 0,0102 0,0053 0,0024 0,0010 0,0003 0,0001 0,0000 0,0000

4 0,0000 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 0,0256 0,0410 0,0625 0,0915 0,1296 0,1785 0,2401 0,3164 0,4096 0,5220 0,6561 0,8145

3 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500 0,2995 0,3456 0,3845 0,4116 0,4219 0,4096 0,3685 0,2916 0,1715

2 0,0135 0,0486 0,0975 0,1536 0,2109 0,2646 0,3105 0,3456 0,3675 0,3750 0,3675 0,3456 0,3105 0,2646 0,2109 0,1536 0,0975 0,0486 0,0135

1 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500 0,2005 0,1536 0,1115 0,0756 0,0469 0,0256 0,0115 0,0036 0,0005

 

Detalhes do Produto

Livro Impresso
Book
Capítulos

Formato
PDF
Criptografado
Sim
SKU
BPP0000207500
ISBN
9788522465699
Tamanho do arquivo
2,5 MB
Impressão
Desabilitada
Cópia
Desabilitada
Vocalização de texto
Não
Formato
PDF
Criptografado
Sim
Impressão
Desabilitada
Cópia
Desabilitada
Vocalização de texto
Não
SKU
Em metadados
ISBN
Em metadados
Tamanho do arquivo
Em metadados