Estatística básica, 9ª Edição

Visualizações: 755
Classificação: (0)

Livro mais vendido da área, a 9ª edição de Estatística Básica confirma seu grande sucesso com um extenso trabalho de revisão, atualização e ampliação, que contou com sugestões de professores e leitores enriquecendo ainda mais o conteúdo por meio de discussões sobre roteiros apropriados para cursos de diferentes níveis. O livro é dividido em três partes. A primeira trata da análise de dados unidimensionais e bidimensionais, com atenção especial para métodos gráficos. A segunda parte traz os conceitos básicos de probabilidades e variáveis aleatórias. Por fim, a terceira parte estuda os tópicos principais da inferência estatística, além de alguns temas especiais, como regressão linear simples. Completo e didático, Estatística Básica é o livro mais adequado para alunos e profissionais de diversas áreas do conhecimento e se destaca por ser a única obra com uma seção em todos os capítulos que ensina a aplicar a teoria por meio dos pacotes computacionais Minitab®, Excel®, Splus® e o pacote do Repositório livre R®. No final do livro, os autores apresentam vários conjuntos de dados que poderão ser utilizados pelos leitores e que estão disponíveis no site www.editorasaraiva.com.br.

 

52 capítulos

Formato Comprar item avulso Adicionar à Pasta

Prefácio à Nona Edição

PDF Criptografado

P r e f á c i o à n o n a E d i ç ã o

Nesta Nona Edição, atendendo a pedidos de leitores, incluímos a utilização de pacotes do Repositórios livre R. Mas continuamos a usar, em alguns exemplos, os pacotes SPlus e Minitab.

Para não aumentar muito o tamanho do livro, a maneira encontrada foi colocar uma pequena introdução ao R, dados e os scripts para reproduzirem os exemplos do livro, na página: .

O leitor também poderá ver os exemplos completos (scripts, gráficos etc.) na página: rpubs.com/EstatBasica.

Além disso, os problemas suplementares de cada capítulo foram separados dos complementos metodológicos. Correções foram feitas em diversos pontos. Quero agradecer de modo especial a Kim Samejima pela colaboração na preparação da página relativa ao R.

Os depoimentos de colegas sobre o papel do Wilton no desenvolvimento da Estatística do Brasil agora encontram-se, também, na página do livro.

São Paulo, junho de 2017.

Pedro A. Morettin

 

Prefácio à Oitava Edição

PDF Criptografado

P r e f á c i o à

OI T A V A E d i ç ã o

Essa edição difere da anterior em dois aspectos. O primeiro capítulo foi reescrito e alguns novos problemas foram acrescentados. Além disso, procuramos corrigir erros presentes na edição anterior. Agradecemos a diversos colegas e alunos que apontaram erros e fizeram comentários sobre o livro.

São Paulo, junho de 2013.

Pedro A. Morettin

 

Prefácio à Sétima Edição

PDF Criptografado

p r e f á c i o À

S É T I M A EDIÇÃO

Nesta Sétima Edição fizemos diversas correções no texto, acrescentamos novos problemas e algumas seções foram reescritas. Mais do que tudo, essa nova edição é uma homenagem ao Professor Wilton de Oliveira Bussab, que nos deixou prematuramente em maio desse ano.

Apresentamos, a seguir, diversos depoimentos de colegas sobre o papel fundamental que Wilton teve no desenvolvimento da Estatística no Brasil.

De minha parte, perdi um amigo de mais de quarenta anos. As vidas de sua família, amigos, colegas e alunos não serão mais as mesmas. Será mais difícil atualizar esse livro, fruto de uma colaboração estreita durante tantos anos. Wilton sempre foi a parte

“pé no chão” dessa parceria, dada a sua grande experiência e vivência de problemas reais. Com sua partida, perderei eu, perderão os leitores. Mas a vida continua, e seu legado será lembrado por todos que tiveram o privilégio de com ele conviver.

São Paulo, julho de 2011.

Pedro A. Morettin

 

Prefácio à Sexta Edição

PDF Criptografado

p r e f á c i o À

S e x T A EDIÇÃO

Nesta edição atendemos à solicitação de leitores que sugeriram modificações em alguns tópicos considerados difíceis. Por exemplo, o tópico sobre quantis empíricos agora traz o cálculo utilizando o histograma, deixando a definição mais geral para a seção de

Problemas e Complementos.

Inúmeras correções foram feitas na edição anterior, à medida que as sucessivas tiragens foram editadas. Nesta sexta edição outros erros foram corrigidos, mas sabemos que diversos persistirão! Agradecemos aos diversos leitores que nos enviaram correções e sugestões.

Acrescentamos problemas a diversas seções do livro e substituímos o conjunto de dados sobre o Brasil (CD-Brasil) com informações atualizadas da Contagem da População 2007 feita pelo IBGE. Os dados também estão disponíveis na página: .

Os Autores

 

1.1 Introdução

PDF Criptografado

Capítulo 1

Preliminares

1.1 Introdução

Em alguma fase de seu trabalho, o pesquisador depara-se com o problema de analisar e entender um conjunto de dados relevante ao seu particular objeto de estudos. Ele necessitará trabalhar os dados para transformá-los em informações, para compará-los com outros resultados ou, ainda, para julgar sua adequação a alguma teoria.

De modo bem geral, podemos dizer que a essência da Ciência é a observação e que seu objetivo básico é a inferência.

A inferência estatística é uma das partes da Estatística. Esta, por sua vez, é a parte da metodologia da Ciência que tem por objetivo a coleta, redução, análise e modelagem dos dados, a partir do que, finalmente, faz-se a inferência para uma população da qual os dados (a amostra) foram obtidos. Um aspecto importante da modelagem dos dados é fazer previsões, a partir das quais se pode tomar decisões.

Os cientistas usam o chamado Método Científico para testar suas teorias ou hipóteses.

 

1.2 Modelos

PDF Criptografado

4

Capítulo 1 — Preliminares

sumários não devam ser obtidos, mas uma análise exploratória de dados não deve se limitar a calcular tais medidas.

1.2 Modelos

Fundamentalmente, quando se procede a uma análise de dados, busca-se alguma forma de regularidade ou padrão ou, ainda, modelo, presente nas observações.

Exemplo 1.1  (continuação)  O que se espera, intuitivamente, no caso em questão é que os gastos de um indivíduo estejam diretamente relacio­nados com os seus rendimentos, de modo que é razoável supor uma “relação linear” entre essas duas quantidades. Os pontos da Figura 1.1 não estão todos, evidentemente, sobre uma reta; essa seria o nosso padrão ou modelo. A diferença entre os dados e o modelo constitui os resíduos. Veja a Figura 1.3.

Podemos, então, escrever de modo esquemático:

DADOS = MODELO + RESÍDUOS ou, ainda,

D = M + R.

(1.2)

A parte M é também chamada parte suave (ou regular ou, ainda, previsível) dos dados, enquanto R é a parte aleatória. A parte R é tão importante quanto M, e a análise dos resíduos constitui uma parte fundamental de todo trabalho estatístico. Basicamente, são os resíduos que nos dizem se o modelo é adequado ou não para representar os dados.

 

1.3 Aspectos Computacionais

PDF Criptografado

5

1 . 3  Asp e c t o s C o mput a c i o n a i s

1.3  Aspectos Computacionais

O desenvolvimento rápido e constante na área de computação foi acompanhado pela introdução de novas técnicas de análise de dados, notadamente de métodos gráficos e de métodos chamados de computação intensiva (como o método bootstrap, que será tratado brevemente neste livro).

Para a implementação dessas técnicas, pacotes estatísticos foram desenvolvidos e que atualmente são usados em larga escala, tanto no meio acadêmico como em indústrias, bancos,

órgãos de governo etc. Esses pacotes podem ser genéricos ou específicos. Os pacotes genéricos

(como o Minitab, SPlus, SPSS, SAS etc.) são adequados para realizar uma gama variada de análises estatísticas. Os pacotes específicos são planejados para realizar análises particulares de uma determinada área.

Por outro lado, os pacotes podem exigir ou não uma maior experiência compu­tacional dos usuários. Alguns operam com menus, e seu uso é mais simples. Outros requerem maior familiaridade com o computador e são baseados em linguagens próprias.

 

1.4 Métodos Gráficos

PDF Criptografado

6

Capítulo 1 — Preliminares

Para uma breve introdução ao R, siga o caminho indicado no Capítulo 1, “Introdução”.

Neste capítulo, também estão relacionados os pacotes usados no livro (packages ou libraries).

Para ver as soluções detalhadas dos exemplos, consulte: .

1.4  Métodos Gráficos

Como dissemos na introdução, os métodos gráficos têm encontrado um uso cada vez maior devido ao seu forte apelo visual. Normalmente, é mais fácil para qualquer pessoa entender a mensagem de um gráfico do que aquela embutida em tabelas ou sumários numéricos.

Os gráficos são utilizados para diversos fins (Chambers et al., 1983):

(a)

(b)

(c)

(d)

(e)

buscar padrões e relações; confirmar (ou não) certas expectativas que se tinha sobre os dados; descobrir novos fenômenos; confirmar (ou não) suposições feitas sobre os procedimentos estatísticos usados; apresentar resultados de modo mais rápido e fácil.

Podemos usar métodos gráficos para plotar os dados originais ou outros dados derivados deles. Por exemplo, a investigação da relação entre as variáveis da Fi­gura 1.1 pode ser feita por meio daquele diagrama de dispersão. Mas podemos também “ajustar” uma reta aos dados, calcular o desvio (resíduo) para cada observação e fazer um novo gráfico, de consumo contra resíduos, para avaliar a qualidade do ajuste.­

 

1.5 Conjuntos de Dados

PDF Criptografado

6

Capítulo 1 — Preliminares

Para uma breve introdução ao R, siga o caminho indicado no Capítulo 1, “Introdução”.

Neste capítulo, também estão relacionados os pacotes usados no livro (packages ou libraries).

Para ver as soluções detalhadas dos exemplos, consulte: .

1.4  Métodos Gráficos

Como dissemos na introdução, os métodos gráficos têm encontrado um uso cada vez maior devido ao seu forte apelo visual. Normalmente, é mais fácil para qualquer pessoa entender a mensagem de um gráfico do que aquela embutida em tabelas ou sumários numéricos.

Os gráficos são utilizados para diversos fins (Chambers et al., 1983):

(a)

(b)

(c)

(d)

(e)

buscar padrões e relações; confirmar (ou não) certas expectativas que se tinha sobre os dados; descobrir novos fenômenos; confirmar (ou não) suposições feitas sobre os procedimentos estatísticos usados; apresentar resultados de modo mais rápido e fácil.

Podemos usar métodos gráficos para plotar os dados originais ou outros dados derivados deles. Por exemplo, a investigação da relação entre as variáveis da Fi­gura 1.1 pode ser feita por meio daquele diagrama de dispersão. Mas podemos também “ajustar” uma reta aos dados, calcular o desvio (resíduo) para cada observação e fazer um novo gráfico, de consumo contra resíduos, para avaliar a qualidade do ajuste.­

 

1.6 Plano do Livro

PDF Criptografado

1.6  Plano do Livro

7

Alguns conjuntos de dados são parte de conjuntos maiores. Todos esses dados podem ser obtidos no endereço:

.

Usaremos um nome curto para identificar cada conjunto de dados. Por exemplo, o

Conjunto de Dados 1 será designado simplesmente por CD-Brasil, o Conjunto de Dados 4, por CD-Poluição etc.

1.6  Plano do Livro

Na primeira parte do livro, trataremos, nos Capítulos 2 a 4, de técnicas gráficas e numéricas que nos permitirão fazer uma primeira análise dos dados disponíveis. No

Capítulo 2, estudaremos como resumir os dados por meio de distribuições de frequências e como representá-los graficamente por meio de gráficos em barras, histogramas e ramo-e-folhas. No Capítulo 3, veremos as principais medidas numéricas resumidoras de um conjunto de dados: medidas de posição (ou localização) e medidas de dispersão (ou de variabilidade).

A partir dessas medidas, poderemos construir gráficos importantes, como o gráfico de quantis e o box plot. No Capítulo 4, trataremos do caso em que temos duas variáveis. Estaremos interessados em verificar se existe alguma associação entre duas variáveis e como medi-la.

 

Capítulo 2 - Resumo de Dados

PDF Criptografado

Capítulo 2

Resumo de Dados

2.1  Tipos de Variáveis

Para ilustrar o que segue, consideremos o seguinte exemplo.

Exemplo 2.1  Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socioeconômicos dos empregados da seção de orçamentos da Companhia MB. Usando informações obtidas do departamento de pessoal, ele elaborou a Tabela 2.1. Essa tabela é chamada planilha de dados.

Planilhas (usualmente na forma eletrônica) são matrizes de dados, construídas com o objetivo de permitir uma análise estatística. Cada linha da matriz corresponde a uma unidade de investigação (por exemplo, unidade amostral) e cada coluna, a uma variável, que corresponde à realização de uma característica.

A planilha, em formato excel, correspondendo à Tabela 2.1, está no Conjunto de Dados, na página do livro.

Para importá-la, utilizaremos qualquer um dos formatos TXT, DAT ou CSV.

Desta forma, o primeiro passo é construir um arquivo CSV (ou alternativamente

 

Capítulo 3 - Medidas-Resumo

PDF Criptografado

Capítulo 3

Medidas-Resumo

3.1  Medidas de Posição

Vimos que o resumo de dados por meio de tabelas de frequências e ramo-e-folhas fornece muito mais informações sobre o comportamento de uma variável do que a própria tabela original de dados. Muitas vezes, queremos resumir ainda mais estes dados, apresentando um ou alguns valores que sejam representativos da série toda.

Quando usamos um só valor, obtemos uma redução drástica dos dados. Usualmente, emprega-se uma das seguintes me­didas de posição (ou localização) central: média, mediana ou moda.

A moda é definida como a realização mais frequente do conjunto de valores observados. Por exemplo, considere a variável Z, número de filhos de cada funcioná­rio casado, resumida na Tabela 2.5 do Capítulo 2. Vemos que a moda é 2, correspondente

à realização com maior frequência, 7. Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição dos valores pode ser bimodal, trimodal etc.

A mediana é a realização que ocupa a posição central da série de observações, quando estão ordenadas em ordem crescente. Assim, se as cinco observações de uma variável forem 3, 4, 7, 8 e 8, a mediana é o valor 7, correspondendo à terceira observação. Quando o número de observações for par, usa-se como mediana a média aritmética das duas observações centrais. Acrescentando-se o valor 9 à série acima, a mediana será (7 + 8)/2 = 7,5.

 

Capítulo 4 - Análise Bidimensional

PDF Criptografado

Capítulo 4

Análise Bidimensional

4.1 Introdução

Até agora vimos como organizar e resumir informações pertinentes a uma única va­riável (ou a um conjunto de dados), mas frequentemente estamos interessados em analisar o comportamento conjunto de duas ou mais variáveis aleatórias. Os dados aparecem na forma de uma matriz, usualmente com as colunas indicando as variáveis e as linhas os indivíduos (ou elementos). A Tabela 4.1 mostra a notação de uma matriz com p variáveis X1, X2, ..., Xp e n indivíduos, totalizando np dados. A Tabela 2.1, com os dados hipotéticos da Companhia MB, é uma ilustração numérica de uma matriz 36 × 7.

O principal objetivo das análises nessa situação é explorar relações (similaridades) entre as colunas, ou algumas vezes entre as linhas. Como no caso de apenas uma variável que estudamos, a distribuição conjunta das frequências será um instrumento poderoso para a compreensão do comportamento dos dados.

Neste capítulo, iremos nos deter no caso de duas variáveis ou dois conjuntos de dados. Na Seção 4.8, daremos dois exemplos do caso de três variáveis.

 

Capítulo 5 - Probabilidades

PDF Criptografado

Capítulo 5

Probabilidades

5.1 Introdução

Na primeira parte deste livro, vimos que a análise de um conjunto de dados por meio de técnicas numéricas e gráficas permite que tenhamos uma boa ideia da distribuição desse conjunto. Em particular, a distribuição de frequências é um instrumento importante para avaliarmos a variabilidade das observações de um fenômeno aleatório. A partir dessas frequências observadas podemos calcular medidas de posição e variabilidade, como média, mediana, desvio padrão etc. Essas frequências e medidas calculadas a partir dos dados são estimativas de quantidades desconhecidas, associa­das em geral a populações das quais os dados foram extraídos na forma de amostras. Em particular, as frequências (relativas) são estimativas de probabilidades de ocorrências de certos eventos de interesse. Com suposições adequadas, e sem observarmos diretamente o fenômeno aleatório de interesse, podemos criar um modelo teórico que reproduza de maneira razoável a distribuição das frequências, quando o fenômeno é observado diretamente. Tais modelos são chamados modelos probabilísticos e serão objeto de estudo neste capítulo e nos subsequentes.

 

Capítulo 6 - Variáveis Aleatórias Discretas

PDF Criptografado

Capítulo 6

Variáveis Aleatórias

Discretas

6.1 Introdução

No capítulo anterior, introduzimos alguns modelos probabilísticos por meio de espaços amostrais bem simples. Isso facilitou bastante a compreensão do conceito de probabilidade e a obtenção de algumas propriedades. Mas, para atender a situações práticas mais gerais, necessitamos ampliar esses conceitos para que tenhamos modelos probabilísticos que representem todos os tipos de variáveis definidas no Capítulo 2. Muito do que foi apresentado naquele capítulo para tratamento descritivo das variáveis terá o seu correspondente no modelo teórico.

Para as variáveis qualitativas, a descrição de probabilidades associadas a eventos cons­truída no capítulo precedente adapta-se muito bem. Dada a sua simplicidade, trataremos aqui de variáveis quantitativas discretas. Já os modelos para variáveis contínuas necessitarão de um artifício matemático, baseado em uma generalização do conceito de histograma, definido na Seção 2.3, e esse será o objetivo do próximo capítulo. A extensão dos modelos para várias variáveis será tratada no Capítulo 8.

 

Capítulo 7 - Variáveis Aleatórias Contínuas

PDF Criptografado

Capítulo 7

Variáveis Aleatórias

Contínuas

7.1 Introdução

Neste capítulo, iremos estudar modelos probabilísticos para variáveis aleatórias contínuas, ou seja, variáveis para as quais os possíveis valores pertencem a um intervalo­ de números reais. A definição dada no capítulo anterior, para v.a. discreta, deve ser modi­ ficada como segue.

Definição.  Uma função X, definida sobre o espaço amostral Ω e assumindo valores num intervalo de números reais, é dita uma variável aleatória contínua.

No Capítulo 2 vimos alguns exemplos de variáveis contínuas, como o salário de indivíduos, alturas etc. A característica principal de uma v.a. contínua é que, sendo resultado de uma mensuração, o seu valor pode ser pensado como pertencendo a um intervalo ao redor do valor efetivamente observado. Por exemplo, quando dizemos que a altura de uma pessoa

é 175 cm, estamos medindo sua altura usando cm como unidade de medida e, portanto, o valor observado é, na realidade, um valor entre 174,5 cm e 175,5 cm.

 

Capítulo 8 - Variáveis Aleatórias Multidimensionais

PDF Criptografado

Capítulo 8

Variáveis Aleatórias

Multidimensionais

8.1  Distribuição Conjunta

Em muitas situações, ao descrevermos os resultados de um experimento, atribuímos a um mesmo ponto amostral os valores de duas ou mais variáveis aleatórias. Neste capítulo, iremos nos concentrar no estudo de um par de variáveis aleatórias, indicando que os conceitos e resultados apresentados estendem-se facilmente a um conjunto finito de variáveis alea­tórias. Um tratamento mais completo é dado ao caso de variáveis discretas, nas Seções 8.1 a 8.4.

Exemplo 8.1  Suponha que estamos interessados em estudar a composição de famílias com três crianças, quanto ao sexo. Definamos:

X = número de meninos,

1, se o primeiro filho for homem

Y =

0, se o primeiro filho for mulher,

Z = �número de vezes em que houve variação do sexo entre um nascimento e outro, dentro da mesma família.

Com essas informações, e supondo que as possíveis composições tenham a mesma probabilidade, obtemos a Tabela 8.1, em que, por exemplo, o evento HMH indica que o primeiro filho é homem, o segundo, mulher e o terceiro, homem.

 

Capítulo 9 - Noções de Simulação

PDF Criptografado

Capítulo 9

Noções de Simulação

9.1 Introdução

Nos capítulos anteriores, aprendemos a construir alguns modelos probabilísticos simples, que são úteis para representar situações reais, ou então para descrever um experimento aleatório. Notamos, também, que se especificarmos um espaço amostral e probabilidades associadas aos pontos desse espaço, o modelo probabilístico ficará completamente determinado e poderemos, então, calcular a probabilidade de qualquer evento aleatório de interesse.

Muitas vezes, mesmo construindo um modelo probabilístico, certas questões não podem ser resolvidas analiticamente e teremos de recorrer a estudos de simulação para obter aproximações de quantidades de interesse. De modo bastante amplo, estudos de simulação tentam reproduzir num ambiente controlado o que se passa com um problema real. Para nossos propósitos, a solução de um problema real consistirá na simulação de variáveis aleatórias. A simulação de variáveis aleatórias deu origem aos chamados Métodos Monte

 

Carregar mais


Detalhes do Produto

Livro Impresso
eBook
Capítulos

Formato
PDF
Criptografado
Sim
SKU
BPPD000244870
ISBN
9788547220228
Tamanho do arquivo
9,5 MB
Impressão
Desabilitada
Cópia
Desabilitada
Vocalização de texto
Não
Formato
PDF
Criptografado
Sim
Impressão
Desabilitada
Cópia
Desabilitada
Vocalização de texto
Não
SKU
Em metadados
ISBN
Em metadados
Tamanho do arquivo
Em metadados