52 capítulos
Medium 9788547220228

Capítulo 2 - Resumo de Dados

MORETTIN, Pedro A. Saraiva - Uni PDF Criptografado

Capítulo 2

Resumo de Dados

2.1  Tipos de Variáveis

Para ilustrar o que segue, consideremos o seguinte exemplo.

Exemplo 2.1  Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socioeconômicos dos empregados da seção de orçamentos da Companhia MB. Usando informações obtidas do departamento de pessoal, ele elaborou a Tabela 2.1. Essa tabela é chamada planilha de dados.

Planilhas (usualmente na forma eletrônica) são matrizes de dados, construídas com o objetivo de permitir uma análise estatística. Cada linha da matriz corresponde a uma unidade de investigação (por exemplo, unidade amostral) e cada coluna, a uma variável, que corresponde à realização de uma característica.

A planilha, em formato excel, correspondendo à Tabela 2.1, está no Conjunto de Dados, na página do livro.

Para importá-la, utilizaremos qualquer um dos formatos TXT, DAT ou CSV.

Desta forma, o primeiro passo é construir um arquivo CSV (ou alternativamente

Ver todos os capítulos
Medium 9788547220228

Capítulo 10

MORETTIN, Pedro A. Saraiva - Uni PDF Criptografado

546

E s tat í s t i c a b á s i c a

12. (a) Usando os NA do problema 10 obtemos:

17. Para u1 = 0,6 e u2 = 0,09, calcule z1 e z2 dadas no método de Box-Müller, obtendo z1 = 0,562 e z2 =

0,357. Repita.

x1 = 0,332; x2 = 0,906; x3 = 0,000; x4 = 0,656; x5 = 0,748; x6 = 0,775; x­7 = 0,849; x8 = 0,648; x9 = 0,283; x10 = 0,728. ;

(b) �Suponha u1 = 0,94; então z1 = Φ–1(u1) = –1,56 e portanto x1 = 10 + 2z1 = 13, 12, etc.

(c) �Para u1 = 0,94, temos que t1 = 1,711 etc.

14. Com os valores zi gerados no problema 12(b), calcule w = z12 + z22 + z32 etc.

19. [1] Suponha gerado u1 = 0,6; [2] r = 3/7 = 0,43, j =

0, pr = (0,7)5 = 0,17, F = 0,17. [3] u1 > F [4]pr =

(0,43)(5)(0,17) = 0,37, F = 0,17 + 0,37 = 0,54, j = 1;

[5]u1 = 0,6 < F, logo coloque x1 = 1. Repita para u2, ..., u5.

23. Suponha os três primeiros valores gerados da Exp

(1/2) do problema 11. Então o primeiro valor gerado­ de X  gama (3; 1/2) seria x1 = 0,435 + 0,061 + 1,099

Ver todos os capítulos
Medium 9788547220228

Capítulo 5

MORETTIN, Pedro A. Saraiva - Uni PDF Criptografado

541

r e s p o s ta s

(b) Considere-se a tabela do total de colunas:

Salário

Estado

Civil Menos de entre 10

10 S.M. e 20 S.M. solteiro

0,60

0,38 casado

0,40

0,62

Total

1,00

Mais de

20 S.M.

0,30

0,70

Total

1,00

1,00

1,00

55

45

Vendas

0,40

0,60

25

15

Pelas diferenças entre as proporções marginais e as do interior da tabela, diz-se que existe relação entre as variáveis.

Atividade

Total

Costeira

Fluvial

Internacional

Estatal 5 (33,64) 141 (129,02) 51 (34,34) 197

Particular 92 (63,64) 231 (242,98) 48 (64,66) 371

Como χ2 = 51,09, parece existir associação entre o tipo de atividade e a propriedade das embarcações.

(c) χ2 = 7,01.

25. Corr(X, Y) = – 0,92

28. (a) �χ2 = 0,0008; logo, não há associação entre os resultados.

20

15

10

5

3

Ver todos os capítulos
Medium 9788547220228

9. Mercado

MORETTIN, Pedro A. Saraiva - Uni PDF Criptografado

519

Conjuntos de dados

Continuação

Ano

PIB

Ano

PIB

Ano

PIB

Ano

PIB

1871

1872

1873

1874

1875

1876

1877

1878

1879

1880

1881

1882

1883

1884

1885

1886

1887

1888

1889

1890

1891

1892

6.56

6.55

6.72

7.71

7.88

7.98

7.30

7.32

7.38

7.88

7.62

6.86

6.65

6.54

7.02

8.07

8.94

9.25

9.59

9.64

9.35

9.15

1903

1904

1905

1906

1907

1908

1909

1910

1911

1912

1913

1914

1915

1916

1917

1918

1919

1920

1921

1922

1923

1924

10.48

11.34

12.47

13.76

14.45

16.01

17.81

20.56

24.29

26.75

26.00

22.91

Ver todos os capítulos
Medium 9788547220228

1.2 Modelos

MORETTIN, Pedro A. Saraiva - Uni PDF Criptografado

4

Capítulo 1 — Preliminares

sumários não devam ser obtidos, mas uma análise exploratória de dados não deve se limitar a calcular tais medidas.

1.2 Modelos

Fundamentalmente, quando se procede a uma análise de dados, busca-se alguma forma de regularidade ou padrão ou, ainda, modelo, presente nas observações.

Exemplo 1.1  (continuação)  O que se espera, intuitivamente, no caso em questão é que os gastos de um indivíduo estejam diretamente relacio­nados com os seus rendimentos, de modo que é razoável supor uma “relação linear” entre essas duas quantidades. Os pontos da Figura 1.1 não estão todos, evidentemente, sobre uma reta; essa seria o nosso padrão ou modelo. A diferença entre os dados e o modelo constitui os resíduos. Veja a Figura 1.3.

Podemos, então, escrever de modo esquemático:

DADOS = MODELO + RESÍDUOS ou, ainda,

D = M + R.

(1.2)

A parte M é também chamada parte suave (ou regular ou, ainda, previsível) dos dados, enquanto R é a parte aleatória. A parte R é tão importante quanto M, e a análise dos resíduos constitui uma parte fundamental de todo trabalho estatístico. Basicamente, são os resíduos que nos dizem se o modelo é adequado ou não para representar os dados.

Ver todos os capítulos

Visualizar todos os capítulos