63 capítulos
Medium 9788582604984

Capítulo 4 - Testes de significância com dados multivariados

Bryan F. J. Manly; Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 4

Testes de significância com dados multivariados

4.1 �Testes simultâneos em várias variáveis

Quando são coletados dados para várias variáveis sobre as mesmas unidades amostrais, é sempre possível examinar as variáveis uma de cada vez no que diz respeito a testes de significância. Por exemplo, se as unidades experimentais estão em dois grupos, então uma diferença entre as médias para os dois grupos pode ser testada separadamente para cada variável. Infelizmente, existe um senão para essa abordagem simples pelo fato de que ela requer o uso repetido de testes de significância, cada um deles tendo uma certa probabilidade de levar a uma conclusão errada. Como será discutida posteriormente na Seção 4.4, a probabilidade de falsamente encontrar pelo menos uma diferença significante acumula com o número de testes aplicados, de modo que ela pode se tornar inaceitavelmente grande.

Há maneiras de ajustar níveis de significância para permitir que muitos testes sejam aplicados ao mesmo tempo, mas pode ser preferível conduzir um

Ver todos os capítulos
Medium 9788582604984

Capítulo 2 - Álgebra matricial

Bryan F. J. Manly; Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 2

Álgebra matricial

2.1 �A necessidade de álgebra matricial

A teoria de métodos estatísticos multivariados pode ser explicada razoavelmente bem somente com o uso de alguma álgebra matricial. Por essa razão, é

útil, se não essencial, ter pelo menos algum conhecimento nesta área da matemática. Isso vale mesmo para aqueles que estão interessados em usar os métodos somente como ferramentas. À primeira vista, a notação de álgebra matricial

é um pouco amedrontadora. No entanto, não é difícil entender os princípios básicos, desde que alguns detalhes sejam aceitos na fé.

2.2 �Matrizes e vetores

Uma matriz m × n é um arranjo de números com m linhas e n colunas, considerado como uma única entidade, da forma:

Se m = n, então ela é uma matriz quadrada. Se existe somente uma coluna, como em

30  Métodos Estatísticos Multivariados: Uma Introdução então ela é chamada de vetor coluna. Se existe somente uma linha, como

então ela é chamada de vetor linha. O negrito é usado para indicar matrizes e vetores.

Ver todos os capítulos
Medium 9788582604984

Capítulo 13 - Epílogo

Bryan F. J. Manly; Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 13

Epílogo

13.1 O próximo passo

Ao escrever este livro, os objetivos foram propositadamente limitados no que se refere a conteúdo. Estes objetivos terão sido alcançados se alguém que tenha lido cuidadosamente os capítulos anteriores tenha uma ideia honesta do que pode e do que não pode ser obtido pelos métodos estatísticos multivariados mais largamente usados. Nossa esperança é de que o livro venha a ajudar muitas pessoas a dar o primeiro passo em “uma jornada de mil quilômetros”.

Para aqueles que deram este primeiro passo, a maneira de ir adiante é ganhar experiência em métodos multivariados analisando diferentes conjuntos de dados e vendo quais resultados são obtidos. Como em outras áreas de estatística aplicada, competência em análise multivariada requer prática.

Desenvolvimentos recentes em análise multivariada têm sido feitos no campo proximamente relacionado à mineração de dados (data mining), o qual se preocupa com extração de informação de conjuntos de dados muito grandes.

Ver todos os capítulos
Medium 9788582604984

Capítulo 12 - Ordenação

Bryan F. J. Manly; Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 12

Ordenação

12.1 �O problema da ordenação

A palavra ordenação para um biólogo significa essencialmente o mesmo que escalonamento para um cientista social. Ambas as palavras descrevem o processo de produção de um pequeno número de variáveis que podem ser usadas para descrever a relação entre um grupo de objetos, começando ou de uma matriz de distâncias ou similaridades entre objetos ou dos valores de algumas variáveis medidas em cada objeto. Deste ponto de vista, muitos dos métodos que foram descritos em capítulos anteriores podem ser usados para ordenação, e alguns dos exemplos se relacionam com este processo. Em particular, representação gráfica de pardocas contra as duas primeiras componentes principais das medidas de tamanho (Exemplo 5.1), representação gráfica de países europeus contra as duas primeiras componentes principais para variáveis de emprego (Exemplo

5.2), produção de um mapa da Ilha Sul da Nova Zelândia de uma tabela de distâncias entre cidades por escalonamento multidimensional (Exemplo 11.1), e representação gráfica de parlamentares de Nova Jersey contra eixos obtidos por escalonamento multidimensional baseado em comportamento de votação

Ver todos os capítulos
Medium 9788582604984

Capítulo 6 - Análise de componentes principais

Bryan F. J. Manly; Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 6

Análise de componentes principais

6.1 �Definição de componentes principais

A técnica de análise de componentes principais foi inicialmente descrita por

Karl Pearson (1901). Ele aparentemente acreditou que era a solução correta para alguns dos problemas de interesse para biométricos naquele tempo, apesar de ter proposto um método prático de cálculo para duas ou três variáveis apenas.

Uma descrição de métodos computacionais práticos veio muito mais tarde, feita por Hotelling (1933). Mesmo então, os cálculos eram extremamente amedrontadores para mais do que poucas variáveis porque tinham que ser feitos à mão.

Somente após os computadores eletrônicos terem se tornado disponíveis generalizadamente é que a técnica de componentes principais alcançou amplo uso.

A análise de componentes principais é um dos métodos multivariados mais simples. O objetivo da análise é tomar p variáveis X1, X2, ..., Xp e encontrar combinações destas para produzir índices Z1, Z2, ..., Zp que sejam não correlacionados na ordem de sua importância, e que descrevam a variação nos dados. A falta de correlação significa que os índices estão medindo diferentes “dimensões” dos dados, e a ordem é tal que Var(Z1) ≥ Var(Z2) ≥ ... ≥ Var(Zp), em que Var(Zi) denota a variância de Zi. Os índices Z são, então, os componentes principais. Ao fazer uma análise de componentes principais, há sempre a esperança de que as variâncias da maioria dos índices serão tão baixas a ponto de serem desprezíveis. Neste caso, a maior parte da variação no conjunto de dados completos pode ser descrita adequadamente pelas poucas variáveis Z com variâncias que não são desprezíveis, e algum grau de economia é então alcançado.

Ver todos os capítulos

Visualizar todos os capítulos