202 capítulos
Medium 9788582604984

Capítulo 3 - Representação de dados multivariados

Bryan F. J. Manly, Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 3

Representação de dados multivariados

3.1 �O problema da representação de muitas variáveis em duas dimensões

Gráficos precisam ser apresentados em duas dimensões, tanto sobre papel quanto na tela de um computador. É, portanto, um processo simples e direto mostrar uma variável representada sobre um eixo vertical contra uma segunda variável representada sobre um eixo horizontal. Por exemplo, a Figura 3.1 mostra a extenção alar representada contra o comprimento total para as 49 pardocas medidas por Hermon Bumpus no estudo da seleção natural (descrito no Exemplo 1.1). Tais representações permitem também mostrar uma ou mais outras características dos objetos em estudo. Por exemplo, no caso dos pardais de Bumpus, sobreviventes e não sobreviventes estão também indicados. Esses gráficos são simples e podem ser produzidos em Excel ou outra planilha eletrônica, bem como em todos os pacotes estatísticos padrão. Também podem ser produzidos usando código R, fornecido no apêndice deste capítulo, para ambos os tipos de gráfico e os mais complicados gráficos que são descritos a seguir.

Ver todos os capítulos
Medium 9788582604984

Capítulo 10 - Análise de correlação canônica

Bryan F. J. Manly, Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 10

Análise de correlação canônica

10.1 �Generalização de uma análise de regressão múltipla

Em alguns conjuntos de dados multivariados, as variáveis se dividem naturalmente em dois grupos. Uma análise de correlação canônica pode então ser usada para investigar os relacionamentos entre os dois grupos. Um caso em questão se refere aos dados que são fornecidos na Tabela 1.3. Lá consideramos

16 colônias de borboletas Euphydryas editha na Califórnia e em Oregon. Para cada colônia, estão disponíveis valores para quatro variáveis ambientais e seis frequências gênicas. Uma questão óbvia a ser considerada é se existem relações entre as frequências gênicas e as variáveis ambientais. Uma maneira de investigar isto é por meio de uma análise de correlação canônica.

Outro exemplo foi fornecido por Hotelling (1936), no qual ele descreveu uma análise de correlação canônica pela primeira vez. Este exemplo envolveu os resultados de testes para velocidade de leitura (X1), potência de leitura (X2), velocidade aritmética (Y1) e potência aritmética (Y2) para 140 crianças estudantes da sétima série. A questão específica que foi considerada foi se habilidade de leitura (como medida por X1 e X2) está ou não relacionada com habilidade aritmética (como medida por Y1 e Y2).

Ver todos os capítulos
Medium 9788582604984

Capítulo 11 - Escalonamento multidimensional

Bryan F. J. Manly, Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 11

Escalonamento multidimensional

11.1 �Construção de um mapa de uma matriz de distâncias

O escalonamento multidimensional é projetado para construir um diagrama mostrando as relações entre um certo número de objetos, sendo dada somente uma tabela de distâncias entre objetos. O diagrama é então um tipo de mapa que pode ser em uma dimensão (se os objetos caem em uma reta), em duas dimensões (se os objetos caem em um plano), em três dimensões (se os objetos podem ser representados por pontos no espaço) ou em um número mais alto de dimensões (caso em que uma simples representação geométrica não é possível).

O fato de ser possível construir um mapa de uma tabela de distâncias pode ser visto considerando o exemplo de quatro objetos – A, B, C e D – mostrados na

Figura 11.1. As distâncias entre os objetos são dadas na Tabela 11.1. Por exemplo, a distância de A a B, a qual é a mesma que a distância de B a A, é 6,0, enquanto que a distância de cada objeto a si mesmo é sempre 0,0. Parece plausível que o mapa possa ser reconstruído de um arranjo de distâncias. Entretanto, é também aparente que uma imagem espelhada do mapa, como mostrado na Figura 11.2, terá o mesmo arranjo de distâncias entre objetos. Consequentemente, parece claro que uma reconstituição do mapa original estará sujeita a uma possível reversão deste tipo.

Ver todos os capítulos
Medium 9788582604984

Capítulo 9 - Análise de agrupamentos

Bryan F. J. Manly, Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 9

Análise de agrupamentos

9.1 �Usos de análise de agrupamentos

Suponha que exista uma amostra de n objetos, cada um dos quais tem um escore em p variáveis. Então a ideia de uma análise de agrupamentos é usar os valores das variáveis para planejar um esquema para agrupar os objetos em classes de modo que objetos similares estejam na mesma classe. O método usado precisa ser completamente numérico, e o número de classes não é usualmente conhecido. Este problema é claramente mais difícil do que o problema para uma análise de função discriminante que foi considerado no capítulo anterior, porque para começar com análise de função discriminante, os grupos são conhecidos.

Há muitas razões pelas quais uma análise de agrupamentos pode valer a pena. Pode ser uma questão de encontrar os verdadeiros grupos que presumimos realmente existirem. Por exemplo, em psiquiatria tem havido discordância sobre a classificação de pacientes depressivos, e a análise de agrupamentos tem sido usada para definir grupos objetivos. A análise de agrupamentos pode também ser útil para redução de dados. Por exemplo, um grande número de cidades pode potencialmente ser usado como teste de mercado para um novo produto, mas é somente viável usar algumas. Se colocarmos as cidades em um número pequeno de grupos de cidades similares, então um membro de cada grupo pode ser usado para o teste de mercado. Alternativamente, se a análise de agrupamentos gerar grupos inesperados, então isso poderia, em si mesmo, sugerir relacionamentos a serem investigados.

Ver todos os capítulos
Medium 9788582604984

Capítulo 4 - Testes de significância com dados multivariados

Bryan F. J. Manly, Jorge A. Navarro Alberto Grupo A PDF Criptografado

Capítulo 4

Testes de significância com dados multivariados

4.1 �Testes simultâneos em várias variáveis

Quando são coletados dados para várias variáveis sobre as mesmas unidades amostrais, é sempre possível examinar as variáveis uma de cada vez no que diz respeito a testes de significância. Por exemplo, se as unidades experimentais estão em dois grupos, então uma diferença entre as médias para os dois grupos pode ser testada separadamente para cada variável. Infelizmente, existe um senão para essa abordagem simples pelo fato de que ela requer o uso repetido de testes de significância, cada um deles tendo uma certa probabilidade de levar a uma conclusão errada. Como será discutida posteriormente na Seção 4.4, a probabilidade de falsamente encontrar pelo menos uma diferença significante acumula com o número de testes aplicados, de modo que ela pode se tornar inaceitavelmente grande.

Há maneiras de ajustar níveis de significância para permitir que muitos testes sejam aplicados ao mesmo tempo, mas pode ser preferível conduzir um

Ver todos os capítulos

Visualizar todos os capítulos