COLETA DE GRANDES AMOSTRAS

COLETA DE GRANDES AMOSTRAS


Daniel Nascimento-e-Silva, PhD

Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)

 

O desafio da ciência é a criação de explicações globais acerca da realidade. Sua intenção é sempre universal. Isso não significa, jamais, que não haja exceções às regras universais. Aliás, a explicação das exceções é fundamental para que se compreendam as dinâmicas comportamentais dos fatos e fenômenos do mundo a partir do impacto que sofrem de outros fenômenos e de seus próprios componentes. Isso significa que a realidade muda a partir da mudança que se lhe processa internamente e em decorrência das ações de outras realidades. Se tomada a aprendizagem como um processo, por exemplo, se houver alterações em uma dessas etapas interiores, provavelmente a aprendizagem terá sem comportamento alterado. Por outro lado, se a vontade de aprender for considerada um fenômeno externo à aprendizagem, é provável que quanto maior ou menor ela for, maior ou menor tenderá a ser a aprendizagem, em um tipo de relacionamento diretamente proporcional. Neste último caso a explicação seria que quanto maior a vontade de aprender, maior a probabilidade de aprendizagem. Mas para que as explicações possam se universalizar, é necessário que se lide com as grandes amostras.

A primeira pergunta que o cientista deve se fazer em relação a tamanho de amostras é em relação ao tamanho da população. Se estudo a aprendizagem de crianças de comunidades ribeirinhas, o tamanho da população é igual a todas as crianças em idade escolar em todas as comunidades ribeirinhas do mundo. Se houver comunidade ribeirinha nos Estados Unidos e se lá houver crianças em idade escolar, essas crianças fazem parte da população. Acontece, contudo, de eu querer estudar a aprendizagem das crianças de comunidades ribeirinhas indígenas. Quando isso acontece, o tamanho da população diminui. Essa é uma das formas, por exemplo, de se delimitar tanto o estudo quanto o tamanho da população. Também posso querer, dentre essa nova população, estudar apenas os casos de crianças superdotadas das comunidades da Amazônia amazonense. Novamente o tamanho da população vai diminuir.

É justamente isso o que queremos mostrar: o tamanho da população vai depender da delimitação do estudo. Mas essa delimitação precisa levar em consideração a pretensão de universalidade da ciência. Se quero estudar a superdotação de crianças indígenas que vivem na beira dos rios do estado do Amazonas é que provavelmente elas apresentam alguma característica que influencia no fenômeno (universal) do meu interesse, que é a aprendizagem. É provável (há sempre uma hipótese para justificar isso) que a superdotação dessas crianças permita compreender o impacto de fatores internos ou externos sobre a aprendizagem. A característica dessa população seria, portanto, a superdotação das crianças indígenas em idade escolar que vivem nas comunidades ribeirinhas. É sobre esse total que os cientistas calculam o tamanho da amostra: sobre todos os indivíduos que apresentam a mesma característica.

A segunda pergunta é sobre o tamanho da amostra propriamente dita. Quantos indivíduos tenho que estudar para que a minha explicação possa ser considerada válida. Naturalmente que aqui estamos tratando de validade externa, que é aquela que permite dizer que o que acontece com a amostra acontece com toda a população. Assim, estudar uma amostra é praticamente o mesmo que estudar todo mundo. E não apenas isso: a explicação vale para todos os tipos de superdotação de crianças indígenas que vivem em comunidades ribeirinhas em todos os lugares do mundo e de outros planetas, se lá existirem essas populações. É preciso não confundir com validade interna, uma vez que a falta de validade interna implica imediatamente a impossibilidade de validade externa.

Quanto maior a necessidade de precisão, de exatidão, das explicações geradas, maior será o tamanho da amostra. A razão disso é que toda explicação científica necessariamente tem erro. Se não tiver erro, não tem ciência. O erro é justamente a diferença entre a explicação gerada pelo estudo a partir de determinada amostra e a explicação obtida, se fosse consultada toda a população, ao invés de uma parte dela. Se desejo ter uma margem de erro de 5%, o tamanho da amostra será A; se a margem de erro desejada for 1%, o tamanho da amostra será B, que obrigatoriamente será maior que A. Por exemplo, se desejo fazer um estudo com uma população de 100 mil pessoas com margem de erro de 5%, o tamanho da amostra será de 400 indivíduos; se a margem de erro cair para 1%, a amostra será composta por 10 mil pessoas.

A terceira e última questão que precisa ser entendida é a ideia de erro. Na prática, o erro é percebido quando se repete o mesmo estudo várias vezes. Se for repetido 100 vezes, haverá diferenças significativas em 5 deles, se a margem de erro for de 5%. Isso significa 5% da explicação estar em desacordo com a realidade. Note que 5% de chance de estar fora da realidade também representa 95% de chances dela estar correta. É uma probabilidade pequena, mas pode ocorrer, sim, porque é o acaso pode levar a isso. É por essa razão que dizemos que esses estudos são randomizados, porque levam em consideração o acaso. Aliás, um número muito grande de cientistas só considera verdadeiramente científicos os resultados randomizados, coisa que as pequenas jamais conseguem fazer.

A ciência é um grande esforço mental. Pode-se-lhe até considerar uma grande arquitetação mental assentada na lógica e na matemática. Se o cientista não tiver tido uma forte preparação lógica, tanto as consistentes como as paraconsistentes, e matemática terá grande dificuldade em fazer ciência. Não é fácil sair da abstração do todo para a operacionalidade de um esquema de ação que permita, ao estudar uma parte muitíssimo parecida com a totalidade, gerar resultados praticamente exatos do que aconteceria ao se estudar todo mundo.


Dr. Daniel Nascimento e Silva

Dr. Daniel Nascimento e Silva

PhD, Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)



O que achou deste artigo?