ORGANIZAÇÃO DE DADOS E PROBLEMAS
Daniel Nascimento-e-Silva, PhD
Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)
Há dois esquemas lógicos por trás das organizações dos dados, dependendo da finalidade da investigação que se faz. Quando a finalidade é gerar conhecimentos para aumentar ou atualizar os estoques disponíveis, o esquema inicia com a observação da realidade que gerou a pergunta de pesquisa, prossegue com o levantamento daquilo que já se conhece e está disponível na literatura, que serve de matéria-prima para a coleta dos dados empíricos, e culmina com a representação pictórica, diagramática, dos dados, procurando-se sentido neles. Esse é o esquema percorrido pela ciência. Quando a finalidade é a produção de algum artefato que resolva determinado problema, cinco outras etapas precisam ser percorridas, como serão detalhadas depois. Por essas razões, os procedimentos de organização dos dados precisam dar conta dos desafios para os quais foram coletados. Quando se organizam os dados com a finalidade científica, as representações precisam visualizar o que está oculto, facilitando a interpretação e a necessária vinculação a algum campo teórico; além disso, se a preocupação é tecnológica, a representação precisa facilitar a confecção do protótipo.
O método científico-tecnológico prevê pelo menos seis tipos de questões de pesquisas capazes de fundamentar e estruturar científica e tecnologicamente qualquer artefato. Cada tipo de questão exige, portanto, uma forma de organização dos dados em busca da visualização da lógica que eles ocultam. O primeiro tipo são as questões conceituais. Essas questões são compostas de duas partes: termos de equivalência e atributos. Os termos de equivalência representam as diferentes visões ou perspectivas sobre determinado fenômeno, enquanto os atributos denotam as características que lhes são mais proeminentes, essenciais, delimitadoras. Assim, quando os cientistas lidam com esse tipo de dados têm em mente o desafio de sintetizar um conjunto de termos de equivalência em um único, da mesma forma que precisam demonstrar suas características fundamentais. É por isso que as organizações desses dados podem ser dar via equações matemáticas, estruturas analíticas ou um diagrama que permita visualizar esses dois componentes.
As questões estruturais são aquelas que têm por finalidade identificar as partes que compõem o fenômeno sob investigação e que será manuseado para gerar a tecnologia. Se desejo saber quais são os componentes de determinado microorganismo, posso tanto criar um desenho mostrando cada uma de suas partes, assim como reproduzir esse ser vivo em forma de desenho ou com uma fotografia. O que importa é que a organização dos dados permita apontar com exatidão os componentes. Isso quer dizer que, ao identificar o que faz parte do conjunto, deixa de lado tudo aquilo que não é parte daquilo que se quer conhecer.
As questões processuais são aquelas que nos colocam o desafio de apontar as etapas de determinado fenômeno. Como consequência, aqui o cientista precisa ter em mente a sucessão dessas etapas, desde a primeira até a última. A organização dos dados deve ser feita de uma forma tal que permita compreender como determinado resultado é gerado, uma vez que todo processo precisa, obrigatoriamente, gerar alguma coisa como produto. É por isso que, muitas vezes, o processo de organização desses dados começa justamente com a identificação do produto final, uma vez que também é comum que haja produtos intermediários ou produtos em processo (product in progress). Diagramas lineares e fluxogramas são produtos desse tipo de organização de dados.
As questões funcionais têm como foco responder à seguinte pergunta: como cada parte de determinada estrutura funciona ou como cada etapa de determinado processo funciona? Como o que os cientistas querem responder é a dinâmica das coisas, quase sempre respondem primeiro uma questão conceitual e outra estrutura ou uma questão conceitual e outra processual. Apesar de estarem vinculadas, as organizações dos outros tipos prévios não manuseiam os mesmos dados. Os dados manuseados são coletados de forma específica para cada etapa ou parte do fenômeno. É o caso da explicação do processo de elaboração de planos estratégicos, quando se quer saber como a etapa da matriz SWOT foi calculada, ou como as pernas de um robô são feitas. Fluxogramas e modelos mentais são exemplos de resultados de organizações de dados aqui.
As questões relacionais também têm os seus dados concentrados nas etapas ou nas partes referentes às questões estruturais e processuais. Elas diferem das questões funcionais porque estas explicam o funcionamento isolado de cada parte, enquanto as questões relacionais procuram entender como uma parte de uma estrutura ou uma etapa de um processo se relaciona com outra, como elas são ligadas, através de que acontece essa ligação. É por isso que a organização desse tipo de dado precisa permitir visualizar as diferentes relações, ligações, filamentos, como os modelos mentais e os algoritmos fazem.
As questões ambientais são um tipo especial de questões relacionais. Enquanto as relacionais são interligações de componentes internos, as ambientais são interligações de componentes do fenômeno com o que está além dele. É daí que advém a ideia de ambiente: um espaço físico ou extrafísico que afeta e/ou é afetado pelo fenômeno ou por pelo menos uma de suas partes ou etapas. Por exemplo, ambientes altamente magnetizados interferem em diferentes tipos de artefatos, assim como uma sala de aula onde um professor executa uma parte de uma sequência didática também interfere no aprendizado dos alunos. A organização desses dados precisa permitir visualizar esses impactos.
Como será mostrado em detalhes mais tarde, cada agrupamento de dados está vinculado a uma questão de pesquisa, principal ou norteadora. Consequentemente, sua organização precisa estar direcionada para ela. Quem deseja aprender a fazer inovação tecnológica de base científica precisa estar atento ao esquema lógico que dá sentido a essas atividades. SE esses esquemas forem desconhecidos ou deixados de lado, corre-se um risco sério de se ter uma enormidade de conhecimentos sem que eles possam ser utilizados para fazer os protótipos.