Acessibilidade / Reportar erro

TRILHA HISTÓRICA SOBRE PRÁTICA DA PUBLICAÇÃO DE DADOS DE PESQUISA

HISTORICAL TRACK ON THE PRACTICE OF RESEARCH DATA PUBLICATION

RESUMO

O presente artigo apresenta a publicação de dados ao longo da história, destacando a prática como uma forma de registro deixado pelo homem ao longo dos tempos. Discute, através da Teoria Ator Rede de Bruno Latour, a mobilização de mundos oportunizados pela prática. Acompanha a “ciência em ação” e discute visibilidade, colaboração, reuso de dados, estímulo à inovação e descoberta científica. Adota-se o recorte temporal com base nos principais períodos da história (Pré-História, Idade Antiga, Idade Média, Idade Moderna e Contemporânea), associando-os às suas formas de registros de dados e informação. A metodologia consistiu em uma exaustiva revisão de literatura em bases de dados, bibliotecas digitais e repositórios sobre o tema: publicação de dados de pesquisa. Conclui-se que a prática vem evoluindo ao longo do tempo, conforme as transformações tecnológicas do período. Atribui-se ao pesquisador ou ao produtor do dado o caráter inovador da prática, considerando-a como instrumento para salvaguardar a memória para a posteridade. Finalmente compreende-se que a proposta para publicação de dados de pesquisa no contexto da Ciência Aberta, enquanto modo de comunicação científica, encontra-se em processo de apropriação e experimentação nacional e internacional entre pares.

Palavras-chave:
Dados de pesquisa; Comunicação científica; Publicação de dados; Ciência aberta

ABSTRACT

This article presents the publication of data throughout history, highlighting the practice as a form of record left by man over time. It discusses, through Bruno Latour's Actor Network Theory, the mobilization of worlds made possible by practice. It tracks “science in action” and discusses visibility, collaboration, data reuse, driving innovation, and scientific discovery. A time frame is adopted based on the main periods of history (Prehistory, Ancient Times, Middle Ages, Modern and Contemporary Ages), associating them with their forms of data and information records. The methodology consisted of an exhaustive literature review in databases, digital libraries and repositories on the subject: publication of research data. It is concluded that the practice has been evolving over time, according to the technological transformations of the period. The innovative character of the practice is attributed to the researcher or data producer, considering it as an instrument to safeguard the memory for posterity. Finally, it is understood that the proposal for publishing research data in the context of Open Science, as a means of scientific communication, is in the process of appropriation and national and international experimentation among peers.

Keywords:
Research data; Scientific Communication; Data publication; Open science

1 INTRODUÇÃO

Das paredes das cavernas e artefatos arqueológicos, passando pela introspecção dos arquivos dos pesquisadores à vitrine dos repositórios e demais fontes de publicação, os dados de pesquisas se veem diante de um protagonismo científico e ganham cada vez mais visibilidade e importância, oportunizando novos modos de interação e comunicação científicas.

A história da publicação dos dados de pesquisa está intimamente relacionada à história da escrita humana. A transição da humanidade, desde a Pré-História, passando pela Idade Antiga, Idade Média, Idade Moderna e Contemporânea, fez com que as formas de registros e inscrições fossem sendo modificadas ao longo dos tempos. Tais registros tornaram-se ferramenta de sobrevivência, além de ser uma forma de salvaguardar a memória para a posteridade. Com o passar dos anos, o desenvolvimento da escrita, enquanto evolução tecnológica, ampliou a maneira de registrar dados e informação para comunicação, memória e possível reutilização futura.

Para contar um pouco do que se acredita ter sido “os primórdios” da publicação de dados, propôs-se uma definição bastante ampla para orientar esta jornada. Desse modo, considerou-se, para fins dessa reconstrução histórica, a prática da publicação de dados como sendo toda forma de registro deixado pelo homem ao longo dos tempos, desde a Pré-História até a modernidade, com o propósito de tornar público dados e informações já utilizados e experimentados para dar conhecimento às gerações futuras. Salienta-se que o termo “publicação de dados de pesquisa” é uma expressão deste século, e, como tal, não poderia ser assim identificada anteriormente. Contudo, a prática em questão é identificada ao longo dos tempos por diversos pesquisadores através dos esforços de arqueólogos, historiadores e demais cientistas, de todas as partes do mundo, em tornar os dados fruto de pesquisas o mais público possível.

Adotou-se o recorte temporal com base nos principais períodos da história (Pré-História, Idade Antiga, Idade Média, Idade Moderna e Contemporânea), associando-os às suas formas de registros de dados e informação.

A contribuição da Teoria Ator Rede (TAR) de Bruno Latour enquanto referencial teórico para o estudo foi pontual por considerar o valor atemporal atribuído aos dados e informações deixados pelo homem ao longo do tempo. A TAR aplica-se à esta reconstrução da trilha histórica da publicação de dados de pesquisa por meio da ideia de mobilização de mundos. De acordo com Latour (2000, p. 364):

[…] a mobilização de mundo compreende o deslocamento ou “mobilização” de uma “coleção”, representada na pesquisa por conjunto de dados, para realidades e ambientes distintos aos quais deram origem aquela coleção. Segundo o autor: Estes podem ser retirados do contexto em que estão e levados embora durante as expedições. Portanto, a história da ciência é em grande parte a história da mobilização de qualquer coisa que possa ser levada a mover-se […].

Nesse sentido, considera-se a característica volátil dos dados e informações registrados desde as cavernas até os contemporâneos conjuntos de dados de pesquisa depositados em repositórios, associando-os à transparência e à comunicabilidade proporcionada pela publicação via periódico ou via repositório, bem como sua possibilidade de compartilhamento e colaboração entre pares.

A contribuição de Latour (2000LATOUR, Bruno. Ciência em ação: como seguir cientistas e engenheiros sociedade afora. São Paulo: Ed. UNESP, 2000.) e da TAR se estende à observação da ciência em ação, uma vez que, o resgate histórico da prática de publicização de dados possibilita acompanhar um modelo de comunicação científica “viva” em ação. A publicação de dados de pesquisa pode ser considerada como uma janela oportuna para a observação da ciência em transformação. A ideia de ciência em transformação é bem ilustrada pela figura tanto do periódico de dados quanto do repositório de dados, uma vez que, sua chegada recente ao campo da comunicação científica apresenta-se como oportunidades e desafios inerentes a dinâmica da ciência. Enquanto estabelecem-se, necessitam de experimentação por parte de seus principais colaboradores (autores, pesquisadores, editores, revisores, bibliotecários, entre outros), num movimento síncrono e assíncrono constante entre os laboratórios (que Latour (2000) chama de centros de cálculo) e a periferia, que pode ser considerada neste contexto como o acesso à descrição dos dados por seus potenciais reutilizadores. A discussão proposta a partir da TAR considerou as relações entre ciência, tecnologia e sociedade e os respectivos atores envolvidos nesse processo.

2 METODOLOGIA

A metodologia utilizada consistiu em uma exaustiva revisão de literatura sobre o tema: publicação de dados de pesquisa, com o propósito de entender o universo terminológico e conceitual sobre a prática em questão. Para tal, foram realizadas buscas nas seguintes bases de dados, bibliotecas digitais e repositórios: Scopus; Web of Science; Science Direct; Information Science and Technology Abstracts (ISTA); Library, Information Science & Technology Abstracts with Full Text (LISTA); Library and Information Science Abstracts (LISA); Springer Link; Literatura Latino-Americana e do Caribe em Ciências da Saúde (LILACS); Medical Literature Analysis and Retrieval System Online (MEDLINE); Cumulative Index to Nursing and Allied Health Literature (CINAHL); Scientific Electronic Library Online (SciELO); Biblioteca Digital Brasileira de Teses e Dissertações (BDTD) do Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT); e o Repositórios Científicos de Acesso Aberto de Portugal (RCAAP).

Os critérios de inclusão adotados na pesquisa consideraram estudos que estabelecessem relação entre a prática da publicação de dados e sua contribuição no workflow da comunicação científica. Além disso, buscamos documentos que propusessem uma definição terminológica e conceitual para o objeto investigado (a prática da publicação de dados de pesquisa). Os critérios de exclusão consideraram documentos que não explorassem o registro de dados e informação ao longo dos tempos, bem como a prática da publicação de dados de pesquisa no âmbito da Ciência Aberta.

Numa tentativa de contextualizar a prática investigada sob a perspectiva de produção e publicização do conhecimento ao longo da história, produzimos um lastro histórico do que chamamos de “trilhas” da prática de publicação de dados. Por meio deste resgate, pretendeu-se contar a “história da prática da publicação de dados”, buscando entender as tecnologias e formas de comunicar os dados produzidos ao longo dos tempos.

3 O CAMINHO PERCORRIDO

A trilha histórica teve início a partir do artigo de Batimarchi (2015BATIMARCHI, Susana. Uma breve história do big data desde 18.000 A.C. Instituto Information Management [IIMA], [s.l.], 22 abr. 2015. Home. Disponível em: https://docmanagement.com.br/04/22/2015/uma-breve-historia-do-big-data-desde-18-000-a-c/. Acesso em: 23 set. 2021.
https://docmanagement.com.br/04/22/2015/...
) Uma breve história do big data desde 18.000 A.C, publicado pelo Instituto Information Management. O texto nos leva ao período pré-histórico, remontando a história do registro de dados a 18.000 A.C, com evidências de que no período paleolítico nossos ancestrais tinham um sistema de arquivo de dados conhecido como osso de Ishango. O artefato citado consiste em ser uma fíbula de um babuíno, que era usada com uma marcação de traços e servia como um sistema matemático simples (Batimarchi, 2015).

Almeida (2002ALMEIDA, Manoel de Campos. Talhas numéricas e o antigo testamento. Revista Brasileira de História da Matemática, [s.l.], v. 2, n. 4, p. 119-139, 2002. DOI: 10.47976/RBHM2002v2n4119-139.
https://doi.org/10.47976/RBHM2002v2n4119...
, p. 120) confirma o entendimento anterior e ajuda a reconstruir essa história ao afirmar que a partir da descoberta do osso de Ishango “os homens estavam assim inventando os rudimentos da contabilidade escrita, traçando algarismos nos ossos (ou madeira), no sistema numérico mais rudimentar que existiu”. Verifica-se, desde então, o registro e a publicação de dados em objetos e/ou superfícies que serviriam de orientação para a posteridade, conforme a figura a seguir.

Figura 1
Osso de Ishango

As inscrições (o registro dos dados) presentes no osso de Ishango e em outros artefatos de mesma natureza ilustram e ao mesmo tempo reforçam a máxima que diz: “os números não falam por si só”. Embora tais instrumentos sejam a base para o desenvolvimento da matemática1 1 Cf. Almeida (2002); Santos (2019); Fuhr e Campos (2017). , e, ainda, considerando toda a pesquisa histórica e arqueológica já realizada sobre tais artefatos, acredita-se que tais objetos isolados e sem descrições histórico-contextuais não revelariam exatamente em que condições e propósitos os dados foram produzidos e registrados.

Outra figura arqueológica pertencente ao mesmo período e que contribuiu para a construção da trilha histórica da publicação de dados de pesquisa é a pintura rupestre. A abordagem voltada para a descoberta sobre o significado, propósito e condições de produção dos registros em pedras e demais superfícies ressignificam a arte contida nas pinturas rupestres em dados de pesquisa. Segundo Viana et al. (2016VIANA, Verônica et al. Arte rupestre. In: REZENDE, Maria Beatriz et al. (org.). Dicionário IPHAN de Patrimônio Cultural. 2. ed. Rio de Janeiro; Brasília: IPHAN: DAF: Copedoc, 2016. Disponível em: http://portal.iphan.gov.br/uploads/ckfinder/arquivos/VERBETE%20ARTE%20RUPESTRE%20-%20pronto%20pdf.pdf. Acesso em: 09 abr. 2023.
http://portal.iphan.gov.br/uploads/ckfin...
, p. 03), tais registros:

[…] respondem pela primeira tentativa de sistematização dos dados fornecidos pela arte rupestre europeia, assegurando que suas figuras formavam “composições” que, embora tratadas até então como meras acumulações casuais de imagens independentes, eram portadoras de significados complexos para as sociedades que as conceberam.

No Brasil, temos vários sítios arqueológicos que contribuem para demonstrar como a pintura rupestre pode ser considerada um “dataset”. Destacamos aqui os dados registrados nas paredes das cavernas no Parque Nacional da Serra da Capivara, no Piauí, região nordeste do Brasil. Não obstante a natureza artística do painel, é inegável que o modo de registro produzido pelos povos deste período revela a riqueza e a versatilidade de formas de representação de dados ao longo dos tempos, conforme veremos na Figura 2.

Figura 2
Pinturas rupestres como dado de pesquisa (Parque Nacional da Serra da Capivara)

Percebe-se que neste período o propósito de organização, registro, administração, publicidade e memória é bastante evidente. Ao considerarmos os registros nas paredes das cavernas e demais artefatos pré-históricos, como “suporte de publicação de dados”, respeitando a compatibilidade tecnológica do período, podemos de fato dar início à construção de uma trilha histórica sobre a publicação dos dados de pesquisa. A arte representada nas pinturas das cavernas revela também um outro olhar sobre dados. Os pigmentos das cores e materiais utilizados em cada uma das cores e texturas abre portas para estudos no campo da química e áreas afins. As descobertas arqueológicas revelam a fertilidade do período e a possibilidade de reuso dos dados ali registrados por vários campos do conhecimento.

Na passagem do período pré-histórico para a Idade Antiga, tem-se o desenvolvimento da escrita cuneiforme, conforme Figura 3.

Figura 3
Escrita cuneiforme

A primeira indagação que surge ao olharmos para essa placa de argila é a seguinte: que dados e informações se escondem por detrás desse bloco de pedra talhado em escrita cuneiforme? Apenas especialistas neste tipo de escrita serão capazes de decifrar. O registro feito em pedra, considerando-a como um suporte aberto (uma parede de pedra em espaço público), não garante o acesso à informação ali registrada. Ou seja, o fato de estar em “acesso aberto” não garante seu adequado entendimento. Supõe-se que o registro desses dados revela informações importantes sobre o período (tempo), a civilização, a cultura, entre outros. Contudo, apenas estudiosos e pesquisadores neste tipo de escrita saberão decifrar esses códigos e terão condições de fazer uma leitura completa e adequada do conteúdo descrito neste suporte, bem como revelar que tipo de dados e informação foram ali publicadas. O exemplo da escrita cuneiforme permite trazer para a discussão a “limitação” de descrição e contextualização ainda presente na prática da publicação de dados de pesquisa da contemporaneidade. O ato de publicar o conjunto de dados nem sempre garante sua compreensão pelos pares e possibilidade de reuso em novas pesquisas. A ausência de uma descrição cuidadosa dos dados, por meio de sua gestão, torna-se um fator que impacta diretamente na usabilidade e reuso de dados em novas pesquisas. De acordo com Reis (2019REIS, Caroline Kirsten. História da escrita: uma contextualização necessária para o processo de alfabetização. 2019. Monografia (Licenciatura em Pedagogia) - Universidade Federal de Uberlândia, Uberlândia, 2019. Disponível em: https://repositorio.ufu.br/bitstream/123456789/28854/1/Hist%C3%B3riaEscritaUma.pdf. Acesso em: 25 maio 2020.
https://repositorio.ufu.br/bitstream/123...
, p. 12),

[…] a maioria das descrições cuneiformes referem-se a dados contábeis e administrativos. Com a escrita cuneiforme, a literatura teve início, os textos literários mais antigos do mundo apareceram em tabuletas sumerianas, em forma de poemas e narrativas, no entanto, a grande maioria das inscrições cuneiformes reveladas na Mesopotâmia são de registros contábeis e administrativos.

Prossegue-se para a Idade Média, onde observa-se o desenvolvimento e aprimoramento de diversas formas de escrita em diferentes partes do mundo. O Alfabeto como o conhecemos nasce na Fenícia e é aprimorado pelos gregos. Contudo, a escrita, a leitura e a compreensão dos registros ainda eram restritas a pequenos grupos “letrados”. Deste ponto em diante, a trilha histórica sobre a prática da publicação de dados de pesquisa começa a ficar mais próximas aos nossos olhos e ouvidos, uma vez que grandes pesquisadores e cientistas, bem como seus registros e descobertas, se destacam neste período. A partir desse momento, a tentativa em organizar a trajetória histórica da publicação de dados confunde-se com a própria história da comunicação científica.

O período em questão é marcado por grandes nomes da ciência, disputas e conflitos teóricos e religiosos. Os manuscritos, suas reproduções por escribas e tradutores são recursos cada vez mais utilizados como forma de registro, memória e salvaguarda de dados e informações produzidos pelos pesquisadores e cientistas do período. O registro de dados a partir da observação da natureza e de experimentos é relatado em manuscritos e cartas como forma de comunicação e troca entre os pares. O espírito de memória científica é fortemente identificado a partir desse período. A Figura 4 apresenta um registro de dados (descrições) encontrado em uma publicação da Idade Média, escrito pelo botânico e médico do exército romano Pedanius Dioscorides, sobre plantas medicinais. Sua pesquisa deu origem a enciclopédia “Of Medical Substances”, traduzido para o latin como “De matéria Medica”, escrita originalmente em grego e posteriormente traduzido para o árabe e outros idiomas.

Figura 4
Registro de plantas medicinais publicados na obra “De Materia Medica” por Pedanius Dioscorides

Os detalhes das ilustrações, bem como as informações sobre cada uma delas, refletem o zelo na gestão dos dados ali registrados. A prática de anotações a partir de observação e experimentos, bem como a descrição dos dados, condições e características intrínsecas e extrínsecas de cada exemplar de planta, revelam o empenho e a intensão do pesquisador em registrar e tornar público tais conteúdos, para que os dados e conhecimentos até então produzidos não se perdessem ao longo do tempo.

Antes de avançar para o período moderno, considera-se relevante destacar o indiscutível legado da obra de Galileu Galilei no curso deste trajeto histórico. Os dados produzidos e registrados por suas investigações e experimentações, e que estão preservados até hoje, servem de base para pesquisas recentes em diversos campos do conhecimento.

Figura 5
Fragmentos e primeiros rascunhos de Galileu Galilei sobre o Tratado "Das coisas que flutuam na água"

Embora esteja em formato de rascunho, tais dados foram publicados sob o formato de livro e estão disponíveis na coleção digital da Library of Congress (Galilei, [entre1611 e 1612], v. 13). Através desta obra preservada, consegue-se perceber nitidamente a preocupação do cientista com o registro dos dados, seus cálculos e conclusões acerca dos experimentos realizados. Talvez um visionário da ciência aberta, deixou registrado seus métodos e investigações, dados positivos e negativos de suas pesquisas para a posteridade científica.

Dando continuidade a reconstrução da trilha histórica pretendida, seguiu-se para a Idade Moderna, onde, através de registros de dados ligados aos fatos históricos da época foi possível refletir sobre a prática e sua contribuição para a história, ciência, tecnologia e demais domínios do conhecimento.

As grandes expedições marítimas e a produção de dados sobre astronomia, oceanografia e geografia dos novos territórios explorados, além de dados sobre a fauna e a flora marcaram o período em questão. Dados e informações sobre fenômenos da natureza e seu impacto sobre as embarcações e as rotas de navegação também ganharam volume. As cartas náuticas, chamadas à época de “cartas portulanas2 2 A definição proposta pela Library of Congress considera que o objetivo principal da carta era retratar com a maior precisão possível os litorais e os portos, razão pela qual eram chamadas de portulanas (Carta portulana, [entre 1502 e 1506]). ”, são belíssimas publicações de dados de pesquisas (Carta portulana, [entre 1502 e 1506]). Nelas, estão registrados com riqueza de detalhes os dados para o desenvolvimento e exploração de rotas marítimas e expansão territorial, bem como a instalação e ampliação de relações comerciais. Os dados ali registrados foram produzidos a partir de observações e experimentações empíricas realizadas por navegadores, cientistas, religiosos e demais estudiosos.

Figura 6
Carta portulana do sudoeste do Oceano Atlântico com o Brasil

As cartas náuticas produzidas a partir da Idade Moderna são excelentes documentos ou suportes tecnológicos da época, que podem ajudar-nos a contar a história e evolução do registro e publicação de dados de pesquisa. Não obstante ao propósito ao qual foram criadas, hoje, ao olhar para trás, consegue-se enxergar o quão rico e valioso é este tipo de suporte onde os dados foram registrados.

Ainda no período moderno, no bojo da Revolução Francesa, diversas pesquisas científicas se desenvolveram e avançaram. Os dados de pesquisa produzidos neste período impulsionaram a ciência em diversos seguimentos. Antoine Lavosier na Europa e suas pesquisas em química emergem nas buscas por dados científicos produzidos no período. Contudo, optou-se por destacar como registro e publicação de dados do período em questão a publicação Army sanitary administration and its reform under the late Lord Herbert, de Florence Nightingale (1862NIGHTINGALE, Florence. Army sanitary administration and its reform under the late Lord Herbert. London: McCorquodale; 1862. Disponível em: https://archive.org/details/armysanitaryadmi00nigh/page/n3/mode/2up. Acesso em: 16 maio 2021.
https://archive.org/details/armysanitary...
). Considerada como referência para a Enfermagem Moderna em todo o mundo, ela foi precursora na produção e gestão de dados produzidos no período pelo campo da Enfermagem. Provavelmente devido a sua formação em matemática, que antecedeu a Enfermagem, deixou um legado amplamente reconhecido em todo o domínio da saúde, principalmente no que se refere à sistematização dos dados observados e produzidos na prática da Enfermagem. Sua experiência em hospitais da Europa e na Guerra da Criméia (1853 a 1856) colaborou para o desenvolvimento e proposição de estudos quantitativos e para a prática científica da Enfermagem e saúde de modo geral. A importância de seus registros é tamanha que, de acordo com artigo publicado no jornal The New York Times, “Ela escreveu sobre saúde pública, saneamento, [...], e por 50 anos ela esteve por trás da maior parte da legislação relacionada à saúde na Inglaterra” (Sweet, 2014SWEET, Victoria. Far more than a lady with a lamp. The New York Times, Nova York, 3 mar. 2014. On medicine. Disponível em: https://www.nytimes.com/2014/03/04/health/florence-nightingales-wisdom.html. Acesso em 07 jan. 2022.
https://www.nytimes.com/2014/03/04/healt...
, tradução nossa).

O cuidado no registro e publicação de dados sistematizados por Nightingale (1862NIGHTINGALE, Florence. Army sanitary administration and its reform under the late Lord Herbert. London: McCorquodale; 1862. Disponível em: https://archive.org/details/armysanitaryadmi00nigh/page/n3/mode/2up. Acesso em: 16 maio 2021.
https://archive.org/details/armysanitary...
) é representado pela Figura 7, onde apresenta-se, por meio de um diagrama, a taxa de mortalidade anual de soldados do exército inglês.

Figura 7
Dados sistematizados sobre taxa de mortalidade do exército inglês (1837 a 1846)

De acordo com a autora, o diagrama representa a taxa de mortalidade da população masculina inglesa da infantaria, com idade entre quinze e quarenta e cinco anos, nos anos de 1837 a 1846. Inclui, ainda, uma terceira divisão no diagrama, que representa a taxa de mortalidade da mesma infantaria durante três anos após a introdução de melhorias sanitárias por ela proposta, entre os anos de 1859 e 1861 (Nightingale, 1862NIGHTINGALE, Florence. Army sanitary administration and its reform under the late Lord Herbert. London: McCorquodale; 1862. Disponível em: https://archive.org/details/armysanitaryadmi00nigh/page/n3/mode/2up. Acesso em: 16 maio 2021.
https://archive.org/details/armysanitary...
). A obra pode ser considerada como uma autêntica publicação de dados da época, uma vez que revela o potencial interdisciplinar e de reuso dos dados produzidos em pesquisas.

Ainda no mesmo período, as contribuições dos pesquisadores Marie Curie e Pierre Curie para a física e química modernas não poderiam deixar de ser mencionadas como contribuições precursoras para o movimento da ciência aberta no que tange ao registro e gestão de dados de pesquisa. Nas palavras de Tasch (2015TASCH, Barbara. Marie Curie's belongings w ill be radioactive for another 1,500 years. Sciencealert, [s.l.], 31 ago. 2015. Disponível em: https://www.sciencealert.com/these-personal-effects-of-marie-curie-will-be-radioactive-for-another-1-500-years. Acesso em 08 out. 2021.
https://www.sciencealert.com/these-perso...
, tradução nossa):

Curie, a primeira e única mulher a ganhar o Prêmio Nobel em duas áreas diferentes (física e química), deu continuidade às pesquisas do físico francês Henri Becquerel, que em 1896 descobriu que o elemento urânio emite raios. Ao lado de seu marido, físico francês, Pierre Curie, a brilhante dupla científica descobriu um novo elemento radioativo em 1898. A dupla batizou o elemento polônio, em homenagem à Polônia, país natal de Marie.

Figura 8
Caderno de pesquisa de Marie Curie

O suporte tecnológico utilizado pelos pesquisadores Marie e Pierre para registrar os dados produzidos em seus experimentos foi o caderno de pesquisa. Nele, é possível visualizar esquemas, dados numéricos e descrições textuais dos experimentos. Revela-se, assim, um arquivo de dados que reúne em uma mesma plataforma dados do tipo: imagem, número e texto. Inúmeros cientistas deste período mereceriam destaque na construção do que chamamos de trilhas da história da publicação de dados.

Cabe ressaltar que caderno de pesquisa enquanto ferramenta para registro e gestão de dados de pesquisa vem sendo aprimorado e atualizado ao longo dos anos graças o avanço da tecnologia. As versões de cadernos de pesquisa contemporâneos atualizam-se e modificam-se para atender as necessidades atuais de pesquisa e inovação.

O período contemporâneo é fortemente marcado pelo avanço da tecnologia computacional e seus diversos suportes de produção e de registro de dados e informação. As Tecnologias de Informação e Comunicação (TIC) leva-nos a percorrer, cada vez mais, vias de mão única, onde não há como retornar ao antigo modus operandi de produção e registro de dados de pesquisa. A e-science e o big data são o presente. A maneira com que pesquisadores contemporâneos trabalham em seus laboratórios, a infraestrutura que dá suporte aos experimentos e a produção massiva de dados demandam cada vez mais conhecimento técnico, infraestrutura tecnológica e investimento.

Na contemporaneidade, os repositórios de dados estabelecem-se, cada vez mais, como locais apropriados para o armazenamento e publicação de dados de pesquisa. Stephanie Simms (2012SIMMS, Stephanie. Data publishing-the first 500 years. In: UNIVERSITY OF CALIFORNIA CURATION CENTER (UC3), Califórnia, 26 mar. 2012. Disponível em: https://uc3.cdlib.org/2012/03/26/data-publishing-the-first-500-years/. Acesso em: 26 maio 2020.
https://uc3.cdlib.org/2012/03/26/data-pu...
), do Centro de Curadoria da Universidade da Califórnia (UC3), colabora com a “trilha histórica da publicação de dados” ao remontar a história da publicação de dados de pesquisa há meio século, embora só tenha recebido os holofotes recentemente no bojo do movimento da Ciência Aberta. Segundo a autora, “a publicação de dados, conduzida de uma maneira que seria reconhecida pelos estudiosos de hoje, vem ocorrendo há quase meio milênio” (Simms, 2012).

Foote (2017FOOTE, Keith. D. A Brief history of big data. Dataversity, [s.l.], 14 dez. 2017. Information Management Articles. Disponível em: https://www.dataversity.net/brief-history-big-data/#. Acesso em: 23 set. 2021.
https://www.dataversity.net/brief-histor...
), em um breve artigo sobre a história do big data, cita a pesquisa de John Graunt, no século XVII, como exemplo de registro e reutilização de dados a partir de dados demográficos já publicados: De acordo com a autora, Em 1663, John Graunt conduziu uma das primeiras pesquisas registradas envolvendo análise de dados. Segundo a autora:

Ele estudou os registros de óbitos mantidos pelas paróquias de Londres. A partir disso, ele foi capaz de fazer observações sobre as taxas de mortalidade variáveis entre os sexos e até mesmo prever a expectativa de vida (Foote, 2017FOOTE, Keith. D. A Brief history of big data. Dataversity, [s.l.], 14 dez. 2017. Information Management Articles. Disponível em: https://www.dataversity.net/brief-history-big-data/#. Acesso em: 23 set. 2021.
https://www.dataversity.net/brief-histor...
, tradução nossa).

Figura 9
Publicação: Observações sobre as contas de mortalidade de John Graunt (1662)

A reutilização dos dados demográficos por John Graunt e demais iniciativas de mesma natureza demonstram a importância da gestão e publicação de dados para reutilização futura. Abre-se um parêntese para uma especulação que se apresentou no decorrer da pesquisa: será que Nightingale (1862NIGHTINGALE, Florence. Army sanitary administration and its reform under the late Lord Herbert. London: McCorquodale; 1862. Disponível em: https://archive.org/details/armysanitaryadmi00nigh/page/n3/mode/2up. Acesso em: 16 maio 2021.
https://archive.org/details/armysanitary...
) reutilizou a metodologia de Graunt (1676) para coletar e analisar os dados de mortalidade por ela observados? Sua formação em matemática possibilita tal elocubração e torna plausível tal hipótese sobre o assunto.

De fato, verifica-se que a cultura da publicação de dados vem sendo construída de forma distinta entre as áreas do conhecimento, e, de acordo com relatório publicado por Swan e Brown (2008SWAN, Alma.; BROWN, Sheridan. To share or not to share: publication and quality assurance of research data outputs. Report commissioned by the research information network. [s.l.]: JISC: Natural Environment Research Council, 2008. Disponível em: https://eprints.soton.ac.uk/266742/1/Published_report_-_main_-_final.pdf. Acesso em: 07 jan. 2022.
https://eprints.soton.ac.uk/266742/1/Pub...
, p. 12, tradução nossa), que aborda a visão dos pesquisadores sobre a publicação de dados:

Algumas disciplinas estão bem à frente de órgãos de financiamento no sentido de que eles têm uma cultura de compartilhamento de dados por um longo tempo e desenvolveram uma infraestrutura e métodos para o fazer. Em outras disciplinas, o compartilhamento de dados não é comum e portanto, as políticas do financiador podem implicar em modificações significativas nas atitudes e no comportamento dos pesquisadores.

Cronin (2013CRONIN, Blaise. Thinking about data. JASIST, [s.l.], v. 64, n. 3, p. 435-436, 2013. DOI https://doi.org/10.1002/asi.22928.
https://doi.org/10.1002/asi.22928...
, p. 435, tradução nossa) percebe a diversidade cultural que permeia a prática da publicação de dados ao compreender que:

Diferentes campos têm convenções mais ou menos bem estabelecidas para contabilizar o uso de dados, desde a captura e rotulagem até publicação (incluindo o processo de revisão por pares) preservação, acesso, compartilhamento e redirecionamento. [...] Mas muitos campos não têm tipos de dados consistentes ou repositórios específicos para promover prática padrões. Geralmente em domínios de natureza altamente interdisciplinares, poliparadigmáticos, cujas definições e condições de contorno geralmente são confusas.

Nos últimos anos, novos fluxos de trabalho envolvendo os dados de pesquisa foram sendo implementados, permitindo assim que novas modalidades de comunicação na ciência e disseminação da informação fossem exploradas pela comunidade científica. Cabe ressaltar que o modelo editorial atual determina as regras e padrões para publicação do conhecimento que não existia em outros períodos históricos. Com isso, passou-a se publicar apenas o resultado da pesquisa e invisibilizando a matéria prima (os dados da pesquisa) que subsidiaram a investigação e resultados.

4 CONSIDERAÇÕES FINAIS

A propagação de uma cultura voltada para a gestão e prática da publicação de dados de pesquisa requer inúmeros esforços institucionais, econômicos, tecnológicos e humanos, além de conceber a ciência de forma aberta e acessível a todos. Empreende um conceito livre e colaborativo para as descobertas científicas, com propósitos e aplicações para a sociedade como um todo.

A finalização desta trilha histórica reafirmou o caráter de transformação e evolução da prática de publicação de dados ao longo dos tempos. Permitiu atribuir ao pesquisador ou ao produtor do dado o caráter inovador da prática, considerando as condições de registro do período. Descartou o caráter de novidade da prática, atribuída por muitos autores ao período contemporâneo. Verificou que as formas de registros e inscrições foram sendo modificadas e melhoradas de acordo com a tecnologia correspondente ao período, e, por último, reafirmou a prática enquanto instrumento de sobrevivência e forma de salvaguardar a memória para a posteridade.

Finalmente compreende que a proposta para publicação de dados de pesquisa no contexto da Ciência Aberta, enquanto modo de comunicação científica, encontra-se em processo de apropriação e experimentação nacional e internacional entre pares. No Brasil já é uma e vem se consolidando dia após dia, principalmente por meio dos repositórios de dados institucionais.

REFERÊNCIAS

  • 1
    Cf. Almeida (2002ALMEIDA, Manoel de Campos. Talhas numéricas e o antigo testamento. Revista Brasileira de História da Matemática, [s.l.], v. 2, n. 4, p. 119-139, 2002. DOI: 10.47976/RBHM2002v2n4119-139.
    https://doi.org/10.47976/RBHM2002v2n4119...
    ); Santos (2019SANTOS, Carla. Os números primos de Ishango. Revista Brasileira Multidisciplinar, Araraquara, v. 22, n. 2, 2019. DOI: 10.25061/2527-2675/ReBraM/2019.v22i2.638.
    https://doi.org/10.25061/2527-2675/ReBra...
    ); Fuhr e Campos (2017FUHR, Ingrid Lilian; CAMPOS, Mauro Forlan Duarte. As origens da Matemática e os variados modos de operação com seus conceitos. Projeção e docência, [s.l.], v. 8, n. 1, p. 79-90, 2017. Disponível em: https://revista.faculdadeprojecao.edu.br/index.php/Projecao3/article/viewFile/778/715.%20Acesso%20em:%2006%20nov.%202018. Acesso em: 09 abr. 2023.
    https://revista.faculdadeprojecao.edu.br...
    ).
  • 2
    A definição proposta pela Library of Congress considera que o objetivo principal da carta era retratar com a maior precisão possível os litorais e os portos, razão pela qual eram chamadas de portulanas (Carta portulana, [entre 1502 e 1506]).

Datas de Publicação

  • Publicação nesta coleção
    05 Ago 2024
  • Data do Fascículo
    2023

Histórico

  • Recebido
    27 Abr 2023
  • Aceito
    26 Out 2023
Escola de Ciência da Informação da UFMG Antonio Carlos, 6627 - Pampulha, 31270- 901 - Belo Horizonte -MG, Brasil, Tel: 031) 3499-5227 , Fax: (031) 3499-5200 - Belo Horizonte - MG - Brazil
E-mail: pci@eci.ufmg.br