Acessibilidade / Reportar erro

A distribuição do conhecimento científico público em informação, comunicação e informática em saúde indexado nas bases de dados MEDLINE e LILACS

Public scientific knowledge distribution in health information, communication and information technology indexed in MEDLINE and LILACS databases

Resumos

Este artigo apresenta estudo exploratório sobre a distribuição da produção científica internacional, regional e nacional na área de informação e comunicação em saúde, referenciada nas bases de dados MEDLINE e LILACS, de 1996 a 2005. Para a seleção dos artigos, foi usada a estrutura hierárquica do vocabulário DeCS na área de Ciência da Informação. Foram determinados quatro domínios específicos: informação em saúde, informática médica, comunicação científica em saúde e comunicação em saúde. As variáveis analisadas foram: os assuntos e periódicos mais representativos, a produção por país de afiliação dos autores e por país de publicação e os idiomas, em ambas as bases de dados. Cerca de 5% dos artigos correspondeu à categoria Ciência da Informação. Os quatro domínios tiveram aumento relativo anual em MEDLINE. O domínio Informática Médica foi o que apresentou maior número de registros em MEDLINE, representando pouco mais da metade de todos os artigos indexados. A importância da Ciência da Informação é mais visível nas publicações dos países desenvolvidos e os resultados confirmaram a predominância dos Estados Unidos e o crescimento significativo da produção científica da China e Coréia do Sul e, em menor escala, do Brasil.

Ciência da informação; Informação em saúde; Informática médica; Comunicação científica em saúde; Comunicação em saúde; Produção científica


This study explores the distribution of international, regional and national scientific output in health information and communication, indexed in the MEDLINE and LILACS databases, between 1996 and 2005. A selection of articles was based on the hierarchical structure of Information Science in MeSH vocabulary. Four specific domains were determined: health information, medical informatics, scientific communications on healthcare and healthcare communications. The variables analyzed were: most-covered subjects and journals, author affiliation and publication countries and languages, in both databases. The Information Science category is represented in nearly 5% of MEDLINE and LILACS articles. The four domains under analysis showed a relative annual increase in MEDLINE. The Medical Informatics domain showed the highest number of records in MEDLINE, representing about half of all indexed articles. The importance of Information Science as a whole is more visible in publications from developed countries and the findings indicate the predominance of the United States, with significant growth in scientific output from China and South Korea and, to a lesser extent, Brazil.

Information science; Healthcare information; Medical informatics; Health Sciences communication; Health communication; Scientific production


ARTIGO ARTICLE

A distribuição do conhecimento científico público em informação, comunicação e informática em saúde indexado nas bases de dados MEDLINE e LILACS

Public scientific knowledge distribution in health information, communication and information technology indexed in MEDLINE and LILACS databases

Abel Laerte Packer; Adalberto Otranto Tardelli; Regina Célia Figueiredo Castro

BIREME/OPAS/OMS, Centro Latino-americano e do Caribe de Informação em Ciências da Saúde. Rua Botucatu 862, Vila Clementino. 04023-901 São Paulo SP. packerab@bireme.ops-oms.org

RESUMO

Este artigo apresenta estudo exploratório sobre a distribuição da produção científica internacional, regional e nacional na área de informação e comunicação em saúde, referenciada nas bases de dados MEDLINE e LILACS, de 1996 a 2005. Para a seleção dos artigos, foi usada a estrutura hierárquica do vocabulário DeCS na área de Ciência da Informação. Foram determinados quatro domínios específicos: informação em saúde, informática médica, comunicação científica em saúde e comunicação em saúde. As variáveis analisadas foram: os assuntos e periódicos mais representativos, a produção por país de afiliação dos autores e por país de publicação e os idiomas, em ambas as bases de dados. Cerca de 5% dos artigos correspondeu à categoria Ciência da Informação. Os quatro domínios tiveram aumento relativo anual em MEDLINE. O domínio Informática Médica foi o que apresentou maior número de registros em MEDLINE, representando pouco mais da metade de todos os artigos indexados. A importância da Ciência da Informação é mais visível nas publicações dos países desenvolvidos e os resultados confirmaram a predominância dos Estados Unidos e o crescimento significativo da produção científica da China e Coréia do Sul e, em menor escala, do Brasil.

Palavras-chave: Ciência da informação, Informação em saúde, Informática médica, Comunicação científica em saúde, Comunicação em saúde, Produção científica

ABSTRACT

This study explores the distribution of international, regional and national scientific output in health information and communication, indexed in the MEDLINE and LILACS databases, between 1996 and 2005. A selection of articles was based on the hierarchical structure of Information Science in MeSH vocabulary. Four specific domains were determined: health information, medical informatics, scientific communications on healthcare and healthcare communications. The variables analyzed were: most-covered subjects and journals, author affiliation and publication countries and languages, in both databases. The Information Science category is represented in nearly 5% of MEDLINE and LILACS articles. The four domains under analysis showed a relative annual increase in MEDLINE. The Medical Informatics domain showed the highest number of records in MEDLINE, representing about half of all indexed articles. The importance of Information Science as a whole is more visible in publications from developed countries and the findings indicate the predominance of the United States, with significant growth in scientific output from China and South Korea and, to a lesser extent, Brazil.

Key words: Information science, Healthcare information, Medical informatics, Health Sciences communication, Health communication, Scientific production

Introdução

O conhecimento científico e técnico em saúde tem nos periódicos o seu principal meio de publicação, com controles de qualidade exercidos, entre outros, pela sua indexação em bases de dados bibliográficas. Essas bases registram, por meio de metadados de artigos científicos e outros tipos de textos (editoriais, cartas, etc.), o conhecimento público atualizado e acumulado ao longo dos anos.

Em ciências da saúde, a principal base de dados bibliográfica internacional é a MEDLINE, coordenada pela National Library of Medicine (NLM) dos Estados Unidos, que é complementada na América Latina e Caribe pela LILACS - Literatura Latino-americana e do Caribe de Informação em Ciências da Saúde, um produto cooperativo coordenado pela BIREME/OPAS/OMS - Centro Latino-americano e do Caribe de Informação em Ciências da Saúde, pertencente à Organização Pan-americana da Saúde. Nestas bases de dados, estão representados os conjuntos mais relevantes da produção científica internacional e regional da América Latina e Caribe. Ambas são operadas com acesso aberto na Biblioteca Virtual em Saúde (BVS).

Além da recuperação de artigos, as bases de dados bibliográficas são fontes de informação que permitem estimar a produção científica nas diferentes áreas do conhecimento em saúde, identificar suas características e observar sua evolução ao longo dos anos nos distintos países, com base nos metadados de autores, país de afiliação institucional, título do periódico, ano de publicação, resumo e assuntos. Entretanto, as bases MEDLINE e LILACS são limitadas no registro da afiliação dos autores, assim como não incluem as referências bibliográficas recebidas pelos artigos, de modo que não é possível realizar estudos de citações, como se faz tradicionalmente com as bases do ISI, da Thomson Scientific, e mais recentemente com SciELO.

Este artigo apresenta um estudo exploratório sobre a distribuição da produção científica na área de informação, comunicação e informática em saúde, referenciada nas bases de dados MEDLINE e LILACS entre os anos 1996 e 2005, situando essa produção no cenário internacional.

Métodos

O universo de registros da produção científica internacional, regional e nacional na área de informação, comunicação e informática em saúde foi definido a partir de recuperação nas bases de dados MEDLINE e LILACS, disponíveis em março de 2006 na Biblioteca Virtual em Saúde, correspondente ao período de dez anos entre 1996 e 2005.

Considerou-se somente a produção científica publicada em periódicos, na forma de artigos e outras comunicações, pois a base de dados MEDLINE indexa apenas esse tipo de documentos. Na base LILACS, que registra todos os tipos de documentos bibliográficos, foi feita seleção dos registros correspondentes a artigos de periódicos.

Fontes de informação

A base MEDLINE é um subconjunto da base PubMed, que indexa, além de periódicos selecionados para indexação sistemática no subconjunto MEDLINE, outros títulos que publicam esporadicamente artigos de interesse em ciências da saúde. Para recuperação de registros, considerou-se apenas o conjunto dos periódicos da MEDLINE, que, em dezembro de 2005, correspondia a 4.959 títulos.

A base LILACS indexava, em dezembro de 2005, 696 periódicos. Os artigos de periódicos na LILACS correspondem a 77% dos registros da base de dados.

As bases de dados são atualizadas semanalmente na BVS. O total de registros para o período 1996-2005 pode mudar a cada atualização, à medida que artigos publicados nessas datas sejam indexados com atraso nas bases de dados.

Os artigos indexados nas bases de dados são representados por metadados bibliográficos e por descritores, que representam os assuntos discutidos, atribuídos por processo manual por profissionais da área da saúde e de ciência da informação. Os descritores são utilizados tanto na formulação de pesquisas bibliográficas como em estudos bibliométricos e cienciométricos. Nas bases MEDLINE e LILACS, os descritores são extraídos respectivamente dos vocabulários Medical Subject Headings (MeSH), gerido pela NLM, e Descritores em Ciências da Saúde (DeCS), sua versão em português e espanhol, administrado pela BIREME. Esses vocabulários foram utilizados neste estudo para a identificação dos documentos relacionados com informação, comunicação e informática em saúde.

Neles, os descritores são classificados e organizados em hierarquias, do geral para o específico, em quinze categorias temáticas, tais como: Anatomia, Organismos, Doenças, Assistência à Saúde. O DeCS tem quatro categorias adicionais criadas para a indexação da literatura da América Latina e Caribe, mas que não foram consideradas neste estudo.

A estrutura desses vocabulários é complexa e os descritores podem estar classificados em mais de uma hierarquia. Por exemplo, o descritor Linguagem aparece na hierarquia de Comunicação em duas categorias: Ciência da Informação e Psicologia e Psiquiatria, representando o meio, verbal ou não-verbal, de comunicar idéias ou sentimentos. O descritor Mortalidade está incluído em sete hierarquias: na categoria de Saúde Pública, sob Demografia e sob Bioestatística; na categoria de Técnicas e Equipamentos, sob Métodos epidemiológicos; na categoria de Ciências Biológicas, novamente sob Demografia e Métodos Epidemiológicos; na categoria de Ciência da Informação, sob Coleta de Dados; e na categoria de Assistência à Saúde, sob Demografia. Dependendo do número de hierarquias a que os descritores pertencem, os registros recuperados podem ser classificados em mais de uma categoria. Assim, o descritorLinguagem em um registro indica que um artigo pertence tanto à categoria de Ciência da Informação quanto à dePsicologia e Psiquiatria. Informação adicional é necessária para resolver a ambigüidade, que pode exigir mecanismos sofisticados de recuperação.

Os descritores que caracterizam as áreas de informação, comunicação e informática em saúde estão representados na categoria L01 – Ciência da Informação. O primeiro nível hierárquico dessa categoria é representado pelos seguintes descritores: Colecionamento de Livros; Cronologia; Classificação; Comunicação; Meios de Comunicação; Segurança (computação); Processos de Cópia; Coleta de Dados; Centros de Informação; Gerenciamento de Informação; Serviços de Informação; Armazenamento e Recuperação da Informação; Teoria da Informação; Biblioteconomia; Informática Médica; Reconhecimento de Padrão; Editoração; Análise de Sistemas.

Deve-se destacar que, independentemente de sua representação em uma categoria específica do DeCS, a informação e a informática têm caráter transversal e perpassam as demais categorias. De fato, todos os registros indexados nas bases de dados MEDLINE e LILACS representam em si informação e comunicação em saúde. Neste estudo, tratou-se da informação e informática em saúde como objeto da pesquisa publicada ou como aplicação de métodos e técnicas em pesquisas de outras áreas do conhecimento em saúde. Em termos práticos, foram considerados os registros com pelo menos um descritor da categoria L01 - Ciência da Informação.

Delimitação da área de informação e informática em saúde

Para caracterizar a área de informação, comunicação e informática em saúde, foram definidos quatro subconjuntos da categoria de Ciência da Informação, denominadas neste estudo como domínios:informação em saúde, informática médica, comunicação científica em saúdeecomunicação em saúde. Cada um destes domínios caracteriza-se pelo tipo de fonte de informação, pelas metodologias e tecnologias que são utilizadas e pelos públicos envolvidos na produção e operação dos fluxos de informação.

O domínio deInformação em Saúde inclui artigos que estudam, utilizam, coletam ou geram informação de tipo epidemiológico, demográfico de pesquisas ou censos, estatísticas vitais, e informação de suporte à vigilância em saúde, à gestão, operação e avaliação de serviços de saúde.

Informática médica (ou Informática em saúde) refere-se a artigos que fazem referência a tecnologias de informação e métodos computacionais em processos relacionados com saúde individual e coletiva. Atualmente, o domínio foi enriquecido com o termo eHealth, que se refere em geral à saúde e tecnologia, mas não há consenso sobre sua definição1 e o termo ainda não existe nos vocabulários MeSH e DeCS.

Comunicação Científica refere-se a artigos que tratam da produção do fluxo de informação científica, incluindo a preparação e submissão de manuscritos, a revisão por pares, edição e publicação, documentação e indexação, sistemas de armazenamento e recuperação de informação, bases de dados, bibliometria e avaliação, bibliotecas, desenvolvimento de coleções, preservação, disseminação.

Comunicação em Saúde refere-se ao domínio dos artigos que tratam da comunicação e difusão de informação entre e para indivíduos e grupos e inclui também comunicação tecnológica.

Para identificar os conceitos pertinentes a cada domínio, consideramos os 362 descritores listados na categoria de Ciência da Informação do vocabulário DeCS, num total de 449 hierarquias, separando grupos de descritores relacionados. O descritor Ciência da Informação, que encabeça a categoria, é definido no DeCS como "o campo do conhecimento, teoria, e tecnologia que lida com a coleção de fatos e números, e os processos e métodos envolvidos em sua manipulação, estocagem, disseminação, publicação e recuperação. Inclui os campos da comunicação, editoração, biblioteconomia e informática".

A identificação dos domínios constituiu uma das principais limitações deste estudo devido à ambigüidade de muitos descritores, que aparecem em mais de uma categoria ou em mais de um ramo hierárquico de uma mesma categoria. Descritores como Sistemas de informação, Disseminação de Informação, Registro e Armazenamento de Dados, Internet, para citar alguns, são representados nas hierarquias relacionadas a quase todos os domínios. Mesmo em ramos hierárquicos aparentemente específicos, foram encontrados conceitos com ambigüidades, como Bases de dados bibliográficas e seus específicos (MEDLARS, MEDLINE, PUBMED, etc.) presentes em Comunicação Científica e Informática médica; ou Acervo de Biblioteca, em Comunicação Científica e Meios de Comunicação. Outras vezes, na própria definição do DeCS, o conceito corresponde a mais de um domínio, como por exemplo, Armazenamento e Recuperação da Informação é definido como "um ramo da ciência da computação ou ciência de bibliotecas relativo ao armazenamento, localização, procura e seleção [...]", isto é, se aplica tanto à Comunicação Científica quanto à Informática médica. Foi decidido manter a ambigüidade gerada pelos descritores que aparecem em mais de uma categoria.

Uma vez definidos os conjuntos de descritores de cada domínio, foram formuladas estratégias de busca, que foram aplicadas nas bases MEDLINE e LILACS, disponíveis na BVS, resultando em conjuntos específicos de registros de artigos de periódicos. Os descritores foram recuperados somente no campo de descritores primários, isto é, quando o descritor corresponde ao conceito central do documento.

A esses conjuntos foi aplicada metodologia de classificação dos descritores recuperados, por freqüência de registros na base, por relevância em relação aos descritores do domínio e por ordem hierárquica, segundo metodologia desenvolvida pela BIREME2.

Para visualização, ordenação e tabulação dos registros recuperados, foi preparada uma interface própria, que permitiu refinar as estratégias e classificar os resultados.

Identificação dos países de afiliação dos autores

A identificação do país de afiliação dos autores foi feita de maneira aproximada, devido a limitações das próprias bases de dados: a base MEDLINE, por exemplo, somente registra o país de afiliação para o primeiro autor, o que não permite identificar a afiliação dos demais autores. Desta forma, a produção medida por país refere-se ao primeiro autor. Além disso, o registro da afiliação é copiado do texto original do artigo e o país não tem um campo específico e normalizado, o que implica a necessidade de recorrer, em muitos casos, à pesquisa de informação adicional para identificação do país através de similaridade de textos e de regras de associação, segundo metodologia desenvolvida pela BIREME3.

A base LILACS registra o país de todos os autores, mas passou a incluir essa informação somente em registros indexados a partir do ano 2000. Sendo assim, a informação sobre afiliação na LILACS foi analisada a partir dessa data.

Tabulação dos resultados

Os resultados foram tabulados por:

. evolução ano a ano do total de registros recuperados em cada domínio, bem como sua representação no total dos registros indexados em cada base de dados;

. temas em destaque na produção científica de cada domínio, a partir dos descritores com maior número de registros;

. periódicos onde foram publicados artigos em cada domínio, por assunto e por país de publicação;

. países de afiliação dos autores, para comparação da produção científica brasileira, com a de países da Iberoamérica (Argentina, Chile, Colômbia, Cuba, México, Espanha e Portugal), países em desenvolvimento (África do Sul, China, Coréia do Sul e Índia) e países desenvolvidos (Estados Unidos, Inglaterra, Alemanha, Canadá, Japão e França);

. idioma das publicações.

Resultados

Em março de 2006, foram recuperados 4.906.843 registros na base MEDLINE e 154.014 na LILACS, correspondentes a artigos originais e de revisão e outras comunicações como cartas, editoriais, comentários, etc. (em adiante todos referidos como artigos), publicados entre 1996 e 2005. A partir dessa data, foram ingressados novos artigos publicados no mesmo período em ambas as bases.

A Tabela 1 apresenta a distribuição desses conjuntos de registros nas quinze categorias temáticas do DeCS. Os registros bibliográficos na base MEDLINE contêm uma média de 3,55 descritores por artigo e na LILACS, 3,18. Um artigo pode estar indexado em múltiplas categorias, devido ao uso de dois ou mais descritores de categorias diferentes ou de um mesmo descritor que pertence a duas categorias.

As áreas com maior produção científica indexada na MEDLINE são Doenças, Compostos Químicos e Drogas, e Ciências Biológicas, as duas primeiras presentes com pelo menos um descritor em cerca de 50% dos registros. Na LILACS, as três áreas com maior número de artigos são Doenças, Técnicas e Equipamento, e Compostos Químicos e Drogas, sendo que descritores da categoria Doenças aparecem em 53% dos registros. As categorias com menor número de publicações indexadas, em ambas as bases, sãoLocalizações Geográficas, Humanidades, Tecnologia e Alimentos e Bebidas, relacionadas em menos de 4% dos registros.

As diferenças mais significativas entre a produção internacional indexada na MEDLINE e a regional na LILACS encontram-se nas categorias Compostos Químicos e Drogas e Anatomia, mais presentes na primeira nas seguintes porcentagens: 48% e 19% e 26% e 15%, respectivamente. Proporcionalmente, a LILACS contém 30% mais registros que MEDLINE nas categorias Saúde Pública e Doenças.

Os artigos relativos à informação, comunicação e informática em saúde, reunidos na categoria Ciência da Informação, objeto deste estudo, correspondem a cerca de 5% dos artigos registrados no período nas duas bases. Entretanto, a distribuição ao longo dos dez anos, assim como nos últimos anos, variam entre a MEDLINE e LILACS (Tabela 2). Enquanto na produção internacional ocorre um crescimento na participação relativa de Ciência da Informação no conjunto da MEDLINE, na LILACS é praticamente constante ao longo do período.

Em números absolutos, entre as quinze categorias do DeCS, as mais relacionadas com Ciência da Informação são Ciências Biológicas, Técnicas e Equipamentos, Saúde Pública e Doenças, embora variem as proporções (Tabela 1). Na base MEDLINE, as categorias Ciências Biológicas, Técnicas e Equipamentos, e Saúde Pública aparecem associadas a 35% dos artigos indexados em Ciência da Informação, e Doenças a 25%. Na LILACS, Ciências Biológicas, Saúde Pública, e Doenças aparecem em torno de 35% dos registros e Técnicas e Equipamentos, em 28%. Observa-se que os registros de Ciência de Informação aparecem associados a descritores de outras categorias em maior proporção que a descritores da própria categoria de Ciência da Informação, o que ocorreu em 26% do total na MEDLINE e na LILACS, 24%.

Entretanto, as categorias que apresentam maior presença de artigos relacionados com Ciência da Informação são Saúde Pública e Ciências Físicas, que ocorrem em cerca de 10%, ou seja, o dobro da presença relativa de Ciência da Informação na base de dados. E as categorias Doenças, Compostos Químicos e Drogas, Anatomia e Organismos, que têm maior presença de artigos nas bases de dados, apresentam menos de 3% dos seus registros relacionados com Ciência da Informação.

Entre os anos 1996 e 2004, o número de registros na MEDLINE aumentou 34%, a uma taxa de crescimento média anual de 3,7%, passando de 421.600 em 1996 a 564.440 em 2004 (Tabela 2).

Nesse período, os artigos relacionados com Ciência da Informação aumentaram 91%, passando de 16.342 para 31.264. Se for considerado o período de dez anos entre 1996 e 2005, a presença relativa anual dessa categoria no conjunto da MEDLINE passou de 3,8% em 1996 para 5,8% em 2005. Este crescimento é ainda mais acentuado nos três anos entre 2002 e 2004, com uma taxa média de 7%, enquanto a média de crescimento da base foi de 4%.

Em contraste, na LILACS, o crescimento de artigos em Ciência da Informação relativo ao total da base é praticamente nulo.

Os quatro domínios de Ciência da Informação definidos no estudo tiveram aumento relativo anual de registros em relação ao total da MEDLINE, em praticamente todos os anos entre 1996 e 2005: informação em saúde cresceu 16%, informática médica, 62%, comunicação científica, 32% e comunicação em saúde, 34%. Informática médica teve o crescimento mais significativo em sua representatividade na MEDLINE, principalmente a partir de 2001, superando 10% ao ano, mais de três vezes o crescimento anual de registros na MEDLINE (Gráfico 1).


Os dez descritores que mais ocorrem na categoria de Ciência da Informação do DeCS e em cada domínio são apresentados na Tabela 3, com as respectivas frequências de ocorrência. Os resultados mostram uma distribuição consistente dos descritores por domínio. Cinco descritores ocorrem em mais de um domínio: Sistemas Computadorizados de Registros Médicos, Bases de dados Factuais, Internet, Terminologia e Redação.

O descritor Internet tem a seguinte evolução na base de dados MEDLINE: foi criado em 1995, mas, desde 1989, 360 artigos recuperados utilizaram a palavra Internet nos títulos ou resumos de artigos. Em 1995, o descritor foi utilizado em apenas dois registros; em 1996, em 19; em 1997, em 24; apenas em 1998 passou a ser amplamente adotado pelos indexadores, com 902 artigos, que representaram 0,2% dos registros da base e 4,6% dos registros de Ciência da Informação. A partir de 1999, a participação relativa desse descritor se mantém em torno de 0,5% no total da base, com exceção do ano 2000, quando passou a 0,6%. Na área de Ciência de Informação, a participação relativa do descritor tem variado: 11,1% em 1999, 13,5% em 2000, 12,2% em 2001, 10,4% em 2002, mantendo-se a partir daí em torno de 9%.

De forma similar, pode-se observar a evolução do termo eHealth ou e-health na base de dados MEDLINE. O termo foi descrito pela primeira vez em um artigo publicado no Journal of Medical Internet Research, em 2000, que relata seu aparecimento após o evento eHealth Ethics Summit, realizado em Washington, DC, Estados Unidos, organizado pela Internet Healthcare Coalition, com apoio da Organização Pan-americana da Saúde. No ano de 2000, foram recuperados 66 artigos que utilizaram esse termo nos títulos ou resumos e, em 2005, 111. Mas, como a freqüência de ocorrência ainda é baixa, o termo não foi até o momento incorporado ao vocabulário MeSH. Os descritores mais utilizados para indexar os artigos onde aparecem os termos e-health ou eHealth foramInternete Telemedicina.

Considerando os assuntos utilizados para classificar os títulos de periódicos, que proporcionam uma visão mais ampla, o conjunto dos artigos indexados em Ciência da Informação foram publicados em títulos de Informática médica, Medicina, e Serviços de saúde, abarcando 26% do total dos registros (Tabela 4). Em cada domínio, seis ou sete assuntos de periódicos concentram 50% dos artigos indexados. Os assuntos Medicina e Serviços de saúde estão presentes nos quatro domínios; Informática médica e Enfermagem, em três.

No domínio de Informação em saúde, destacam-se periódicos de Serviços de saúde, Enfermagem, Saúde pública e Epidemiologia. Periódicos de Informática médica publicam 17% dos artigos do domínio de Informática médica, a mais alta porcentagem de freqüência de assunto de periódico registrada nos quatro domínios; em seguida, Serviços de saúde, Engenharia biomédica, Diagnóstico por imagem e Radiologia. No domínio de Comunicação científica, têm maior frequência os assuntos Medicina, Informática médica e Ciência (Tabela 4).

O caráter multidisciplinar dos artigos indexados na categoria de Ciência da Informação é revelado também pela quantidade de periódicos em que foram publicados. Assim, os 233.130 artigos indexados em Ciência de Informação na base de dados MEDLINE foram publicados em 5.951 periódicos e os 7.198 registros na LILACS, em 722, que correspondem à quase totalidade de periódicos indexados nessas bases no período analisado. Os artigos de Informação em saúde foram publicados em 4.144 periódicos (70% do total), de Informática médica, em 4.974 (84%), de Comunicação científica, em 4.386 (74%) e de Comunicação em saúde, em 4.068 (68%).

Considerando os periódicos indexados na base MEDLINE que publicaram 50% dos artigos relacionados com Ciência da Informação, foram encontrados 280 títulos diferentes no domínio de Informação em Saúde, 192 em Informática Médica, 265 em Comunicação Científica e 285 em Comunicação em Saúde. Para LILACS, o número de títulos por domínio são, respectivamente, 63, 64, 48 e 46.

Ao considerar os 77 periódicos que publicaram 25% dos artigos, observa-se que 17 (22%) são do domínio de Informática Médica (Studies in health technology and informatics, Bioinformatics, Health management technology, Journal of telemedicine and telecare, Journal of AHIMA, Healthcare informatics, Proceedings of the American Medical Informatics Association Symposium, etc.). Entre estes 77 títulos, destacam-se os periódicos de maior cobertura científica como BMJ, Nature, Science, Lancet, JAMA e Proceedings of the National Academy of Sciences, que em conjunto respondem por 3% da produção científica desse domínio.

Na base MEDLINE, foram recuperados artigos publicados em 69 periódicos classificados em Informática médica e 4 em Ciência da Informação. Na LILACS, há apenas um periódico de Informática Médica (Informática médica, da Argentina) e um de Ciência da Informação (ACIMED, de Cuba).

Com relação à distribuição geográfica de afiliação dos autores, os artigos de Ciência da Informação registrados na base de dados MEDLINE, de 1996 a 2005, foram publicados por autores de 168 países, considerando somente o primeiro autor. Na LILACS, foram identificados autores de 93 países, incluindo todos os autores. A distribuição total da afiliação dos autores por países é altamente concentrada, sendo que na MEDLINE autores de seis países publicaram mais de 50% dos registros: Estados Unidos, Inglaterra, Alemanha, Canadá, Japão e França, em ordem decrescente de freqüência. Em LILACS, autores do Brasil, Cuba, Argentina, Chile e Venezuela publicaram 86% do total de artigos de Ciência da Informação.

A distribuição dos artigos na área de Ciência da Informação na base MEDLINE por países de afiliação dos autores é apresentada na Tabela 5. Foram considerados os seis países com maior número de artigos, os países ibero-americanos e, para efeitos de comparação, a África do Sul, China, Coréia do Sul e Índia. De 1996 a 2004, os seis países com maior produção registrada na base MEDLINE em Ciência da Informação permaneceram os mesmos e na mesma proporção e todos tiveram a sua participação relativa aumentada em Ciência da Informação. Por outro lado, todos tiveram a participação relativa diminuída no total da base, menos acentuada no caso do Canadá e Alemanha.

Os autores ibero-americanos publicam nos periódicos indexados na base MEDLINE menor proporção de artigos relacionados à Ciência da Informação que a outras áreas da saúde. Mesmo assim, a participação relativa da América Latina aumentou significativamente entre 1996 e 2004, com uma variação positiva de 167% em Ciência da Informação, superior à taxa de crescimento de 67% relativa à base toda. O Brasil é o único país latino-americano que apresenta crescimento sistemático em Ciência da Informação no conjunto da MEDLINE.

A produção brasileira na base MEDLINE, medida pela afiliação do primeiro autor para todo o período, representa 0,91% de toda a base e 0,61% dos registros indexados na categoria Ciência da Informação. Em 2004, a participação relativa foi 1,24% no total da base e 0,86% em Ciência da Informação, um aumento de 160% e 133% , respectivamente. Entre 2002 e 2004, o aumento de artigos de autores brasileiros foi de 15% na base toda e de 20% em Ciência da Informação, o que coincide com a taxa de crescimento médio mundial da categoria.

O México, que é o segundo país em número de publicações científicas da América Latina e Caribe indexadas na MEDLINE, teve para todo o período de 1996 a 2005 uma participação relativa de 0,16% em Ciência da Informação, que corresponde a cerca da metade da sua participação na base toda (0,33%), com crescimento de 30% entre 1996 e 2004 no total da base e sem crescimento em Ciência da Informação. O terceiro país da América Latina com mais artigos, a Argentina, atingiu em 2004 uma participação relativa de 0,12% em Ciência da Informação, inferior aos 0,30% na base toda, com crescimento respectivo de 57% e 24%, aquém da média da região. O Chile, o quarto país com maior produção científica na América Latina e Caribe registrada na MEDLINE, apresentou o menor crescimento nesse grupo de países (Tabela 5).

A China e Coréia do Sul apresentam um crescimento extraordinário, tanto no que se refere à participação relativa em toda a base MEDLINE (188,4% e 307,8%, respectivamente) quanto na categoria Ciência da Informação, ultrapassando a cifra de 750%. Contrastando, o crescimento da Índia foi de 38,7% na base toda e 10,8% em Ciência da Informação. Entretanto a participação relativa em informação está ainda abaixo da média mundial de 5%.

A distribuição dos artigos em Ciência da Informação na MEDLINE, tomando por base o país de afiliação do primeiro autor e o país de publicação do periódico, revela que os autores dos Estados Unidos publicam cerca de 80% dos seus artigos em periódicos americanos. Em contraste, os autores do Canadá, França e Japão publicam, respectivamente, 16%, 26% e 30% em periódicos do próprio país; no total da base esses países publicam 13%, 28% e 30%, respectivamente, em periódicos nacionais. Na América Latina, nos cinco principais países produtores de artigos da categoria Ciência da Informação, a porcentagem de artigos publicados nos países de origem dos autores varia consideravelmente: Argentina, 12,6%; Brasil, 44%; Chile, 50%; Colômbia, 13 %. No total da base, a proporção de artigos publicados em periódicos nacionais é menor para Brasil (30%), Chile (29%) e Colômbia (11%) e se mantém para Argentina. Os autores brasileiros publicaram em periódicos de 24 países, com maior porcentagem de artigos em periódicos dos Estados Unidos (26%) e Inglaterra (14%), que juntamente com os publicados no Brasil somam 84%.

Na LILACS, a distribuição dos registros por país de afiliação dos autores e país de publicação revela que em média 79% dos artigos sobre Ciência da Informação foram publicados em periódicos nacionais; 10 países publicaram mais de 90% dos artigos em periódicos nacionais (Argentina, Bolívia, Brasil, Colômbia, Costa Rica, Cuba, Honduras, Jamaica, Porto Rico e Venezuela) e 2, menos que a média: Equador (71%) e Uruguai (52%). Equador e Uruguai têm, respectivamente, 14 e 10 periódicos indexados na LILACS. Os autores brasileiros publicaram 99% dos artigos de Ciência da Informação em 253 periódicos nacionais. Os periódicos brasileiros que publicaram 25% da produção brasileira foram: Cadernos de Saúde Pública, Revista de Saúde Pública, Pro-Fono, Femina, Revista Latino-americana de Enfermagem, Revista Brasileira de Enfermagem, Revista Brasileira de Epidemiologia e Psicologia: reflexão e crítica.

Finalmente, com relação aos idiomas dos textos, na MEDLINE predomina o inglês em 90% dos registros na categoria de Ciência da Informação, seguido do alemão (2,6%), francês (1,5%) e espanhol (1,1%). Estas cifras se aproximam da distribuição na base toda: inglês (90%), alemão e francês (1,6% cada) e espanhol (1,2%). Na LILACS, o inglês é menos utilizado (13% dos registros) e as publicações são predominantemente em espanhol (49%) e português (40%), o que evidencia o seu caráter regional.

Discussão

O estudo abordou a amplitude da categoria de Ciência da Informação na pesquisa científica em saúde indexada nas bases MEDLINE e LILACS, compondo quatro subconjuntos ou domínios, que na prática se traduzem em disciplinas e campos profissionais diferentes. A distribuição dos registros nestes quatros domínios revelou consistência no contexto de cada uma das bases de dados, considerando o caráter internacional da MEDLINE com predominância da produção científica dos Estados Unidos e o caráter regional da LILACS com predominância do Brasil.

Embora as fronteiras temáticas da categoria de Ciência da Informação no MeSH possam ser criticadas, a sua estrutura de descritores permitiu identificar um conjunto de artigos e das relações com as demais categorias temáticas de saúde representadas nesse vocabulário. Em estudo similar relacionado ao domínio de Informática em Saúde, Pagliariet al.1 utilizaram o vocabulário MeSH na análise da produção científica sobre e-health e concluíram que apenas a base MEDLINE tem uma taxonomia hierárquica de descritores que cobre essa área. No levantamento realizado em várias bases de dados, os autores concluíram que a produção dessa área se distribui entre várias áreas do conhecimento.

A Informática Médica é o domínio com maior número de registros na categoria de Ciência da Informação na MEDLINE, representando ao longo dos dez anos um pouco mais da metade de todos os artigos indexados na categoria, enquanto as outras categorias participam em 22% dos registros. Esta presença marcante é ainda mais acentuada a partir de 2001, quando a representatividade dos artigos relacionados com informática médica na MEDLINE cresceu em média o dobro do crescimento da base de dados. Este resultado evidencia o papel crescente que as tecnologias de informação vêm desempenhando no tratamento e comunicação da informação, na automação dos processos e embutida nos equipamentos médicos. Entretanto, este desempenho não se verifica na produção científica publicada nos periódicos da América Latina e Caribe e indexada na LILACS, onde o domínio Informação em Saúde contém quase 50% dos registros da categoria de Ciência da Informação, enquanto Informática Médica contém 25%.

O caráter multidisciplinar da Ciência da Informação se revela, também, no conjunto da produção científica em saúde, pela coocorrência de seus descritores com todas as demais categorias. Este fato ocorre em ambas as bases de dados e com distribuições equivalentes, o que indica um padrão de coocorrência ou multidisciplinaridade.

Morris et al.4 discutiram a interdisciplinaridade da informática médica e como esta se relaciona com áreas correlatas, por meio da análise de periódicos e de co-citações. Os resultados mostraram que os artigos de informática médica foram recuperados em bases de dados médicas ou de ciência da informação e que os periódicos onde foram publicados se enquadravam desde "periódicos orientados à engenharia e instrumentação" até "periódicos orientados para a prática clínica".

O caráter multidisciplinar da informação foi também constatado pelo fato que 70% ou mais dos periódicos indexados em ambas as bases de dados publicaram algum artigo que foi indexado por um descritor de Ciência da Informação. Sem muitos periódicos específicos de informática médica e ciência da informação na América Latina, como acontece em outras regiões do mundo, a utilização dos descritores do DeCS na recuperação permitiu identificar artigos relacionados a esses domínios na base de dados LILACS.

Esta dispersão vale para os quatro domínios, embora o domínio Informática Médica apresente maior consistência ao ter 17% dos artigos publicados em periódicos classificados como informática médica, seguido de periódicos em assuntos correlatos em biomedicina, tais como engenharia, radiologia e diagnóstico por imagem e serviços de saúde. Não obstante esta consistência, o domínio Informática Médica foi identificado em artigos publicados em 84% dos periódicos, a mais alta cifra entre os quatro domínios, o que parece indicar, por um lado, um universo de artigos de pesquisa científica em informática médica e, por outro lado, sua aplicação como tecnologia de apoio às pesquisas em outras áreas temáticas. Perry et al.5, ao analisar as fronteiras entre a informática médica e a ciência da informação em saúde, concluíram que "a ampliação da informática médica, a falta de clareza nas distinções entre os diferentes tipos de materiais, e o movimento das bibliotecas quanto ao uso predominante de serviços automatizados, ofereceu à ciência da informação e à informática médica a oportunidade de desenvolver relações de sinergia combinando as fortalezas de ambas disciplinas".

Os resultados deste estudo permitiram explorar quantitativamente a distribuição da produção científica na área de informação, comunicação e informática em saúde, referenciada nas bases de dados MEDLINE e LILACS, e situá-la no cenário internacional da comunicação cientifica em saúde. Seria necessário, entretanto, um estudo qualitativo dos artigos e periódicos recuperados para uma análise crítica e detalhada sobre a pesquisa científica em cada domínio.

Contudo, os resultados mostram que a importância da Ciência da Informação em toda sua amplitude é mais visível na pesquisa cientifica em saúde dos países desenvolvidos e confirmam a predominância dos Estados Unidos e o crescimento significativo da produção científica da China e Coréia do Sul e, em menor escala, do Brasil.

Colaboradores

AL Packer participou da concepção, análise dos resultados e redação final; AO Tardelli, da metodologia de extração de dados, análise dos resultados e redação final; RCF Castro, da preparação das tabelas, análise dos resultados e redação final.

Artigo apresentado em 18/08/2006

Aprovado em 04/12/2006

Versão final apresentada em 10/12/2006

  • 1. Pagliari C, Sloan D, Gregor P, Sullivan F, Detmer D, Kahan JP, et al What is eHealth (4): a scoping exercise to map the field. J Med Internet Res [serial on the Internet] 2005 [cited 2006 Ago 10]; 7(1):e9. Available from: http://www.jmir.org/2005/1/e9/
  • 2. Tardelli AO, Anção MS, Packer AL, Sigulem D. Descoberta baseada em literatura: um enfoque experimental para descoberta aberta em bases de dados do tipo MEDLINE. In:VIII Congresso Brasileiro de Informática em Saúde; 2002; Natal. [acessado 2006 Ago 10]. Disponível em: http://ambienteaprendiz.bvs.br/pdf/aot_medline.pdf
  • 3. Tardelli AO, Anção MS, Packer AL, Sigulem D. An implementation of the trigram phrase matching method for text similarity problems. Stud Health Technol Inform 2004; 103:43-9.
  • 4. Morris TA, McCain KW. The structure of medical informatics journal literature. J Am Med Inform Assoc 1998; 5(5):448-66.
  • 5. Perry GJ, Roderer NK, Assar S. A current perspective on medical informatics and health sciences librarianship.J Med Libr Assoc 2005; 93(2):199-205.

Datas de Publicação

  • Publicação nesta coleção
    19 Abr 2007
  • Data do Fascículo
    Jun 2007

Histórico

  • Aceito
    10 Dez 2006
  • Recebido
    18 Ago 2006
ABRASCO - Associação Brasileira de Saúde Coletiva Av. Brasil, 4036 - sala 700 Manguinhos, 21040-361 Rio de Janeiro RJ - Brazil, Tel.: +55 21 3882-9153 / 3882-9151 - Rio de Janeiro - RJ - Brazil
E-mail: cienciasaudecoletiva@fiocruz.br