Acessibilidade / Reportar erro

Importância do uso adequado da estatística básica nas pesquisas clínicas Pesquisa feita na Universidade Federal de Alagoas.

Resumo

Justificativa e objetivo

O uso inadequado da estatística básica é o maior responsável pelo erro de interpretação dos artigos científicos. O objetivo deste artigo de revisão foi rever alguns tópicos básicos de estatística para alertar autores e leitores sobre a importância do relato adequado da estatística básica.

Conteúdo

Foi feita pesquisa bibliográfica e transversal que analisou publicações em livros, artigos nas bases de dados SciELO (Scientific Electronic Library Online) e PubMed, do National Center for Biotechnology Information. Pesquisas na área médica não estão livres do risco de resultados falso positivos e falso negativos devido à escolha dos testes estatísticos e à presença de pequenos tamanhos de amostra.

Conclusão

A compreensão acerca do uso adequado da estatística básica propicia menores erros nos relatos dos resultados de estudos executados e na interpretação das suas conclusões.

Palavras-chave
Bioestatística; Anestesia; Tamanho da amostra

Abstract

Background and objective

The inadequate use of basic statistics is the main responsible for scientific article misinterpretation. The purpose of this review article was to review some basic statistical topics to alert authors and readers about the importance of basic statistics proper reporting.

Content

A bibliographical and cross-sectional study was carried out, which analyzed publications in books and articles in the following databases: SciELO (Scientific Electronic Library Online) and PubMed (Available from the National Center for Biotechnology Information). Medical research is not free from the risk of false positive and false negative results due to the choice of statistical tests and presence of small sample sizes.

Conclusion

Understanding the correct use of basic statistics leads to fewer errors in reporting the results of studies performed and in the interpretation of their conclusions.

Keywords
Biostatistics; Anesthesia; Sample size

Introdução

A estatística é uma ciência que usa a análise dos dados para testar as hipóteses estatísticas, verificar a força da evidência clínica e, assim, se existem associações entre grupos ou a veracidade de fenômenos de interesse.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. O pesquisador deve formular hipóteses, observar os fenômenos biológicos que ocorrem na população e retirar dessa população uma amostra para testar suas hipóteses. A semelhança de uma amostra com a população que a originou permite que os resultados da análise dos dados sejam mais fidedignos para a elucidação das hipóteses.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60.

A análise estatística, presente nas pesquisas científicas e relatada nos artigos originais, permite ao leitor, aos pacientes e aos gestores de saúde interpretar a informação advinda dos dados coletados durante a execução de uma pesquisa e assim usá-la em prol da sociedade.22 Kurichi JE, Sonnad SS. Statistical methods in the surgical literature. J Am Coll Surg. 2006;202:476-84. A preocupação de relatar adequadamente os resultados de pesquisas biomédicas está presente na literatura mundial desde décadas passadas.33 Bajwa SJ. Basics, common errors, and essentials of statistical tools and techniques in anesthesiology research. J Anaesthesiol Clin Pharmacol. 2015;31:547-53.

A frequência do uso adequado dos testes estatísticos pode ser vista em diversas áreas médicas, como oncologia, radiologia, cirurgia e anestesiologia.22 Kurichi JE, Sonnad SS. Statistical methods in the surgical literature. J Am Coll Surg. 2006;202:476-84.,44 Barbosa FT, Sousa DA. Frequency of the adequate use of statistical tests of hypothesis in original articles published in the Revista Brasileira de Anestesiologia between January 2008 and December 2009. Rev Bras Anestesiol. 2010;60:528-36.

5 Hokanson JA, Luttman DJ, Weiss GB. Frequency and diversity of use of statistical techniques in oncology journals. Cancer Treat Rep. 1986;70:589-94.
-66 Goldin J, Zhu W, Sayre JW. A review of the statistical analysis used in papers published in Clinical Radiology and British Journal of Radiology. Clin Radiol. 1996;51:47-50. As consequências podem ser sérias se a análise do conteúdo científico for inadequada, como resultados falsos com suposições não justificadas e conclusões sem respaldo biológico.33 Bajwa SJ. Basics, common errors, and essentials of statistical tools and techniques in anesthesiology research. J Anaesthesiol Clin Pharmacol. 2015;31:547-53.

As mais diversas orientações para relatos de dados e medidas estatísticas estão disponíveis aos pesquisadores e já foram publicadas por vários autores de artigos científicos que demonstraram quais itens são importantes para ser usados em relatos de pesquisas científicas.77 Altman DG, Gore SM, Gardner MJ, et al. Statistical guidelines for contributors to medical journals. Br Med J (Clin Res Ed). 1983;7:286-93, 1489.,88 Bailar JC, Mosteller F. Guidelines for statistical reporting in articles for medical journals. Amplifications and explanations. Ann Intern Med. 1988;108:266-73. Apesar da existência de tais orientações, os erros nos relatos de pesquisas que usam a estatística ainda continuam a existir e se devem tanto ao uso da estatística básica como da estatística avançada, porém a maior frequência ocorre com o uso da estatística básica, ao contrário do que se pode acreditar.22 Kurichi JE, Sonnad SS. Statistical methods in the surgical literature. J Am Coll Surg. 2006;202:476-84.,99 Kim M. Statistical methods in arthritis & rheumatism: current trends. Arthritis Rheum. 2006;54:3741-9.

O presente artigo de revisão é uma tentativa de tornar os anestesiologistas cônscios dos diversos aspectos dos métodos estatísticos usados em pesquisas clínicas, assim como tentar, por meio desta revisão narrativa, reduzir ao máximo os erros estatísticos que ainda são cometidos na parte básica da estatística. O objetivo deste artigo foi rever alguns tópicos básicos de estatística para alertar autores e leitores de pesquisas científicas sobre a importância do relato adequado da estatística básica.

Método

Foi executada uma pesquisa bibliográfica e transversal por meio de publicações de livros e artigos científicos obtidos em meios eletrônicos nas seguintes bases de dados: SciELO (Scientific Electronic Library Online) e PubMed (National Center for Biotechnology Information). Foram usados os seguintes descritores: bioestatística, anestesia e tamanho da amostra. Os mesh terms usados foram: biostatistics, anesthesia e sample size.

Revisão de literatura

Conceitos básicos de estatística descritiva

Os clínicos devem ser capazes de tomar as melhores decisões perante o paciente em sua prática rotineira e a aquisição de novo conhecimento somente será possível se eles forem capazes de ler e analisar criticamente os artigos publicados em periódicos científicos. A estatística descritiva é uma parte da estatística que auxilia os pesquisadores e os leitores a entenderem as informações de dados coletados por meio da sua organização e sumarização.1010 McHugh ML. Descriptive statistics. Part I: level of measurement. J Spec Pediatr Nurs. 2003;8:35-47. A estatística descritiva é a única estatística usada em trabalhos descritivos e em alguns estudos epidemiológicos.1010 McHugh ML. Descriptive statistics. Part I: level of measurement. J Spec Pediatr Nurs. 2003;8:35-47. O uso de dados brutos em artigos científicos, ou seja, dados da forma como foram coletados na pesquisa, não é comum e pode prejudicar a sua interpretação e tornar a leitura desinteressante.

A estatística descritiva é usada para a descrição de dados por meio do uso de números ou medidas estatísticas que possam melhor representar todos os dados coletados durante a execução de uma pesquisa. É considerada um passo inicial para a escolha adequada e o uso dos testes estatísticos de hipóteses.1111 Twycross A, Shields L. Statistics made simple. Part 2. Standard deviation, variance and range. Paediatr Nurs. 2004;16:24. É essencial conhecer qual estatística é mais apropriada para os mais diferentes níveis de mensuração.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. As mais usadas em artigos publicados na área de saúde podem ser vistas na tabela 1.

Tabela 1
Resumo da estatística descritiva mais usada em publicações na área de saúde1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6.

A estatística descritiva pode ser dividida em medidas de tendência central e de dipersão.1313 Twycross A, Shields L. Statistics made simple. Part 1: mean, medians, and mode. Paediatr Nurs. 2004;16:32. A primeira usa um valor que representa o que é mais típico e que pode ser usado para representar todos os demais valores coletados numa pesquisa.1313 Twycross A, Shields L. Statistics made simple. Part 1: mean, medians, and mode. Paediatr Nurs. 2004;16:32. A segunda usa um valor que revela como os dados variam em torno desse valor que é mais típico.1111 Twycross A, Shields L. Statistics made simple. Part 2. Standard deviation, variance and range. Paediatr Nurs. 2004;16:24. As principais medidas de tendência central são: a média, a moda e a mediana.1313 Twycross A, Shields L. Statistics made simple. Part 1: mean, medians, and mode. Paediatr Nurs. 2004;16:32. As principais medidas de dispersão são a variância, o desvio padrão e a amplitude interquartílica.1111 Twycross A, Shields L. Statistics made simple. Part 2. Standard deviation, variance and range. Paediatr Nurs. 2004;16:24.

A média é uma medida importante porque incorpora o valor de cada participante da pesquisa.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. Os passos necessários ao seu cálculo são: contar o número total de casos, que é conhecido usualmente em estatística como “n”; somar todos os valores e dividir pelo número total de casos.1313 Twycross A, Shields L. Statistics made simple. Part 1: mean, medians, and mode. Paediatr Nurs. 2004;16:32. Essa vantagem da média também é seu problema, pois é afetada por valores discrepantes altos ou baixos que distorcem a informação que se deseja transmitir sobre os dados analisados.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6.

A mediana difere da média porque é a posição cujo valor numérico situa-se na metade da distribuição dos demais valores quando organizados em ordem crescente.1414 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 2: descriptive statistics. Ann Emer Med. 1990;19:309-15. Se tomarmos valores aleatórios 88, 89, 90, 91 e 92, teremos como média 90.

A moda é o valor que ocorre mais frequentemente e não providencia uma indicação de todos os valores coletados numa pesquisa, mas sim daquele que mais se repetiu.1313 Twycross A, Shields L. Statistics made simple. Part 1: mean, medians, and mode. Paediatr Nurs. 2004;16:32. Se tomarmos valores aleatórios 88, 88, 90, 91 e 92, teremos como moda 88.

A mediana e os quartis são valores representativos da posição, em escala percentual, dos valores distribuídos em ordem crescente. A mediana representa a posição 50% na escala de distribuição.1414 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 2: descriptive statistics. Ann Emer Med. 1990;19:309-15. Para saber onde está a posição da mediana, basta dividir o valor total de casos por 2.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. Uma forma simples para saber qual é o valor numérico é: ordenar os valores om ordem crescente, eliminar gradativamente os valores extremos e no fim identificar o valor que ficou no centro.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. Esse valor será a mediana. Em alguns casos todos os valores das extremidades são eliminados e não resta valor central. Quando isso ocorrer, deve-se fazer a média dos dois últimos valores e assim calcular o valor central.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. A mediana não é influenciada pelos valores discrepantes e deve ser preferida quando eles estiverem presentes.1414 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 2: descriptive statistics. Ann Emer Med. 1990;19:309-15. Se tomarmos valores aleatórios 85, 89, 90, 91 e 97, teremos como mediana 90.

As medidas de tendência central têm sua aplicabilidade. A indicação para a aplicação de cada medida pode ser vista na tabela 2. Tomando-se dois conjuntos de valores aleatórios, o primeiro 88, 89, 90, 91 e 92 e o segundo 30 + 70 + 90 + 120 + 140, teremos como média dos dois conjuntos 90. Observando-se exclusivamente a média não se percebe a informação sobre o restante dos valores e por isso é preciso recorrer às medidas de dispersão para se perceber que os dados dos grupos não são iguais.

Tabela 2
Aplicabilidade das medidas de tendência central1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6.

Os valores podem ser próximos ou distantes da média e essa distância do valor até a média é conhecida como discrepância.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. A soma de todas as discrepâncias pode ser igual a zero, então para poder usar essas discrepâncias é recomendável quadrar cada valor da discrepância antes de usá-lo matematicamente.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. A média desses valores quadrados é conhecida como variância.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. A unidade de medida da variável analisada também fica quadrada, por isso em alguns casos é difícil compreender seu significado.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6.

O desvio padrão é uma das medidas estatísticas mais comumente usadas para demonstrar a variabilidade dos dados.1515 Clegg F. Introduction to statistics I: descriptive statistics. Br J Hospital Med. 1987;37:356-67. É uma medida que estima o grau em que o valor de determinada variável se desvia da média.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. Matematicamente a raiz quadrada da variância é o desvio padrão.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. A unidade de medida da variável permanece na sua forma original.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6.

A amplitude total é a distância entre os valores mais alto e mais baixo.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. É calculada pela subtração entre o maior e o menor valor de um conjunto de dados.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. A medida não informa se os valores estão distribuídos equitativamente, se há grupos de valores próximos uns dos outros ou se há ausências de grupos de valores entre os dados coletados.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6.

A amplitude interquartílica é uma medida de posição que se relaciona com a mediana.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. Os quartis representam a posição 25% e 75% na escala, de maneira que o primeiro quartil representa o valor que corresponde ao primeiro quarto da distribuição (25% dos valores abaixo dessa posição) e o terceiro quartil representa o valor que corresponde ao terço quarto da distribuição (75% dos valores acima dessa posição).

As medidas de dispersão têm sua aplicabilidade. Reanalisando-se os dois conjuntos de valores aleatórios anteriores percebe-se que para o primeiro conjunto de dados tem-se média 90; desvio-padrão 1,15 e amplitude total de 88-92; o para o segundo tem-se a média 90; desvio-padrão 43,01 e amplitude total de 30-140. Percebe-se pelo uso das medidas de dispersão que os conjuntos de valores são diferentes. A indicação de onde cada medida pode ser empregada pode ser vista na tabela 3.

Tabela 3
Aplicabilidade das medidas de dispersão1111 Twycross A, Shields L. Statistics made simple. Part 2. Standard deviation, variance and range. Paediatr Nurs. 2004;16:24.,1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6.,1313 Twycross A, Shields L. Statistics made simple. Part 1: mean, medians, and mode. Paediatr Nurs. 2004;16:32.

A média e o desvio padrão são mais bem empregados quando os dados têm distribuição normal ou simétrica, assim como a mediana e a amplitude interquartílica para dados com distribuição assimétrica.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. Uma das formas de identificar se ocorre simetria na distribuição dos dados é criar o gráfico do histograma e observar sua forma.1212 McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6. A criação do gráfico começa com a distribuição do número de casos no eixo do y e do nível da variável analisada no eixo do x (fig. 1). Se a forma se assemelhar a um sino, já existe forte indicativo para que os dados tenham distribuição normal.

Figura 1
Distribuição do número de casos no eixo do y e do nível da variável analisada no eixo do x

A distribuição dos dados também pode ser verificada de forma estatística pela comparação entre a curva formada pela distribuição dos dados coletados em uma pesquisa e a curva normal. Os aplicativos de computador podem executar o cálculo como BioEstat version5.0, STATA, EpiInfo e outros.

Conceitos básicos de estatística inferencial

A estatística inferencial é a parte da estatística que é usada para formular conclusões e fazer inferências após a análise de dados coletados em pesquisas.1313 Twycross A, Shields L. Statistics made simple. Part 1: mean, medians, and mode. Paediatr Nurs. 2004;16:32. A estatística inferencial usa os testes de hipóteses e a estimação para fazer as comparações e predições e tirar conclusões que servirão para as populações baseados em dados de amostras.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. As inferências estatísticas podem ser: a análise bivariada e a análise multivariada.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. A primeira analisa a relação entre uma variável dependente e uma independente. A segunda analisa a relação entre uma variável dependente e múltiplas variáveis independentes e verifica o potencial de confusão ou confundimento dessas sobre aquela.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60.

A inferência estatística somente é possível após testar as hipóteses estatísticas.1616 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 3, sensitivity, specificity, predictive value, and hypothesis testing. Ann Emerg Med. 1990;19:591-7. A hipótese é uma presunção numérica acerca de um parâmetro desconhecido ao pesquisador.1616 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 3, sensitivity, specificity, predictive value, and hypothesis testing. Ann Emerg Med. 1990;19:591-7. As duas hipóteses estatística são: hipóteses de nulidade e alternativa.1616 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 3, sensitivity, specificity, predictive value, and hypothesis testing. Ann Emerg Med. 1990;19:591-7. A primeira, hipótese de nulidade estatística, refere-se à ausência de efeito ou de associação.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. A segunda, hipótese alternativa, defende que existe diferença entre pelo menos duas populações estudadas e quando positiva diz haver diferença entre os grupos analisados.1616 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 3, sensitivity, specificity, predictive value, and hypothesis testing. Ann Emerg Med. 1990;19:591-7.

Os pesquisadores podem ter dois erros quando se baseiam nessas duas hipóteses para formular conclusões: erros tipo I e II.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. O erro tipo I refere-se a um resultado falso positivo, ou seja, rejeitar a hipótese nula quando na verdade essa é verdadeira.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. O erro tipo II refere-se a um resultado falso negativo, ou seja, aceitar a hipótese nula quando na verdade essa é falsa.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. A probabilidade de ocorrer o erro tipo I é conhecida como nível de significância ou alfa.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. O nível de significância aceitável e mais usado na área de saúde é de 5%.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. Os testes estatísticos de hipóteses calculam a probabilidade de o evento pesquisado ocorrer assumindo-se que a hipótese nula seja verdadeira.1717 Biau DJ, Jolles BM, Porcher R. P value and the theory of hypothesis testing: an explanation for new researchers. Clin Orthop Relat Res. 2010;468:855-62. Essa probabilidade é conhecida como valor de p.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. Se o valor de p calculado pelos testes estatísticos for menor do que o nível de significância, pode-se rejeitar a hipótese nula e aceitar a hipótese alternativa que diz haver diferença ou associação entre os grupos analisados.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. Esse raciocínio se aplica aos ensaios clínicos de superioridade. O erro mais comum entre os leitores é acreditar que o valor de p representa a probabilidade de a hipótese nula ser verdadeira.1717 Biau DJ, Jolles BM, Porcher R. P value and the theory of hypothesis testing: an explanation for new researchers. Clin Orthop Relat Res. 2010;468:855-62. Os ensaios clínicos de não inferioridade ou de equivalência testam exatamente o contrário, a lógica da interpretação é oposta, já que a hipótese nula representa a diferença entre os valores observados.

Kurichi et al.22 Kurichi JE, Sonnad SS. Statistical methods in the surgical literature. J Am Coll Surg. 2006;202:476-84. fizeram um pesquisa em 2006, analisaram publicações em diversas revistas científicas na área de cirurgia e demonstraram que os testes t de Student e do qui-quadrado foram os testes hipóteses mais usados. Esse achado é corroborado por outras pesquisas em outras áreas da medicina.44 Barbosa FT, Sousa DA. Frequency of the adequate use of statistical tests of hypothesis in original articles published in the Revista Brasileira de Anestesiologia between January 2008 and December 2009. Rev Bras Anestesiol. 2010;60:528-36.

5 Hokanson JA, Luttman DJ, Weiss GB. Frequency and diversity of use of statistical techniques in oncology journals. Cancer Treat Rep. 1986;70:589-94.
-66 Goldin J, Zhu W, Sayre JW. A review of the statistical analysis used in papers published in Clinical Radiology and British Journal of Radiology. Clin Radiol. 1996;51:47-50.

O teste t de Student é um teste paramétrico que compara a média de duas amostras.1818 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 4: statistical inference techniques in hypothesis testing. Ann Emerg Med. 1990;19:820-5. O uso desse teste requer algumas condições:1818 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 4: statistical inference techniques in hypothesis testing. Ann Emerg Med. 1990;19:820-5. a população que originou a amostra deve ter distribuição simétrica, as variâncias das amostras devem ser iguais ou próximas e as amostras devem ser independentes.1818 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 4: statistical inference techniques in hypothesis testing. Ann Emerg Med. 1990;19:820-5. A estatística desse teste pode ser obtida de acordo com os seguintes passos: calcular as médias amostrais e os respectivos desvios padrões, encontrar a diferença entre as duas médias amostrais, calcular o erro padrão e dividir o valor da diferença entre as médias pelo valor do erro padrão.1919 Rumsey D. Testes de hipóteses mais utilizados. In: Rumsey D, editor. Estatística para Leigos. Rio de Janeiro: Alta Books; 2010. p. 237-47. Uma vez encontrado o valor de t deve-se consultar uma tabela de valores críticos da estatística t de acordo com os graus de liberdade adequados a cada caso.1818 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 4: statistical inference techniques in hypothesis testing. Ann Emerg Med. 1990;19:820-5. Se o valor de t encontrado for maior ou igual ao valor de t tabelado, pode-se rejeitar a hipótese de nulidade.1818 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 4: statistical inference techniques in hypothesis testing. Ann Emerg Med. 1990;19:820-5. O valor da estatística t pode também ser convertido ao valor de p.1919 Rumsey D. Testes de hipóteses mais utilizados. In: Rumsey D, editor. Estatística para Leigos. Rio de Janeiro: Alta Books; 2010. p. 237-47. Se o valor de p for menor do que nível de significância adotado para a pesquisa, deve-se rejeitar a hipótese de nulidade.1919 Rumsey D. Testes de hipóteses mais utilizados. In: Rumsey D, editor. Estatística para Leigos. Rio de Janeiro: Alta Books; 2010. p. 237-47.

As pesquisas médicas geralmente envolvem mais de dois grupos. O teste de Anova é usado para simultaneamente testar a igualdade entre mais de dois grupos.2020 Gaddis ML. Statistical methodology: IV. Analysis of variance, analysis of covariance, and multivariate analysis of variance. Acad Emerg Med. 1998;5:258-65. As diversas formas desse testes são: Anova um fator para uma variável independente, Anova dois fatores para duas variáveis independentes e Anova medidas repetidas analisa participantes que servem como controle para eles mesmos.2020 Gaddis ML. Statistical methodology: IV. Analysis of variance, analysis of covariance, and multivariate analysis of variance. Acad Emerg Med. 1998;5:258-65. O uso desse teste requer algumas condições: a amostra deve ter distribuição simétrica, amostras devem ser escolhidas de forma aleatória e a homocedasticidade deve ser avaliada. A variância representa a dispersão dos dados que serão analisados. A homocedasticidade representa a homogeneidade das variâncias e é um pressuposto que deve ser observado para a execução do teste.2020 Gaddis ML. Statistical methodology: IV. Analysis of variance, analysis of covariance, and multivariate analysis of variance. Acad Emerg Med. 1998;5:258-65.

O teste do qui-quadrado é um teste não paramétrico usado para responder perguntas de pesquisa que envolvem taxas, proporções ou frequências.2121 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 5: statistical inference techniques for hypothesis testing with nonparametric data. Ann Emerg Med. 1990;19:1054-9. O teste não requer que os dados assumam uma distribuição simétrica.2121 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 5: statistical inference techniques for hypothesis testing with nonparametric data. Ann Emerg Med. 1990;19:1054-9. Existem dois testes: qui-quadrado de independência e de aderência.2121 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 5: statistical inference techniques for hypothesis testing with nonparametric data. Ann Emerg Med. 1990;19:1054-9. O teste de independência é o mais usado e avalia a frequência de dados de dois ou mais grupos.2121 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 5: statistical inference techniques for hypothesis testing with nonparametric data. Ann Emerg Med. 1990;19:1054-9. O teste de aderência é usado para comparar dados amostrais com dados de populações conhecidas.2121 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 5: statistical inference techniques for hypothesis testing with nonparametric data. Ann Emerg Med. 1990;19:1054-9.

A estatística do teste do qui-quadrado para duas amostras pode ser obtida de acordo com os seguintes passos: calcular as proporções amostrais, encontrar a diferença entre essas duas proporções, calcular a proporção amostral geral que será usada no cálculo do erro padrão, calcular o erro padrão e dividir o valor da diferença entre as proporções pelo valor do erro padrão.1919 Rumsey D. Testes de hipóteses mais utilizados. In: Rumsey D, editor. Estatística para Leigos. Rio de Janeiro: Alta Books; 2010. p. 237-47. A hipótese nula pode ser rejeitada se o valor de p for menor do que o nível de significância adotado na pesquisa ou se o valor encontrado for maior ou igual a um valor tabelado tal qual ocorre com o teste t.1919 Rumsey D. Testes de hipóteses mais utilizados. In: Rumsey D, editor. Estatística para Leigos. Rio de Janeiro: Alta Books; 2010. p. 237-47.

O uso dos testes estatísticos não paramétricos tem aumentado com o passar dos anos.22 Kurichi JE, Sonnad SS. Statistical methods in the surgical literature. J Am Coll Surg. 2006;202:476-84. Uma pesquisa que analisou publicações na área de cirurgia observou que em Archives of Surgery houve um aumento de 0% em 1985 para 33% em 2003 e em Annals of Surgery de 12% em 1985 para 49% em 2003.22 Kurichi JE, Sonnad SS. Statistical methods in the surgical literature. J Am Coll Surg. 2006;202:476-84. Os métodos não paramétricos são aplicados para dados que tenham distribuição assimétrica ou provenientes de escalas ordinais e nominais.2121 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 5: statistical inference techniques for hypothesis testing with nonparametric data. Ann Emerg Med. 1990;19:1054-9. Os mais comuns e suas indicações são: qui-quadrado e teste exato de Fisher para proporções ou frequências; testes U de Mann-Whitney, Wilcoxon, Kruskal-Wallis e Friedman para dados ordinais; e Kruskal-Wallis e Friedman para comparações intergrupos.2121 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 5: statistical inference techniques for hypothesis testing with nonparametric data. Ann Emerg Med. 1990;19:1054-9. Os dados de amostras com pequeno número total de participantes podem ser mais bem avaliados com testes não paramétricos.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60.

A formação profissional do médico geralmente lhe oferece um conhecimento básico em estatística, porém muitos não estão aptos para usar esses conhecimentos na interpretação dos dados.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. A decisão de qual teste usar para cada situação em particular requer o esclarecimento de alguns pontos: escala de medida dos dados; número de grupos; relação entre os participantes, ou seja, se os grupos são independentes ou relacionados e intenção do pesquisador de estabelecer diferença ou relação entre os grupos.2222 Twycross A, Shields L. Statistics made simple. Part 4: choosing the right test. Paediatr Nurs. 2004;16:24. Um exemplo hipotético seria analisar complicações em sala de recuperação anestésica. O primeiro passo a se fazer é contar o evento de interesse e dividi-lo pelo total de pacientes para achar a proporção e ao se multiplicar essa proporção por 100 tem-se a porcentagem. Em seguida se pode verificar diferença entre gêneros pelo teste do qui-quadrado ou verificar a quantidade de anestésico usada por cada paciente e extrair a média. Um guia geral para a escolha dos testes pode ser visto na tabela 4.

Tabela 4
Guia geral para escolha dos testes estatísticos11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60.,2020 Gaddis ML. Statistical methodology: IV. Analysis of variance, analysis of covariance, and multivariate analysis of variance. Acad Emerg Med. 1998;5:258-65.,2121 Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 5: statistical inference techniques for hypothesis testing with nonparametric data. Ann Emerg Med. 1990;19:1054-9.

Como executar o cálculo do tamanho amostral

A estatística é usada para comparações entre grupos e fazer predições para populações a partir de dados provenientes de amostras, uma vez que geralmente não é viável fazer análise de dados de todos os membros de uma população.11 Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60. A hipótese é formulada observando a população testada na amostra. Um número adequado de participantes deve ser calculado antes da execução da pesquisa.2323 Charan J, Kantharia ND. How to calculate sample size in animal studies? J Pharmacol Pharmacother. 2013;4:303-6. Se o tamanho da amostra for menor do que o necessário, o efeito real analisado pode ser negligenciado pelo pesquisador e se esse tamanho for muito grande ocorrerá desperdício de recursos e animais caso se trate de uma pesquisa experimental.2323 Charan J, Kantharia ND. How to calculate sample size in animal studies? J Pharmacol Pharmacother. 2013;4:303-6.

O cálculo do tamanho da amostra pode ser executado por meio de aplicativos de computador. Existem alguns aplicativos gratuitos online que usam o método do poder estatístico. Alguns exemplos são: http://www.openepi.com/Menu/OE_Menu.htm; http://www.biomath.info/power/index.htm; http://homepage.stat.uiowa.edu/∼rlenth/Power/#Download_to_run_locally; http://statpages.org; http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/PowerSampleSize; http://tinyurl.com/timbocalculo.

Erros comuns em anestesia

A identificação de erros em estatística foi pesquisada em literatura da Anaesthetic Research Society.2424 Goodman NW, Hughes AO. Statistical awareness of research workers in British anaesthesia. Br J Anaesth. 1992;68:321-4. As categorias apontadas nesta pesquisa foram: apresentação de método ou escolha do teste estatístico, variabilidade e probabilidade. Os erros mais comuns foram: ausência de identificação de testes de estatística inferencial, apresentação inadequada dos dados para permitir a interpretação dos valores de p e apresentação inadequada do desvio padrão da média.

Os erros comuns encontrados em anestesia são:33 Bajwa SJ. Basics, common errors, and essentials of statistical tools and techniques in anesthesiology research. J Anaesthesiol Clin Pharmacol. 2015;31:547-53. escolha errada de um teste de hipóteses que desconsidera a distribuição dos dados, escolha errada de um teste de hipóteses que desconsidera a hipótese clínica, que leva a erro tipo I durante análises de significância, uso do qui-quadrado quando a frequência esperada de uma célula é menor do que 5, uso do qui-quadrado sem correção de Yates em amostra pequenas, uso do teste t para amostras pareada em amostras não pareadas e parear amostras para analisar com o teste t.

Considerações finais

O uso adequado da estatística básica permite que o clínico possa sentir mais confiança nos resultados das pesquisas e assim implantar novas intervenções ou fármacos na prática clínica.

As principais recomendações para minimizar os erros no relato de artigos científicos são:77 Altman DG, Gore SM, Gardner MJ, et al. Statistical guidelines for contributors to medical journals. Br Med J (Clin Res Ed). 1983;7:286-93, 1489.,88 Bailar JC, Mosteller F. Guidelines for statistical reporting in articles for medical journals. Amplifications and explanations. Ann Intern Med. 1988;108:266-73. descrever a hipótese da pesquisa; conceituar as variáveis usadas na pesquisa; resumir os dados das varáveis por meio da estatística descritiva; descrever os métodos empregados na análise de cada variável e relacionar os métodos estatísticos empregados; verificar a distribuição dos dados antes da execução das análises e relatar o teste ou técnica empregados; descrever os métodos de ajuste usados para múltiplas comparações; descrever como os valores discrepantes foram tratados; descrever o nível de significância; descrever os parâmetros usados para a execução do cálculo do tamanho da amostra de forma que os cálculos possam ser repetidos; descrever o programa ou pacote estatístico usado na análise; usar a média e o desvio padrão para dados com distribuição normal; usar a mediana e a amplitude interquartílica para dados com distribuição assimétrica; não substituir o desvio padrão pelo erro padrão.

Os maiores erros na interpretação de dados provenientes de pesquisas científicas se devem ao uso inadequado da estatística básica abordada nesta revisão narrativa. Os profissionais de saúde devem ser capazes de avaliar criticamente os resultados de estudos para que as informações dispostas na literatura possam influenciar positivamente nos cuidados aos pacientes. O entendimento da validade das conclusões propicia a aplicabilidade dos achados aos pacientes.

A compreensão acerca do uso adequado da estatística básica propicia menores erros nos relatos dos resultados de estudos executados e na interpretação das suas conclusões.

  • Pesquisa feita na Universidade Federal de Alagoas.

References

  • 1
    Windish DM, Diener-West M. A clinician-educator's roadmap to choosing and interpreting statistical tests. J Gen Intern Med. 2006;21:656-60.
  • 2
    Kurichi JE, Sonnad SS. Statistical methods in the surgical literature. J Am Coll Surg. 2006;202:476-84.
  • 3
    Bajwa SJ. Basics, common errors, and essentials of statistical tools and techniques in anesthesiology research. J Anaesthesiol Clin Pharmacol. 2015;31:547-53.
  • 4
    Barbosa FT, Sousa DA. Frequency of the adequate use of statistical tests of hypothesis in original articles published in the Revista Brasileira de Anestesiologia between January 2008 and December 2009. Rev Bras Anestesiol. 2010;60:528-36.
  • 5
    Hokanson JA, Luttman DJ, Weiss GB. Frequency and diversity of use of statistical techniques in oncology journals. Cancer Treat Rep. 1986;70:589-94.
  • 6
    Goldin J, Zhu W, Sayre JW. A review of the statistical analysis used in papers published in Clinical Radiology and British Journal of Radiology. Clin Radiol. 1996;51:47-50.
  • 7
    Altman DG, Gore SM, Gardner MJ, et al. Statistical guidelines for contributors to medical journals. Br Med J (Clin Res Ed). 1983;7:286-93, 1489.
  • 8
    Bailar JC, Mosteller F. Guidelines for statistical reporting in articles for medical journals. Amplifications and explanations. Ann Intern Med. 1988;108:266-73.
  • 9
    Kim M. Statistical methods in arthritis & rheumatism: current trends. Arthritis Rheum. 2006;54:3741-9.
  • 10
    McHugh ML. Descriptive statistics. Part I: level of measurement. J Spec Pediatr Nurs. 2003;8:35-47.
  • 11
    Twycross A, Shields L. Statistics made simple. Part 2. Standard deviation, variance and range. Paediatr Nurs. 2004;16:24.
  • 12
    McHugh ML. Descriptive statistics. Part II: most commonly used descriptive statistics. J Spec Pediatr Nurs. 2003;8:111-6.
  • 13
    Twycross A, Shields L. Statistics made simple. Part 1: mean, medians, and mode. Paediatr Nurs. 2004;16:32.
  • 14
    Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 2: descriptive statistics. Ann Emer Med. 1990;19:309-15.
  • 15
    Clegg F. Introduction to statistics I: descriptive statistics. Br J Hospital Med. 1987;37:356-67.
  • 16
    Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 3, sensitivity, specificity, predictive value, and hypothesis testing. Ann Emerg Med. 1990;19:591-7.
  • 17
    Biau DJ, Jolles BM, Porcher R. P value and the theory of hypothesis testing: an explanation for new researchers. Clin Orthop Relat Res. 2010;468:855-62.
  • 18
    Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 4: statistical inference techniques in hypothesis testing. Ann Emerg Med. 1990;19:820-5.
  • 19
    Rumsey D. Testes de hipóteses mais utilizados. In: Rumsey D, editor. Estatística para Leigos. Rio de Janeiro: Alta Books; 2010. p. 237-47.
  • 20
    Gaddis ML. Statistical methodology: IV. Analysis of variance, analysis of covariance, and multivariate analysis of variance. Acad Emerg Med. 1998;5:258-65.
  • 21
    Gaddis GM, Gaddis ML. Introduction to biostatistics. Part 5: statistical inference techniques for hypothesis testing with nonparametric data. Ann Emerg Med. 1990;19:1054-9.
  • 22
    Twycross A, Shields L. Statistics made simple. Part 4: choosing the right test. Paediatr Nurs. 2004;16:24.
  • 23
    Charan J, Kantharia ND. How to calculate sample size in animal studies? J Pharmacol Pharmacother. 2013;4:303-6.
  • 24
    Goodman NW, Hughes AO. Statistical awareness of research workers in British anaesthesia. Br J Anaesth. 1992;68:321-4.

Datas de Publicação

  • Publicação nesta coleção
    Nov-Dec 2017

Histórico

  • Recebido
    10 Jun 2016
  • Aceito
    17 Jan 2017
Sociedade Brasileira de Anestesiologia R. Professor Alfredo Gomes, 36, 22251-080 Botafogo RJ Brasil, Tel: +55 21 2537-8100, Fax: +55 21 2537-8188 - Campinas - SP - Brazil
E-mail: bjan@sbahq.org