Acessibilidade / Reportar erro

Principais tabelas estatísticas aplicadas à contabilidade e à auditoria

ARTIGOS

Principais tabelas estatísticas aplicadas à contabilidade e à auditoria

Edmundo Eboli Bonini

Professor do Departamento de Contabilidade de Atuaria da Faculdade de Economia e Administração da Universidade de São Paulo

1. INTRODUÇÃO

O Comitê de Amostragem Estatística do American Institute of Certified Public Accountants - AICPA - publicou, em fevereiro de 1962, um relatório especial intitulado A Amostragem estatística e o auditor independente. Esse relatório tratava da natureza geral da amostragem estatística e de sua aplicabilidade à auditoria, concluindo com o seguinte parágrafo:

"São recomendáveis um maior conhecimento de amostragem estatística e pesquisa adicional sobre sua aplicabilidade, por parte da profissão. Seguindo esta conclusão, o comitê deu atenção, posteriormente, à relação entre amostragem estatística e os padrões de auditoria geralmente aceitos, acreditando que a publicação de seus pontos de vista sobre o assunto possa servir a uma finalidade bastante útil."1 1 Instituto de Auditores Independentes do Brasil. 5. Seção Regional. Exposição de normas de auditoria. São Paulo/Paraná, 1977. n.1.p. 25.

As leis da estatística, como todas as leis científicas, nasceram da observação de um modo de comportamento uniforme, de um conjunto de dados estatísticos. Os profissionais desta ciência têm a preocupação de observar o maior número possível de dados que parece repetir-se na futura lei e, só depois disso, considerar a lei como exata, sujeita, no entanto, a alterações quando negar a homogeneidade que se supõe existir em tocio o conjunto. Mas, quantos desses dados estatísticos devem ser estudados, antes que a lei possa ser formulada? Haverá possibilidade de estudar todos os que existem? Será isso necessário, para que a lei tenha aplicação em todos os casos que porventura forem aparecendo?

Em qualquer pesquisa, de qualquer natureza, é importante levantarmos uma amostra, para inferirmos sobre o comportamento do todo. Nesta inferência, cometemos erros que são medidos por meio do cálculo de probabilidade, e o mais importante modelo de probabilidade é o modelo normal. Em qualquer levantamento estatístico, admitimos que todos os elementos que deverão fazer parte da amostra são escolhidos com igual probabilidade de dela fazerem parte.

Iremos analisar as tabelas relativas a mecanismo da amostragem, dimensionamento, intervalos de confiança e tipos de amostragem.

2. PRINCIPAIS TABELAS E PROBLEMAS TÍPICOS

2.1. Números aleatórios ou randômicos ou dígitos aleatórios ou números ao acaso

Uma amostra é aleatória se todo elemento a ser escolhido de um coletivo tiver probabilidade constante. O melhor método consiste em numerar cada um dos dados do coletivo N com um número da série de 1 a N, e escolher de uma tábua de dígitos aleatórios, uma lista telefônica, n números que correspondam a n unidades. Para a construção de tabelas de números aleatórios, foram ideados diversos métodos,2 2 Horton, H. B. A Method of obtaining random numbers. Ann. of Matl. Statist., p. 81-5, 1948. que procuram evitar o aparecimento de alguns números ou grupo de números ou ordem de colocação e que foram aplicados a várias provas de hipóteses, entre elas as mencionadas por Kendall.3 3 Kendall, M. G. & Babington, S. B. Randomness and random sampling numbers. Journ. of Statistic. Soc, 7:147 seg., 1938. As principais tabelas são:

a) Tippett, L.H.C. Random sampling numbers. I. ed. London, 1927; 2. ed. London, 1952. (Tract, of Computers, n. 15).

b) Kendall, M.G. e Babington, S.B. Tables of random sampling numbers. London, 1939. (Tract, of Computers, n. 24).

c) Fischer, R. A. & Yates, F. Statistical tables. Table n. 33.

d) Horton, H. B. & Smith, R. T. Tables of 105.000 random decimal digits. Washington, 1949. Interstate Commerce Comission.

e) A Million random digits with 100.000 normal deviates. The Rand Corporation, 1955.

O uso das tábuas para obter amostras aleatórias, no caso de escolher n dados, dentro de um coletivo de N, poderá ser feito da seguinte forma:

a) ordenar e numerar os Andados do coletivo;

b) começar por qualquer bloco da tábua e percorrê-la em qualquer direção, escolhendo os n números menores do que N e os dados correspondentes. Se aparecerem números maiores do que N, são desprezados.

Temos a seguir um extrato:

90752 52210 83974 29992 65831 38857 50490 64364 67412 33339 31926 14883 24413 59744 08962 00358 31662 25388 61642 34072 81249 95012 68379 93526 70765 10592 04542 76463 15664 10493 20492 38391 91132 21999 59516 16408 81899 04153 53381 79401 21438 83035 18629 81953 05520 91962 04739 13092 97662 73115 35101 47498 87637 99016 71060 88824 57491 16703 23167 49323 45021 33132 12544 30405 83946 23792 14422 15059 45799 22716

2.2 Letras do alfabeto aleatórias

Os documentos contábeis poderão ter uma composição alfanumérica e, assim, poderemos compor as amostras aleatórias com as duas tabelas - letras e números aleatórios - considerando que os dois primeiros números representem as letras do alfabeto. Uma tabela de letras aleatórias poderá ser observada no livro de Herbert Arkin, Handbook of sampling for audiiing and accounting, editado pela McGraw Hill em 1963. Um extrato desta tabela é dado a seguir:

2.3 Meses aleatórios

Os documentos contábeis poderão ter uma composição mensal e numérica, daí a utilização de duas tabelas: meses aleatórios e dígitos aleatórios. Temos a seguir um extrato:

MAR SEP MAR AUG SET MAR DEC AUG MAY JAN MAY OCT SEP SEP JUN APR MAY MAY OCT APR DEC FEB DEC SEP DEC FEB JUN MAY SEP DEC NOV JUL MAY NOV DEC FEB DEC AUG JUN APR DEC FEB JUN JUL MAY OCT NOV JAN NOV NOV

2.4. Tamanho da amostra n para amostragem por atributos (taxa de ocorrência) - população finita N

onde n é o tamanho da amostra, N é o tamanho do universo, p é a taxa de ocorrência decimal na amostra, q' = 1 - p' é a proporção de insucesso na amostra, α é o nível de significância, 1 - α é o nível de confiança (este é, normalmente, de 90<Vo, 95%, 99% e 99,9%), Z„/2 é o valor da variável normal reduzida, que depende de freqüência α.

α : 010 0,05 0,01 0,001 α/2 : 0,05 0,025 0,005 0,0005 Zα/2 : 1,645 1,96 2,58 3,30

Os valores de Z„/2 são obtidos através da curva normal, sendo que Z,,/2 são as abcissas que correspondem às áreas de Assim, teremos:

Para utilizarmos a fórmula de n, deveremos especificar:

a) nível de significância (a) ou nível de confiança (1-α)

b) valor da taxa de ocorrência p' ,q' = 1 - p'

c) tamanho da população N

d) margem de confiança (erro) e

Vejamos um exemplo: Desejo fazer uma circularização de clientes. O meu cardex apresenta 4.500 clientes. Por meio de dados passados, ou de uma amostra piloto (n = 30 clientes), sei que a percentagem de violações é de 2% (0,02). Qual o número mínimo de clientes a serem analisados, admitindo-se um erro (precisão) de 1% (0,01) e um nível de confiança de 95%. Substituindo os dados:

Se a população fosse infinita, teríamos:

O valor de p' que torna máximo p'q' = P (1 -p') = p' -p'2, seja:

N = 4.500; e = 0,01; p´= 0,02; q' = 0,98; 1 - = 0,95 Z,,25 = 1,96, na formula de n, teremos:

w = p' -p'2; W' = 0 => 1 -2p' = 0 => p' = 1/2 e o valor máximo de p' q' é 1/4. Então, podemos escrever: n < 0,25 . Se α = 0,05 e e = 0,04, teremos n = 600.

Em função da tabela 1, poderemos tirar as seguintes conclusões:

a) à medida que aumentamos a tolerância (margem de confiança, erro), diminui o número de elementos a serem observados;

b) para uma mesma tolerância, se o universo aumenta, isto não implica aumentar na mesma proporção o número de elementos da amostra;

c) se dobrarmos a tolerância, para um mesmo universo, não implica em reduzir pela metade o número de elementos a serem observados.

2.5 Tabela de d, - fatores para estimar o valor do desvio-padrão populacional δ em função da amplitude média R

O valor de δ é dado por: δ = , onde d2 é a tabela que depende do número de elementos que compõe cada grupo. Assim, teremos:

Exemplo: levantamos um grupo de 48 documentos reunindo-os em 8 grupos, sendo cada grupo composto de 6 documentos. Em cada grupo tivemos os seguintes maiores e menores valores:

Grupos: 1 2 3 4 5 6 7 8 Maior valor: 21 19 32 41 45 51 50 26 Menor valor: 12 9 10 30 20 30 20 10 Amplitude (R): 9 10 22 11 25 21 20 16

Temos que (R) = = 18; d26 = 2,534

Então, o valor de δ será: δ = = = 7,103

2.6 Tamanho da amostra n para amostragem por variáveis (valor monetário) - população finita N

onde: n é o tamanho da amostra; N = tamanho do universo; δ = desvio-padrão populacional; e = precisão ou margem de confiança; α = nível de significância; 1 - α = nível de confiança; Zδ/2 é o valor da variável normal reduzida que depende do nível de significância.

Observando os saldos do exemplo acima, qual o número mínimo de documentos a ser analisado, sendo o erro da amostragem (precisão) de 1; 1 - α = 0,95; N = 5.000?

Solução n =

Em função da tabela abaixo, poderemos tirar as seguintes conclusões:

a) à medida que aumenta a margem de confiança e, diminui o número de elementos;

b) mantendo-se a margem de confiança e constante em relação ao desvio-padrão populacional e aumentándose o nível de confiança, o número de elementos a serem observados aumenta;

c) aumentando-se , não se reduz na mesma proporção o número de elementos a serem observados, evidente mantendo-se constante o nivél de confiança.

2.7 Intervalo de confiança para a proporção ou freqüência ou taxa de ocorrência p' ou confiabilidade da amostra para freqüência relativa - população finita N

onde: p' é a taxa de ocorrência na amostra; q' = 1 - p'; néo tamanho da amostra; 1 - α é o nível de confiança; α nível de significância; Zα/2 é o valor da variável normal reduzida que depende de α; Né o tamanho da população.

Exemplo: Sendo p' = 0,5; q' = 0,5; 1 - a = 0,95; n = 1.000; Af= 10.000, qual o intervalo de confiança?

0,5 ± 1,96. = 0,5 ± 1,96 . 0,0158114 . 0,9487 = 0,5 ± 0,0293793 ou 0,4706 e 0,529 ou 47,06% e 53%

2.8 Confiabilídade da amostra para o cálculo do intervalo de confiança de média - população finita N - grande amostra n > 30

onde: n é o tamanho da amostra; N é o tamanho da população; Z é o valor da variável normal reduzida.

Damos a seguir um extrato desta tabela.

Em função do extrato acima, verificamos que: a) mantendo-se constante ne N, à medida que aumenta o nível de confiança, aumenta o erro da amostragem, como múltiplo do desvio-padrão; b) para um mesmo universo N, o nível de confiança 1 - α, à medida que aumenta o tamanho da amostra n, diminui o erro da amostragem, como múltiplo do desvio-padrão.

Seja um inventário composto de 4.000 itens de valor total de Cr$ 1.289.640,00; a média por item será: Cr$ 1.289.640 + 4.000 = Cr$ 322,41. Levantamos uma amostra-piloto de 120 itens e obtivemos uma média para as amplitudes de Cr$ 148,49 (dividimos os 120 itens em 20 grupos de 6 itens cada, e obtivemos 20 amplitudes cuja soma foi de Cr$ 2.969,72).

O valor de δ será: δ = = 58,60

O erro da amostragem como múltiplo do desvio-padrão é:

Neste caso consideramos: n = 120; N = 4.000; 1 - α = 0,99.

A exatidão da amostragem ou erro por item será:

A avaliação da exatidão da amostragem para o total do universo é: 4.000 ∙ Cr$ 13,59 = Cr$ 54.360,00

Podemos concluir que existem 99 chances em 100 de que o inventário de Cr$ 1.289.640,00 apresente uma flutuação de Cr$ 54.360,00 para mais ou para menos. Os limites de controle são:

Limite superior de controle: Cr$ 1.289.640,00 + Cr$ 54.360,00 = Cr$ 1.344.000,00

Limite inferior de controle: Cr$ 1.289.640,00 - Cr$ 54.360,00 = Cr$ 1.235.280,00

2.9 Confiabilidade da amostra para o cálculo do intervalo de confiança da média - população infinita N - , grande amostra n > 30

, quando N tende para infinito, tende para 1 e, portanto, a expressão inicial ficará ±onde né o tamanho da amostra e Zα/2 o valor da variável normal reduzida.

Qual a confiabilidade da amostra, ou seja, o fator que deverei multiplicar pelo desvio-padrão, a fim de obter a exatidão da amostragem e o intervalo de confiança para a média? Considerar uma amostra de 2.500 itens e o nível de confiança de 95%.

Solução:

Em função da tabela abaixo, poderemos concluir o seguinte:

a) matendo-se constante o tamanho da amostra n, à medida que aumenta o nível de confiança, aumenta o erro da amostragem como múltiplo do desvio-padrão;

b) para um mesmo nível de confiança, à medida que aumenta o tamanho da amostra, diminui o erro da amostragem como múltiplo do desvio-padrão.

2.10 Fator de correção para a população finita

onde: n e N são tamanhos de amostra e população respectivamente. Assim, poderemos ter a seguinte tabela:

O valor 0,9487 foi obtido com: n = 100; N = 1.000 e . Podemos observar que, à medida que aumenta a relação , diminui o fator de correção, uma vez que diminui .

2.11 Amostragem por descoberta - probabilidade de incluir pelo menos uma ocorrência na amostra

Adota-se o modelo hipergeométrico (sem reposição) quando, em uma população de N documentos, há E errados. Escolhendo-se n documentos aleatoriamente, qual a probabilidade de encontrarmos e errados?

Quando

< 0,10, adota-se o modelo binomial como sendo uma boa aproximação de modelo hipergeométrico.

Uma população é composta de 200 documentos. De experiências passadas, sabemos que a percentagem de erros é de 1%(E = 0,01 . 200 = 2). Levantando-se uma amostra de 10 documentos (n = 10), qual a probabilidade de termos pelo menos um documento errado na amostra?

Em função da tabela seguinte, poderemos tirar as seguintes conclusões:

a) mantendo-se constante n e N, à medida que aumentamos a taxa de ocorrência (erros) na população, aumenta a probabilidade de incluir pelo menos uma ocorrência na amostra;

b) para uma mesma população e taxa de ocorrência na população, a probabilidade de incluir pelo menos uma ocorrência na amostra aumenta à medida que aumentamos o tamanho da amostra n.

2.12 Plano de amostragem para aceitação

O plano de amostragem para aceitação inclui o número de elementos da população N, o tamanho da amostra n e um número de aceitação c. O número de aceitação é o número máximo de erros ou outro evento que é tolerado na amostra, para o universo ser considerado satisfatório. Admitindo-se o modelo hipergeométrico:

O modelo binomial é: Ph(n;p;x)= px qn-x, p=1-q, p= ; µ = np e δ2= npq. O modelo de Poisson apresenta a forma:

Em geral, na construção de planos de amostragem simples, para que uma partida ou lote seja aceitável na inspeção, fixa-se o número máximo de erros que se permite, na amostra de tamanho n; tal número máximo de erros, c, denomina-se número de aceitação. Ocorrendo na amostra um ou mais erros além de c, a partida será rejeitada; define-se assim, em conseqüência, o número de rejeição r = c+ 1. Naturalmente, devemos ter: 0 < c < (n - 1) e 1< r < n.

Vejamos dois exemplos do modelo hipergeométrico (sem reposição):

1. seja uma partida de N = 50 documentos com número de erros E = 2. Qual a probabilidade de aceitação da partida, inspecionando-se uma amostra de n = 10, com um número de aceitação c = 1?

No caso, f = = 0,20 > 0,10 e, por isso, deveremos utilizar a distribuição hipergeométrica. Se fosse f < 0,10, deveríamos utilizar o modelo binomial.

para e = 0; e = 1, teremos:

= 0,637; PH (50;2;10;1)= = 0,326

As probabilidades de aceitação e rejeição são respectivamente:

Para c = 1, será: F(1) = P(0 < e < 1) = 0,637 + 0,326 = 0,963, e a probabilidade de rejeição será: 1 -F(1) = 0,037

2. Se levantarmos uma amostra de n - 40 documentos, de uma população composta de N = 200 documentos, sabendo-se que a percentagem ou taxa de erros é de 1%, ou seja, E = 2, qual a probabilidade de aceitação para o número de aceitação (número máximo de erros ou outro evento que é tolerado na amostra pará o universo ser considerado satisfatório) 1, c = 1?

PH(N;E;n;c = 1) = PH(N;E;n;e = 0) + PH(N;E;n; e= 1)

PH(200; 2; 40; c = 1) = PH(200; 2; 40; 0) + PH(200;2;40; 1) =

= PH(200;2;40;c=1)=

PH (200;2;40; c=1) = = 0,639 + 0,3216 = 0,9606 ou 96,1%

Se c = 2, teremos:

PH(200;2;40; c = 2 = = 0,639 + 03216 + 0,0391

PH(200;2;40;c = 2 = 0,9997 ou 99,97%, aproximadamente 100%

Os cálculos acima poderão ser observados na tabela 8:

Em função da tabela 8, temos as seguintes observações:

a) matendo-se N, n e c, à medida que aumenta a taxa de erros na população E, diminui a probabilidade de aceitação;

b) matendo-se N, ne E (taxa de erros na população), à medida que aumenta o número de aceitação c, aumenta a probabilidade de aceitação;

c) mantendo-se N, c (número de aceitação, número máximo de erros na amostra, para aceitarmos o lote ou universo ou partida) e E (taxa de erros ou número de erros no universo), à medida que aumenta o tamanho da amostra n, diminui a probabilidade de aceitação;

d) mantendo-se n, c, E, à medida que aumenta o tamanho do universo N, aumenta a probabilidade de aceitação;

e) uma amostra com um número de erros igual ao da população, apresenta a probabilidade de 100% de aceitação. Por exemplo:

PH(200;2;40;c = 2) = PH(200;2;40;0) + (200;2;40;1) + (200;2;40;1) + PH(20*0;2;40;2)

PH(200;2;40;c=2) = 0,639 +0,3216 + 0,0391 = 0,997 ou 100%

2.13 Tabela de amostragem por conglomerados - erro da amostragem como múltiplo do desviopadrão populacional δ

Para o cálculo do intervalo de confiança para a média, temos que:

considerando-se uma população infinita. O erro da amostragem ou margem de confiança é dado por:

Apresentamos a seguir um extrato desta tabela:

Vejamos dois exemplos:

a) Qual o erro de amostragem para n = 15,1 - α = 0,90 ou 90%?

Solução:

= 0,4707; t α/2:n-1 = 0,10;14 = 1,7613

(Consultar Estatística - teoria e exercícios de E. E. Bonini e S. E. Bonini, p. 434)

b) Qual o erro da amostragem para n = 20; 1 - α = 0,95 ou 95%?

Solução:

= 0,4795; t α/2:n-1 = 0,5;19 = 1,7613

3. CONCLUSÃO E SUMÁRIO

Em qualquer pesquisa de cunho científico, é fundamental a aplicação de métodos quantitativos.

Raramente é possível levantar todos os elementos de uma população devido a restrições de tempo, presteza, especialização, economia, etc. Em função das restrições levantadas, observamos uma amostra com o objetivo de inferir sobre o coletivo.

O Comitê de Amostragem Estatística do Instituto Americano de Contadores Públicos Certificados publicou, em fevereiro de 1962, um relatório especial intitulado A Amostragem Estatística e o Auditor Independente. Este relatório tratava da natureza geral da amostragem estatística e de sua aplicabilidade à auditoria, observando, entre outros, os seguintes detalhes:

- São recomendáveis um maior conhecimento de amostragem estatística e pesquisa adicional sobre sua aplicabilidade, por parte da profissão.

- O Comitê é de opinião que o uso da amostragem estatística é permitido, de acordo com os padrões de auditoria geralmente aceitos.

- As amostras estatísticas são avaliadas em termos de precisão, que se expressa como uma escala de valores positivos e negativos, em torno do resultado da amostra, e confiança, que se expressa como a proporção dessas escalas, com base em todas as possíveis amostras semelhantes do mesmo tamanho e que incluíram o valor da população real.

- Embora a amostragem estatística forneça ao auditor uma medida de precisão e confiança, as técnicas estatísticas não definem para ele os valores de cada uma, necessários à segurança no trabalho de auditoria.

- A especificação da precisão e confiança necessárias em um determinado teste é uma função da auditoria e deve basear-se em julgamento, da mesma maneira que uma decisão quanto à segurança necessária em auditoria, quando não se usa a amostragem estatística.

- Ao determinar a extensão de um dado teste de auditoria e do método para selecionar itens a serem examinados,-o auditor pode considerar a possibilidade de usar as técnicas de amostragem estatística comprovadamente vantajosas em certas circunstâncias. O uso de amostragem estatística não reduz a necessidade do julgamento do auditor, mas fornece certas medidas estatísticas quanto aos resultados dos testes de auditoria, as quais, de outra forma, não se podem obter!4 4 Exposição de normas de auditoria, cit.

O presente artigo tem por objetivo eliminar a subjetividade dos levantamentos contábeis por amostragem, ou seja, responder às perguntas de como, onde, quanto e por que dos elementos comprobatórios contábeis.

  • Arkin, H. Handbook of sampling in auditing and accounting. New York McGraw Hill, 1962.
  • Barnes, R. M. Work sampling. 2.ed. John Wiley & Sons, 1964.
  • Bonini, E. E. & Bonini, S. E. Estatística - teoria e exercícios. São Paulo, Loyola, 1976.
  • Cohran, G. William. Técnicas de amostragem. Fundo de Cultura, 1965.
  • Grant, E.L. Statistical Quality Control. McGraw Hill.
  • Hill, Henry P. Roth; Joseph, L & Arkin, H. Sampling in auditing. New York, The Ronald Press, 1962.
  • Instituto de Auditores Independentes do Brasil. 5. Seção Regional. Exposição de Normas de Auditoria. São Paulo/Paraná, 1977. n.1.
  • Lourenço, Ruy de C.B. Filho. Controle estatístico de qualidade. Rio de Janeiro, Ao Livro Técnico, 1964.
  • Madow, William G. Teoria dos levantamentos por amostragem. IBGE.
  • Rodrigues, Milton da Silva. Vocabulário brasileiro de estatística, IBGE, 1956.
  • Tagliacarne, Gugliemo. Pesquisa de mercado, técnica eprática, Atlas, 1976.
  • Trueblood, Robert M. & Cyest, R. M. Sampling tecniques in accounting, Englewood Cliffs, New Jersey, Prentice Hall, 1957.
  • Vance, Lawrence L. & Neter, John. Statistical sampling for auditors and accountants. New York, John Wiley & Sons, 1956.
  • 1
    Instituto de Auditores Independentes do Brasil. 5. Seção Regional.
    Exposição de normas de auditoria. São Paulo/Paraná, 1977. n.1.p. 25.
  • 2
    Horton, H. B. A Method of obtaining random numbers.
    Ann. of Matl. Statist., p. 81-5, 1948.
  • 3
    Kendall, M. G. & Babington, S. B. Randomness and random sampling numbers.
    Journ. of Statistic. Soc, 7:147 seg., 1938.
  • 4
    Exposição de normas de auditoria, cit.
  • Datas de Publicação

    • Publicação nesta coleção
      08 Ago 2013
    • Data do Fascículo
      Set 1979
    Fundação Getulio Vargas, Escola de Administração de Empresas de S.Paulo Av 9 de Julho, 2029, 01313-902 S. Paulo - SP Brasil, Tel.: (55 11) 3799-7999, Fax: (55 11) 3799-7871 - São Paulo - SP - Brazil
    E-mail: rae@fgv.br