Page 82 - 20anosIbraop
P. 82
Todavia, Simon Newcomb (1881), um com o primeiro dígito 1 incidindo por mais
astrônomo e matemático do século XIX, observou dez anos. Dessa maneira, ao se escolher
que as primeiras páginas das tábuas de logaritmos se uma data aleatória, é mais provável que o
apresentavam mais desgastadas do que as últimas, DJIA desse dia possua o 1 como primeiro
indicando que o valor usualmente mais acessado dígito, do que qualquer outro dígito. Essa
era o 1, e que a frequência diminuía até o 9. Como mesma lógica se aplica a diversos dados
Newcomb não reuniu dados numéricos ou forneceu presentes na natureza, tal como o tamanho
qualquer outra evidência de sua descoberta, o fato de populações.
só começou a ganhar importância mais de meio Um banco de dados tem maior
século depois, quando o físico Frank Benford (1938) chance de representar uma distribuição
incidentalmente chegou à mesma conclusão. Benford de Benford se os dados forem coletados
publicou artigo seminal em 1938, denominado The de diferentes distribuições (Hill, 1995).
Law of Anomalous Numbers, em que utilizou dados Por outro lado, números atribuídos pela
coletados de diferentes tipos de fontes. Esses dados intervenção do homem, tais como números
eram aleatórios e não possuíam nenhuma relação da Seguridade Social, códigos postais,
entre si, e variavam desde números obtidos nas contas bancárias, números telefônicos ou
páginas principais dos jornais e todos os números de números fabricados por estudantes em
um tópico importante do até tabelas matemáticas experimentos geralmente não se conformam
e constantes científicas. Seu trabalho analisou os com a Lei de Benford (Nigrini, 2000). Essa
primeiros dígitos dos dados coletados e mostrou observação sugere que a Lei dos Números
que: 30,6% dos números possuíam 1 como primeiro Anômalos pode ser usada para se detectar
dígito; o primeiro dígito 2 ocorria em 18,5% dos indícios de manipulação humana de dados.
casos; e que, em contraste, somente 4,7% dos Contudo, naturalmente, desvios em relação
números possuíam como primeiro dígito o número 9. à distribuição de Benford não constituem
Essas frequências dos primeiros dígitos se aplicam a prova conclusiva de manipulação, assim
uma variedade de fontes de dados, incluindo contas como uma conformidade não assegura
de energia, endereços, preços de ações, valores fidedignidade dos dados. Uma não
populacionais, taxas de mortalidade, entre outras.
conformidade pode ser vista como um
Tomando-se como exemplo um índice de sinal indicando que os dados precisam
ações Dow Jones Industrial Average (DJIA), e de um exame mais minucioso. Assim, a
supondo que ele aumente, em média, 7% ao ano, Lei de Benford (Lei NB) pode ser usada
ele dobrará mais ou menos a cada dez anos. Caso em conjunto com outros mecanismos de
o DJIA seja igual a 10.000, após dez anos tendo o controle como um primeiro passo para
1 como o primeiro dígito, ele finalmente chegará a checar possíveis manipulações nos dados.
20.000. Passados mais 10 anos, o índice dobrará A hipótese de que dados fabricados
para 40.000 (em cerca de metade desses dez anos ou falsificados são identificados mediante o
os números começarão com 2, e na outra metade desvio dos dígitos em relação à distribuição
começarão com 3). Após outra década, o número de Benford foi testada recentemente em
chegará a 80.000 (obter-se-ão os valores 4, 5, 6 e 7 diversos contextos. Nigrini, assumindo que
como os primeiros dígitos em apenas dez anos). Em dados contábeis verdadeiros seguiam a
um dado momento, chegar-se-á ao valor de 100.000,
distribuição de Benford bem de perto (como
82