Page 82 - 20anosIbraop
P. 82

Todavia, Simon Newcomb (1881), um  com o primeiro dígito 1 incidindo por  mais
                  astrônomo e matemático do século XIX, observou  dez anos. Dessa maneira, ao se escolher
                  que as primeiras páginas das tábuas de logaritmos se  uma data aleatória, é mais provável que o
                  apresentavam mais desgastadas do que as últimas,  DJIA desse dia possua o 1 como primeiro
                  indicando que o valor usualmente mais acessado  dígito, do que qualquer outro dígito. Essa
                  era o 1, e que a frequência diminuía até o 9. Como  mesma lógica se aplica a diversos dados
                  Newcomb não reuniu dados numéricos ou forneceu  presentes na natureza, tal como o tamanho
                  qualquer outra evidência de sua descoberta, o fato  de populações.
                  só começou a ganhar importância mais de meio          Um banco de dados tem maior
                  século depois, quando o físico Frank Benford (1938)   chance  de  representar  uma  distribuição
                  incidentalmente chegou à mesma conclusão. Benford   de Benford se os dados forem coletados
                  publicou artigo seminal em 1938, denominado The   de diferentes distribuições (Hill, 1995).
                  Law of Anomalous Numbers, em que utilizou dados   Por outro lado, números atribuídos pela
                  coletados de diferentes tipos de fontes. Esses dados   intervenção do homem, tais como números
                  eram aleatórios e não possuíam nenhuma relação   da Seguridade Social, códigos postais,
                  entre si, e variavam desde números obtidos nas   contas bancárias, números telefônicos ou
                  páginas principais dos jornais e todos os números de   números fabricados por estudantes em
                  um tópico importante do    até tabelas matemáticas   experimentos geralmente não se conformam
                  e constantes científicas. Seu trabalho analisou os   com a Lei de Benford (Nigrini, 2000). Essa
                  primeiros dígitos dos dados coletados e mostrou   observação sugere que a Lei dos Números
                  que: 30,6% dos números possuíam 1 como primeiro   Anômalos pode ser usada para se detectar
                  dígito; o primeiro dígito 2 ocorria em 18,5% dos   indícios de manipulação humana de dados.
                  casos; e que, em contraste, somente 4,7% dos    Contudo, naturalmente, desvios em relação
                  números possuíam como primeiro dígito o número 9.   à distribuição de Benford não constituem
                  Essas frequências dos primeiros dígitos se aplicam a   prova  conclusiva  de  manipulação,  assim
                  uma variedade de fontes de dados, incluindo contas   como uma conformidade não assegura
                  de energia, endereços, preços de ações, valores   fidedignidade  dos  dados.  Uma  não
                  populacionais, taxas de mortalidade, entre outras.
                                                                  conformidade pode ser vista como  um
                        Tomando-se como exemplo um índice de  sinal indicando que os dados precisam
                  ações Dow Jones Industrial Average (DJIA), e  de um exame mais minucioso. Assim, a
                  supondo que ele aumente, em média, 7% ao ano,  Lei de Benford (Lei NB) pode ser usada
                  ele dobrará mais ou menos a cada dez anos. Caso  em  conjunto  com  outros  mecanismos  de
                  o DJIA seja igual a 10.000, após dez anos tendo o  controle como um primeiro passo para
                  1 como o primeiro dígito, ele finalmente chegará a  checar possíveis manipulações nos dados.
                  20.000. Passados mais 10 anos, o índice dobrará       A hipótese de que dados fabricados
                  para 40.000 (em cerca de metade desses dez anos   ou falsificados são identificados mediante o
                  os números começarão com 2, e na outra metade   desvio dos dígitos em relação à distribuição
                  começarão com 3). Após outra década, o número   de  Benford  foi  testada  recentemente  em
                  chegará a 80.000 (obter-se-ão os valores 4, 5, 6 e 7   diversos contextos. Nigrini, assumindo que
                  como os primeiros dígitos em apenas dez anos). Em   dados contábeis verdadeiros seguiam a
                  um dado momento, chegar-se-á ao valor de 100.000,
                                                                  distribuição de Benford bem de perto (como


           82
   77   78   79   80   81   82   83   84   85   86   87