Acessibilidade / Reportar erro

Variabilidade comportamental em humanos: efeitos de regras e contingências

Human behavioral variability: effects of rules and contingencies

Resumos

Dois experimentos investigaram, com estudantes universitários, a variabilidade aprendida. No Experimento 1, quatro grupos (n = 5) foram submetidos a dois esquemas de reforçamento para seqüências de respostas de pressão às teclas P e Q do computador. Para o grupo Variabilidade (VAR) o reforçamento era dependente do alto grau de variação entre as seqüências, e para o grupo Acoplado (ACO) o reforçamento independia dessa variabilidade. Foram manipuladas a ordem de apresentação dessas contingências e o intervalo entre elas (0 e 3 meses). No Experimento 2, essas contingências foram combinadas a instruções verbais (regras) que as descreviam correta ou incorretamente (quatro grupos, n = 5). Os resultados mostraram: 1) maior variabilidade em VAR, independente das demais variáveis manipuladas, 2) desempenho em ACO afetado parcialmente pela ordem das contingências, pelo intervalo e pelas regras. Em ambos os estudos, os sujeitos não foram capazes de descrever as contingências em vigor. Esses resultados indicam o controle operante da variabilidade observada.

variabilidade comportamental; comportamento governado por regras; reforçamento operante; comportamento humano


Two experiments investigated the learning of variability by undergraduate students. In the experiment 1, four groups (n = 5) were submitted to two schedules of reinforcement for pressing the P or the Q keys at a computer. For the Variability group (VAR) the reinforcement was dependent on high variation among sequences; for the Yoked group (ACO) the reinforcement was given independently of the sequence variability. It was manipulated the order and interval (0 and 3 months) for contingencies presentation. In the second experiment, four groups received these contingencies associated with correct or incorrect instructions (rules). The results showed that: 1) the responding was always more variable under the VAR contingency, 2) under ACO, the behavior was partially influenced by order and interval for contingencies presentation, and by the rules. In both experiments, the subjects were not able to report the contingency that was working. These results point the operant control of the behavior variability observed.

behavioral variability; rule-governed behavior; operant contingencies; human behavior


Variabilidade comportamental em humanos: efeitos de regras e contingências1 1 Este trabalho foi subvencionado pelo CNPq (Projeto Integrado de Pesquisa, proc. no. 523.612/95-8). Partes dessa pesquisa foram apresentadas no 4th International Congress on Behaviorism and the Sciences of Behavior (Sevilha, Espanha, 1998), na XXVIII Reunião Anual de Psicologia (Ribeirão Preto, 1998) e no 8 o. Simpósio Internacional de Iniciação Científica da USP (São Paulo, 2000).

Human behavioral variability: effects of rules and contingencies

Maria Helena Leite Hunziker2 2 Endereço: Departamento de Psicologia Experimental - Universidade de São Paulo, Av. Prof. Mello Moraes, 1721, CEP 05508-900 - São Paulo – SP ( hunziker@usp.br) ; Vanessa Pik Quen Lee; Christiane Cardoso Ferreira; Adriana Pinto da Silva e Flávia Capelossi Caramori

Universidade de São Paulo

Endereço para correspondência Endereço para correspondência Maria Helena Leite Hunziker Departamento de Psicologia Experimental, Universidade de São Paulo Av. Prof. Mello Moraes, 1721 CEP 05508-900, São Paulo, SP E-mail: ( hunziker@usp.br)

RESUMO

Dois experimentos investigaram, com estudantes universitários, a variabilidade aprendida. No Experimento 1, quatro grupos (n = 5) foram submetidos a dois esquemas de reforçamento para seqüências de respostas de pressão às teclas P e Q do computador. Para o grupo Variabilidade (VAR) o reforçamento era dependente do alto grau de variação entre as seqüências, e para o grupo Acoplado (ACO) o reforçamento independia dessa variabilidade. Foram manipuladas a ordem de apresentação dessas contingências e o intervalo entre elas (0 e 3 meses). No Experimento 2, essas contingências foram combinadas a instruções verbais (regras) que as descreviam correta ou incorretamente (quatro grupos, n = 5). Os resultados mostraram: 1) maior variabilidade em VAR, independente das demais variáveis manipuladas, 2) desempenho em ACO afetado parcialmente pela ordem das contingências, pelo intervalo e pelas regras. Em ambos os estudos, os sujeitos não foram capazes de descrever as contingências em vigor. Esses resultados indicam o controle operante da variabilidade observada.

Palavras-chave: variabilidade comportamental; comportamento governado por regras; reforçamento operante; comportamento humano.

ABSTRACT

Two experiments investigated the learning of variability by undergraduate students. In the experiment 1, four groups (n = 5) were submitted to two schedules of reinforcement for pressing the P or the Q keys at a computer. For the Variability group (VAR) the reinforcement was dependent on high variation among sequences; for the Yoked group (ACO) the reinforcement was given independently of the sequence variability. It was manipulated the order and interval (0 and 3 months) for contingencies presentation. In the second experiment, four groups received these contingencies associated with correct or incorrect instructions (rules). The results showed that: 1) the responding was always more variable under the VAR contingency, 2) under ACO, the behavior was partially influenced by order and interval for contingencies presentation, and by the rules. In both experiments, the subjects were not able to report the contingency that was working. These results point the operant control of the behavior variability observed.

Key words: behavioral variability; rule-governed behavior; operant contingencies; human behavior.

A análise da função seletiva do reforço, proposta por Skinner (1981), tem predominado nos estudos operantes. Durante muito tempo, houve dúvidas se o reforço poderia atuar no sentido de aumentar a variabilidade do comportamento, além de atuar aumentando a sua repetição. Baseado em dados experimentais, Schwartz (1982) chegou a afirmar que a variabilidade comportamental não poderia ser incrementada através de reforçamento. Contudo, Page e Neuringer (1985) apontaram que essa conclusão se deveu a uma falha no procedimento empregado por Schwartz, e demonstraram experimentalmente que o comportamento variável aumenta se reforçado e fica sob controle de estímulos, o que o caracteriza como um operante.

Embora ainda sem uma padronização conceitual e metodológica, a variabilidade vem sendo avaliada, via de regra, sobre mudanças ou diferenças entre comportamentos (Hunziker & Moreno, 2000). Metodologicamente, estabelece-se um referencial comparativo para que essas diferenças sejam auferidas no comportamento em análise, tornando o reforço contingente a elas. A maioria dos trabalhos atuais vem utilizando a emissão de seqüências de respostas em dois manipulanda, tais como pressão à barra direita (D) ou esquerda (E) por ratos, fazendo a análise comparativa sobre a freqüência ou ordem de ocorrência de ambas as respostas, dispostas em seqüências (Hunziker, Caramori, Silva & Barba, 1998; Hunziker, Saldana & Neuringer, 1996; Mook, Jeffrey & Neuringer; 1993; Morgan & Neuringer, 1990; Neuringer, 1991; Stokes, 1995). Da mesma forma, em pombos, analisam-se bicadas a discos dispostos à direita ou à esquerda numa caixa de reforçamento (Machado, 1989; 1993; 1997; Neuringer, 1992). Procedimentos bastante distintos são às vezes empregados, tais como a análise da mudança na vocalização de pássaros em função do reforçamento (Manabe, Kawashima & Staddon, 1995). De uma maneira geral, independentemente da resposta analisada, identifica-se a seleção da variabilidade do comportamento quando o reforçamento é contingente a esse padrão comportamental.

Conceitualmente, o comportamento variável vem sendo analisado como equivalente ao comportamento aleatório, ou seja, aquele cujas respostas seriam igualmente prováveis a cada emissão. Em estudos com animais, essa aleatoriedade ficou demonstrada comparando-se seu comportamento ao de um gerador randômico (Page & Neuringer, 1985). A generalidade desses dados para humanos esbarrou em estudos que indicavam que o comportamento humano dificilmente ocorre de forma aleatória, mesmo quando solicitado (Bakan, 1960; Evans & Graham, 1980; Tune, 1964; Rath, 1966; Wagenaar, 1972). Tais estudos sugeriam que a variabilidade operante não poderia ser generalizada para o estudo do comportamento humano.

Contudo, em oposição a essa análise, Neuringer (1986) argumentou que os trabalhos que falharam em obter comportamento variável com sujeitos humanos tinham problemas metodológicos. Essa análise foi seguida por uma demonstração experimental de que a variabilidade pode também ser aprendida por esses sujeitos em função do seu reforçamento. No seu experimento, Neuringer solicitou a estudantes universitários que pressionassem de forma aleatória os números 1 e 2 do teclado do computador. Paralelamente, o computador gerava esses números de forma aleatória, fornecendo o referencial de comparação para o comportamento dos estudantes. Estes eram reforçados quando seu comportamento se aproximasse do produzido pelo computador. Os resultados mostraram que os estudantes aprenderam a se comportar de forma "aleatória" em função do reforçamento.

Outros estudos, desenvolvidos por Neuringer e colaboradores, vem confirmando que o reforçamento operante pode produzir aumento da variação comportamental em humanos, quer sejam eles adultos ou crianças, portadores ou não de psicopatologias identificadas (Miller, 1996; Neuringer, Deiss & Imig, 2000; Neuringer & Voss, 1993; Saldana & Neuringer, 1998). Contudo, algumas diferenças são observadas nas pesquisas com humanos e com animais. Por exemplo, tem-se obtido que os sujeitos humanos apresentam grau intermediário de variabilidade mesmo em situações em que a variação não é exigida para reforçamento (Saldana & Neuringer, 1998), o que não se observa com animais, que apresentam, nessa condição, comportamento altamente repetitivo (Hunziker & cols., 1998). Dados como esse sugerem a possível existência de fatores que controlam o comportamento humano variável - além da contingência operante - os quais podem estar ausentes nos estudos com animais.

O comportamento verbal pode ser uma fonte de controle diferenciada, presente nos estudos com humanos (de Rose, 1994). Portanto, a investigação da variabilidade comportamental - feita com estudos comparativos humano/animal para que se chegue à identificação dos processos básicos da aprendizagem da variação, isolando-se algumas possíveis características espécie-específicas - deve incluir aspectos do comportamento verbal que podem estar interferindo no desempenho dos sujeitos humanos.

O presente estudo foi realizado com o objetivo de investigar a variabilidade comportamental em sujeitos humanos, traçando um paralelo com alguns estudos realizados com animais. Para tanto, foram mantidas algumas das características do procedimento básico utilizado freqüentemente com animais. Foi também realizada a coleta de um dado adicional, não possível de ser obtido com animais, que é o relato dos sujeitos sobre sua percepção da contingência em vigor. No Experimento 1, os objetivos foram: 1) verificar se a variabilidade comportamental apresentada por estudantes universitários seria diferencialmente produzida por dois esquemas de reforçamento que diferissem entre si quanto à exigência de variação como critério para a liberação do reforço; 2) verificar se essa variabilidade poderia ser alterada pela ordem de apresentação das contingências e/ou pelo intervalo transcorrido entre a exposição a cada uma delas; 3) verificar se a variabilidade apresentada estaria correlacionada com a descrição verbal da contingência em vigor, feita pelos sujeitos.

Experimento 1

Método

Sujeitos

Vinte estudantes de graduação em Psicologia da USP, cinco homens e quinze mulheres, com idades entre 21 e 25 anos, participaram voluntariamente da pesquisa, sem receber informações sobre o tema pesquisado.

Equipamento

Controles e registros do experimento foram feitos através de computadores (Macintosh, modelos Performa 630 e 5215CD) com teclado convencional e monitor colorido, equipados com programa escrito em linguagem True Basic, desenvolvido e descrito por Miller e Neuringer (2000).

Procedimento

Antes de iniciar a sessão, o computador mostrava apenas um triângulo equilátero situado no centro da tela. O sujeito recebia de forma oral a seguinte instrução:

Há essas duas teclas Q e P, que você pode apertar em qualquer ordem, desde que não as pressione ao mesmo tempo. A cada quatro pressões aparecerá na tela o desenho de uma carinha ou apenas um barulho. O seu objetivo é preencher o triângulo com carinhas.

A pressão das teclas Q ou P caracterizava uma resposta, que era acompanhada pelo breve aparecimento de uma luz nos cantos inferiores esquerdo ou direito da tela, respectivamente. As demais teclas estavam inoperantes. A unidade comportamental considerada foi a seqüência de quatro respostas, havendo 16 seqüências possíveis dado o arranjo entre essas teclas (por exemplo, seqüências QQQQ, QPQP, QQQP, PQPP, PPPP, etc). Ao ser completada uma seqüência, ela poderia ser seguida por um tom agudo (3.000 Hz) ou grave (500 Hz), de 0,2 s de duração. O tom agudo era acompanhado pelo aparecimento na tela de um desenho de face estilizada (denominada "carinha"), composto por um círculo verde de 0,75 polegada de diâmetro, com dois olhos e uma boca sorridente. O aparecimento da "carinha" foi considerado um reforço. Cada "carinha" se alojava dentro do triângulo que estava na tela, acumulando-se da esquerda para a direita, da base para o topo. Seqüências não reforçadas eram seguidas apenas por tom grave e tela escura. Quinze "carinhas" preenchiam o triângulo, encerrando o jogo, o que era sinalizado por uma série de quatro tons (800, 1.600, 2.400 e 3.200 Hz) e "carinhas" de diferentes cores e tamanhos, que se sucediam ao longo de 2s. Novo triângulo vazio era automaticamente apresentado na tela, dando início a novo jogo. A cada cinco jogos, havia uma breve interrupção para o experimentador introduzir nova série de jogos.

Cada sujeito realizou vinte jogos, sendo todos submetidos a duas contingências de reforçamento - variabilidade (VAR) e acoplamento (ACO) – cada uma permanecendo em vigor por dez jogos consecutivos. Foi manipulada a ordem de apresentação das contingências e o intervalo entre elas (0 ou 3 meses): nos grupos de intervalo 0, fazia-se apenas uma breve interrupção entre as sessões, tempo suficiente para mudar a contingência no computador (máximo 2 minutos). Em função desses arranjos, foram compostos quatro grupos: VAR-0-ACO, ACO-0-VAR, VAR-3-ACO, ACO-3-VAR.

Em ambas as contingências, o requisito mínimo para reforçamento foi a emissão de seqüências de quatro respostas. Como o conceito de variabilidade aqui correspondeu ao de eqüiprobabilidade de ocorrência das diferentes seqüências possíveis (Hunziker & Moreno, 2000), o esquema VAR reforçava essa distribuição eqüitativa atendendo a dois critérios: 1) menor freqüência - a probabilidade de reforço era tanto maior quanto menos freqüentemente a seqüência tivesse sido emitida anteriormente (por exemplo, comparando-se as seqüências QQPP, PPQP, QQPP e PPPP, a terceira teria menor probabilidade de reforçamento que as demais); 2) menor recência - na sua repetição, uma seqüência teria maior probabilidade de reforçamento quanto maior fosse o número de outras seqüências diferentes dela intercalando essa repetição.

Quando em vigor a contingência ACO, a configuração da seqüência (distribuição das respostas Q ou P) não alterava a probabilidade de reforçamento: o reforço era liberado para qualquer seqüência com base apenas na porcentagem média de reforçamento obtida em VAR, calculada para cada bloco de cinco jogos consecutivos. Nos grupos VAR-ACO, cada sujeito recebeu igual porcentagem de reforços recebida por ele próprio em VAR (auto-acoplamento). Nos grupos cuja primeira contingência foi ACO, cada sujeito foi acoplado a um sujeito do grupo exposto inicialmente a VAR. Dessa forma, quando submetido à contingência ACO, cada sujeito do grupo ACO-VAR recebeu igual porcentagem de reforçamento que um dos sujeitos do grupo VAR-ACO. Esse procedimento permitiu igual porcentagem média de reforços em ambas as contingências, com a única diferença que em VAR a liberação do reforço foi dependente da variabilidade das seqüências.

A lógica do programa considerava que, dadas as 16 seqüências possíveis, a probabilidade de reforçamento em VAR tinha um limiar máximo de 1/16, ou seja, 0.0625. Até atingir esse limiar todas as seqüências eram reforçadas. Seqüências cuja freqüência o ultrapassavam não eram reforçadas até que ficassem novamente abaixo dele. Isso era obtido na medida que outras seqüências fossem sendo emitidas, pois aumentava o "n" do denominador sobre o qual o limiar de reforçamento era calculado. Foi também utilizado um "coeficiente de amnésia": a cada seqüência emitida, as demais tinham suas freqüências multiplicadas por 0,99, o que as rebaixava, produzindo a sua gradual aproximação do limiar probabilístico de reforçamento. Portanto, no seu conjunto, quanto menos recente e freqüente fosse a seqüência, maior a sua probabilidade de reforçamento em VAR.

Ao final de cada sessão, foi registrado de forma cursiva o relato dos sujeitos sobre o que acreditavam ser preciso fazer para que as carinhas aparecessem na tela, dado esse utilizado para uma análise qualitativa dos comportamentos apresentados.

Quantitativamente, a variabilidade das seqüências emitidas foi analisada utilizando-se o índice estatístico U, calculado segundo a fórmula: U= -S[(N1-16)*(log2[N1-16])]/log2(16), onde N equivale à freqüência de emissão de uma dada seqüência dividida pela soma de todas as seqüências emitidas (Page e Neuringer, 1985). Valor de U=1,0 indica o máximo de variabilidade possível, enquanto U=0,0 é representativo de repetição de uma mesma seqüência. Como o cálculo desse índice exige amostragem relativamente grande, o registro das seqüências foi sendo acumulado no decorrer dos jogos considerando-se todas as seqüências emitidas anteriormente. Esse registro acumulado foi também utilizado para comparação das seqüências emitidas ao longo da contingência VAR, determinando aquelas que deveriam, ou não, ser reforçadas.

Resultados

A Tabela 1 mostra as porcentagens de reforçamento obtidas pelos sujeitos que foram expostos inicialmente à contingência VAR, distribuídas pelos dois blocos de cinco jogos consecutivos. Em média, essa porcentagem de reforçamento girou em torno de 50%, sendo os valores mínimos e máximos 32,19 e 64,25%, respectivamente. Esses dados também mostram que a maioria dos sujeitos apresentou queda nesse índice no decorrer dos jogos (exceção apenas dos sujeitos 4 e 5 do grupo VAR-0-ACO).

A Figura 1 mostra o grau de variabilidade comportamental alcançado nesse experimento, indicado pelos índices U. Pode-se constatar que todos os sujeitos apresentaram altos índices de variabilidade (U acima de 0,90 ao final da sessão) quando submetidos à contingência VAR, com um padrão muito semelhante entre si, independentemente da ordem de apresentação das contingências e do intervalo entre elas. Por outro lado, sob a contingência ACO foram obtidos índices inferiores de variabilidade (comparativamente aos obtidos em VAR), além de um desempenho irregular entre sujeitos. Sob essa contingência, a ordem de exposição às contingências afetou o desempenho: as discrepâncias intra-grupo foram maiores e os índices gerais de variabilidade foram menores quando a contingência ACO antecedeu a VAR. O intervalo entre sessões também afetou o desempenho em ACO: no grupo que teve sessões seguidas (intervalo 0), nota-se mais acentuadamente o efeito de ordem de apresentação das contingências, sendo que o intervalo de 3 meses entre as sessões diminuiu a interferência da aprendizagem em VAR sobre o desempenho em ACO, ficando mais visível o controle diferencial das duas contingências.


A análise dos relatos verbais mostra que todos os sujeitos, independentemente a qual grupo pertenciam, consideraram necessário "descobrir a regra do jogo", embora as formulações sobre aquilo que acreditavam ser a "regra" tenham variado entre os mesmos. Apesar dessas diferenças, a maioria apontou que essa regra mudava ao longo da sessão. Seguem abaixo exemplos de relatos de três sujeitos, que ilustram o padrão obtido com os demais, quando perguntados sobre o que acreditavam ser necessário fazer para que aparecessem as carinhas:

  1. "Tinha uma seqüência certa, mas às vezes não. A seqüência mudava a cada três carinhas, mais ou menos".

  2. "Eu fazia seqüência com três de um lado, um do outro; depois dois de um lado e dois do outro, depois fazia um espelho, e assim por diante".

  3. "Tinha que fazer combinações matemáticas. Se eu tivesse uma folha, eu ia anotando as seqüências que eu já tinha feito, para não repetir. Ia ficar mais fácil".

A análise qualitativa desses relatos demonstrou que os sujeitos forneceram explicações semelhantes para as contingências de variabilidade e acoplamento, não discriminando a mudança de contingência ocorrida entre os blocos. Isso foi observado mesmo nos sujeitos que tiveram comportamento bastante diferenciado frente a VAR e ACO, mostrando uma falta de correlação entre a descrição da contingência e o desempenho frente a ela.

Discussão

Todos os sujeitos aqui testados foram sensíveis ao reforçamento da variabilidade das seqüências emitidas, comportando-se de forma mais próxima ao aleatório quando expostos à essa contingência do que quando submetidos ao reforçamento independente da variação do comportamento. Além disso, essa alta variabilidade foi replicável em cada sujeito exposto à contingência que reforçava diferencialmente seqüências variáveis, sem interferência da ordem de apresentação das contingências ou do intervalo entre elas. Por outro lado, frente à contingência que não exigia variabilidade para liberação do reforço, os desempenhos foram pouco sistemáticos intra-grupo, sendo o comportamento dos sujeitos afetado pela ordem e intervalo entre a apresentação das contingências. Portanto, pode-se dizer que os índices de variabilidade altos e regulares, replicáveis intra-grupo, foram, aparentemente, controlados pelo reforçamento contingente à variação das seqüências emitidas.

A ordem de exposição às contingências afetou o comportamento controlado pela contingência que não exigia variação (ACO) no sentido de que os sujeitos apresentaram taxas de variabilidade mais elevadas após terem sido reforçados a variar (ordem VAR-ACO) do que quando expostos a igual contingência antes da aprendizagem da variabilidade (ordem ACO-VAR). A provável causa desse efeito pode ser o fato de que a contingência ACO não exigia, mas também não punia, a variabilidade. Assim, a manutenção do comportamento variável, quando não exigido para reforçamento, pode ter se dado por reforçamento acidental, pois padrões de comportamento já reforçados, e que não se contrapunham à atual contingência, tinham maior chance de ocorrer e coincidir acidentalmente com o reforçamento. Deve-se destacar que esse efeito de ordem foi mais acentuado quando não houve intervalo entre as sessões. Aparentemente, o intervalo (3 meses) reduziu o controle pela contingência anterior, fortalecendo o controle da contingência presente, enquanto que a apresentação seqüencial de ambas as contingências dificultou a discriminação da mudança entre elas.

Um dado aparentemente conflitante é o relativo aos altos índices de variação sob a contingência VAR, que são acompanhados de baixas porcentagens de reforçamento. A interpretação de que esses baixos índices de reforçamento indicariam falta de ajuste à contingência não se sustenta justamente pelos altos índices U obtidos. Na verdade, esses dados são consistentes com a análise da variabilidade como equivalente a um responder aleatório. Conforme demonstrado por Page & Neuringer (1985) e Neuringer (1986), um computador produzindo números aleatórios, e submetido à contingência de reforçamento Lag, receberia em torno de 50% dos reforços disponíveis. Isso se deve à própria natureza do fenômeno em estudo e à contingência de reforçamento utilizada. O comportamento aleatório é, por definição, composto por respostas que são independentes entre si, ou seja, aquelas cuja ocorrência não altera em nada a ocorrência da seguinte. Portanto, se cada resposta é sempre tão provável quanto as demais, elas não seguem nenhum padrão prévio, podendo mesmo haver repetições eventuais. Se a contingência utilizada reforça apenas a emissão de respostas que atingem algum critério de diferença, é de se esperar que num padrão aleatório ocorram respostas que não atendam a esse requisito, não sendo, portanto, reforçadas. Dessa forma, o esperado é que o responder aleatório receba reforçamento apenas parcial.

Quanto à queda do reforçamento observada na segunda metade da sessão, ela é típica do índice de U acumulado: como cada "jogo" incorpora as seqüências emitidas anteriormente, considerando-as como parte do universo de análise da variabilidade, torna-se crescentemente mais difícil atingir o critério para reforçamento a despeito da manutenção dos altos índices de variabilidade.

Um aspecto crítico desse experimento é o fato de que a descrição verbal dos sujeitos da contingência em vigor não se correlacionou com os índices de acerto apresentados pelos sujeitos. Esse fato sugere diferentes controles para o comportamento verbal (que descrevia as contingências) e para as escolhas sucessivas entre teclas P e Q. Se por um lado o reforçador (aparecimento da figura indicativa de acerto) controlou a variabilidade, ele não controlou a descrição verbal das contingências.

É possível que o controle do comportamento verbal estivesse mais na história de reforçamento e que as escolhas entre P e Q estivessem sob o controle do reforçamento presente. Estudantes universitários têm, em geral, uma história em que foram positivamente reforçados por apresentar comportamento variável frente a situações similares à utilizada nesse experimento, tais como no uso de jogos em computadores, ou frente a problemas matemáticos (e outros). Essa variabilidade envolve o teste de várias estratégias para solucionar o problema apresentado, as quais freqüentemente requerem comparações entre conjuntos de dados (conforme sugerido no relato 3). Assim, dada essa história de reforçamento, é altamente provável que, frente a uma situação nova, esses sujeitos tenham maior probabilidade de apresentar diferentes comportamentos como forma de encontrar a estratégia adequada, ou seja, aquela que seja reforçada diferencialmente.

Apesar dessa aparente independência entre o reforçamento da variabilidade e a descrição da contingência, o comportamento verbal do sujeito interferiu, ao menos parcialmente, nos resultados obtidos na condição em que o reforçamento não era exigido (ACO). Ou seja, na ausência de uma contingência mais estrita, as descrições das contingências formuladas pelos sujeitos passaram a controlar parte do seu comportamento. Considerando-se que regras são respostas verbais que controlam o comportamento do ouvinte e que o comportamento determinado principalmente por antecedentes verbais é chamado de comportamento governado por regras (de Rose, 1994), pode-se dizer que quando o próprio sujeito emite as respostas verbais que controlam seu comportamento, ele está sob o controle de regras auto-formuladas. As descrições das contingências, formuladas pelos sujeitos, podem ter atuado, nesse experimento, como regras auto-formuladas que controlaram, ao menos parcialmente, o desempenho sob a contingência em que a variabilidade era permitida, mas não exigida.

De acordo com Hineline (1984; 1992), a análise do comportamento auto-interpretativo pode, e deve, ser parte da análise do comportamento em humanos, sem que isso signifique um retorno aos termos cognitivos. Se discriminar é se comportar de maneira diferente em diferentes situações (Catania, 1992), pode-se separar em dois blocos os comportamentos aqui observados: os discriminativos, compostos pelas respostas de pressão às teclas P e Q que ocorreram de forma diferenciada dependendo da contingência em vigor, e os verbais não discriminativos, que descreveram iguais "regras" para diferentes contingências.

Um teste indireto de que regras (auto-formuladas) exerceram controle sobre o desempenho não verbal dos sujeitos desse estudo seria refazer o experimento manipulando diferentes regras (fornecidas pelo experimentador), compatíveis ou não com as contingências em vigor, e verificar se elas exerceriam algum controle sobre o comportamento variável. O Experimento 2 foi realizado com o objetivo de realizar esse teste. Para tanto, mantiveram-se as contingências semelhantes às utilizadas no Experimento 1, com a adição de algumas instruções ("regras") que descreviam, correta ou incorretamente, essas contingências.

Experimento 2

Método

Sujeitos

Vinte estudantes com iguais características dos anteriores, sendo 10 homens e 10 mulheres, com idade entre 17 e 22 anos, sem experiência prévia com essa pesquisa.

Equipamento

Os equipamentos e software utilizados foram os mesmos do experimento anterior.

Procedimento

Cada sujeito foi exposto a apenas uma contingência de reforçamento (VAR ou ACO) ao longo de dez jogos consecutivos, da mesma forma que descrito no Experimento 1. A única diferença foi relativa à instrução fornecida antes de iniciar a sessão: a primeira parte dessa instrução foi igual à do Experimento 1, seguida de um complemento que descrevia uma das contingências manipuladas (regra), conforme segue.

...Cada 4 respostas formam uma seqüência, havendo 16 seqüências possíveis por causa das combinações de Q e P em 4 respostas. Para atingir melhor o objetivo, você deve utilizar o maior número de seqüências, evitando repetir as seqüências que você fez mais recentemente. (regra que descreve a contingência "var")

...Cada 4 respostas formam uma seqüência, havendo 16 seqüências possíveis por causa das combinações de Q e P em 4 respostas. Independente de como você montar a seqüência, aparecerá a carinha ou só um barulho. As carinhas vão preenchendo o triângulo. Depois do 10º triângulo, acaba a sessão. Lembre-se: o aparecimento das carinhas NÃO depende da forma como você monta a seqüência. A única exigência é que você faça seqüências de 4 respostas. (regra que descreve a contingência "aco").

Metade dos sujeitos foi exposta à contingência VAR e metade à contingência ACO. Em cada contingência, metade dos sujeitos recebeu a instrução que descrevia corretamente a contingência em vigor e a outra metade recebeu instrução incorreta, ou seja, a que descrevia a contingência alternativa. A combinação entre as contingências (VAR e ACO) e as "regras" fornecidas pelo experimentador (var e aco) caracterizou os quatro grupos (n = 5) utilizados nesse experimento: grupos Vv, Va, Av e Aa.

Foram analisados os índices U e as repostas às questões formuladas ao final da sessão: "A instrução ajudou você a atingir os objetivos? O que você fez para que aparecessem as carinhas?"

Resultados

A Figura 2 mostra os índices de U acumulado apresentados ao longo dos jogos pelos sujeitos dos quatro grupos. Na sua parte superior, esses índices são apresentados dentro da amplitude possível (0,0 a 1,0), enquanto que, na parte inferior, os mesmos dados são plotados considerando-se o valor mínimo de U=0,95, ou seja, dentro da amplitude 0,95 a 1,0. A análise da parte superior da figura mostra que apesar de todos sujeitos terem apresentado altos índices de variabilidade ao longo da sessão, ocorreram diferenças entre os grupos como função das contingências e das regras fornecidas, sendo o efeito das primeiras o mais acentuado. De uma maneira geral, os sujeitos expostos ao reforçamento de variabilidade (grupos Vv e Va) apresentaram índices U mais elevados e homogêneos, enquanto que os indivíduos submetidos ao reforçamento independente da variabilidade (Aa e Av) apresentaram menores índices de U e uma maior diversidade intra-grupo. Essa diferença, decorrente da contingência, sofreu uma pequena interferência da regra fornecida: os desempenhos extremos e opostos foram aqueles dos grupos que receberam regras compatíveis com a contingência (grupos Vv e Aa), enquanto que grupos que receberam regras conflitantes com a contingência (grupos Va e Av) apresentaram desempenhos intermediários.


Essas diferenças entre os grupos ficam mais evidentes na parte inferior dessa Figura 2, que arbitra um U mínimo de 0,95 para considerar o comportamento como variável. Verifica-se que todos sujeitos expostos à contingência VAR apresentaram padrão de variabilidade, alguns com valores crescentes, nos jogos finais. Contrariamente, nenhum dos sujeitos submetidos à contingência ACO apresentou esse padrão nos jogos finais, sendo que apenas dois sujeitos de cada um desses grupos apresentou variabilidade em alguns poucos jogos no decorrer da sessão, sem sustentar esse padrão nos jogos finais. Conforme apontado acima, além da contingência, a regra influenciou parcialmente o comportamento: no grupo em que houve concordância entre regra e contingência de variabilidade (grupo Vv) o padrão variável se instalou para todos os sujeitos desde o 3º jogo, enquanto que no grupo onde a regra era contrária à contingência de variação (grupo Va), esse padrão foi obtido apenas no 7º jogo. Apesar de os sujeitos dos grupos submetidos à contingência ACO poucas vezes terem ultrapassado o valor de U = 0,95, esse padrão foi mais freqüente quando a regra descrevia a necessidade de variação da seqüência emitida (grupo Av) do que quando descrevia a irrelevância da variabilidade (grupo Aa).

Através dos relatos verbais verificou-se que a maioria dos sujeitos considerou que a instrução não foi suficiente para garantir os acertos e por isso eles formularam hipóteses próprias para descrever a lógica do jogo. Exemplos desses relatos são apresentados na Tabela 2, utilizando-se a descrição de um sujeito de cada grupo. Da mesma forma que no Experimento 1, verificou-se que as hipóteses auto-formuladas não se correlacionaram com a contingência em vigor, nem com o grau de variabilidade apresentado por eles (índices U, apresentados nessa Tabela 2).

Discussão

Os resultados desse experimento indicam que as regras fornecidas pelo experimentador demonstraram um controle apenas parcial da variabilidade, potencializando ou diminuindo, em pequena escala, o controle exercido pela contingência (VAR), sem impedir níveis relativamente altos de variabilidade na condição em que ela não era exigida (ACO). Assim, mais uma vez ficou demonstrado que a contingência VAR controla altos níveis de variabilidade, independente das diferenças individuais existentes entre esses sujeitos. Por outro lado, nossos resultados não foram conclusivos no que diz respeito ao controle do comportamento na condição em que o reforçamento foi independente da variação. Apesar de não descartar totalmente a hipótese formulada no experimento anterior de que a variabilidade observada durante essa fase seria controlada por regras (auto-formuladas), os resultados atuais não a fortalecem. Se as regras fossem a principal fonte de controle desse comportamento, seria de se esperar que o fornecimento delas facilitasse a discriminação da contingência, de forma que frente à contingência ACO pouca variabilidade fosse apresentada. Contudo, sob essa contingência, o que se obteve foi uma padrão intermediário de variabilidade, semelhante ao descrito no Experimento 1. Isso significa que um mesmo padrão de comportamento se repetiu tanto na ausência de regras descritivas da contingência, fornecidas pelo experimentador, como no contexto em que foram dadas regras verdadeiras ou falsas. Mesmo considerando-se que os resultados desse experimento não podem ser generalizados pois aplicam-se apenas às regras aqui fornecidas, eles não confirmam (embora não neguem) que os níveis de variabilidade sob a contingência ACO sejam controlados por regras.

O fornecimento das regras não reduziu a dissociação entre a descrição verbal da contingência e o seu desempenho frente a ela, descrita no Experimento 1. Aparentemente, ambos os comportamentos aqui observados - verbal e escolha entre P e Q - foram controlados por fatores diversos, que em nenhum caso foi a regra (instrução) fornecida. Tais resultados coincidem com os apresentados por Simonasi, Oliveira & Gosh (1997) que, comparando a relação entre a regra fornecida (instrução), a formulação da regra pelo sujeito (descrição da contingência) e o seu desempenho, obtiveram que a descrição da contingência não se correlacionava com o desempenho frente à contingência.

Assim, pode-se dizer que, apesar de o reforçamento operante da variação das seqüências haver controlado taxas de variabilidade maiores e mais estáveis, ele não controlou o comportamento verbal dos sujeitos (ou seja, a descrição feita dessa mesma contingência ao final da sessão). Da mesma maneira, o comportamento verbal, apresentado ao final da sessão, não se correlacionou com o comportamento de escolher entre P e Q apresentado em cada jogo. Portanto, esse conjunto de resultados sugere que, dentre as variáveis manipuladas nesse experimento, foi o reforçamento da variabilidade, e não a regra, a fonte mais poderosa de produção de comportamento variável em todos os sujeitos, confirmando a análise de Page & Neuringer (1985) sobre a natureza operante dessa variabilidade.

Se podemos afirmar que tanto as contingências como as instruções foram inócuas para a descrição da contingência feita pelos sujeitos, não fica claro nesse estudo o que controlou tal comportamento. Como discutido no Experimento 1, a história dos estudantes (envolvendo atividades em computadores, solução de problemas matemáticos e outros) pode ser uma das variáveis responsáveis pela descrição verbal imprecisa das contingências em vigor, devido à generalizações de "regras" anteriormente experimentadas.

Comparativamente com os estudos realizados em animais, os dados obtidos em ambos os experimentos mostram algumas diferenças, especificamente no comportamento apresentado na ausência de reforçamento da variabilidade. Sem ter história de variabilidade reforçada, os animais apresentaram padrão altamente repetitivo (U próximo a 0,0) quando a variabilidade não foi exigida (Hunziker & cols. 1998), enquanto que os estudantes, sujeitos do atual estudo, nunca apresentaram repetição sistemática das seqüências. As causas dessa diferença entre espécies podem ser múltiplas: relativas ao reforço utilizado, à natureza da resposta estudada, entre outras. Por exemplo, no que diz respeito aos reforços utilizados nos estudos com animais e humanos, apesar da gota de água (liberada para o rato privado) e a apresentação da figura indicativa de certo (para os estudantes universitários) serem consideradas ambas reforçadoras na situação experimental, dificilmente pode-se afirmar que tenham total equivalência funcional. O mesmo pode ser discutido quanto à natureza da resposta de pressão à barra ou de pressão de teclas do computador, para ratos e estudantes universitários, respectivamente. Embora essas sejam diferenças inevitáveis quando se faz um estudo comparativo entre espécies, não se pode deixar de apontá-las como possíveis fontes de diferenças nos resultados obtidos, de forma que em estudo futuros elas possam ser reduzidas através de procedimentos que as tornem mais equivalentes funcionalmente.

A análise qualitativa das seqüências emitidas detalha algumas diferenças entre animais e humanos. Nos estudos com ratos, observou-se que, não sendo exigida a variabilidade para reforçamento, os animais tendiam a emitir seqüências que envolviam respostas alocadas num único operandum, ou seja, todas as respostas na barra direita ou na barra esquerda. Isso significa que não emitiam respostas de mudança de uma para outra barra (Hunziker e cols., 1996; 1998; Barba & Hunziker, no prelo). A análise feita nesses estudos sugeriu uma otimização do sujeito, ou "economia de respostas": seqüências sem alternações entre barras eram compostas por apenas quatro resposta de pressão, enquanto que cada mudança de barra (que por si só é uma resposta) implicava em maior número de respostas emitidas e maior demora para se obter o reforço. Portanto, não havendo exigência de variação, os sujeitos se comportavam de forma "econômica", ou seja, escolhiam a opção que envolvia menor número de respostas e maior proximidade temporal do reforço. Essa lógica aparentemente não se aplicou aos sujeitos humanos aqui testados, que apresentaram diferentes seqüências que envolviam alta freqüência de resposta de mudança entre as teclas Q ou P. Qual o reforço para esse padrão comportamental?

Pode-se sugerir que para humanos é aversivo fazer repetidamente uma mesma atividade motora, como uma repetição mecânica. Se assim for, desde que as alternativas de mudança sejam "fáceis" elas se tornam altamente prováveis pois estariam sendo reforçadas negativamente por evitar essa aversividade inerente à repetição (verbalmente descrita como "monótona"). Para os estudantes, teclar Q ou P (respostas com igual custo para mão esquerda e direita, respectivamente) implicava em grau de esforço pequeno, não comparável ao deslocamento corporal do rato para emitir resposta de pressão às barras esquerda e direita. Assim, se mudar de tecla não implicava em maior esforço do que apenas repetir, e se repetir era aversivo, é altamente provável que os estudantes tenham apresentado alta freqüência de respostas de mudança. Por sua vez, respostas de mudança geram variabilidade a menos que elas ocorram sistematicamente na mesma posição da seqüência, o que seria provável apenas se esse padrão repetitivo fosse critério para reforçamento..

Uma dificuldade praticamente intransponível nos estudos comparativos entre humanos e animais é o controle sobre a história de reforçamento na fase pré-experimental: ele é relativamente alto nos trabalhos com animais e quase inexistente nos estudos em humanos. Quando manipulada experimentalmente, pode-se identificar quão relevante é essa variável na determinação do comportamento. Por exemplo, os resultados dos dois experimentos aqui apresentados, com humanos, replicaram os dados obtidos anteriormente em animais mostrando que os níveis de variabilidade podem ser função da história de reforçamento: os estudantes apresentaram maior variabilidade em ACO quando essa condição sucedeu a experiência em VAR, da mesma forma que ratos apresentaram maior variabilidade sob o esquema de liberação do reforço independente da variação quando este sucedeu uma fase variabilidade reforçada (Hunziker & cols., 1998). Se essa pequena história criada no contexto experimental foi suficiente para produzir diferenças no comportamento, pode-se considerar que, via de regra, os sujeitos humanos, que trazem longas e diversas histórias de reforçamento, têm possivelmente maior interferência dessa variável sobre a contingência atual do que os sujeitos infra-humanos, cuja história pode ser mais restrita na condição pré-experimental. No caso de sujeitos humanos com pouca idade ou mesmo deficiências comportamentais, essa comparação pode ser mais direta dada a menor diversidade e longevidade das histórias de reforçamento, como no estudo com crianças portadoras de déficit de atenção por hiperatividade (human attention deficit hyperactivity disorder, ou ADHD) que passaram a variar mais, independentemente do reforçamento, após uma história de variabilidade reforçada (Saldana & Neuringer, 1998).

De qualquer maneira, essa limitação, inerente aos estudos comparativos, destaca ainda mais a relevância de replicações obtidas entre espécies, tal como a de que o reforçamento contingente à variabilidade de seqüências produz alta probabilidade de comportamento variável quer em animais ou em sujeitos humanos, adultos ou crianças, portadores ou não de patologias. Estudos futuros podem reduzir as diferenças funcionais aqui apontadas de forma a identificar se, além da contingência operante, outras variáveis controlam, de forma diferenciada, o comportamento variável em animais e humanos.

Recebido em 18.01.2001

Primeira decisão editorial em 07.12.2001

Versão final em 07.03.2002

Aceito em 10.08.2002

  • Antonitis, J.J. (1951). Response variability in rat during conditioning extinction, and reconditioning. Journal of Experimental Psychology, 42, 273-281.
  • Attneave, F. (1959). Applications of Information Theory to Psychology: A Summary of Basic Concepts, Methods and Results. New York: Holt-Dryden Book: Henry Holt.
  • Bakan, P. (1960). The capacity for generating information by randomization. Quarterly Journal of Experimental Psychology, 18, 119-129.
  • Barba, L.S. (1997). Variabilidade Comportamental Aprendida Dissertação de Mestrado, Universidade de São Paulo, São Paulo.
  • Barba, L.S. & Hunziker, M.H.L. (no prelo). Variabilidade comportamental produzida por dois esquemas de reforçamento. Acta Comportamentalia.
  • Catania, A.C. (1992). Learning. Englewood Cliffs, N.J.: Prentice-Hall, Inc. (3a. edição).
  • Eckerman, D. & Lanson, R. (1969). Variability of response location for pigeons responding under continuous reinforcement intermittent reinforcement, and extinction. Journal of the Experimental Analysis of Behavior, 12, 73-80.
  • Evans, F.J. & Grahan, C. (1980). Subjective random number generation and attention deployment during acquisition and over learning of a motor skill. Bulletin of the Psychonomic Society, 15, 391-394.
  • de Rose, J.C. (1994). O livro Verbal Behavior de Skinner e a pesquisa empírica sobre Comportamento Verbal. Psicologia: Teoria e Pesquisa, 10 , 495-510.
  • Galbicka, G. (1994). Shaping in the 21st century: Moving percentile schedules into applied settings. Journal of Applied Behavior Analysis, 27, 739-760.
  • Hineline, P.H. (1984). Can a statement in cognitive terms be a behavior-analytic interpretation? The Behavior Analyst, 7, 97-100.
  • Hineline, P.H. (1992). A self-interpretative behavior analysis. American Psychologist, 47, 1274-1286.
  • Hunziker, M.H.L., Saldana, L. & Neuringer, A. (1996). Behavioral Variability in SHR and WKI Rats as a Function of Rearing, Environment, and Reinforcement Contingence. Journal of the Experimental Analysis of Behavior, 65, 129-144.
  • Hunziker, M.H.L., Caramori, F.C., Silva, A.P. & Barba, L.S. (1998). Efeitos da história de reforçamento na variabilidade comportamental. Psicologia: Teoria e Pesquisa, 14, 149-159.
  • Hunziker, M.H.L. & Moreno, R. (2000). Análise da noção de variabilidade comportamental. Psicologia: Teoria e Pesquisa, 16, 135-143.
  • Machado, A. (1989). Operant conditioning of behavioral variability using percentile reinforcement schedule. Journal of the Experimental Analysis of Behavior, 52,155-166.
  • Machado, A. (1993). Learning variable and stereotypical sequences of responses: some data and new model. Behavioral Processes, 30,103-130.
  • Machado, A. (1997). Increasing the variability of response sequences in pigeons by adjusting the frequency of switching between two keys. Journal of the Experimental Analysis of Behavior, 68, 1-25.
  • Manabe, K., Kawashima, T. & Staddon, J.E.R. (1995). Differential vocalization in budgerigars: toward an experimental analysis of naming. Journal of the Experimental Analysis of Behavior, 63, 111-126.
  • Miller, N. & Neuringer, A. (2000). Reinforcing variability in adolescents with autism. Journal of Applied Behavior Analysis, 33, 151-165.
  • Mook, D.M., Jeffrey, J. & Neuringer, A. (1993). Spontaneously hypertensive rats (SHR) readily learn to vary but not repeat instrumental responses. Behavioral and Neural Biology, 59, 126-135.
  • Morgan, L. & Neuringer, A. (1990). Behavioral variability as a function of response topography and reinforcement contingency. Animal Learning and Behavior, 18, 257-263.
  • Neuringer, A. (1986). Can people behave "randomly"?: The role of feedback. Journal of Experimental Psychology: General, 115, 62-75.
  • Neuringer, A. (1991). Operant variability and repetition as functions of interresponse time. Journal of Experimental Psychology: Animal Behavior Processes, 17, 3-12.
  • Neuringer, A. (1992). Choosing to vary and repeat. Psychological Science, 3, 246-250.
  • Neuringer, A. (1993). Reinforced variation and selection. Animal Learning and Behavior, 21, 83-91.
  • Neuringer, A., Deiss, C. & Imig, S. (2000). Comparing choices and variations in people and rats: Two teaching experiments. Behavior Research Methods, Instruments, and Computers, 32, 407-416.
  • Neuringer, A., Deiss, C. & Olson, G. (2000). Reinforced variability and operant learning. Journal of Experimental Psychology: Animal Behavior Processes, 26,98-111.
  • Neuringer, A. & Voss, C. (1993). Approximating chaotic behavior. Psychological Science, 4, 113-119.
  • Page, S. & Neuringer, A. (1985). Variability is an operant. Journal of Experimental Psychology: Animal Behavior Processes, 11, 429-452.
  • Rath, G.J. (1966). Randomization by humans. American Journal of Psychology, 79, 97-103.
  • Saldana, L. & Neuringer, A. (1998). Is instrumental variability abnormally high in children exhibiting ADHD and aggressive behavior? Behavioural Brain Research, 94, 51-59.
  • Schwartz, B. (1982). Failure to produce response variability with reinforcement. Journal of the Experimental Analysis of Behavior, 37, 171-181.
  • Simonasi, L.E., Oliveira, C.I. & Gosh, C.S. (1997). Exposição a contingências, conteúdo de instrução e formulação de regras. Psicologia: Teoria e Pesquisa, 13, 189-195.
  • Skinner, B.F. (1981). Selection by consequences. Science, 213, 501-504.
  • Stokes, P.D. (1995). Learned variability. Animal Learning and Behavior, 23, 164-176.
  • Tune, G.S. (1964). A brief survey of variables that influence random generation. Perceptual and Motor Skills, 18, 705-710.
  • Wagenaar, W.A. (1972). Generation of random sequences in human subjects: A critical survey of literature. Psychological Bulletin, 77, 65-72.
  • Endereço para correspondência
    Maria Helena Leite Hunziker
    Departamento de Psicologia Experimental, Universidade de São Paulo
    Av. Prof. Mello Moraes, 1721
    CEP 05508-900, São Paulo, SP
    E-mail: (
  • 1
    Este trabalho foi subvencionado pelo CNPq (Projeto Integrado de Pesquisa, proc. no. 523.612/95-8). Partes dessa pesquisa foram apresentadas no 4th International Congress on Behaviorism and the Sciences of Behavior (Sevilha, Espanha, 1998), na XXVIII Reunião Anual de Psicologia (Ribeirão Preto, 1998) e no 8
    o. Simpósio Internacional de Iniciação Científica da USP (São Paulo, 2000).
  • 2
    Endereço: Departamento de Psicologia Experimental - Universidade de São Paulo, Av. Prof. Mello Moraes, 1721, CEP 05508-900 - São Paulo – SP (
  • Datas de Publicação

    • Publicação nesta coleção
      26 Ago 2003
    • Data do Fascículo
      Ago 2002

    Histórico

    • Aceito
      10 Ago 2002
    • Recebido
      18 Jan 2001
    Instituto de Psicologia, Universidade de Brasília Instituto de Psicologia, Universidade de Brasília, 70910-900 - Brasília - DF - Brazil, Tel./Fax: (061) 274-6455 - Brasília - DF - Brazil
    E-mail: revistaptp@gmail.com