Acessibilidade / Reportar erro

Reaparecimento de sequências com diferentes números de respostas em contextos de extinção e de variação

RESUMO

O reaparecimento de uma resposta previamente extinta quando os reforços para uma resposta alternativa são descontinuados é denominado ressurgência. Foram investigados os efeitos de três variáveis sobre o reaparecimento de sequências de respostas: probabilidade da sequência (alta e baixa), contexto de teste (extinção e variação operante) e número de respostas por sequência (três e cinco). Sequências muito prováveis reapareceram mais frequentemente que sequências pouco prováveis, o reaparecimento da sequência alvo foi mais frequente no contexto de extinção do que de variação e o reaparecimento da sequência alvo variou inversamente ao número de respostas por sequência. O reaparecimento da sequência alvo, entretanto, não foi conceitualizado como ressurgência, uma vez que sua frequência foi menor que a das sequências controle.

Palavras-chave:
ressurgência; probabilidade da sequência; contexto de teste; número de respostas por sequência; humanos

ABSTRACT

The reappearance of a response previously extinguished when an alternative response no longer produces reinforcers is called resurgence. The effects of three variables on the reappearance of response sequences - sequence probability (high and low), context of test (extinction and operant variation) and number of responses per sequence (three and five responses) - were investigated. Sequences with high probability reappeared more often than sequences with low probability, the reappearance of the target sequence was more frequent under extinction than under variation, and the reappearance of the target sequence varied inversely with the number of responses by sequence. The reappearance of the target sequence was not conceptualized as resurgence because its frequency was lower than that of the control sequences.

Keywords:
resurgence; sequence probability; context of test; number of responses per sequence; humans

Ressurgência consiste no reaparecimento de uma resposta previamente extinta quando uma resposta alternativa, recentemente reforçada, é extinta. O procedimento padrão para avaliar a ressurgência inclui três fases. Na Fase de Treino, uma resposta alvo (R1) é reforçada. Na Fase de Eliminação, R1 é extinta enquanto outra resposta (R2) passa a ser reforçada. Finalmente, na Fase de Teste, R2, assim como R1, não produz reforços. O reaparecimento da R1, a despeito da ausência de reforços programados, caracteriza a ressurgência (Bruzek, Thompson & Peters, 2009Bruzek, J. L., Thompson, R. H., & Peters, L. C. (2009). Resurgence of infant caregiving responses. Journal of the Experimental Analysis of Behavior, 92, 327-343.; Epstein, 1985Epstein, R. (1985). Extinction-induced resurgence: Preliminary investigations and possible applications. The Psychological Record, 35, 143-153.; Sweeney & Shahan, 2016Sweeney, M. M., & Shahan, T. A. (2016). Resurgence of target responding does not exceed increases in inactive responding in a forced-choice alternative reinforcement procedure in humans. Behavioural Processes, 124, 80-92.). Variações desse procedimento têm mostrado que a ressurgência ocorre não somente quando a R2 é extinta, mas também quando há redução na frequência (Lieving & Lattal, 2003Lieving, G. A., & Lattal, K. A. (2003). Recency, repeatability, and reinforce retrenchment: An experimental analysis of resurgence. Journal of the Experimental Analysis of Behavior, 80, 217-233.) e atraso (Jarmolowicz & Lattal, 2014Jarmolowicz, D. P., & Lattal, K. A. (2014). Resurgence under delayed reinforcement. Psychological Record, 64, 189-193.) do reforço. Conforme ressaltado por Jarmolowicz e Lattal, os estudos de ressurgência têm contribuído para a compreensão dos efeitos da extinção e da história de reforçamento e também para a prevenção da recorrência de comportamentos problema.

Na maioria dos estudos de ressurgência, a unidade de resposta compreende uma única resposta, quer essa resposta seja pressionar uma barra (e.g., Winterbauer & Bouton, 2010Winterbauer, N. E., & Bouton, M. E. (2010). Mechanisms of resurgence of an extinguished instrumental behavior. Journal of Experimental Psychology, 36, 343-353.), bicar um disco (e.g., Cançado & Lattal, 2011Cançado, C. R. X., & Lattal, A. K. (2011). Resurgence of temporal patterns of responding. Journal of the Experimental Analysis of Behavior, 95, 271-287.) ou pressionar a tecla de um teclado de computador (e.g., Alessandri, Lattal & Cançado, 2015Alessandri, J., Lattal, K. A., & Cançado, C. R. X. (2015). The recurrence of negatively reinforced responding of humans. Journal of the Experimental Analysis of Behavior, 104, 211-222.). Poucos estudos, no entanto, foram realizados com unidades comportamentais que compreendem um maior número de respostas - por exemplo, unidades compostas por sequências de respostas. Em um desses estudos, Bachá-Méndez, Reid e Mendoza-Soylovna (2007Bachá-Méndez, G., Reid, A. K., & Mendoza-Soylovna, A. (2007). Resurgence of integrated behavioral units. Journal of the Experimental Analysis of Behavior, 87, 5-24., Experimento 2) alteraram o procedimento padrão de ressurgência expondo ratos a quatro fases em que o reforço era sempre contingente à emissão de uma sequência específica de duas respostas, distribuídas em duas barras (esquerda e direita, E e D, respectivamente). Na primeira fase, para dois sujeitos, o reforço era contingente à emissão da sequência ED e, para os outros dois, à emissão da sequência DE. Na segunda fase, o reforço era contingente à emissão de uma sequência homogênea (EE ou DD), ao passo que as demais estavam sob extinção. Na terceira fase, outra sequência homogênea era reforçada de modo que reforços contingentes à emissão da sequência EE (ou DD) na fase anterior passaram a ser contingentes à emissão da sequência DD (ou EE). As demais sequências não eram seguidas por reforço. Na última fase, o reforço era contingente à emissão de uma sequência heterogênea oposta àquela aprendida na primeira fase. Na terceira e na quarta fase, as quais permitiam a avaliação do reaparecimento de sequências, verificou-se a ressurgência da sequência heterogênea treinada na primeira fase para todos os sujeitos.

A ressurgência de sequências de três respostas foi investigada por Sánchez-Carrasco e Nieto (2005Sánchez-Carrasco, L. S., & Nieto, J. (2005). Resurgence of three response sequences in rats. Revista Mexicana de Análisisde la Conducta, 31, 215-226.). Nesse estudo, ratos foram distribuídos em dois grupos que diferiam quanto à sequência de respostas reforçada na Fase de Treino. Para um grupo, a sequência DED era reforçada e, para o outro grupo, o mesmo ocorria com a sequência DEE. Na Fase de Eliminação, uma sequência alternativa era continuamente reforçada (EEE) para os dois grupos, enquanto a sequência de respostas aprendida na fase anterior estava sob extinção. Na Fase de Teste, nenhuma das sequências de respostas possíveis era seguida de reforço. Para todos os sujeitos, a sequência treinada em cada um dos grupos na primeira fase (DED ou DEE) reapareceu com uma frequência maior do que a das demais sequências possíveis. Ressurgência de sequências de três respostas também foi observada por Reed e Morgan (2006Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307-315.).

No estudo de Villas-Bôas (2006Villas-Bôas, A. (2006). Efeitos do procedimento de extinção sobre o responder em ratos: sequências de respostas como operante. Dissertação de Mestrado, Universidade de São Paulo, São Paulo.), ratos, distribuídos em dois grupos, aprenderam a emitir quatro sequências de quatro respostas distribuídas em duas barras. Para o Grupo 1, cada sequência foi treinada e, em seguida, extinta, antes do treino da próxima sequência; para o Grupo 2, a extinção de uma sequência foi feita simultaneamente ao treino da próxima sequência (não havia extinção entre as fases de treino). Na última extinção de cada grupo, foi observado que as sequências previamente treinadas reapareceram com maior frequência para o Grupo 2 do que para o Grupo 1. Não houve evidência, entretanto, de que as quatro sequências treinadas reapareceram mais frequentemente do que as demais sequências possíveis, de modo que não é factível uma avaliação inequívoca da ocorrência ou não de ressurgência.

Os resultados de Villas-Bôas (2006Villas-Bôas, A. (2006). Efeitos do procedimento de extinção sobre o responder em ratos: sequências de respostas como operante. Dissertação de Mestrado, Universidade de São Paulo, São Paulo.) não replicam aqueles de Bachá-Méndez et al. (2007Bachá-Méndez, G., Reid, A. K., & Mendoza-Soylovna, A. (2007). Resurgence of integrated behavioral units. Journal of the Experimental Analysis of Behavior, 87, 5-24.), Sánchez-Carrasco e Nieto (2005Sánchez-Carrasco, L. S., & Nieto, J. (2005). Resurgence of three response sequences in rats. Revista Mexicana de Análisisde la Conducta, 31, 215-226.) e Reed e Morgan (2006Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307-315.), os quais observaram ressurgência de sequências de respostas. Essa inconsistência pode ter ocorrido em razão de fatores procedimentais (e.g., critério de mudança de fases, número de reforços obtidos em cada fase), mas também devido a diferenças no número de respostas por sequência ou, alternativamente, no universo de sequências possíveis. Bachá-Méndez et al.Bachá-Méndez, G., Reid, A. K., & Mendoza-Soylovna, A. (2007). Resurgence of integrated behavioral units. Journal of the Experimental Analysis of Behavior, 87, 5-24. investigaram sequências com duas respostas (i.e., quatro sequências possíveis), Sánchez-Carrasco e Nieto e Reed e Morgan usaram sequências de três respostas (i.e., oito sequências possíveis) e Villas-Bôas utilizou sequências de quatro respostas (i.e., 16 sequências possíveis). Dessa forma, é razoável supor que, quanto maior o número de respostas por sequência (e, consequentemente, o número de sequências possíveis), menos provável a ressurgência da sequência alvo. Essa variável foi diretamente investigada no presente estudo por meio da comparação de sequências com três e cinco respostas.

Uma segunda variável pode ter contribuído para a diferença entre os resultados de Villas-Bôas (2006Villas-Bôas, A. (2006). Efeitos do procedimento de extinção sobre o responder em ratos: sequências de respostas como operante. Dissertação de Mestrado, Universidade de São Paulo, São Paulo.), Bachá-Méndez et al. (2007Bachá-Méndez, G., Reid, A. K., & Mendoza-Soylovna, A. (2007). Resurgence of integrated behavioral units. Journal of the Experimental Analysis of Behavior, 87, 5-24.), Sánchez-Carrasco e Nieto (2005Sánchez-Carrasco, L. S., & Nieto, J. (2005). Resurgence of three response sequences in rats. Revista Mexicana de Análisisde la Conducta, 31, 215-226.) e Reed e Morgan (2006Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307-315.), a saber, a probabilidade de emissão de cada sequência possível. Quando os reforços são liberados de acordo com um esquema de reforçamento contínuo (CRF), independentemente da topografia da sequência, observa-se, por exemplo, que as sequências EEEE e DDDD são as mais prováveis dentre as 16 sequências possíveis, e que a sequência DEEE é mais provável do que a sequência EEED (Neuringer, Deiss & Olson, 2000Neuringer, A., Deiss, C., & Olson, G. (2000). Reinforced variability and operant learning. Journal of Experimental Psychology: Animal Behavior Processes, 26, 98-111.). É possível que essa frequência diferencial reflita o grau de dificuldade na aprendizagem dessas sequências. No caso da sequência DEEE, o organismo aprende que a primeira resposta deve ser emitida em um operandum, e as demais, no outro; no caso da sequência EEED, entretanto, o organismo deve discriminar o momento exato (após três respostas) da mudança de um operandum para o outro (Neuringer, 1993Neuringer, A. (1993). Reinforced variation and selection. Animal Learning & Behavior, 21, 83-91.). Considerando que, em um universo de sequências possíveis, algumas são mais prováveis do que outras e que essa variável não foi isolada nos estudos aqui descritos, o presente estudo avaliou a contribuição da probabilidade (alta e baixa) de uma sequência alvo sobre a ressurgência dessa sequência.

A ressurgência é comumente observada em um contexto que induz variabilidade comportamental, isto é, em um contexto de extinção. Exceções seriam os estudos de Lieving e Lattal (2003Lieving, G. A., & Lattal, K. A. (2003). Recency, repeatability, and reinforce retrenchment: An experimental analysis of resurgence. Journal of the Experimental Analysis of Behavior, 80, 217-233., Experimento 4) e de Jarmolowicz e Lattal (2014Jarmolowicz, D. P., & Lattal, K. A. (2014). Resurgence under delayed reinforcement. Psychological Record, 64, 189-193.). Mesmo nesses casos, os reforços eram apresentados aperiodicamente na Fase de Teste e, assim, a contingência compreendia períodos de extinção. A variabilidade comportamental, entretanto, pode ser produzida diretamente por contingências de reforçamento. Ou seja, é possível gerar sequências variadas tornando o reforço contingente à emissão de (a) sequências diferentes daquelas anteriormente reforçadas (Page & Neuringer, 1985Page, S., & Neuringer, A. (1985). Variability is an operant? Journal of Experimental Psychology: Animal Behavior, 11, 429-452.) ou (b) sequências pouco frequentes e pouco recentes (Souza & Abreu-Rodrigues, 2006Souza, A. S., & Abreu-Rodrigues, J. (2006). Discriminative properties of vary and repeat contingencies. Behavioural Processes, 85, 116-125.). Diante disso, o terceiro objetivo do presente estudo consistiu em investigar se o reforçamento explícito da variação na emissão de outras sequências (que não aquelas reforçadas nas fases de Treino e de Eliminação), em comparação com a variação induzida pela extinção, afetaria diferencialmente a ressurgência da S1.

Finalmente, o presente estudo investigou a generalização entre espécies dos resultados das pesquisas sobre ressurgência de sequências de respostas. Até o momento, a ressurgência de sequências foi investigada apenas com ratos (Bachá-Méndez et al., 2007Bachá-Méndez, G., Reid, A. K., & Mendoza-Soylovna, A. (2007). Resurgence of integrated behavioral units. Journal of the Experimental Analysis of Behavior, 87, 5-24.; Reed & Morgan, 2006Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307-315.; Sánchez-Carrasco & Nieto, 2005Sánchez-Carrasco, L. S., & Nieto, J. (2005). Resurgence of three response sequences in rats. Revista Mexicana de Análisisde la Conducta, 31, 215-226.; Villas-Bôas, 2006Villas-Bôas, A. (2006). Efeitos do procedimento de extinção sobre o responder em ratos: sequências de respostas como operante. Dissertação de Mestrado, Universidade de São Paulo, São Paulo.) e, no presente estudo, o interesse recaiu sobre organismos humanos.

Diante dessas considerações, o presente trabalho compreendeu dois experimentos, os quais tinham em comum o interesse na ressurgência de sequências de respostas. O Experimento 1 verificou se a ressurgência de uma sequência com cinco respostas seria diferencialmente afetada por sua probabilidade de ocorrência (alta ou baixa) e pelo contexto em vigor na Fase de Teste (variabilidade induzida pela extinção e variabilidade diretamente reforçada). O Experimento 2 teve os mesmos objetivos do Experimento 1; a unidade comportamental consistiu, no entanto, em uma sequência com três respostas.

Experimento 1

O Experimento 1 teve dois objetivos: (1) avaliar se a probabilidade de ocorrência (alta ou baixa) de uma sequência com cinco respostas interfere em sua ressurgência, e (2) verificar se a ressurgência dessa sequência é diferencialmente afetada pelas condições experimentais (extinção e variação operante) da Fase de Teste.

Método

Participantes. Vinte estudantes universitários, de ambos os sexos e de diferentes cursos de graduação, participaram desse experimento. Todos os participantes leram e assinaram o Termo de Consentimento Livre e Esclarecido antes de iniciar a sessão experimental. Após a sessão, os estudantes receberam, por sua participação, pontos em disciplinas do Departamento de Processos Psicológicos Básicos do Curso de Psicologia. O projeto foi aprovado pelo Comitê de Ética em Pesquisa com Seres Humanos da Faculdade de Ciências da Saúde da Universidade de Brasília (Processo 045/12).

Ambiente e Equipamento. O experimento foi realizado em uma sala com 2,30 m x 1,80 m, com duas mesas e duas cadeiras, além de um microcomputador e uma impressora matricial sobre uma das mesas. Um programa desenvolvido na linguagem Visual Basic 6® foi utilizado para apresentar os eventos experimentais e registrar os dados.

Procedimento. Uma única instrução foi apresentada na tela do computador no início da sessão:

Este é um experimento sobre aprendizagem. Sua tarefa consiste em formar sequências de 5 respostas. Para tal, você deve utilizar as teclas F e J do teclado. A cada letra pressionada, aparecerá um círculo colorido na tela, de forma que você poderá acompanhar em que parte da sequência você se encontra.

Existem 32 sequências possíveis. Para cada sequência correta, você receberá 10 pontos e a cada 100 pontos, você receberá uma ficha para participar de um sorteio ao final do experimento. O computador mostrará o total de pontos recebidos e o número de fichas que irá receber.

Quanto estiver pronto para começar, clique em OK.

Depois que o participante clicava em OK, a tela com a instrução era substituída por uma tela preta com um contador de pontos (parte inferior esquerda da tela), um contador de fichas para o sorteio (parte inferior direita da tela) e cinco círculos com bordas brancas e fundo preto, dispostos horizontalmente na parte superior e central da tela. A tarefa consistia em emitir sequências de cinco respostas distribuídas nas teclas F e J do teclado. Havia 32 sequências possíveis. A cada tentativa, à medida que o participante pressionava as teclas F e J, os círculos eram automaticamente preenchidos pelas cores vermelha e amarela, respectivamente. Caso a sequência emitida atendesse o critério de reforçamento em vigor, o feedback de acerto era apresentado. Esse feedback consistia na apresentação de uma tela com uma “carinha feliz” e, abaixo desta, a frase “Você ganhou 10 pontos”. Após 2 s, a tela com os círculos pretos com bordas brancas era reapresentada, mas agora o contador de pontos e o contador de fichas mostravam os pontos e as fichas ganhas, respectivamente; essa tela também continha, abaixo dos círculos, uma pirâmide com as “carinhas felizes” ganhas até o momento. Os pontos e as fichas eram acumulados, ao longo das tentativas, até o final da sessão experimental. As “carinhas felizes” eram acumuladas até formar uma pirâmide com 10 “carinhas”, o que implicava a emissão de 10 sequências corretas e a obtenção de 100 pontos. Quando a pirâmide se completava, as “carinhas felizes” desapareciam, uma ficha era adicionada ao contador de fichas e uma nova pirâmide era iniciada após a emissão da próxima sequência correta. Caso a sequência emitida não atendesse o critério de reforçamento em vigor, um timeout (TO) era apresentado. Esse TO consistia na apresentação de uma tela totalmente preta durante 2 s. Após cada feedback, ou TO, uma nova tentativa era iniciada.

Os participantes foram distribuídos em quatro grupos experimentais (Alta-Ext, Alta-Var, Baixa-Ext e Baixa-Var) e expostos às fases de Treino, Eliminação e Teste, todas em vigor em uma mesma sessão de aproximadamente 1 h.

Em um estudo piloto, realizado com 20 participantes, foram selecionadas as sequências alvo para cada uma das duas primeiras fases do experimento. Para selecionar essas sequências, os participantes foram expostos a 100 tentativas, durante as quais estava em vigor uma contingência de variação (limiar 0,03) sobreposta a um esquema VI 1 min (ver Neuringer et al., 2000Neuringer, A., Deiss, C., & Olson, G. (2000). Reinforced variability and operant learning. Journal of Experimental Psychology: Animal Behavior Processes, 26, 98-111.). Assim, após a passagem de 1 min, em média, a emissão de uma sequência produzia o feedback de acerto, mas apenas se sua frequência fosse menor ou igual a 3% do total de sequências emitidas até o momento; caso contrário, ocorria um TO. As sequências emitidas por todos os participantes foram ordenadas com base em suas frequências de emissão. A sequência mais frequente (FJFJF) foi identificada como a sequência de “probabilidade alta”, e a menos frequente (JFJJF), como a sequência de “probabilidade baixa”. Por fim, a sequência com “probabilidade intermediária” (JJFJJ) foi aquela com frequência próxima à média aritmética das frequências das sequências com alta e baixa probabilidade. Essas três sequências (probabilidade alta, baixa e intermediária) foram, então, utilizadas nas fases do presente experimento, descritas a seguir.

Fase de Treino. Nessa fase estava em vigor um esquema CRF para uma única sequência (S1). Para os grupos Alta-Ext e Alta-Var, a S1 era a sequência com probabilidade alta, e para os grupos Baixa-Ext e Baixa-Var, a S1 era a sequência com probabilidade baixa. Dessa forma, a emissão da S1 (alta ou baixa probabilidade) era sempre seguida por feedback de acerto, ao passo que as demais 31 sequências eram sempre seguidas por TO.

Fase de Eliminação. Durante essa fase, a sequência com probabilidade intermediária (S2) era reforçada de acordo com o esquema CRF, para todos os grupos. Assim, sempre que essa sequência era emitida, um feedback de acerto era apresentado; a emissão das demais sequências, inclusive da S1, era seguida por TO.

Fase de Teste. A contingência em vigor nessa fase diferiu entre os grupos. Para os grupos Alta-Ext e Baixa-Ext estava em vigor uma contingência de extinção e para os grupos Alta-Var e Baixa-Var, uma contingência de variação. Quando a contingência de extinção estava em vigor, todas as sequências possíveis eram seguidas por TO, inclusive a S1 e a S2. Quando a contingência de variação estava em vigor, a S1 e a S2 eram seguidas por TO, ao passo que as outras 30 sequências produziam o feedback de acerto caso atendessem à contingência de reforçamento em vigor. Essa contingência consistiu em um critério de variação sobreposto ao esquema VI 1 min. Assim, as 30 sequências diferentes da S1 e da S2 eram reforçadas apenas se fossem emitidas após a passagem de 1 min, em média, e se atendessem ao critério do limiar 0,50. Sequências que não atendessem à contingência de reforçamento eram seguidas por TO.

O encerramento das fases de Treino e Eliminação ocorria quando o participante emitia a S1 (e S2) 50 vezes ou quando completava 200 tentativas, o que ocorresse primeiro. Se esse critério não fosse atendido, o experimento era finalizado. O encerramento da Fase de Teste, por sua vez, ocorria após 100 tentativas. As mudanças de fases não eram sinalizadas.

Resultados

A Figura 1 mostra a porcentagem de ocorrência da S1 e S2, em blocos de 10 tentativas, durante as fases de Treino, Eliminação e Teste, para cada participante de cada grupo. Na Fase de Treino (TR), todos os participantes aprenderam a S1, a despeito de sua probabilidade. O critério de aprendizagem da S1 foi atendido após 83 tentativas, em média, para os grupos Alta-Ext e Alta-Var, e após 142 e 124 tentativas, em média, para os grupos Baixa-Ext e Baixa-Var, respectivamente. Na Fase de Eliminação (EL), houve uma diminuição na porcentagem de ocorrência da S1 ao longo das tentativas, para todos os participantes, de modo que nos últimos quatro ou cinco blocos essa sequência não foi emitida. Verifica-se, também, a aprendizagem da sequência S2 em, aproximadamente, 82 e 68 tentativas para os grupos Alta-Ext e Alta-Var, respectivamente, e 91 e 80 tentativas para os grupos Baixa-Ext e Baixa-Var, respectivamente. Na Fase de Teste (TT), a S2 ocorreu para todos os participantes, porém em menor frequência se comparada à fase anterior. No contexto de extinção, a S1 reapareceu para todos os participantes, a despeito de ser uma sequência com alta ou baixa probabilidade; no contexto de variação, quando a S1 era uma sequência com alta probabilidade, observa-se seu reaparecimento para todos os participantes, mas quando era uma sequência com baixa probabilidade, seu reaparecimento ocorreu para somente um participante (B-V 111).

Figura 1
Porcentagem de ocorrência das sequências 1 (S1) e 2 (S2) durante as fases de Treino (TR), Eliminação (EL) e Teste (TT), para cada participante de cada grupo do Experimento 1.

A Tabela 1 apresenta as taxas de reforços e de sequências na Fase de Treino, para cada participante de cada grupo. Nessa fase, todos os participantes emitiram a S1 50 vezes antes de completarem 200 tentativas, ou seja, receberam 50 reforços. As taxas médias de reforços foram maiores para os grupos com S1 de alta probabilidade (16 e 13 reforços por minuto) do que para os grupos com S1 de baixa probabilidade (7 e 9 reforços por minuto). As taxas médias de sequências foram similares entre os quatro grupos (entre 18 e 21 respostas por minuto).

Tabela 1
A S1 selecionada, taxa de reforços (reforços por minuto) e taxa de sequências (sequências por minuto) para cada participante durante a Fase de Treino dos experimentos 1 e 2. Posição da frequência da S1, em relação à frequência de cada uma das 32 sequências possíveis e valor U, para cada participante durante a Fase de Teste dos experimentos 1 e 2.

A Tabela 1 também apresenta a posição da frequência da S1, em relação à frequência das demais sequências, para cada participante de cada grupo, na Fase de Teste. Para sete dos 10 participantes dos grupos Alta-Ext e Alta-Var, a S1 com alta probabilidade foi uma das 10 mais frequentes (as exceções foram os participantes A-E 206, A-V 103 e A-V 104), a despeito do contexto em vigor ser extinção ou variação; a S1 com baixa probabilidade (grupos Baixa-Ext e Baixa-Var) também foi uma das 10 sequências mais frequentes para quatro dos cinco participantes expostos à extinção (com exceção do participante B-E 217), mas foi emitida por apenas um dos cinco participantes expostos à variação (B-V 111).

O valor U também é mostrado na Tabela 1. Essa medida indica o nível de variabilidade das sequências emitidas na Fase de Teste e foi obtida por meio da seguinte fórmula:

sendo que RFi corresponde à frequência relativa de cada uma das sequências possíveis e n, ao número de sequências possíveis. O valor U pode variar entre 0 e 1, sendo que valores iguais a 1 indicam que todas as sequências possíveis foram emitidas com igual frequência (variabilidade máxima) e valores iguais a 0 indicam que uma única sequência foi emitida (repetição máxima). Observa-se que, a despeito da probabilidade da S1, a extinção tendeu a gerar valores U médios maiores (acima de 0,9) do que aqueles produzidos pela contingência de variação (abaixo de 0,8).

Os resultados da Fase de Teste são sumarizados na Figura 2, a qual mostra a frequência média da S1 com alta e baixa probabilidade, nos contextos de extinção e de variação. Assim como foi observado na Figura 1 e na Tabela 1, o reaparecimento da S1 foi mais frequente durante a extinção do que durante a variação. Além disso, para os participantes expostos à extinção, o reaparecimento da S1 não foi afetado por sua probabilidade, mas, para os participantes expostos à variação operante, a S1 com alta probabilidade reapareceu mais frequentemente do que a S1 com baixa probabilidade.

Figura 2
Frequência média da S1 quando a extinção (barras brancas) e a variação (barras pretas) estavam em vigor na Fase de Teste do Experimento 1.

Discussão

Os resultados do Experimento 1 indicaram que: (1) a sequência com alta probabilidade foi aprendida tão prontamente quanto a sequência probabilidade intermediária, e ambas foram aprendidas mais rapidamente do que a sequência com baixa probabilidade; (2) o reaparecimento da S1 com alta probabilidade foi mais frequente do que o da S1 com baixa probabilidade, principalmente no contexto de variação; e (3) o reaparecimento da S1 foi maior no contexto de extinção do que no contexto de variação.

Tanto a maior prontidão da aprendizagem da S1 com alta probabilidade e da S2 (com probabilidade intermediária), quando comparadas com a S1 com baixa probabilidade, quanto o reaparecimento mais frequente da S1 com alta probabilidade do que da S1 com baixa probabilidade podem ser atribuídos ao controle discriminativo intrassequência, ou seja, ao controle que uma resposta exerce sobre a próxima resposta da sequência (Abreu-Rodrigues, Hanna, de Melo Cruz, Matos & Delabrida, 2004Abreu-Rodrigues, J., Hanna, E. S., de Mello Cruz, A. P., Matos, R., & Delabrida, Z. (2004). Differential effects of midazolam and pentylenetetrazole on behavioral repetition and variation. Behavioural Pharmacology, 15, 535-543.). A S1 com alta probabilidade (FJFJF) e a sequência com probabilidade intermediária (JJFJJ) envolviam alternação regular entre as teclas F e J, ao passo que a S1 com baixa probabilidade (JFJJF) exigia alternações em pontos irregulares da sequência. Na sequência FJFJF, por exemplo, cada resposta era sempre seguida pela resposta alternativa, ao passo que, na sequência JFJJF, uma resposta podia ser seguida pela resposta alternativa, mas também por ela mesma. Se for considerado que o controle discriminativo é mais acentuado quando o estímulo antecedente é um preditor confiável do reforço (e.g., Blough, 1975Blough, P. M. (1975). Wavelength generalization and discrimination in the pigeon. Perception & Psychophysics, 12, 342-348.), pode-se afirmar que o controle discriminativo de uma resposta sobre a próxima pode ter se desenvolvido mais prontamente nas sequências com probabilidade alta e intermediária, resultando na aprendizagem mais rápida dessas sequências.

Se sequências muito prováveis são também aquelas com controle discriminativo intrassequência mais preciso, e considerando que esse controle contribui para a manutenção de sequências de respostas como uma unidade comportamental (Reed, Schachtman & Hall, 1991Reed, P., Schachtman, T. R., & Hall, G. (1991). Effect of signaled reinforcement on the formation of behavioral units. Journal of Experimental Psychology: Animal Behavior Processes, 17, 475-485.), então sequências com maior controle discriminativo (probabilidade alta) tenderiam a reaparecer mais frequentemente (ou se extinguirem mais dificilmente) do que aquelas com menor controle discriminativo (probabilidade baixa). Essa análise é consistente com demonstrações de que quando o reforço para sequências de respostas resulta na formação de unidades comportamentais integradas (com forte controle discriminativo), alterações nos esquemas de reforço não alteram a topografia dessas sequências. No estudo de Reed et al., por exemplo, o uso de estímulos discriminativos facilitou a aprendizagem da sequência de respostas alvo e promoveu a manutenção dessa sequência quando as contingências de reforço foram alteradas.

As taxas de reforços, maior para os grupos expostos à S1 com probabilidade alta do que para aqueles expostos à S1 com probabilidade baixa, sugerem outra fonte de controle. Atribuir o reaparecimento mais frequente da S1 com probabilidade alta à maior taxa de reforços dessa sequência deve, no entanto, ser feito com cautela, uma vez que a contribuição da taxa de reforços para a ressurgência é um ponto controverso na literatura. Alguns autores (e.g., Craig & Shahan, 2016Craig, A. R., & Shahan, T. A. (2016). Behavioral momentum theory fails to account for the effects of reinforcement rate on resurgence. Journal of the Experimental Analysis of Behavior, 105, 375-392.; Da Silva, Maxwell & Lattal, 2008da Silva, S. P., Maxwell, M. E., & Lattal, A. K. (2008). Concurrent resurgence and behavioral history. Journal of the Experimental Analysis of Behavior, 90, 313-331.) defendem que a taxa de reforços não é um preditor confiável da ressurgência, ou pelo menos não tão confiável quanto a taxa de respostas (no presente experimento, a taxa de sequências não diferiu entre grupos ou entre contextos); outros autores (e.g., Podlesnik & Shahan, 2010Podlesnik, C. A., & Shahan, T. A. (2010). Extinction, relapse, and behavioral momentum. Behavioural Processes, 84, 400-411.), no entanto, indicam que há uma relação direta entre taxa de reforços e magnitude da ressurgência.

Os efeitos da probabilidade alta ou baixa sobre o reaparecimento da S1 foram maiores no contexto de variação operante do que no contexto de extinção. Para analisar o papel do contexto, três aspectos devem ser considerados. Primeiro, a extinção induziu a emissão de sequências diferentes de S1 e S2. A indução de sequências não previamente treinadas é consistente com resultados experimentais de estudos anteriores (e.g., Souza, Abreu-Rodrigues & Baumann, 2010Souza, A. S., Abreu-Rodrigues, J., & Baumann, A. A. (2010). History effects on induced and operant variability. Learning & Behavior, 38, 426-437.; Villas-Bôas, 2006Villas-Bôas, A. (2006). Efeitos do procedimento de extinção sobre o responder em ratos: sequências de respostas como operante. Dissertação de Mestrado, Universidade de São Paulo, São Paulo.), os quais mostram que, quando uma sequência não mais produz reforços, os organismos tendem a emitir sequências alternativas, ou seja, tendem a apresentar um responder variado, pelo menos no início da extinção.

Segundo, a extinção induziu níveis de variabilidade mais altos do que aqueles observados no contexto de variação operante, o que parece contraproducente uma vez que a variabilidade na emissão das sequências não era condição necessária para a liberação do reforço no contexto de extinção, mas sim no contexto de variação. Isso pode ter ocorrido porque o critério de variação utilizado no contexto de variação operante não era muito rigoroso, permitindo a repetição ocasional de sequências. Ou seja, uma vez que o valor do limiar era 0,50, uma mesma sequência podia ser repetida em 50% das tentativas. Logo, essa contingência, apesar de reforçar a variação, permitia também que ocorresse a repetição de sequências (Abreu-Rodrigues, 2005Abreu-Rodrigues, J. (2005). Variabilidade comportamental. Em J. Abreu-Rodrigues & M. R. Ribeiro (Orgs.), Análise do comportamento: pesquisa, teoria e aplicação (pp. 189-210). Porto Alegre: Artmed.; Schwartz, 1982Schwartz, B. (1982). Reinforcement-induced behavioral stereotypy: How not to teach people to discover rules. Journal of Experimental Psychology: General, 111, 23-59.). Na extinção, por outro lado, a repetição de uma sequência nunca era reforçada, o que induzia a emissão de uma sequência diferente após cada sequência.

O terceiro ponto refere-se ao reaparecimento mais frequente da S1 sob o contexto de extinção quando comparado ao de variação operante. O reaparecimento da S1 no contexto de extinção é consistente com os resultados de outros estudos em que foi programada a extinção de sequências de respostas (e.g., Bachá-Méndez et al., 2007Bachá-Méndez, G., Reid, A. K., & Mendoza-Soylovna, A. (2007). Resurgence of integrated behavioral units. Journal of the Experimental Analysis of Behavior, 87, 5-24.; Reed & Morgan, 2006Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307-315.; Sánchez-Carrasco & Nieto, 2005Sánchez-Carrasco, L. S., & Nieto, J. (2005). Resurgence of three response sequences in rats. Revista Mexicana de Análisisde la Conducta, 31, 215-226.). Por sua vez, o reaparecimento menos frequente da S1 no contexto de variação operante provavelmente ocorreu porque a inclusão de reforços para as sequências alternativas se sobrepôs aos efeitos da história de reforçamento da S1. Essa análise é consistente com a proposta de Lieving e Lattal (2003Lieving, G. A., & Lattal, K. A. (2003). Recency, repeatability, and reinforce retrenchment: An experimental analysis of resurgence. Journal of the Experimental Analysis of Behavior, 80, 217-233.). Esses autores argumentam que a ressurgência deve ser compreendida dentro de um continuum, em cujos extremos encontram-se o alto reforçamento para respostas (ou sequências) alternativas e o baixo ou nenhum reforçamento para essas respostas (ou sequências). Assim, quando há reforços para respostas (ou sequências) alternativas, como ocorreu no presente contexto de variação operante, a ressurgência da resposta (sequência) alvo apresenta menor magnitude; por outro lado, a ausência de reforços para respostas (sequências) alternativas torna a ressurgência mais provável.

Em suma, os resultados do Experimento 1 mostraram que a S1 reapareceu, principalmente quando era uma sequência com probabilidade alta e quando não havia reforços para sequências alternativas. O reaparecimento da S1 não foi, no entanto, mais frequente do que o das outras sequências (com exceção do participante A-E 203), um resultado que pode ter ocorrido em função do número de respostas por sequência (ou, alternativamente, do número de sequências possíveis). Essa possibilidade foi investigada no experimento a seguir.

Experimento 2

Embora a S1 tenha reaparecido no Experimento 1, isso não pode ser, inquestionavelmente, considerado como uma evidência de ressurgência porque a S1 não foi mais frequente do que as demais sequências. Assim, a fim de promover a ressurgência da S1, o procedimento utilizado no Experimento 2 diferiu em três aspectos daquele utilizado no Experimento 1.

Primeiro, o número de respostas por sequência foi reduzido (de cinco para três). Essa redução foi feita porque estudos com ratos mostraram ressurgência com sequências de duas (Bachá-Méndez et al., 2007Bachá-Méndez, G., Reid, A. K., & Mendoza-Soylovna, A. (2007). Resurgence of integrated behavioral units. Journal of the Experimental Analysis of Behavior, 87, 5-24.) e de três respostas (Sanchéz-Carrasco & Nieto, 2005Sánchez-Carrasco, L. S., & Nieto, J. (2005). Resurgence of three response sequences in rats. Revista Mexicana de Análisisde la Conducta, 31, 215-226.; Reed & Morgan, 2006Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307-315.), mas não com sequências de quatro respostas (Villas-Bôas, 2006Villas-Bôas, A. (2006). Efeitos do procedimento de extinção sobre o responder em ratos: sequências de respostas como operante. Dissertação de Mestrado, Universidade de São Paulo, São Paulo.). Segundo, no Experimento 1, as sequências alvo eram as mesmas para todos os participantes de um determinado grupo e, embora a aprendizagem das sequências com probabilidade alta e intermediária tenha sido mais rápida, quando comparada à aprendizagem da sequência com probabilidade baixa, houve alguma variabilidade entre os participantes. Com o objetivo de averiguar se o critério de seleção de sequências afetou o reaparecimento da S1, o Experimento 2 utilizou sequências específicas para cada participante. Ou seja, a sequência com probabilidade alta (ou baixa) correspondeu à sequência que cada participante emitiu mais (ou menos) frequentemente em uma fase pré-experimental. Terceiro, no Experimento 1, os efeitos dos contextos de extinção e variação operante foram avaliados por meio de manipulações entre grupos. No Experimento 2, por outro lado, esses efeitos foram também investigados a partir de manipulações intrassujeito, ou seja, dois grupos de participantes foram expostos a duas fases de teste (variação operante e extinção), em vez de a apenas uma fase (variação ou extinção). Dessa forma, foi possível avaliar se o maior reaparecimento da S1 durante a extinção do que durante a variação, observado no Experimento 1, também ocorre quando o contexto de extinção é introduzido após o contexto de variação.

Método

Participantes. Participaram desse experimento 20 estudantes universitários. Os demais detalhes foram idênticos àqueles do Experimento 1.

Ambiente e Equipamento. A sala de coleta de dados e os equipamentos utilizados foram idênticos àqueles do Experimento 1.

Procedimento

Os participantes foram distribuídos em quatro grupos (Alta-Ext, Alta-Var-Ext, Baixa-Ext e Baixa-Var-Ext) e expostos a quatro fases (Seleção da Sequência Alvo, Treino, Eliminação e Teste), todas realizadas em uma única sessão.

No início da sessão, o participante recebia uma instrução geral que diferia daquela fornecida no Experimento 1 apenas no que se refere ao número de respostas por sequência (3) e ao número máximo de sequências possíveis (8). Após a leitura da instrução, o participante foi exposto a uma tarefa idêntica àquela descrita no Experimento 1.

Fase de Seleção das Sequências Alvo. Nessa fase, o participante deveria emitir sequências de três respostas de acordo com um esquema VI 1 min ao longo de 50 tentativas. Assim, sequências emitidas a cada 1 min, em média, eram seguidas pelo feedback de acerto. Nessa fase, diferentemente do que foi feito no estudo piloto do Experimento 1, não havia nenhum critério de variação em vigor para evitar que os participantes iniciassem o experimento com história de reforçamento da variação. Em seguida, o experimentador selecionava as sequências alvo com base na frequência absoluta de todas as sequências possíveis, assim como foi descrito no Experimento 1, com uma diferença: em vez de ordenar as frequências agregadas das sequências emitidas por todos os participantes, o experimentador ordenava as frequências das sequências emitidas por cada participante. Isso permitiu a obtenção de uma sequência com probabilidade alta (mais frequente), intermediária (frequência média) e baixa (menos frequente) para cada participante.

Fase de Treino. Idêntica à do Experimento 1, ou seja, apenas a S1 gerava reforços, os quais eram liberados de acordo com o esquema CRF.

Fase de Eliminação. Idêntica à do Experimento 1, isto é, os reforços eram liberados sempre que, e apenas quando, a S2 era emitida.

Fase de Teste 1. Para os grupos Alta-Ext e Baixa-Ext, essa fase foi idêntica à Fase de Teste dos mesmos grupos no Experimento 1: ou seja, não havia liberação de reforços para nenhuma das oito sequências possíveis. Para os grupos Alta-Var-Ext e Baixa-Var-Ext, essa fase foi idêntica à Fase de Teste dos grupos Alta-Var e Baixa-Var do Experimento 1; isto é, uma contingência de variação (critério do limiar 0,5), sobreposta a um esquema VI 1 min, estava em vigor para todas as sequências, com exceção da S1 e da S2, as quais eram sempre seguidas por TO.

Fase de Teste2. Somente os grupos Alta-Var-Ext e Baixa-Var-Ext foram expostos a essa fase, que era idêntica à Fase de Teste dos grupos Alta-Ext e Baixa-Ext do Experimento 1. Ou seja, não havia liberação de reforços.

Os demais aspectos do procedimento foram idênticos ao que foi descrito no Experimento 1.

Resultados

A porcentagem de ocorrência das sequências S1 e S2, em blocos de 10 tentativas, durante as fases de Treino, Eliminação e Teste, é mostrada, para cada participante de cada grupo, na Figura 3. Na Fase de Treino, todos os participantes aprenderam a S1, independentemente de qual sequência foi definida como S1 para cada participante e de sua probabilidade (alta ou baixa). Para os grupos Alta-Ext e Alta-Ext-Var, o critério de aprendizagem foi atingido após 66 tentativas, em média; para os demais grupos, a aprendizagem da sequência com baixa probabilidade exigiu um número médio maior de tentativas, principalmente para dois participantes (184 tentativas para o participante B-E 20 e 167 tentativas para o participante B-E 21). Para os demais, o critério foi alcançado, em média, após 73 tentativas. Na Fase de Eliminação, observa-se uma diminuição de pelo menos 50% na porcentagem de ocorrência da S1 logo no primeiro bloco de 10 tentativas (com exceção dos participantes A-E 07, A-E 11 e A-V-E 19), assim como a extinção dessa sequência nos blocos finais dessa fase. Ainda nessa fase, observa-se a aprendizagem da S2 (única sequência elegível para o reforço) que, assim como a S1, diferiu entre os participantes. Para todos os grupos, a S2 foi aprendida após um número médio de tentativas similar (entre 54 e 63 tentativas) e próximo aos da S1 com probabilidade alta na Fase de Treino. Na Fase de Teste 1 e 2, todos os participantes emitiram a S2, porém em menor frequência do que na fase anterior. Além disso, ocorreu o reaparecimento da S1 para todos os participantes, sendo a magnitude desse reaparecimento maior durante a extinção do que durante a variação, independentemente da ordem de apresentação do contexto de extinção. Os efeitos da probabilidade da S1, entretanto, não são claramente observados nessa figura.

Figura 3
Porcentagem de ocorrência das sequências 1 (S1) e 2 (S2) durante as fases de Treino (TR), Eliminação (EL) e Teste (TT), para cada participante de cada grupo do Experimento 2.

Conforme apresentado na Tabela 1, na Fase de Treino, todos os participantes receberam 50 reforços. O grupo Baixa-Ext apresentou taxa média de reforços menor (20 reforços por minuto) do que os demais (entre 27 e 28 reforços por minuto) e taxa média de sequências maior (45 sequências por minuto) do que os outros grupos (entre 34 e 38 sequências por minuto). Além disso, a taxa de reforços e de sequências, em ambas as fases, foram maiores no Experimento 2 do que no Experimento 1.

A Tabela 1 indica que a S1 com probabilidade alta foi uma das quatro sequências mais frequentes, para nove dos 10 participantes, no contexto de extinção (a exceção foi o participante A-V 19); durante a variação, por outro lado, a S1 foi uma das quatro sequências menos frequentes para quatro dos cinco participantes (a exceção foi o participante A-V 03). A S1 com probabilidade baixa foi uma das quatro sequências mais frequentes para seis dos 10 participantes durante a extinção, mas uma das três sequências menos frequentes para todos os cinco participantes expostos à variação.

A Tabela 1 também aponta o valor U. Assim como no Experimento 1, o valor U médio foi maior durante a extinção (acima de 0,95) do que durante a variação (igual ou abaixo de 0,85), tanto para os grupos expostos à S1 com probabilidade alta quanto para aqueles expostos à S1 de probabilidade baixa.

A Figura 4 mostra a frequência média por oportunidade da S1 com probabilidade alta e baixa nos contextos de extinção e variação do Experimento 1 (painel à esquerda) e do Experimento 2 (painel central). São também apresentados os resultados de um grupo adicional (painel à direita), que serão discutidos na seção de Discussão Geral. Uma vez que o universo de sequências possíveis diferia quando a S1 tinha cinco ou três respostas, havia menos oportunidades para a S1 ser emitida nas 100 tentativas da Fase de Teste do Experimento 1 do que naquelas do Experimento 2. Dessa forma, um número maior de ocorrências da S1 no Experimento 2 não indicaria, necessariamente, uma maior magnitude da ressurgência dessa sequência, já que a S1 poderia ter ter sido emitida mais frequentemente apenas porque havia mais oportunidade para isso ocorrer. Para evitar esse problema de interpretação dos resultados, a frequência média da S1 foi dividida pelo número de sequências possíveis nos Experimentos 1 e 2 (32 e 8, respectivamente). As frequências médias das duas situações de extinção não diferiram entre os grupos Alta-Ext (2,1) e Alta-Var-Ext (2,15), e entre os grupos Baixa-Ext (1,17) e Baixa-Var-Ext (1,17) do Experimento 2, e por isso a figura apresenta apenas a média dos dois primeiros e dos dois últimos grupos.

Figura 4
Frequência média da S1 por oportunidade quando a extinção (barras brancas) e a variação (barras pretas) estavam em vigor na Fase de Teste do Experimento 1 (painel à esquerda), Experimento 2 (painel ao centro) e grupo adicional (painel à direita).

O reaparecimento da S1 foi mais frequente quando essa sequência compreendia três respostas (Experimento 2) do que quando compreendia cinco respostas (Experimento 1). Além disso, assim como no Experimento 1, a S1 reapareceu com maior frequência no contexto de extinção do que no de variação durante o Experimento 2. Com relação ao nível de dificuldade, quando a sequência tinha cinco respostas, a S1 com probabilidade alta reapareceu mais frequentemente do que a S1 com probabilidade baixa, mas apenas durante a variação; quando a sequência tinha três respostas, a S1 com probabilidade alta também foi mais frequente que a S1 com probabilidade baixa, mas principalmente durante a extinção.

Discussão

Alguns resultados do Experimento 2 replicaram aqueles do Experimento 1: (1) a S1 com probabilidade baixa foi aprendida mais lentamente e reapareceu menos frequentemente do que a S1 com probabilidade alta; e (2) o reaparecimento da S1 foi mais frequente no contexto de extinção do que de variação. A replicação desses resultados ocorreu a despeito da mudança no número de sequências e no procedimento utilizado para selecionar as sequências alvo. Contrariamente ao que ocorreu no Experimento 1, a diferença entre o reaparecimento da S1 com probabilidade alta e baixa foi maior no contexto de extinção do que de variação. Finalmente, a S1 com três respostas (Experimento 2) reapareceu mais do que a S1 com cinco respostas (Experimento 1).

A aprendizagem mais rápida e o reaparecimento mais frequente da S1 não podem ser unicamente atribuídos ao controle discriminativo intrassequência, como foi feito no Experimento 1, uma vez que uma mesma sequência pode ter sido selecionada como de alta probabilidade para um participante e como de baixa probabilidade para outro (ver participantes A-V-E 35 e B-V-E 38, Tabela 1). Ainda, é provável que o controle intrassequência tenha se desenvolvido similarmente entre as sequências. Isso porque, uma vez que a sequência tinha apenas três respostas, havia uma certa regularidade entre as respostas de todas as oito sequências possíveis.

As diferenças na aprendizagem e o reaparecimento da S1 com probabilidade alta e baixa, no entanto, podem ter sido ocasionados por variáveis presentes na Fase de Seleção das Sequências Alvo. Embora não haja registro do número de reforços contingentes a cada sequência nessa fase, é possível que a S1 com probabilidade alta, por ser a mais frequente, tenha recebido mais reforços do que a S1 com probabilidade baixa (a menos frequente), o que pode ter favorecido o reaparecimento da S1 na Fase de Teste (Winterbauer, Lucke & Bouton, 2013Winterbauer, N. E., Lucke, S., & Bouton, M. E. (2013). Some factors modulating the strength of resurgence after extinction of an instrumental behavior. Learning and Motivation, 44, 60-71.).

O reaparecimento menos frequente da S1 no contexto de variação do que no de extinção, observado no Experimento 2, pode ser explicado com base no reforçamento das sequências não alvo, assim como foi feito no Experimento 1. Em ambos os contextos, no entanto, a magnitude do reaparecimento da S1 foi maior no Experimento 2, comparado ao Experimento 1 (Figura 4), um resultado que pode ser atribuído ao número de respostas por sequência. No Experimento 2, a sequência tinha três respostas, e no Experimento 1, cinco respostas, o que sugere que, quanto menor o número de respostas por sequência, maior o reaparecimento da S1. Talvez o reforçamento de uma sequência com um número menor de respostas, conforme discutido anteriormente, torne o controle discriminativo intrassequência mais preciso do que no caso de uma sequência com um número maior de respostas e esse controle, por sua vez, facilite o reaparecimento de sequências mais curtas. Evidências de que a precisão do controle discriminativo varia diretamente com o número de respostas da sequência são encontradas na literatura de numerosidade (e.g., Machado & Rodrigues, 2007Machado, A., & Rodrigues, P. (2007). The differentiation of response numerosity in the pigeon. Journal of the Experimental Analysis of Behavior, 88, 153-178.; Mechner, 1958Mechner, F. (1958). Probability relations within response sequences under ratio reinforcement. Journal of the Experimental Analysis of Behavior, 1, 109-122.).

A comparação entre os Experimentos 1 e 2 mostra, ainda, que no Experimento 1 a S1 com probabilidade alta reapareceu mais frequentemente do que a S1 com probabilidade baixa, mas apenas no contexto de variação; no Experimento 2, entretanto, o reaparecimento mais frequente da S1 com probabilidade alta ocorreu principalmente no contexto de extinção. É possível que essa diferença entre experimentos resulte da relação entre o número de sequências possíveis e o grau de discriminabilidade da ausência de reforços para a S1. A variabilidade induzida (contexto de extinção) e o reforçamento intermitente das sequências não alvo (contexto de variação) podem ter dificultado a discriminabilidade da ausência de reforços para S1, principalmente quando havia 30 (Experimento 1), em comparação com 6 (Experimento 2) sequências não alvo. Diante disso, no contexto de variação, a ocorrência de reforços para as sequências não alvo possivelmente contribuiu para o reaparecimento mais frequente da S1 com probabilidade alta, principalmente quando a discriminabilidade da extinção da S1 era baixa (Experimento 1). No contexto de extinção, por outro lado, uma vez que nenhuma sequência produzia reforços, seria esperado que quanto mais alta a discriminabilidade da extinção da S1 (Experimento 2), menos provável o reaparecimento da S1 com probabilidade baixa, o que, de fato, foi observado.

Discussão geral

O presente estudo avaliou se a probabilidade (alta vs baixa) de uma sequência de respostas, determinada pela frequência da sequência no estudo piloto (Experimento 1) e na Fase de Seleção das Sequências Alvo (Experimento 2), e os contextos (extinção vs. variação) em vigor na Fase de Teste, caracterizados pela ausência total de reforços programados e pela liberação de reforços contingentes a um critério de variabilidade, respectivamente, afetariam a ressurgência dessa sequência. Foi observado que: (1) sequências com probabilidade alta reapareceram mais frequentemente do que sequências com probabilidade baixa; (2) o contexto de extinção promoveu o reaparecimento mais frequente da sequência alvo do que o contexto de variação; e (3) o reaparecimento da sequência alvo variou inversamente com o número de respostas por sequência.

Os dois primeiros resultados foram amplamente discutidos nos Experimentos 1 e 2, mas o terceiro resultado requer algumas considerações adicionais. Embora estudos acerca do papel da taxa de reforços sobre o reaparecimento de uma resposta apresentem resultados contraditórios (e.g., Craig & Shahan, 2016Craig, A. R., & Shahan, T. A. (2016). Behavioral momentum theory fails to account for the effects of reinforcement rate on resurgence. Journal of the Experimental Analysis of Behavior, 105, 375-392.; Podlesnik & Shahan, 2010Podlesnik, C. A., & Shahan, T. A. (2010). Extinction, relapse, and behavioral momentum. Behavioural Processes, 84, 400-411.; Silva et al., 2008), tanto no Experimento 1 quanto no Experimento 2 do presente estudo o reaparecimento da S1 foi correlacionado com maior taxa de reforços. Além disso, o número de respostas por sequência ou, mais precisamente, o controle discriminativo intrassequência, mais poderoso em sequências com menor número de respostas (Abreu-Rodrigues et al., 2004Abreu-Rodrigues, J., Hanna, E. S., de Mello Cruz, A. P., Matos, R., & Delabrida, Z. (2004). Differential effects of midazolam and pentylenetetrazole on behavioral repetition and variation. Behavioural Pharmacology, 15, 535-543.) deve também ser considerado. Conforme apontado no Experimento 1, esse controle - caracterizado pelo efeito preditivo de cada resposta sobre a próxima resposta da sequência -, ao favorecer a manutenção da integridade da sequência, pode também ter promovido seu reaparecimento (Reed et al., 1991Reed, P., Schachtman, T. R., & Hall, G. (1991). Effect of signaled reinforcement on the formation of behavioral units. Journal of Experimental Psychology: Animal Behavior Processes, 17, 475-485.).

Com o objetivo de esclarecer a contribuição isolada do número de reforços e de respostas por sequência para o reaparecimento da S1, uma manipulação extra foi realizada após o Experimento 2. Um grupo adicional, composto por quatro participantes, foi exposto às mesmas condições experimentais do grupo Alta-Ext do Experimento 1 (sequências com cinco respostas), mas o procedimento de seleção das sequências foi individualizado (ou seja, foi idêntico àquele do Experimento 2), ocasionando um número de reforços para a S1 similar entre os grupos do Experimento 2 e o grupo adicional, e maior do que o número de reforços dos grupos do Experimento 1. Foi observado que a S1 com probabilidade alta reapareceu para todos os participantes do grupo adicional e que esse reaparecimento foi maior do que no Experimento 1, mas menor do que no Experimento 2 (Figura 4). A comparação dos resultados do grupo adicional com aqueles do mesmo grupo no Experimento 1 (ambos com sequências de cinco respostas, mas o primeiro com maior número de reforços para a S1) fornece evidências de que o número de reforços não deve ser negligenciado. Por outro lado, quando os resultados do grupo adicional são comparados com os do mesmo grupo no Experimento 2 (ambos com número de reforços similar, mas com número de respostas por sequência diferente), verifica-se que o número de respostas por sequência também é uma variável de controle relevante. Em suma, os resultados do grupo adicional sugerem que ambas as variáveis (número de reforços e número de respostas por sequências) afetaram o reaparecimento da S1.

É importante ressaltar que, no presente estudo, o reaparecimento da S1 não foi conceitualizado como ressurgência. Isso porque, embora S1 tenha reaparecido, sua frequência de ocorrência não foi maior do que a das outras sequências na Fase de Teste. Esse aspecto é importante porque a extinção pode induzir a emissão não somente de respostas treinadas previamente, mas também de novas respostas (Catania, 1998/2006Catania, A. C. (2006). Aprendizagem: comportamento, linguagem e cognição (D. G. Souza, Org. Trad.). Porto Alegre: Artmed . (Trabalho original publicado em 1998).). A possibilidade de indução de outras respostas, que não a resposta treinada, gera algumas questões: (1) Se a ocorrência da S1, na Fase de Teste, é menos frequente do que a ocorrência de outras sequências, é legítimo caracterizar o reaparecimento da S1 como ressurgência?; (2) Quando essas outras sequências não são mensuradas, é viável afirmar que o reaparecimento da S1 é ressurgência?; (3) Se a ressurgência é o reaparecimento de uma sequência previamente reforçada e, em seguida, extinta, qual seria o papel do reforçamento da S1 se sequências nunca antes reforçadas podem ser induzidas com maior magnitude que a própria S1? Essas questões parecem requerer não somente um refinamento metodológico nos estudos de ressurgência (i.e., a mensuração de respostas controle, como foi feito por alguns autores, como Bachá-Méndez et al., 2007Bachá-Méndez, G., Reid, A. K., & Mendoza-Soylovna, A. (2007). Resurgence of integrated behavioral units. Journal of the Experimental Analysis of Behavior, 87, 5-24.; Bishop, 2008Bishop, M. R. (2008). Resurgence of operant variability. Tese de Doutorado, University of Nevada, Reno.; Bruzek et al., 2009Bruzek, J. L., Thompson, R. H., & Peters, L. C. (2009). Resurgence of infant caregiving responses. Journal of the Experimental Analysis of Behavior, 92, 327-343.; Reed & Morgan, 2006Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307-315.; Sanchéz-Carrasco & Nieto, 2005Sánchez-Carrasco, L. S., & Nieto, J. (2005). Resurgence of three response sequences in rats. Revista Mexicana de Análisisde la Conducta, 31, 215-226.; Sweeney & Shahan, 2013Sweeney, M. M., & Shahan, T. A. (2013). Effects of high, low, and thinning rates of alternative reinforcement on response elimination and resurgence. Journal of the Experimental Analysis of Behavior, 100, 1-15.; Villas-Bôas, 2006Villas-Bôas, A. (2006). Efeitos do procedimento de extinção sobre o responder em ratos: sequências de respostas como operante. Dissertação de Mestrado, Universidade de São Paulo, São Paulo.), mas também uma revisão do próprio conceito de ressurgência.

A mensuração de sequências controle permite separar o efeito da variabilidade induzida pela extinção do efeito da história de reforçamento (Bishop, 2008Bishop, M. R. (2008). Resurgence of operant variability. Tese de Doutorado, University of Nevada, Reno.). Se, por exemplo, a frequência da sequência controle for maior ou igual à da S1, então a descontinuação dos reforços para a S2 explica o reaparecimento da S1 (assim como a ocorrência da sequência controle). Por outro lado, se a frequência da S1 for maior que a da sequência controle, então seu reaparecimento deve ser atribuído à história experimental de reforçamento. Dessa forma, se o conceito de ressurgência se refere ao reaparecimento de uma resposta previamente reforçada (R1) diante da extinção de outra resposta (R2), e se essa extinção induz variação na emissão de respostas, então, em decorrência do reforçamento prévio, a ocorrência da R1 deve ser mais frequente do que a ocorrência de outras respostas.

Em estudos futuros, seria interessante efetuar manipulações que pudessem aumentar a probabilidade de ressurgência da S1. A emissão de sequências de respostas distribuídas em duas teclas produz várias sequências que são topograficamente similares, o que pode dificultar a ressurgência da sequência alvo. Uma alternativa, então, seria acrescentar estímulos discriminativos diferenciais em cada fase experimental (ver Kincaid, Lattal & Spence, 2015Kincaid, S. L., Lattal, K. A. & Spence, J. (2015). Super-resurgence: ABA renewal increases resurgence. Behavioural Processes, 115, 70-73.). Essa ideia parece plausível, uma vez que a literatura mostra evidências de ressurgência da resposta de bicar (Doughty, da Silva & Lattal, 2007Doughty, A. H., da Silva, S. P., & Lattal, K. A. (2007). Differential resurgence and response elimination. Behavioural Processes, 75, 115-128.) e de padrões temporais do responder (Cançado & Lattal, 2011Cançado, C. R. X., & Lattal, A. K. (2011). Resurgence of temporal patterns of responding. Journal of the Experimental Analysis of Behavior, 95, 271-287.) que foram treinados em uma situação experimental com estímulos exteroceptivos.

Referências

  • Abreu-Rodrigues, J. (2005). Variabilidade comportamental. Em J. Abreu-Rodrigues & M. R. Ribeiro (Orgs.), Análise do comportamento: pesquisa, teoria e aplicação (pp. 189-210). Porto Alegre: Artmed.
  • Abreu-Rodrigues, J., Hanna, E. S., de Mello Cruz, A. P., Matos, R., & Delabrida, Z. (2004). Differential effects of midazolam and pentylenetetrazole on behavioral repetition and variation. Behavioural Pharmacology, 15, 535-543.
  • Alessandri, J., Lattal, K. A., & Cançado, C. R. X. (2015). The recurrence of negatively reinforced responding of humans. Journal of the Experimental Analysis of Behavior, 104, 211-222.
  • Bachá-Méndez, G., Reid, A. K., & Mendoza-Soylovna, A. (2007). Resurgence of integrated behavioral units. Journal of the Experimental Analysis of Behavior, 87, 5-24.
  • Bishop, M. R. (2008). Resurgence of operant variability. Tese de Doutorado, University of Nevada, Reno.
  • Blough, P. M. (1975). Wavelength generalization and discrimination in the pigeon. Perception & Psychophysics, 12, 342-348.
  • Bruzek, J. L., Thompson, R. H., & Peters, L. C. (2009). Resurgence of infant caregiving responses. Journal of the Experimental Analysis of Behavior, 92, 327-343.
  • Cançado, C. R. X., & Lattal, A. K. (2011). Resurgence of temporal patterns of responding. Journal of the Experimental Analysis of Behavior, 95, 271-287.
  • Catania, A. C. (2006). Aprendizagem: comportamento, linguagem e cognição (D. G. Souza, Org. Trad.). Porto Alegre: Artmed . (Trabalho original publicado em 1998).
  • Cleland, B. S., Foster, T. M., & Temple, W. (2000). Resurgence: The role of extinction. Behavioural Processes, 52, 117-129.
  • Craig, A. R., & Shahan, T. A. (2016). Behavioral momentum theory fails to account for the effects of reinforcement rate on resurgence. Journal of the Experimental Analysis of Behavior, 105, 375-392.
  • da Silva, S. P., Maxwell, M. E., & Lattal, A. K. (2008). Concurrent resurgence and behavioral history. Journal of the Experimental Analysis of Behavior, 90, 313-331.
  • Doughty, A. H., da Silva, S. P., & Lattal, K. A. (2007). Differential resurgence and response elimination. Behavioural Processes, 75, 115-128.
  • Epstein, R. (1985). Extinction-induced resurgence: Preliminary investigations and possible applications. The Psychological Record, 35, 143-153.
  • Jarmolowicz, D. P., & Lattal, K. A. (2014). Resurgence under delayed reinforcement. Psychological Record, 64, 189-193.
  • Kincaid, S. L., Lattal, K. A. & Spence, J. (2015). Super-resurgence: ABA renewal increases resurgence. Behavioural Processes, 115, 70-73.
  • Lieving, G. A., & Lattal, K. A. (2003). Recency, repeatability, and reinforce retrenchment: An experimental analysis of resurgence. Journal of the Experimental Analysis of Behavior, 80, 217-233.
  • Machado, A., & Rodrigues, P. (2007). The differentiation of response numerosity in the pigeon. Journal of the Experimental Analysis of Behavior, 88, 153-178.
  • Mechner, F. (1958). Probability relations within response sequences under ratio reinforcement. Journal of the Experimental Analysis of Behavior, 1, 109-122.
  • Neuringer, A. (1993). Reinforced variation and selection. Animal Learning & Behavior, 21, 83-91.
  • Neuringer, A., Deiss, C., & Olson, G. (2000). Reinforced variability and operant learning. Journal of Experimental Psychology: Animal Behavior Processes, 26, 98-111.
  • Page, S., & Neuringer, A. (1985). Variability is an operant? Journal of Experimental Psychology: Animal Behavior, 11, 429-452.
  • Podlesnik, C. A., & Shahan, T. A. (2010). Extinction, relapse, and behavioral momentum. Behavioural Processes, 84, 400-411.
  • Reed, P., & Morgan, T. A. (2006). Resurgence of response sequences during extinction in rats shows a primacy effect. Journal of the Experimental Analysis of Behavior, 86, 307-315.
  • Reed, P., Schachtman, T. R., & Hall, G. (1991). Effect of signaled reinforcement on the formation of behavioral units. Journal of Experimental Psychology: Animal Behavior Processes, 17, 475-485.
  • Sánchez-Carrasco, L. S., & Nieto, J. (2005). Resurgence of three response sequences in rats. Revista Mexicana de Análisisde la Conducta, 31, 215-226.
  • Schwartz, B. (1982). Reinforcement-induced behavioral stereotypy: How not to teach people to discover rules. Journal of Experimental Psychology: General, 111, 23-59.
  • Souza, A. S., & Abreu-Rodrigues, J. (2006). Discriminative properties of vary and repeat contingencies. Behavioural Processes, 85, 116-125.
  • Souza, A. S., Abreu-Rodrigues, J., & Baumann, A. A. (2010). History effects on induced and operant variability. Learning & Behavior, 38, 426-437.
  • Sweeney, M. M., & Shahan, T. A. (2013). Effects of high, low, and thinning rates of alternative reinforcement on response elimination and resurgence. Journal of the Experimental Analysis of Behavior, 100, 1-15.
  • Sweeney, M. M., & Shahan, T. A. (2016). Resurgence of target responding does not exceed increases in inactive responding in a forced-choice alternative reinforcement procedure in humans. Behavioural Processes, 124, 80-92.
  • Villas-Bôas, A. (2006). Efeitos do procedimento de extinção sobre o responder em ratos: sequências de respostas como operante. Dissertação de Mestrado, Universidade de São Paulo, São Paulo.
  • Winterbauer, N. E., & Bouton, M. E. (2010). Mechanisms of resurgence of an extinguished instrumental behavior. Journal of Experimental Psychology, 36, 343-353.
  • Winterbauer, N. E., Lucke, S., & Bouton, M. E. (2013). Some factors modulating the strength of resurgence after extinction of an instrumental behavior. Learning and Motivation, 44, 60-71.

Datas de Publicação

  • Publicação nesta coleção
    2016

Histórico

  • Recebido
    07 Set 2016
  • Aceito
    06 Nov 2016
Instituto de Psicologia, Universidade de Brasília Instituto de Psicologia, Universidade de Brasília, 70910-900 - Brasília - DF - Brazil, Tel./Fax: (061) 274-6455 - Brasília - DF - Brazil
E-mail: revistaptp@gmail.com