Este trabalho apresenta um algoritmo de roteamento adaptativo, denominado Agentes-Q, baseado na integração de três estratégias de aprendizagem combinadas com alguns mecanismos para aumentar sua velocidade de adaptação. As três estratégias são: aprendizagem-Q, aprendizagem por reforço dual e aprendizagem baseada no comportamento de colônias de formigas. O algoritmo proposto é composto por um conjunto de agentes móveis simples, que se comunicam indiretamente e cooperam na busca dos melhores caminhos na rede. Os agentes selecionam as rotas de forma distribuída e atualizam incrementalmente as informações utilizadas na escolha dos caminhos. Agentes-Q foi aplicado a uma rede telefônica da British Telecom e a porcentagem média de chamadas perdidas por ele foi comparada a de dois algoritmos baseados no comportamento de colônias de formigas. Os experimentos envolveram variações nos padrões de tráfego, nível de carga e topologia da rede e a utilização de ruído na informação usada na seleção das rotas. Agentes-Q obteve melhor desempenho que seus competidores, apresentando maior capacidade de adaptação às situações consideradas.
Redes de telecomunicações; roteamento; aprendizagem-Q; agentes baseados em formigas