RESUMO
A literatura apresenta muitas definições acerca da noção de Tópico e de estrutura informacional (cf. BARBOSA, 2005; MELLO; SILVA, 2015). Neste trabalho, assume-se a definição da Language into Act Theory (CRESTI, 2000) que diz que o Tópico é a porção textual que se realiza por meio de um padrão entoacional do tipo prefix (‘t HART et al. 1990) e que tem por função constituir o domínio sobre o qual a força ilocucionária se aplica. Um SN em Tópico pode ser o sujeito do verbo no Comentário ou um anacoluto. SNs anacolutos são sintagmas que não possuem relação sintática com o conteúdo presente no Comentário. Neste trabalho, mostra-se como SNs estão distribuídos probabilisticamente entre essas duas condições quando são realizados como Tópico na fala espontânea. Para isso, foram coletados dados de corpora de fala espontânea etiquetados informacionalmente - incluindo a unidade de Tópico conforme definida acima - de três línguas: espanhol europeu (NICOLÁS MARTÍNEZ; LOMBÁN SOMACARRERA, 2018), inglês americano (CAVALCANTE; RAMOS, 2016) e português brasileiro (PANUNZI; MITTMANN, 2014). O método estatístico utilizado para o cálculo da probabilidade foi um modelo misto de regressão logística com efeitos aleatórios cruzados, conduzido com auxílio do R (R CORE TEAM, 2018). Três variáveis foram selecionadas para o cálculo: acessibilidade do referente, animacidade e definitude. O modelo mostrou que há cerca de cinco vezes mais chances de que o SN realizado em Tópico seja sujeito do verbo no Comentário caso ele seja animado, definido e seja classificado como informação dada no discurso.
PALAVRAS-CHAVE:
Tópico; Sujeito; SN; Sintaxe da fala; Gramática probabilística