RESUMO
Objetivo Elaborar um indicador composto denominado Índice Videoquimográfico da Função Glótica – IVFG, a partir de parâmetros da videoquimografia digital, captados pelo exame de videolaringoscopia de alta velocidade de mulheres sem e com alterações laríngeas de etiologia comportamental.
Método A amostra foi composta por 92 mulheres, destas 55 apresentaram disfonia comportamental, com presença de alterações laríngeas e vocais, e 37 mulheres sem alterações laríngeas e vocais, entre 18 a 45 anos. A avaliação vocal foi realizada por consenso pela análise perceptivo-auditiva da vogal /a/ em frequência e intensidade habituais, e classificação através do grau geral da disfonia, onde G0 indicou qualidade vocal neutra e G1 a 3 qualidade vocal alterada. As imagens laríngeas foram obtidas pela gravação da emissão da vogal /i/, em frequência e intensidade habituais para análise da videoquimografia digital. A construção do IVFG se deu pela escolha do ponto médio da glote para análise e, elaboração foi realizada regressão logística pelo programa MINITAB 19.
Resultados A regressão logística contou com duas etapas, sendo que a etapa 1 constou da análise de todas as variáveis, onde as variáveis abertura máxima e fechamento glótico apresentaram significância estatística (p-valor <0.05) e o modelo se encontrou bem ajustado de acordo com o teste de Hosmer-Lemeshow (p-valor=0,794); na etapa 2, as variáveis selecionadas foram novamente analisadas e o modelo também se mostrou bem ajustado (p-valor=0,198). O IVFG foi definido por IVFG=e^(8,1318-0,2941AbMax-0,0703FechGlo)/1+e^(8,1318-0,2941AbMax-0,0703FechGlo).
Conclusão O IVFG apresenta valor de corte igual a 0,71. A probabilidade de acerto é de 81,5%, sensibilidade 76,4%, especificidade de 89,2%.
Descritores
Quimografia; Voz; Disfonia; Aprovação de Teste de Diagnóstico; Laringe
ABSTRACT
Purpose To develop the Videokymographic Index of Glottic Function (VIGF), a composite indicator from digital videokymography parameters, captured by high-speed videolaryngoscopy exams of women with and without laryngeal alterations of behavioral etiology.
Methods The sample consisted of 92 women aged between 18 and 45 years. Fifty-five (55) women with behavioral dysphonia, presenting with laryngeal and voice alterations, and thirty-seven (37) women without any laryngeal and voice alterations. Voice evaluation was performed by consensus via an auditory-perceptual analysis of the sustained vowel /a/ at a habitual pitch and loudness. Voice classification was obtained by means of a general degree of dysphonia, where G0 indicated neutral voice quality and G1 to G3 indicated altered voice quality. Laryngeal images were captured via digital videokymography analysis of a sustained vowel /i/ at a habitual pitch and loudness. The VIGF was based on the midpoint of the glottal region for analysis. Logistic regression was performed using the MINITAB 19 program.
Results Logistic regression was composed of two stages: Stage 1 consisted of the analysis of all variables, where the maximum opening and closed quotient variables showed statistical significance (p-value <0.05) and the model was well adjusted according to the Hosmer-Lemeshow test (p-value=0.794). Stage 2 consisted of the re-analysis of the selected variables, also showing a well-adjusted model (p-value=0.198). The VIGF was defined as follows: VIGF=e^(8.1318-0.2941AbMax-0.0703FechGlo)/1+e^(8.1318-0.2941AbMax-0.0703FechGlo).
Conclusion The VIGF demonstrated a cut-off value equal to 0.71. The probability of success was 81.5%, sensitivity 76.4%, and specificity 89.2%.
INTRODUÇÃO
A voz se constitui como uma principal ferramenta da comunicação, transmitindo importantes características do falante(1). Sabe-se que a fonação é coordenada por mecanismos neurofisiológicos, os quais exigem harmonia e integridade do aparelho fonador(1).
A classificação das disfonias pode ser baseada em diversos critérios, uma vez que a voz é o resultado da integração de múltiplas dimensões. As disfonias comportamentais são aquelas que a etiologia é dada pelo comportamento vocal(2). Lesões com alterações teciduais de mucosa, como nódulos vocais, edemas, pólipos, dentre outros, exemplificam este quadro de disfonia(1).
Nas disfonias comportamentais a presença de alteração vocal associada com sintomas de esforço fonatório podem ser fatores limitadores da qualidade de vida do paciente disfônico(3). O diagnóstico desta alteração é multidisciplinar, onde os exames laríngeos serão instrumentos fundamentais na descrição do padrão vibratório das pregas vocais (PPVV) e do comportamento dos ciclos glóticos(4).
A avaliação otorrinolaringológica dispõe de equipamentos com tecnologias variadas, sendo a videolaringoestroboscopia o método que permite a visualização do movimento muco-ondulatório da mucosa das PPVV(4). A literatura evidencia a eficácia diagnóstica da videolaringoscopia de alta velocidade (HSV), instrumento capaz de captar 2000 a 6000 imagens por segundo, permitindo a real visualização da vibração da mucosa das PPVV e possíveis irregularidades glóticas durante a fonação, além de possibilitar a extração dos parâmetros da videoquimografia digital (DKG)(5,6).
Considerando o plano horizontal de observação, a DKG é um instrumento que permite a observação direta da vibração das PPVV e análise quantitativa da função glótica(7). Sua avaliação permite a detecção de assimetrias laríngeas, amplitude de propagação da onda mucosa e fechamento da glote(8-10). Em sua análise, considera as variáveis abertura máxima, mínima e média, amplitude de vibração e frequência de cada prega vocal, além de avaliar o fechamento glótico(11).
A precisão diagnóstica é de fundamental importância para o aperfeiçoamento no tratamento de pacientes com disfonia. Pesquisas que utilizam a HSV e a DKG são promissoras, posto que são tecnologias que permitem a visualização do ciclo glótico de forma real, estática e com ponto de seleção na linha média, possibilitando o conhecimento e compreensão sobre a dinâmica da produção vocal(12).
Os Indicadores compostos ou índices numéricos são ferramentas que possibilitam a síntese de variáveis relacionadas a um determinado evento(13). Considerando o caráter multidimensional da voz, as principais variáveis utilizadas na caracterização destes índices são análise perceptivo-auditiva (vogal sustentada, fala encadeada e texto balanceado foneticamente), acústica, aerodinâmica e respiratória(14-17).
Na clínica vocal, os índices são instrumentos que podem ser aplicados na avaliação, processo terapêutico e monitoramento da evolução do quadro disfônico, sendo um método complementar à intervenção vocal. Dentre os índices mais utilizados, citam-se o Dysphonia Severity Index (DSI)(14), Cepstral Spectral Index of Dysphonia (CSID)(15), Acoustic Voice Quality Index (AVQI)(16), Acoustic Breathiness Index (ABI)(17), os quais consideram as variáveis acústicas, cepstrais, e aerodinâmicas em suas análises para determinação da disfonia.
O objetivo desse estudo é elaborar um indicador composto denominado Índice Videoquimográfico da Função Glótica – IVFG, a partir de parâmetros da videoquimografia digital, captados pelo exame de videolaringoscopia de alta velocidade de mulheres sem e com alterações laríngeas de etiologia comportamental.
O desenvolvimento da tecnologia da semiologia laríngea propiciou a avaliação quantitativa das fases do ciclo glótico, portanto, o Índice Videoquimográfico da Função Glótica (IVFG) beneficiará a precisão diagnóstica, uma vez que a videoquimografia é composta por diversos parâmetros e sua análise fornece diferentes informações do ciclo glótico. A melhor precisão diagnóstica laríngea otimiza o tratamento fonoterápico, por meio do auxílio na definição de melhores técnicas vocais, melhorando o prognóstico do tratamento vocal.
MÉTODO
Trata-se de um estudo retrospectivo para a construção de um Indicador Composto, que seguiu todas as etapas recomendadas pelo Standards for Reporting Diagnostic accuracy studies (STARDS)(17). Esta pesquisa foi aprovada pelo Comitê de Ética em Pesquisa (COEP) da Universidade Federal de Minas Gerais, sob o número CAAE 44848115.0.0000.5149.
Este estudo utilizou uma amostra de conveniência composta por 92 mulheres, que foram divididas em dois grupos. O Grupo 1 (G1) foi composto por mulheres com alterações laríngeas, alteração da qualidade vocal e presença de queixas vocais. Todas as participantes do G1 preencheram os critérios para o diagnóstico de disfonia de base comportamental(18). O Grupo 2 (G2) foi formado por mulheres sem alterações laríngeas, qualidade vocal neutra e ausência de queixa vocal. Os dados analisados foram provenientes do banco de dados de imagens laríngeas da videolaringoscopia de alta velocidade (HSV) do Laboratório de Saúde Funcional em Fonoaudiologia (OSF/UFMG) no período de 2017 a 2018. Por se tratar da análise de um banco de dados, os participantes foram contatados por telefone e questionados sobre a concordância na realização desta pesquisa, não sendo necessária a assinatura de outro Termo de Consentimento Livre e Esclarecido (TCLE).
Para seleção das imagens laríngeas, foram critérios de inclusão ser mulher de 18 a 45 anos, e para o G1 apresentar exame laríngeo alterado com presença de alterações teciduais ou estruturais das PPVV e/ou de coaptação glótica; qualidade vocal alterada; e presença de queixa vocal, definindo um diagnóstico de disfonia de base comportamental(18). Para o G2 foram critérios de inclusão apresentar exame sem alterações laríngeas, qualidade vocal neutra e ausência de queixa vocal. Os critérios de exclusão considerados foram, no dia da realização do exame, estar grávida ou em período menstrual ou pré-menstrual. Foram também excluídas mulheres que apresentaram reflexo de náusea exacerbado, autorreferiram traumas ou cirurgias na região cervical, doenças laríngeas ou infecciosas das vias aéreas superiores, doenças hormonais e imagens da HSV com baixa nitidez.
Para a definição do diagnóstico laríngeo foram realizadas avaliações com a HSV por dois médicos otorrinolaringologistas com experiência maior que cinco anos. Em cada exame foram gravadas 2000 imagens por segundo usando laringoscópio rígido de 70° com 300W de luz xênon (KayPentax ®, Lincoln Park, New Jersey) com sistema de videolaringoscopia de alta velocidade colorido modelo 9710. A resolução da imagem utilizada foi 512 x 512 pixels com modo de cor de 8 bit RGB. As imagens laríngeas foram obtidas pela gravação da emissão da vogal /i/, em frequência e intensidade habituais, sendo selecionada a melhor sequência de imagens após o início das emissões, previamente estabelecidos pelos autores. Durante a análise, optou-se pela escolha de interpretação dos dados referentes ao ponto médio da glote, uma vez que as lesões que acometem o terço médio das PPVV são as mais prevalentes(19,20).
As imagens laríngeas gravadas e selecionadas para a pesquisa foram avaliadas pelos dois otorrinolaringologistas, e para o diagnóstico do tipo de fechamento glótico se utilizou a classificação de Woo(21).
Para a avaliação perceptivo-auditiva da qualidade vocal, as vozes de todas as participantes foram gravadas em uma sala acusticamente tratada e foi processada diretamente em um computador da marca Dell®, modelo Optiplex GX260, com placa de som profissional marca Direct Sound® com a utilização de um microfone unidirecional, condensador, da marca Shure®, posicionado a dois centímetros da comissura labial, com ângulo de captação direcional de 45°. Foi solicitado à participante que, em posição sentada, emitisse a vogal sustentada /a/ de forma habitual e plena. As gravações das vozes ocorreram antes da realização do HSV.
A avaliação da qualidade vocal foi realizada por consenso por três fonoaudiólogos especialistas em voz, por meio da análise perceptivo-auditiva da vogal /a/ sustentada. A classificação vocal se deu através do grau geral da disfonia em uma escala de quatro pontos, onde zero indicou qualidade vocal neutra, e três qualidade vocal alterada de grau intenso.
A presença de queixa vocal foi avaliada no dia da realização da HSV, a partir análise da autopercepção da qualidade vocal (referir ter/não ter voz boa ou muito boa) e análise da presença/ausência de sintomas vocais (fadiga e/ou desconforto). A presença de queixa vocal foi definida pela autopercepção negativa da qualidade vocal e pela presença de sintomas vocais.
Do total de 112 amostras de imagem laríngea e voz analisadas, foram incluídas neste estudo 92 imagens. O Grupo 1 (G1) foi composto por 55 mulheres com idade média de 29,01 anos (DP=4,33). As principais alterações laríngeas encontradas foram nódulos vocais (N=24), cisto de prega vocal (N=20); fendas médio-posterior (N=4), dupla (N=1), e paralela (N=1); vasculodisgenesia (N=4); e lesão polipóide (N=1), além de qualidade vocal alterada de grau leve (N=49) e moderado (N=6), e presença de queixa vocal. O G1 caracterizou, portanto, o grupo de mulheres com disfonia comportamental.
O Grupo 2 (G2) foi composto por 37 mulheres com idade média de 26,37 anos (DP=3,87). As participantes deste grupo apresentaram exame laríngeo sem alterações estruturais. Observou-se somente presença de fenda triangular posterior nas mulheres, sendo esta considerada fisiológica(2). Todas as participantes deste grupo apresentaram qualidade vocal neutra, e não possuíam queixa vocal. O G2 formou o grupo de mulheres com laringe normal.
Neste estudo 20 imagens laríngeas não foram selecionadas para a pesquisa por não atenderem os critérios de inclusão ou exclusão. Dez imagens laríngeas apresentaram baixa nitidez que inviabilizou a análise da DKG; seis pacientes apresentaram sinais de refluxos gastroesofágico; três pacientes referiram histórico de microcirurgia laríngea; e um apresentou infecção de vias aéreas superiores.
Para a extração dos parâmetros da DKG, a análise quantitativa das imagens laríngeas foi realizada por meio do programa de processamento de imagens denominado KIPS® (Kay's Image Processing Software), versão 1.11, fornecido pela KayPENTAX®.
Análise da videoquimografia digital (DKG)
Para montagem do videoquimograma no KIPS®, o avaliador inicialmente delimitou manualmente a região da imagem laríngea para análise. Duas linhas verticais possibilitaram restringir a largura da imagem quimográfica e três linhas horizontais foram utilizadas para separar os terços posterior (linha 1), médio (linha 2) e anterior (linha 3), determinando as regiões das PPVV para análise (Figura 1). Para o desenvolvimento desta pesquisa foram considerados os resultados da DKG da linha 2.
Para análise da imagem foi selecionado o trecho médio das gravações, excluindo o início e o final dos vídeos. O programa executou a montagem bidimensional do movimento mucoondulatório das PPVV de forma automática. O avaliador converteu a cor da imagem para escala de cinza para extração das medidas, e para tal, utilizou a ferramenta de ajuste de retângulo de detecção de borda e da ferramenta de detecção de bordas, concluindo a seleção da rima glótica para cada linha determinada, com o gráfico da DKG gerado. O KIPS® analisou e quantificou os dados do gráfico da DKG, organizando-os em uma tabela. A descrição dos parâmetros está descrita na Tabela 1.
A análise estatística dos dados foi realizada pelo programa estatístico MINITAB versão 19. Primeiramente foi realizada uma análise descritiva dos dados com medidas de tendência central e dispersão. Para elaboração do IVFG foi realizada regressão logística, em conjunto com o Teste de Hosmer-Lemeshow(22), o qual compara a frequência de acontecimentos de eventos observados e sinalizados pelo modelo de regressão logística.
A ideia do Teste de Hosmer-Lemeshow(22) no contexto do presente trabalho implica em dividir as 92 mulheres examinadas em 10 grupos de acordo com a magnitude das probabilidades de alteração vocais indicadas pelo modelo de regressão logística. Em seguida comparamos para cada grupo o número observado de mulheres com alterações na laringe versus o número esperado sinalizado pelo modelo. De forma similar também comparamos a situação das mulheres sem alteração na laringe em relação as alterações observadas e sinalizadas pelo modelo. Quanto mais próximo for os valores observados daqueles indicados pelo modelo de regressão logística, melhor será o ajuste. Esta proximidade ou não é avaliada pelo distribuição Qui-Quadrado proposta por Hosmer-Lemeshow(22).
Simultaneamente ao teste de Hosmer-Lemeshow(22) também devemos avaliar a significância de cada variável no modelo. Para tanto utilizamos o teste da razão de verossimilhança disponível no software estatístico XLSTAT. Um modelo de regressão logística válido deve ter p-valor no teste de Hosmer-Lemeshow alto (usualmente maior que 5% - significância) e p-valores baixos para os testes relativos as variáveis do modelo (usualmente menor que 5% - significância).
Para avaliar a sensibilidade e a especificidade, a Curva ROC foi obtida por meio do software XLSTAT.
RESULTADOS
Na Figura 2 se observa o fluxo dos participantes por meio de um diagrama de sequência, de acordo com as normas STARDS(17).
Inicialmente, foi realizada a análise descritiva das variáveis através das medidas de tendência central e de dispersão, de acordo com a Tabela 2. As mulheres com quadros de alteração laríngea por disfonia comportamental (G1) apresentam menores valores médios nos parâmetros da DKG de aberturas máxima e média; de amplitude de pregas vocais direita e esquerda; e de fechamento glótico; e de maiores valores da média dos parâmetros de frequência de abertura das pregas vocais direita e esquerda, caracterizando um ciclo glótico com menor excursão do movimento mucoondulatório e com maior frequência de vibração das PPVV.
Como as mulheres participantes do estudo foram classificadas pertencentes aos grupos G1 ou G2 e tal classificação podia depender das variáveis descritas na Tabela 2, optamos pelo uso da regressão logística para entender o processo classificatório. Em uma primeira etapa utilizamos a regressão logística com todas as variáveis descritas na Tabela 2 como representado pela Equação 1.1:
Em que P(Y=1) indica a probabilidade de alterações laríngeas de etiologia comportamental condicionado as variáveis X1,…,X7 descritas na Tabela 3.
Análise da regressão logística dos parâmetros videoquimográficos dos grupos de mulheres sem e com alteração laríngea
Considerando um nível de significância 5% (α) as variáveis estatisticamente significantes, de acordo com o teste da razão de verossimilhança, foram abertura máxima e fechamento glótico. O Teste de Hosmer Lemeshow(22), que tem por finalidade constatar a qualidade do ajuste, mostrou que o modelo está bem ajustado (p-valor=0,794). Como observado na Tabela 3, o intercepto β0 é um parâmetro auxiliar para calcularmos a probabilidade de alteração quando, teoricamente, todas as variáveis explicativas assumirem o valor zero. Em termos matemáticos essa probabilidade é representada por eβ01−eβ0. A sua necessidade ou não é avaliada em termos de significância estatística.
Na segunda etapa da regressão logística, as variáveis selecionadas (abertura máxima e fechamento glótico) foram analisadas para criação do Índice Videoquimográfico da Função Glótica (IVFG). Na Tabela 4, observa-se a descrição dos dados. O Teste de Hosmer Lemeshow(22) confirmou a bondade do ajuste apresentando p-valor=0,198 e os testes da razão de verossimilhança indicaram a significância das variáveis abertura máxima e fechamento glótico (p-valor ≅0) bem como da necessidade do intercepto. Adicionalmente, o valor do R2 de McFadden(23) obtido com o software XLSTAT resultou em 0,384. De acordo com Louviere et al.(23) valores de R2 de McFadden entre 0,2 e 0,4 é um indicativo de um ótimo ajuste do modelo de regressão logística.
Análise final da regressão logística dos parâmetros videoquimográficos dos grupos de mulheres sem e com alteração laríngea
Observamos também que, para validade do modelo final obtido nesta segunda fase, o valor da métrica “evento por variável” (EPV)(24) apresentou o resultado 37/2=18,5. No cálculo usamos o evento “sem alteração”, pois a sua quantidade observada é menor, isto é, apresenta 37 mulheres enquanto a quantidade do evento “com alteração” foi de 55. O valor 2 indica a quantidade de variáveis no modelo final (abertura máxima e fechamento glótico). De acordo com a literatura(24) um tamanho amostral necessário para estimar os parâmetros adequadamente em um modelo de regressão logística deve apresentar EPV≥10. Como o EPV do modelo final apresentado neste trabalho foi de 18,5, então o tamanho amostral pode ser julgado adequado para as conclusões obtidas(25).
Neste momento, definiu-se o valor de corte para o IVFG igual a 0,71, de tal forma a maximizar o grau de acerto das mulheres pertencentes ao estudo nos grupos G1 ou G2, obtido pelo modelo de regressão logística.
A partir da análise da Curva ROC, a probabilidade de acerto geral encontrada foi de 81,5%, sensibilidade 76,4% (probabilidade de julgar uma mulher com laringe alterada decorrente de uma disfonia de etiologia comportamental quando ela realmente possui a laringe alterada) e especificidade de 89,2% (probabilidade de julgar uma mulher como laringe normal quando ela realmente não possui laringe alterada).
Destacamos também que a área sob a curva ROC (Receiver Operating Characteristic) foi de aproximadamente 0,89 indicando uma precisão excelente(24,25). Adicionalmente rejeitamos que a área sob a curva ROC fosse 0.5 (padrão aleatório) com nível de significância 5% com um p-valor < 0,0001, o qual pode ser observado na Figura 3.
Portanto, o IVFG pode ser descrito abaixo pelo modelo de regressão logística, onde e representa a função exponencial, AbMax o valor da abertura máxima e FechGlo representa valores do fechamento glótico (Equação 1.2).
Para valores de IVFG ≥0,71 entendemos que existe alta probabilidade da ocorrência de alterações laríngeas em quadros de disfonia comportamental, enquanto valores <0,71 determinam alta probabilidade de laringes normais em mulheres.
DISCUSSÃO
A elaboração do IVFG como instrumento de diagnóstico laríngeo de mulheres com disfonia comportamental foi possível, evidenciando ser um método de avaliação com adequados valores de sensibilidade, especificidade e com probabilidade de acerto de 81,5%.
A observação direta das PPVV e de estruturas laríngeas é essencial para o diagnóstico dos distúrbios da voz(26). A HSV apresenta-se como um instrumento capaz de suprir os limites da laringoscopia tradicional, uma vez que fornece dados sobre o comportamento real do ciclo glótico, tornando o diagnóstico clínico mais eficaz e visual, sendo facilmente interpretável(27).
Na prática clínica, a DKG associada a HSV enriquece substancialmente as possibilidades de diagnóstico laríngeo, e revela de forma quantitativa, o comportamento dinâmico das pregas vocais e de outras estruturas laríngeas(28). Este método também permite caracterizar com maior riqueza de detalhes as irregularidades de vibração e duração do ciclo glótico, onda mucosa, relação vertical e padrão de fechamento glótico(28).
A partir da análise do ciclo glótico de 252 participantes, de ambos os sexos, a HSV apresentou 100% de precisão diagnóstica nas alterações vocais de grau moderado e 64% das alterações de grau intenso quando comparada à videoendoscopia(29). Pacientes com e sem alterações laríngeas foram avaliados pelos dois métodos e, os autores observaram diferenças significativas na classificação dos quadros vocais, uma vez que a HSV é capaz de fornecer imagens mais precisas da fonação ao longo de muitos ciclos glóticos, favorecendo a qualidade do diagnóstico(30).
Os índices em saúde são desenvolvidos para permitir mensurar e atribuir valores que definem padrões, propiciando comparações e melhorando a precisão diagnóstica. A partir da observação dos parâmetros que melhor descrevem de forma concisa o evento, os índices auxiliam na compreensão e criação de valores de referência para a prática clínica, sendo utilizado de forma ampla em outras áreas do conhecimento(31).
O considerável interesse na quantificação clínica da qualidade vocal, utilizando técnicas de análise acústica e análise perceptivo-auditiva, causou instigante desejo em pesquisadores para simplificação dessas medidas a índices numéricos. Na análise vocal existem índices descritos na literatura(14-16,18), os quais consideram como material de análise a fala encadeada e vogais sustentadas.
Observou-se que, na avaliação da soprosidade vocal, proposta pelo Acoustic Breathiness Breathiness Index (ABI)(18), os pesquisadores encontraram valores de sensibilidade e especificidade em 82,4% e 92,9%. Na avalição da qualidade vocal, a partir de medidas acústicas proposta pelo Acoustic Voice Quality Index (AVQI)(16), foram encontrados valores de sensibilidade e especificidade de 85% e 100%, respectivamente, fornecendo parâmetros precisos para identificação e separação de vozes normais e disfônicas.
A triagem da gravidade da disfonia, a partir do CSID(15), em 322 sujeitos, por meio do uso de medidas cepstrais, apresentou sensibilidade de 75% e especificidade de 73%, com possibilidade de acerto em 85%. E, a determinação do grau geral da disfonia, por meio do Dysphonia Severity Index (DSI)(14) determinou valores de sensibilidade e especificidade de 72 e 75%, respectivamente.
O uso de recomendações sistemáticas (ou guideliness) para construção de práticas clínicas, a fim de sistematizar informações sobre determinadas condições de saúde, são amplamente difundidas(17). Parâmetros como sensibilidade e especificidade são essenciais para determinar casos positivos e negativos de forma correta, os quais são aferidos a partir do teste padrão. Neste estudo, optou-se pelo uso da STARD para estabelecer critérios de construção, reduzindo possíveis vieses(17).
A precisão diagnóstica de um teste clínico está atrelada aos seus valores de sensibilidade e especificidade. O FVI apresentou valor de corte de 0,71, sensibilidade de 76,4%, especificidade de 89,2%, com probabilidade de acerto de 81,5%. A determinação destes valores é primordial para estabelecer o poder diagnóstico de um instrumento. Os resultados do IVFG evidenciam altos valores de sensibilidade e especificidade, que determinam a capacidade preditiva deste teste diagnóstico(15), confirmados pela área da Curva ROC de 89%, que caracteriza um poder de discriminação excelente(22) entre mulheres com laringes normais e mulheres com laringe alterada em quadros de disfonia comportamental. Outros estudos(16,18) também utilizaram a Curva ROC para determinar a especificidade e sensibilidade no diagnóstico por meio do índice, apresentando valores que variariam de 0,5 a 0,68. Os resultados obtidos por meio da curva ROC desta pesquisa reforçam o IVFG como um instrumento sensível e preciso na avaliação de laringes de mulheres com etiologia comportamental.
O IVFG, descrito nesse estudo, se torna um diferencial na qualidade do diagnóstico das alterações laríngeas de mulheres com disfonia comportamental, uma vez que utiliza uma tecnologia recentemente introduzida na avaliação laríngea.
São limitações desse estudo a aplicabilidade em indivíduos apenas do sexo feminino, que apresentem lesões laríngeas de caráter comportamental.
Todas as avaliações das imagens laríngeas e da qualidade vocal foram realizadas por consenso por profissionais especialistas na área com o objetivo de tornar a avaliação diagnóstica colaborativa. Outras possibilidades de avaliação diagnóstica são possíveis, como análise dos resultados mais prevalentes dos avaliadores com maiores níveis de concordância. Estudos futuros são necessários para uma melhor compreensão da melhor estratégia avaliativa e classificatória, quando se lida com análises subjetivas, como a análise perceptivo-visual da imagem laríngea, e a análise perceptivo-auditiva da voz.
A American Speech Language-Hearing Association (ASHA)(2) recomendou protocolos para avaliação instrumental da produção de voz como a avaliação da imagem laríngea, a análise acústica da voz, e a avaliação aerodinâmica, com o objetivo de definir balizadores da avaliação vocal; permitir comparações entre diferentes centros clínicos e de pesquisa; e facilitar a avaliação da eficácia do tratamento vocal(2). Segundo a ASHA, com relação à avaliação laríngea, recomenda-se a realização da videolaringoscopia para análise estrutural da laringe, e a videolarinestrobosgoscopia para avaliação do movimento vibratório das PPVV(2). A literatura reforça que a imagem laríngea obtida pela videolaringoscopia é o padrão-ouro para o diagnóstico das alterações vocais(32), e a HSV pode ser utilizada como um complemento para estroboscopia, principalmente para os quadros de disfonia caracterizadas por vibrações assimétricas ou aperiódicas das PPVV(32). Apesar da HSV se configurar como uma tecnologia recente, dependente de um instrumental de alto custo, e ainda com pouco acesso à clínica laringológica, pesquisas científicas com a HSV são importantes para se analisar o real valor diagnóstico deste procedimento avaliativo.
Apesar da avaliação laríngea ser do escopo do médico otorrinolaringologista, a ASHA(2) entende que o fonoaudiólogo deve ter conhecimentos e formação adequada para a análise funcional das imagens laríngeas, como auxílio na tomada da melhor decisão clínica para o tratamento fonoaudiológico de indivíduos disfônicos.
Pesquisas futuras com a aplicação do IVFG na determinação do diagnóstico de alterações laríngeas de mulheres com disfonia comportamental são importantes para se analisar a aplicação deste instrumento na prática clínica vocal.
CONCLUSÃO
O IVFG apresenta valor de corte igual a 0,71, onde ≥0,71 representam presença de alterações laríngeas em quadros de disfonia comportamental, enquanto valores <0,71 determinam laringes normais. A probabilidade de acerto é de 81,5%, sensibilidade 76,4% e especificidade de 89,2%. O IVFG otimiza o diagnóstico laríngeo, e possibilita uma melhor definição do tratamento fonoterápico nos casos de disfonias comportamentais, potencializando o prognóstico na clínica vocal.
-
Trabalho realizado na Universidade Federal de Minas Gerais – UFMG - Belo Horizonte (MG), Brasil.
-
Fonte de financiamento: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) pela concessão de bolsa de pesquisa e pelo apoio - Código de Financiamento 001 e Conselho Nacional de Desenvolvimento Científico e Tecnológico-Brasil (CNPq) (nº 309108/2019-5).
REFERÊNCIAS
- 1 Behlau M, Azevedo R, Pontes P. Conceito de voz normal e classificação das disfonias. In: Behlau M, editor. Voz: o livro do especialista. 1ª ed. Rio de Janeiro: Revinter; 2001. p. 53-84.
-
2 Patel RR, Awan SN, Barkmeier-Kraemer J, Courey M, Deliyski D, Eadie T, et al. Recommended protocols for instrumental assessment of voice: american speech-language-hearing association expert panel to develop a protocol for instrumental assessment of vocal function. Am J Speech Lang Pathol. 2018;27(3):887-905. http://dx.doi.org/10.1044/2018_AJSLP-17-0009 PMid:29955816.
» http://dx.doi.org/10.1044/2018_AJSLP-17-0009 -
3 Góes TRV, Ferracciu CCS, Silva DRO. Associação entre a adesão da terapia vocal e perfil de atividades vocais em pacientes disfônicos comportamentais. CoDAS. 2016;28(5):595-601. http://dx.doi.org/10.1590/2317-1782/20162015232 PMid:27812672.
» http://dx.doi.org/10.1590/2317-1782/20162015232 -
4 Baravieira PB, Brasolotto AG, Hachiya A, Takahashi-Ramos MT, Tsuji DH, Montagnoli AN. Comparative analysis of vocal fold vibration using high-speed videoendoscopy and digital kymography. J Voice. 2014;28(5):603-7. http://dx.doi.org/10.1016/j.jvoice.2013.12.019 PMid:24726330.
» http://dx.doi.org/10.1016/j.jvoice.2013.12.019 - 5 Nascimento UN, Santos MAR, Gama ACC. Digital videokymography: analysis of glottal closure in adults. J Voice. 2021. No prelo. PMid:34417083.
- 6 Patel R, Dubrovskiy D, Dollinger M. Characterizing vibratory kinematics in children and adults with high-speed digital imaging. J Speech Lang Hear Res. 2014;57(2):S674-86. PMid:24686982.
-
7 Larsson H, Hertegård S, Lindestad PA, Hammarberg B. Vocal fold vibrations: high-speed imaging, kymography, and acoustic analysis: a preliminary report. Laryngoscope. 2000;110(12):2117-22. http://dx.doi.org/10.1097/00005537-200012000-00028 PMid:11129033.
» http://dx.doi.org/10.1097/00005537-200012000-00028 -
8 Tsuji D, Dajer M, Ishikawa C, Takahashi M, Montagnoli A, Hachiya A. Improvement of vocal pathologies diagnosis using high-speed videolaryngoscopy. Int Arch Otorhinolaryngol. 2014;18(3):294-302. http://dx.doi.org/10.1055/s-0034-1372512 PMid:25992109.
» http://dx.doi.org/10.1055/s-0034-1372512 -
9 Svec JG, Schutte HK. Kymographic imaging of laryngeal vibrations. Curr Opin Otolaryngol Head Neck Surg. 2012;20(6):458-65. http://dx.doi.org/10.1097/MOO.0b013e3283581feb PMid:22931907.
» http://dx.doi.org/10.1097/MOO.0b013e3283581feb -
10 Tsutsumi M, Isotani S, Pimenta RA, Dajer ME, Hachiya A, Tsuji DH, et al. High-speed videolaryngoscopy: quantitative parameters of glottal area waveforms and high-speed kymography in healthy individuals. J Voice. 2017;31(3):282-90. http://dx.doi.org/10.1016/j.jvoice.2016.09.026 PMid:27793519.
» http://dx.doi.org/10.1016/j.jvoice.2016.09.026 -
11 Svec JG, Schutte HK. Videokymography: high-speed line scanning of vocal fold vibration. J Voice. 1996;10(2):201-5. http://dx.doi.org/10.1016/S0892-1997(96)80047-6 PMid:8734395.
» http://dx.doi.org/10.1016/S0892-1997(96)80047-6 -
12 Sulica L. Laryngoscopy, stroboscopy and other tools for the evaluation of voice disorders. Otolaryngol Clin North Am. 2013;46(1):21-30. http://dx.doi.org/10.1016/j.otc.2012.09.001 PMid:23177402.
» http://dx.doi.org/10.1016/j.otc.2012.09.001 - 13 Mingoti SA. Análise de dados através de métodos de estatística multivariada: uma abordagem aplicada de dados. Belo Horizonte: UFMG; 2005. 295 p.
-
14 Kim H, Gao S, Yi B, Shi R, Wan Q, Huang Z. Validation of the dysphonia severity index in the Dr. Speech Program. J Voice. 2019;33(6):948.e23-9. http://dx.doi.org/10.1016/j.jvoice.2019.08.011 PMid:31526665.
» http://dx.doi.org/10.1016/j.jvoice.2019.08.011 -
15 Awan SN, Roy N, Zhang D, Cohen SM. Validation of the Cepstral Spectral Index of Dysphonia (CSID) as a screening tool for voice disorders: development of clinical cutoff scores. J Voice. 2016;30(2):130-44. http://dx.doi.org/10.1016/j.jvoice.2015.04.009 PMid:26361215.
» http://dx.doi.org/10.1016/j.jvoice.2015.04.009 -
16 Englert M, Barsties V, Latoszek B, Maryn Y, Behlau M. Validation of the acoustic voice quality index, version 03.01, to the Brazilian Portuguese Language. J Voice. 2021;35(1):160.e15-21. http://dx.doi.org/10.1016/j.jvoice.2019.07.024 PMid:31474432.
» http://dx.doi.org/10.1016/j.jvoice.2019.07.024 -
17 Cohen JF, Korevaar DA, Altman DG, Bruns DE, Gatsonis CA, Hooft L, et al. STARD 2015 guidelines for reporting diagnostic accuracy studies: explanation and elaboration. BMJ Open. 2016;6(11):e012799. http://dx.doi.org/10.1136/bmjopen-2016-012799 PMid:28137831.
» http://dx.doi.org/10.1136/bmjopen-2016-012799 -
18 Englert M, Barsties V, Latoszek B, Maryn Y, Behlau M. Validation of the acoustic breathiness index to the Brazilian Portuguese language. Logoped Phoniatr Vocol. 2022;47(1):56-62. http://dx.doi.org/10.1080/14015439.2020.1864467 PMid:33404289.
» http://dx.doi.org/10.1080/14015439.2020.1864467 -
19 Dejonckere PH, Bradley P, Clemente P, Cornut G, Crevier-Buchman L, Friedrich G, et al. A basic protocol for functional assessment of voice pathology, especially for investigating the efficacy of (phonosurgical) treatments and evaluating new assessment techniques: guideline elaborated by the Committee on Phoniatrics of the European Laryngological Society (ELS). Eur Arch Otorhinolaryngol. 2001;258(2):77-82. http://dx.doi.org/10.1007/s004050000299 PMid:11307610.
» http://dx.doi.org/10.1007/s004050000299 -
20 van Houtte E, van Lierde K, D’Haeseleer E, Claeys S. The prevalence of laryngeal pathology in a treatment-seeking population with dysphonia. Laryngoscope. 2010;120(2):306-12. http://dx.doi.org/10.1002/lary.20696 PMid:19957345.
» http://dx.doi.org/10.1002/lary.20696 -
21 Woo P. Objective measures of laryngeal imaging: what have we learned since Dr. Paul Moore. J Voice. 2013;28(1):69-81. http://dx.doi.org/10.1016/j.jvoice.2013.02.001 PMid:24094798.
» http://dx.doi.org/10.1016/j.jvoice.2013.02.001 - 22 Hosmer DW, Lemeshow S. Applied logistic regression. 2nd ed. New York: John Wiley & Sons; 1985. p. 156-64.
-
23 Louviere JJ, Hensher AD, Swait DJ. Stated choice methods. New York: Cambridge University Press; 2000. http://dx.doi.org/10.1017/CBO9780511753831
» http://dx.doi.org/10.1017/CBO9780511753831 - 24 Menard S. Coefficients of determination for multiple logistic regression analysis. Am Stat. 2000;54:17-24.
-
25 Mittlböck M, Schemper M. Explained variation in logistic regression. Stat Med. 1996;15(19):1987-97. http://dx.doi.org/10.1002/(SICI)1097-0258(19961015)15:19<1987::AID-SIM318>3.0.CO;2-9 PMid:8896134.
» http://dx.doi.org/10.1002/(SICI)1097-0258(19961015)15:19<1987::AID-SIM318>3.0.CO;2-9 -
26 Behrman A. Common practices of voice therapists in the evaluation of patients. J Voice. 2005;19(3):454-69. http://dx.doi.org/10.1016/j.jvoice.2004.08.004 PMid:16102671.
» http://dx.doi.org/10.1016/j.jvoice.2004.08.004 -
27 Wittenberg T, Tigges M, Mergell P, Eysholdt U. Functional imaging of vocal fold vibration: digital multislice high-speed kymography. J Voice. 2000;14(3):422-42. http://dx.doi.org/10.1016/S0892-1997(00)80087-9 PMid:11021509.
» http://dx.doi.org/10.1016/S0892-1997(00)80087-9 -
28 Qiu Q, Schutte HK, Gu L, Yu Q. An automatic method to quantify the vibration properties of human vocal folds via videokymography. Folia Phoniatr Logop. 2003;55(3):128-36. http://dx.doi.org/10.1159/000070724 PMid:12771464.
» http://dx.doi.org/10.1159/000070724 -
29 Deliyski DD. Endoscope motion compensation for laryngeal high-speed videoendoscopy. J Voice. 2005;19(3):485-96. http://dx.doi.org/10.1016/j.jvoice.2004.07.006 PMid:16102674.
» http://dx.doi.org/10.1016/j.jvoice.2004.07.006 -
30 Patel R, Dailey S, Bless D. Comparison of high-speed digital imaging with stroboscopy for laryngeal imaging of glottal disorders. Ann Otol Rhinol Laryngol. 2008;117(6):413-24. http://dx.doi.org/10.1177/000348940811700603 PMid:18646437.
» http://dx.doi.org/10.1177/000348940811700603 - 31 Pigozzo MN, Laganá DC, Campos TN, Yamada MCM. A importância dos índices em pesquisa clínica odontológica: uma revisão da literatura. Odontol Univ Cid São Paulo. 2008;20(3):280-7.
-
32 Popolo PS, Johnson AM. Relating cepstral peak prominence to cyclical parameters of vocal fold vibration from high-speed videoendoscopy using machine learning: a pilot study. J Voice. 2021;35(5):703-16. http://dx.doi.org/10.1016/j.jvoice.2020.01.026 PMid:32173147.
» http://dx.doi.org/10.1016/j.jvoice.2020.01.026