Accessibility / Report Error

Avaliação de dados genômicos imputados em características distintas usando os métodos de Random Forest e de limiares Bayesianos

RESUMO.

Os objetivos deste estudo foram (1) quantificar a precisão de imputação e acessar os fatores que as afetam; e (2) avaliar a precisão do princípio de BayesA (TBA), do modelo Bayesiano LASSO (BTL), e o algoritmo Random Forest para analisar as características distintas. Dados genômicos foram simulados para indicar variações na herdabilidade (h2 = 0.30 e 0.10), número de QTL (QTL = 81 e 810), número de SNP (10 k e 50 k) e desequilíbrio de ligação (LD = baixo e alto) para 27 cromossomos. Para uma simulação mais realista, nós cobrimos os marcadores aleatoriamente com 90% da taxa ausente para cada cenário, depois, os marcadores foram imputados usando o software FImpute. Nos genótipos imputados uma grande oscilação de precisão foi observada pelo modelo RF (0.164-0.512) comparado com TBA (0.283 - 0.469) e BTL (0.272 - 0.504). Comparando com os genótipos originais, os genótipos imputados decaíram a precisão média da predição genômica em cerca de 0.0273 (oscilação de 0.024 para 0.036). Comparando-se ao princípio Bayesiano, o uso de RF melhorou a precisão de predição com o aumento da densidade do marcador. Além disso, o melhor método para predição de precisão genômica depende da arquitetura genômica da sua população.

Palavras-chave:
precisão; arquitetura genômica; desequilíbrio de ligação aprendizado maquinal; genótipos mascarados

Editora da Universidade Estadual de Maringá - EDUEM Av. Colombo, 5790, bloco 40, CEP 87020-900 , Tel. (55 44) 3011-4253, Fax (55 44) 3011-1392 - Maringá - PR - Brazil
E-mail: actaanim@uem.br