Acessibilidade / Reportar erro

Determinação de constituintes químicos em madeira de eucalipto por Pi-CG/EM e calibração multivariada: comparação entre redes neurais artificiais e máquinas de vetor suporte

Determination of chemical constituents in eucalyptus wood by Py-GC/MS and multivariate calibration: comparison between artificial neural network and support vector machines

Resumo

Multivariate models were developed using Artificial Neural Network (ANN) and Least Square - Support Vector Machines (LS-SVM) for estimating lignin siringyl/guaiacyl ratio and the contents of cellulose, hemicelluloses and lignin in eucalyptus wood by pyrolysis associated to gaseous chromatography and mass spectrometry (Py-GC/MS). The results obtained by two calibration methods were in agreement with those of reference methods. However a comparison indicated that the LS-SVM model presented better predictive capacity for the cellulose and lignin contents, while the ANN model presented was more adequate for estimating the hemicelluloses content and lignin siringyl/guaiacyl ratio.

analytical pyrolysis; artificial neural network; least square-support vector machine


analytical pyrolysis; artificial neural network; least square-support vector machine

ARTIGO

Determinação de constituintes químicos em madeira de eucalipto por Pi-CG/EM e calibração multivariada: comparação entre redes neurais artificiais e máquinas de vetor suporte

Determination of chemical constituents in eucalyptus wood by Py-GC/MS and multivariate calibration: comparison between artificial neural network and support vector machines

Cleiton Antônio NunesI; Claudio Ferreira LimaI, * * e-mail: cflima@ufv.br ; Luiz Cláudio de Almeida BarbosaI; Jorge Luiz ColodetteII; Paulo Henrique FidêncioIII

IDepartamento de Química, Universidade Federal de Viçosa, 36570-000 Viçosa - MG, Brasil

IIDepartamento de Engenharia Florestal, Universidade Federal de Viçosa, 36570-000 Viçosa - MG, Brasil

IIIDepartamento de Química, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 39100-000 Diamantina - MG, Brasil

ABSTRACT

Multivariate models were developed using Artificial Neural Network (ANN) and Least Square - Support Vector Machines (LS-SVM) for estimating lignin siringyl/guaiacyl ratio and the contents of cellulose, hemicelluloses and lignin in eucalyptus wood by pyrolysis associated to gaseous chromatography and mass spectrometry (Py-GC/MS). The results obtained by two calibration methods were in agreement with those of reference methods. However a comparison indicated that the LS-SVM model presented better predictive capacity for the cellulose and lignin contents, while the ANN model presented was more adequate for estimating the hemicelluloses content and lignin siringyl/guaiacyl ratio.

Keywords: analytical pyrolysis; artificial neural network; least square-support vector machine.

INTRODUÇÃO

Atualmente, a alta demanda de análises dos programas de melhoramento genético voltados à qualidade da madeira de eucalipto tem exigido métodos analíticos mais rápidos e eficientes, uma vez que os métodos padrões requerem procedimentos trabalhosos e demorados, apesar de serem validados e produzirem resultados confiáveis.1

A pirólise associada à cromatografia gasosa e à espectrometria de massas (Pi-CG/EM) tem se destacado entre as técnicas alternativas utilizadas na caracterização química da madeira de eucalipto, apresentando como principal vantagem o uso de pequenas quantidades de amostra e de procedimentos rápidos com mínimos pré-tratamentos.2-6

A pirólise analítica pode ser definida como uma técnica de caracterização de determinado material pelas reações de degradação químicas induzidas por energia térmica na ausência de oxigênio, resultando em um conjunto de pequenas espécies moleculares as quais são relacionadas à composição da amostra original.7 A possibilidade da cromatografia gasosa de separar os produtos provenientes da pirólise e da espectrometria de massas de identificá-los faz da associação entre estas técnicas uma poderosa ferramenta para caracterização de diversos materiais poliméricos não voláteis.

Embora os pirogramas (cromatogramas referentes às amostras pirolisadas) da madeira de eucalipto contenham informações sobre a composição química das amostras, o seu uso em modelos convencionais de calibração univariada para a estimativa de parâmetros composicionais, como os teores de celulose ou de lignina, pode ser dificultado devido a esse tipo de informação estar distribuída por todo o pirograma.2,4-6,8 Entretanto, modelos de calibração para sistemas com resposta multivariada, como os pirogramas, podem ser construídos empregando métodos de calibração multivariada.

Entre os métodos de calibração multivariada têm se destacado as redes neurais artificiais9 e, mais recentemente, as máquinas de vetor suporte por mínimos quadrados.10

As redes neurais artificiais (ANN, Artificial Neural Network) são um conjunto de métodos matemáticos e algoritmos computacionais projetados para simular o processamento de informações e aquisição de conhecimento do cérebro humano. Operacionalmente uma rede neural pode ser considerada como uma "caixa de processamento" que pode ser treinada para que, a partir de um conjunto de dados de entrada, possa gerar uma ou mais saídas. As ANN vêm sendo amplamente empregadas na solução de problemas em química, principalmente em calibração multivariada, na qual tem permitido a construção de modelos com excelente capacidade de previsão.9

As máquinas de vetor de suporte (SVM, Support Vector Machine) são máquinas de aprendizagem que podem ser usadas para regressão ou classificação. As máquinas de vetor de suporte por mínimos quadrados (LS-SVM, Least Square - Support Vector Machine) são uma modificação das SVM que, ao invés de usarem uma programação quadrática, usam um sistema de equações lineares e uma função custo por mínimos quadrados, proporcionando menor exigência computacional em relação às SVM sem perda na qualidade das soluções, uma vez que ambas são baseadas nos mesmos princípios.10 A principal vantagem que tem sido relatada na aplicação das LS-SVM é a elevada capacidade de generalização dos modelos construídos. Uma descrição mais detalhada sobre as LS-SVM pode ser encontrada nas refs. 10 a 12.

Neste trabalho foram desenvolvidos modelos de calibração multivariada empregando ANN e LS-SVM para a estimativa da relação siringil/guaiacil (S/G) e dos teores de celulose, hemiceluloses e lignina em madeira de eucalipto por Pi-CG/EM, fazendo-se uma comparação da capacidade preditiva dos modelos.

PARTE EXPERIMENTAL

Preparo das amostras

Utilizaram-se amostras de madeira de clones adultos de E. grandis, de híbridos de E.grandis x E. urophilla e de híbrido natural de E. grandis. As árvores foram cultivadas nas regiões de Barão de Cocais, Guanhães, Santa Bárbara e Ipaba, no estado de Minas Gerais. Foram amostradas 3 árvores de cada um dos 6 clones cultivados nas 4 regiões, totalizando 72 amostras.

As toras de madeira foram transformadas em cavacos utilizando um picador de laboratório, sendo posteriormente classificados manualmente, eliminando-se pedaços de casca, nós e cavacos defeituosos. Os cavacos selecionados foram homogeneizados e, em seguida, secos ao ar para uniformização da umidade. A seguir, os cavacos foram transformados em serragem em um moinho de hélice Tecnal modelo TE-631. A serragem obtida foi classificada em peneiras de 40-60 mesh.

Análise por Pi-CG/EM

A pirólise foi realizada em um sistema on-line constituído de um pirolisador de microforno Shimadzu modelo PYR-4A acoplado a um cromatógrafo gasoso/espectrômetro de massas Shimadzu modelo PQ5050A.

A amostra de serragem (50 μg) foi pirolisada a 550 ºC sob atmosfera de hélio a 100 kPa como descrito anteriormente.5,8 Os produtos de pirólise foram transferidos automaticamente para o injetor do cromatógrafo aquecido a 100 °C, usando hélio como gás de arraste com um fluxo de 1,0 mL m-1. A razão de split foi de 1/10. A separação dos compostos foi feita por coluna capilar DB-5 (30,0 m × 0,25 mm × 0,25 μm), com temperatura programada em 45 °C por 4 min até 240 °C numa taxa de aquecimento de 4 °C min-1, permanecendo nessa temperatura por 10 min.

O espectrômetro de massas foi operado no modo de impacto de elétrons com energia de 70 eV e varredura de massas no intervalo de 50 a 350 Da. As temperaturas no detector e na interface CG/EM foram de 250 e 290 °C, respectivamente.

Determinação da constituição química da madeira pelos métodos clássicos

Os valores de relação siringil/guaicil e dos teores de celulose, hemiceluloses e lignina, utilizados na calibração e validação dos modelos, foram determinados por procedimentos bem estabelecidos descritos na literatura. Os teores de celulose e hemiceluloses foram determinados de acordo com o procedimento descrito por Kennedy et al..13 O teor de lignina foi determinado pela soma das ligninas insolúvel, determinadas pelo procedimento descrito por Gomide e Demuner,14 e solúvel, determinadas pelo método descrito por Goldschimid.15 A relação siringil/guaiacil foi determinada de acordo com o método descrito por Lim e Dence.16

Os valores dos parâmetros de caracterização química, determinados pelos métodos padronizados, foram da ordem de 40% de celulose, 20% de hemiceluloses, 30% de lignina e relação siringil/guaiacil da ordem de 3.

Calibração multivariada

Os pirogramas foram trabalhados utilizando a faixa de tempo de 0 a 46 min, sendo considerado o pirograma médio para cada amostra obtido por duplicata. Os pirogramas passaram por pré-processamento por normalização,17 para remover alguma variação sistemática possivelmente associada com o tamanho da amostra.

Os dados foram analisados utilizando o programa Matlab versão 6.5 com Neural Network Toolbox versão 4.0.2 (The Mathworks, Natick, USA) e LS-SVMlab Toolbox versão 1.5.18

Na calibração por ANN, os dados da matriz dos pirogramas normalizados, contendo 5565 variáveis (intensidade a cada 0,5 s), foram comprimidos utilizando a análise das componentes principais (PCA),19 uma vez que em testes preliminares foi encontrada dificuldade no processamento computacional da matriz original. A matriz dos escores, com 72 variáveis, foi então utilizada como entrada no modelo de calibração.20 As amostras foram divididas em grupos de calibração (70% das amostras), validação (20%) e teste (10%) utilizando o algoritmo Kennard-Stone.21 O modelo foi construído empregando uma rede do tipo feed-forward backpropagation com função de treinamento Levenberg-Marquardt backpropagation, sendo testadas combinações das funções sigmoidal e linear nas camadas intermediárias e de saída. O erro médio quadrático desejado para convergência foi de 1,65.

Para a modelagem por LS-SVM foi utilizada a matriz dos pirogramas normalizados, sendo as amostras divididas nos grupos de calibração (2/3 das amostras) e teste (1/3) pelo algoritmo Kennard-Stone. A avaliação do desempenho do modelo foi feita por validação cruzada. Foram testadas as funções núcleo de base radial e polinomial.

O parâmetro usado nas avaliações de desempenho dos modelos foi a média da raiz do erro médio quadrático de previsão conforme a Equação 1:

em que k é o número de RMSE (Root Mean Square Error) considerados para obter o valor médio, e i corresponde ao parâmetro estimado (celulose, hemiceluloses, ligninas e S/G), sendo

em que representa o valor previsto pelo modelo multivariado, yi representa o valor referência e n corresponde ao número de amostras.

RESULTADOS E DISCUSSÃO

Caracterização dos produtos de pirólise das amostras de eucalipto

Em estudos anteriores observou-se que a temperatura de pirólise influencia a composição dos produtos formados durante a pirólise da madeira, sobretudo os produtos derivados de lignina.5 Verificou-se que os melhores resultados foram obtidos quando a madeira foi pirolisada a 550 ºC por 10 s. Assim, as amostras de madeira de eucalipto foram pirolisadas nessas condições e os produtos separados e caracterizados por CG/EM.

Os pirogramas das amostras apresentaram perfis semelhantes ao mostrado na Figura 1, sendo identificados 8 derivados de carboidratos, 12 de lignina guaiacil, 15 de lignina siringil e um derivado de lignina modificada (Tabela 1), que pode ser observado quando a lignina é pirolisada em temperaturas próximas a 600 ºC. Estes compostos foram previamente identificados em madeira de eucaliptos cultivados no Brazil4-6 e em outros países.2,22,23 Os compostos foram identificados pela comparação de seus espectros de massa com os da biblioteca Willey 333,000, com dados da literatura3-6,8,23 e, quando necessário, por fragmentografia de massas.


Foi observada a prevalência de unidades guaiacil e siringil nos pirogramas das madeiras de eucalipto, o que caracteriza uma lignina de madeira de angiosperma.8,24 O composto mais abundante, derivado da decomposição de carboidrato, foi o 1,6-anidro-²-D-glicopiranose (levoglicosano).5,25 Os compostos derivados de lignina do tipo siringil apresentaram-se mais numerosos que os do tipo guaiacil, como já observado em outros estudos deste tipo de madeira.4-6

Não foram observados derivados de lignina do tipo p-hidroxifenil e de extrativos, devido provavelmente às suas baixas concentrações no tipo de amostra analisado.

Calibração multivariada por ANN

Na calibração por ANN, os melhores resultados foram obtidos utilizando a função de transferência linear na camada intermediária e na camada de saída. O número de neurônios na camada intermediária foi otimizado, sendo a melhor arquitetura de rede obtida com 9 neurônios na camada intermediária, na qual se obteve o menor erro quadrático médio de validação (RMSEV). A partir desse ponto, ao se aumentar o número de neurônios na camada intermediária, ocorria também o aumento da diferença entre os erros de calibração (RMSEC) e de validação, indicando sobreajuste do modelo, como pode ser visto na Figura 2.


A Tabela 2 apresenta os indicadores de desempenho do modelo construído empregando a rede neural. Os valores dos erros quadráticos médios (RMSE) apresentaram-se pelo menos uma ordem de grandeza abaixo dos valores estimados para cada constituinte. Os parâmetros estatísticos indicaram uma boa capacidade de previsão da rede ao se utilizar as amostras de validação e teste.

Calibração multivariada por LS-SVM

Na modelagem por LS-SVM, os melhores resultados foram obtidos utilizando função polinomial de ordem 2. Os parâmetros t (intercepto da função polinomial) e γ (regularização para minimizar os erros de regressão) foram combinados, a fim de se verificar a tendência do erro de validação cruzada (RMSECV), constituindo a etapa de otimização do modelo. Este procedimento é semelhante à escolha do número de neurônios na camada intermediária para os modelos de regressão ANN, porém neste caso tem-se um problema em duas dimensões. Como verificado na superfície ilustrada na Figura 3, o valor de RMSECV decresceu intensamente até por volta de t e γ = 400, quando passou a não apresentar mais uma grande redução. Ao se continuar diminuindo os valores de t e γ, o valor de RMSECV tendeu a um mínimo, mas isso poderia levar a um modelo sobredimensionado com maior tendência a erros de previsão de amostras externas.10 Assim os valores de t e γ foram fixados em 300.


Os indicadores de desempenho do modelo construído empregando LS-SVM são apresentados na Tabela 3. Assim como verificado na modelagem por ANN, a modelagem por LS-SVM também apresentou uma boa capacidade de previsão ao se utilizar as amostras de teste.

Comparação entre as modelagens por ANN e LS-SVM

Ao comparar os dois modelos de calibração, verificou-se que embora ambos tenham apresentado bons desempenhos, a modelagem por ANN apresentou melhor capacidade para estimar o teor de hemiceluloses e da relação siringil/guaiacil, apresentando menores RMSE e erros relativos para as amostras de teste. Para a estimativa dos teores de celulose e lignina, o modelo construído por LS-SVM mostrou-se mais adequado por apresentar menores RMSE e erros relativos para o grupo de teste.

Em relação ao modelo ANN, o modelo LS-SVM apresentou diferenças mais significativas entre os erros dos grupos de calibração e teste, exceto para a determinação de celulose. Entretanto, isso não invalida o uso do modelo LS-SVM na estimativa dos teores de celulose e lignina, uma vez que os erros obtidos para este modelo foram aceitáveis e inferiores aos obtidos pelo modelo ANN.

Independentemente da capacidade preditiva dos modelos, a modelagem por LS-SVM apresentou a vantagem de ter um processamento computacional menos exigente e mais rápido que a modelagem por ANN. Com o método LS-SVM foi possível a utilização direta dos dados originais, enquanto que no método ANN estes dados precisaram ser comprimidos por PCA.

Quanto à otimização dos modelos, apesar das LS-SVM necessitarem do ajuste de dois parâmetros, eles são ajustados simultaneamente, e assim esta tarefa não apresentou maiores dificuldades em relação às ANN, que têm apenas um parâmetro a ser otimizado. Entretanto, as LS-SVM permitiram utilizar uma maior quantidade de amostras no grupo de teste sem diminuir o número de amostras no grupo de calibração, uma vez que a validação cruzada pôde ser facilmente implementada.

Por fim, os valores dos parâmetros obtidos pelos métodos clássicos bem como os respectivos valores estimados pelos métodos multivariados para as amostras de teste são apresentados na Tabela 4. Os valores estimados foram obtidos através do modelo que apresentou o melhor desempenho para cada parâmetro.

CONCLUSÕES

A Pi-CG/EM mostrou-se uma técnica eficiente para a caracterização química da madeira de eucalipto, principalmente da lignina. Sua associação às ANN e às LS-SVM permitiu o desenvolvimento de bons modelos de calibração multivariada para a determinação de parâmetros químicos de qualidade em amostras de madeira de eucalipto.

A modelagem por LS-SVM apresentou uma melhor capacidade preditiva dos teores de celulose e de lignina, enquanto que a modelagem por ANN apresentou melhor desempenho na estimativa do teor de hemiceluloses e da relação siringil/guaiacil.

A simplicidade no preparo das amostras e a possibilidade de se determinar simultaneamente, a partir de um único pirograma, várias propriedades químicas nas amostras de madeira foram as principais vantagens observadas nos métodos quimiométricos estudados.

AGRADECIMENTOS

Ao CNPq e à FAPEMIG pelo apoio financeiro.

Recebido em 25/5/10; aceito em 27/8/10; publicado na web em 30/11/10

  • 1
    Pasquini, C.; Carneiro, C. J. G.; Bomfim, P. M.; O Papel 2007, 3, 71.
  • 2
    Rodrigues, J.; Graça, J.; Pereira, H.; J. Anal. Appl. Pyrolysis 2001, 58, 481.
  • 3
    Ralph, J.; Hatfield, R. D.; J. Agric. Food Chem 1991, 39, 1426.
  • 4
    Lima, C. F.; Barbosa, L. C. A.; Marcelo, C. R.; Silvério, F. O.; Colodette, J. L.; BioResources 2008, 3, 701.
  • 5
    Barbosa, L. C. A.; Maltha, C. R. A.; Silva, V. L.; Colodette, J. L.; Quim. Nova 2008, 31, 2035.
  • 6
    Nunes, C. A.; Lima, C. F.; Barbosa, L. C. A.; Colodette, J. L.; Gouveia, A. F. G.; Silvério, F. O.; Bioresour. Technol 2010, 101, 4056.
  • 7
    Uden, P. C.; Pure Appl. Chem.1993, 65, 2405.
  • 8
    Del Río, J. C.; Gutiérrez, A.; Hernando, M.; Landín, P.; Romero, J.; Martínez, A. T.; J. Anal. Appl. Pyrolysis 2005, 74, 110.
  • 9
    Cerqueira, E. O.; Andrade, J. C.; Poppi, R. J.; Mello, C.; Quim. Nova 2001, 24, 864.
  • 10
    Ferrão, M. F.; Mello, C.; Borin, A.; Maretto, D. A.; Poppi, R. J.; Quim. Nova 2007, 30, 852.
  • 11
    Ferrão, M. F.; Godoy, S. C.; Gerbase, A. E.; Mello, C.; Furtado, J. C.; Petzhold, C. L.; Poppi, R. J.; Anal. Chim. Acta 2007, 595, 114.
  • 12
    Borin, A.; Ferrão, M. F.; Mello, C.; Maretto, D. A.; Poppi, R. J.; Anal. Chim. Acta 2006, 579, 25.
  • 13
    Kennedy, F.; Phillips, G. O.; Willians, P. A.; Wood and cellulosics: industrial utilization, biotechnology, structure and properties, Ellis Horwood: Chichester, 1987.
  • 14
    Gomide, J. L.; Demuner, B. J.; O Papel 1986, 47, 36.
  • 15
    Goldschmid, O. Em Lignins: occurrence, formation, structure and reations; Sarkanen; K. V.; Ludwig, C. H., eds.; John Wiley & Sons: New York, 1971.
  • 16
    Lim, S. Y.; Dence, C. W.; Methods in lignin chemistry, Springer Verlag: Berlin, 1992.
  • 17
    Wise, B. M.; Gallagher, N. B.; Bro, R.; Shaver, J. M.; PLS_Toolbox 3.0 for use with MATLAB, Eigenvector Research, Inc.: Manson, 2002.
  • 18
    Pelckmans, K.; Suykens, J. A. K.; van Gestel, T.; De Brabanter, J.; Lukas, L.; Hamers, B.; De Moor, B.; Vandewalle, J.; LS-SVMlab Toolbox User's Guide version 1.5, Departament of Electrical Engineering, Katholieke Universiteit Leuven: Leuven, 2003.
  • 19
    Ferreira, M. M. C.; Antunes, A. M.; Melgo, M. S.; Volpe, P. L. O.; Quim. Nova 1999, 22, 724.
  • 20
    Fidêncio, P. H.; Poppi, R. J.; Andrade, J. C.; Anal. Chim. Acta 2002, 453, 125.
  • 21
    Kennard, R. W.; Stone, L. A.; Technometrics 1969, 11, 137.
  • 22
    Yokoi, H.; Nakase, T.; Ishida, Y.; Ohtani, H.; Tsuge, S.; Sonoda, T.; Ona, T.; J. Anal. Appl. Pyrolysis 2001, 57, 145.
  • 23
    Oudia, A.; Mészáros, E.; Simões, R.; Queiroz, J.; Jakab, E.; J. Anal. Appl. Pyrolysis 2007, 78, 233.
  • 24
    Rowell, R. M.; Handbook of Wood Chemistry and Wood Composites, CRC Press: Boca Raton, 2005.
  • 25
    Alén, R.; Kuoppala, E.; Oesch, P.; J. Anal. Appl. Pyrolysis 1996, 36, 137.
  • *
    e-mail:
  • Datas de Publicação

    • Publicação nesta coleção
      02 Mar 2011
    • Data do Fascículo
      2011

    Histórico

    • Recebido
      25 Maio 2010
    • Aceito
      27 Ago 2010
    Sociedade Brasileira de Química Instituto de Química, Universidade Estadual de Campinas (Unicamp), CP6154, 13083-0970 - Campinas - SP - Brazil
    E-mail: quimicanova@sbq.org.br