Scientia Forestalis, volume 44, n. 110
p.393-403, junho de 2016

Modelo de crescimento e produção de Clutter adicionado de uma variável latente para predição do volume em um plantio de Eucalyptus urograndis com variáveis correlacionadas espacialmente

Clutter´s growth and yield model with latent component to predictions of volume in a plantation of Eucalyptus urograndis with data Sapatially correlated

Júlio César Pereira1
Priscila Aiko Someda Dias2
Ricardo Coser Mergulhão3
Cláudio Roberto Thiersch1
Luiz Carlos Faria1

1Professor Adjunto do Departamento de Ciências Florestais. UFScar - Universidade Federal de São Carlos - Campus Sorocaba. Rodovia João Leme dos Santos, Km 110 - SP-264 - 18052780 - Sorocaba, SP, Brasil. E-mail: julio.pereira.ufscar@gmail.com; mergulhao@ufscar.br; crthiersch@ufscar.br; lcfaria@ufscar.br.
2Graduando em Engenharia Florestal. UFScar - Universidade Federal de São Carlos - Campus Sorocaba. Rodovia João Leme dos Santos, Km 110 - SP-264 - 18052780 - Sorocaba, SP, Brasil. E-mail: prit92@gmail.com.
3Professor Adjunto do Departamento de Engenharia de Produção. UFScar - Universidade Federal de São Carlos - Campus Sorocaba. Rodovia João Leme dos Santos, Km 110 - SP-264 - 18052780 - Sorocaba, SP, Brasil. E-mail: mergulao@ufscar.br.

Recebido em 29/05/2015 - Aceito para publicação em 18/11/2015

Resumo

Os modelos de produção são necessários para projetar mudanças no crescimento de florestas e fornecer informações para auxiliar nas tomadas de decisões. A aplicação da geoestatística é uma alternativa para se obter estimativas mais precisas sobre a produção quando os dados são espacialmente correlacionados. O presente trabalho tem o objetivo comparar o modelo de produção de Clutter com o mesmo modelo adicionado de uma componente espacial em termos de precisão das estimativas volumétricas, sendo que a hipótese do trabalho é a de que a inserção dessa componente espacial trará melhoria no ajuste bem como na capacidade de predição do modelo para um conjunto de dados com variáveis espacialmente correlacionadas. Os dados utilizados são provenientes de 117 parcelas permanentes de um plantio de Eucalyptus urograndis. A base de dados apresenta medições anuais, do segundo até o sexto ano. O modelo adicionado de componente espacial foi definido pela adição de uma variável latente na equação de área basal, para a qual foram testadas diversas funções de correlação espacial. Os ajustes foram realizados pelo método da máxima verossimilhança, e comparados pelo critério de informação de Akaike (AIC) pelo erro padrão residual (EPR). O modelo com componente espacial apresentou melhor ajuste quando comparado ao modelo tradicional, sendo as funções de correlação de Matérn (k=0,2 e k=0,3), esférico, exponencial e exponencial potência as que proporcionaram os melhores resultados para esse modelo. Além disso, o modelo adicionado da componente espacial se mostrou superior ao modelo tradicional em termos de predição. As predições de volume realizadas com o modelo adicionado de componente espacial reduziram o erro padrão residual em até 6,57%.
Palavras-chave: Geoestatística, área basal, mapa de volume, modelagem de correlação.

Abstract

Growth and yield models are important to predict changes in a forest and provide information that helps to make more reliable decisions. Geo-statistical techniques used jointly with growth and yield models can be useful to obtain more precise estimates of yield when the data set is spatially correlated. Therefore, this paper is aimed to compare the Clutter model (1963) and the same model with a spatial component in terms of precision of volumetric estimates. The working hypothesis was that inserting a spatial component into Clutter’s model would provide improvement on its fitting and predictive capacity when applied to a spatially dependent data set. The data set used was from a Eucalyptus plantation where 117 plots of 400 m2 each were measured from the 2nd to the 6th year of growth. The traditional model proposed by Clutter (1963) and the same model with a spatial component in the basal area equation were fitted with likelihood methods. The second model was tested with several correlation functions for the spatial component. The models were compared using the Akaike Information Criterion (AIC) and the Residual Standard Error (RSE). The results showed that the model with a spatial component fitted better than the traditional model to the data set. There was a gain of precision when predicting basal area and volume using the model with a spatial component with the spherical, exponential, Mátern (k=0.2 and k=0.3) and powered exponential correlation functions. The volume predictions made by the model with a spatial component reduced the residual standard error to 6.57%.
Keywords: Geo-statistics, Basal Area, Volume Mapping, Correlation Modeling.


INTRODUÇÃO

O aumento na oferta de produtos de origem florestal nas últimas décadas levou as empresas do setor a aperfeiçoarem seus sistemas produtivos para tornarem a atividade um negócio ainda mais rentável e competitivo em diversas partes do mundo e especialmente no Brasil no setor de florestas plantadas de ciclo curto (WHITEMAN; BROWN, 2000; ADAMOWICZ et al., 2008). Um dos fatores que podem contribuir para melhorar a eficiência econômica na produção de florestas plantadas é a obtenção de informações mais precisas sobre as respostas em crescimento da floresta frente aos efeitos de fatores ambientais. Nesse sentido são realizados inventários florestais contínuos, e a partir de dados obtidos é possível estabelecer modelos de crescimento e de produção utilizados para fins de planejamento da atividade, especialmente em relação ao atendimento de demandas industriais em empresas verticalizadas (HUSCH et al., 1982; SCOLFORO; MELLO, 2006; CASTRO et al., 2015).

Os modelos de crescimento e produção podem ser utilizados para testar hipóteses sobre o crescimento, fazer predições de produtividade, examinar a variabilidade de uma espécie em termos de produção, explorar sistemas silviculturais alternativos, aperfeiçoar o regime de desbastes, investigar os efeitos da imposição de algumas restrições à gestão, a fim de que se possa formular prescrições e guia de política florestal (VANCLAY, 1994; FALCÃO; MARQUES, 2002; CASTRO et al., 2015). Dentre as diversas possibilidades de uso, esses modelos são especialmente empregados na determinação da idade ótima de colheita de um povoamento florestal (RESENDE et al., 2004; SANTANA et al., 2005).  A otimização da idade de colheita pode se dar considerando unicamente questões volumétricas ou, por uma análise mais abrangente, objetivando a maximização da receita líquida, ou seja, o lucro da atividade florestal considerada (KLEMPERER, 1996; DUERR, 1960). Do ponto de vista volumétrico, em povoamentos equiâneos e submetidos aos mesmos regimes de manejo a melhor idade de colheita é aquela em que se maximiza o volume médio anual, ou na idade de maior incremento médio anual do povoamento (SILVA et al. 2005).  A idade volumétrica ótima de colheita é especialmente utilizada em empresas florestais verticalizadas, onde o produto comercializado não é oriundo diretamente da produção florestal, mas sim de subprodutos obtidos desta, como celulose, por exemplo.  Obviamente, tais empresas também objetivam a maximização do lucro, entretanto isso é obtido considerando o fluxo de caixa global e não apenas o da produção florestal. Para a determinação da idade economicamente ótima de colheita florestal também é utilizada a função de crescimento, fornecendo a estimativa das receitas que podem ser obtidas num ciclo florestal.  Entretanto, nesse caso também são necessárias as estimativas dos custos produtivos. Outra variável que afeta a determinação da idade econômica de colheita é o custo de oportunidade frente a outras opções de investimento.  Assim não necessariamente a idade que maximiza o volume média anual é aquela que também maximiza a receita líquida.

Os modelos de crescimento e produção buscam prognosticar a produção volumétrica, a área basal ou o crescimento em função de uma série de variáveis possíveis de serem quantificadas no povoamento florestal. Tais modelos podem ser estabelecidos de maneira explícita (modelos globais ou modelos de povoamento total) ou implícita (relacionada à distribuição diamétrica) (SCOLFORO, 2006). Segundo Cruz et al. (2008), os modelos de povoamento total, que expressam a produção em termos de unidade de área, a exemplo dos modelos de Buckman (1962) e de Clutter (1963), foram amplamente estudados visando à sua aplicação a diferentes espécies florestais, em diferentes regiões, e se mostraram eficientes em muitos casos, gerando estimativas precisas e livres de tendência. Em geral, os modelos de crescimento e produção tradicionais são obtidos por técnicas de regressão e podem ser descritos por dois componentes: um termo de tendência e um termo de erro aleatório, considerado independente. No entanto, é possível que as observações oriundas de parcelas vizinhas sejam correlacionadas, ou seja podem apresentar valores similares devido à proximidade espacial, não satisfazendo a suposição de independência dos erros nos modelos clássicos de regressão. A correlação entre valores de uma variável aleatória para uma localização e os valores da mesma variável para localizações vizinhas é chamada de dependência espacial. Segundo Lu e Zhang (2010) a correlação espacial é um fenômeno comum em florestas e ocorre devido à existência de microambientes. Quando a suposição de independência não é satisfeita, o uso dos modelos tradicionais, isto é, modelos que não acomodam a dependência espacial, conduz a estimativas viciadas para a variância do resíduo (ZHANG et al., 2009). Por causa desses problemas há a necessidade de se desenvolver modelos que incorporem explicitamente tal dependência. Observa-se que os estudos de crescimento e produção têm apresentado grandes evoluções nas últimas décadas, principalmente a modelagem das florestas plantadas, em paralelo ao desenvolvimento de novas tecnologias que tornam mais eficiente a obtenção de informações das variáveis ambientais.  Dentre essas, destaca-se uso do Sistema de Informações Geográficas (SIG) no auxílio à gestão florestal. Com um SIG é possível obter e processar o posicionamento geográfico das parcelas, e até mesmo das árvores, em um inventário florestal, o que permite uma análise espacial dos dados empregando-se a geoestatística na modelagem. A geoestatística, é uma ferramenta muito útil quando os dados coletados apresentam dependência espacial. E tal fenômeno é comum em características dendrométricas, ou seja, parcelas localizadas próximas tendem a apresentar comportamento similar, principalmente devido às características ambientais locais, tais como: fertilidade do solo e a disponibilidade hídrica (MELLO, 2004; ZHANG et al., 2009; LU; ZHANG, 2010).

Nesse contexto, o presente trabalho tem por objetivo comparar o modelo de produção proposto por Clutter (1963) com o respectivo modelo adicionado de uma componente espacial em termos de precisão das estimativas volumétricas, sendo que a hipótese do trabalho é a de que a inserção dessa componente espacial no modelo de Clutter (1963) trará melhoria no ajuste bem como na capacidade de predição do modelo para um conjunto de dados com variáveis espacialmente correlacionadas. A análise baseou-se em dados de um plantio de Eucalyptus urograndis, híbrido amplamente utilizado para o reflorestamento no território brasileiro.


MATERIAL E MÉTODOS

Nesta seção são apresentados os materiais e métodos necessários para se atingir o objetivo e buscar a corroboração da hipótese levantada. À vista disso, são apresentados: o conjunto de dados utilizados no ajuste dos modelos de produção; o modelo tradicional de produção proposto por Clutter (1963); e, então, a versão do modelo de Clutter adicionada de uma componente espacial, proposta neste trabalho. Finalmente, são descritos os métodos de ajuste dos modelos, bem como os critérios de comparação adotados.  

No presente estudo foi utilizada uma base de dados de um plantio clonal de híbridos de Eucalyptus urograndis, em espaçamento constante de 3,6 x 2,5 m, cobrindo uma área de aproximadamente 1170 ha, localizado no município de Itapetininga - SP, Brasil. A região está localizada entre as coordenadas geográficas 23º 21' latitude Sul, 48º 01' longitude Oeste, com altitudes em torno de 660 m, classificação climática de Köppen do tipo Cwa, com pluviosidade média anual de 1.310,6 mm e índices de chuva menores durante o inverno (CEPAGRI, 2012).

A base de dados é oriunda de medições anuais, do segundo ao sexto ano de 117 parcelas de inventário florestal contínuo de 400 m2 cada, e contém dados de: altura média das árvores dominantes (Hd), segundo o conceito de Assmann; área basal, em m2 por hectare (G); idade em meses (I); sítio (S), em metros, obtido a partir do modelo de Chapman e Richards para a idade de referência de 72 meses; o volume total com casca (V), em m3 por hectare; e coordenadas geográficas das parcelas no sistema de projeção Universal Transversa de Mercator (UTM) Zona 22S. A intensidade amostral foi uma parcela a cada 10 ha.

O modelo tradicional de produção utilizado foi proposto por Clutter (1963) e é apresentado nas equações 1 e 2:

em que V2 é o volume na idade I2; G1 é a área basal predita na idade I1; S representa o sítio; I1 e I2 são as idades 1 e 2, respectivamente,  e    são um termos aleatórios, associados à área basal e volume, supostos normalmente distribuídos com média zero e variâncias  e  , respectivamente,  ou seja, e finalmente e  são coeficientes do modelo.  Com o modelo ajustado é possível gerar valores de volume por idade e sítio. Visando uma melhoria na estimativa de volume, a equação de predição da área basal foi acrescida de uma componente espacial, como mostra a equação 3. Assim, o modelo com adição de uma componente espacial corresponde ao sistema de equações apresentado a seguir (equações 3 e 4):

em que,  é um termo aleatório, assumido seguir um processo gaussiano , sendo  a variância do processo (variabilidade devida à dependência espacial) e  representa uma função de correlação que depende do parâmetro , , neste caso passa a ser um termo normalmente distribuído com média zero e variância  (efeito pepita ou variação de microescala) e  , assim como antes, também é assumido seguir uma distribuição normal com média zero e uma certa variância.

Ao se adotar os modelos, descritos nas equações (3) e (4), considera-se que a dependência espacial é explicada pela componente , mas que o decaimento dessa dependência em função da distância entre as parcelas, se dá segundo uma função de correlação representada por , em que o parâmetro está associado com o alcance em termos de distância da dependência espacial.

A função de correlação é a que define também a função de semivariância dada pela equação (5):

(5)

O gráfico da função dada pela equação (5) é caracterizado pelo aumento da semivariância em função da distância e é conhecido na geoestatística como semivariograma teórico. Na prática, o semivariograma teórico busca ser uma representação da verdadeira e desconhecida relação entre distância e similaridade. Essa relação, entre distância e similaridade (semivariância), é representada pelo semivariograma empírico, o qual é o gráfico de dispersão entre distância e estimativas de semivariância calculadas com base nos dados observados, pela equação: .

O semivariograma empírico é de grande utilidade na geoestatística, e foi utilizado a fim de ajudar a identificar a existência de dependência espacial nos dados, a descrever a estrutura de tal dependência e auxiliar na identificação dos modelos de semivariograma teóricos, ou seja, das funções de correlação candidatas aos dados (CRESSIE, 1993; MELLO et al., 2006; PEREIRA et al., 2011).

A fim de se escolher a função de correlação que melhor representa o decaimento da correlação espacial, diversas funções de correlação foram testadas, sendo elas: as funções esférica, exponencial, de Gauss, de Matérn (k=0,2 e k=0,3), onda e exponencial potência, conforme apresentadas em Diggle e Ribeiro Jr. (2007).      

As equações foram ajustadas pelo método da máxima verossimilhança e avaliadas pelo critério da informação de Akaike (AIC) (AKAIKE, 1974). O valor de AIC é definido como:  em que  é o valor maximizado da função de verossimilhança e  é o número de parâmetros no modelo. Esse critério é uma combinação do ajuste do modelo (mensurado pelo logaritmo da máxima verossimilhança) e de sua complexidade (mensurada pelo número de parâmetros). Segundo Zuur et al. (2013), os valores de AIC de modelos com diferentes combinações de covariáveis podem ser comparados, sendo que quanto menor for o valor de AIC, melhor será o modelo.

Para o ajuste dos modelos foram utilizados o software R (R DEVELOPMENT CORE TEAM, 2013) e o pacote geoR (RIBEIRO JR.; DIGGLE, 2001). A comparação dos desempenhos dos modelos foi realizada pelo método da validação cruzada, que consistiu em retirar 10% das parcelas para aplicação posterior dos modelos já ajustados, na predição de área basal e volume. Obteve-se, então, os Erros Padrão Residuais Percentuais (EPR %), cuja expressão é dada pela equação 6:

(6)

em que  representa o valor observado e  o valor predito na parcela de localização ; e a média de todos as localizações. Quanto menor o valor de EPR, melhor é a capacidade de predição do modelo.


RESULTADOS E DISCUSSÃO

Incialmente foi realizada uma análise exploratória com o resíduo da Equação 1 ajustada para a área basal. Nessa análise aplicou-se o teste de Shapiro-Wilk (W = 0,995, p-valor = 0,688) o qual não indicou a falta de normalidade. Em seguida a presença de dependência espacial no resíduo foi constatada com base no semivariograma empírico e no gráfico de envelope simulado, propostos por Diggle e Ribeiro Jr. (2007) e apresentados na Figura 1. Notou-se a dependência espacial, uma vez que alguns pontos semivariograma empírico ficaram localizados fora dos limites de variação do envelope. Além disso, foi verificada também a ausência de anisotropia nos dados, dado que os parâmetros dos semivariogramas direcionais apresentaram estimativas similares.


Figura 1. Semivariograma empírico juntamente com o respectivo gráfico de envelope, para o resíduo da área basal.
Figure 1. Empirical semi-variogram and simulated envelope graphs for residuals of basal area.

Os semivariogramas empíricos, juntamente com os semivariogramas teóricos resultantes do ajuste das funções de correlação testadas no modelo com componente espacial estão apresentados na Figura 2. Analisando-se o semivariograma do resíduo da Equação 1 para a área basal observa-se que conforme se aumenta a distância entre as parcelas também há um aumento da semivariância. De acordo com autores como Cressie (1993); Pereira et al. (2011), esse comportamento evidencia também a presença de correlação espacial no resíduo.


Figura 2. Modelos teóricos ajustados de correlação espacial para área basal: a) Esférico, b) Exponencial , c) Gaussiana, d) Exponencial Potência, e) Onda, f) Matérn (κ=0,3) e g) Matérn (κ=0,2).
Figure 2. Theoretical semi-variogram fitted to empirical semi-variogram of basal area: a) Spherical, b) Gaussian, c) Exponential, d) Powered Exponential, e) Wave, f) Matern (κ=0,3) and g) Matern (κ=0,2).

Os parâmetros estimados dos semivariogramas teóricos são apresentados na Tabela 1, onde se observa que as estimativas do parâmetro   são maiores que as estimativas do parâmetro , exceto para a função de correlação Matérn (). Na literatura da geoestatística o parâmetro  é chamado de variância do processo ou variância do sinal enquanto que o parâmetro é a variância de microescala ou devido a erro de medida, a soma de ambos  é comumente chamada de patamar (SCHMIDT; SANSÓ, 2006). Quanto maior o valor de  maior a variância devida à dependência espacial. Dessa forma, as estimativas desses parâmetros mostram que a variância devido à dependência espacial é maior que a variância do erro ou de microescala para os dados em questão.

O parâmetro , usualmente chamado de alcance, fornece uma ideia do alcance da dependência espacial capturada pela função ajustada, em termos de distância. Para todas as funções tal alcance ficou estimado em torno de 4.500 metros, exceto para a função de correlação onda, cuja estimativa foi de aproximadamente 2.000 metros.

Tabela 1. Parâmetros dos modelos de semivariograma teóricos para o ajuste do resíduo da área basal em um povoamento de “Eucalipto urograndis” em Itapetininga – SP, Brasil.
Table 1. Parameter estimates of theoretical semi-variograms, which were fitted to basal area residuals; database of a plantation of “Eucalyptus urograndis” in Itapetininga - São Paulo state, Brazil.
Modelo Parametros
Esférico 0,4351 0,378 0,8131 4500,0004 -
Exponencial 0,6928 0,3771 1,0699 4499,9999 -
Gaussiano 0,5640 0,4665 1,0305 4499,9993 -
Matern (κ=0.2) 0,2805 0,3527 0,6332 4500,0001 0,2
Matern (κ=0.3) 0,3796 0,3602 0,7398 4500,0000 0,3
Exponencial Potência 0,6104 0,372 0,9824 4500,0000 -
Onda 0,7554 0,4685 1,2239 1999,9982 -

Na tabela 2 são apresentados os valores de AIC para todos os modelos ajustados e também o erro padrão residual das predições, tanto da área basal quanto do volume. Os valores de AIC apresentados nos permitem escolher os melhores modelos, ou sejam, aqueles que apresentam os melhores ajustes, sem no entanto apresentar grande complexidade (elevado número de parâmetros). Em relação ao erro padrão residual, esse nos permite comparar os modelos com relação à sua capacidade de predição, sendo que quanto menor, mais precisas serão as predições.

Com relação ao modelo com componente espacial, Guedes (2008) ressalta que a função de correlação a ser ajustada deve ser a que melhor represente a tendência dos valores, pois a mesma será utilizada na predição de valores da variável regionalizada em locais não amostrados, para posterior construção de um mapa de variabilidade da variável em estudo.

Tabela 2. Valores do critério de informação de Akaike (AIC) para os modelos de Clutter e o mesmo adicionado de uma componente espacial com diferentes funções de correlação. E Erro Padrão Residual (EPR) para predições da área basal e volume.
Table 2. AIC values for fitted models: Clutter’s model and the same model added with a spatial component using different correlation functions, and Residual Standard Errors (RSE) for predictions of basal area and volume.
Modelo AIC EPR de G2 [%] EPR de V2 [%]
Ajuste* Validação** Ajuste* Validação**
Tradicional 539,1 7,28 7,01 2,92 7,13
Esférico 491,7 2,88 2,36 2,64 0,57
Exponencial 491,6 2,86 2,33 2,63 0,56
Gauss 504,9 2,43 2,87 3,30 0,66
Matern (κ=0.2) 491,6 2,29 2,50 2,40 0,55
Matern (κ=0.3) 490,7 2,53 2,43 2,48 0,55
Potência exponencial 491,1 2,78 2,36 2,58 0,56
Onda 505,5 2,26 3,04 3,35 0,67
* Parcelas que foram utilizadas no ajuste do modelo; **Parcelas de validação que foram retiradas antes do ajuste do modelo para teste da eficiência do ajuste.

Segundo Hardin e Hilbe (2007) e também segundo Zuur et al. (2013), modelos com diferentes combinações de covariáveis podem ser comparados, entretanto, como o AIC depende da quantidade de dados, é preferível comparar os valores de AIC de modelos ajustados para o mesmo número de observações. Dessa forma, quanto menor o valor de AIC melhor é o modelo.

Observando-se que todos os resultados da Tabela 2 são provenientes de ajustes com a mesma quantidade de dados, de acordo com a literatura citada anteriormente, os valores de AIC obtidos podem ser comparados entre si. Dessa forma, pelos resultados encontrados de AIC (Tabela 2), nota-se que as funções de correlação esférica, exponencial, Matérn () e exponencial potência foram as que proporcionaram os melhores modelos com a componente espacial.

Um outro resultado valioso a ser destacado, em termos de ajuste e complexidade de modelo, é a superioridade do modelo com componente espacial. Observa-se que com qualquer uma das funções de correlação testadas o modelo adicionado de componente espacial apresenta menor valor de AIC em relação ao modelo tradicional (Tabela 2). Ao se inserir a componente espacial no modelo, obviamente aumenta-se a sua complexidade, pois o número de parâmetros aumenta. Entretanto, mesmo aumentando a complexidade do modelo, o uso da componente espacial é vantajoso, pois proporciona melhoria no ajuste, de tal forma que os valores de AIC são reduzidos de 539,1 para até 490,7. A melhoria proporcionada pela componente espacial, também se reflete na capacidade de predição dos modelos.

Em termos de predição, de forma análoga ao que se observou nos ajustes, o modelo com componente espacial também se mostrou superior. As predições de volume realizadas com o modelo adicionado de componente espacial apresentaram valores de EPR menores do que as predições com o modelo tradicional, assim como ocorre para área basal.

Assim, é possível observar que a função de correlação de Matérn (tanto com parâmetro κ igual a 0,2 quanto 0,3) apresentaram os menores erros para a estimativa de volume, quando este foi predito na idade dois, para as parcelas utilizadas no ajuste e também para as parcelas de validação, conforme mostra a Tabela 2. No entanto, as diferenças entre os modelos adicionados da componente espacial, quanto à capacidade de predição, foram pequenas. Ou sejam, todos os modelos com componente espacial apresentaram erros de predição próximos entre si.

Quanto às predições do volume realizadas nas mesmas parcelas utilizadas no ajuste dos modelos (coluna 5 da Tabela 2), dois modelos com componente espacial (de Gauss e Onda) não atenderam às expectativas e chegaram a apresentar erros de predição do volume próximos, mas um pouco maiores do que os erros do modelo sem componente espacial. Porém, nas predições das parcelas de validação (coluna 6 da Tabela 2), esses dois modelos (de Gauss e Onda) foram superiores em relação ao modelos sem componente espacial. De maneira geral, os modelos que obtiveram um maior ganho de precisão na predição da área basal e volume foram os modelos adicionados das funções de correlação esférica, exponencial, Matérn () e exponencial potência.

A fim de ilustrar o uso do modelo com componente espacial para a predição, foi gerado o mapa de variabilidade da variável volume, apresentado na Figura 3, usando a função de correlação de Matérn (κ=0,3) que apresentou o melhor ajuste quando foram comparados os resultados da Tabela 2. Assim, em termos de erro de predição, o mapa apresentado é o mais confiável se comparado a mapas que poderiam ser gerados pelos outros modelos apresentados. Isso se dá pelo fato do mapa ter sido gerado a partir do melhor modelo ajustado e com a melhor capacidade de predição.


Figura 3. Distribuição espacial do volume da floresta, estimado utilizando o modelo adicionado de componente espacial com função de correlação Matérn (κ=0,3) nas idades: (a) 3 anos; (b) 5 anos; e (c) 7 anos.
Figure 3. Spatial distribution of forest volume estimated using the model added with a spatial component and Matérn (κ = 0.3) correlation function at ages: (a) 3; (b) 5; and (c) 7 years.

O fato do modelo com componente espacial ter se mostrado mais preciso, na predição da área basal, pode ser atribuído à forte dependência espacial encontrada nessa variável. Observa-se na Tabela 1 que as estimativas da variância devida à correlação espacial () são maiores do que as estimativas da variância de microescala ( e, por esse motivo, era esperado obter predições mais precisas com o modelo com componente espacial (PEREIRA et al., 2011; MELLO et al., 2006). Além disso, o fato do volume ser diretamente dependente da área basal reforçou a superioridade do mesmo modelo, também nas predições do volume.

Observando-se a Tabela 2, nas colunas “validação”, nota-se que a diferença no valor EPR entre o modelo tradicional e o modelo adicionado da componente espacial, com função de correlação exponencial, por exemplo, é de 4,68% para a predição da área basal e de 6,57% para a predição do volume. Esses dados, mostram o quanto se pode ganhar em precisão ao se fazer uso do modelo adicionado da componente espacial.

Em um inventário florestal, os principais objetivos são conhecer o estoque presente na floresta, identificar o potencial de crescimento e produção da floresta, e ainda conhecer a sua estrutura horizontal e vertical. As consequências econômicas do uso dessas informações para o investidor florestal são tanto melhores quanto mais acuradas e precisas forem suas expectativas. Ou seja, se as expectativas do investidor forem baseadas em estimativas acuradas de produção, isso significa que em média suas estimativas não serão distantes do real valor a ser obtido. Por outro lado, se essas estimativas também forem precisas, isso significa que sua variabilidade em relação à média será pequena. Os métodos de amostragem e análises estatísticas utilizadas tradicionalmente em inventários florestais não levam em consideração as possíveis correlações entre observações vizinhas, não considerando assim uma importante fonte de variabilidade do processo. Com isso, essa possível fonte de variação, que pode ser explicada pela correlação espacial, acaba sendo tratada como variação do acaso nos modelos tradicionais, inflacionando assim a variância do erro aleatório do modelo. Como consequência as estimativas volumétricas podem não ser tão precisas, pois conforme visto nos resultados apresentados e também de acordo com Zhang et al. (2004), a variabilidade das estimativas da variável resposta são afetadas pela variabilidade do termo de erro do modelo.

Do ponto de vista gerencial é recomendável que as alternativas de manejo considerem a especificidade local, o que potencialmente reduz custos e otimiza a produção, obtendo-se assim melhores resultados econômicos.  Essa estratégia, denominada silvicultura de precisão, já vem sendo empregada em empresas que utilizam alta tecnologia na produção florestal. Um pré-requisito para adoção dessa estratégia gerencial é o conhecimento da variabilidade local, o que permitiria adotar manejos adaptados à variabilidade local (PELISSARI, 2012; KANEGAE JR. et al., 2007). Nesse sentido, Mello (2004); Diniz (2007) ressaltam que os métodos geoestatísticos exploram adequadamente as relações existentes entre as unidades amostrais próximas e podem gerar resultados mais precisos e permitir que decisões de manejo possam se dar a nível local, o que contribui para melhorar o retorno financeiro da atividade florestal.

Para pequenos e médios produtores, cuja comercialização da produção frequentemente é realizada com a floresta em pé, predições mais precisas do volume esperado são primordiais para se evitar prejuízos econômicos.  Raciocínio análogo pode ser realizado no gerenciamento da produção florestal para grandes empresas verticalizadas, nas quais a oferta de madeira é baseada na demanda industrial.  Nesse caso, expectativas de produção mais precisas podem reduzir os custos de manutenção de estoques de madeira nos pátios industriais ou de aquisição de madeira de terceiros.  


CONCLUSÕES

De modo geral, pode-se concluir que a inserção de uma componente espacial no modelo de produção de Clutter, proporcionou melhoria no desempenho, quando aplicado aos dados de um plantio de Eucalyptus urograndis. Dentre as funções de correlação analisadas para a componente espacial, constatou-se que as funções esférica, exponencial, de Matérn e exponencial potência, foram as mais adequadas. Além disso, a comparação dos modelos mostrou que o modelo adicionado de componente espacial foi mais preciso nas predições de área basal e principalmente de volume, reduzindo em até 6,57% o erro de predição dessa última variável.


AGRADECIMENTOS

Em especial à Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), instituição de fomento brasileira que deu suporte financeiro para realização do trabalho.


REFERÊNCIAS BIBLIOGRÁFICAS

ADAMOWICZ, V.; BOYDA, A.; MCFARLANE, P. Report 2 in the Series on “Drivers of Change in Canada’s Forests and Forest Sector”. in: Global Forest-Products Markets and Canadian Wood Supply. University of Alberta : Forest Futures Project of the SFM Network, January, 2008.

AKAIKE, H. Information measures and model selection. International Statistical Institute. v. 44, p. 277-291, 1974.

BUCKMAN, R. E. Growth and yield of red pine in Minnesota. Washington: USDA Forest Service, 1962, 50 p. (Technical Bulletin, 1272)

CASTRO, R. V. O.; CUNHA, A. B.; SILVA, L. V.; LEITE, H. G.; SILVA, A. L. Modelagem do crescimento e produção para um povoamento de Eucalyptus utilizando dois métodos para quantificação do índice de local. Scientia Forestalis, Piracicaba, v. 43, n. 105, p. 83-90, 2015.

CEPAGRI - CENTRO DE PESQUISAS METEOROLÓGICAS E CLIMÁTICAS APLICADAS À AGRICULTURA. Clima dos Municípios Paulistas, 2012. Disponível em: < www.cpa.unicamp.br/outras-informacoes/clima_muni_258.html>. Acesso em: out. 2014.

CLUTTER, J. L. Compatible growth and yield models for Loblolly Pine. Forest Science, Bethesda, v. 9, n. 3, p. 354-371, 1963.

CRESSIE, N. A. C. Statistics for Spatial data. New York: Wiley, 1993, 900 p.

CRUZ, J. P.; LEITE, H. G.; SOARES, C. P. B.; CAMPOS, J. C. C.; SMIT, L.; NOGUEIRA, G. S.; OLIVEIRA, M. L. R. Modelos de crescimento e produção para plantios comerciais jovens de Tectona grandis em Tangará da Serra, Mato Grosso. Revista Árvore, Viçosa, v. 32, n. 5, p. 821-828, 2008.

DIGGLE, P. J.; RIBEIRO JR., P. Model-based Geostatistics. Lancaster: Springer Series in Statistics, 2007, 230 p.

DINIZ, F. S.; Métodos de amostragem e geoestatística aplicados ao inventário florestal. 2007. 87 p. Dissertação (Mestrado em Engenharia Florestal) – Universidade Federal de Lavras, Lavras, 2007.

DUERR, W. A. Fundamentals of forestry economics. New York: McGraw-Hill, 1960, 579 p.

FALCÃO, A.; MARQUES, A. F. Metodologia expedita para simulação do crescimento e produção de algumas espécies florestais portuguesas. Documento técnico GEGREN 01/02, 2002. Disponível em: < http://www.di.fc.ul.pt/~afalcao/docs/DT1-Modelos.pdf >. Acesso em: out. 2014.

GUEDES, L. P. C. Otimização de amostragem espacial. 2008. 143 p. Tese (Doutorado em Agronomia) – Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 2008.

HARDIN, J. W.; HILBE, J. M. Generalized linear models and extensions. Texas: Stata Press, 2007, 245 p.

HUSCH, B.; MILLER, C. I.; BEERS, T. W. Forest mensuration. New York: John Wiley & Sons, 1982, 401 p.

KANEGAE JR., H.; MELLO, J. M.; SCOLFORO, J. R. S.; OLIVEIRA, A. D. Avaliação da continuidade espacial de características dendrométricas em diferentes idades de povoamentos clonais de Eucalyptus sp. Revista Árvore, Viçosa, v. 31, n. 5, p. 859-866, 2007.

KLEMPERER, D. W.  Forest Resource Economics and Finance, New York: McGrall Hill, 1996, 551 p.

LU, J.; ZHANG, L. Evaluation of parameter estimation methods for fitting spatial regression models. Forest Science, Bethesda, v. 56, n. 5, p. 505-514, 2010.

MELLO, J. M. Geoestatística aplicada ao inventário florestal. 2004. 110 p. Tese (Doutorado em Recursos Florestais) – Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 2004.

MELLO, J. M.; OLIVEIRA, M. S.; BATISTA, J. L. F.; JUSTINIANO JR., P. R.; KANEGAE JR., H. Uso do estimador geoestatístico para predição volumétrica por talhão. Floresta, Curitiba, v. 36, n. 2, p. 251-260, 2006.

PELISSARI, A. L. Silvicultura de precisão aplicada ao desenvolvimento de Tectona grandis L.f. na Região Sul do Estado de Mato Grosso. 2012. 78 p. Dissertação (Mestrado em Ciências Florestais e Ambientais) - Universidade Federal de Mato Grosso. Cuiabá, 2012.

PEREIRA, J. C.; MOURÃO, D. A. C.; SCALET, V.; SOUZA, C. A. M. Comparação entre Modelos de Relação Hipsométrica com e sem Componente Espacial para Pinus sp. na FLONA Ipanema-SP. Scientia forestalis, Piracicaba, v. 39, n. 89, p. 43-52, 2011.

R DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing, 2013. Disponível em: < www.R-project.org >. Acesso em: out. 2014.

RESENDE, R. R.; VALE, A. B.; SOARES, T. S.; SILVA, M. L.; COUTO, L.; VALE, R. S. Emprego de um modelo de crescimento e produção para determinação da rotação em povoamentos de Eucalipto. Revista Árvore, Viçosa, v. 28, n. 2, p. 219-225, 2004.

RIBEIRO JR., P.; DIGGLE, P.J. geoR: A package for geostatistical analysis. R-News, v. 1, n. 2, p. 15-18, 2001. Disponível em: < www.cran.r-project.org/doc/Rnews >. Acesso em: out. 2014.

SANTANA, C.; MELLO, A. A.; EISFELD, R. L.; SANQUETTA, C. R. Sistema de equações para simulação do crescimento e da produção em povoamentos de Eucalyptus grandis Hill ex Maiden. sem desbaste baseado no modelo de Clutter. Ambiência, Guarapuava, v. 1, n. 2, p. 239-256, 2005.

SCHMIDT, A. M.; SANSÓ, B. Modelagem Bayesiana da Estrutura de Covariância de Processos Espaciais e Espaço-Temporais. Caxambu: ABE, 2006, 151 p.

SCOLFORO, J. R. S. Biometria florestal: modelos de crescimento e produção florestal. Lavras: UFLA/FAEPE, 2006, 393 p.

SCOLFORO, J. R. S.; MELLO, J. M. Estatística Espacial - Noções de Geoestatística Aplicada ao Inventário Florestal. In: _____. Inventário Florestal. Lavras: UFLA/FAEPE, 2006. p. 114-150.

SILVA, M. L.; VALVERDE, S. R.; JACOVINE, L. A. G. Economia Florestal. 2.ed. Viçosa: Editora UFV, 2005, 176 p.

VANCLAY, J. K. Modelling forest growth and yield: applications to mixed tropical forests. Wallingford: School of Environmental Science and Management Papers, 1994, 537 p.

WHITEMAN, A.; BROWN, C. Modelling global forest products supply and demand: recent results from FAO and their potential implications for New Zealand. New Zealand Journal of Forestry, Rotorua, v. 44, n. 4, p. 6-9, 2000.

ZHANG, L.; BI, H.; CHENG, P.; DAVIS, C. J. Modeling spatial variation in tree diameter–height relationships. Forest Ecology and Management, Amsterdam, v. 189, n. 1, p. 317-329, 2004.

ZHANG, L.; MA, Z.; GUO, L. An evaluation of spatial autocorrelation and heterogeneity in the residuals of six regression models. Forest Science, Bethesda, v. 55, n. 6, p. 533-548, 2009.

ZUUR, A. F.; HILBE, J.; IENO, E. N. A Beginner's Guide to GLM and GLMM with R: A Frequentist and Bayesian Perspective for Ecologists. Newburgh: Highland Statistics, 2013. 270 p.