Acessibilidade / Reportar erro

We are Living on the Edge: Gerenciando Sinistros de Extrema Severidade Usando a Teoria de Valores Extremos

Resumo

Ocorrências de altíssimo valor monetário e baixíssima probabilidade constituem grandes riscos no mercado segurador. Uma ferramenta para análise de eventos dessa natureza é a Teoria de Valores Extremos (TVE). O objetivo deste trabalho é aproximar a TVE das Ciências Atuariais, utilizando diferentes estimadores de parâmetros, possibilitando o cálculo de prêmios de resseguro e a escolha do limite de retenção ideal para seguradoras. A execução foi em duas etapas: (i) comparando os estimadores em simulações, e; (ii) usando microdados reais oriundos de 5 ramos SUSEP de naturezas distintas, com o intuito de estimar estatísticas de valores extremos. Em geral, o estimador de Momentos foi o mais consistente de todos. O estimador de Pickands nas simulações apresentou resultados promissores, mas a quantidade restrita de dados e sua grande variância o tornam inconstante na aplicação aos dados reais. Finalmente, observou-se que a TVE é um poderoso ferramental para a área de seguros, melhor capturando o comportamento de sinistros extremos do que métodos tradicionais.

Palavras-chave:
Seguros; Valores extremos; Expected shortfall ; Estimação em altos quantis

Abstract

Claims with high severity and low probability constitute a high risk for the insurance market. One tool to deal with this kind of event is the Extreme Value Theory (EVT). The main goal of this article is to apply the EVT to Actuarial Science using a different estimator for parameters, allowing the calculation of pure reinsurance premiums and the choice for the retention limit for insurance companies. The execution was split into two parts: (i) comparing the estimators through simulations, and; (ii) using data from 5 SUSEP lines of business with different natures, intending to estimate some extreme value statistics. In simulation studies, the Pickands estimator was very promising, but the limited amount of data resulted in a great variance when applied to real cases. Lastly, we concluded that the EVT is a powerful tool for insurance, capturing the behavior of extreme clams amount better than traditional models.

Keywords:
Insurance; Extreme values; Expected shortfall; High quantiles estimation

1. Introdução

Riscos que não podem ser evitados ou reduzidos devem ser transferidos ou retidos (Vaughan & Vaughan, 2013Vaughan, E. J., & Vaughan, T. M. (2013). Fundamentals of Risk and Insurance. John Wiley & Sons.). Normalmente, os riscos que devem ser transferidos apresentam baixa probabilidade e alta severidade. Para indivíduos, o processo é simples: adquirir um seguro, de modo que a seguradora se comprometa a indenizar as perdas. Porém, seguradoras também estão sujeitas a eventos catastróficos, devendo, então, comprar resseguro. Mas, enquanto para o indivíduo a transferência de responsabilidades é apenas mais uma estratégia, para a seguradora é sua atividade principal, ensejando profunda análise técnica para bem lidar com riscos. Caso a alocação não seja precisa, a empresa pode se encontrar demasiadamente desprotegida ou superprotegida (Dempster et al., 2003Dempster, M. A. H., Germano, M., Medova, E. A., & Villaverde, M. (2003). Global Asset Liability Management. British Actuarial Journal, 9(1), 137-195. https://doi.org/10.1017/S1357321700004153
https://doi.org/10.1017/S135732170000415...
; Dietz & Walker, 2019Dietz, S., & Walker, O. (2019). Ambiguity and Insurance: Capital Requirements and Premiums. Journal of Risk and Insurance, 86(1), 213-235. https://doi.org/10.1111/jori.12208
https://doi.org/10.1111/jori.12208...
).

No mercado de seguros, eventos de baixa probabilidade e extrema severidade tipicamente se manifestam em catástrofes naturais ou pela própria natureza da atividade seguradora, quando diversas unidades de alto valor monetário sofrem danos ao mesmo tempo ou com alguma estrutura de dependência (Chen & Yuan, 2017Chen, Y., & Yuan, Z. (2017). A revisit to ruin probabilities in the presence of heavy-tailed insurance and financial risks. Insurance: Mathematics and Economics , 73, 75-81. https://doi.org/10.1016/j.insmatheco.2017.01.005
https://doi.org/10.1016/j.insmatheco.201...
; Gatto, 2020Gatto, R. (2020). The stability of the probability of ruin. Stochastic Models, 36(1), 112-133. https://doi.org/10.1080/15326349.2019.1695135
https://doi.org/10.1080/15326349.2019.16...
; Tanaka & Carvalho, 2019Tanaka, A. D., & Carvalho, J. V. F. (2019). Estimação da estrutura de dependências entre classes de seguro por meio de cópulas. Revista Brasileira de Risco e Seguro, 15(25), 1-34.). Nessas situações, o resultado da empresa pode ser negativo e gerar futuros problemas de solvência (Carvalho & Cardoso, 2021Carvalho, J. V. F., & Cardoso, L. (2021). Os Impactos da Rentabilização do Estoque de Capital Sobre a Probabilidade de Ruína e o Capital de Solvência para Seguradoras. Revista Evidenciação Contábil & Finanças, 9(3), 9-29. ; Damasceno & Carvalho, 2021Damasceno, A. T., & Carvalho, J. V. F. (2021). Assessment of the new investment limits for assets of Social Security Regimes for Public Servants established by Resolution CMN 3,922/2010. Revista Brasileira de Gestao de Negocios, 23(4), 728-743. https://doi.org/10.7819/rbgn.v23i4.4128
https://doi.org/10.7819/rbgn.v23i4.4128...
; Euphasio Junior & Carvalho, 2022Euphasio Junior, J. W., & Carvalho, J. V. F. (2022). Reinsurance and Solvency Capital: Mitigating Insurance Companies’ Ruin Probability. Revista de Administração Contemporânea, 26(1), e200191. https://doi.org/10.1590/1982-7849rac2022200191.en
https://doi.org/10.1590/1982-7849rac2022...
; Ramsden & Papaioannou, 2019Ramsden, L., & Papaioannou, A. D. (2019). Ruin probabilities under capital constraints. Insurance: Mathematics and Economics , 88(1), 273-282. https://doi.org/10.1016/j.insmatheco.2018.11.002
https://doi.org/10.1016/j.insmatheco.201...
; Wüthrich, 2015Wüthrich, M. V. (2015). From ruin theory to solvency in non-life insurance. Scandinavian Actuarial Journal, 2015(6), 516-526. https://doi.org/10.1080/03461238.2013.858401
https://doi.org/10.1080/03461238.2013.85...
).

Para ilustrar a dimensão desse problema, duas situações catastróficas podem ser ilustrativas. Primeiro, com relação à tragédia de Mariana ocorrida em 2015: um estudo recente da Terra Brasis (2017Terra Brasis . (2017). Terra Report: Relatório do Mercado Brasileiro de Resseguros. https://www.australre.com/wp-content/uploads/2021/03/Terra-Report-Brasil-201706-Port-v7.pdf
https://www.australre.com/wp-content/upl...
) apontou que o desastre teve uma avaliação de danos totais estimados em R$26,2 bilhões, sendo apenas R$2,25 bilhões segurados. Esse tipo de evento, caso não possua cobertura adequada, poderia conduzir a Vale à falência. E, depois, de uma maneira mais geral: segundo dados oficiais da SUSEP, no mesmo ano foram emitidos cerca de R$95 bilhões em prêmios de seguros (vida e não vida). Logo, no ano de 2015 um só evento representou 2,1% do volume total de prêmios de seguros de todos os ramos somados, evidenciando a importância de estimações a respeito desse tipo de catástrofe. Em contraposição, em âmbito internacional, o estudo da Aon (2018Aon. (2018). Weather, Climate & Catastrophe Insight - 2018 Annual Report. http://thoughtleadership.aon.com/Documents/20190122-ab-if-annual-weather-climate-report-2018.pdf
http://thoughtleadership.aon.com/Documen...
) apontou que o valor das perdas oriundas de desastres naturais possui uma alta variância ao longo do tempo. Em determinados anos, sob efeito de fatores climáticos ou antropogênicos, ocorrências de eventos extremos podem ocasionar maior dispêndio com seguros (Mendes-Da-Silva et al., 2021Mendes-Da-Silva, W., Lucas, E. C., & Carvalho, J. V. F. (2021). Flood insurance: The propensity and attitudes of informed people with disabilities towards risk. Journal of Environmental Management, 294, 113032. https://doi.org/10.1016/j.jenvman.2021.113032
https://doi.org/10.1016/j.jenvman.2021.1...
). Portanto, estimar a frequência e os valores de ocorrências análogas às evidenciadas pode ser fundamental para seguradoras planejarem adequadamente sua política de gerenciamento de riscos (Cummins & Weiss, 2014Cummins, J. D., & Weiss, M. A. (2014). Systemic risk and the U.S. insurance sector. Journal of Risk and Insurance, 81(3), 489-528. https://doi.org/10.1111/jori.12039
https://doi.org/10.1111/jori.12039...
; Kasumo et al., 2018Kasumo, C., Kasozi, J., & Kuznetsov, D. (2018). On Minimizing the Ultimate Ruin Probability of an Insurer by Reinsurance. Hindawi Journal of Applied Mathematics, 2018(19), 1-11. https://doi.org/10.1155/2018/9180780
https://doi.org/10.1155/2018/9180780...
).

Uma possível ferramenta de análise dos eventos de magnitude elevada é a Teoria de Valores Extremos (TVE). Trata-se de uma metodologia originada das ciências naturais e adotada pelas diversas áreas de finanças no início da década de 1990, e consiste em um conjunto de técnicas que visam modelar a distribuição de máximos de uma coleção de variáveis aleatórias, estimar caudas de distribuições e mensurar as probabilidades de ocorrências em altos quantis. Aplicada às ciências atuariais, torna-se possível a modelagem do capital mínimo de solvência, o cálculo de prêmios de resseguro, sendo também importante para avaliar o viés de estimação de parâmetros, dependência entre as observações e para a escolha do limite de retenção ideal de riscos por uma seguradora (McNeil, 1997McNeil, A. J. (1997). Estimating the Tails of Loss Severity Distributions Using Extreme Value Theory. ASTIN Bulletin, 27(1), 117-137. https://doi.org/10.2143/AST.27.1.563210
https://doi.org/10.2143/AST.27.1.563210...
). Ressalta-se que, embora o desenvolvimento da TVE não seja recente, e seu espectro de aplicação seja bastante amplo, no Brasil há poucos trabalhos que se utilize dessa técnica para a Atuária (Melo, 2006Melo, E. F. L. (2006). Uma Aplicação da Teoria de Valores Extremos para Avaliação do Risco de Contratos de Resseguro. Revista Brasileira de Risco e Seguro, 2(3), 1-22.).

O objetivo deste trabalho é obter os melhores ajustes das caudas de distribuições de sinistros, utilizando diferentes estimadores de parâmetros proporcionados pela TVE. Inicialmente, avalia-se a eficiência das metodologias por meio de simulações em cenários controlados. Em seguida, os modelos testados serão utilizados para estimar a cauda de dados oriundos de 5 ramos com características distintas, de caudas leves a pesadas, com o intuito de estimar o Expected Shortfall (ES), a medida-resumo dos valores extremos. Os resultados serão discutidos em função do tipo de cauda de cada um dos ramos, de qual modelo da TVE melhor ajustou os resultados reais e da consistência e confiabilidade dos métodos empregados. Também será realizada a comparação de modelos tradicionalmente utilizados em ajuste de sinistros com aqueles da TVE.

2. Fundamentação Teórica

Uma das abordagens da TVE consiste em separar uma função distribuição em dois domínios distintos e ajustar um modelo para cada subdomínio. A maioria dos trabalhos preocupam-se mais em avaliar os altos quantis do que as ocorrências comuns, exatamente porque é nas caudas que podem se materializar os eventos de maior impacto e que exigem estratégias de gerenciamento de risco mais delicadas. Por exemplo, Haan (1990Haan, L. (1990). Fighting the arch-enemy with mathematics. Statistica Neerlandica, 44(2), 45-68. https://doi.org/10.1111/j.1467-9574.1990.tb01526.x
https://doi.org/10.1111/j.1467-9574.1990...
) aplicou a TVE para modelar o nível do mar e tomar decisões com respeito ao tamanho ideal de barragens na Holanda, país no qual aproximadamente 40% do território fica abaixo do nível do mar.

Em conjunto com o desenvolvimento de distribuições de caudas pesadas na teoria de probabilidades, foram propostos índices que pudessem inferir quão frequentes são os valores extremos de uma distribuição. O estimador proposto por Hill (1975Hill, B. M. (1975). A Simple General Approach to Inference About the Tail of a Distribution. The Annals of Statistics, 3(5), 1163-1174. https://doi.org/10.1214/aos/1176343247
https://doi.org/10.1214/aos/1176343247...
) para a distribuição Pareto é comumente aplicado devido a sua simplicidade e suas propriedades estatísticas úteis, como ser assintoticamente Normal (Haeusler & Teugels, 1985Haeusler, E., & Teugels, J. L. (1985). On Asymptotic Normality of Hill’s Estimator for the Exponent of Regular Variation. The Annals of Statistics, 13(2), 743-756. https://doi.org/10.1214/aos/1176349551
https://doi.org/10.1214/aos/1176349551...
) e convergir com a menor variância possível (Hall & Welsh, 1984Hall, P., & Welsh, A. H. (1984). Best Attainable Rates of Convergence for Estimates of Parameters of Regular Variation. The Annals of Statistics, 12(3), 1079-1084. https://doi.org/10.1214/aos/1176346723
https://doi.org/10.1214/aos/1176346723...
). Brazauskas and Serfling (2000Brazauskas, V., & Serfling, R. (2000). Robust and Efficient Estimation of the Tail Index of a Single-Parameter Pareto Distribution. North American Actuarial Journal, 4(4), 12-27. https://doi.org/10.1080/10920277.2000.10595935
https://doi.org/10.1080/10920277.2000.10...
) sugeriram um estimador baseado na mediana de amostras de estimadores de Hill, compararam sua eficiência com outros estimadores amplamente aplicados e avaliaram o impacto que outliers na amostra podem ter.

Outra abordagem historicamente importante no estudo de caudas foi a de Pickands (1975Pickands, J. (1975). Statistical Inference Using Extreme Order Statistics. The Annals of Statistics, 3(1), 119-131.) para a Pareto Generalizada, com base nas estatísticas de ordem. Estimadores dessa classe, em geral, são menos suscetíveis à presença de viés do que os de Hill, porém sua variância costuma ser maior (Yun, 2000Yun, S. (2000). A class of Pickands-type estimators for the extreme value index. Journal of Statistical Planning and Inference, 83(1), 113-124. https://doi.org/10.1016/S0378-3758(99)00085-3
https://doi.org/10.1016/S0378-3758(99)00...
). Para compensar essa desvantagem, Taylor and Falk (1994Taylor, P., & Falk, M. (1994). Efficiency of convex combinations of pickands estimator of the extreme value index. Nonparametric Statistics, 4(2), 133-147. https://doi.org/10.1080/10485259408832606
https://doi.org/10.1080/1048525940883260...
) consideraram a combinação convexa entre dois estimadores de Pickands, enquanto Drees (1995Drees, H. (1995). Refined Pickands Estimators of the Extreme Value Index. The Annals of Statistics, 23(6), 2059-2080. https://doi.org/10.1214/aos/1034713647
https://doi.org/10.1214/aos/1034713647...
) generalizou para um número arbitrário de combinações. Yun (2000Yun, S. (2000). A class of Pickands-type estimators for the extreme value index. Journal of Statistical Planning and Inference, 83(1), 113-124. https://doi.org/10.1016/S0378-3758(99)00085-3
https://doi.org/10.1016/S0378-3758(99)00...
), por outro lado, abordou o estimador de Pickands a partir de outras estatísticas de ordem, resultando em variância até 10% menor.

Em finanças, os modelos de TVE são utilizados sobretudo na análise de VaR (Value at Risk), que é uma medida de exposição a perdas severas de um portfólio de investimento, sendo constantemente comparados a resultados obtidos por modelos de séries temporais. Daníelsson and Morimoto (2000Daníelsson, J., & Morimoto, Y. (2000). Forecasting Extreme Financial Risk: A Critical Analysis of Practical Methods for the Japanese Market. Monetary and Economic Studies, 18(2), 25-48.) compararam a aplicação de modelos GARCH com TVE em índices do mercado japonês no cálculo do VaR, e concluíram que, além de serem mais estáveis, os métodos TVE exibiram melhor precisão e menor variância. Iglesias (2012Iglesias, E. M. (2012). An analysis of extreme movements of exchange rates of the main currencies traded in the Foreign Exchange market An analysis of extreme movements of exchange rates of the main currencies traded in the Foreign Exchange market. Applied Economics, 44(35),4631-4637. https://doi.org/10.1080/00036846.2011.593501
https://doi.org/10.1080/00036846.2011.59...
) propôs um estimador e o comparou com Hill com base no teste de Hausman aplicado à modelagem de taxas de câmbio entre países. Como conclusão, verificou que Hill é melhor na maior parte dos casos em relação ao novo estimador. Stupfler and Yang (2018Stupfler, G., & Yang, F. (2018). Analyzing and predicting cat bond premiums: a financial loss premium principle and extreme value modeling. ASTIN Bulletin, 48(1), 375-411. https://doi.org/10.1017/asb.2017.32
https://doi.org/10.1017/asb.2017.32...
), buscando uma abordagem que capture a maior aversão ao risco em situações de pós-crises, utilizaram a TVE para a precificação de CAT Bonds, títulos que lastreiam riscos catastróficos emitidos por seguradoras.

Uma das críticas a essa forma de aplicação da TVE é a existência usual de correlação temporal entre os dados, algo que pode ocasionar em maior viés das estimativas. Além disso, não há métodos muito eficientes para determinar o limiar ideal no qual a TVE é válida. Por isso, Haan et al. (2016Haan, L., Mercadier, C., & Zhou, C. (2016). Adapting extreme value statistics to financial time series: Dealing with bias and serial dependence. Finance Stoch, 20, 321-354. https://doi.org/10.1007/s00780-015-0287-6
https://doi.org/10.1007/s00780-015-0287-...
) propuseram um estimador que busca solucionar os problemas anteriores, sendo que seus resultados apontam para maior eficiência quando aplicados sobre o índice Dow Jones.

Apenas mais recentemente, os pesquisadores em Ciências Atuariais começaram a utilizar a TVE para a modelagem de seguros. Em alguns casos, pode ser necessário modelar sinistros cujo desenvolvimento ainda não terminou, possuindo, então, uma parcela do seu valor estimada. Desta forma, Beirlant et al. (2018Beirlant, J., Maribe, G., & Verster, A. (2018). Penalized bias reduction in extreme value estimation for censored Pareto-type data, and long-tailed insurance applications. Insurance: Mathematics and Economics, 78, 114-122. https://doi.org/10.1016/j.insmatheco.2017.11.008
https://doi.org/10.1016/j.insmatheco.201...
) ajustaram diversos estimadores da TVE para uma amostra de sinistros de automóveis, com parte do desenvolvimento dos sinistros estimada. Os autores concluíram que o estimador proposto reduziu o viés. Em seguros de vida, Huang et al. (2020Huang, F., Maller, R., & Ning, X. (2020). Modelling life tables with advanced ages: An extreme value theory approach. Insurance: Mathematics and Economics , 93, 95-115. https://doi.org/10.1016/j.insmatheco.2020.04.004
https://doi.org/10.1016/j.insmatheco.202...
) utilizaram métodos da TVE para preencher tábuas atuariais em idades avançadas. Como poucas pessoas atingem idades além de 100 anos, comumente esses casos são aproximados ou até mesmo excluídos nas tábuas convencionais, o que dificulta a estimação de grandes perdas no caso de planos de aposentadorias.

McNeil (1997McNeil, A. J. (1997). Estimating the Tails of Loss Severity Distributions Using Extreme Value Theory. ASTIN Bulletin, 27(1), 117-137. https://doi.org/10.2143/AST.27.1.563210
https://doi.org/10.2143/AST.27.1.563210...
), por outro lado, modelou uma base de seguros contra incêndio da Dinamarca usando o estimador de máxima verossimilhança (EMV) juntamente com auxílio de métodos gráficos complementares. O autor chegou à conclusão de que a TVE deveria ser uma área mais explorada pelos atuários por ser uma ferramenta aplicável na análise de riscos em altos quantis, porém os parâmetros possuem alta incerteza, especialmente em relação à escolha do limite de retenção. Este último estudo, por seu impacto como uma das primeiras aplicações da TVE na área de Ciências Atuariais, foi revisitado por Resnick (2014Resnick, S. I. (2014). Discussion of the danish data on large fire insurance losses. ASTIN Bulletin, 27(1), 139-151. https://doi.org/10.2143/AST.27.1.563211
https://doi.org/10.2143/AST.27.1.563211...
), munido de novas técnicas desenvolvidas no período. Nele, o autor concluiu que as suposições de independência entre observações feita por McNeil (e, de forma geral, em modelagem de seguros) são precisas, além de os estimadores apontarem para modelos semelhantes em ambos os artigos. Porém a sensibilidade quanto à escolha do início da cauda permanece um problema a ser explorado.

No caso brasileiro, Melo (2006Melo, E. F. L. (2006). Uma Aplicação da Teoria de Valores Extremos para Avaliação do Risco de Contratos de Resseguro. Revista Brasileira de Risco e Seguro, 2(3), 1-22.) utilizou a TVE para modelagem de cauda. O autor trouxe uma abordagem voltada a resseguros nos ramos compreensivos condominiais e empresarial contra incêndio, raios e explosões. O objetivo era comparar funções tradicionalmente utilizadas para ajustar distribuições a valores de sinistros, como a Gama e a Log Normal, a outras que poderiam ser mais adequadas (TVE) na modelagem de caudas. O autor afirma que os modelos próprios da TVE produzem melhores resultados ao se estimar altos quantis, estando de acordo com a literatura existente. Assim, baseado na conclusão sobre modelos TVE e pela ampla existência de estimadores, pretende-se expandir os resultados do autor ao considerar diferentes métodos de ajuste do modelo TVE, especialmente da Distribuição de Pareto Generalizada. Para isso, os coeficientes obtidos serão comparados quanto à aproximação em média, variância e viés.

3. Procedimentos Metodológicos

Nesta seção será definido o problema da pesquisa em sua forma matemática. Em seguida, apresenta-se um breve resumo a respeito da TVE, relatando seus resultados mais importantes e que dão sustentação para a discussão dos estimadores a serem computados. Por último, o processo de simulação empregado será detalhado.

3.1. Peaks over Threshold

Seja Y1 , ..., Yn uma coleção de variáveis aleatórias com função distribuição acumulada FY(.) representando sinistros ocorridos em um dado período. Considere u um limite de retenção, yf o supremo do suporte de uma variável aleatória e Yn:i estatística de ordem, como i-ésimo maior termo. Define-se a cauda de uma distribuição como todo o boreliano à direita de U, em outras palavras, X=(Y-U)+ >0. É importante ressaltar a diferença das variáveis aleatórias Y e X. A primeira representa o valor total do sinistro, e a segunda é a parcela excedente ao limiar estipulado, parte pertinente ao ressegurador no caso de um resseguro por excesso de danos.

O método Peaks Over Threshold (POT) é uma forma de modelar a distribuição de Y. Ela consiste em dividir FY(.) em dois subdomínios e modelar apenas a parcela à direita de um dado valor, parte pertinente aos valores extremos, como descrito na Equação 1. A vantagem dessa separação é que muitas vezes os dados são influenciados por diferentes fenômenos, o que tornaria um modelo único propício a vieses e incapaz de capturar a totalidade do evento. É comum que um ajuste único se adapte melhor à parte central da distribuição, enquanto os extremos ficam mais propensos a erros. Neste trabalho, o foco principal é a estimação da parcela FX(.).

F Y y = { F ^ Y y , F ^ Y U + 1 - F Y ^ U × F X y - U , 0 y U y > U (1)

3.2. A Distribuição de Valores Extremos

A primeira abordagem para valores extremos é por meio da distribuição dos máximos de variáveis aleatórias. Considere m < n e defina Mm =Máx(Y1 , ..., Ym). Conhecendo a acumulada FY(.), pode-se tomar a distribuição de Mm a partir do próximo desenvolvimento:

P M m = M á x { Y 1 , , Y m } < y = P Y 1 < y Y m < y = P m Y < y = F Y m y (2)

Tomando-se o limite quando m → ∞, obtém-se:

F Y m y = 1 , y y f 0 , y < y f (3)

Em outras palavras, a distribuição do máximo converge para uma distribuição degenerada, não trazendo nenhuma informação útil a respeito da modelagem em questão. Assim, com o objetivo de obter alguma estimativa relevante para valores altos da distribuição, pode-se considerar transformações para reescalar a variável aleatória. Segundo Gnedenko (1943Gnedenko, B. (1943). Sur La Distribution Limite Du Terme Maximum D ’ Une Serie Aleatoire. Annals of Mathematics, 44(3), 423-453. https://doi.org/10.2307/1968974
https://doi.org/10.2307/1968974...
), caso existam sequências {am}, {bm}, com bm >0 para todo m, satisfazendo:

P M m - a m b m < y = F Y m y × b m + a m m H y (4)

então, se H(.) não for degenerada, ela é definida da seguinte forma:

H y = e x p { - 1 - 1 + γ y - 1 / γ } , γ 0 e x p { - 1 - e - y } , γ = 0 (5)

A função H(.) é dita Distribuição de Valores Extremos (DVE), sendo o seu formato unicamente dependente do parâmetro de forma γ, chamado índice de valor extremo. Pode-se subdividir H(.) em 3 classes diferentes: caso γ<0, H é uma distribuição Weibull; quando γ=0 é a ocorrência de uma Gumbel; e, por último, com γ>0 torna-se uma Fréchet. Cada família de distribuições está relacionada a um dos casos citados acima, no qual se diz que ela pertence ao domínio de atração de H(.), com γ menor, igual ou maior que 0. Caso existam dois pares distintos de sequências {am},{bm} e {am*},{bm*} para os quais H(.) seja não degenerada, então o γ final conduz ao mesmo domínio de atração (Resnick, 1971Resnick, S. I. (1971). Tail equivalence and its applications. Journal of Applied Probability, 8(1), 136-156. https://doi.org/10.2307/3211844
https://doi.org/10.2307/3211844...
).

3.3. A Distribuição de Pareto Generalizada

Outra abordagem para o estudo de ocorrências raras é avaliar propriedades de convergência da cauda. O objetivo é encontrar uma distribuição limite com a qual se possa aproximar a cauda FX(.). Um resultado importante foi obtido por Pickands (1975Pickands, J. (1975). Statistical Inference Using Extreme Order Statistics. The Annals of Statistics, 3(1), 119-131.). Seja 0<U<yf um limite de retenção. Então:

s u p r F Y x + U - F Y U 1 - F Y U - G x = s u p r F X ( x ) - G x = 0 (6)

com

G x = 1 - 1 + γ x σ - 1 γ , γ 0 1 - e - x σ , γ = 0 (7)

Na Equação 7, σ é um parâmetro de escala, e a função G(.) é denominada Distribuição de Pareto Generalizada (DPG), e, assim como a função H(.), unifica três famílias de distribuições com naturezas distintas. Quando γ<0, G(.) corresponde a uma Beta, utilizada para modelar variáveis aleatórias sem cauda ou de cauda curta, com suporte limitado (yf <∞) e todos os momentos definidos. Distribuições contidas nesse caso são a Uniforme e a Weibull. Para γ=0, a distribuição limite é uma Exponencial, tendo cauda média, momentos finitos e suporte infinito. Essa família engloba a maior quantidade de funções, sendo Normal, Log-Normal e Gama as principais representantes. Finalmente, quando γ>0, tem-se a distribuição de Pareto, que engloba as distribuições de caudas pesadas, com eventuais momentos indefinidos e decaimento da cauda em lei de potências. Entre seus representantes, encontram-se Log-Gama, Cauchy e Burr. A família da Pareto é usualmente utilizada para modelagem de caudas em seguros por sua natureza mais conservadora para estimar altos quantis.

Pickands (1975Pickands, J. (1975). Statistical Inference Using Extreme Order Statistics. The Annals of Statistics, 3(1), 119-131.) definiu estimadores paramétricos para locação e escala dessas distribuições, com base nas estatísticas de ordem. Considere k inteiro de forma que 0<4k<n. Assim, os estimadores são:

γ k P = l n 2 - 1 l n X n : k - X n : 2 k X n : 2 k - X n : 4 k (8)

σ k P = X n : 2 k - X n : 4 k / 0 l n 2 e γ k P u d u (9)

A mesma letra grega γ foi utilizada em ambas as distribuições H(.) e G(.) para o índice de valor extremo pelo fato de esse indicador denotar, em geral, o mesmo domínio de atração (Pickands, 1975Pickands, J. (1975). Statistical Inference Using Extreme Order Statistics. The Annals of Statistics, 3(1), 119-131.). Neste trabalho também foi considerado o estimador de máxima verossimilhança da Pareto Generalizada, obtido numericamente maximizando a derivada da equação (7) para a amostra.

3.3.1. Distribuição de Pareto

O caso γ>0 (Pareto) é o mais interessante. Em geral, distribuições que convergem para esse domínio de atração podem ser representadas por L(x), uma função de variação lenta:

F X x = 1 - x - α × L ( x ) (10)

em que α se relaciona com a DPG por meio da relação α=1/γ. Quando L(x)=c, uma constante real, o EMV pode ser computado segundo o procedimento de Hill (1975Hill, B. M. (1975). A Simple General Approach to Inference About the Tail of a Distribution. The Annals of Statistics, 3(5), 1163-1174. https://doi.org/10.1214/aos/1176343247
https://doi.org/10.1214/aos/1176343247...
) de maximização da verossimilhança. A diferença entre o procedimento de Hill e o citado na seção 3.3 é que Hill considera apenas o parâmetro γ e possui uma solução analítica, enquanto o da seção 3.3 considera γ e σ simultaneamente. A formulação matemática do índice de Hill é dada por:

γ k H = 1 / α k H = i = 1 k - 1 l n X n : i X n : k k (11)

Também será utilizada neste trabalho uma generalização do estimador de Hill proposta por Dekkers et al. (1989Dekkers, A. L. M., Einmahl, J. H. J., & Haan, L. (1989). A Moment Estimator for the Index of an Extreme-Value Distribution. The Annals of Statistics, 17(4), 1833-1855. https://doi.org/10.1214/aos/1176347397
https://doi.org/10.1214/aos/1176347397...
). O estimador por momentos possui propriedades de convergência similares a Hill, mas com a vantagem de ser mais confiável em ajustes de caudas leves e médias (Resnick, 2014Resnick, S. I. (2014). Discussion of the danish data on large fire insurance losses. ASTIN Bulletin, 27(1), 139-151. https://doi.org/10.2143/AST.27.1.563211
https://doi.org/10.2143/AST.27.1.563211...
). Sua forma funcional é bastante semelhante à Equação (11):

M k j = i = 1 k - 1 l n X n : i X n : k j k (12)

γ k M = 1 / α k M = M k 1 + 1 - 1 2 1 - M k 1 2 M k 2 - 1 (13)

Estimadores dessa família possuem boas propriedades estatísticas. Porém, eles estão sujeitos ao efeito variância vs. viés: i.e., quanto mais observações são utilizadas na estimação, maior é o viés e menor é a variância do estimador, fato que torna a escolha do início da cauda um processo sensível (Caeiro et al., 2020Caeiro, F., Henriques‐Rodrigues, L., Gomes, M. I., & Cabral, I. (2020). Minimum‐variance reduced‐bias estimation of the extreme value index: A theoretical and empirical study. Computational and Mathematical Methods, 2(4), 1-17. https://doi.org/10.1002/cmm4.1101
https://doi.org/10.1002/cmm4.1101...
).

3.4. Método de Simulação

Este trabalho será executado em duas etapas. Inicialmente, os algoritmos serão testados em cenários controlados, por meio de simulação, com o objetivo de observar as diferenças entre os métodos e resultados obtidos. Depois, as técnicas desenvolvidas serão aplicadas para dados reais anônimos de uma seguradora.

Nas simulações, os dados serão gerados a partir de uma DPG, com diferentes magnitudes do parâmetro γ e tamanhos de amostra. O procedimento básico de simulação, cujo objetivo é verificar a capacidade de capturar o domínio de atração correto, bem como avaliar a qualidade de ajuste, terá o seguinte algoritmo:

  1. Gerar uma amostra aleatória de n microdados de sinistros Y, com distribuição FY(y);

  2. Da amostra, obter os gráficos Horror Plots (HP), com o intuito de verificar o comportamento de convergência do coeficiente em função do número de observações;

  3. Fazer os histogramas de cada um dos estimadores e compilar os resultados em tabelas;

  4. Determinar qual mais se aproximou do valor real no cenário controlado;

3.5. Ferramentas de Análise

O gráfico HP de uma amostra constitui-se de dados ordenados de maneira decrescente, e, partindo do i-ésimo elemento, calcular o respectivo estimador para o subconjunto de dados entre o primeiro elemento e o i-ésimo. O objetivo é avaliar o comportamento de convergência das estimativas, em função da quantidade de observações disponíveis.

O Expected Shortfall (ES), definido como a esperança da perda além de um liminar u, possui seu comportamento dependente do domínio de atração da Pareto Generalizada. Para γ positivos (negativos), possui um comportamento crescente (decrescente) em função de u, ou seja, a esperança da perda aumenta (diminui) de acordo com o liminar. Quando γ=0, a Pareto Generalizada torna-se uma Exponencial, que, pela propriedade de falta de memória, o ES assume um valor constante. Assim, pode-se utilizar gráficos dos pares ordenados descritos pela Equação 15 para buscar regiões de comportamento homogêneo da cauda e definir o limite de retenção.

Y n : k , i = 1 k - 1 ( Y n : i - Y n : k ) k - 1 , 2 k n (14)

É importante notar que o ES ponderado pela probabilidade de exceder o limiar 1-FY(u) constitui o prêmio atuarialmente justo de resseguro na modalidade excesso de danos. Afinal, um prêmio atuarialmente justo é o valor a ser pago por uma apólice de (res)seguro equivalente à esperança matemática dos valores presentes dos sinistros futuros aos quais um agente econômico está sujeito (Bowers et al., 1997Bowers, N. L., Gerber, H. U., Hickman, J. C., Jones, D. A., & Nesbitt, C. J. (1997). Actuarial Mathematics (2nd ed.). The Society of Actuaries.; Landes, 2015Landes, X. (2015). How Fair Is Actuarial Fairness? Journal of Business Ethics, 128(3), 519-533. https://doi.org/10.1007/s10551-014-2120-0
https://doi.org/10.1007/s10551-014-2120-...
).

Também serão utilizados QQ-Plots da amostra contra uma distribuição exponencial de mesma média, domínio de atração no qual γ=0. O objetivo é indicar se o conjunto de dados possui cauda mais (menos) pesada que uma exponencial, o que indicaria um γ positivo (negativo).

4. Resultados da Simulação

Na Figura 1, apresentam-se os HP para três dos estimadores testados com uma amostra de 2.500 observações geradas a partir de uma DPG com γ=1,5 e σ=100. Observa-se que o estimador de Hill requer um baixo número de dados em sua estimação, pois, caso contrário, a presença de viés começa a ser mais intensa. Já o estimador de Momentos segue a mesma tendência de Hill, porém o viés é menos intenso. O estimador de Pickands é o que possui maior variabilidade de todos; no entanto, não possui viés, evidenciando a necessidade de utilizar todos os dados disponíveis para seu cálculo. O EMV não necessita ser apresentado, pela sua natureza de obtenção direta, não estando sujeito a viés por se conhecer a função densidade.

Figura 1.
HP dos resultados de estimação por diferentes métodos para uma distribuição Pareto Generalizada com γ=1,5; σ=100; 2500 dados.

Foram geradas 5.000 amostras aleatórias de tamanho 2500 e para cada uma, aplicados os 4 estimadores, dado um número de estatísticas de ordem. Na Figura 2, são apresentados os histogramas dos resultados com parâmetros γ=1,5 e σ=100 e, na Tabela 1, suas estatísticas descritivas. Da Figura 2, nota-se que a distribuição de cada um dos estimadores é próxima a uma Normal. Já pela Tabela 1, evidencia-se a diferença existente entre o valor real dos parâmetros e os obtidos pelos estimadores de Hill e de Momentos, lançando luz sobre o problema da variância vs. viés. Quanto maior a amostra em ambos os casos, maior é o viés presente na estimação e menor a variância do estimador. Mas o método dos Momentos ainda consegue resultados melhores que Hill, tanto na proximidade ao valor real, como pelo desvio-padrão, ao se comparar Momentos com n=300 e Hill com n=125.

Usando Hill com n=500, cenário no qual a variância e a média foram muito semelhantes ao estimador Momentos com 700 dados, houve também o maior viés presente, da ordem de 0,05. Nesse cenário, os estimadores obtidos seriam os mais conservadores, pois indicam uma cauda mais pesada do que a real em um cenário no qual a variância das perdas não está bem definida (porque γ>1). Em contraposição, por existirem muitos dados na amostra, o estimador Pickands consegue ser mais eficiente ao obter um desvio-padrão pouco menor que o de Momentos com 300 e Hill com 125 observações, enquanto mantém o viés nulo. Quanto ao EMV, pelos dados terem sido gerados por sua própria função, ele é o melhor de todos, tanto em média como desvio-padrão, como esperado. Entretanto, é necessário cautela ao considerar esse estimador o mais adequado, pois se está testando na distribuição verdadeira para ele. Na prática, ela é desconhecida.

Tabela 1
Comparação dos métodos de estimação do γ para uma distribuição Pareto Generalizada com γ=1,5; σ=100; 2.500 dados.

O mesmo exercício foi replicado para amostras de tamanho 2500 obtidas da Pareto Generalizada de parâmetros γ=0,1; σ=10. Os resultados de uma replicação ilustrativa encontram-se na Figura 3. Nota-se como o viés é intenso em Hill, mesmo quando poucos dados estão sendo utilizados em sua estimação devido a sua natureza de estimação de caudas pesadas. A mesma consideração aplica-se ao estimador de Momentos, tendo seu viés crescido muito mais rápido do que no caso γ=1,5. Já Pickands é extremamente volátil no início para estabilizar ao final.

Figura 2.
Histogramas dos resultados de estimação por diferentes métodos para uma distribuição Pareto Generalizada com γ=1,5; σ=100; 2500 dados.

No experimento de extrações sucessivas de amostras, pela limitação de espaço, omitiram-se os histogramas porque os formatos não eram muito diferentes do caso anterior e a aproximação Normal continua válida. A Tabela 2 traz as estatísticas descritivas desse experimento. O viés do estimador de Hill é evidente, pois mesmo utilizando apenas n=12 ou 25 (quantidades de dados em que o estimador ainda apresenta estabilidade em algum patamar), a diferença entre o coeficiente estimado e o real ficou na ordem de 0,1. O estimador de Pickands novamente foi mais eficiente que o de Momentos, uma vez que para obter um resultado semelhante no viés, o desvio-padrão do estimador de Momentos foi mais elevado. Por outro lado, se o objetivo for a mesma variância, então existirá um viés de 0,04. O EMV novamente teve resultados semelhantes a Pickands na média, mas seu desvio-padrão é menor.

Figura 3.
HP dos resultados de estimação por diferentes métodos para uma distribuição Pareto Generalizada com γ=0,1; σ=10; 2.500 dados.

Tabela 2
Comparação dos métodos de estimação do γ para uma distribuição Pareto Generalizada com γ=0,1; σ=10; 2.500 dados.

É interessante notar que ao desconsiderar o EMV, cujos bons resultados já eram esperados por ser um método de estimação direta, Pickands em todos os experimentos controlados foi sempre aquele que mais se aproximou do verdadeiro valor do coeficiente γ. Nos casos sem viés, a variância de Pickands foi similar ou menor que a de Hill e Momentos. Porém, quando algum viés é tolerado, foi possível obter estimativas de menor variância como no caso γ=1,5 utilizando Hill e Momentos. Outra observação importante é o fato de Hill e Momentos serem mais bem aplicáveis para valores maiores de γ, caso contrário o viés pode ser significativo devido ao trade-off viés vs. variância, apontado anteriormente. Entretanto, o desvio sempre deveria ocorrer no sentido de ser mais conservador, pois tal situação pode ser preferível a incorrer em maior variância. Especialmente em situações nas quais a sobreprecificação dos riscos (gerando potenciais custos de oportunidade) é menos danosa do que a exposição à insolvência das companhias.

5. Resultados Aplicados

Nesta seção, apresentam-se os resultados obtidos ao aplicar os diferentes métodos de estimação a microdados de sinistros reais de uma seguradora multinacional que opera no Brasil, ocorridos e liquidados no período entre janeiro/2006 e maio/2012. Foram utilizados 5 ramos com características distintas para efeito de comparação: 0196 (Riscos Nomeados e Operacionais), 0167 (Riscos de Engenharia), 0351 (Responsabilidade Civil Geral), 0531 (Automóveis-Casco) e 0993 (Vida em Grupo). Todos os valores monetários expressos em moeda constante de maio/2012, possibilitando comparação direta. Na Tabela 3, apresentam-se as estatísticas descritivas.

Na Figura 4 apresentam-se os ES e QQ-Plot para cada um dos ramos. No ramo 0531 é possível identificar tendência a caudas leves, pois o QQ-Plot fica abaixo da linha de controle da distribuição Exponencial e há queda brusca do ES. Quanto ao ramo 0993, seu ES é crescente assim como seu QQ-Plot encontra-se acima da linha da Exponencial, mas há uma tendência de uma estabilização no final da distribuição. Tais fatores indicam uma distribuição de caudas leves: i.e., para ambos os casos não é esperado que haja ganhos expressivos da utilização da TVE.

Tabela 3
Estatísticas descritivas dos microdados disponíveis de cada ramo.

Pela Tabela 3, nota-se que o ramo 0196 possui maior dispersão. A Figura 4 evidencia esse comportamento, pois trata-se de um ramo que tradicionalmente apresenta sinistros de altas magnitudes e, portanto, exigindo a modelagem de valores extremos. Há um descolamento importante do QQ-Plot relativo à Exponencial, e o ES é crescente. Porém, nota-se a existência de uma aparente estabilização na cauda desse ramo, assim como no caso do 0993. Isso ocorre porque a penúltima e antepenúltima observações são muito próximas (R$36.827.195 e R$35.086.290). Finalmente, nos ramos 0351 e 0167, o QQ-Plot e o ES indicam distribuições com caudas pesadas.

Como a determinação do quantil a partir do qual os dados são considerados “valores extremos” é discricionária para cada caso, foi determinado um valor de corte da cauda baseado no comportamento do QQ-Plot e do ES. Esse corte pode ser entendido como o limite de retenção em um contrato de resseguro na modalidade excesso de danos, sendo o sinistro excedente reembolsável à seguradora por uma resseguradora. Buscou-se utilizar a região onde há maior estabilidade nas observações mais extremas nos dois elementos (QQ-Plot e ES) em sua determinação. A única exceção foi no ramo 0196, no qual não há comportamento bem definido em ambos os critérios, então utilizou-se o HP2 2 Foram executados HP para todos os casos, mas, por restrição de espaço, foram apresentadas apenas do ramo 0196. Caso seja de interesse do leitor, os autores podem fornecer os resultados mediante requisição. .

Objetivamente, os modelos serão comparados com base na soma dos erros quadráticos (SEQ) entre a função acumulada observada e a estimada, descrita pela Equação (16). Para a construção dos gráficos da função acumulada e cálculo da SEQ, com base no EMV e Pickands, foi utilizado o parâmetro de escala estimado σ próprio de cada método, conforme a seção 3. Como Hill e Momentos não descrevem uma forma de obtenção do parâmetro de escala, escolheu-se aquele que minimiza a SEQ. Também será realizado ajuste da distribuição Gama (baseline model), objetivando comparação com modelos tradicionalmente utilizados.

S E Q = i = 1 k F ^ ( X n : i ) - F ( X n : i , γ ^ ) 2 (15)

Os resultados obtidos das estimações para cada ramo foram compilados na Tabela 4, e os gráficos comparando as funções acumuladas empíricas e teóricas encontram-se na Figura 5.

Figura 4.
QQ-Plots e gráficos do ES de cada ramo.

Tabela 4
Resultados das estimações usando os microdados reais de cada ramo

No ramo 0531, foi escolhido U=100.000, com 190 observações acima desse limite. É possível inferir que a cauda neste caso é leve, porque os estimadores de Momentos, Pickands e Máxima Verossimilhança indicam γ^ negativo. Dentre todos os modelos, aquele que mais se aproximou foi Momentos (SEQ=0,0570), seguido por Pickands (SEQ=0,1686), Máxima Verossimilhança (SEQ=0,2497) e Gama (SEQ=0,4083). Por outro lado, o estimador de Hill não capturou o efeito da cauda leve, tendo sido o único estimador a apresentar γ^ positivo.

No ramo 0993, foi escolhido U=30.000 com 244 observações. Esse limiar foi decidido com base no gráfico do ES, pois o comportamento é aproximadamente linear dentro desse subdomínio. Nesta situação, encontraram-se basicamente duas formas de comportamento do ajuste: Momentos e Máxima Verossimilhança com γ^ mais baixo e indicadores de SEQ melhores (0,15); Hill e Pickands com o γ^ mais alto e SEQ piores (0,24), resultado similar à distribuição Gama. No segundo caso, como foi discutido na seção 4, Hill possui a característica de maior viés e superestimação da cauda para valores baixos de γ^.

No ramo 0196, foi escolhido o limite U=15.000 com 137 observações com base nos HP da Figura 6, porque, para este caso, nem o QQ-Plot nem o ES apresentavam um comportamento muito bem definido. No HP, pode-se observar em Hill e Momentos uma tendência na estabilização dos coeficientes entre 100 e 150 observações, daí a definição do limiar U. Do resultado da Tabela 4, a melhor estimativa foi dada pelo EMV (SEQ=0,0275), seguido por Momentos e Hill com SEQ similares (por volta de 0,043), e, finalmente, Pickands (SEQ=0,1013). O coeficiente γ^≈2 implica distribuição de cauda pesada e sem momentos definidos, representando risco potencialmente severo na atividade seguradora dado que sua média é instável. A distribuição Gama apresentou ajuste muito pior que todos os estimadores da Pareto Generalizada, indicando que modelos tradicionais falham em capturar caudas pesadas. Tal efeito fica mais evidente ao avaliar os resíduos, que apresentam acentuada tendência positiva e depois negativa.

No ramo 0351, foi escolhido o limiar U=20.000 e n=105 pelo mesmo motivo do ramo 0993: o ES é aproximadamente linear e eliminam-se alguns resíduos de valores baixos. Novamente, o EMV e Momentos conseguem melhores resultados (SEQ=0,0310 e 0,0449, respectivamente), enquanto Hill (SEQ=0,0783) superestima, e Pickands (SEQ=0,0798) subestima a cauda. Entretanto, independentemente do estimador escolhido, é possível inferir que a cauda da distribuição é levemente pesada com média definida, dado que o coeficiente nunca ultrapassou 1. Neste ramo, novamente a distribuição Gama apresentou baixa qualidade de ajuste, com SEQ muito elevada.

No ramo 0167, não houve imposição de limite de retenção devido à pouca quantidade de dados. Observa-se que a variabilidade dos estimadores foi bastante elevada nesse caso, tendo até mesmo Hill oscilado por volta de 0,5, e outro corte elevaria esse valor, tornando o método pouco confiável. Novamente, pela Tabela 4, o EMV foi o mais preciso (SEQ=0,0318), seguido por Pickands (SEQ=0,1112), Momentos (SEQ=0,1269) e Hill (SEQ=0,3608). Nos gráficos de ajuste, nota-se que Momentos e Hill apresentaram tendência de superestimação dos quantis nos maiores valores da distribuição, sendo mais apropriados para valores mais baixos. Por outro lado, Pickands e EMV comportaram-se de forma contrária: subestimaram o início da distribuição para capturar melhor quantis mais altos. Novamente, a distribuição Gama teve o pior resultado.

Foram calculados os ES teóricos na Tabela 4 usando cada um dos métodos. O ES da amostra e da distribuição Gama são iguais porque os parâmetros α e β foram obtidos pela função geradora de momentos. Geralmente, ramos nos quais os γ^ são elevados, os resultados não foram valores bem definidos: nota-se que os ramos 0196 e 0167 apresentaram 4 ES infinitos, o que reforça a natureza pesada dessas caudas. Por outro lado, o ramo 0351 apresenta seus γ^ com elevada variância, refletindo-se igualmente em alta variância do ES. Nele, a maior estimativa (Hill) é mais de 15 vezes superior à menor (Pickands). Nos ramos de caudas leves ou pouco pesadas (0531 e 0993), não houve grandes variações entre as estimativas teóricas do ES.

Figura 5.
Ajustes (esquerda) e resíduos (direita) da distribuição de valores extremos para cada ramo, por diferentes métodos

Figura 6.
HP do ramo 0196-Riscos Nomeados e Operacionais.

5.2. Aderência dos ajustes providos pelos diferentes estimadores

Para verificar a aderência dos ajustes, computaram-se as SEQ obtidas variando o limite de retenção para cada ramo. Os resultados encontram-se na Figura 7.

No ramo 0531, os estimadores Pickands e Momentos têm durante todo o intervalo testado os melhores valores de SEQ. O EMV e a distribuição Gama apresentam inicialmente SEQ altas. Porém, a partir de U>100000, a SEQ aproxima-se de Momentos e Pickands. Hill está sempre em um patamar mais elevado.

No ramo 0993, a distribuição Gama apresenta resultados similares a EMV e Momentos quando U>30000. Por outro lado, Hill e Pickands possuem grande variação no intervalo de limiares testados, embora não sejam totalmente inadequados no intervalo 30000<U<35000.

Quanto aos ramos 0196 e 0351, nota-se, em ambos os casos, que a distribuição Gama apresenta sempre alto SEQ, qualquer que seja o intervalo de limiares testado. A natureza das amostras é a cauda pesada, e essa distribuição não consegue capturar esse efeito, tornando-se inadequada a sua utilização nesses casos.

Finalmente, o ramo 0167 não possui dados suficientes para essa análise.

Figura 7.
Comportamento do SEQ por limiar, para cada ramo.

6. Estimação ao Longo do Tempo

Como uma última forma de analisar os dados, considerou-se a dimensão do tempo. Para avaliar a sensibilidade das estimativas à chegada de novas informações, os dados foram dispostos longitudinalmente. O objetivo é identificar qual o impacto que sinistros de alto valor monetário, sobretudo aqueles que ultrapassam o máximo vigente, têm sobre as estimativas oriundas dos diferentes métodos. Pelas limitações de espaço, serão desconsiderados os ramos 0531, porque sua cauda já é cortada (pela imposição de um limite máximo de indenização), e 0167, pela quantidade insuficiente de dados. As barras verticais indicam valores de sinistro que ultrapassam o máximo vigente. Os resultados encontram-se na Figura 8.

Figura 8.
Comportamento dos Estimadores ao longo do Tempo

Os resultados evidenciam comportamentos semelhantes entre os estimadores, tanto em crescimento como em decrescimento. No ramo 0351, há tendência de crescimento das estimativas sempre que um novo máximo é atingido na amostra, seguido de uma estabilização no novo patamar. O EMV é o mais afetado de todos, seguido de Momentos, enquanto Hill pouco se altera, mantendo o patamar desde 2007.

Já no ramo 0196, verifica-se rápida ascensão dos máximos, atingindo o patamar final da amostra em 2008. Isso ocorre porque um dos maiores sinistros da amostra foi observado logo nos primeiros momentos. Todavia, como no ramo 0351, os coeficientes não se estabilizaram na mesma velocidade. Na verdade, há tendência de queda ao longo do tempo, podendo os valores extremos do início do período terem sido considerados suficientemente raros, de modo a não afetar severamente os índices de cauda. Mas também pode sinalizar uma mudança no processo de subscrição da companhia, selecionando melhor os riscos baseados nas severas perdas passadas.

Finalmente, o ramo 0993, similar ao ramo 0196, apresenta rápida maturação do máximo. Contudo, não há a tendência de queda dos estimadores, mas um comportamento convergente semelhante ao ramo 0351. Isso pode indicar manutenção do processo de subscrição e gerenciamento de riscos, ou que não houve mudanças bruscas no perfil da carteira de segurados.

Figura 9.
Comportamento do Expected Shortfall ao longo do Tempo

O objetivo da Figura 9 é avaliar a evolução do ES ao longo do tempo. É importante lembrar que o ES é o prêmio atuarialmente justo de resseguro, e trata-se do custo em que a seguradora incorre para proteger-se financeiramente da ocorrência de sinistros de magnitudes extremas. Assim, é fundamental avaliar a sensibilidade que essa medida possui quando aparece um novo sinistro máximo e, também, quando o mesmo máximo perdura por muito tempo. As barras verticais indicam valores de sinistro que ultrapassam o máximo vigente.

Os comportamentos em todos os ramos são muito similares aos já verificados na Tabela 4. Um ramo destaca-se na Figura 9: 0196. Como as estimativas de γ são sempre maiores que 1 (aproximando-se de 2), os ES desse ramo são infinitos e aparecem como descontinuidades, por diferentes métodos de estimação. A implicação imediata é apresentar prêmios dos contratos de resseguro tão caros que tornaria os riscos não resseguráveis. Como os prêmios de resseguro deveriam estar contidos nos prêmios de seguros, a consequência seria tornar os eventos não seguráveis, reduzindo a capacidade de oferta das seguradoras, uma vez que as entidades considerariam os riscos envolvidos nessas operações extremamente altos e imprevisíveis.

Para o ramo 0993, Hill e Pickands, o ES mantém um valor próximo a R$50 mil durante todo o período enquanto EMV, Momentos e a amostra não desviam dos valores da Tabela 4. O ES do EMV é aproxima-se da amostra porque os γ estimados na Figura 8 foram próximos a 0. Finalmente, no ramo 0351, com exceção do estimador de Hill, os ES também se mantêm aproximadamente constantes, com pequenas oscilações positivas quando novos sinistros máximos são materializados. Em todos os casos, contudo, os prêmios atuarialmente justos de resseguro são positivamente sensíveis ao rompimento do antigo limiar, sinalizando que o valor deve ser automaticamente atualizado em função da ocorrência de um novo máximo. Ademais, nota-se que os prêmios tendem a permanecerem constantes (ou com leve redução) à medida que o antigo máximo continua vigorando, denotando certa persistência das severidades antigas influenciando a precificação contratual.

7. Considerações Finais

Na atividade seguradora, com o intuito de garantir a solvência da companhia no longo prazo, é relevante não apenas dispor de ferramentas para estimar os maiores riscos potenciais aos quais a companhia está exposta, mas principalmente ter bons critérios para selecionar os melhores estimadores. Afinal, caso materializados, sinistros de severidades extremas podem levar um segurador a apresentar variações intensas no resultado e, em última instância, conduzir a entidade à ruína. Uma das ferramentas para lidar com essa incerteza é o contrato de resseguro, especialmente o excesso de danos. Diante desse cenário, este trabalho teve como objetivo avaliar os diferentes métodos de estimação para altos quantis de distribuições de sinistros, considerando apenas os valores que superam um dado limite de retenção. A TVE foi escolhida para ser a base deste trabalho pelos resultados promissores advindos das técnicas derivadas dessa área da Estatística.

Com relação aos métodos de estimação testados, de forma geral, o estimador de Momentos aparentou ser o mais apropriado de todos. Por um lado, seu viés nas simulações foi um pouco intenso quando uma grande proporção da amostra era utilizada para estimação, mas sempre no sentido de superestimar os riscos expostos e ser mais conservador. Por outro lado, sua variância não é muito grande, sendo aplicável também para qualquer γ, tornando-o versátil. Quanto ao estimador de Hill, embora tenha a menor variância dentre todos, possui um viés muito intenso quando utilizado para caudas que não sejam extremamente pesadas advindas de distribuições sem esperança definida (γ>1). Em geral, apresentou resultados muito bons quando utilizado no ramo 0196, mas mesmo assim não conseguiu ser melhor que Momentos. Importante ressaltar que Resnick (2014Resnick, S. I. (2014). Discussion of the danish data on large fire insurance losses. ASTIN Bulletin, 27(1), 139-151. https://doi.org/10.2143/AST.27.1.563211
https://doi.org/10.2143/AST.27.1.563211...
) já trouxe menção ao fato de Momentos ser mais adequado a valores mais baixos de γ do que Hill.

O estimador de Pickands nas simulações obteve resultados muito promissores, mas a quantidade restrita de dados e sua grande variância o tornam inconstante na aplicação aos dados reais. Desta forma, ao contrário de Hill ou Momentos, não é possível determinar se os riscos estão sendo superestimados ou subestimados, pois qualquer desvio é simplesmente aleatório. Por fim, o EMV também obteve resultados consistentes, além de possuir uma variância pequena quando comparado aos outros modelos. Seu viés, da mesma forma que o de Pickands, é nulo, sendo desta forma uma escolha que não tende a superestimar ou subestimar a estimação da distribuição de valores extremos. Seu único defeito, porém, é quando γ<0. Nesta situação, acabou sendo o estimador com maior SEQ. Finalmente, a tradicional distribuição Gama obteve bons resultados em caudas leves ou pouco pesadas, como os ramos 0531 e 0993, embora não seja adequada para caudas pesadas (ramos 0351 e 0196).

Diante de todos os resultados obtidos nesse estudo, tanto nos experimentos simulados como na aplicação real, observou-se que os métodos de estimação de caudas constituem um poderoso ferramental para a área de seguros e deveriam ser olhados com mais cuidado. Embora os resultados não impliquem que exista um estimador perfeito e único que possa ser aplicado em todos os casos com eficiência, a combinação de todos os métodos é vital para obter boas estimativas. Entender a natureza e as características de cada estimador é fundamental para a correta aplicação do modelo. Uma possível extensão deste trabalho seria fazer avaliação similar para outros estimadores, dado seu amplo espectro, e compará-los entre as suas famílias e metodologias.

References

  • Aon. (2018). Weather, Climate & Catastrophe Insight - 2018 Annual Report. http://thoughtleadership.aon.com/Documents/20190122-ab-if-annual-weather-climate-report-2018.pdf
    » http://thoughtleadership.aon.com/Documents/20190122-ab-if-annual-weather-climate-report-2018.pdf
  • Beirlant, J., Maribe, G., & Verster, A. (2018). Penalized bias reduction in extreme value estimation for censored Pareto-type data, and long-tailed insurance applications. Insurance: Mathematics and Economics, 78, 114-122. https://doi.org/10.1016/j.insmatheco.2017.11.008
    » https://doi.org/10.1016/j.insmatheco.2017.11.008
  • Bowers, N. L., Gerber, H. U., Hickman, J. C., Jones, D. A., & Nesbitt, C. J. (1997). Actuarial Mathematics (2nd ed.). The Society of Actuaries.
  • Brazauskas, V., & Serfling, R. (2000). Robust and Efficient Estimation of the Tail Index of a Single-Parameter Pareto Distribution. North American Actuarial Journal, 4(4), 12-27. https://doi.org/10.1080/10920277.2000.10595935
    » https://doi.org/10.1080/10920277.2000.10595935
  • Caeiro, F., Henriques‐Rodrigues, L., Gomes, M. I., & Cabral, I. (2020). Minimum‐variance reduced‐bias estimation of the extreme value index: A theoretical and empirical study. Computational and Mathematical Methods, 2(4), 1-17. https://doi.org/10.1002/cmm4.1101
    » https://doi.org/10.1002/cmm4.1101
  • Carvalho, J. V. F., & Cardoso, L. (2021). Os Impactos da Rentabilização do Estoque de Capital Sobre a Probabilidade de Ruína e o Capital de Solvência para Seguradoras. Revista Evidenciação Contábil & Finanças, 9(3), 9-29.
  • Chen, Y., & Yuan, Z. (2017). A revisit to ruin probabilities in the presence of heavy-tailed insurance and financial risks. Insurance: Mathematics and Economics , 73, 75-81. https://doi.org/10.1016/j.insmatheco.2017.01.005
    » https://doi.org/10.1016/j.insmatheco.2017.01.005
  • Cummins, J. D., & Weiss, M. A. (2014). Systemic risk and the U.S. insurance sector. Journal of Risk and Insurance, 81(3), 489-528. https://doi.org/10.1111/jori.12039
    » https://doi.org/10.1111/jori.12039
  • Damasceno, A. T., & Carvalho, J. V. F. (2021). Assessment of the new investment limits for assets of Social Security Regimes for Public Servants established by Resolution CMN 3,922/2010. Revista Brasileira de Gestao de Negocios, 23(4), 728-743. https://doi.org/10.7819/rbgn.v23i4.4128
    » https://doi.org/10.7819/rbgn.v23i4.4128
  • Daníelsson, J., & Morimoto, Y. (2000). Forecasting Extreme Financial Risk: A Critical Analysis of Practical Methods for the Japanese Market. Monetary and Economic Studies, 18(2), 25-48.
  • Dekkers, A. L. M., Einmahl, J. H. J., & Haan, L. (1989). A Moment Estimator for the Index of an Extreme-Value Distribution. The Annals of Statistics, 17(4), 1833-1855. https://doi.org/10.1214/aos/1176347397
    » https://doi.org/10.1214/aos/1176347397
  • Dempster, M. A. H., Germano, M., Medova, E. A., & Villaverde, M. (2003). Global Asset Liability Management. British Actuarial Journal, 9(1), 137-195. https://doi.org/10.1017/S1357321700004153
    » https://doi.org/10.1017/S1357321700004153
  • Dietz, S., & Walker, O. (2019). Ambiguity and Insurance: Capital Requirements and Premiums. Journal of Risk and Insurance, 86(1), 213-235. https://doi.org/10.1111/jori.12208
    » https://doi.org/10.1111/jori.12208
  • Drees, H. (1995). Refined Pickands Estimators of the Extreme Value Index. The Annals of Statistics, 23(6), 2059-2080. https://doi.org/10.1214/aos/1034713647
    » https://doi.org/10.1214/aos/1034713647
  • Euphasio Junior, J. W., & Carvalho, J. V. F. (2022). Reinsurance and Solvency Capital: Mitigating Insurance Companies’ Ruin Probability. Revista de Administração Contemporânea, 26(1), e200191. https://doi.org/10.1590/1982-7849rac2022200191.en
    » https://doi.org/10.1590/1982-7849rac2022200191.en
  • Gatto, R. (2020). The stability of the probability of ruin. Stochastic Models, 36(1), 112-133. https://doi.org/10.1080/15326349.2019.1695135
    » https://doi.org/10.1080/15326349.2019.1695135
  • Gnedenko, B. (1943). Sur La Distribution Limite Du Terme Maximum D ’ Une Serie Aleatoire. Annals of Mathematics, 44(3), 423-453. https://doi.org/10.2307/1968974
    » https://doi.org/10.2307/1968974
  • Haan, L. (1990). Fighting the arch-enemy with mathematics. Statistica Neerlandica, 44(2), 45-68. https://doi.org/10.1111/j.1467-9574.1990.tb01526.x
    » https://doi.org/10.1111/j.1467-9574.1990.tb01526.x
  • Haan, L., Mercadier, C., & Zhou, C. (2016). Adapting extreme value statistics to financial time series: Dealing with bias and serial dependence. Finance Stoch, 20, 321-354. https://doi.org/10.1007/s00780-015-0287-6
    » https://doi.org/10.1007/s00780-015-0287-6
  • Haeusler, E., & Teugels, J. L. (1985). On Asymptotic Normality of Hill’s Estimator for the Exponent of Regular Variation. The Annals of Statistics, 13(2), 743-756. https://doi.org/10.1214/aos/1176349551
    » https://doi.org/10.1214/aos/1176349551
  • Hall, P., & Welsh, A. H. (1984). Best Attainable Rates of Convergence for Estimates of Parameters of Regular Variation. The Annals of Statistics, 12(3), 1079-1084. https://doi.org/10.1214/aos/1176346723
    » https://doi.org/10.1214/aos/1176346723
  • Hill, B. M. (1975). A Simple General Approach to Inference About the Tail of a Distribution. The Annals of Statistics, 3(5), 1163-1174. https://doi.org/10.1214/aos/1176343247
    » https://doi.org/10.1214/aos/1176343247
  • Huang, F., Maller, R., & Ning, X. (2020). Modelling life tables with advanced ages: An extreme value theory approach. Insurance: Mathematics and Economics , 93, 95-115. https://doi.org/10.1016/j.insmatheco.2020.04.004
    » https://doi.org/10.1016/j.insmatheco.2020.04.004
  • Iglesias, E. M. (2012). An analysis of extreme movements of exchange rates of the main currencies traded in the Foreign Exchange market An analysis of extreme movements of exchange rates of the main currencies traded in the Foreign Exchange market. Applied Economics, 44(35),4631-4637. https://doi.org/10.1080/00036846.2011.593501
    » https://doi.org/10.1080/00036846.2011.593501
  • Kasumo, C., Kasozi, J., & Kuznetsov, D. (2018). On Minimizing the Ultimate Ruin Probability of an Insurer by Reinsurance. Hindawi Journal of Applied Mathematics, 2018(19), 1-11. https://doi.org/10.1155/2018/9180780
    » https://doi.org/10.1155/2018/9180780
  • Landes, X. (2015). How Fair Is Actuarial Fairness? Journal of Business Ethics, 128(3), 519-533. https://doi.org/10.1007/s10551-014-2120-0
    » https://doi.org/10.1007/s10551-014-2120-0
  • McNeil, A. J. (1997). Estimating the Tails of Loss Severity Distributions Using Extreme Value Theory. ASTIN Bulletin, 27(1), 117-137. https://doi.org/10.2143/AST.27.1.563210
    » https://doi.org/10.2143/AST.27.1.563210
  • Melo, E. F. L. (2006). Uma Aplicação da Teoria de Valores Extremos para Avaliação do Risco de Contratos de Resseguro. Revista Brasileira de Risco e Seguro, 2(3), 1-22.
  • Mendes-Da-Silva, W., Lucas, E. C., & Carvalho, J. V. F. (2021). Flood insurance: The propensity and attitudes of informed people with disabilities towards risk. Journal of Environmental Management, 294, 113032. https://doi.org/10.1016/j.jenvman.2021.113032
    » https://doi.org/10.1016/j.jenvman.2021.113032
  • Pickands, J. (1975). Statistical Inference Using Extreme Order Statistics. The Annals of Statistics, 3(1), 119-131.
  • Ramsden, L., & Papaioannou, A. D. (2019). Ruin probabilities under capital constraints. Insurance: Mathematics and Economics , 88(1), 273-282. https://doi.org/10.1016/j.insmatheco.2018.11.002
    » https://doi.org/10.1016/j.insmatheco.2018.11.002
  • Resnick, S. I. (1971). Tail equivalence and its applications. Journal of Applied Probability, 8(1), 136-156. https://doi.org/10.2307/3211844
    » https://doi.org/10.2307/3211844
  • Resnick, S. I. (2014). Discussion of the danish data on large fire insurance losses. ASTIN Bulletin, 27(1), 139-151. https://doi.org/10.2143/AST.27.1.563211
    » https://doi.org/10.2143/AST.27.1.563211
  • Stupfler, G., & Yang, F. (2018). Analyzing and predicting cat bond premiums: a financial loss premium principle and extreme value modeling. ASTIN Bulletin, 48(1), 375-411. https://doi.org/10.1017/asb.2017.32
    » https://doi.org/10.1017/asb.2017.32
  • Tanaka, A. D., & Carvalho, J. V. F. (2019). Estimação da estrutura de dependências entre classes de seguro por meio de cópulas. Revista Brasileira de Risco e Seguro, 15(25), 1-34.
  • Taylor, P., & Falk, M. (1994). Efficiency of convex combinations of pickands estimator of the extreme value index. Nonparametric Statistics, 4(2), 133-147. https://doi.org/10.1080/10485259408832606
    » https://doi.org/10.1080/10485259408832606
  • Terra Brasis . (2017). Terra Report: Relatório do Mercado Brasileiro de Resseguros. https://www.australre.com/wp-content/uploads/2021/03/Terra-Report-Brasil-201706-Port-v7.pdf
    » https://www.australre.com/wp-content/uploads/2021/03/Terra-Report-Brasil-201706-Port-v7.pdf
  • Vaughan, E. J., & Vaughan, T. M. (2013). Fundamentals of Risk and Insurance. John Wiley & Sons.
  • Wüthrich, M. V. (2015). From ruin theory to solvency in non-life insurance. Scandinavian Actuarial Journal, 2015(6), 516-526. https://doi.org/10.1080/03461238.2013.858401
    » https://doi.org/10.1080/03461238.2013.858401
  • Yun, S. (2000). A class of Pickands-type estimators for the extreme value index. Journal of Statistical Planning and Inference, 83(1), 113-124. https://doi.org/10.1016/S0378-3758(99)00085-3
    » https://doi.org/10.1016/S0378-3758(99)00085-3
  • 2
    Foram executados HP para todos os casos, mas, por restrição de espaço, foram apresentadas apenas do ramo 0196. Caso seja de interesse do leitor, os autores podem fornecer os resultados mediante requisição.

Editado por

EDITOR-IN-CHIEF

ASSOCIATE EDITOR

Datas de Publicação

  • Publicação nesta coleção
    20 Maio 2024
  • Data do Fascículo
    2024

Histórico

  • Recebido
    07 Mar 2022
  • Revisado
    19 Ago 2022
  • Aceito
    16 Nov 2022
  • Publicado
    24 Out 2023
Fucape Business School Av. Fernando Ferrari, 1358, Boa Vista, 29075-505, Vitória, Espírito Santo, Brasil, (27) 4009-4423 - Vitória - ES - Brazil
E-mail: bbronline@bbronline.com.br