Matematyka ubezpieczeń życiowych/Model demograficzny

Z testwiki
Przejdź do nawigacji Przejdź do wyszukiwania

Szablon:T

Punktem wyjścia do rozważań na temat ubezpieczeń na życie jest analiza trwania ludzkiego życia i momentu jego końca jako zjawiska o charakterze losowym. W niniejszym rozdziale omówiony zostaną podstawowe zagadnienia związane z modelem demograficznym.

W swej najprostszej wersji model ten zakłada, że śmierć danego osobnika następuje w losowym (czyli niemożliwym do dokładnego przewidzenia w sposób pewny) momencie a szanse zajścia lub nie takiego zdarzenia rozpatrujemy tylko i wyłącznie jako funkcję wieku osobnika. Uwzględnienie czynników pokoleniowych jest możliwe, ale wymagać będzie większej komplikacji modelu.

Zmienne losowe i inne oznaczenia

Obiektem naszych rozważań będzie osobnik w wieku x i oznaczać go będziemy symbolem (x). Interesować nas będzie również jego wiek w chwili zgonu (czyli całkowita długość trwania jego życia) rozumiana jako zmienna losowa i oznaczana symbolem X. Ponieważ (x) jest obecnie w wieku x, to pozostało przed nim jeszcze Xx lat życia. Wprowadzamy więc zmienną losową T(x), zapisywaną czasem bez argumentu jako T i definiujemy ją następująco:

T(x):={Xxdlax[0;X],0dlax[0;X].

Kolejnymi symbolami jakie wprowadzimy będą oznaczenia gęstości i dystrybuant dla rozważanych zmiennych losowych. Będą to odpowiednio f i F dla zmiennej X oraz g i G dla zmiennej T.

Wszystkie powyższe wartości nie muszą być liczbami całkowitymi. W praktyce dość często wiek jest wyrażany całkowitymi liczbami ukończonych lat życia. Również ubezpieczenia zawierane są często na konkretną liczbę lat. Całkowitą liczbę lat jakie (x) przeżyje nim umrze oznaczymy przez K.

Wszystkie powyższe oznaczenia zostały zebrane w tabeli:

ozn. opis
(x) osobnik w wieku x
X wiek w chwili zgonu
F(t) dystrybuanta zmiennej X
f(t) gęstość zmiennej X
T dalsze trwanie życia osoby (x)
G(t) dystrybuanta zmiennej T
g(t) gęstość zmiennej T
K całkowita liczba przeżytych lat

Podstawowe prawdopodobieństwa występujące w modelu

Przyjąwszy powyższe oznaczenia możemy rozpocząć rozważania nad prawdopodobieństwem, że (x) przeżyje lub nie zadany okres czasu t. Prawdopodobieństwa te będą rzecz jasna funkcjami dwóch zmiennych - x i t. W notacji aktuarialnej są one oznaczane jako tpx i tqx. Umownie, gdy czas t=1 to jest on w tym zapisie pomijany.

qx=1qx,
px=1px.

Wprowadzamy również funkcję s(x) zwaną funkcją przeżycia. Definiuje się ją jako prawdopodobieństwo, że (0) (czyli noworodek) dożyje wieku x

s(x)=xp0.

Poniższa tabela zwięźle ujmuje wprowadzone oznaczenia

oznaczenie definicja założenia
F(x) Pr(Xx) x0
s(x) Pr(X>x) x0
tpx Pr(T(x)>t) x,t0
tqx Pr(T(x)t) x,t0
s|tqx Pr(s<T(x)<s+t) x,s,t0
k|qx Pr(K(x)=k) x0,k{0}
kpxqx+k Pr(K(x)=k) x0,k{0}

Zależności

Każdy człowiek w danym okresie czasu może albo umrzeć albo nie. Nie istnieje trzecia możliwość a zatem prawdopodobieństwa tpx i tqx muszą dawać w sumie 1

tpx+tqx=1

Można łatwo wykazać interpretując tpx+s jako prawdopodobieństwo warunkowe przeżycia przez x-latka t+s lat pod warunkiem, że przeżyje on co najmniej s lat (tpx+s=Pr(T>s+t|T>s)), że zachodzi równość

s+tpx=spxtpx+s.

Podobnie można zinterpretować s|tqx

s|tqx=s+tqxsqx=(1s+tpx)(1spx)==spxs+tpx=spxspxtpx+s==spx(1tpx+s)=spxtqx+s.

Kolejna warta zapamiętania zależność również łatwa do uzyskania w podobny sposób to:

tpx=s(x+t)s(x)

Intensywność umieralności

Chcielibyśmy czasem mieć możliwość oceny prawdopodobieństwa zgonu nie w pewnym przedziale czasu ale lokalnie w danym momencie t. Prawdopodobieństwo xpx jest równe 0. Musimy więc rozważać niezerowe przedziały i dokonać przejścia granicznego czyli innymi słowy posłużyć się pojęciem pochodnej. Definiuje się więc wielkość zwaną intensywnością umieralności, oznaczaną μx i określoną następująco

μx=limΔx0Pr(x<X<x+Δx|X>x)Δx.

Prawdopodobieństwo występujące w powyższym wzorze można wyrazić za pomocą funkcji przeżycia

Pr(x<X<x+Δx|X>x)=s(x)s(x+Δx)s(x).

Po podstawieniu otrzymujemy

μx=limΔx0s(x)s(x+Δx)s(x)Δx=s(x)s(x)=ddtlns(x).

Współczynnik umieralności można również wyrazić w terminach prawdopodobieństw tpx

μx+t=ddttpxtpx=ddtlntpx

Modele analityczne

Życie ludzkie jest procesem na który wpływ ma wiele czynników. Różne czynniki mają wpływ na śmiertelność w różnym wieku. W każdej populacji rozkład zmiennej T jest nieco inny. W XVIII i XIX w. podejmowano jednak próby opisania śmiertelności w sposób analityczny. Dziś modele te mają już raczej charakter wyłącznie historyczny, a próby analitycznego opisania rozkładu długości trwania życia spotykają się ze sceptyczną oceną demografów.

W 1724 r. Abraham de Moivre przyjął założenie, że istnieje nieprzekraczalny wiek graniczny ω. Założył również, że dalsze trwanie życia (x) ma rozkład jednostajny na przedziale (0,ωx). Natężenie wymierania w takim modelu wyraża się wzorem

μx+t=1ωxt,t(0,ωx).

O hipotetycznej populacji, w której umieralność spełnia powyższe równanie mówi się, że rządzi nią prawo umieralności de Moivre

W 1824 r. Benjamin Gompertz postawił hipotezę, że wiek graniczny nie istnieje a współczynnik umieralności jest funkcją wykładniczą.

μx+t=Bcx+t,B>0,c>1,t>0.

W 1860 r. William Makeham uzupełnił formułę Gompertza o stały, niezależny od wieku człon A.

μx+t=A+Bcx+t,B>0,c>1,t>0.

Warto zauważyć, że w modelach Gompertza i Makehama gdy c=1 to współczynnik umieralności byłby stały (niezależny od wieku). Oznaczałoby to, że człowiek niezależnie od wieku ma przed sobą takie same perspektywy odnośnie długości dalszego trwania życia. Innymi słowy w takiej populacji nikt się nie starzeje, długość życia ma rozkład wykładniczy, a umieralność można wtedy porównać do procesu rozpadu promieniotwórczego.

W 1939 r. szwedzki inżynier i matematyk Ernst Hjalmar Waloddi Weibull zaproponował użycie funkcji wielomianowej w miejsce wykładniczej

μx+t=k(x+t)n,k>0,n>1,t>0.

Tablice długości trwania życia

Podstawowe dane demograficzne niezbędne do kalkulacji aktuarialnych gromadzone są w formie tablic długości trwania życia. Tablice takie publikowane są w Polsce przez Główny Urząd Statystyczny[1]. Mają one formę tabeli w której osobno dla mężczyzn a osobno dla kobiet znajdują się dane zebrane w kolumnach:

x lx qx dx Lx Tx ex
  • x – wiek w latach,
  • lx – średnia liczba dożywających wieku x spośród początkowej liczby l0=100000 noworodków,
  • qx – jak wyjaśniono wcześniej jest to prawdopodobieństwo, że (x) przeżyje co najwyżej kolejny rok,
  • dx:=lxlx+1 – średnia liczba zgonów w przedziale wieku od x do x+1
  • Lx – średnia ogólna liczba przeżytych lat pomiędzy wiekiem x i x+1 z początkowej kohorty l0=100000 noworodków,
  • Tx – średnia ogólna liczba przeżytych lat powyżej wieku x dla początkowej kohorty l0=100000 noworodków,
  • ex – oczekiwana dalsza długość trwania życia dla (x).

Symbol dx jest szczególnym przypadkiem symbolu ndx definiowanego następująco:

ndx:=lxlx+n=lxqx.

Symbol ex definiuje się następująco:

ex=E(T(x))=0tg(t)dt=0tpxdt.

Dla zmiennej dyskretnej K(x) również definiuje się analogiczny symbol:

ex=E(K(x))=k=0kkpxqx+k=k=0k+1px=k=1kpx.

Ponadto można pokazać, że:

exex+12.
tpx=lx+tlx
t|kqx=lx+tlx+t+klx


Ubezpieczyciele do swych kalkulacji korzystają z własnych tablic, które nie są ogólnie dostępne.

Prawdopodobieństwo zgonu dla okresów ułamkowych

Dane demograficzne zebrane w tablicach długości trwania życia mają charakter dyskretny. Dostarczają informację o konkretnych wartościach jedynie dla wartości całkowitych. Gdy chcemy uzyskać dane dla konkretnego momentu pomiędzy tymi wartościami musimy dokonać interpolacji. W podrozdziale niniejszym omówimy trzy podstawowe założenia dla interpolacji stosowanej w ubezpieczeniach na życie.

Nieco bardziej formalnie i korzystając z wprowadzonych oznaczeń ujmujemy to zagadnienie następująco. Znamy rozkład zmiennej K i na jego podstawie chcemy interpolować rozkład zmiennej T. Wprowadzamy oznaczenie S:

S:=TK.

Jednostajny rozkład zgonów w ciągu roku (UDD)

Założenie to określane jest skrótem UDD (ang. uniform distribution of deaths). Już z samej nazwy widać, że przy założeniu tym S ma rozkład jednostajny na przedziale jednego roku. Zakładać ponadto będziemy, że zmienne K i S są niezależne. Z jednostajności rozkładu zgonów w ciągu roku wynika liniowość prawdopodobieństwa tqx względem t w przedziale (0,1) czyli

tqx=tqx.

Stała intensywność umieralności

Zakładamy tu, że μx+t ma dla każdego t(0,1) wartość stałą równą μx+12=lnpx.

Przy tym założeniu zmienne K i S nie są niezależne.

Założenie Balducciego

Założenie to określone jest wzorem:

1tqx+t=(1t)qx.

Idea tego założenia polega na liniowej interpolacji odwrotności funkcji przeżycia:

1s(x+t)=(1t)1s(x)+t1s(x+1),t[0,1].

Przy tym założeniu zmienne K i S nie są niezależne.

Podsumowanie

funkcja UDD μ=const Balducci
tqx tqx 1eμt tqx1(1t)qx
tpx 1tqx eμt px1(1t)qx
yqx+t yqx1tqx 1eμy yqx1(1t)qx
μx+t qx1tqx μ qx1(1t)qx
tpxμx+t qx eμtμ pxqx(1(1t)qx)2
ex ex+12
Var(T) Var(K)+112

Tablice specjalne

Tablice długości trwania życia są skonstruowane dla poszczególnych grup zróżnicowanych według różnych czynników. Najważniejszym czynnikiem branym pod uwagę przy zawarciu ubezpieczenia jest wiek początkowy x. Ubezpieczenia jednak są oferowane często osobom cieszącym się dobrym zdrowiem. Często również przed przystąpieniem do ubezpieczenia wykonywane są badania medyczne. Sytuacja takiej osoby nie jest więc identyczna z sytuacją x-latka, który wykupił ubezpieczenie kilka lat temu nawet jeśli inne czynniki są identyczne. Aby wziąć to pod uwagę konstruuje się tablice specjalne (selektywne, ang. select life tables). W tablicach takich prawdopodobieństwa śmierci są różne w zależności od wieku przystąpienia do ubezpieczenia. Wprowadza się zatem oznaczenie q[x]+t jako prawdopodobieństwo, że osoba (x+t), która przystąpiła do ubezpieczenia w wieku x umrze w ciągu najbliższego roku. Zachodzi przy tym nierówność

q[x]<q[x]+1<q[x]+2<

Po kilku latach (powiedzmy r) wiek w chwili przystąpienia przestaje mieć tak duże znaczenie i można używać zwykłych tablic. Zachodzi więc

q[x]+k=qx+kdlakr.

Przypisy