نوع مقاله : مقاله پژوهشی
عنوان مقاله English
نویسندگان English
Forecsting the death rate accurately is of paramount importance. The purpose of this research is to select the best stochastic mortality model in Iran based on a comparison between Lee-Carter models and the age-at-death distribution model (maximum entropy) for the male and female populations separately. It is worth mentioning that one of the strengths of modeling using age-at-death distribution is that it effectively represents the age-specific mortality pattern in Iran and answers the question of whether the mortality pattern in Iran is stable. Considering any model that reports the lowest error based on evaluation criteria, the life table for the year 1400 in Iran has been introduced and compared with the mortality tables TD88-90 in France and ILT1400 in Iran. In this regard, real mortality data in Iran for the years 2011-2019 for ages 0-100 years have been used. Ultimately, it was concluded that the Lee-Carter model performed better for the male population and the Currie model for the female population in Iran. It was also concluded that the existing tables in Iran report a higher mortality rate, and the life table presented in this article may be suitable for pricing insurance products and for more accurate calculation of actuarial indicators, such as the probability of death.
کلیدواژهها English
مقدمه و بیان مسأله
مدلبندی و پیشبینی مرگومیر در دهههای اخیر به یکی از موضوعات مهم در حوزه جمعیتشناسی و بیمسنجی تبدیل شده است. شرکتهای بیمه و صندوقهای بازنشستگی از پیشبینی نرخ فوت بهعنوان ورودی در محاسبات قیمتگذاری محصولات عمر، پرداختهای بازنشستگی و همچنین تعیین حقبیمه بیمهگذاران خود استفاده میکنند. همچنین این پیشبینیها برای حقوق بازنشستگی نیز بسیار حائز اهمیت است، زیرا در هنگام بازنشستگی پرداختهای ماهانه را براساس امید زندگی افراد محاسبه میکنند (Levantesi & Pizzorusso,2019) . عامل اصلی افزایش امید زندگی را میتوان کاهش میزان مرگومیر در سنین سالخوردگی نام برد و اگرچه یکی از بهترین دستاوردهای بشر است اما به یکی از مهمترین چالشهای سازمان بهداشت جهانی، سازمانهای تامین اجتماعی و شرکتهای بیمه که محصولات بیمه عمر و مستمری ارائه میکنند تبدیل شده است. استفاده از جداول عمر بومی ساخته شده باتوجه به میزان مرگومیر کشور خودمان به تفکیک جنسیت، بر محاسبه دقیقتر حق بیمه محصولات نیز اثر چشمگیری دارد. لذا در این پژوهش تلاش شده است تا با ارائه جدول عمری مبتنی بر عملکرد بهترین مدل تصادفی انتخاب شده به محاسبات دقیقتر نرخ فوت پرداخته بهگونهای که تقاضا برای محصولات بیمه عمر در ایران بیشتر شود. همچنین از آنجا که نرخ فوت برای هر جامعه و زیرمجموعه جمعیتی هرکشور متفاوت است، نیاز است تا از نرخهای فوت متفاوتی برای جمعیت زنان و مردان استفاده شود. زیرا بهصورت کلی زنان طول عمر طولانیتری نسبت به مردان دارند. نرخ فوت در ایران در ابتدا براساس جدول مرگومیر TD88-90 فرانسه محاسبه میشد، که مبتنی بر نرخ فوت مردان فرانسه است. از سال ۱۴۰۰ تاکنون از نرخ فوت جدول ILT1400 ایران در محاسبات استفاده میشود اما متاسفانه در این جدول نیز تفکیک جنسیت انجام نشده است. لذا در این مقاله، علاوهبر انتخاب بهترین مدل مرگومیر تصادفی در پیشبینی نرخ فوت کشور ایران به تفکیک جنسیت، به ساخت جدول عمر جداگانه برای زنان و مردان برمبنای عملکرد بهترین مدل انتخابی پرداخته میشود.
جدول عمر یکی از مهمترین ابزارهای جمعیتشناسی است که بیانگر وضعیت کنونی جمعیت و ادامه حیات، جامعه مورد بررسی است. برای ساخت جدول عمر میتوان به کمک میزان مرگومیر کل عناصر جدول را بدست آورد، اما به کمک آن نمیتوان دست به پیشبینی جمعیتی زد. لذا مدلسازی مرگومیر از نیمه اول قرن هجدهم به یک موضوع ثابت تبدیل شده است و تحت سه رویکرد کلی بررسی میشود (Booth & Tickle,2008). در حالت کلی برای مشخص کردن نرخ فوت در ادبیات بیمسنجی از دو روش استفاده میشود : ۱) روش مدلبندی ۲) روش جدولسازی (پاینده نجفآبادی، ۱۴۰۱). همچنین بهطور کلی سه عامل سن، دوره و گروه در مدلبندی و پیشبینی مرگومیر به کار میروند.
یکی دیگر از دیدگاههای کارآمد و متفاوت برای مدلسازی و پیشبینی مرگومیر استفاده از توزیع سن در زمان فوت است. این توزیع بیانگر مرگومیر تجربی یک جمعیت است و اطلاعات مفیدی در مورد معیار کلیدی طول عمر مانند متوسط مدت زمان زندگی یک جمعیت، نابرابری تجربه شده توسط جمعیت در زمان فوت و یا طول عمر فراتر از حد انتظار افراد بدست می آورد. علیرغم مزایای ذکر شده برای این روش، عموماً در مدلسازی و پیشبینی مرگومیر نادیده گرفته میشود. با توجه به اهمیت مدلبندی و پیشبینی مرگومیر، در این مقاله از دادههای مرگومیر کشور ایران برای مدلسازی و پیشبینی نرخ فوت استفاده شده است. دادههای واقعی شامل تعداد فوتیها و جمعیت کشور ایران، برای ۹ سال متوالی (۱۳۹۰-۱۳۹۸) و برای بازه سنی ۰ تا ۱۰۰ سال و به تفکیک هر دو جنسیت است که به ترتیب از سازمان ثبت احوال کشور و مرکز آمار ایران اخذ شده است. برای تعیین میزاى درستی دادهها در زمینه مرگومیر، در ابتدا دادهها ارزیابی شده و سپس به مدلسازی پرداخته میشود. برای اینکار دادههای ثبتی سالانه فوت از نظر کمثبتی ارزیابی و اصلاح شدهاند. بدین صورت که ماتریس توزیع سنی و سالانه فوتهای هر جنسیت بهصورت جداگانه بررسی شده است. یکی از روشهای اصلاح آن هموارسازی میانگین محرک است. هموارسازی درواقع بعد از محاسبه نرخ فوت و در هنگام ساخت جدول عمر اعمال شده است. در این روش ابتدا میزان فوت مرکزی (تقسیم تعداد فوت در هر سن بر جمعیت همان سن) در یک سال مشخص با میزان فوت مرکزی فرضی که بهصورت کاهش سالیانه ۵ در صدهزارم از میزان فوت مرکزی سال پایه، سال۱۳۹۰، محاسبه شده و مقایسه میشود. اگر میزان فوت محاسبه شده از میزان فوت فرضی کمتر باشد مقدار فرضی جایگزین میشود و تعداد فوت جدید به دست میآید. باکمک این روش میتوان کمثبتیهای موجود در یک سال مشخص را شناسایی و اصلاح کرد. اما به دلیل اینکه سال ۱۳۹۰ بهعنوان پایه انتخاب شد اصلاحات انجام شده به روش هموارسازی دادههای این سال را تغییر نمیدهد. همچنین میتوان گفت کمثبتی اغلب برای گروههای سنی میانسال رخ میدهد و همچنین تاثیر آن در اصلاح کمثبتی ناچیز است. لذا اصلاح کمثبتی در این مقاله به روش هیل انجام شده است. در واقع بعد از اعمال اصلاحات در الگوی فوت با کمک روش هموارسازی، دادههای حاصل در ارزیابی دادههای فوت به روش هیل در فاصله بین ۱۳۹۰-۱۳۹۸ مورد استفاده قرار میگیرد. در این روش علاوه بر دادههای فوت دادههای دو سرشماری ۱۳۹۰ و ۱۳۹۵نیز وجود دارد. دادههای سرشماری بهمنظور استفاده در این روش به میانه سال سرشماری جابهجا شده است. بنابراین دادههای فوت بین دو سرشماری باید از اول مهر ۱۳۹۰ تا ۳۱ شهریور ۱۳۹۵ را دربرگیرد. بدین ترتیب دادههای سالانه ثبت فوتی برای سالهای ۱۳۹۱ تا ۱۳۹۴ بهطور کامل و با فرض توزیع یکنواخت فوتها برای سالهای ۱۳۹۰ و ۱۳۹۵ است. با کاربرد این دادهها روش هیل ضریب پوشش دادههای فوت را برای مردان و زنان به ترتیب ۸۱ و ۶۲ درصد برآورد کرده است. کاربرد روش هیل برای اصلاح دادههای فوتی ثبتی در فاصله دو سرشماری ۱۳۹۰ و ۱۳۹۵ بدین معناست که تنها ۸۱٪ از فوتهای دوره ۶ ساله برای مردان و ۶۲٪ برای زنان ثبت شده است. بهمنظور اصلاح کمثبتی تعداد فوتیهای ثبتی دوره ۶ ساله باید بر میزانهای مذکور تقسیم شود. همچنین برای محاسبه میزان مرگومیر باید جمعیت سرشماری سال ۱۳۹۰ بر عدد 0.81 تقسیم شود تا کمشماری آن نسبت به سال ۱۳۹۵ اصلاح شود. شایان ذکر است که ضرایب پوشش فوت در وش هیل برای کل دوره محاسبه میشوند و ضریب اعمال شده برای تمام سالها و سنین دوره مطالعه یکسان است اما استفاده از ضریب یکسان برای سالهای مختلف چندان درست نمیباشد. بنابراین برای بهبود ثبت دادههای فوت در طی دوره مورد بررسی از شاخص نسبت دادههای مرگومیر به کل تعداد مرگومیر در هرسال مورد بررسی بهعنوان شاخص وزنی مناسب استفاده شده است. درواقع بعد از اطمینان از صحت دادهها، از نرخ فوت خام ایران در سالهای ۱۳۹۰ تا ۱۳۹۵ برای برازش مدلها استفاده میشود و نرخ فوت برای سالهای ۱۳۹۶-۱۳۹۸ پیشبینی میشود. سپس با مقایسه نرخ مرگومیر مشاهده شده با نرخ مرگومیر پیشبینیشده براساس هریک از مدلهای معرفی شده در ادامه به رتبهبندی مدلها براساس دقت پیشبینی هریک پرداخته میشود. براساس مدلی که رتبه نخست را اخذ کرده است پیشبینی نرخ فوت تا افق ۱۴۰۲ انجام میشود. و در نهایت نرخ مرگومیر پیشبینی شده براساس عملکرد بهترین مدل تصادفی با نرخ مرگومیر جداول TD88-90 فرانسه و ILT1400 ایران مقایسه میشود. با داشتن نرخ فوت برای کل دوره (۱۴۰۲-۱۳۹۰) میتوان جداول عمر متناظر با جنسیت را برای هر سال ساخت. ساخت جدول عمر با استفاده از نرمافزار R و بسته “demography” ساخته شده است.
مرور پیشینه پژوهش
میتوان گفت منشأ مدلسازی مرگومیر بهعنوان یک زمینه تحقیقاتی و جمعیتشناسی بهعنوان یک رشته علمی، بهطور کلی با کار جان گرانت تاجر مشهور لندنی آغاز شد. (Graunt, 1662)با توجه به مشاهدات طبیعی خود که براساس ثبت دویست هزار مرگومیر در بولتنهای کلیسای لندن بود فهرستی شبیه جدول مرگومیر را که براساس علل مرگومیر طبقهبندی شده بود تدوین کرد که سرآغاز تدوین جدولهای تحلیلی مرگومیر شد. بعد از آن (Halley, 1693)ریاضیدان و ستارهشناس مشهور، جدول کاملتری را به تفکیک سن بنا نمود. وی حتی موفق شد روشی را برای انجام محاسبات سالیانه عمر براساس این جدول ارائه دهد. سپس محققان دیگری به این مسئله پرداختند و جدولهایی در مقیاس ملی تدوین کردند و تفاوت مرگومیر در نقاط شهری و روستایی را مطرح ساختند؛ تا آنکه نخستین جدول عمر بر حسب گروههای سنی ساخته شد و از آن به بعد مطالعه مرگومیر به یکی از موضوعات عمده جمعیت شناختی تبدیل شد. شایان ذکر است که جدول عمر مهمترین ابزار تحلیلی جمعیّتشناسان است اما بدون دسترسی به دادههای مرگ با جزئیات سنّی و جنسی کار دشواری است. بنابراین، در مناطق و کشورهایی که دادههای ثبت مرگ با جزئیات مورد نیاز در دسترس نیست (Moultrie and et.al, 2013) و یا به دلیل ضعف نظام ثبت، دچار کمثبتی یا خطای گزارش باشند ساخت جدول عمر به مراتب سختتر است. در بسیاری از کشورهای کمتر توسعهیافته و درحالتوسعه از جمله ایران، با وجود همه پیشرفتهای صورتگرفته در مقایسه با گذشته، پوشش ثبت واقعه مرگ هنوز صددرصد نیست (عزیزیشاکر، ۱۳۹۸). در کشور ایران نیز، بهمنظور در نظر گرفتن تغییرات جمعیتی، طبق آیین نامه شماره 68 شورای عالی بیمه، نهاد ناظر صنعت بیمه، بیمه مرکزی جمهوری اسلامی ایران موظف است حداقل هر پنج سال یک بار جدول عمر اعلام شده را بهروزرسانی نماید (مصوبات شورای عالی بیمه، ۱۳۹۰).
در مورد پیشینه مدلسازی نظری مرگومیر میتوان گفت که در ابتدا با (De Moivre, 1725)آغاز شد. وی فرض کرد که مدل فوتیها از توزیع یکنواخت پیروی میکنند. بعدها گومپرتز در سال ۱۸۲۵ با اتخاذ یک رویکرد بیولوژیکی به مدلسازی ریاضی پرداخت. او فرض کرد که شدت مرگومیر x در بزرگ سالی افزایش تقریباً تصاعدی را نشان میدهد، زیرا بر این باور بود که قوای جسمانی افراد با افزایش سن کاهش مییابد. در واقع، این مدل یک تابع نمایی است که در آن دو پارامتر مدل مثبت هستند. (Makeham, 1867) مدل گومپزتز را که برای سنین بالا مناسب نبود اصلاح کرد، همچنین در این مدل یک پارامتر ثابت برای در نظر گرفتن مرگومیر به دلایل غیرمرتبط با سن اضافه گردیده است. تا اوایل قرن بیستم، مدلهای گومپرتز و مکهام از جمله مدلهای رایج مرگومیر باقی ماندند تا اینکه اقتصاددان ایتالیایی، پارتو نظریات خود را که برمبنای مشکلات جامعه بود در مدل وارد کرد. برخلاف مدلسازی مرگومیر، پیشبینی مرگومیر یک تلاش نسبتاً جدیدتر است. بهطور کلی مدلسازی مرگومیر به سه رویکرد تقسیم میشود: ۱- رویکرد مبتنی بر تجربه: در رویکرد ذهنی پیشبینی مرگومیر مبتنی بر تجربیات افراد خبره و متخصصان است. مزیت این رویکرد وارد کردن دانش تخصصی در یک روش کیفی است اما این روش به دلیل ذهنی و محافظهکارانه بودن نظرات خبرگان، اغلب منجر به کم برآورد کردن مرگومیر میشود (Waldron, 2005). ۲- رویکرد مبتنی بر برونیابی: اکثر روشهای پیشبینی مرگومیر مبتنی بر رویکرد برونیابی هستند. در این روش از نظم موجود در الگوهای سنی در طول زمان برای پیشبینی مرگومیر آتی استفاده میشود. این رویکرد از برونیابی خطی ساده تا روشهای مبتنی بر مدلهای دو عاملی (سن و دوره) را شامل میشود. در مدلهای دو عاملی نرخ فوت، تنها تابعی از سن بیمهگذار نیست و دوره زمانی نیز نقش اساسی در تغییرات نرخ مرگ ومیر ایفا میکند. ۳- رویکرد مبتنی بر علت: در این روش از مدلهای مبتنی بر علت فوت استفاده میشود، که میتوان دانش پزشکی و اطلاعات در مورد تغییرات رفتاری و محیطی را وارد مدل کرد. نمونهای از چنین مدلی رابطه توضیحی بین سیگار کشیدن و سرطان ریه است. اگرچه استفاده از این روش به علت عدمدرک کامل از روابط بین عوامل ریسکومرگومیر با نااطمینانی همراه است، اما کاربرد این روش در شبیهسازی اثر شیوع بیماری بر مرگومیر است. درواقع میتوان گفت که در طول سه دهه گذشته است که مجموعه جدیدی از مدلهای مرگومیر، با تکیه بر روشهای آماری و تصادفی مشخص میشوند و با هدف صریح پیشبینی دقیق طول عمر مورد استفاده قرار گرفتهاند. لازمه پیشبینی مرگومیر، تصریح یک مدل پایه از دادهها و تصریح مدلی برای پیشبینی است.
از طرفی یکی دیگر از دیدگاههای متفاوت در مورد تحولات مرگومیر و تغییرات الگوی طول عمر انسان، استفاده از توزیع سن در زمان فوت است که نمایانگر مرگومیر تجربی در یک جمعیت است و به این ترتیب پاسخگوی دو سوال کلیدی در مطالعات مرگومیر خواهد بود.
1) انسانها بهطور متوسط چند سال عمر میکنند؟ 2) سن در زمان فوت چقدر متغیر است؟ پاسخ به سوال دوم میتواند زمینه را برای پرسش مطرح شده در مقاله کمیجانی و همکاران (١٣٩٣) فراهم کند.اینکه آیا نرخ مرگومیر ویژه سنی در طول زمان در ایران تغییر نکرده است؟
علیرغم مزایای ذکر شده برای به تصویر کشیدن الگوهای مرگومیر و مطالعه نابرابری طول عمر، توزیع سن در زمان فوت عموماً در مدلسازی و پیشبینی نادیده گرفته میشود. تنها چند تلاش برای استفاده صریح از آنها برای پیشبینی مرگومیر آینده انجام شده است. اولین بار (Pearson, 1987)، اقدام به توصیف الگوی مرگومیر انسانی به کمک توزیع سن در زمان فوت کرد. (Dellaportas, Smith and Stavropoulos,2001)از تعداد فوتیها برای تطبیق مدل هلیگمن پولارد با روشهای بیزی استفاده کرده است. همچنین (Mazzuco, Scarpa and Zanotto, 2018)مرگومیر را با برازش یک توزیع نیمه نرمال[1] و توزیع چوله نرمال چند بعدی[2] به تابع توزیع تجربی سن در زمان فوت مشاهده شده مدل میکنند. ایدۀ جدید دیگری توسط (Basellini and Camarda, 2019) معرفی شد که در آن از یک تابع سه پارامتری برای مدلسازی و مقایسه پویایی توزیع مرگومیر بزرگسالان حول سن معین استفاده میکنند که این پارامترها میتوانند با استفاده از مدلهای سری زمانی استاندارد برونیابی شوند. یک روش نوآورانه دیگر برای مدلسازی و پیشبینی مرگومیر استفاده از گشتاورهای آماری است که توسط (Pascariu, Lenart and Canudas-Romo, 2019) ارائه شد. روشهای سری زمانی برای برونیابی تعداد محدودی از گشتاورها استفاده میشود و سپس بازسازی توزیع سن در زمان فوت برای آینده انجام میشود. استفاده از دانش آماری در مورد شکل توزیع و اینکه چگونه سطح مرگومیر در یک سن خاص کاملاً به سطوح مرگومیر در تمام سنین دیگر وابسته است، مزیت بزرگی برای روشهای برونیابی مبتنی بر فراوانی مرگ است. این مقاله نشان میدهد که با استفاده از گشتاورهای آماری و اطلاعات توزیع سن در زمان فوت میتوان پیشبینیهای دقیقی از میزان مرگومیر خاص سنی به دستآورد. در این مقاله مدل ماکسیمم آنتروپی را با سایر مدلهای کلاسیک مرگومیر تصادفی به خوبی برازش داده شده مقایسه میشوند و رتبه هریک از مدلها باتوجه به قدرت پیشگویی نرخ فوت آینده تعیین میشود. قابلتوجه است که وجه اصلی تمایز این مقاله با اکثر پژوهشهای انجام در دادههای مورد استفاده است. بیشتر مدلسازیهای صورت گرفته در ایران با استفاده از بانک اطلاعات مرگومیر (HMD) انجام شده است که این بانک اطلاعاتی شامل دادههای مرگومیر 51 کشور است اما متاسفانه دادههای مربوط به کشور ایران در آن بارگذاری نشده است. از جمله این پژوهشها میتوان به مقالات کشمرزی و شعاعی (۱۴۰۱) و ذکایی و آلحسینی (١٣٩٣) اشاره کرد. اگرچه الگوی مرگومیر کشور فرانسه به الگوی مرگومیر ایران تاحدودی شبیه است اما استفاده از دادههای ملی در برآورد دقیقتر و درستتر نرخ فوت کمک زیادی به جمعیتشناسان و بیمسنجها میکند. همچنین باتوجه به مطالب گفته شده در بیشتر مدلسازیها از خانواده مدلهای لیکارتر استفاده میشود، اما در این پژوهش عملکرد پیشببینی مدلهای کلاسیک با رویکرد نسبتا جدید مدلسازی برمبنای توزیع سن در زمان فوت مقایسه میشوند.
چارچوب نظری پژوهش
1) نمادها
سادهترین معیار مرگومیر تعداد مرگومیر است. با این حال، برای اهداف عملی کاربرد چندانی ندارد، زیرا به شدت تحت تأثیر تعداد افرادی است که در معرض خطر مرگ هستند. به همین دلیل، جمعیتشناسان معمولا به جای تعداد مرگومیر از نرخ فوت استفاده میکنند. سادهترین نرخ فوت قابل تصور از تقسیم تعداد کل فوتهای یک جمعیت در یک دوره زمانی بر کل جمعیت مورد بررسی بهدست میآید. به این معیار نرخ فوت خام میگویند. دوره زمانی مورد بررسی معمولا یک سال تقویمی است.
(
اکثر مدلهای تصادفی مرگومیر که از نرخ فوت یا احتمال مرگ برای مدلسازی استفاده میکنند به فرم زیر هستند:
که در آن پارامتر وابسته به سن، پارامتر وابسته به زمان و پارامتر مربوط به گروه است.
استفاده از نرخ فوت و یا احتمالات مرگومیر بیشترین کاربرد و علاقه را در بین بیمسنجها در امر مدلسازی و پیشبینی مرگومیر دارد. رویکرد اکثر روشهای پیشنهادی و تثبیتشده برای مدلسازی و پیشبینی مرگومیر انسان استفاده از نرخ فوت و برآورد پارامترهای مدلهای تصادفی مرگومیر براساس تابع ماکسیمم درستنمایی است. یکی از دلایل اصلی استفاده از این شاخص جمعیتشناختی در مطالعه و پیشبینی مرگومیر این است که آنها به راحتی تحولات مرگومیر را در طول سن و زمان به تصویر میکشند و در واقع نمایش مستقیمی از تغییرات در الگوی سنی مرگومیر ارائه میکنند. همچنین استفاده از لگاریتم مرگومیر به ما این اطمینان را میدهد که ضرورتاً نرخها مثبت خواهند بود.
در این بخش، ابتدا یکدستهبندی کلی در خصوص مدلهای استفاده شده در این مقاله انجام میشود و در مقاله ای دیگر به صورت مفصل به معرفی هریک از آنها پرداخته شده است.
جدول ۱: معرفی مدلها
|
نام مدل |
فرمول مدل |
شناساپذیری مدل |
|
مدلهای کلاسیک تصادفی |
||
|
لیکارتر |
مشکل شناساپذیری دارد. |
|
|
رینشوهابرمن |
|
مشکل شناساپذیری دارد. |
|
کوری |
|
مشکل شناساپذیری دارد و نیاز به یک قید اضافهتر نیز دارد. |
|
CBD |
|
مشکل شناساپذیری ندارد |
|
CMI |
مشکل شناساپذیری دارد |
|
|
پلیت |
|
مشکل شناساپذیری دارد |
|
هیندمن اولا |
|
مشکل شناساپذیری دارد |
|
چند متغیره گام تصادفی با رانش |
|
مشکل شناساپذیری ندارد |
|
لیلی |
مشکل شناساپذیری دارد |
|
|
مدل توزیع سن در زمان فوت |
||
|
ماکسیمم آنتروپی |
مشکل شناساپذیری ندارد |
|
2) مدل لیکارتر
مدل تصادفی لیکارتر، یکی از مهمترین مدلهای دو عاملی برای پیشبینی مرگومیر است .(Lee and Carter, 1992)این مدل به دلیل عملکرد نسبتاً خوبی که در برآورد نرخهای مرگومیر داشته است، در میان بیمسنجها و جمعیتشناسان شهرت یافته است. روش لیکارتر بهعنوان یک روش برونیابی، ترکیبی از یک مدل جمعیتشناسی غنی (با کمترین پارامتر) و روشهای سری زمانی است. این مدل به وسیله مولفههای اصلی در این بخش تخمین زده میشود و با کمک تجزیه ماتریسی، مولفههای مستقل مرگومیر و همچنین الگوهای سنی و اهمیت آنان در طول زمان شناسایی میشوند. اگرچه در این روش هم مانند سایر روشهای برونیابی، اطلاعات پیرامون تأثیرات حاصل از پیشرفتهای پزشکی، رفتاری، یا اجتماعی در محاسبه مرگومیرها بیتاثیر هستند، اما بنابر دلایلی استفاده از آن بر سایر روشهای برونیابی برتری دارد. اول، پارامترهای مدل قابلیت تفسیرپذیری دارند و اغلب اوقات، مدل قدم زدن تصادفی با رانش برای برونیابی روند آتی نرخ مرگومیر مناسب است. دوم، در کشورهای صنعتی و توسعهیافته، بخش زیادی از تغییرات در نرخ مرگومیر کل کشور به کمک این مدل پوشش داده میشود؛ سوم، علاوه بر پیشبینی تکی نرخهای مرگومیر قادر به ارائه بازههای اطمینان متناظر با آنها نیز است. در کتب جمعیتشناسی ازاینروش بهعنوان مدل آماری برجسته در پیشبینی بلندمدت میزان مرگومیر کل جمعیت یاد شده است
3) مدل رینشو- هابرمن
این مدل توسط (Renshaw and Haberman, 2006) ارائه شد. در واقع این مدل با اضافه کردن اثر همگروهی، کلاس مدل لیکارتر را به کلاس وسیعتری از مدلهای غیرخطی، پارامتری و تعمیمیافته گسترش داده است و این امکان را میدهد تا مدلسازی و برونیابی اثرات گروهی در دوره خاص انجام شود. مطالعه همگروهی مطالعهای است بر روی گروهی از افراد با حداقل یک تجربه مشترک خاص در یک دوره زمانی خاص.
4) مدل کوری
این مدل توسط (Currie, 2006)معرفی شد. این مدل در واقع ساده شده مدل رینشو هابرمن است بهطوری که اگر در مدل رینشو هابرمن پارامترها را بهصورت تعریف کنیم، به مدل APC میرسیم. و در این مدل بیانگر تعداد افراد در هر سن است.
5) مدل CBD[3]
این مدل در سال ۲۰۰۶ توسط کارینز[4] ارائه شد که در آن به جای استفاده از نرخ فوت از احتمال مرگ استفاده میشود (Cairns, Blake and Dowd, 2006).
6) مدل CMI
این مدل در سال ۲۰۰۷ معرفی شد و یک تعمیم از مدل CBD است.
7) مدل پلیت
این مدل در سال 2009 معرفی شد. این مدل چهار متغیر تصادفی دارد. بیانگر تغییرات در سطح مرگومیر برای همه سنین است. عامل اجازه میدهد تا تغییرات در مرگومیر بین سنین متفاوت باشد. همچنین به نظر میرسد پویایی مرگومیر در سنین پایینتر (تا سن 40-50 سال) میتواند در برخی مواقع متفاوت باشد، ضریب برای ثبت این پویاییها اضافه شده است.
8) مدل هیندمن اولا
در این روش مدلبندی مرگومیر با نگاهی تابعی به لگاریتم نرخ فوت خام هر سال است. در این مدل نمودار لگاریتم نرخ فوت به شکل تابعی از سن در نظر گرفته میشود. این روش نسبت به سالهای دورافتاده مثل سالهای جنگ یا شیوع بیماری خاص استوار است و امکان اعمال قیدهای مختلف را به ما میدهد (Hyndman and Shahid Ullah, 2007).
فرض اصلی در این روش بدین صورت است که اگر بیانگر لگاریتم نرخ فوت خام مشاهده شده در سن x و زمان t باشد، تابع پیوسته همواری همچون در زمان t وجود دارد، بهطوری که با کمی خطا در نقاط گسسته سن قابل مشاهده است. بنابراین، مشاهدهها در این روش به شکل )، t=1,…,n)) و نمایش داده میشوند که در آن مقدار از نوفه موجود در سری است که با تغییر سن تغییر میکند (وجود این مؤلفه در خطای مدل، به دلیل تصحیح فرض هم واریانسی در مدل لیکارتر است) (ذکایی و آل حسینی، 1393).
9) مدل چند متغیره گام تصادفی با رانش
این مدل نشاندهنده یک برونیابی خطی ساده از لگاریتم نرخ فوت خام خاص سن، بر اساس اولین و آخرین مقادیر فوت مشاهده شده در سری زمانی چندمتغیره است (Pascariu, Lenart and Canudas-Romo, 2019).
10) مدل مرگومیر چند جمعیتی لیلی
مدل لیلی نیز تعمیمی از مدل کلاسیک لیکارتر است که در سال ۲۰۰۵ معرفی شد. مدل لیلی به جای در نظر گرفتن تنها دادههای یک کشور، دادههای چندین کشور را در نظر میگیرد. ایده آنها در مورد مدلسازی چندجمعیتی ناشی از وجود همبستگی بین گروههایی است که نزدیک به یکدیگر هستند: در چنین شرایطی، بهبود مرگومیر در یک کشور بر بهبود مرگومیر در کشور دیگر تأثیر میگذارد و منجر به کاهش همبستگی در نرخ مرگومیر میشود.
پارامتر خاص سنی است و شکل کلی مرگومیر را برای جمعیت نشان میدهد. برای جلوگیری از انحرافات گروههای فرعی در یک جمعیت تعریف میشود و میتوان گفت بیانگر تغییرات مرگومیر در کل گروه است. این فاکتور مشترک برای همه جمعیتها به کمک روش SVD که در مدل لیکارتر استفاده شد، بهدست میآید و پارامتر بیانگر حساسیت سن به اثر دوره است. پارامتر اثر دوره است و برای تعدیل میانگین امید زندگی کل گروه تنظیم شده است. یک روش قدم زدن تصادفی با رانش بر روی پارامتر اعمال میشود تا روند رایج در مرگومیر آینده پیشبینی شود. بیانگر رانش مدل و متغیر تصادفی نرمال مستقل و همتوزیع هستند (Li and Lee, 2005).
11) مدل ماکسیمم آنتروپی
آنتروپی مقداری برای اندازهگیری میزان عدمقطعیت یک متغیر تصادفی را مشخص میکند. این اندازه برای نخستین بار توسط شانون در سال ۱۹۴۸ و سپس توسط (Shannon and Weaver, 1949) معرفی شده است و میتوان گفت بهترین شکل ریاضی معرفی شده است زیرا ماکسیمم کردن آن با کمک روش لاگرانژ به آسانی انجام میشود و به دلیل مقعر بودن تابع، دارای ماکسیمم نسبی است.
با توجه به اصل ماکسیمم آنتروپی، با شرط داشتن اطلاعات بخصوصی از یک متغیر تصادفی و یا یک بردار از متغیرهای تصادفی بایستی توزیعی را برای آن انتخاب کرد که علاوهبر داشتن اطلاعات مورد نظر، دارای ماکسیمم عدمقطعیت باشد. در این بخش از یک روش جدید و نوآورانه برای مدلسازی و پیشبینی مرگومیر با استفاده از شکل تابع چگالی و گشتاورهای آماری استفاده شده است و با استفاده از گشتاورهای آماری و تابع چگالی توزیع فوت به پیشبینی سطوح مرگومیر خاص سنی پرداخته شده است. یک گشتاور آماری یکی از مشخصههای توزیعی که به آن تعلق دارد را توصیف میکند.اگرچه برای تعیین تابع چگالی یک توزیع، مجموع تمام گشتاورها بهصورت منحصر به فرد نیاز است اما داشتن اطلاعات در مورد تمام گشتاورها تا بینهایت امری غیرممکن است . روش ارائه شده در این بخش مسئله گشتاور متناهی را در نظر میگیرد که در آن چگالی مثبت، را میتوان با کمک تعداد محدودی از گشتاورها بهدست آورد. ما چند گشتاور مشاهده شده از توزیع سن در زمان فوت را ارزیابی میشود تا با استفاده از مدلهای سری زمانی چندمتغیره به پیشبینی آنها پرداخته شود و توزیع پیشبینی را با استفاده از رویکرد ماکسیمم آنتروپی ارائه شده توسط مید و پاپانویکا (۱۹۸۴) که بر میانگین نرخ تولید اطلاعات تصادفی یعنی آنتروپی اطلاعات تکیه دارد، بازسازی میشود.
12) مشکل گشتاور متناهی
بازسازی چگالی احتمال ، که تنها تعداد محدودی از گشتاورهای آن مشخص است، کار سادهای نیست و در ادبیات ریاضی بهعنوان مسئله گشتاور متناهی شناخته میشود. اخیراً روشهای زیادی برای حل این مشکل پیشنهاد شده است، اما در حالت کلی هدف تمام روشها ساخت دنبالههای خاصی از توابع است که در نهایت به توزیع واقعی همگرا شوند، زیرا تعداد گشتاورهای به بینهایت میل میکنند بهعبارتی تابعی را باید یافت که گشتاور اول آن با گشتاورهای واقعی برابر باشد.
در ابتدا قیود مورد نیاز برای چگالی را بیان میشود:
با توجه به تابع گشتاور آماری داریم:
در رابطه (8)، تعداد محدودیتهای گشتاوری، ها گشتاورهای مشخصه و برآورد نمونهای امین گشتاور خام است. رابطه (8) شامل معادله است که در آن از تابع چگالی بهدست میآیند.
معمولاً از 3 تا 6 گشتاور برای پیدا کردن تناسب خوبی از چگالی واقعی استفاده میشود. در این قسمت از بازسازی ماکسیمم آنتروپی و الگوریتمهای توسعه یافته بهعنوان یک روش مشخص برای ساخت دنبالهای از تقریبها نزدیک به چگالی واقعی پیروی میکنیم.
این روش براساس آنتروپی اطلاعات داده شده وابسته به تابع چگالی است. بهطوری که تابع ، ماکسیمم شود.
و بهترتیب حداقل و حداکثر سن هستند. لازم به ذکر است در این بخش از گشتاورهای خام استفاده شده است.
آنتروپی تابع چگالی یک تابع مقعر بر حسب بوده و دارای ماکسیمم است. حال از روش لاگرانژ اویلر برایامین گشتاور میتوان نوشت:
با استفاده از معادله اویلر
یا
رابطه ، فرم کلی تابع چگالی احتمال ماکسیمم آنتروپی[5] (ME) است.
برای پیدا کردن یک شکل عمومی از چگالی، ME معادله را در تابع لاگرانژ جایگزین کرده و مجددا بررسی میکنیم
از طرفی امین گشتاور خام را میتوان بهصورت زیر بازنویسی کرد:
با توجه به دانستن اولین گشتاور از بین تا گشتاور موجود، معادلات و را باید بهعنوان یک معادله غیرخطی از معادله برای ضرایب لاگرانژ در نظر گرفت. با توجه به اینکه در تابع چگالی نرمال شده ، اولین گشتاور همواره برابر با 1 است، با توجه به رابطه خواهیم داشت:
با توجه به رابطه اولین ضریب لاگرانژ بر حسب ضرایب باقیمانده لاگرانژ بهدست میآید.
و با توجه به روابط و خواهیم داشت:
برای حل ضرایب لاگرانژ از روش نیوتن رافسون استفاده میشود
که در آن مقدار عددی گشتاور واقعی است.
برای حل ضرایب لاگرانژ از روش نیوتن رافسون، از روش بههنگامسازی متوالی استفاده میشود
که شیب
و ماتریس هسین
به دلیل اینکه ماتریس هسین در همه جا محدب و مثبت معین است، جوابی منحصربهفرد برای معادله فوق وجود دارد. مزیت این روش به این دلیل است که موضوع حداکثرسازی اندکی از محدودیتهای گشتاوری را میتوان به آسانی روش الگوریتم نیوتن رافسون انجام داد.
13) ایده ماکسیمم آنتروپی و الگوریتم مدلسازی مرگومیر
ایده این مدل برای پیشبینی ساده است. سطوح مرگومیرخاص سن برای یک جمعیت در زمان آینده، با برونیابی تعداد محدودی از گشتاورهای آماری ارائه شده توسط شاخص توزیع سن در زمان فوت جدول مرگومیر تعیین میشود. برای برونیابی، از مدلهای سری زمانی چندمتغیره استفاده میشود و توزیع سن در زمان فوت در هر زمان دلخواه از گشتاورهای پیشبینی شده با استفاده از الگوریتم MEبهدست میآید. در ابتدا گشتاورهای ترتیبی سوم به بعد نرمال میشوند و یک تبدیل لگاریتمی به مقادیر مطلق تمام گشتاورهای مشاهده شده اعمال میشود. استفاده از مقادیر مطلق گشتاورهای مشاهده شده، تضمینی برای مثبت بودن معیارهای شکل مربوطه در هر افق پیشبینی است. شاخص دوره مورد استفاده در پیشبینی، با تفاوت مرتبه اول گشتاورهای مرکزی مشاهده شده به این صورت است
از یک قدم زدن چندمتغیره به همراه بردار پارامترهای رانش، برای سنجش پویایی شاخصهای دوره چندگانه استفاده میکنیم.
که و. همچنین نشان دهنده ماتریس فاکتورسازی چولسکی از ماتریس واریانس کوواریانس است. پارامترهای به روش کمترین مربعات معمولی برآورد میشوند.
الگوریتم مدلسازی مرگومیر
برازش مدلها شامل:
مدل لی کارتر مدل رینشو هابرمن مدل APC مدل CBD مدل CMI مدل پلیت
مدل هیندمن اولا مدل لیلی ماکسیمم آنتروپی با ۴، ۵ و ۶ گشتاور مدل قدم زدن تصادفی
روش تحقیق و دادهها
یکی از روشهای جدید مبتنی بر توزیع سن در زمان فوت، استفاده از شکل تابع چگالی و گشتاورهای آماری است که با استفاده از گشتاورهای آماری و تابع چگالی توزیع فوت به پیشبینی سطوح مرگومیر خاص سنی میپردازد (Pascariu, Lenart and Canudas-Romo, 2019),روش سری زمانی برای برونیابی تعداد محدودی از گشتاورها استفاده میشود و به کمک گشتاورهای برونیابی شده به بازسازی توزیع سن در زمان فوت با کمک روش ماکسیمم آنتروپی پرداخته میشود. این روش بر میانگین نرخ تولید اطلاعات توسط یک منبع تصادفی داده یا تابع چگالی، یعنی آنتروپی اطلاعات تکیه دارد.
در این مقاله از دادههای مرگومیر کشور ایران برای مدلسازی و پیشبینی نرخ فوت استفاده شده است. دادههای واقعی شامل تعداد فوتیها و جمعیت کشور (مرگومیر) ایران، برای ۹ سال متوالی (۱۳۹۰-۱۳۹۸) و برای بازه سنی ۰ تا ۱۰۰ سال و به تفکیک هر دو جنسیت است که به ترتیب از سازمان ثبت احوال کشور و مرکز آمار ایران اخذ شده است. در ابتدا دادهها به دو بازه تقسیم میشوند. پنجره پسرو شامل دادهها از سال ۱۳۹۰ تا ۱۳۹۵ است و پنجره پیشرو شامل دادههای سه سال پایانی ۱۳۹۷ تا ۱۳۹۸ است. در ادامه تمامی مدلهای مرگومیر تصادفی مبتنی بر نرخ فوت و توزیع سن در زمان فوت بر روی پنجره پسرو پیادهسازی میشوند و برای تجزیه و تحلیل برازش مدلها از آنها استفاده میشود. سپس در پنجره پیشرو به پیشبینی نرخهای فوت خام براساس روش نمونهگیری خارج از نمونه پرداخته میشود و نرخهای فوت خام مشاهده شده با نرخهای فوت خام پیشبینی شده برای هر یک از مدلها با هم مقایسه میشوند و با توجه به معیارهای خطای معرفی شده در این بخش، خطای گزارش شده هر مدل در قالب جدول ارائه میشود. در نهایت با توجه به خطای گزارش شده، قدرت پیشگویی مدلها با هم مقایسه میشوند و بهترین مدل تصادفی برای پیشبینی نرخ فوت کشور ایران برحسب جنسیت معرفی میگردد.
برای مقایسه دقت پیشبینی مدلها از معیارهای ارزیابی زیر استفاده شده است. شایان ذکر است که در این مقاله
حداکثر سن مورد بررسی و تعداد سالهای پیشبینی شده است که در واقع فاصله بین نرخ فوت خام مشاهده شده و پیشبینی شده است. همچنین حداکثر سن مورد بررسی برای تمامی افراد ۱۰۰ سال است و در سالهای ۱۳۹۶ تا ۱۳۹۸ اختلاف نرخ فوت پیشبینی شده با نرخ فوت واقعی محاسبه میشود. قابلتوجه است خطاهای معرفی شده وابسته به داده مورد بررسی هستند و همچنین معیارهای ارزیابی دقت برمبنای هستند و نمیتوان از آنها برای مقایسه سریهایی که در مقیاسهای مختلف هستند استفاده کرد. در این مقاله ۷ معیارهای ارزیابی خطا در سه طبقه (خطاهای وابسته به مقیاس[6]، درصد خطا [7]و خطاهای مقیاس شده[8]) تعریف شده است.. زیرا ارزیابی دقت پیشبینی را تنها میتوان با در نظر گرفتن عملکرد یک مدل بر روی دادههای جدیدی که هنگام برازش مدل استفاده نشده است، تعیین کرد و توجه به اینکه یک مدل چقدر با دادههای تاریخی مطابقت دارد، کافی نیست. هنگام ارزیابی مدلها، استفاده از بخشی از دادههای موجود برای آزمایش (برازش)[9] و استفاده از بقیه دادهها برای تخمین یا آموزش(پیشبینی)[10] مدل رایج است. سپس دادههای آزمایشی را میتوان برای اندازهگیری میزان احتمال پیشبینی مدل بر روی دادههای جدید مورد استفاده قرار داد. اندازه مجموعه دادههای استفاده شده برای برازش مدل معمولاً حدود 20٪ از کل نمونه است، اگرچه این مقدار به مدت زمان نمونه مورد بررسی و افق پیشبینی بستگی دارد. تعداد سالهای در نظر گرفته شده برای برازش مدل، در حالت ایدهآل باید حداقل به اندازه حداکثر افق پیشبینی مورد نیاز باشد. شایان ذکر است که برازش معقول یک مدل با دادهها به معنی پیشبینی خوب آن مدل نیست و به کمک مدلی با تعداد پارامترهای کافی میتوان به برازش خوبی از مدل دست پیدا کرد.
الف- میانگین قدرمطلق خطا: در آمار، میانگین قدرمطلق خطا (MAE) معیاری از خطاهای بین مشاهدات زوجی است که یک پدیده را بیان میکنند. این تابع زیان بدون در نظر گرفتن علامت، از فاصله بین مقادیر پیشبینی شده و واقعی بهعنوان معیار استفاده میکند. زمانی که داده پرت یا دورافتاده در مشاهدات وجود داشته باشد، استفاده از تابع زیان میانگین قدرمطلق خطا کارایی بالایی دارد. همچنین درک و محاسبه این معیار برای مقایسه پیشبینیهای صورت گرفته در یک مجموعه داده آسان است (شعاعی و کشمرزی، ۱۴۰۱ وChen, Z., Yang, 2004 ).
ب- ریشه میانگین مربعات خطا: میانگین تفاوت بین مقادیر پیشبینی شده توسط یک معیار و مقادیر واقعی را اندازهگیری میکند و تخمینی از اینکه مدل مورد نظر چقدر قادر به پیشبینی مقدار هدف (دقت) است را ارائه میکند.
ج- میانگین مربعات خطا: تابع زیان میانگین مربعات خطا، بهعنوان میانگین اختلاف بین مقادیر واقعی و تخمینی تعریف میشود.
د- خطای مطلق نسبی:
ه- خطای استاندارد باقیمانده:
و- میانگین درصد قدرمطلق خطای متقارن: یک معیار اندازهگیری دقت براساس درصد خطا است. در این تابع زیان نیز بدون در نظر گرفتن علامت، تفاوت بین مقادیر پیشبینی شده و واقعی بر نصف مجموع مقادیر مطلق واقعی و پیشبینی شده تقسیم میشود.
ز- میانگین درصد قدرمطلق خطا: که انحراف میانگین درصد مطلق نیز نامیده میشود، دقت یک سیستم پیشبینی را اندازه میگیرد. این دقت را بهصورت درصد اندازهگیری میکند و میتواند بهعنوان میانگین درصد خطای مطلق برای هر دوره زمانی منهای مقادیر واقعی تقسیم بر مقادیر واقعی محاسبه شود.
در معیارهای ارزیابی مبتنی بر درصد خطا اگر مقدار مشاهده شده داده مورد بررسی، صفر باشد آنگاه نتیجه در مجموعه تست بینهایت یا تعریفنشده است، و زمانی که هر مقدار واقعی داده نزدیک به صفر باشد، مقادیر بزرگی گزارش میشود(Chen, Yang, 2004 and Canudas, 2010)
یافتهها
باتوجه به نمودار ۱ جمعیت نوزادان (۰ تا ۱) ساله در سال ۱۳۹۰ مرگومیر بیشتری را نسبت به سال ۱۳۹۸ تجربه کردهاند. همچنین در سال ۱۳۹۰، ۱۰ درصد از جمعیت مردان تا قبل از ۵۶ سالگی فوت کردند درحالیکه این عدد در سال ۱۳۹۸ به ۶۰ سال افزایش پیدا کرده است. بیشترین فراوانی فوت در سال ۱۳۹۰ مربوط به مردان ۸۶ ساله است و این آمار برای سال ۱۳۹۸ مربوط به ۸۷ سالگی است. واضح است با در دست داشتن دادهها با بازهی طولانیتر درک ما از روند الگوی مرگومیر بیشتر خواهد بود. قابلتوجه است در تمامی ۹ سال داده مشاهده شده تنها ۱۰ درصد از جمعیت مردان ایران شانس زندگی کردن پس از حدود ۹۲ سالگی را داشتهاند. حداکثر سن در سال ۱۳۹۰ نسبت به سال ۱۳۹۸ کمی بیشتر است که میتوان علت آنرا شیوع بیماری کرونا در نظر گرفت. همچنین ۸۰ درصد از جمعیت در تمامی ۹ سال مورد بررسی در حدود بازه سنی (۶۰- ۹۲) سال زندگی کردهاند و بنابراین طبق الگوی سنی مشاهده شده میتوان گفت بیشترین تعداد فوتی مربوط به گروه سنی میانسالان و سالمندان است.
نمودار ۱: توزیع سن مشاهده شده در زمان فوت برای جمعیت مردان ایران در سالهای ۱۳۹۰ تا ۱۳۹۸
نمودار۲، نشان میدهد در سال ۱۳۹۰، ۱۰ درصد از جمعیت زنان تا قبل از ۶۵ سالگی فوت میکردند و این عدد در سال ۱۳۹۸ به حدود ۶۷ سال افزایش یافته است. همچنین ۱۰ درصد از جمعیت سالمندان در سال ۱۳۹۰ شانس زندگی تا ۹۵ سال را داشتند و این عدد برای سال ۱۳۹۸ در حدود ۹۳ سال است. بیشترین تعداد فوت مشاهده شده در سال ۱۳۹۰ مربوط به سن ۸۴ سال است که در سال ۱۳۹۸ به سن ۸۷ سال افزایش پیدا کرده است. همچنین با مقایسه نمودار ۱ و ۲ نتیجهگیری میشود که طول عمر زنان ایران از مردان ایران بیشتر است.
نمودار ۲: توزیع سن مشاهده شده در زمان فوت برای جمعیت زنان ایران در سالهای ۱۳۹۰ تا ۱۳۹۸
در این پژوهش، عملکرد روش مدل ماکسیمم آنتروپی با (چهار، پنج و شش) گشتاور که براساس مدلسازی فراوانی مرگومیر در توزیع سن در زمان فوت است، با ۹ مدل مرگومیر تصادفی که بر مدلسازی نرخ لگاریتم فوت̸ مرگومیر تأکید دارند، مقایسه میشود. از آنجاییکه همیشه میتوان، برازش کامل دادهها را با استفاده از مدلی با پارامترهای کافی بهدست آورد و با توجه به اینکه برازش خوب لزوماً به معنای عملکرد خوب پیشبینی نیست (هیندمن و اولاه، ۲۰۰۷)، مدلها براساس توانایی آنها در برازش دادههای تاریخی ارزیابی نخواهند شد و مدلها براساس عملکرد پیشبینی خارج از نمونه بر روی دادههای مشاهده شده آزمایش میشوند. بدین صورت که نرخ فوت خام پیشبینی شده در پنجره پیشرو برای سالهای ۱۳۹۸−۱۳۹۷ با نرخ فوت خام مشاهده شده در همین دوره مقایسه میشوند و با توجه به معیارهای ارزیابی خطا نتایج آنها در جداول 2 و 3 ارائه میشود.
در جدول (2) اعداد مربوط به نرخ فوت خام برای جمعیت مردان ایران، تحت ۷ معیار ارزیابی برازش مدل مختلف برای مدلهای مرگومیر تصادفی معرفی شده در این مطالعه قابل مشاهده است. شایان ذکر است تمامی اعداد در ۱۰۰ ضرب شدهاند. برای تمامی معیارهای خطا، مقدار کوچکتر بر مقدار بزرگتر برتری دارد. برای محاسبه رتبه نهایی مدل مجموع رتبهها در هر یک از معیارهای ارزیابی با هم جمع میشوند و در نهایت از کوچک به بزرگ با شماره ۱ تا ۱۲ مشخص میشوند. لذا همانطور که واضح است، مدل لیکارتر تقریباً عملکرد بهتری را نسبت به سایر مدلهای تصادفی در میان جمعیت مردان داشته است. براساس دو معیار میانگین درصد قدرمطلق خطای متقارن و ریشه میانگین مربعات خطا مدل لیکارتر رتبه دوم را در بین ۱۲ مدل کسب کرده است و با اختلافی جزئی بهترتیب مدل هیندمن اولا و مدل پلیت رتبه نخست را در دو معیار خطای ذکر شده دارند. براساس ۵ معیار ارزیابی برازش مدل دیگر یعنی (میانگین قدرمطلق خطا، میانگین درصد قدرمطلق خطا، میانگین مربعات، خطای مطلق نسبی و خطای استاندارد باقیمانده) مدل لیکارتر رتبه نخست را دارد. بهصورت کلی میتوان نتیجه گرفت مدل لیکارتر رتبه نخست و مدل هیندمن اولا، رتبه دوم را در بین مدلهای مورد مقایسه دارد. شایان ذکر است به دلیل کوچک بودن اعداد جداول ۲ و ۳ برای سهولت مقایسه ظاهری، تمامی اعداد در ضرب شدهاند.
در حین پیادهسازی هریک از مدلها باید به ۳ نکته دقت داشت که ۱- آیا مدل توانایی تولید مسیرهای نمونه را دارد یا خیر؟ عدماطمینان به فرآیندی که مسیرهای نمونه تصادفی را ایجاد میکند، برای کارهایی نظیر قیمت گذاری ابزارهای مالی مرتبط با طول عمر و تدوین استراتژیهای مربوط به حمایت از امنیت ضروری است، که تمامی مدلها در این قسمت خوب عمل کردهاند. 2- مهم است که اگر اثرات گروهی وجود دارد و باید تمام محدودیتهای آن را بررسی شود که در بخش قبل توضیح داده شده است. 3- ساختار همبستگی با اهمیت: در حقیقت این ویژگی توانایی تولید یک ساختار همبستگی غیرارادی بین تغییرات سال به سال در میزان مرگ ومیر در سنین مختلف را بررسی میکند. تجزیه و تحلیل آماری از میزان مرگومیر به تغییرات در در سنین مختلف که میزان در ارتباط هستند، اشاره دارد. ساختار همبستگی زمانی بی اهمیت است، که ارتباط کاملی بین تغییرات در میزان مرگومیر در سنین مختلف از یک سال به سال دیگر وجود داشته باشد. بهعنوان مثال در مورد مدل لیکارتر، در جایی که یکسری فرآیند سری kt وجود دارد، که این مورد را نشان میدهد. برای مدل های، لی و کارتر و رینشو و هابرمن ما در تمام سنین به جز در سنین جوانی ارتباط کاملی بین سنین داریم، جایی که اثر تصادفی اضافهای ناشی از ورود یک گروه جدید با اثر گروهی ناشناخته است. مدلهای خانواده CBD امکان ایجاد یک همبستگی غیرساختاری را فراهم میآورند، زیرا همه آنها بیش از یک عامل اساسی مخاطره دورهای را دارند.
در جدول ۳ نرخ فوت خام مربوط به جمعیت زنان ایران، تحت ۷ معیار سنجش خطا ارائه شده است. همانطور که مشخص است مدل کوری رتبه نخست را در بین مدلهای معرفی شده برای پیشبینی نرخ فوت خام دارد و پس از آن مدل پلیت رتبه دوم را اخذ میکند. براساس دو شاخص (میانگین قدرمطلق خطا و میانگین درصد قدرمطلق خطای متقارن) مدل پلیت و براساس معیار خطای استاندارد باقیمانده، مدل رینشو هابرمن عملکرد نسبتاً بهتری نسبت به سایر مدلهای مرگومیر دارند.
با مقایسه جدول ۲ با جدول ارائه شده در مقاله (شعاعی و کشمرزی، ۲۰۲۱) درمییابیم که جدول معرفی شده در این مقاله، خطاهای کوچکتری را برای مدلهای مشابه با معیار ارزیابی خطاهای یکسان گزارش میکند.
در ادامه همچنین به مقایسه احتمال مرگومیر جداول (88-90TD فرانسه) و (1400ILT ایران) که در شرکتهای بیمه مورد استفاده قرار میگیرند با نرخ مرگومیر پیشبینی شده در این مقاله برای سالهای ۱۴۰۰ و ۱۴۰۱ پرداخته شده است.
شکل ۳. مقایسه نرخ مرگومیر جداول عمر مختلف با نرخ مرگومیر پیشبینی شده در سال ۱۴۰۰ براساس بهترین مدل انتخابی
رنگ آبی مربوط به جدول TD88-90، مشکی مربوط به جدول ILT1400، قرمز مربوط به پیشبینی مدل انتخابی لی کارتر برای جمعیت مردان در سال ۱۴۰۰ و رنگ سبز مربوط به پیشبینی مدل انتخابی کوری برای جمعیت زنان در سال ۱۴۰۰ است.
همانطور که مشخص است جدول TD88-90 نرخ مرگومیر بیشتری را نسبت به بقیه جداول گزارش میکند. همچنین نرخ مرگومیر گزارش شده از مدل لی کارتر نسبت به جدول ILT1400 مقدار کمتری را به جز در دو بازه سنی (۱۶- ۲۶) و (۹۰-۹۹) سال نشان میدهد. همچنین با مقایسه نرخ مرگومیر بهدست آمده از پیشبینی مدل کوری و جدول1400ILT در مییابیم که جدول مرگومیر حاصل از بهترین مدل انتخابی برای زنان، مدل کوری در سال ۱۴۰۰ همواره عدد کوچکتری را نسبت به جدول کنونی ایران به جز در بازه ۷ ساله (۹۲-۹۹) سال گزارش میکند.
شکل ۴. مقایسه نرخ مرگومیر جداول موجود در ایران با نرخ مرگومیر پیشبینی شده در سال ۱۴۰۱ براساس بهترین مدل انتخابی
رنگ آبی مربوط به جدول TD88-90، مشکی مربوط به جدول 1400ILT، نارنجی مربوط به پیشبینی بهترین مدل انتخابی لیکارتر برای جمعیت مردان در سال 1401 و رنگ بنفش مربوط به پیشبینی بهترین مدل انتخابی کوری برای جمعیت زنان در سال ۱۴۰۱ است. با مقایسه نرخهای مرگومیر پیشبینی شده در سال ۱۴۰۱ براساس بهترین مدل انتخابی با جدول مرگومیر کنونی (ILT1400) در مییابیم که نتایج پیشبینی شده در تمامی بازهها به جز (۹۲-۹۹ سال) برای مدل انتخابی کوری، برای جمعیت زنان در سال ۱۴۰۱ و بازه سنی (۷۹-۹۹ سال) برای مدل لیکارتر، برای جمعیت مردان در سال ۱۴۰۱ مقادیر کوچکتری را گزارش میکنند. اگرچه جداول مرگومیر در تمام دنیا برای هرجنسیت بهصورت جداگانه تدوین میشود اما هیچ یک از جداول موجود در ایران علیرغم مزایای زیادی که به همراه دارند به تفکیک جنسیت ارائه نشده است. انتظار میرود با استفاده از جداول معرفی شده در این مقاله که براساس عملکرد بهترین مدل تصادفی مرگومیر در برازش و پیشبینی نرخ فوت به تفکیک جنسیت انتخاب شدهاند، محاسبات دقیقتری در بیمهعمر و مستمری به عمل آید.
بحث و نتیجهگیری
اگرچه افزایش طول عمر انسان بدون شک یکی از برجستهترین دستاوردهای جوامع مدرن است با این حال بهبود در بقا و همچنین کاهش باروری باعث ایجاد روند سالخوردگی در جمعیت سراسر جهان شده است. در نتیجه، بخشهای دولتی و خصوصی برای ارائه محصولات بازنشستگی و مراقبتهای بهداشتی سالمندان با چالشهای زیادی مواجه شدند. عواقب این دو معضل بهگونهای است که صنعت مالی برای اشاره به این موضوع اصطلاح ریسک طول عمر را به کار برده است. به این معنا که اگر بازنشستگان (بهطور متوسط) بیشتر از حد انتظار زندگی کنند. مؤسسه با خروج پولی بیشتر از ذخایر برنامهریزی شده خود مواجه خواهد شد. تفاوتهای کوچک بین طول عمر محقق شده و پیشبینی شده بازنشستگان، در بازار مالی ضررهای بسیار بزرگی را به وجود میآورد. به این ترتیب، نیاز به مدلهای نوآورانهای که بتواند سیر مرگ ومیر آینده را با دقت بیشتری نسبت به رویکردهای قبلی پیشبینی کند، مشهود است. بهمنظور پیشبینی مناسب نرخ فوت جمعیت و با توجه به اینکه مرگومیر یک فرآیند پویا است که با گذشت زمان دستخوش تغییرات میشود، در این مقاله علاوه بر مدلهای تصادفی کلاسیک از خانواده مدلهای مربوط به توزیع سن در زمان فوت نیز برای پیشبینی نرخ فوت استفاده شده است.
در این پژوهش به انتخاب بهترین مدل مرگومیر تصادفی برای پیشبینی نرخ فوت ایران به تفکیک جنسیت و براساس دادههای واقعی پرداخته شده است. در واقع برای انجام این کار از ۹ مدل تصادفی مبتنی بر پیشبینی نرخ فوت/ نرخ مرگومیر و مدل ماکسیمم آنتروپی مبتنی بر پیشبینی فراوانی فوت استفاده شده است. برای ارزیابی قدرت پیشگویی هریک مدلها از 7 معیار ارزیابی مدل استفاده شده است. براساس بازه مورد نظر (۰-۱۰۰) سال مشخص شد که از بین ۱۰ مدل مورد بررسی، مدل تصادفی لیکارتر برای جمعیت مردان و مدل تصادفی کوری برای جمعیت زنان بهترین عملکرد را دارند، یعنی مدل دو عاملی و سه عاملی مبتنی بر خانواده مدلهای لیکارتر نتایج دقیقتری را ارائه کردهاند و بعد از آنها با اندکی اختلاف به ترتیب برای جمعیت مردان و زنان ایران مدل هیندمن اولا و مدل پلیت رتبۀ دوم را اخذ میکنند. در ادامه جداول عمر ایران باتوجه برای سال ۱۴۰۰ باتوجه به عملکرد پیشبینی مدل کوری و مدل لیکارتر به ترتیب برای جمعیت زنان و مردان ایران ارائه شد. همانطور که از جدول 4 و 5 مشخص است امید زندگی زنان بهطور متوسط 3 سال در سنین کودکی، 2 سال در سنین میانسالی و یکسال در سنین پیری از امید زندگی مردان بیشتر است، لذا الگوی کلی مرگومیر زنان با مردان متفاوت است. بنابراین بدیهی است که یک مدل برای هر دو جنسیت، عملکرد یکسانی نداشته باشد. همچنین در ادامه مقایسۀ نرخ مرگومیر پیشبینی شده در سالهای ۱۴۰۰ و ۱۴۰۱ با نرخ مرگومیر جداول عمر موجود در ایران انجام شد. از نتایج مقایسه اینگونه دریافت شد که در اکثر بازههای سنی نرخ مرگومیر پیشبینی شده (احتمال فوت) با توجه به عملکرد بهترین مدل، اعداد کوچکتری را نسبت به جداول عمر موجود در ایران گزارش میکنند. این موضوع برای صنعت بیمه و صندوقهای بازنشستگی از اهمیت خاصی برخوردار است. زیرا هرچه احتمال فرد بیمهشده کوچکتر باشد، فرد بیشتر عمر میکند و در بیمهنامههای عمر مختلط و بیمه عمر به شرط فوت میتوانیم حقبیمه کمتری را از فرد بیمهشده دریافت کنیم. کاهش حق بیمه میتواند یک عاملی برای افزایش تقاضای این محصول بیمهای باشد. همچنین در صدور بیمهنامههای عمر به شرط حیات به دلیل کاهش احتمال فوت و طولانیتر شدن مدت زمان برقراری بیمهنامه حق بیمه بیشتری باید از فرد بیمهشده اخذ شود.
در این پژوهش، بهمنظور مقایسه دقت پیشبینی مدلهای مرگومیر تصادفی، از شاخص نرخ فوت خام استفاده شده است. مشخص است که با تغییر شاخص مرگومیر و همچنین معیارهای ارزیابی مدل، نتایج متفاوتی حاصل میشود. سن معین در هنگام مرگ یکی از شاخصهایی است که اخیراً شناسایی شده است. سن معین در هنگام مرگ را بهعنوان اصلیترین و طبیعیترین ویژگی طول عمر انسان معرفی میکنند و برخلاف شاخص امید زندگی در بدو تولد، تنها تحت تأثیر مرگومیر بزرگسالان است و در نتیجه نسبت به تغییراتی که در میان جمعیت سالمند رخ میدهد حساستر است. در کشورهای با مرگومیر پایین که بیشتر فوتها در سنین بالا اتفاق میافتد، سن معین در هنگام مرگ به یک شاخص قوی تبدیل شده است. در نظر گرفتن این شاخص و یا دیگر شاخصهای جداول مرگومیر (امید زندگی در بدو تولد، نرخ مرگومیر، تعداد بازماندگان در سن x و ...) میتواند برای پژوهشهای آتی مفید باشد. همچنین به دلیل تاثیر کیفیت زندگی بر طول عمر انسان میتوان ضرایب تعدیلی را برای جدول عمر را به تفکیک محل سکونت (شهر و روستا) و استان محل سکونت در نظر گرفت.
تشکر و قدردانی
این مقاله برگرفته از پایان نامه کارشناسی ارشد نویسنده دوم مقاله در رشته بیمسنجی است که در دانشکده علوم ریاضی دانشگاه شهید بهشتی به انجام رسیده است. نویسندگان از حمایت مالی پارک فناوری اطلاعات و ارتباطات وزارت علوم، تحقیقات و فناوری در قالب کد اعتباری ۰۰۰۵۵۳ − ۰۱ − ۰۰ − ۰۲ قدردانی مینمایند.
[1]. Half-Normal
[2]. Skew-bimodal-Normal distribution
[3]. Carins-Blake-Dowd
[4]. Cairns
[5]. Maximum Entropy
[6]. Scale-dependent Errors
[7]. Percentage Errors
[8]. Scaled Errors
[9]. Testing
[10]. Training