نوع مقاله : مقاله پژوهشی
عنوان مقاله English
نویسندگان English
Various studies have examined the transformations of marriage at the national and regional levels, but there are still unknowns at the provincial level within the country. The purpose of this article is to investigate the universality of women's marriage in the provinces of the country using the survival random forest method, one of the common algorithms in machine learning. Using the household expenditure and income survey data from 2008 to 2019, the general status of women's marriage was investigated by defining a threshold level (marriage rate less than 95% for women aged 45-49). The findings of this research indicate that, among the research variables, high school and university education levels had the greatest impact on reducing the universality of women's marriages. The proportion of urbanization in each province is another influential variable in reducing the universality of women's marriages. Out of the total of 31 provinces of the country, 11 provinces still had the universality of marriage until the end of the study period, but the marriage rate of women aged 45-49 in other provinces has decreased to below 95%. The high marriage rates in most of the provinces that do not enjoy the universality of marriage now indicate the existence of a suitable platform for facilitating marriage and expanding its universality in the country. Otherwise, it is expected that this trend will continue to decrease in the future.
کلیدواژهها English
مقدمه و بیان مسئله
گمانهزنیها درباره علل تأثیرگذار بر تاخیر ازدواج زنان در ادبیات جمعیتشناسی و سایر رشتهها بسیار است. در جمعیتشناسی اما بهواسطه نقش مستقیم ازدواج بر تحولات باروری، به ازدواج زنان و تغییرات آن توجه ویژهای شده است. افزایش قابلتوجه در دستیابی به فرصتهای تحصیلی زنان در سالهای بعد از انقلاب همگام با ورود نسلهای متولدین دوره بیشزایی[1] به سن ازدواج و باروری، مطالعه نقش تحصیلات در اثرگذاری بر تغییرات ازدواج و باروری را به مقصدی مهم برای محققان تبدیل کرده است. رشد جمعیت تحصیلکردهها و تغییر ترکیب جمعیت بیسواد به نفع جمعیتی که نسبت به گذشته باسوادتر است، یکی از دلایل مهم در توجه ویژه به نقش تحصیلات است. هر چند تحصیلات به خودی خود در کاهش یا افزایش باروری فرضیه تأیید شدهای به شمار میرود، اما بیشتر از طریق افزایش سن ازدواج و زمانبندی[2] فرزندآوری به خصوص در کشورهای دارای میزان بالای باروری نکاحی عمل میکند (Jones and Gubhaju, 2009). در همین راستا، در دهههای اخیر فرضیات متعددی در خصوص نحوه تأثیر تحصیلات بر خانواده و ازدواج و رابطه آن با تحولات جمعیتی شکل گرفته است.
در دهههای اخیر، تحولات اقتصادی و اجتماعی در کنار گذار جمعیتی، همانند سایر نهادها، نهاد خانواده و ازدواج را نیز تحت تأثیر قرار داده است. از دیدگاه نظریهپردازان نوسازی، تحولات در خانواده به تغییرات در زندگی اجتماعی وابسته است که متأثر از سه جریان صنعتی شدن، شهرنشینی و آموزش همگانی است. بنابراین، تغییرات ساختار خانواده و ازدواج در انطباق با تغییرات شرایط اجتماعی و اقتصادی صورت گرفته است (عباسی شوازی و صادقی، ۱۳۸۴). با توجه به این تغییرات، در بسیاری از نقاط دنیا سن ازدواج تغییر کرده است و همگام با شرایط جامعه هر روز در حال تغییر است (Bloom, 2020). در نتیجه در بسیاری از نقاط دنیا در چند سال اخیر، بخش قابل توجهی از تحقیقات معطوف به دگرگونیهای ازدواج و خانواده بوده است (Muhsam, 1974;Malhutra, 1997; Torabi and Baschieri, 2010; Rallu, 2006; Lampard, 2013; Sabbah-Karkaby and Stier, 2017; Bhrolchain, 2001). در ایران نیز، میانگین سن ازدواج بار اول زنان و مردان از سال ۱۳۴۵ تا ۱۳۹۵ تغییرات قابل توجهی داشته است به طوری که این مقدار برای مردان از ۲۵ سال در سال ۱۳۴۵ به ۲۷ سال در سال ۱۳۹۵ رسیده و برای زنان نیز از ۱۸ سال در سال ۱۳۴۵ به ۲۳ سال در سال ۱۳۹۵ افزایش یافته است (فتحی و همکاران، ۱۳۹۶). همانطور که مشاهده میشود تغیرات در میانگین سن ازدواج برای هر دوجنس رخ داده است، اما برای زنان محسوستر بوده چرا که میانگین سن ازدواج در مردان، ۲ سال و در زنان ۵ سال افزایش یافته است.
بررسیها در تبیین عوامل افزایش سن ازدواج به خصوص برای زنان در دهههای قبل نقش مؤثر تحصیلات و عوامل اقتصادی را نشان میدهد (ترابی و شمس قهفرخی، ۱۴۰۰). آموزش و تحصیلات میتواند زنان را در معرض بسیاری از ایدهها و نگرشهای جدیدی قرار دهد که به نوعی آنها را از ازدواج دور میکند (Ikamari, 2005; Zhao, 2017). بنابراین بخش قابلتوجهی از تأخیر در ازدواج زنان مربوط به تغییرات نگرشی حاصل از تحصیلات است. بهطوریکه زنان با تحصیلات بالا کمتر در سنین پایینتر ازدواج میکنند و اوج ازدواج آنان در سنین بالاتر است (Goldestein and Kenny, 2001). این تغییر الگوی سنی ازدواج از سنین پایین به سنین بالاتر شاید مهمترین خروجی اثر تحصیلات بر ازدواج زنان باشد. به عبارت دیگر، با افزایش نسبت زنان تحصیلکرده در مقایسه با گذشته بخش قابلتوجهی از بازار ازدواج منعکس کننده الگوی ازدواج زنانی است که هم تحصیلکرده هستند و هم الگوی ازدواج متأخری را تجربه میکنند. نسبتهای متفاوت تحصیلی و شغلی در میان مردان و زنان، علاوه بر تأثیرگذاری بر بازار ازدواج میتواند به الگوی ازدواج متفاوت در یک جامعه تبدیل شود. برای مثال وجود مضیقه ازدواج در افراد تحصیلکرده باعث میشود برخی از این افراد با گروههای سنی دیگر و حتی نژادهای دیگر ازدواج کنند (Hirchman and Matras, 1971). این الگوی متأخر ازدواج زنان در سالهای اخیر دغدغه علمی و سیاستگذاری مهمی را مبنی بر تأخیر در ازدواج زنان و در نهایت کاهش ازدواج در ایران ایجاد کرده است. یافتههای رازقی نصرآباد و رحیمی (۱۳۹۳) افزایش میانگین سالهای تجرد زنان و مردان ایران در طول دورههای ۱۳۸۵ و ۱۳۹۰ و نقش تأثیرگذار تحصیلات در این زمینه را نشان میدهد. همچنین بسیاری از تحقیقاتی که در ایران در تبیین ازدواج زنان انجام شده است به نقش تحصیلات تأکید کردهاند (کاظمیپور، ۱۳۸۳؛ رضادوست و ممبنی، ۱۳۹۰: رحیمی و همکاران، ۱۳۹۴: محمودیان،۱۳۸۳؛ Torabi et al., 2013).
در کنار تحصیلات متغیرهای دیگری را نیز میتوان برشمرد که بر روند تغییرات ازدواج زنان ایران مؤثر بودهاند. ویژگی متفاوت شهرهای صنعتی، فضای شغلی و دستیابی متفاوت به امکانات مختلف میتواند منجر به شکلگیری انواع جدید خانواده و نوع متفاوت ازدواج به خصوص برای زنان باشد (Puschmann and Solli, 2014). با گذشت چندین دهه از تحولات اقتصادی اجتماعی ایران، تحقیقات مختلف نشاندهنده اثر این تغییرات بر الگوی ازدواج است. با گسترش شهرنشینی در ایران، میانگین سن در ازدواج اول برای افراد شهرنشین به مراتب بالاتر از این مقدار در مناطق روستایی است (بگی، ۱۴۰۱). شهرنشینی در بسیاری از نقاط ایران به معنای ایجاد فرصتهای تحصیلی و شغلی بیشتر به خصوص برای زنان است. بنابراین، افزایش سالهای حضور در مدرسه برای زنان مناطق شهری به طور قابل توجهی بیشتر از زنان روستایی است. در نتیجه، الگوی ازدواج زنان در مناطق روستایی و شهری نشان میدهد که زنان روستایی در ایران بسیار زودتر از زنان شهری ازدواج میکنند (Saadati and Bagheri, 2017). همچنین استقلال زنان، میزان بیکاری مردان و وضعیت اشتغال زنان نیز از عوامل مهم تأخیر در ازدواج دختران در بین شهرستانهای کشور به شمار میرود (حسینی و همکاران، ۱۳۹۷). تفاوت سن ازدواج زنان بر حسب فعالیت آنان ممکن است ناشی از آن باشد که زنان شاغل احتمال ازدواج در سنین بالاتر را نیز برای خود متصور هستند لذا در انتخاب همسر وسواس بیشتری به خرج میدهند و همین امر به دیر ازدواج کردن آنان خواهد انجامید (عسکریندوشن و همکاران، ۱۳۹۷).
علاوه بر ویژگیهای اقتصادی-اجتماعی که در بالا بدان اشاره شد، ویژگیهای فرهنگی و تفاوتهای نگرشی مهمی وجود دارد که میتواند تبیین کننده تغییرات ازدواج زنان در ایران باشد. در بافت فرهنگی و قومی
بنابر آنچه که در بالا گفته شد، فضای کلی تحقیقات داخلی و خارجی در خصوص عوامل مؤثر بر تغییرات ازدواج زنان به خوبی روشن است. تحصیلات زنان یکی از مهمترین عواملی است که در کاهش و تأخیر ازدواج زنان بدان تاکید شده است. در کنار تحصیلات، شهرنشینی و عوامل اقتصادی و فرهنگی نیز توانسته بخشی از دگرگونیهای ازدواج زنان را تبیین کند. با این وجود، بخش مبهم ماجرا به تفاوتهای استانی و نقش این عوامل بر تغییرات ازدواج زنان در سطح استانهای کشور برمیگردد. در سطح کلی برآوردها از کاهش عمومیت ازدواج و در نتیجه افزایش تجرد قطعی زنان در سالهای آینده خبر میدهد (کوششی و خلیلی، ۱۳۹۹). در سطح شهرستان استانهای کشور نیز برخی از مطالعات بر تفاوت در نسبتهای تجرد صحه گذاشتهاند. نتایج تحلیلها در سطح شهرستانهای کشور نشان میدهد که شهرستانهای غرب و جنوب غرب کشور بیشترین میزان تجرد و شهرستانهای مرکز و شمال شرق کشور کمترین میزان تجرد در دو جنس را تجربه میکنند (امامی و همکاران، ۱۴۰۰). اما در سطح استانی اطلاعات دقیقی درباره این موضوع در دسترس نیست. مقاله حاضر با تکیه بر چنین خلاء پژوهشی، سعی در بررسی عوامل تأثیرگذار بر تغییرات ازدواج زنان در سطح استانهای کشور دارد. سوال اصلی این پژوهش آن است که عواملی که در مطالعات پیشین در تبیین تغییرات ازدواج بدان اشاره شده است آیا در سطح استانی هم صادق است؟ همچنین استانهای مختلف چه تفاوتی در تجربه چنین تغییراتی دارند. فرض اصلی این مطالعه آن است که، استانهای مختلف بهواسطه سطح توسعهیافتگی و شرایط فرهنگی-اجتماعی مختلف ممکن است تجربه متفاوتی از تغییرات ازدواج زنان و تأثیرپذیری از متغیرهای مهم در این زمینه داشته باشند.
روش و دادههای تحقیق
روش پژوهش حاضر تحلیل ثانویه دادههای موجود است. دادهها و مدل در زبان برنامهنویسی پایتون[3] نوشته و اجرا شده است. برای بررسی تغییرات عمومیت ازدواج در بین استانهای کشور از دادههای طرح هزینه درآمد خانوار در بین سالهای ۱۳۸۸ تا ۱۳۹۹ استفاده شده است. تعداد مشاهدات کل تحقیق ۴۰۲ عدد بوده است که برابر است با تعداد ۳۱ استان از سال ۱۳۸۸ تا ۱۳۹۹. نسبت ازدواج کردههای زنان ۴۹-۴۵ ساله در هر استان در بین سالهای مذکور محاسبه شد و سپس کاهش نسبت زنان ازدواج کردهی هر استان به زیر ۹۵% بهعنوان وقوع رخداد عدم عمومیت ازدواج در نظر گرفته شد. انتخاب این سطح آستانهای برای مبنا قرار دادن کاهش عمومیت ازدواج براساس مطالعه جونز (۲۰۱۵) است که این سطح را ملاک کاهش عمومیت ازدواج میداند. ملاک شروع تحلیل با سال ۱۳۸۸ نیز از طریق بررسی نسبت زنان ازدواج کرده ۴۹-۴۵ ساله در سالهای قبل از آن انتخاب شده است. ابتدا از سال ۱۳۸۰ نسبت زنان ازدواج کرده در گروه سنی ۴۹-۴۵ سال ارزیابی شد که براساس آن تغییر قابل توجهی در بین استانهای کشور تا قبل از سال ۱۳۸۸ در این نسبت مشاهده نشد و در نتیجه این سال بهعنوان سال مبدا انتخاب شد. در بین استانهای کشور، تنها استان البرز از سال ۱۳۸۹ بر مبنای تقسیمات جدید کشوری به استانهای کشور اضافه شده است. برای سال قبل از آن نسبت ازدواج کردههای زنان تهران برای استان البرز اعمال شده است.
متغیرهای مستقل تحقیق شامل تحصیلات، شهرنشینی و نرخ مشارکت اقتصادی کل است. سطح تحصیلات زنان به سه گروه بیسواد و ابتدایی راهنمایی، دبیرستان و دانشگاهی تقسیم شده است. بهدلیل عدم دسترسی به دادههای سری زمانی در خصوص نرخ مشارکت اقتصادی زنان در بازه ۱۳ ساله مطالعه، از نرخ مشارکت اقتصادی کل استفاده شده است. در ادامه روش جنگل تصادفی بقاء و مدلسازی تابع بقاء که در این مقاله مورد استفاده بودهاند معرفی خواهد شد.
1) روش جنگل تصادفی بقا: روش جنگل تصادفی بقا[4] یکی از روشهای توسعه داده شده براساس الگوریتمهای یادگیری ماشین است که پایه و اساس آن الگوریتم درخت تصمیمگیری و جنگل تصادفی است. روش جنگل تصادفی جزء الگوریتمهای یادگیری نظارت شده[5] است که برای هر دو کاربرد طبقهبندی[6] و رگرسیون مورد استفاده قرار میگیرد[7]. جنگل تصادفی در واقع الگوریتم توسعه داده درخت تصمیمگیری است که بر طبق آن چندین درخت تصمیم از طریق نمونهگیری تصادفی ساخته میشود و مدل نهایی از طریق درختهای تصمیم ایجاد شده ارزیابی میشود (Geron, 2019). یکی دیگر از برتریهای جنگل تصادفی نسبت به درخت تصمیمگیری این است که با ایجاد هزاران درخت تصمیم میتوان تا حد زیادی از بیش برازشی[8] مدل که ضعف اصلی الگوریتم درخت تصمیم است، جلوگیری کرد. به طور کلی تمامی الگوریتمهای یادگیری ماشین در معرض دو خطر جدی قرار دارند: بیش برازشی و کم برازشی[9].
بیش برازشی زمانی رخ میدهد که مدل بیش از حد پیچیده و اصطلاحاً دادههای آموزش[10] را حفظ کرده است و قابل تعمیم به دادههای تست نیست (در یادگیری ماشین، منظور از دادههای آموزش دادههایی است که برای بهکارگیری الگوریتم، آموزش داده میشود و دادههای تست نیز دادههای است برای سنجش دقت الگوریتم مدل بر این دادهها اعمال میشود). در این شرایط مدل قابل اعتبار نیست چرا که ممکن است تمام دادههای پرت را نیز مورد بررسی قرار دهد. کم برازشی زمانی رخ میدهد که الگوریتم نتوانسته است به اندازه کافی دادههای آموزش را مورد بررسی قرار دهد. راههای مختلفی برای حل دو مشکل بیش برازشی و کم برازشی پیشنهاد شده است. برای مثال میتوان به روش اعتبار سنجی متقابل[11] و یا تغییر ابر پارامترها[12] اشاره کرد (Muller and Guido, 2016).
در الگوریتم جنگل تصادفی با ایجاد درختهای تصمیم متعدد از طریق نمونهگیری تصادفی تا حد زیادی میتوان از بیشبرازشی و کمبرازشی مدل جلوگیری کرد. در این روش، همچون تمام الگوریتمهای یادگیری ماشین ابتدا دادهها به دو مجموعه دادههای آموزش و دادههای تست تقسیم میشوند. ابتدا مدل از طریق دادههای آموزش، آموزش داده میشود و سپس برای ارزیابی این یادگیری، مدل بر مجموعه دادههای تست اعمال میشود. ارزیابی اولیه و کلی مدل از طریق اعمال آن بر مجموعه دادههای تست ایجاد میشود (Jo, 2021). به طور کلی، اگر مدل توانسته باشد به خوبی آموزش دیده باشد باید بر روی دادههای تست هم عملکرد خوبی داشته باشد در غیر این صورت مدل مناسب دادههای مورد استفاده نیست. در صورت آموزش مناسب مدل بر دادههای آموزش، بعد از این مرحله برای ساختن درختهای تصمیم متعدد از نمونه بوتاسترپ[13] استفاده میشود. این نمونه به معنای نمونهگیری مکرر از یک مجموعه داده به همراه جانشینی است که خروجی آن یک مجموعه داده است که حجم آن به اندازه داده اولیه است اما امکان دارد برخی از دادهها حذف و یا برخی تکرار شوند. شکل ۱ نحوه ایجاد نمونه بوتاسترپ از داده اصلی برای هر مقدار درخت تصمیم را نشان میدهد.
شکل۱-نمونه بوت استرپ از داده اصلی برای B مقدار درخت تصمیم
همانطور که در شکل ۱ مشاهده میشود، براساس نمونه بوتاسترپ مقدار مشخصی از درخت تصمیم برای دادههای تحقیق ایجاد میشود که مدل نهایی از طریق رأیگیری از این تعداد مشخص از درختها ایجاد و به کار گرفته میشود. بنابراین میتوان مجموعه متناهی از درختهای تصمیم را متصور شد که به صورت سلسله مراتبی با هم مرتبط هستند. در هر درخت تصمیم اولین گره[14] که در بالای هر درخت قرار دارد بهعنوان گره ریشه[15] شناخته میشود. در ادامه در هر مرحله گره اصلی به چند زیرگروه تقسیم میشود که هر کدام از شاخهها دربردارنده اطلاعات مربوط به داده است و در نهایت باید از بین آنها یک گره نهایی انتخاب شود. شکل ۲ فرآیند رأیگیری در درخت تصمیم را نشان میدهد.
شکل ۲- فرآیند رایگیری در بین درختهای تصمیم مختلف
همانطور که در شکل ۲ مشخص است، فرآیند رأیگیری در مدل جنگل تصادفی برای هر درخت تصمیم اعمال میشود که در نهایت تنها یک گره بهعنوان پاسخ اصلی و گره پایانی[16] انتخاب میشود. در شکل ۲ مسیر انتخاب گره پایانی در بین ۳ درخت تصمیم با رنگ قرمز مشخص شده است. مزیت اصلی الگوریتم جنگل تصادفی ایجاد درختان تصمیم مختلف است که با رأیگیری در هر درخت امکان بررسی تمامی حالتهای ممکن پارامترهای مدل را به محقق خواهد داد و موجب افزایش قدرت پیشبینی مدل میشود.
2) مدلسازی تابع بقا: برای مدلسازی تابع بقا از طریق الگوریتم جنگل تصادفی ابتدا تعداد N درخت تصمیم از طریق فرآیند بوتاسترپینگ ایجاد میشود سپس برای هر درخت تصمیم تابع بقای مجزا ایجاد میشود و متغیرهای تأثیرگذار در مدل برای هر درخت رایگیری میشود. در مرحله بعد براساس هر گره پایانی تابع بقای هر درخت تصمیم مشخص میشود. در نهایت نیز با استفاده از دادههای OOB مقدار خطای پیشبینی مدل مشخص خواهد شد (Ishwaran et al. 2008). به طور میانگین، نمونه بوتاسترپ حدودا ۳۶ درصد از دادهها را شامل نمیشود و بنابراین این دادهها وارد مدل نخواهند شد. بهمنظور ارزیابی مدل، از این دادهها برای اعتبارسنجی متقابل استفاده میشود که به خطای خارج از کیسه[17] یا OOB معروف است. درنتیجه دادههای نمونهگیری شده که در مدل محاسبه میشوند داخل کیسه[18] نامیده میشوند (Fantazzini and Figini, 2009).
روش جنگل تصادفی بقا، تابع بقا، ، را از طریق معادله زیر برآورد میکند:
با در دست داشتن هر تعداد مشخص از درخت تصمیم تابع بقا از طریق میانگینگیری گرههای پایانی بدست میآید.[19] اگر و به ترتیب تابع تجمعی مخاطره و تابع بقا برای b مقدار درخت تصمیم باشند در نتیجه توابع برآورد شده برابر است با:
همچنین برای برآورد خطای پیشبینی مدل، OOB، از روش مشابهی یعنی میانگینگیری از گرههای پایانی در هر درخت تصمیم استفاده میشود. اگر برابر باشد با درختهای تصمیمی که در آن مورد i خارج از کیسه باشد بنابراین:
در ادامه برای بررسی اثر متغیرهای مستقل[20] بر تابع بقا و همچنین ارزیابی اهمیت دو مورد i و j در دو متغیر مستقل و میگوییم مقدار i تاثیر کمتری دارد اگر:
که در آن برابر است زمان وقوع رخداد در مدل. در نهایت شاخص بریر نیز برای ارزیابی مدل از طریق معادله زیر محاسبه میشود. اگر برآوردی از تابع بقا باشد مقدار شاخص بریر[21] برای این تابع برابر است با:
که در آن برآوردی تابع بقای سانسور شده است (Ishwaran et al. 2011).
یافتههای تحقیق
در این مطالعه، نسبت زنان ازدواج کرده در گروه سنی ۴۹-۴۵ ساله در بین استانهای کشور وارد مدل تحقیق شده است. بررسی ابتدایی این نسبتها برای استانهای مختلف نشاندهنده تغییرات محسوس در نسبت زنان ازدواج کرده تقریبا در تمامی استانهای کشور است. شکلهای ۳ و ۴ این نسبتها را در بین استانهای مختلف برای دو سال ۱۳۸۸ و ۱۳۹۹ (زمان شروع و پایان مطالعه) نشان میدهد.
شکل ۳- نسبت ازدواج کردههای زنان ۴۹-۴۵ ساله در بین استانهای کشور.۱۳۸۸
شکل ۴- نسبت زنان ازدواج کرده ۴۹-۴۵ ساله در بین استانهای کشور.۱۳۹۹
همانطور که در شکل ۳ مشخص است، نسبت زنان ازدواج کرده در گروه سنی ۴۹-۴۵ سال در تمامی استانهای کشور در سال ۱۳۸۸ بالاتر از ۹۵% بوده است (خط چین قرمز نسبت ازدواج کردههای زنان در سطح ۹۵% را نشان میدهد) که بیانگر عمومیت بالای ازدواج در بین تمامی استانهای کشور است. همچنین بیشترین نسبت زنان ازدواج کرده ۴۹-۴۵ ساله در بین استانهای کشور مربوطه به استانهای سیستان و بلوچستان، کهگیلویه و بویر احمد، یزد، خراسان رضوی، خراسان جنوبی و هرمزگان است. در حالی که کمترین مقدار این نسبت در استانهای گیلان، مرکزی و لرستان مشاهده میشود. بنابراین، همانگونه که قبلاً اشاره شد، تا شروع سال ۱۳۸۸ هنوز تمامی استانها از عمومیت ازدواج برخوردار بودند.
۱۲ سال بعد و در سال ۱۳۹۹ این نسبتها به کلی متفاوت است. همانطور که در شکل ۴ مشخص است، به جز ۱۱ استان تمامی استانهای کشور نسبت ازدواج پایینتر از ۹۵% را برای زنان ۴۹-۴۵ تجربه کردهاند. این استانها عبارتند از استانهای گیلان، مازندران، آذربایجان غربی، کرمان، خراسان رضوی، سیستان و بلوچستان،کردستان، یزد، قم، گلستان و خراسان جنوبی. به عبارت دیگر، این استانها همچنان از عمومیت ازدواج برخوردارند. پایینترین مقدار این نسبت در بین تمامی استانهای کشور در سال ۱۳۹۹ مربوط به استان کرمانشاه با نسبت ۸۵% است. اگرچه در ۲۰ استان کشور نسبت ازدواج کردههای زنان ۴۹-۴۵ ساله پایینتر از عمومیت ازدواج است ، اما همچنان نسبت زنان ازدواج کرده ۴۵-۴۹ ساله در اکثر استانهای کشور در سطحی بالای ۹۰ درصد قرار دارد که نشاندهنده رواج بالای ازدواج در کشور است. در بخش بعد به مدلسازی این نسبتها و در نهایت توابع بقای استانی اشاره میشود.
بهکارگیری الگوریتمهای یادگیری ماشین در مدلسازی تابع بقا نیازمند ملاحظات گوناگونی است که مهمترین آن بررسی صحت و دقت مدل در فرآیند تحلیل داده است. شاخصهای مختلفی برای ارزیابی این الگوریتمها وجود دارد که بسته به نوع الگوریتم مورد استفاده میتواند متفاوت باشد. یکی از مهمترین شاخصهای ارزیابی جنگل تصادفی در ابتدا تعداد درخت تصمیمگیری بهینه برای مدل است. شکل ۵ نمودار تعداد درختان تصمیمگیری مورد استفاده برای این تحقیق و میزان خطای متناظر با آن را براساس هر تعداد درخت تصمیم نشان میدهد.
شکل ۵- تعداد درخت تصمیم و میزان خطای متناظر با آن
انتظار میرود با افزایش تعداد درختان تصمیم مقدار خطای مدل کاهش یابد. بنابر شکل ۵، تعداد درخت تصمیم در مقدار کمتر از ۵۰۰ درخت مقدار خطای نسبتا بالایی را نشان میدهد اما با افزایش درختان مقدار خطا کاهش مییابد و رفتهرفته به یک سطح پایدار میرسد. اینکه با چه تعداد درخت تصمیم میتوان بهترین نتیجه را از مدل گرفت دقیقاً تابع شکل فوق و مقدار خطا در هر مقدار درخت تصمیم است. با این حال، افزایش تعداد آن لزوماً به معنای دقت بیشتر مدل نیست. تعداد بهینه درخت تصمیم همبستگی بالایی با تعداد مشاهدات در دادههای مورد استفاده و متغیرهای تحقیق دارد. در دادههای بسیار بزرگ انتظار میرود با تعداد درخت تصمیم کمتری درصد خطای مدل کاهش یابد. در این تحقیق همانطور که شکل ۵ نیز نشان میدهد، تعداد ۱۵۰۰ درخت تصمیم برای بهکارگیری مدل استفاده شده است که درصد خطای آن به زیر ۳۰/0 رسیده است و تعداد بهینه درختان تصمیم را برای این مدل نشان میدهد.
از جمله شاخصهای مهم دیگر در ارزیابی الگوریتم جنگل تصادفی بقا شاخص نمره بریر[22] و شاخص CPRS است. این شاخص نشاندهنده دقت مدل در تعداد واحد زمانی است که واقعه ممکن است در آن رخ بدهد. این شاخص بین صفر و یک متغیر است و هر چقدر عدد آن به صفر نزدیکتر باشد بیانگر دقت بیشتر مدل است. شکل ۶ هر دو شاخص CPRS و نمره بریر را نشان میدهد.
شکل ۶- شاخص بریر و CPRS به تفکیک زمان مورد مطالعه
براساس شکل ۶، شاخص بریر و CPRS هرگز به بالاتر ۳۰/۰ درصد نزدیک نمیشوند که بیانگر دقت قابل قبول مدل است. در شاخص بریر افزایشی و سپس کاهشی بودن مدل در سالهای وقوع رویداد نشاندهنده دقت مدل در سالهای ابتدایی و پایانی داده مورد مطالعه است. به بیان دیگر، نوع پراکندکی و همبستگی متغیرهای تحقیق با زمان رخداد واقعه در سالهای پایانی و ابتدایی تحقیق نسبت به سالهای میانی به نحو دقیقتری در مدل منعکس شده است. در شاخص CPRS نیز روند افزایشی نمودار نشاندهنده دقت بالای مدل در سالهای ابتدایی در بین مشاهدات و کاهش آن در سالهای پایانی است با این حال مقدار کمتر از ۵۰/۰ نشاندهنده دقت قابل قبول مدل در هر دو شاخص است.
شاخص بریر شاخص بسیار مهی در ارزیابی نهایی مدل و همچنین شاخص خوبی برای سنجش این موضوع است که متغیرهای مستقل مدل آیا توانستهاند تبیین کننده متغیر وابسته باشد یا خیر. شکل ۷ تأثیر متغیرهای مستقل مدل برای ۱۵۰۰ درخت تصمیم بر تابع بقا عمومیت ازدواج در بین استانهای کشور را نشان میدهد. همانطور که پیشتر نیز گفته شد، تأثیر نهایی هر یک از متغیرهای تحقیق بر عمومیت ازدواج زنان از طریق رأیگیری در هر درخت تصمیم و در نهایت میانگینگیری از تمام گرههای پایانی انجام میشود.
شکل ۷- متغیرهای تأثیرگذار بر تابع بقای عمومیت ازدواج
بنابر شکل ۷، بیشترین متغیری که توانسته است بر کاهش عمومیت ازدواج زنان و وقوع رخداد در استانهای کشور تأثیرگذار باشد تحصیلات دبیرستانی و بعد از آن تحصیلات دانشگاهی است. شهرنشینی و میزان مشارکت اقتصادی کل نیز در رتبههای بعدی تأثیرگذاری بر متغیر وابسته و وقوع رویداد قرار دارند. میزان شهرنشینی در هر استان علاوه بر اثر مستقیمی که میتواند داشته باشد، از طریق افزایش دستیابی به فرصتهای تحصیلی میتواند بر کاهش عمومیت ازدواج زنان تأثیرگذار باشد. تحصیلات ابتدایی به همراه میزان مشارکت اقتصادی کل کمترین تأثیر را بر وقوع رویداد و کاهش عمومیت ازدواج زنان داشته است با این حال تأثیر این دو متغیر صفر نیست. اهمیت نسبی هر متغیر نسبت به سایر متغیرها از طریق مقایسه بیناستانی در مدل صورت میگیرد. بر این اساس، تغییراتی که استانهای مختلف به لحاظ نسبتهای تحصیلی و میزان استغال و شهرنشینی تجربه میکنند در تصمیمگیری نهایی مدل موثر است و خروجی نهایی که نقش متغیرهای مهم را به ترتیب نشان میدهد براساس تفاوتهای استانی اعمال میشود.
همانطور که در شکل ۷ مشخص است، مقیاس عددی برای سنجش تأثیرگذاری متغیرها به صورت نسبت آن با سایر متغیرها و نه به صورت یک عدد مطلق و استاندارد شده بیان شده است و در نتیجه تنها میتوان آن را نسبت به سایر مقادیر تفسیر کرد. در نتیجه، متغیر تحصیلات دبیرستانی بیشتر از سایر متغیرها تغییرات متغیر وابسته را توضیح میدهد که این متغیر به اندازه ۰۶/۰ و تحصیلات دانشگاهی به اندازه ۰۴/۰ از تغییرات متغیر وابسته را تبیین میکنند. همچنین، با حذف متغیر تحصیلات دبیرستانی انتظار میرود به مقدار ۰۶/۰ مدل دچار کمبرازشی شود. وجه دیگر اهمیت متغیرهای تحقیق در شکل ۸ نشان داده شده است.
شکل ۸- ترتیب اهمیت متغیرهای مستقل براساس شاخص عمق حداقلی در برآورد تابع بقا
شکل ۸ ترتیب اهمیت متغیرهای تحقیق در برآورد تابع بقا در استانهای مختلف را نشان میدهد. همانطور که انتظار میرود، ترتیب اهمیت متغیرها برابر است با تحصیلات دبیرستان، تحصیلات دانشگاهی، شهرنشینی، میزان مشارکت اقتصادی کل و تحصیلات ابتدایی. نکته مهم در شکل ۸ ارزیابی ترتیب اهمیت متغیرهای مستقل تحقیق براساس شاخص عمق حداقلی[23] است. براساس این شاخص متغیرهای تحقیق براساس تعداد دفعات جدا شدن آنها در فرآیند رأیگیری در درختهای تصمیمگیری طبقهبندی میشوند. به بیان دیگر، شاخص عمق حداقلی بیان میکند که در فرآیند تصمیمگیری در بین درختهای تصمیم چند مرتبه از یک متغیر مستقل برای رأیگیری نهایی استفاده شده است و چه تعداد از رأیگیریها براساس آن متغیر بوده است. در شکل ۸ متغیرهای سطح تحصیلات دبیرستان، شهرنشینی و میزان مشارکت اقتصادی کل بهعنوان بیشترین معیار رأیگیری در بین درختهای تصمیم انتخاب شدهاند.
با ارزیابی کلی مدل و بررسی اثرات متغیرهای تحقیق بر تابع بقای مدل، میتوان تابع بقای کلی را در بین استانهای مختلف براساس هر تعداد درخت تصمیم مختلف برآورد کرد. بر این اساس، با وارد کردن تأثیر هر یک از متغیرهای مدل بر استانهای مختلف، تابع بقا با تأثیر تمامی متغیرها برای هر استان بدست میآید. شکل ۹ تابع بقای هر استان را در طول دوره مطالعه نشان میدهد. ترتیب استانها براساس شکل ۴ است، استانهایی که در سال ۱۳۹۹ به ترتیب از نسبت ازدواجکردههای بالاتری برای زنان ۴۹-۴۵ ساله برخوردار بودهاند.
بنابر شکل ۹، عمده استانهای کشور در طول دوره مطالعه به سطح آستانهای کاهش نسبت زنان ازدواج کرده ۴۹-۴۵ ساله به پایینتر از ۹۵/۰ نزدیک شدهاند. همانطور که پیشتر نیز گفته شد، تنها ۱۱ استان واقعه مورد نظر را تا پایان سال مورد بررسی،۱۳۹۹، تجربه نکردهاند. در حالی که نسبت زنان ازدواج کرده ۴۹-۴۵ ساله سایر۲۰ استان با فاصلههای زمانی مختلف تا پایان سال ۱۳۹۹ به مقداری پایینتر از ۹۵/۰ رسیده است. الگوی تابع بقا در ۳ استان سیستان و بلوچستان، آذربایجان غربی و قم حاکی از آن است که نه تنها تا پایان سال مطالعه واقعه مورد نظر را تجربه نکردهاند بلکه در سطح بسیار بالایی از احتمالات تابع بقا قرار دارند. برای این سه استان احتمالات بقا تا پایان سال مطالعه به ترتیب برابر است با ۹۹/۰، ۹۸/۰ و۹۷۳/۰ است. این ۳ استان در تحلیل اولیه نیز در شمار استانهایی قرار داشتند که در هر دو سال ۱۳۹۹ و ۱۳۸۸ از عمومیت ازدواج برخوردار بودند. همچنین استانهایی مانند بوشهر، اردبیل، قزوین، کهگیلویه و بویر احمد و چهارمحال و بختیاری اگرچه واقعه مورد نظر را تجربه کردهاند، با این حال، احتمال بقای بالاتری را برای واقعه مورد نظر نشان میدهند. برای این استانها روند تابع بقا با شدت بیشتری به سمت تجربه واقعه مورد نظر پیش میرود. برخلاف این استانها، استانهای هرمزگان، زنجان و فارس قرار دارند که با یک شیب ملایم و کندی به سمت تجربه واقعه مورد نظر پیش میروند.
شکل ۹- تابع بقا براساس مدل جنگل تصادفی بقا برای استانهای کشور
الگوی متفاوت استانی در تابع بقا، نشاندهنده سطح متفاوت از تأثیرگذاری متغیرهای مستقل بر متغیر مورد مطالعه و وقوع رخداد است. دستیابی متفاوت به سطوح تحصیلی و نسبتهای مختلفی از شهرنشینی و میزان مشارکت اقتصادی اینگونه توانسته است بر احتمال بقا و تجربه واقعه مورد نظر تأثیرگذار باشد. از سوی دیگر الگوی متأخر ازدواج در بین زنان میتواند عامل دیگری برای تفاوتها در احتمالات بقای استانی باشد. در برخی از استانها مانند هرمزگان الگوی احتمال بقا نشاندهنده سرعت بیشتر تجربه واقعه در این استان است در حالی که در برخی دیگر از استانها مانند البرز این روند آرام و بطئی است. زمانبندی متفاوت استانهای مختلف در رسیدن به موقعیت عدم عمومیت ازدواج و مقادیر متفاوت احتمال بقا در آنها به خوبی نشاندهنده تأثیر متغیرهای مورد مطالعه بر تابع بقا است. از طرف دیگر، با توجه به محدودیت دادههای مورد مطالعه در این تحقیق، ممکن است چنین تفاوتهای استانی مربوط به سایر متغیرهای اجتماعی و اقتصادی و همچنین متغیرهای فرهنگی، قومی و مذهبی باشد که در این مطالعه سنجیده نشده است. این موضوع به خصوص برای استانهایی بیشتر صادق است که در طول دوره مطالعه واقعه مورد نظر را تجربه نکرده باشند. در این استانها این امکان وجود دارد که متغیرهای دیگری بر عمومیت ازدواج تأثیرگذار باشد.
نتیجهگیری
برآوردهایی که از تغییرات ازدواج انجام میشود عمومًا طیف وسیعی از متغیرهای تأثیرگذار اجتماعی-اقتصادی و جمعیتی را شامل میشود. این موضوع تا حد زیادی به ماهیت بین رشتهای مطالعات ازدواج و خانواده و همچنین تأثیرپذیری آن از عوامل مختلف در یک جامعه برمیگردد. با این حال، مطالعات متعددی که در این زمینه انجام شده نقش متغیرهای مهمی را آشکار کرده است که میتواند تا حد زیادی تبیین کننده بخش عمده تغییرات ازدواج زنان باشد. تحصیلات بهعنوان یکی از مهمترین عواملی است که در بسیاری از تحقیقات خارجی و داخلی در تأثیرگذاری تأخیر در ازدواج و کاهش عمومیت ازدواج زنان بدان اشاره شده است. افزایش سالهای حضور در دورههای تحصیلی و داشتن چشمانداز شغلی بعد از تحصیلات دلیل عمده تأخیر در ازدواج است که فراوان بدان پرداخته شده است. سطوح مختلف تحصیلی زنان میتواند تأثیرات متفاوتی بر الگوی سنی ازدواج آنان داشته باشد. علاوه بر این، سطح متفاوت دستیابی زنان به تحصیلات در نقاط شهری و روستایی باعث شده است تا شهرنشینی فارغ از اثر خاص خود، از طریق ایجاد فرصتهای متفاوت زنان به تحصیلات در تأخیر در ازدواج زنان تأثیرگذار باشد.
در این مقاله، با تکیه بر ادبیات پیشین اثر برخی از متغیرهای مهم همچون تحصیلات، شهرنشینی و میزان مشارکت اقتصادی بر روند عمومیت ازدواج زنان در استانهای مختلف مورد بررسی قرار گرفت. با سطح متفاوتی از شهرنشینی و دستیابی به فرصتهای آموزشی زنان، انتظار میرود روند تأخیر در ازدواج آنان نیز به تفکیک استانها مختلف متفاوت باشد. از طرفی دیگر، براساس مطالعه عباسی شوازی (۱۳۸۰) همگراییای که در کاهش باروری در استانهای مختلف کشور اتفاق افتاده است، فرض این همگرایی برای کاهش عمومیت ازدواج در استانهای مختلف را قویتر میکند. اگرچه ازدواج در بافت سنتی-دینی ایران همچنان از ارزش بالایی برخوردار است، اما تأثیرگذاری برخی از عوامل و شرایط متفاوت استانهای مختلف را در این زمینه نباید نادیده گرفت.
برای بررسی چنین تفاوتهایی در سطح استانهای کشور، در این مقاله از یک روش جدید در مدلسازی توابع بقا استفاده شده است. الگوریتمهای یادگیری ماشین بهواسطه دقت بالا و قابلیت مدلسازی با دادهها و متغیرهای فراوان به سرعت در حال گسترش هستند. این روشها قابلیتهای مهمی از جمله آموزش دادهها را برای محقق فراهم میکنند که از طریق آن به ماشین این اجازه را میدهد که با کمترین دخالت محقق مدلی که در ذیل داده پنهان شده است را کشف و به کار بگیرد. با این حال استفاده از این الگوریتمها نیازمند ملاحظات بسیاری است که باید از سوی محقق به دقت بررسی شود. ماهیت احتمالی این روشها باعث میشود خطای حاصل از مدلسازی به دقت قابل بررسی و نمایش باشد که این امکان را فراهم میکند تا محقق بتواند مدل متناسب با داده خود را به نحو دقیقتری انتخاب کند. ضعف عمده چنین الگوریتمهایی پیچیدگی آن است که میتواند به کارگیری این مدلها را با مشکل مواجه کند. نکته مهمی که در استفاده از این الگوریتمها باید به یاد داشت آن است که همیشه در معرض بیشبرازشی و یا کمبرازشی قرار دارند. در این مقاله، تحلیل استانی تابع بقا در استانهای مختلف کشور از طریق روش جنگل تصادفی بقا و تعریف یک سطح آستانهای، نسبت ازدواج کمتر از ۹۵ درصد برای زنان ۴۹-۴۵ سال، انجام شده است.
تحلیل استانی تغییرات عمومیت ازدواج زنان در ایران نشان میدهد که روند کاهشی آن از سال ۱۳۸۸ آغاز شده است. تا قبل از این سال، تغییر محسوسی در عمومیت ازدواج زنان به خصوص در استانهای کمتر توسعهیافته مشاهده نشده است. دستیابی متفاوت زنان به تحصیلات و همچنین شهرنشینی و میزان مشارکت اقتصادی متفاوت توانسته است منجر به تفاوت قابل توجه در روند کاهشی عمومیت ازدواج زنان شود. تابع بقای محاسبه شده در این مطالعه نشان میدهد که از بین کل استانهای کشور ۱۱ استان گیلان، مازندران، آذربایجان غربی، کرمان، خراسان رضوی، سیستان و بلوچستان، کردستان، یزد، قم، گلستان و خراسان جنوبی تا پایان سال ۱۳۹۹ همچنان از عمومیت ازدواج برخوردار بودهاند. این در حالی است که بقیه استانها در سالهای مختلف دوره مورد مطالعه واقعه را تجربه کردهاند و نسبت ازدواج کردههای زنان ۴۹-۴۵ ساله به زیر ۹۵/۰ رسیده است. بررسی متغیرهای تأثیرگذار در تابع بقای استانها نیز نشان داد که سطح تحصیلات دبیرستان و دانشگاه بیشترین تأثیر را در کاهش عمومیت ازدواج زنان در استانهای کشور دارد. بعد از تحصیلات، شهرنشینی بهعنوان مهمترین متغیر تبیین کننده کاهش عمومیت ازدواج به شمار میرود.
علیرغم کاهش عمومیت ازدواج و تغییرات قابل توجه در تاخیر ازدواج زنان در اکثر استانهای کشور، ۲۲ استان، بررسیهای استانی حاکی از أن است که نسبت ازدواج کردههای زنان ۴۹-۴۵ ساله همچنان در سطح بالایی قرار دارد. با وجود کاهش این نسبت، در بسیاری از استانهای کشور نسبت ازدواج کردههای زنان در سطحی بالاتر از ۹۰/۰ قرار دارد. تحلیل توابع بقای استانی نیز نشان میدهد، به جز ۱۱ استان مذکور بسیاری از استانها تا پایان سال مطالعه واقعه مورد نظر را تجربه نکردهاند. در نتیجه، اگرچه عمومیت ازدواج در ایران در سال ۱۳۹۹ در بسیاری از استانهای کشور نسبت به سال ۱۳۸۸ از بین رفته است، نسبت زنان ازدواج کرده ۴۹-۴۵ ساله به ندرت به سطحی پایینتر از ۸۷% رسیده است که نشاندهنده رواج بالای ازدواج اما با یک الگوی متأخر در کشور است.
تفاوتهای فرهنگی و اجتماعی در هر یک استانهای کشور میتواند تأثیر گوناگونی بر روند تغییرات ازدواج داشته باشد که فراتر از بحث این مقاله است. در شرایط مساوی و در صورت وجود سطوح یکسان متغیرهای مستقل در استانهای کشور، انتظار میرود شرایط فرهنگی خاص هر استان تبیین کننده تغییرات عمومیت ازدواج زنان باشد. عواملی همچون فردگرایی، خودتحقق بخشی، سرمایه فرهنگی و ارزشهای دینی میتواند در کنار سایر عوامل اجتماعی و اقتصادی توضیحدهنده تغییرات ازدواج در ایران باشد (عسکری ندوشن و همکاران، ۱۳۹۵). اهمیت این موضوع با توجه به سطح توسعهیافتگی مختلف استانها و همچنین تفاوتهای قومی و فرهنگی ملازم با أن بیشتر نیز میشود. برای مثال، عمومیت ازدواج در دو استان قم و خراسان رضوی حتی تا پایان سال ۱۳۹۹ در سطح بالایی قرار دارد که میتواند تا حدودی منعکس کننده نقش فضای مذهبی در این دو استان باشد.
در این تحقیق تحصیلات بهعنوان تأثیرگذارترین متغیر بر کاهش عمومیت ازدواج زنان همچون سایر مطالعات، نشاندهنده اهمیت بالای این متغیر در تغییرات ازدواج است. در برخی از مطالعات به الگوی U شکل تاثیرگذاری تحصیلات بر سن ازدواج زنان اشاره شده است (خلیلی، ۱۴۰۰؛ عسکریندوشن و همکاران، ۱۳۹۷). بهنحویکه، زنان با تحصیلات کم و زنان با تحصیلات بالا بیشترین تأخیر در ازدواج را تجربه میکنند و از شانس ازدواج کمتری برخوردار هستند. با این حال، بررسیهای مقاله حاضر نشان میدهد که الگوی تأثیرگذاری تحصیلات بر ازدواج زنان وقتی در سطح استانهای کشور نگاه شود، میتواند متفاوت باشد و لزوما رابطه U شکل بین تحصیلات و تاخیر در ازدواج زنان را تایید نکند. از طرفی دیگر، این امکان نیز وجود دارد که با افزایش سهم زنان تحصیلکرده نسبت به زنان بیسواد در کل جمعیت، الگوی ازدواج این زنان در درازمدت غالب شود و حتی با افزایش سهم این زنان ممکن است شانس ازدواج آنان نیز نسبت به زنان بیسواد افزایش یابد. آیسن و استوینسون در تایید این نکته (۲۰۱۰) معتقدند، هرچه از نسلهای گذشته به نسلهای امروزی میرسیم، زنان تحصیلکرده نسبت به گذشته از شانس ازدواج بیشتری برخوردار هستند که دلیل آن افزایش سهم این زنان نسبت به کل جمعیت زنان است.
یکی از محدودیتهای اصلی تحلیل بقا یافتن متغیرهای مستقلی است که مقدار آنها در طول زمان تغییر کند. در این مقاله، با توجه به محدودیت در دسترسی به دادههای سری زمانی در بازه ۱۲ ساله تحقیق، سعی شد تا متغیرهایی برای بررسی تغییرات ازدواج انتخاب شوند که اطلاعات آنها از سال ۱۳۸۸ تا ۱۳۹۹ موجود باشد. با این حال، میتوان متغیرهای دیگری را نیز وارد مدل کرد و اثر آن را بر روند تغییرات عمومیت ازدواج زنان مورد مطالعه قرار داد.
[1]. Baby boom
[2]. Timing
[3]. python
[4] Random survival forest
[5] Supervised learning
[6] Classification
[7] برای اطلاعات بیشتر در خصوص الگوریتمهای یادگیری نظارت شده رجوع کنید به واردهان (۲۰۲۰).
[8] Overfitting
[9] Underfitting
[10] Training data
[11] Cross-validation
[12] Hyperparameters
[13] Bootstrap sample
[14] node
[15] Root node
[16]. Terminal node
[17]. Out of bag error
[18]. In-bag
[19]. برای اطلاعات بیشتر در زمینه الگوریتم جنگل تصادفی رجوع کنید به لوپه (۲۰۱۴)
[20] features
[21] Brier index
[22] Brier index
[23] - Minimal Depth