شبیه‌سازی ریزداده‌های جمعیت نیروی کار در ایران با استفاده از روش همگذاشتی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه پژوهشی پردازش داده‌ها و اطلاع‌رسانی، پژوهشکده آمار، تهران

2 استادیار، دانشکده علوم ریاضی، دانشگاه صنعتی اصفهان، اصفهان

3 کارشناس ارشد آمار، مرکز آمار ایران، تهران،

چکیده

یکی از مسائلی که سازمان‌های تولیدکننده آمار رسمی در انتشار برخی داده‌ها با آن مواجهه‌اند، محرمانگی داده‌های فردی است. این مسئله باعث شده که ریز داده‌های مورد نیاز به راحتی در اختیار عموم قرار نگیرند. یکی از راه‌های حل این مسئله شبیه‌سازی جمعیت به روش همگذاشتی است که در این مقاله کاربرد آن بررسی می‌شود. داده‌های مورد استفاده، داده‌های طرح نیروی کار مرکز آمار ایران فصل تابستان 1397 می‌باشد. در این مطالعه، ابتدا ریز داده‌های جمعیت نیروی کار در سطح ملی به تفکیک استان‌ها تولید می‌شود و سپس با استفاده از براورد کارایی نسبی مجانبی، دقت برآوردهای حاصل از نمونه گرفته شده از جمعیت واقعی و جمعیت شبیه‌سازی شده با هم مقایسه می‌شوند. نتایج این تحقیق نشان می‌دهد که ضمن تولید ریز داده‌های جمعیت نیروی کار در سطح ملی به تفکیک استان‌ها، دقت برآوردهای حاصل از ریزداده‌های جمعیت شبیه‌سازی شده پیشنهادی، بیشتر از برآوردهای حاصل از نمونه گرفته شده از جمعیت واقعی است. همچنین در این مقاله نشان داده می‌شود که از جمعیت شبیه‌سازی شده در برآورد پارامترهای نواحی کوچک و جوامعی که حجم نمونه کافی نیست نیز می توان استفاده کرد.

کلیدواژه‌ها


عنوان مقاله [English]

Simulation of Microdata of Labor Force Population of Iran with Synthetic Method

نویسندگان [English]

  • Ashkan Shabbak 1
  • Hamed Lorvand 2
  • Ali Rahimi 3
1 Assistant Professor, Statistical Research and Training Center, Tehran
2 Assistant Professor of Statistics, Isfahan University of Technology, Isfahan
3 MA in Statistics, Statistical Center of Iran, Tehran
چکیده [English]

One of the issues that statistical organizations face in disseminating micro data is confidentiality, which has made the data not easily available to the public.One way to solve this problem is Synthetic simulation. In this article we proposed a simulated method, which is called synthetic, generates data with high similarity to the original population while maintaining confidentiality. Thus, estimated parameters are more accurate. The labor force survey (LFS) is one of the important surveys of statistical center of Iran, which provides valuable information about Iran’s LFS situation, specially unemployment rate.In this article, an attempt is made to investigate the application of the synthetic method for simulation target population, using results of the Iran’s LFS, summer 2018, for whole 31 country provinces. Moreover, due to compare the accuracy of Horowitz-Thompson estimates from the simulated population and real population, we have used the asymptotic relative efficiency estimate, which shows that estimation from the synthetic population is more efficient than the estimation obtained from sample of original population. This paper also shows that the proposed method can be used to estimate the parameters of small areas and where the sample size is not sufficient

کلیدواژه‌ها [English]

  • Population Simulation
  • Synthetic Method
  • Unemployment Rate
  • Estimated Asymptotic Relative Efficiency
  • Small Area Estimation
-       معطی، محمدتقی و حمیدرضا نواب‌پور (۱۳۹۴). "شبیه‌سازی جمعیتی کوچک‌ناحیه‌ها در سال پایه"، نامه انجمن جمعیت‌شناسی ایران. دوره ۴، شماره ۱۹، صص ۱۰۷-۸۹.
-       مرکز آمار ایران (۱۳۹۷) نتایج آمارگیری طرح نیروی کار تابستان 1397، تهران.
-       مرکز آمار ایران (۱۳۹۵) نتایج سرشماری نفوس و مسکن ۱۳۹۵، تهران.
-        Alfons, A., Kraft, S., Templ, M. and Filzmoser, P (2011). "Simulation of close-to-reality population data for household surveys with application to EU-SILC." Journal of Statistical Methods and Applications 203:383-407
-        Beckman, R. J., Baggerly, K. A., and McKay, M. D. (1996). "Creating Synthetic Baseline Populations." Transportation Research Part A 30: 415-429.
-        Bidarbakhtnia, A., Zhang, L,. (2017). Synthetic data generation for small area estimation: A pilot study on Indonesian population using simPop, Bangkok.
-        Deming, W. E.; Stephan, F. F. (1940). "On a Least Squares Adjustment of a Sampled Frequency Table When the Expected Marginal Totals are Known." Annals of Mathematical Statistics 11(4): 427–444.
-        Horvitz, D.G. and Thompson, D.J. (1952). "A Generalization of Sampling without Replacement from a Finite Universe." Journal of the American Statistical Association 47: 663-685.
-        Lenormand, M. and Deffuant, G. (2013). "Generating a Synthetic Population of Individuals in Households: Sample-Free Vs Sample-Based Methods." Journal of Artificial Societies and Social Simulation 16(4):12.
-        Morrissey K, O’Donoghue C, Clarke G, Ballas D, Hynes S (2012). "SMILE: An Applied Spatial Micro-Simulation Model for Ireland." Studies in Applied Geography and Spatial Analysis 5:79–94.
-        Nowok, B., Raab, G.M and Dibben, C. (2016). "synthpop: Bespoke creation of synthetic data in R." Journal of Statistical Software 74(11): 1-26.
-        Rubin, D.B. (1993). “Discussion: Statistical Disclosure Limitation.” Journal of Ocial Statistics 92: 461–468.
-        SimTRAVEL Research Initiative (2007). PopGen: Population Generator. Arizona State University, US Environmental Protection Agency, and Federal Highway Administration. URL http://urbanmodel.asu.edu/popgen.html.
-        Synthia Project Team (2012). Synthia: Custom Synthetic Population Generator. System no longer available due to completion of grant funding, URL https://synthia.rti.org/.
-        Templ, Matthias. Meindl, Bernhard. Kowarik, Alexander. Dupriez, Olivier. (2017). "Simulation of Synthetic Complex Data: The R Package simPop." Journal of Statistical Software 79, 10.
-        TRANSIMS Project Team (2008). TRANSIMS: TRansportation ANalysis SIMulation System Version 4. URL http://code.google.com/p/transims/.
-        UNSD (2015), United Nations Fundamental Principles of Official Statistics: Implementation Guidelines. New York: UN.