- صفحه نخست
- سفارش
- مقالات وبلاگ
- خدمات
- همکاری
- قوانین و مقررات
- درباره ما
- تماس با ما
فهرست مطالب (با کلیک روی هر عنوان به همان قسمت هدایت خواهید شد)
در این مقاله قصد داریم به معرفی روش های آنالیز آماری در اقتصاد سنجی بپردازیم.
ابتدا به تعریف اقتصاد سنجی می پردازیم سپس به طور کلی به روش های اقتصاد سنجی اشاره می کنیم.
اقتصاد سنجی شاخه ای از اقتصاد است که به استفاده از روش های ریاضی (به ویژه آمار) در توصیف سیستم های اقتصادی می پردازد.
به بیانی بهتر اقتصاد سنجی عبارت است از تحلیل کمی پدیدههای اقتصادی واقعی مبتنی بر توسعه همزمان نظریه و مشاهده، مرتبط با روشهای استنتاج مناسب. این علم از ریاضیات، استنتاج آماری و تئوری اقتصادی برای تعیین کمیت پدیده های اقتصادی استفاده می کند.
اقتصاددانان می گویند که اقتصاد سنجی مدل های نظری اقتصادی را به ابزارهایی تبدیل می کند که قانون گذاران، یعنی سیاست گذاران، می توانند برای سیاست گذاری از آنها استفاده کنند.
اقتصاد سنجی گزاره های کیفی را به گزاره های کمی تبدیل می کند. اقتصاد سنجی یک وسیله آماری است که به شما کمک می کند رابطه بین متغیرهای مختلف اقتصادی، اجتماعی و…بررسی کنید. برای مثال اگر بخواهیم اثر متغیر تحصیلات را بر متغیر تحصیلات بررسی کنیم باید از اقتصادسنجی کمک بگیریم. سپس این رابطه را با نظریه اقتصادی واجد شرایط ارزیابی می کنیم. و در نهایت، با استفاده از تکنیک های ریاضی و آماری (مثلاً رگرسیون) آن رابطه را به صورت کمی تبدیل می کنیم.
به منظور تحلیل آماری ابتدا باید به جمع آوری داده بپردازیم. با استفاده از داده های آماری در دنیای واقعی می توانیم تحلیل های مختلفی را با کمک نرم افزارهای آماری مختلف از جمله اویوز، استتا و…انجام دهیم.
در واقع اقتصاد سنجی زیرمجموعه ای از علم اقتصاد است که از مدل های ریاضی و آماری با تئوری های اقتصادی برای درک، توضیح و اندازه گیری و مدل سازی علیت در سیستم های اقتصادی استفاده می کند.
اقتصاد سنجی زیرمجموعه ای از علم اقتصاد است که از آمار و تکنیک های ریاضی برای «توجیه» یک مدل اقتصادی نظری با دقت تجربی استفاده می کند. به عبارت دیگر، اقتصاد سنجی رشته اغلب محرمانه اقتصاد نظری را به ابزارهای سیاست گذاری و تصمیم گیری در بخش های دولتی و خصوصی تبدیل می کند. حوزه اقتصاد سنجی تا حد زیادی با پدیده های کلان اقتصادی مانند اشتغال، دستمزد، رشد اقتصادی، محیط زیست، کشاورزی و نابرابری سر و کار دارد.
هیچ مرز مشخصی برای روش های اماری اقتصاد سنجی وجود ندارد بنابراین فهرست کردن تمام روشها، ابزارها و تکنیکهایی که در آن قرار میگیرند دشوار است.
ما در این مطلب به طور کلی روش های آماری در اقتصاد سنجی را به چهار دسته تقسیم بندی کردیم:
آمار توصیفی نقش کلیدی در تجزیه و تحلیل داده های اکتشافی (EDA ) در پروژه های علم داده ایفا می کند. آمار توصیفی گرایش مرکزی، پراکندگی و توزیع داده ها را با استفاده از تکنیک های آماری اندازه گیری می کند.
آزمون فرضیه به طور کلی به بررسی یک ادعا در برابر حقایق پذیرفته شده (به نام “فرضیه صفر”) اشاره دارد و از داده های نمونه برای تأیید ادعای کل جمعیت استفاده می کند.
از آنجایی که امکان بررسی همه افراد وجود ندارد، محقق از جمعیت دو نمونه نمونه برداری می کند و فرضیه (یعنی ادعا) را در مقابل فرضیه صفر آزمایش می کند.
بنابراین آزمون فرضیه آزمون یک ادعا است، اما دقیقاً چگونه می توانید اعتبار ادعا را اندازه گیری کنید؟ چندین آزمایش برای آن وجود دارد:
🎓انجام پایان نامه ارشد و دکتری در همه رشته ها با چاپ مقاله 📝
آزمون t زمانی استفاده می شود که 1 متغیر مستقل (مثلاً جنسیت) با 2 سطح (مثلاً پسران در مقابل دختران) و 1 متغیر وابسته (مثلاً نمره آزمون) وجود داشته باشد.
ANOVA زمانی استفاده می شود که 1 متغیر مستقل با بیش از 2 سطح وجود داشته باشد.
ما می توانیم از آزمون ANOVA برای مقایسه تامین کنندگان مختلف و انتخاب بهترین های موجود استفاده کنیم. )ANOVA تحلیل واریانس) زمانی استفاده می شود که بیش از دو گروه نمونه داشته باشیم و مشخص کنیم که آیا تفاوت آماری معنی داری بین میانگین دو یا چند گروه نمونه مستقل وجود دارد یا خیر.
در فرضیهای مانند «تفاوت نظر لیبرالها، محافظهکاران و مستقلها در مورد سیاست مالیاتی پیشنهادی» 1 متغیر مستقل (وابستگی حزبی) با بیش از 2 سطح (لیبرالها، محافظهکاران، مستقلها) و 1 متغیر وابسته (نظر در مورد سیاست مالیاتی) داریم).
یک آزمون فرضیه آماری است که در تجزیه و تحلیل جداول احتمالی زمانی که حجم نمونه بزرگ است استفاده می شود.
به عبارت ساده تر، این آزمون در درجه اول برای بررسی اینکه آیا دو متغیر طبقه بندی شده در تأثیرگذاری بر آمار آزمون (مقادیر درون جدول) مستقل هستند استفاده می شود.
این آزمون زمانی معتبر است که آماره آزمون خی دو تحت فرضیه صفر توزیع شده باشد، به ویژه آزمون کای دو پیرسون و انواع آن.
رگرسیون مبحث بسیار گسترده ای است اما در زیر تکنیکها و مدلهای مرتبط مورد استفاده در مسائل رگرسیون در حوزه اقتصادسنجی را خلاصه میکنیم.
مدلهای خطی تکنیکهایی هستند که به طور گسترده برای متغیرهای وابسته پیوسته استفاده میشوند. دو تکنیک خاص در خانواده مدل های خطی رگرسیون ساده و چندگانه است. رگرسیون خطی ساده دارای یک متغیر وابسته است و با یک متغیر مستقل توضیح داده می شود (به عنوان مثال وزن در مقابل قد). از سوی دیگر، رگرسیون خطی چندگانه، بیش از یک متغیر توضیحی دارد (به عنوان مثال وزن توضیح داده شده با قد و سن). انواع مختلفی از مدل های خطی مانند رگرسیون Ridge و LASSO وجود دارد.
مدلهای دادههای پانل، تکنیکهای رگرسیون تخصصی هستند که در مدلسازی دادههای سری زمانی استفاده میشوند. این یک روش قدرتمند برای پیش بینی مشاهدات وابسته به زمان است. برخی از تکنیکهای مورد استفاده در مدلهای دادههای پانل عبارتند از OLS ترکیبی (حداقل مربع معمولی)، مدل اثرات ثابت و مدل اثرات تصادفی.
مدلهای دادههای شمارش برای مدلسازی دادههای شمارش (به عنوان مثال تعداد جرایم) به عنوان تابعی از متغیرهای کمکی (مانند بیکاری، درآمد و…) استفاده میشوند. دو روش برای رگرسیون داده های شمارش عبارتند از پواسون و دو جمله ای منفی.
مدلهای حاصل یا نتیجه باینری زمانی استفاده میشوند که متغیر وابسته باینری باشد (به عنوان مثال بله/خیر، تایید/عدم تایید). در اقتصاد سنجی، مدل های لاجیت(Logit (و پروبیت) ( Probitبرای مدل سازی نتایج باینری اعمال می شوند.
در جاهایی استفاده میشوند که مدلهای خطی شکست میخورند – یا به این دلیل که نتیجه دادههای شمارش است یا به این دلیل که پیوسته است. اما به طور معمول توزیع نمیشود. یک GLM از سه جزء تشکیل شده است: الف) یک جزء تصادفی، که یک خانواده نمایی از توزیع های احتمال است. ب) یک جزء سیستماتیک، که یک پیش بینی خطی است. و ج) یک تابع پیوند که رگرسیون خطی را تعمیم می دهد.
همانطور که از نام آن پیداست، خودرگرسیون رگرسیون یک متغیر بر روی خود، بر روی مقدار گذشته آن است. در این مورد، متغیرهای مستقل مقادیر گذشته همان سری داده های تک متغیره ای هستند که پیش بینی می شوند. خودرگرسیون برداری این مفهوم تک متغیره را تعمیم می دهد و امکان گنجاندن متغیرهای همبسته اضافی را در مدل فراهم می کند. در این فرآیند، متغیر وابسته با استفاده از مقادیر گذشته (تاخر) خود و همچنین مقادیر تاخیر عوامل برونزا پیشبینی میشود.
مانند رگرسیون، پیشبینی نیز یک موضوع تحقیقاتی خوب و بزرگ است. جای تعجب نیست که یک جعبه ابزار پیش بینی غنی با گزینه های مختلف برای دانشمندان داده وجود دارد. بیشتر اوقات، این تکنیکها ارتباط نزدیکی با یکدیگر دارند و محدودیتهای یک تکنیک منجر به توسعه تکنیک دیگر میشود.
این مدل ها در مجموع به عنوان پیش بینی “معیار” یا “پایه” شناخته می شوند. این تکنیکها به ندرت در عمل به کار میروند، اما به ایجاد شهود پیشبینی کمک میکنند تا لایههای بیشتری از پیچیدگی اضافه شود. برخی از تکنیک ها در پیش بینی معیار عبارتند از: ساده، فصلی، متوسط، ساده فصلی، رانش، روند خطی، پیاده روی تصادفی و پیاده روی تصادفی هندسی.
یک سری زمانی به 3 جزء تقسیم می شود: روند، فصلی و نویز سفید (یعنی نقاط داده تصادفی). برای اهداف پیشبینی، میتوانیم مؤلفههای قابل پیشبینی (یعنی روند و فصلی) را پیشبینی کنیم، اما نه شرایط غیرقابل پیشبینی را که بهصورت تصادفی رخ میدهند. هموارسازی نمایی می تواند این نوع تغییرپذیری را در یک سری با صاف کردن نویز سفید کنترل کند. برخی از انواع هموارسازی نمایی عبارتند از: هموارسازی نمایی ساده، روند خطی Holt و هموارسازی نمایی Holt-Winter.
این مدل مجموعه ای از مدل ها را نشان می دهد که نزدیک به یکدیگر هستند. میانگین متحرک یکپارچه خودرگرسیونARIMA مسلماً محبوبترین و پرکاربردترین تکنیک آماری برای پیشبینی است. همانطور که از نام آن پیداست، ARIMA دارای 3 مؤلفه است: الف) یک مؤلفه Autoregressive برای مدلسازی رابطه بین سری و مقادیر تأخیر آن. ب) یک مؤلفه میانگین متحرک که ارزش آینده را به عنوان تابعی از خطاهای پیشبینی تأخیر پیشبینی میکند. و ج) یک جزء مجتمع که سری را ثابت می کند. برخی از انواع دیگر این مجموعه مدلسازی عبارتند از: SARIMA، ARIMAX، SARIMAX و… .