۳-۱۰-۱-۱ضریب تعیین

ریشه دوم ضریب تعیین است که می‌تواند مقادیری بین ۱- و ۱+ را به خود بگیرد و علامت آن همان شیب خط رگرسیون (b) است. یعنی اگر شیب خط رگرسیون مثبت باشد، ضریب همبستگی ® نیز مثبت، و اگر شیب خط رگرسیون منفی باشد، ضریب همبستگی نیز منفی خواهد بود. و اگر (b) صفر باشد، ® نیز صفر خواهد بود.

ضریب همبستگی شدت و نوع رابطه را نیز نشان می‌دهد. ضریب فوق بر حسب روابط زیر محاسبه می شود:

رابطه (۳-۶)

رابطه (۳-۷)

رابطه (۳-۸)

رابطه (۳-۹)

۳-۱۰-۱-۲- ضریب تعیین تعدیل شده:

مهمترین معیاری است که با آن می توان رابطه بین دو متغیر xو y را نشان داد. این ضریب میزان انحراف مشاهدات (y)، با برآورد خط رگرسیون را اندازه می‌گیرد و بین صفر تا یک در نوسان می‌باشد، به طوری که مقدار صفر بیانگر آن است که خط رگرسیون هرگز نتوانسته است تغییرات yرا به تغییرات متغیر مستقل xنسبت دهد و مقدار یک بیانگر آن است که خط رگرسیون به طور دقیق توانسته است تغییرات yرا به تغییرات متغیر مستقل xنسبت دهد. رابطه محاسبه ضریب مذکور عبارت است از:

رابطه ۳-۱۰)

رابطه ۳-۱۱)

در روابط فوق علائم به کار گرفته شده به ترتیب زیر معرفی می‌شوند:

Y: متغیر وابسته X: متغیر مستقل

B: ضریب رگرسیون r: ضریب همبستگی بین Xو Y

Sy: انحراف از استاندارد متغیر وابسته Sx: انحراف از استاندارد متغیر مستقل

لازم به توجه است که ضریب تعیین در مقایسه با ضریب همبستگی، معیار گویاتری است

۳-۱۱-مدل های رگرسیونی داده های ترکیبی[۵۷]

واژه رگرسیون برای اولین بار توسط گالتون[۵۸]، در سال ۱۸۷۷ به کار رفت. این واژه به معنی بازگشت بوده و نشان دهنده آن است که مقدار یک متغیر به متغیر دیگری مربوط است. مدل‌های رگرسیون ‌بر اساس این نظریه ساخته ‌شده‌اند که اگر دو عامل با یکدیگر همبستگی داشته باشند تغییر یکی با تغییر دیگری قرین خواهد شد. هر چه ارتباط دو عامل مذبور به یکدیگر نزدیکتر باشد ضریب همبستگی تغییرات آن ها بزرگ تر و به حداکثر همبستگی یعنی ۱، نزدیکتر خواهد بود. ‌بنابرین‏ اگر روند گذشته نشان دهد که بین تغییر یک عامل و تغییرات چند عامل دیگر همبستگی معناداری وجود دارد، می توان تصور کرد که در آینده نیز همبستگی مذبور حفظ خواهد شد و اگر ضریب همبستگی مذبور را بدانیممی توان اندازه تغییر عامل وابسته را نسبت به تغییر عامل مستقل مرتبط با آن، اندازه گیری و پیش‌بینی کنیم.

در اکثر مدل‌های رگرسیونی، معمولا می‌خواهیم تغییرات یک متغیر را (y) بر حسب تعدادی از متغیرها (xها) که معتقدیم که باعث تغییرات y می شود توضیح دهیم. اغلب این کار را در قالب یک تابع انجام می‌دهیم:

رابطه ۳-۱۲)

k=1,2…N i=1,2… N

اندیس k تعداد متغیرهای توضیح دهنده را نشان می‌دهد. اغلب برای شروع، شکل این تابع را خطی فرض می‌کنند:

رابطه ۳-۱۳)

در اینجا اندیس i نشان دهنده تعداد مشاهداتی است که از هر متغیر در دست داریم. تعداد مشاهدات می‌تواند بر حسب زمان باشد، در این صورت yt و xkt را داریم که هر متغیر در طول سال، فصل، ماه و …. اندازه گیری می شود و خواهیم داشت t,…,1,2 =t به عبارت دیگر yt و xkt سری زمانی[۵۹] می‌باشند.یعنی یک متغیر واحد که مقادیر آن در فاصله زمانی مورد نظر ‌بر اساس یک مکانیزم معین (مثلا یک مکانیزم آماری) تولید می شود. در حالت دیگر می توان در یک زمان خاص، برای مثال در یک سال معین، یک متغیر را در یک جامعه آماری اندازه گیری کرد. در این حالت یک مقطع از جامعه را در یک زمان خاص پیمایش کرده­ایم که به زبان فنی تر آن را برش مقطعی می گوئیم ‌با اعمال فرض­های کلاسیک رگرسیون،مدل مذکور برای یافتن bها یاضرایب تابع برآورد می­ شود.

بانقض فروض کلاسیک با مشکلاتی چون همبستگی پیاپی[۶۰]جملات اخلال یعنی tɛ در مدل های سری زمانی و واریانس ناهمسانی در مدل های مقطعی روبرو می‌شویم. آزمون های آماری ‌در مورد ضرایب، آماره های R2 و F رگرسیون و نظایر آن به تعدادی مشاهدات یعنی، T ‌در مورد سری زمانی و N ‌در مورد داده های مقطعی و تعداد پارامترها (βهای) برآورد شده بستگی دارد، اغلب با یک مشکل عمومی در این مدل‌ها روبرو می‌شویم، متغیرهای توضیحی یعنی xها با یکدیگر هم‌خطی دارند که باعث می شود مقادیر درست βها برآورد نشود و استنتاج با مشکل مواجه شود.در مدل های پانل دیتا، متغیرها را هم در میان مقاطع جامعه آماری و هم در طول زمان اندازه گیری می‌کنیم. البته باید توجه داشت که متغیر ها باید در طول سالها یکسان بمانند که در صورت عدم رعایت آن پانل نامتوازن[۶۱] خواهد بود.‌به این ترتیب با دو بعد سروکار داریم: بعد زمان و بعد مقاطع، که آن را داده های گروهی- زمانی[۶۲] نیز می‌گویند.

واضح است که تعداد مشاهدات از یک متغیر، چندین برابر شده است، یعنی از T یا N در داده های سری زمانی یا داده های مقطعی به N × T در داده های پانل، افزایش یافته است. متغیرها در عرض جامعه اندازه گیری می شود و واریانس عرض، اطلاعات زیادی برای آزمون فرضیات فراهم می آورد. در طول دوره زمانی نیز همین متغیر اندازه ­گیری شده و واریانس آن در طول زمان می ­تواند اطلاعات مفیدی از پویایی های[۶۳] متغیر مربوطه در طول زمان برای آزمون فرضیات با ماهیتی دیگر فراهم کند و امکان مدل سازی شبیه آنچه در ادبیات سری زمانی مطرح است به وجود آید.

برای آشنایی بیشتر با پانل دیتا ابتدا نماد مدل خطی پانل دیتا را نشان می‌دهیم و سپس به معرفی نمایش ماتریسی خواهیم پرداخت:

رابطه۳-۱۴)

که به زبان ماتریسی به صورت زیر است:

رابطه۳-۱۵) ۱,….,T

اندیس i برای افراد یا مقاطع ( تعداد N) و اندیس t برای زمان ( از ۱ تا T) در نظر گرفته شده است. به عبارت دیگر داده ها این طور سازماندهی می‌شوند:

رابطه۳-۱۶)

۳-۱۲-مزایای پانل دیتا در مقایسه با داده های مقطعی یا سری زمانی

الف) تعداد مشاهدات و داده ها در پانل دیتا بسیار بیشتر بوده و باعث می شود اعتماد به برآوردها بیشتر شود.

ب) به محققان تجربی اجازه می‌دهد مدل های پیشرفته تری را تبیین کرده و آزمون کنند که فرضیه های مقید کننده کمتری در بر داشته باشد.

ج) زیاد بودن تعداد مشاهدات مسئله هم‌خطی بودن را نیز تا حدود زیادی حل می‌کند.

د) با این مجموعه داده ها می توان اثراتی را شناسایی و اندازه گیری کرد که در داده های مقطعی محض یا سری زمانی قابل شناسایی نیست.

ه) استفاده از داده های پانل دیتا تورش برآورد را از بین می‌برد و یا کم می کند.

۳-۱۳-آزمون­ناهمسانی واریانس­ها

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...