دانلود متن کامل پایان نامه ارشد – ۳-۱۰-۱-۱ضریب تعیین – پایان نامه های کارشناسی ارشد |
۳-۱۰-۱-۱ضریب تعیین
ریشه دوم ضریب تعیین است که میتواند مقادیری بین ۱- و ۱+ را به خود بگیرد و علامت آن همان شیب خط رگرسیون (b) است. یعنی اگر شیب خط رگرسیون مثبت باشد، ضریب همبستگی ® نیز مثبت، و اگر شیب خط رگرسیون منفی باشد، ضریب همبستگی نیز منفی خواهد بود. و اگر (b) صفر باشد، ® نیز صفر خواهد بود.
ضریب همبستگی شدت و نوع رابطه را نیز نشان میدهد. ضریب فوق بر حسب روابط زیر محاسبه می شود:
رابطه (۳-۶)
رابطه (۳-۷)
رابطه (۳-۸)
رابطه (۳-۹)
۳-۱۰-۱-۲- ضریب تعیین تعدیل شده:
مهمترین معیاری است که با آن می توان رابطه بین دو متغیر xو y را نشان داد. این ضریب میزان انحراف مشاهدات (y)، با برآورد خط رگرسیون را اندازه میگیرد و بین صفر تا یک در نوسان میباشد، به طوری که مقدار صفر بیانگر آن است که خط رگرسیون هرگز نتوانسته است تغییرات yرا به تغییرات متغیر مستقل xنسبت دهد و مقدار یک بیانگر آن است که خط رگرسیون به طور دقیق توانسته است تغییرات yرا به تغییرات متغیر مستقل xنسبت دهد. رابطه محاسبه ضریب مذکور عبارت است از:
رابطه ۳-۱۰)
رابطه ۳-۱۱)
در روابط فوق علائم به کار گرفته شده به ترتیب زیر معرفی میشوند:
Y: متغیر وابسته X: متغیر مستقل
B: ضریب رگرسیون r: ضریب همبستگی بین Xو Y
Sy: انحراف از استاندارد متغیر وابسته Sx: انحراف از استاندارد متغیر مستقل
لازم به توجه است که ضریب تعیین در مقایسه با ضریب همبستگی، معیار گویاتری است
۳-۱۱-مدل های رگرسیونی داده های ترکیبی[۵۷]
واژه رگرسیون برای اولین بار توسط گالتون[۵۸]، در سال ۱۸۷۷ به کار رفت. این واژه به معنی بازگشت بوده و نشان دهنده آن است که مقدار یک متغیر به متغیر دیگری مربوط است. مدلهای رگرسیون بر اساس این نظریه ساخته شدهاند که اگر دو عامل با یکدیگر همبستگی داشته باشند تغییر یکی با تغییر دیگری قرین خواهد شد. هر چه ارتباط دو عامل مذبور به یکدیگر نزدیکتر باشد ضریب همبستگی تغییرات آن ها بزرگ تر و به حداکثر همبستگی یعنی ۱، نزدیکتر خواهد بود. بنابرین اگر روند گذشته نشان دهد که بین تغییر یک عامل و تغییرات چند عامل دیگر همبستگی معناداری وجود دارد، می توان تصور کرد که در آینده نیز همبستگی مذبور حفظ خواهد شد و اگر ضریب همبستگی مذبور را بدانیممی توان اندازه تغییر عامل وابسته را نسبت به تغییر عامل مستقل مرتبط با آن، اندازه گیری و پیشبینی کنیم.
در اکثر مدلهای رگرسیونی، معمولا میخواهیم تغییرات یک متغیر را (y) بر حسب تعدادی از متغیرها (xها) که معتقدیم که باعث تغییرات y می شود توضیح دهیم. اغلب این کار را در قالب یک تابع انجام میدهیم:
رابطه ۳-۱۲)
k=1,2…N i=1,2… N
اندیس k تعداد متغیرهای توضیح دهنده را نشان میدهد. اغلب برای شروع، شکل این تابع را خطی فرض میکنند:
رابطه ۳-۱۳)
در اینجا اندیس i نشان دهنده تعداد مشاهداتی است که از هر متغیر در دست داریم. تعداد مشاهدات میتواند بر حسب زمان باشد، در این صورت yt و xkt را داریم که هر متغیر در طول سال، فصل، ماه و …. اندازه گیری می شود و خواهیم داشت t,…,1,2 =t به عبارت دیگر yt و xkt سری زمانی[۵۹] میباشند.یعنی یک متغیر واحد که مقادیر آن در فاصله زمانی مورد نظر بر اساس یک مکانیزم معین (مثلا یک مکانیزم آماری) تولید می شود. در حالت دیگر می توان در یک زمان خاص، برای مثال در یک سال معین، یک متغیر را در یک جامعه آماری اندازه گیری کرد. در این حالت یک مقطع از جامعه را در یک زمان خاص پیمایش کردهایم که به زبان فنی تر آن را برش مقطعی می گوئیم با اعمال فرضهای کلاسیک رگرسیون،مدل مذکور برای یافتن bها یاضرایب تابع برآورد می شود.
بانقض فروض کلاسیک با مشکلاتی چون همبستگی پیاپی[۶۰]جملات اخلال یعنی tɛ در مدل های سری زمانی و واریانس ناهمسانی در مدل های مقطعی روبرو میشویم. آزمون های آماری در مورد ضرایب، آماره های R2 و F رگرسیون و نظایر آن به تعدادی مشاهدات یعنی، T در مورد سری زمانی و N در مورد داده های مقطعی و تعداد پارامترها (βهای) برآورد شده بستگی دارد، اغلب با یک مشکل عمومی در این مدلها روبرو میشویم، متغیرهای توضیحی یعنی xها با یکدیگر همخطی دارند که باعث می شود مقادیر درست βها برآورد نشود و استنتاج با مشکل مواجه شود.در مدل های پانل دیتا، متغیرها را هم در میان مقاطع جامعه آماری و هم در طول زمان اندازه گیری میکنیم. البته باید توجه داشت که متغیر ها باید در طول سالها یکسان بمانند که در صورت عدم رعایت آن پانل نامتوازن[۶۱] خواهد بود.به این ترتیب با دو بعد سروکار داریم: بعد زمان و بعد مقاطع، که آن را داده های گروهی- زمانی[۶۲] نیز میگویند.
واضح است که تعداد مشاهدات از یک متغیر، چندین برابر شده است، یعنی از T یا N در داده های سری زمانی یا داده های مقطعی به N × T در داده های پانل، افزایش یافته است. متغیرها در عرض جامعه اندازه گیری می شود و واریانس عرض، اطلاعات زیادی برای آزمون فرضیات فراهم می آورد. در طول دوره زمانی نیز همین متغیر اندازه گیری شده و واریانس آن در طول زمان می تواند اطلاعات مفیدی از پویایی های[۶۳] متغیر مربوطه در طول زمان برای آزمون فرضیات با ماهیتی دیگر فراهم کند و امکان مدل سازی شبیه آنچه در ادبیات سری زمانی مطرح است به وجود آید.
برای آشنایی بیشتر با پانل دیتا ابتدا نماد مدل خطی پانل دیتا را نشان میدهیم و سپس به معرفی نمایش ماتریسی خواهیم پرداخت:
رابطه۳-۱۴)
که به زبان ماتریسی به صورت زیر است:
رابطه۳-۱۵) ۱,….,T
اندیس i برای افراد یا مقاطع ( تعداد N) و اندیس t برای زمان ( از ۱ تا T) در نظر گرفته شده است. به عبارت دیگر داده ها این طور سازماندهی میشوند:
رابطه۳-۱۶)
۳-۱۲-مزایای پانل دیتا در مقایسه با داده های مقطعی یا سری زمانی
الف) تعداد مشاهدات و داده ها در پانل دیتا بسیار بیشتر بوده و باعث می شود اعتماد به برآوردها بیشتر شود.
ب) به محققان تجربی اجازه میدهد مدل های پیشرفته تری را تبیین کرده و آزمون کنند که فرضیه های مقید کننده کمتری در بر داشته باشد.
ج) زیاد بودن تعداد مشاهدات مسئله همخطی بودن را نیز تا حدود زیادی حل میکند.
د) با این مجموعه داده ها می توان اثراتی را شناسایی و اندازه گیری کرد که در داده های مقطعی محض یا سری زمانی قابل شناسایی نیست.
ه) استفاده از داده های پانل دیتا تورش برآورد را از بین میبرد و یا کم می کند.
۳-۱۳-آزمونناهمسانی واریانسها
فرم در حال بارگذاری ...
[جمعه 1401-09-25] [ 01:31:00 ق.ظ ]
|