دانلود فایل ها در مورد پیش بینی لینک در شبکه ... |
Connections or Links:شبکه اجتماعی غیر متصل و کامنت ها
User Generated Content:تگ هایی که روی عکس میگذارند
Class Label:گروه هایی که کاربران عضو آن هستند.
جدول ۴-۱ ویژگی های داده های جمع آوری شده فلیکر
Nember | |
۱۹۵ | Categories (Number of groups) |
۸۰،۵۱۳ | Nodes |
۵،۸۹۹،۸۸۲ | Links |
۱٫۸ ×۱۰−۳ | Network density |
۵،۷۰۶ | Maximum degree |
۱۴۶ | Average degree |
۰٫۶۱ | Clustering coefficient |
۴-۳-معیارهای ارزیابی
اگر در حالت کلی گراف G(V, E)، را در نظر بگیریم.vمجموعه ای از گره ها و E مجموعه ای از یال ها میباشد .عموما ما نمیخاهیم بدانیم که آیا لینک ها گم شده اند یا لینک های آینده چیست زیرا این عمل به صورت قطعی غیر ممکن است و فقط ما صحت نتایج را میتوانیم بررسی کنیم. بنابراین برای آزمایش صحت الگوریتم ، لینک های مشاهده شده یعنی E به صورت تصادفی به دو بخش تقسیم میشود: مجموعه آموزشی [۷۵] و مجموعه آزمایشی[۷۶] .مجموعه آزمایشی برای تست انجام میشود و هیچ اطلاعاتی در این مجموعه اجازه ندارد برای پیش بینی استفاده شود در صورتی که در مجموعه داده های آموزشی اطلاعات مشخص میباشد.در این صورت اجتماع داده های آزمایشی و آموزشی مجموع داده ها میباشد.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
مزیت این متد اعتبارسنجی تصادفی در این است که تعداد تکرارها بر روی داده های آموزشی تاثیری ندارد ولی در این روش بعضی از لینک ها ممکن است ظاهر نشده و بعضی از لینک های دیگر در زمان دیگری ظاهر شوند و ممکن است در این روش بعضی از اشکالات آماری رخ دهد و این معایب با بهره گرفتن از روش K-fold cross-validation که لینک های مشاهده شده به k زیرمجموعه به صورت تصادفی بخش بندی میشوند برطرف میشود و به تعداد k مرتبه تکرار میشود.با بهره گرفتن از این متد همه ی لینک ها برای اعتبار سنجی استفاده شده و هر لینک برای پیش بینی واقعی مورد استفاده قرار میگیرد.در این حالت هر چه مقدار k بیشتر باشد لینک های بیشتری بررسی شده و در نتیجه محاسبات نیز افزایش می یابد،مناسب ترین ۱۰-fold cross-validation میباشد که از نظر زمان و کارایی به نتیجه خوبی میرسد.
ماتریس در همریختگی[۷۷] که نشان دهنده مقدارهای درست و غلط حاصل از پیش بینی ها میباشد در جدول ۴-۲نشان داده شده است.
جدول ۴-۲-ماتریس در همریختگی:شامل معیارهایی برای محاسبه نتایج پیش بینی ها
مطابق جدول ۴-۲ مقدار ≡Sensitivity true positive rate≡Recallبه صورت زیر است:
مقدار Accuracy نیز به صورت زیر است:
فرم در حال بارگذاری ...
[چهارشنبه 1400-09-24] [ 10:10:00 ب.ظ ]
|