۱٫۸۰۷

و  طبق فرمول ۳-۳ برای محاسب نهایی محاسبه می شود.

( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

= ۲۴٫۸۸  = ۲۴٫۸۸
در اینجا ۰٫۷ در نظر گرفته شده است. نیز برای محاسبات همان مقدار بهینه ۳ در نظر گرفته می شود. دو کلمه recession و industry هر دو جز مجموعه Yiو Xi هستند پس طبق فرمول۳-۴ و ۳-۵

۳٫۲٫۳ . تشابه جملات بر اساس عبارات مشترک
اگر دو متن کلمات مشابه با هم داشته باشند می توان میزان مشابهت آنها را بر اساس این کلمات مشترک بدست آورد (این کلمات یا همگی در یک موقعیت مکانی هستند، و یا در موقعیت های مختلف در جملات ظاهر می شوند). هستینگز]۲۶ [معتقد بود که این کلمات ارزش چندانی در اندازه گیری شباهت معنایی جملات کوتاه ندارد. در این روش برای آنکه از اهمیت کم این معیار چشم پوشی نشود فاکتور وزنی آن را کمتر از ۵/۰ در نظر می گیریم .
روش کار به این صورت است که ، فرض کنیم P و R دو جمله با کلمات مشابه هستند و|R|<|P|، تمام کلمات مشابه در دو جمله استخراج می شوند. اگر X مجموع کلمات مشابه درP وY مجموع کلمات مشابه در R باشد هر کدام از این مجموعه ها ترتیب مخصوص به خود دارند. از آنجا که تعداد کلمات P بیشتر ازR است و در اصطلاح Pبزرگتر ازR است. به کلمات موجود در مجموعه X به ترتیب موقعیتشان در جمله وزنی از۱ تا اختصاص می دهیم و همین وزن به کلمات مجموعه Y الحاق می شود. سپس میزان شباهت این جمله بر اساس دستور زیر محاسبه می شود.

فرمول ۳-۷
به عنوان مثال دو جمله را در نظر بگیریید
P: Einstein was a German-born theoretical physicist
R: The theoretical physicist – Einstein lived at 19 century
X = {Einstein, theoretical, physicist} X= {1, 2, 3}
Y= {theoretical, physicist, Einstein} Y= {2, 1, 3}
با توجه به فرمول ۳-۷ 
۴٫۲٫۳ . شباهت کلی جملات
Islam روش خود را در۶ مرحله ارائه خلاصه کرده است:
ابتدا تمام کلمات اضافه در جملات برای پیدا کردن کلمات کلیدی پاک می شود اگر P و R دو جمله مورد نظر باشند m کلمه از P و n کلمه از R کلمات اصلی ما را تشکیل می دهند. (حذف حروف و کلمات اضافه)

در این مرحله کلمات مشابه در این مجموعه علامت گذاری می شوند. کلمه مشابه درR وP کنار گذاشته شده و بقیه برای بررسی نگه داشته می شود. اگر m=بود به مرحله ۶ میرویم. در غیراین صورت <m به ترتیب ادامه میدهیم.

ماتریس تشابه خطی دو مجموعه  به صورت زیرتشکیل می شود. هر در به صورت زیر محاسبه می شود :
اگر ،  کاراکتر داشته باشد  و هر ،  کاراکتر  و  به صورتی که  طول کوتاه ترین کلمه و  بلندترین کلمه مشترک است]۲۳ [.

فرمول ۳-۸

مثال زیر این مرحله را توضیح می دهد
=“allmileage_make_maxkm”
=“make_minmile_distance_possible_take”
اجرا مرحله اول
= {all, mileage, make, max, km} m=5
= {make, min, mile, distance, possible, take} n=6
اجرا مرحله دوم
= {all, mileage, max, km}
= {min, mile, distance, possible, take}

به عنوان نمونه میزان شباهت بین possible واینگونه محاسبه شده:

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...