زیرپوست رکامندرها – قسمت اول – محاسبه تشابه

در مجموعه پست‌هایی که قسمت اول آن را پیش رو دارید، به معرفی و توصیف تکنیک‌ها و الگوریتم‌های مورد استفاده در رکامندر‌ها می‌پردازیم. برخی از این تکنیک‌ها و الگوریتم‌ها در خدمات recommender.ir استفاده شده است.

در مقالات و پست‌های فارسی به ترجمه‌های گوناگونی برای واژه Recommender Systems برمی‌خوریم: سامانه‌های پیشنهاددهنده، سامانه‌های توصیه‌گر و …

در حالی که سعی‌ می‌کنیم فارسی را پاس بداریم در این سری پست‌ها از “رکامندر” بجای واژه‌های یاد شده استفاده می‌کنیم. حتما می‌پرسید چرا. توصیه‌گر یک جورایی توی اعصابه. زورگویی مستتری داره که اجازه نمی‌ده باهاش ارتباط برقرار کنم. پیشنهاددهنده‌ هم خیلی بی‌حس و حال به نظر میاد. پس از “رکامندر” استفاده می‌کنم. منبع این سری MEAP انتشارات منینگ است که در انتهای متن معرفی شده. حتما می‌دونید که سری MEAP کتاب‌هایی هستند که در آینده نزدیک چاپ می‌شن و علاقمندان می‌تونن قبل از چاپ نسخه نهایی به استقبال کتاب مورد علاقه‌شون برن.

 

یافتن تشابه بین کاربران و آیتم‌ها (محتوا)

یکی از مهمترین کاربردهای رکامندرها یافتن تشابه بین کاربران و آیتم‌هاست. تشابه توسط روشهای متنوعی محاسبه می‌شود. قبل از آنکه به معرفی تکنیک‌های محاسبه تشابه بپردازیم، با تابع تشابه (Similarity Function) آشنا می‌شویم:

بین دو آیتم i1 و i2 تشابه عبارت از مقدار تابع زیر است:

sim ( i1, i2 )

مقدار این تابع برابر با ۱ است اگر دو آیتم i1 و  i2 نظیر به نظیر مشابه یکدیگر باشند. ( یکسان باشند )

همچنین مقدار این تابع برابر با صفر است اگر این دو آیتم در هیچ بعدی اشتراک و تشابه نداشته باشند.

محاسبات تشابه با محاسبات فاصله بین آیتم‌ها ارتباط تنگاتنگی دارد. مقدار تابع تشابه با افزایش نزدیکی دو آیتم به یکدیگر افزایش می‌یابد. هم چنین با کاهش تشابه آیتم‌ها به سمت صفر میل می‌کند.

برخی تکنیک‌های محاسبه تشابه

یکی از تکنیک‌های محاسبه تشابه تکنیک جاکارد است. تکنیک جاکارد در کسب‌و‌کارهایی که تنوع کمی در تعامل کاربر دارند، کاربرد دارد. برای مثال در سامانه‌هایی که لایک/دیسلایک یا افزوده شدن به سبد تنها تغییر وضعیت‌هایی دریافتی از بروزر یا اپلیکیشن هستند. در اپلیکیشن‌ها و سایت‌هایی که دامنه متنوعی از مقادیر را برای میزان علاقمندی کاربر به آیتم‌ها می‌توان در نظر گرفت، می‌توان از تکنیک‌های پیرسون و تشابه کسینوسی استفاده کرد. جدول زیر را ببینید:

برخی تکنیک‌های متداول برای محاسبه تشابه کاربران با یکدیگر، عبارتند از:

برخی تکنیک‌های متداول در محاسبه تشابه آیتم‌ها عبارتند از:

 

در قسمت آینده به کاربرد پالایش مشارکتی (Collaborative Filtering) در محاسبه همسایگی آیتم‌ها و تکنیک‌های محاسبه پیشنهاد‌ (recommendation) می‌پردازیم.

 

منبع: 

Excerpt From: Kim Falk. “Practical Recommender Systems MEAP V16.” iBooks. – 2018
0 پاسخ

برای ما بنویسید

دوست داریم نظر شما رو بدونیم

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *