کامنتوم، راه‌حلی برای تحلیل کامنت و ترجمه‌ آن به علاقمندی

پیرو همکاری در یک پروژه تحقیقاتی با کتابخانه ملی، به تحلیل و درک کامنت‌ کاربران علاقمند شده بودم. لذا در سال ۹۳ چهار دامنه برای پروژه‌هایی به دو نام کامنتوم و داکیومنتوم رجیستر کردم. همزمان یکی از دانشجویان دانشگاه شهیدبهشتی (همکلاسی) بر پایان نامه‌ای با موضوع Opinion Spam Detection کار می‌کرد. در آنزمان یکسال از عمر رکامندر می‌گذشت و موفقیت‌های کوچکی حاصل شده بود. ارائه مشاوره به آن همکلاسی و نیاز‌های روز افزودن کاربران وب ذهنم را حسابی درگیر کرده بود. تا آن زمان رکامندر قادر بود رفتار کاربر با ماوس (شامل کلیک، اسکرول…) را به علامندی ترجمه و طیف وسیعی از کاربرد‌ها در حوزه پیش‌بینی رفتار کاربر را در اختیار قرار دهد. ولی قادر به تحلیل کامنت‌ها نبودیم.

در حوزه تحلیل متن فارسی کارهای بسیاری انجام شده. با مطالعه فارس‌نت، محصول خوب آزمایشگاه زبان‌ طبیعی دانشگاه شهید بهشتی شروع کردم. سپس به محصولات موفقی همچون هضم از گروه موفق صبحه سر زدم. خلاصه ساز‌ها و کتابخانه‌های موجود پایتون را بررسی کردم. بارها آزمایش کردم. در نهایت نتیجه‌ای که حاصل شد، توسعه محصولی جدید و بر پایه ایده‌ و طرحی متفاوت بود.

تا اوایل سال ۹۵ پیشرفت‌هایی جزئی حاصل شد. چرا که رکامندر تمام انرژی تیم بسیار کوچک ما را می‌بلعید. پیرو گسترش کمی و کیفی مشتریان رکامندر، با نیاز‌های بزرگان وب ایران در حوزه تحلیل کامنت به خوبی آشنا شده بودم. پس از نسخه ۲.۶ رکامندر که در پایان تیرماه ۱۳۹۵ ریلیز شد، فرصتی اندک حاصل شد تا به دو پروژه کامنتوم و هایپرسپیس (مصور سازی داده) بیشتر بپردازیم. توسعه هایپرسپیس را به یکی از بهترین برنامه‌نویسان وب ایران سپردم… بزودی خبرهای خوبی از هایپرسپیس می‌شنوید.

طی یکماه تمام ماژول‌هایی که در طول دو سال گذشته به صورت پراکنده پیرامون کامنتوم توسعه داده شده بود، یکپارچه شد. تست‌های اولیه ماورای انتظار بود.

در توسعه کامنتوم تاجایی که توانستیم از روش‌های کلاسیک پرهیز کردیم. چرا که نتایجی که از روش‌های کلاسیک حاصل می‌شد را قبلا آزموده بودیم. قصد ما ترجمه ماشینی یا ریشه یابی و کنترل صحت جملات نبود. ما به دنبال کشف ذائقه کامنت نویس بودیم. پس راهی دیگر بر گزیدیم.

تا انتهای مرداد دو محصول معرفی می‌کنیم:

۱. نسخه ۲.۷ رکامندر که به کمک کامنتوم، ارزش‌هایی عمیق تر و ماندگار تر خلق می‌کند. همچنین ۲.۷ مجهز به الگوریتم‌های طبقه بندی مشتریان (Customer Segmentation) است.

۲. نسخه اولیه کامنتوم که به صورت بلادرنگ کامنت کاربران فارسی را تحلیل نموده و به اعدادی قابل اندازه گیری بدل می‌کند.

اینتگرشنی که مدتهاست به دنبال آن بودیم آرام آرام شکل می‌گیرد:

comment_analysis-1024x663

 

در ابتدای سال ۹۴ با مساعدت شرکت محترم دیجی‌کالا، انبوهی از کامنت‌های خام کاربران در اختیار ما قرار گرفت. سعی کردیم کامنتوم مستقل از زبان / زمینه باشد. ولی نتوانستیم این وابستگی را به صفر برسانیم. لذا نسخه فعلی کامنتوم در پاسخ به نیاز‌های یک کسب و کار آنلاین (مشابه دیجی‌کالا) کارایی بالاتری به نمایش می‌گذارد.

یک استارتاپ کوچک داوطلب یافتن خطا‌ها و ارائه پیشنهاد برای بهبود خدمات کامنتوم شد. در پایان مرداد API ای محدود برای آزمایش توسط مشتریان انتخاب شده دیگری نیز در اختیار علاقمندان قرار می‌گیرد.

با پایان شهریور استفاده صنعتی از کامنتوم را آغاز می‌کنیم.

0 پاسخ

برای ما بنویسید

دوست داریم نظر شما رو بدونیم

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *