دسته‌بندی موضوعی محتوا

دی‌ماه را متمرکز روی کامنتوم کار کردیم. یک سفارش داشتیم و باید به سرعت به شکل یک اندپوینت روی کامنتوم پیاده‌سازی می‌شد. نظرتون رو به گفتگوی اولیه‌ای که بین ما مشتری اتفاق افتاده جلب می‌کنم:

مشتری: من به شما تعداد محدودی محتوای متنی فارسی می‌دم. این محتوا می‌تونه کامنت کاربرا باشه یا پست‌های روی سایت‌های خبری و وبلاگ‌ها. خودم بهتون می‌گم که از نظر من هر کدام در چه دسته‌بندی قرار می‌گیره. سرویس شما بعد از اینکه یاد گرفت دسته‌بندی‌های مد نظر ما چی هستن، انتظار داریم پست‌های جدید رو هم برای ما دسته‌بندی کنه. دوست داریم در حد کسی که دوره راهنمایی رو تموم کرده دقیق باشه و نه بیشتر. برامون مهمه که سرویس بتونه بلادرنگ (Real-Time) پاسخ بده

منظورتون از بلادرنگ دقیقا چیه؟ تا چه اندازه تاخیر برای شما قابل قبوله؟

مشتری: حداکثر ۱۰۰ میلی ثانیه. کمتر هم بشه اشکالی نداره 😉

تعداد مثال‌هایی که در اختیارمون می‌ذارین چند تاست؟

مشتری: بین ۵ تا ۱۰۰۰ تا.  ممکنه بیشتر هم باشن. هر کدام حداقل یک خط و حداکثر ممکنه تا ۱۰ مگابایت متن داشته باشه.

بسیار خوب. نمونه‌هاتون رو لطفا بفرستین.

بعد از این گفتگو کار رو شروع کردیم. زیرساخت مورد نیاز رو قبلا در کامنتوم توسعه داده بودیم. کافی بود به سمت نیاز مشتری نزدیک بشیم. دسته‌بندی‌هایی که در اختیار ما گذاشت عبارت بودند از:

  • اقتصادی
  • ورزشی
  • رمانتیک و احساسی
  • خانواده و کودک
  • بهداشت و سلامت
  • سیاسی
  • فناوری
  • صنعت

مشتری برای هر دسته بندی تعدادی لینک از پست‌هایی متنوع فرستاد. ما هم سرویس رو برای شناسایی هر دسته‌ آموزش دادیم.

در حال حاضر سرعت پاسخگویی حدود ۵ میلی‌ثانیه به ازای هر پست ۱۰۰۰ کلمه‌اس‌ست که نظر مشتری رو جلب کرده.

دسته‌بندی‌ها محدودیتی نداره. می‌تونیم برای مثال پست‌های فوتبال، شنا، اسکی، دو‌میدانی و … رو هم تفکیک کنیم.

همچنین این مکانیزم رو روی تحلیل کامنت‌های کاربران هم به کار گرفتیم و خروجی رو در اختیار اندپوینت دیگری که قبلا توسعه داده بودیم قرار دادیم. برای این بخش نیز پستی رو به زودی آماده می‌کنیم. نتایج فوق‌العاده خوب و دقیق هستن.

برای آزمایش سرویس فعلا از سواگر استفاده می‌کنیم. اگر با سواگر آشنا هستید که کار بسیار ساده است. اگر نه می‌تونید طبق دستورالعمل زیر سرویس رو محک بزنید.

معرفی و دموی خدمت طبقه‌بندی محتوا را در این فیلم ببینید:

 

 

کامنتوم در تحلیل بلادرنگ کامنت‌های کاربران نیز بسیار چابک و دقیق است. فیلم زیر را ملاحظه کنید:

 

توجه: برای آزمایش سرویس کافیه با ما تماس بگیرین تا لینک سرویس آزمایشی در اختیارتون قرار بگیره.

 

 

خودتان آزمایش کنید

برای آزمایش سرویس کافیه بخش‌هایی از محتوایی که می‌خواهید طبقه‌بندی بشه، انتخاب کنید. در این مثال از یک پست در حوزه سلامت (http://www.hidoctor.ir/302350_physical-symptoms-depression.html) استفاده کردیم.
سلامت یکی از طبقه‌بندی‌هایی‌ست که سرویس برای تشخیص اونا آموزش دیده:

 

 

برای شروع محتوای پست را انتخاب و به حافظه کپی کنید:

 

به انتخاب کردن بخش‌های دیگر پست و کپی کردن آن‌ها به کلیپ‌برد ادامه دهید:

 

پس از اینکه محتوای پست را انتخاب کردید می‌توانید سرویس را فراخوانی کنید متن انتخاب شده را در قسمت userContent از واسط گرافیکی که سواگر تولید کرده قرار بدین کافیه به آدرسی که از تیم ما دریافت کردین برین. صفحه‌ای مانند تصویر زیر رو مشاهده می‌کنید. روی Example Value کلیک کنید. در باکس سمت چپ (userContent) یک آبجکت JSON ساده نوشته می‌شود:

 

محتوایی که از پست انتخاب کرده بودید را در قسمت string از آبجکت پیست کنید. دقت کنید این متن باید یک JSON معتبر باشد. برای سنجش اعتبار این متن می توانید از سایت‌هایی  مثل https://jsonlint.com استفاده کنید. هر چه طول متن ارسالی بیشتر باشد دقت محاسبات نیز افزایش می‌یابد.

پس از آماده شدن محتوای userContent روی دکمه Try it out در پایین باکس کلیک کنید:

 

اگر محتوا یک JSON معتبر باشد و همچنین سرویس آماده پاسخگویی باشد، پاسخ سرویس را در کمتر از ۱۰۰ میلی‌ثانیه دریافت می‌کنید. این پاسخ به دسته‌بندی هایی که سرویس برای پست شما پیش‌بینی کرده است اشاره می‌کند:

 


 

یک پیام JSON نمونه اینجا هست برای اینکه راحت شروع کنید. حتما مطمئن بشین که فرمت محتوای ورودی یک JSON درست و معتبر است. می‌تونید روی https://jsonlint.com ارزیابی کنید. برای مثال در متن زیر احتمالا باید کوتیشن‌ها رو اصلاح کنید. پی‌اچ‌پی و وردپرس بلد نیستم. نمی‌دونم چرا کوتیشن‌ها رو دست‌کاری می‌کنه وردپرس. زحمت اصلاحش با خدوتون:

{
“body”: “آمار و رکوردهای بی‌ام‌و M5، همچنان در صدر اخبار رسانه‌های خودرویی قرار دارد. قدرت ۶۰۰ اسب بخار از پیشرانه‌ی ۴.۴ لیتری توئین‌توربو، همراه با زمان ۳.۲ ثانیه برای رسیدن به سرعت ۱۰۰ کیلومتر بر ساعت از حالت سکون، تنها بخشی از توانایی‌های حیرت‌انگیز این خودروی سدان است. از سویی دیگر، به نظر می‌رسد که مدیران بی‌ام‌و، به دنبال رکوردهای بیشتر و تبلیغات گسترده‌تر برای محصول جذاب خود هستند. چند روز پیش خبر از پیش‌نمایش یک فیلم کوتاه حیرت‌انگیز، با موضوع دریفت با بی‌ام‌و M5 داده بودیم، اما امروز، جزئیات و ویدئوی نهایی این رویداد، پیش روی ما است.رای ثبت رکورد طولانی‌ترین دریفت دنیا، مسیر دایره‌ای یا اصطلاحا دونات شکل، برای بی‌ام‌و M5 انتخاب شد. این خودرو، در مدت زمان ۸ ساعت، مسافتی به طول ۳۷۲ کیلومتر را بدون وقفه، دریفت کرد، اما این تمام ماجرا نبود و ۵ مرتبه سوخت‌گیری حین حرکت نیز به رکوردهای بی‌ام‌و M5، اضافه شد. پشت فرمان، جان شوارتز قرار داشت که مدرس آکادمی رانندگی حرفه‌ای بی‌ام‌و است. او توانسته بود در سال ۲۰۱۳ نیز، رکورد ۸۲.۵ کیلومتر دریفت منظم با یک سوخت‌گیری را به ثبت رساند.با هدف سوخت‌رسانی به M5 اصلی، نمونه‌ای دیگری از این خودرو حضور داشت که از نسل قبل و مدل ۲۰۱۶ بود. راننده‌ی خودروی سوخت‌رسان، مت مولینز هم، نقش مهمی در رکوردگیری داشت و با دریفت هماهنگ، توانست ۵ سوخت‌گیری موفق را، ممکن کند. شاید با دیدن چنین صحنه‌هایی، فیلم‌های هالیوودی نظیر سریع و خشن تداعی شوند، اما در عمل توسط تیم بی‌ام‌و به حقیقت پیوست. خودروهای دریفت‌کننده، حین یکی از سوخت‌گیری‌ها توانستند در مسیری به طول ۶۳ کیلومتر، به صورت کاملا هماهنگ و کنار یکدیگر قرار گیرند.”
}


 

کاربردهای این اندپوینت عبارتند از:

  • افزایش میزان دقت انتخاب بنر در هنگام نمایش Native Ad و بنر‌های حاشیه صفحات.
  • تحلیل تعداد بسیار زیاد محتوا (هزاران)‌ در عرض چند دقیقه برای یافتن شکایات مشتریان، پیشنهاد‌ها یا اسپم‌ …
  • تحلیل کامنت‌ها و ایمیل‌های کاربران به منظور دسته بندی در گروه‌های : مثبت، منفی، شکایت، پیشنهاد، تبلیغ، ناسزا و …
  • تقویت مکانیزم‌های تشکیل پرسونای کاربر و طبقه‌بندی خودکار کاربران به دسته‌بندی‌های پیچیده مثل:‌
    • طرفدارای پرسپولیس
    • طرفدارای استقلال
    • طرفدارای استقلال که علی کریمی رو هم دوست دارن
    • طرفدارای سیاه‌جامگان که تراکتورسازی رو هم دوست دارن ولی از استقلال و پرسپولیس خوششون نمیاد
  • کنترل میزان انطباق محتوای کالا/پست با دسته‌بندی انتخاب شده توسط کاربر.
  • طبقه‌بندی خودکار رزومه‌های دریافت شده
  • طبقه‌بندی مقالات و اخبار

 

معرفی دسته‌بندی‌ها توسط مشتری انجام می‌شه و نامحدوده. این خدمت مانند انسان به یادگیری می‌پردازد. لذا در تعریف دسته‌بندی‌ها محدودیتی وجود ندارد. همچنین از زبان مستقل است. یعنی به همین شکل می‌توان پست‌های عربی، چینی، روسی یا هر زبان دیگر را نیز با دقت و سرعتی کم نظیر پردازش کرد.

پیشنهاد می‌کنم پست‌های قبلی ما در مورد معرفی توانمندی‌های کامنتوم را نیز مطالعه کنید.

بسیار علاقمندیم ایده‌های شما درباره این اندپوینت را بشنویم. هم اکنون کجای کسب‌و‌کار شما به تحلیل بلادرنگ محتوای (فارسی، عربی، چینی …) نیاز دارد؟

2 پاسخ

برای ما بنویسید

دوست داریم نظر شما رو بدونیم

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *