یادگیری غیررسمی (یادگیری بدون نظارت): نوعی از یادگیری است که در آن مدل بر روی دادههایی آموزش میبیند که خروجیهای معلوم ندارند. هدف مدل کشف الگوها یا توزیعهای پنهان در دادهها است.
ویژگیها:
– بدون برچسب: مدل با خروجیهای معلوم تغذیه نمیشود و به همین دلیل به جستجوی ساختار نهفته در دادهها میپردازد.
– خوشهبندی و استخراج: عملیاتهایی مانند خوشهبندی و کاهش ابعاد.
نمونههایی از کاربردها:
– خوشهبندی مشتریان بر اساس رفتار خرید.
– کاهش ابعاد در دادههای بزرگ برای نمایش یا تحلیل.
– تحلیل تصاویر برای کشف ویژگیهای مختلف.
یادگیری تقویتی: نوعی از یادگیری است که در آن مدل از طریق تعامل با یک محیط خاص یاد میگیرد. این مدل از طریق پاداشها یا جریمهها بر اساس عملکرد خود انگیزه میگیرد، که به آن کمک میکند تا استراتژیهای خود را بهبود بخشد.
ویژگیها:
– تعامل با محیط: مدل از تجربیات گذشته از طریق انجام اقداماتی در یک محیط خاص یاد میگیرد.
– تقویت رفتار: برخلاف یادگیری نظارتشده و غیرنظارتشده، یادگیری تقویتی با یادگیری از پاداشها و نتایج ناشی از انتخابهایش عملکرد خود را بهبود میبخشد.
نمونههایی از کاربردها:
– بازیها (مانند AlphaGo در بازی Go).
– رباتیک (رباتهایی که یاد میگیرند چگونه وظایف خاصی را انجام دهند).
– سیستمهای رانندگی خودکار (مانند خودروهای خودران که از تجربیات رانندگی یاد میگیرند).
هر نوع یادگیری نقشی در حوزههای مختلف دارد و انتخاب آن بستگی به ماهیت مسئله و دادههای موجود دارد. در حالی که یادگیری نظارتشده در وظایفی که نیاز به خروجیهای مشخص دارند کمک میکند، یادگیری غیرنظارتشده در مواردی که دادههای طبقهبندی شده موجود نیستند به کار میرود و یادگیری تقویتی بر توسعه استراتژیهای مؤثر از طریق تعامل و تجربه متمرکز است.