راههای مختلفی هست که شما به یه ماشین یه سری چیزا رو یاد بدین که البته انتخابشون بستگی به نوع مسئله هم داره.
اصلیترین چیزی که نیازه، داده است. مثلا مجموعهای از عکسای سگ و گربه که مشخصه کدوم عکس مال کدوم حیوونه. این داده ها رو میدیم به ماشین، با الگوریتمهای مشخصی ویژگیهای سگ و گربهها رو یاد میگیره و حالا میتونه تشخیص بده یک عکس، عکس سگه یا گربه.
آیا اگر عکس آدم بدیم بهش میتونه تشخیص بده نه سگه و نه گربه؟ نه! مثل تارزانه که هیچ وقت آدم ندید و فقط حیوونا رو دیده بود.
اگر داده برچسب داشته باشه، مثل اینجا که هر عکس یا اسم گربه داره یا سگ، بهش میگیم یادگیری نظارت شده یا supervised.
حالا فرض کنید شما کلی داده از آدمها دارین که شامل سن و درآمدشونه. یه نمودار مشابه پایین براشون رسم میکنید. خیلی مشخصه که سه گروه داریم. طوری که اعضای یک گروه خیلی به هم شبیهن ولی اعضای دو گروه مختلف خیلی از هم دورن. به همچین الگوریتمی میگیم بدون نظارت یا unsupervised.
البته که انواع جالبتر و نزدیکتر به دادههای دنیای واقعی داریم مثل semi-supervised که میتونید دربارشون مطالعه کنید.
پ.ن 1: سومین گروه دانش آموزای هستن که آرایشگاه کار میکنن و توی سن کم درآمدشون از هم سنای من بیشتره :)
پ.ن 2: در نمودار باید جای محور x و y عوض بشه تا منطقی به نظر بیاد.