یادگیری ماشینی زیرمجموعه ای از هوش مصنوعی (AI) است که اغلب با مفهوم گسترده تر اشتباه گرفته می شود. یادگیری ماشینی که توسط دانشمند کامپیوتر آرتور ساموئل در سال ۱۹۵۹ ابداع شد، به عنوان توانایی کامپیوتر برای یادگیری بدون برنامه نویسی صریح تعریف شده است. همچنین به عنوان تجزیه و تحلیل پیش بینی یا مدل سازی پیش بینی شناخته می شود.
یادگیری ماشین در هسته خود از الگوریتم های برنامه ریزی شده برای تجزیه و تحلیل داده های ورودی و پیش بینی مقادیر خروجی استفاده می کند. این الگوریتم ها در طول زمان با معرفی داده های جدید یاد می گیرند و بهینه می شوند و به تدریج هوش را توسعه می دهند.
چهار نوع الگوریتم یادگیری ماشین وجود دارد: تحت نظارت، نیمه نظارتی، بدون نظارت و تقویتی.
یادگیری با نظارت:
در یادگیری نظارت شده، ماشین از نمونه های ارائه شده توسط اپراتور یاد می گیرد. به الگوریتم یک مجموعه داده شناخته شده با ورودی ها و خروجی های دلخواه داده می شود. الگوها را شناسایی می کند، از مشاهدات می آموزد و پیش بینی می کند. اپراتور الگوریتم را تا زمانی که به دقت بالایی دست یابد تصحیح می کند. طبقه بندی، رگرسیون و پیش بینی تحت آموزش نظارت شده قرار می گیرند.
– طبقه بندی
مشاهدات جدید را بر اساس داده های موجود به دسته ها اختصاص می دهد.
– رگرسیون
روابط بین متغیرها را تخمین می زند که برای پیش بینی مفید است.
– پیش بینی
روندهای آینده را بر اساس داده های گذشته و حال پیش بینی می کند.
آموزش نیمه نظارتی:
شبیه به یادگیری تحت نظارت است اما از داده های برچسب دار و بدون برچسب استفاده می کند. داده های برچسب دار دارای برچسب های معنی دار هستند، در حالی که داده های بدون برچسب فاقد آنها هستند. این ترکیب به الگوریتمها کمک میکند تا برچسبگذاری دادههای بدون برچسب را بیاموزند.
یادگیری بدون نظارت:
در اینجا، الگوریتم داده ها را برای شناسایی الگوها بدون راهنمایی انسان مطالعه می کند. مجموعه داده های بزرگ را تفسیر می کند و آنها را سازماندهی می کند و در طول زمان تصمیم گیری را بهبود می بخشد. خوشه بندی و کاهش ابعاد تحت آموزش بدون نظارت قرار می گیرند.
– خوشه بندی
داده های مشابه را بر اساس معیارهای تعریف شده گروه بندی می کند.
– کاهش ابعاد
متغیرها را برای یافتن اطلاعات خاص کاهش می دهد.
یادگیری تقویتی:
بر فرآیندهای یادگیری دسته بندی شده تمرکز می کند، جایی که الگوریتم گزینه ها را بررسی می کند، نتایج را پایش می کند و رویکرد خود را از طریق آزمون و خطا تطبیق می دهد.
انتخاب الگوریتم مناسب به عواملی مانند اندازه، کیفیت و تنوع داده ها بستگی دارد. الگوریتم های محبوب عبارتند از طبقه بندی کننده ساده بیز، خوشه بندی K Means، ماشین بردار پشتیبان، رگرسیون خطی، رگرسیون لجستیک، شبکه های عصبی مصنوعی، درختان تصمیم، جنگل های تصادفی، و نزدیکترین همسایگان.
استفاده از یادگیری ماشینی به تخصص نیاز ندارد. SAS الگوریتمهای یادگیری ماشینی متنوعی را برای کمک به کسبوکارها ارائه میدهد تا به طور مداوم ارزش را از دادههای خود استخراج کنند.
انتخاب الگوریتم یادگیری ماشینی مناسب
تصمیم گیری برای استفاده از الگوریتم یادگیری ماشینی مستلزم در نظر گرفتن چندین فاکتور مانند اندازه، کیفیت و تنوع داده ها است. بهعلاوه، کسبوکارها باید تعیین کنند که از دادهها به دنبال چه بینشی هستند. سایر جنبه های مهم عبارتند از دقت، زمان آموزش، پارامترها و نقاط داده. بنابراین، انتخاب الگوریتم مناسب ترکیبی از الزامات تجاری، مشخصات، آزمایش و زمان در دسترس است. حتی دانشمندان داده با تجربه نیز نمی توانند بدون آزمایش گزینه های مختلف بهترین الگوریتم را پیش بینی کنند.
الگوریتم های رایج و محبوب یادگیری ماشین:
الگوریتم طبقه بندی کننده ساده بیز (یادگیری نظارت شده – طبقه بندی):
– بر اساس قضیه بیز، این طبقه بندی کننده یک کلاس/رده را به طور مستقل برای هر مقدار پیش بینی می کند. با وجود سادگی، اغلب از روش های طبقه بندی پیچیده تر بهتر عمل می کند.
K به معنای الگوریتم خوشه بندی (یادگیری بدون نظارت – خوشه بندی):
– این الگوریتم برای دسته بندی داده های بدون برچسب استفاده می شود، این الگوریتم گروه ها را به صورت تکراری بر اساس ویژگی های ارائه شده پیدا می کند.
الگوریتم ماشین برداری پشتیبان (یادگیری تحت نظارت – طبقه بندی):
– این الگوریتم ها داده ها را برای طبقه بندی و رگرسیون تجزیه و تحلیل می کنند. آنها داده ها را بر اساس مجموعه ای از مثال های آموزشی به دسته ها فیلتر می کنند و مدلی می سازند که مقادیر جدیدی را به دسته ها اختصاص می دهد.
رگرسیون خطی (یادگیری نظارت شده/رگرسیون):
– ابتدایی ترین نوع رگرسیون، کمک به درک روابط بین دو متغیر پیوسته.
رگرسیون لجستیک (یادگیری نظارت شده – طبقه بندی):
– بر تخمین احتمال یک رویداد بر اساس داده های قبلی، مناسب برای نتایج باینری (۰ و ۱) تمرکز می کند.
شبکه های عصبی مصنوعی (یادگیری تقویتی):
– متشکل از واحدهای به هم پیوسته، با الهام از سیستم های بیولوژیکی، به طور هماهنگ برای حل مسائل خاص کار می کنند. آنها با مثال و تجربه یاد می گیرند که برای مدل سازی روابط غیر خطی در داده های با ابعاد بالا یا پیچیده مفید است.
درخت تصمیم (یادگیری نظارت شده – طبقه بندی/رگرسیون):
– ساختار درخت مانند که هر نتیجه ممکن از یک تصمیم را نشان می دهد. هر گره نشان دهنده یک آزمایش روی یک متغیر خاص است و هر شاخه نتیجه آن آزمایش است.
جنگل های تصادفی (یادگیری نظارت شده – طبقه بندی/رگرسیون):
– یک روش یادگیری گروهی که چندین الگوریتم را برای ایجاد نتایج بهتر ترکیب می کند. اگرچه هر طبقهبندیکننده فردی ضعیف است، اما این ترکیب نتایج عالی ایجاد میکند.
نزدیکترین همسایه ها (یادگیری تحت نظارت):
– الگوریتم K-Nearest-Neighbour با بررسی نقاط داده نزدیک، احتمال یک نقطه داده متعلق به یک گروه خاص را تخمین می زند.
در نتیجه، انتخاب الگوریتم های یادگیری ماشین مناسب برای تجزیه و تحلیل کسب و کار شما مستلزم در نظر گرفتن عوامل مختلفی است. برای استفاده از این مدل ها نیازی نیست که یک دانشمند داده یا آماردان متخصص باشید. در SAS، محصولات و راهحلهای ما مجموعهای جامع از الگوریتمهای یادگیری ماشینی را ارائه میکنند که به شما کمک میکند بهطور مداوم از دادههایتان ارزش استخراج کنید.
محبوب ترین انواع یادگیری ماشینی کدامند؟
رگرسیون خطی
رگرسیون لجستیک
درخت تصمیم
SVM (ماشین بردار پشتیبانی)
بیز ساده لوح
kNN (k-نزدیکترین همسایهها)
K-Means
جنگل تصادفی
ابتدایی ترین یادگیری ماشینی چیست؟
رایجترین نوع یادگیری ماشینی یادگیری نقشهبرداری Y = f(X) برای پیشبینی Y برای X جدید است. به این مدلسازی پیشبینی یا تحلیل پیشبینی میگویند و هدف ما انجام دقیقترین پیشبینیهای ممکن است.
۷ مرحله یادگیری ماشینی چیست؟
جمع آوری داده: نقاط داده را برای ساخت مجموعه داده خود تعریف کنید.
آماده سازی داده ها.
انتخاب مدل.
آموزش.
ارزیابی.
تنظیم.
پیش بینی.
آیا هوش مصنوعی نوعی ML است؟
آیا هوش مصنوعی و یادگیری ماشینی یکسان هستند؟ در حالی که هوش مصنوعی و یادگیری ماشین بسیار نزدیک به هم مرتبط هستند، اما یکسان نیستند. یادگیری ماشینی زیر مجموعه ای از هوش مصنوعی در نظر گرفته می شود.
دو نوع اصلی ML چیست؟
۲ نوع یادگیری در یادگیری ماشینی: تحت نظارت و بدون نظارت.
آیا ML و AI متفاوت هستند؟
یادگیری ماشین (ML) شاخه خاصی از هوش مصنوعی (AI) است. ML در مقایسه با هوش مصنوعی دامنه و تمرکز محدودی دارد. هوش مصنوعی شامل چندین استراتژی و فناوری است که خارج از محدوده یادگیری ماشین هستند.
تکنیک های یادگیری ماشینی چیست؟
تکنیکهای یادگیری ماشینی (ML) سیستمها را قادر میسازد تا از تجربه بیاموزند. ML به توانایی یک سیستم برای کسب و ادغام دانش از طریق مشاهدات در مقیاس بزرگ و بهبود و گسترش خود با یادگیری دانش جدید به جای برنامه ریزی با آن دانش اشاره دارد (شاپیرو، ۱۹۹۲).
اولین نوع یادگیری ماشینی چیست؟
تاریخچه یادگیری ماشین در سال ۱۹۴۳ با اولین مدل ریاضی شبکه های عصبی ارائه شده در مقاله علمی “حساب منطقی ایده های ماندگار در فعالیت عصبی” توسط والتر پیتس و وارن مک کالوچ آغاز شد.
کدام ابزار برای یادگیری ماشین استفاده می شود؟
TensorFlow
PyTorch
PyTorch Lightning
Scikit-Learn
کاتالیزور
XGBoost
LightGBM
CatBoost
قدرتمندترین مدل زبان هوش مصنوعی چیست؟
بر اساس گزارش OpenAI، مدلهای مختلفی وجود دارد که GPT-3.5 توربو بهترین آنهاست. داده های آموزشی GPT-3.5 تا سپتامبر ۲۰۲۱ ادامه دارد. همچنین در موتور جستجوی Bing ادغام شد اما از آن زمان با GPT-4 جایگزین شده است.
قوی ترین نوع هوش مصنوعی چیست؟
هوش مصنوعی قوی که به عنوان هوش عمومی مصنوعی (AGI) یا هوش مصنوعی عمیق نیز شناخته می شود، یک سیستم کامپیوتری با هوشی جامع است که قادر به یادگیری و استفاده از توانایی فکری خود برای حل هر مشکلی است.
یادگیری ماشین:
یادگیری ماشینی زیرشاخهای از هوش مصنوعی (AI) است که شامل استفاده از الگوریتمهایی است که رایانهها را قادر میسازد تا از تجربه یاد بگیرند و بدون برنامهریزی صریح، پیشرفت کنند. اغلب به آن تحلیل پیش بینی یا مدل سازی پیش بینی می گویند.
یادگیری تحت نظارت:
یادگیری نظارت شده نوعی از یادگیری ماشینی است که در آن الگوریتم بر روی یک مجموعه داده شناخته شده با ورودی ها و خروجی های برچسب دار آموزش داده می شود. الگوریتم یاد می گیرد که الگوها را در داده ها شناسایی کند و پیش بینی کند. به عنوان مثال می توان به طبقه بندی، رگرسیون و پیش بینی اشاره کرد.
یادگیری بدون نظارت:
یادگیری بدون نظارت شامل الگوریتم یادگیری ماشینی است که داده ها را بدون خروجی های برچسب دار مطالعه می کند. این الگوریتم با تجزیه و تحلیل داده های موجود، سازماندهی آنها در خوشه ها یا ساختارها و بهبود تصمیم گیری در طول زمان، همبستگی ها و روابط را شناسایی می کند. به عنوان مثال می توان به خوشه بندی و کاهش ابعاد اشاره کرد.
آموزش نیمه نظارتی:
یادگیری نیمه نظارت شده از ترکیبی از داده های برچسب دار و بدون برچسب استفاده می کند. داده های برچسب دار دارای تگ های معنی دار هستند که به الگوریتم اجازه می دهد داده ها را درک کند، در حالی که داده های بدون برچسب فاقد این اطلاعات هستند. الگوریتم یاد می گیرد که داده های بدون برچسب را با استفاده از ترکیب ارائه شده برچسب گذاری کند.
یادگیری تقویتی:
یادگیری تقویتی بر فرآیندهای یادگیری دسته بندی شده متمرکز است، جایی که یک الگوریتم گزینه ها و احتمالات مختلف را بررسی می کند. از طریق آزمون و خطا یاد می گیرد و رویکرد خود را بر اساس تجربیات گذشته برای دستیابی به نتایج بهینه تطبیق می دهد.
الگوریتم طبقه بندی کننده ساده بیز:
طبقه بندی کننده ساده بیز بر اساس قضیه بیز است و مقادیر را به طور مستقل طبقه بندی می کند. یک کلاس یا دسته را بر اساس مجموعه مشخصی از ویژگی ها با استفاده از احتمال پیش بینی می کند. با وجود سادگی، طبقه بندی کننده اغلب از روش های طبقه بندی پیچیده تر عمل می کند.
K به معنای الگوریتم خوشه بندی:
الگوریتم K Means Clustering یک روش یادگیری بدون نظارت است که برای دستهبندی دادههای بدون برچسب با یافتن گروهها به صورت تکراری بر اساس ویژگیهای ارائه شده استفاده میشود. تعداد گروه ها با متغیر K نشان داده می شود.
الگوریتم ماشین برداری پشتیبانی:
الگوریتمهای ماشین بردار پشتیبان، مدلهای یادگیری تحت نظارت هستند که برای طبقهبندی و تحلیل رگرسیون استفاده میشوند. آنها داده ها را بر اساس نمونه های آموزشی به دسته بندی فیلتر می کنند و مدلی برای اختصاص مقادیر جدید به دسته های خاص می سازند.
رگرسیون خطی:
رگرسیون خطی اساسی ترین نوع رگرسیون است که امکان درک روابط بین دو متغیر پیوسته را فراهم می کند.
رگرسیون لجستیک:
رگرسیون لجستیک بر تخمین احتمال وقوع یک رویداد بر اساس داده های قبلی متمرکز است. برای نتایج باینری استفاده می شود، جایی که تنها دو مقدار ۰ و ۱ نشان دهنده نتایج هستند.
شبکه های عصبی مصنوعی (ANN):
شبکههای عصبی مصنوعی شامل واحدهایی هستند که در لایههایی با الهام از سیستمهای بیولوژیکی مانند مغز چیده شدهاند. شبکه های عصبی مصنوعی با مثال و تجربه یاد می گیرند که برای مدل سازی روابط غیر خطی در داده های با ابعاد بالا یا پیچیده مفید است.
درخت تصمیم:
درختان تصمیم سازه هایی مانند نمودار جریان هستند که هر نتیجه ممکن یک تصمیم را نشان می دهند. هر گره نشان دهنده یک آزمایش روی یک متغیر خاص است و هر شاخه نتیجه آن آزمایش است.
جنگل های تصادفی:
جنگلهای تصادفی یا «جنگلهای تصمیم تصادفی» یک روش یادگیری گروهی است که چندین الگوریتم را برای نتایج بهتر در طبقهبندی، رگرسیون و سایر وظایف ترکیب میکند. هر یک از طبقه بندی کننده ها ضعیف هستند، اما ترکیب آنها نتایج عالی ایجاد می کند.
نزدیک ترین همسایه ها:
الگوریتم K-Nearest-Neighbour احتمال یک نقطه داده متعلق به یک گروه خاص را با بررسی نقاط داده نزدیک تخمین می زند.
منابع
https://www.analyticsvidhya.com