Machine Learning va Data Science’ni qanday boshlash mumkin?

Machine Learning va Data Science’ni qanday boshlash mumkin?

Agar siz Machine Leaning va Data Science sohalariga qiziqib ularni o’rganishni boshlamoqchi bo’lsangiz bu maqola sizga oz bo’lsada tushuncha bera oladi degan umiddamiz! Unda Machine Learning va Data Science haqida ma’lumot berib o’tmoqchimiz.

Havolalar orqali Andrew NG ning baatafsil taqdim etgan darslarini qoldirdik, foydali manbaalar va kurslar bilan maqola so’ngida tanishib chiqishingiz mumkin!

Qanday qilib boshlash mumkin?

Birinchi navbarta dasturlash tilini tanlab olishingiz kerak bo’ladi. Masalan, Python, R, Matlab, C/C++ va boshqa dasturlash tillari ( bu sizga bog’liq ). Python-Machine Learning va Data Science sohalarida keng qo’llaniladigan tillardan biridir.

Nega Python?

Python o’rganish uchun oson va kuchli dasturlash tili hisoblanadi! U to’liq ishlab chiqilgan, algoritmlarni amalga oshirish uchun ajoyib vosita. Aynan ushbu dasturlash tilida ko’plab Data Analysis va Machine Learning uchun paketlar(packages) mavjud.

Data Science

Machine Learning va Data Science

Data Science’ning asosiy jihati ma’lumotlardan yangi natijalarni olishdir.
Data Science bizga katta hajmdagi ma’lumotlardan ma’no va kerakli ma’lumotlarni topishga imkon beradi. Ma’lumotlar omborlarida to’nnalab xom ma’lumotlar saqlanganligi sababli, ularni qayta ishlash orqali o’rganish bizga ko’p narsa beradi.

Keling, endi Data Science’ning yo’nalishlari haqida bilib olamiz.

Data Visualization

Data Visualization – ma’lumotlar va ma’lumotlarning grafik tasviridir. Diagrammalar, grafiklar va xaritalardan vizual foydalanish tushuniladi.

Data Analysis

Data Analysis – ma’lumotlarimizni tahlil qilish uchun ishlatiladi, chunki haqiqiy hayotdagi ma’lumotlarni to’plash oson emas va ba’zida biz modelimiz ishlashini, aniqligini yaxshilash va ma’lumotlardan foydali ma’lumotlarni olish uchun ma’lumotlarimizni yanada samaraliroq qilishimiz kerak.

Data Cleaning

Dunyoda ma’lumotlar ko’p. Kerakli ma’lumotlarni yig’ish juda qiyin va ba’zida ma’lumotlar chalkash bo’lishi mumkin, shuning uchun biz modelimiz aniqligi va ishlash tezligini yaxshilash uchun avvalambor Data Cleaning’dan foydalanamiz.

Data Mining

Data Mining – bu xom ma’lumotlarni foydali ma’lumotlarga aylantirishdir. Bu kompaniyalar tomonidan qo’llaniladigan jarayon. Katta hajmdagi ma’lumotlardan keraklilarini izlash uchun dasturiy ta’minotdan foydalanish.

Machine Leaning

Machine Learning va Data Science

Machine Leaning – analitik model yaratishni avtomatlashtiradigan ma’lumotlarni tahlil qilish usuli bo’lib, u ma’lumotlarni o’rgana oladi. Machine Leaning insonning minimal aralashinuvi bilan qaror qabul qilishi mumkin degan g’oyaga asoslangan yo’nalish.

Machine Leaning’ning 4 ta yo’nalishi bor:

Machine Learning va Data Science

Supervised leaning

“Supervised Learning atamasi Machine Learning tizimiga nima qilish kerakligini ko’rsatuvchi o’qituvchi yoki o’rgatuvchi tomonidan taqdim etilgan maqsad y nuqtai nazaridan kelib chiqadi.”

— Page 105, Deep Learning, 2016.

Modelga kiritilgan ma’lumotlar, asosiy farq va munosabatlar aniq bo’lmaguncha o’qitiladi, bu unga hech qachon ko’rilmagan ma’lumotlar taqdim etilganda aniq yorliqlash natijalarini berishga imkon beradi.

Supervised Leaning, tasniflash va regressiya muammolarida yaxshi. Masalan, yangilik maqolasi qaysi toifaga tegishli ekanligini aniqlash yoki kelajakdagi ma’lum bir sana uchun sotish hajmini bashorat qilish. Supervised Leaning’ning vazifasi savolga eng optimal javobni topib bera olishdan iborat.

Supervised Leaning qanday ishlaydi?

Barcha Machine Learning algoritmlari singari, Supervised Leaning mashg’ulotlarga asoslangan. O’qitish bosqichida tizim etiketli (label’langan) ma’lumotlar to’plamlari bilan oziqlanadi, ular tizimga har bir muayyan kirish qiymatiga qanday chiqish bog’liqligini ko’rsatadi. Keyin o’qitilgan model sinov ma’lumotlari bilan taqdim etiladi: Bu etiketlangan (label’langan) ma’lumotlar, ammo yorliqlar algoritmga oshkor etilmagan. Sinov ma’lumotlarining maqsadi etiketsiz (label’lanmagan) ma’lumotlarda algoritm qanchalik aniq ishlashini o’lchashdir.

Unsupervised Learning

“Unsupervised Learning’ da o’qituvchi yoki o’rgatuvchiga hojat yo’q! Algoritm ushbu qo’llanmasiz ma’lumotlarni tushuna olishi kerak.”

— Page 105, Deep Learning, 2016.

Unsupervised Learning’ni regressiya yoki tasniflash muammosiga to‘g‘ridan-to‘g‘ri qo‘llash mumkin emas, chunki Supervised Learning’dan farqli o‘laroq, bizda kirish ma’lumotlari mavjud, lekin tegishli chiqish ma’lumotlari yo‘q. Unsupervised Learning’ning maqsadi ma’lumotlar to’plamining asosiy tuzilishini topish, ma’lumotlarni o’xshashliklari bo’yicha guruhlash va ushbu ma’lumotlar to’plamini tartiblangan formatda taqdim etishdir.

Unsupervised Learning qanday ishlaydi?

Uni quyidagi sur’at orqali tushuntirib beramiz:

1*BnQdoGECOZekYIbkw2Ju7w

Bu erda biz yorliqsiz kirish ma’lumotlarini oldik, ya’ni u toifalarga ajratilmagan va tegishli chiqishlar ham berilmagan. Endi ushbu yorliqsiz kirish ma’lumotlari uni o’qitish uchun Machine Learning modeliga beriladi. Birinchidan, u ma’lumotlardan yashirin belgilarni topish uchun xom ma’lumotlarni sharhlaydi va keyin K-means clustering, Anomaly detection va boshqalar kabi mos algoritmlarni qo’llaydi.

Tegishli algoritmni qo’llaganidan so’ng, algoritm ma’lumotlar ob’ektlarini ob’ektlar orasidagi o’xshashlik va farqlarga ko’ra guruhlarga ajratadi.

Semi – Supervised Learning

“Semi – Sepervised Learning(SSL) nazorat ostida va nazoratsiz o’rganish o’rtasidagi yarmidir. Belgilanmagan ma’lumotlarga qo’shimcha ravishda, algoritm ba’zi nazorat ma’lumotlari bilan ta’minlangan — lekin barcha misollar uchun shart emas. Ko’pincha, bu ma’lumotlar ba’zi misollar bilan bog’liq bo’lgan maqsadlar bo’ladi.”

— Page 2, Semi-Supervised Learning, 2006.

Semi – Supervised Learning’ga misollar:

  1. Nutqni tahlil qilish: Ovozli fayllarni etiketlash (label’lash) juda intensiv ish bo’lganligi sababli, Semi – Supervised Learning bu muammoni hal qilish uchun juda tabiiy yondashuvdir.

  2. Internet-kontent tasnifi: Har bir veb-sahifani belgilash amaliy va amalga oshirib bo’lmaydigan jarayondir va shuning uchunSemi – Supervised Learning ostida o’rganish algoritmlaridan foydalanadi. Hatto Google qidiruv algoritmi ham berilgan soʻrov uchun veb-sahifaning dolzarbligini baholash uchun Semi – Supervised Learning variantidan foydalanadi.

  3. Proteinlar ketma-ketligi tasnifi: DNK zanjirlari odatda juda katta hajmga ega bo’lganligi sababli, bu sohada Semi – Supervised Learning kuchayishi kutilmoqda.

Reinforcement Learning

Reinforement Learning (RL) qaror qabul qilishga qaratilgan bo’limdir. Bu maksimal mukofot olish uchun muhitda maqbul vaziyatni o’rganishdir. Bu optimal darajada atrof-muhit bilan o’zaro ta’sir qilish va uning qanday munosabatda bo’lishini kuzatish orqali o’rganiladi, xuddi bolalar atrofdagi dunyoni o’rganishlari va maqsadga erishishga yordam beradigan harakatlarni o’rganishlari kabi.

Aytaylik, musobaqada nazoratchi yo’q bo’lganda, Reinforcement Learning mukofotni maksimal darajada oshiradigan harakatlar ketma-ketligini mustaqil ravishda kashf qilishi kerak. Ushbu kashfiyot jarayoni sinov va xato qidiruviga o’xshaydi. Harakatlarning sifati nafaqat ular qaytaradigan darhol mukofot, balki ular olishi mumkin bo’lgan kechiktirilgan mukofot bilan ham o’lchanadi. Nazoratchining yordamisiz ko’rinmas muhitda yakuniy muvaffaqiyatga olib keladigan harakatlarni o’rganishi mumkinligi sababli, mustahkamlashni o’rganish juda kuchli algoritmdir. U qabul qilayotgan barcha ma’lumotlarini saqlaydi va eslab qoladi. Keyin eng optimal variantlarni taqdim etadi. Misol uchun AIchatbot’lari yoki yaqindagina Instagram tarmog’iga qo’shilgan taxminiy javob berish xizmati:

1*yHj3JfUS9T9ZsVJIv8WIYQ

Ushbu habardagi yozuv foydalanuvchiga eng ko’p kelayotgan habarlarni saqlab olgan holda Reinforcement Learning algoritmi orqali yaratilgan. (Siz ham account’ingizga kirib ushbu funksiyani tekshirib ko’ring)

Deep Learning

Deep Learning – bu tizimlashtirilmagan yoki etiketlanmagan ma’lumotlardan Unsupervised Learning’ga qodir bo’lgan tarmoqlarga ega bo’lgan Machine Learning’ning bo’limi. Chuqur deep neural learning yokideep neural network sifatida ham tanilgan.

Neural Networks

Neural Networks— bu inson miyasining ishlash usulini taqlid qiluvchi jarayon orqali ma’lumotlar to’plamidagi asosiy munosabatlarni aniqlashga intiladigan bir qator algoritmlar.

Deep Learning: Kurs (o’zbek tilida), kurs(ingliz tilida)

Data Science: Kurs (o’zbek tilida), Kurs (ingliz tilida)

Machine Learning: Kurs (ingliz tilida), kurs (ingliz tilida)

Sizlarga foydali bo’ldi degan umiddamiz! Keyingi postlarda ko’rishguncha ;D

Mohinur Abdurahimova

Comment List

Leave a comment

Sharhlash uchun siz saytga kirishingiz lozim.