Si të zgjidhni algoritme të ML për problemet e regresionit?

Thisshtë kjo gumëzhitje kudo – Mësimi i makinerisë!


Pra, çfarë është kjo “Mësim Makinerie (ML)?”

Le ta shqyrtojmë një shembull praktik. Nëse mund ta imagjinoni probabilitetin e rezultatit të një detyre të bërë për herë të parë say Le të themi se detyra është të mësoni të ngasni një makinë. Kjo do të thotë, si do të reagonit ju vetë ?. Me pasiguri?

Nga ana tjetër, si do të dëshironit të përkulem për të njëjtën detyrë pas një praktike disa vjeçare? Ndoshta do ta kalonit mentalitetin tuaj nga parametri i pasigurisë ose ai më i sigurt. Pra, si e morët atë ekspertizë në detyrë?

Ka shumë të ngjarë, ju keni përvojë duke tundur disa parametra dhe performanca juaj është përmirësuar. E drejtë? Ky është Mësimi i Makinerisë.

Një program kompjuterik thuhet se mëson nga përvoja (E) për disa detyra (T) për të dhënë rezultatin më të mirë të performancës (P).

Në të njëjtën mënyrë, makinat mësojnë nga disa koncepte të ndërlikuara të matematikës, dhe të gjitha të dhënat për to janë në formën 0 dhe 1. Si rezultat, ne nuk e kodojmë logjikën për programin tonë; në vend të kësaj, ne duam që një makinë të kuptojë logjikën nga të dhënat më vete.

Për më tepër, nëse doni të gjeni lidhjen midis përvojës, nivelit të punës, aftësive të rralla dhe pagës, atëherë duhet të mësoni algoritme të mësimit të makinerisë.

Dataset komplekse me më shumë KarakteristikaDataset komplekse me më shumë Karakteristika

Sipas këtij studimi të rastit, duhet të shkulni tiparet për të marrë etiketat. Por, ju nuk e kodoni Algoritmin, dhe përqendrimi juaj duhet të jetë në të dhënat.

Prandaj, koncepti është Të dhënat + Algoritmi = pasqyra. Së dyti, Algoritmet tashmë janë zhvilluar për ne, dhe ne duhet të dimë se cili algoritëm të përdorim për zgjidhjen e problemeve tona. Le të hedhim një vështrim në problemin e regresionit dhe mënyrën më të mirë për të zgjedhur një algoritëm.

Pasqyrë e mësimit të makinerisë

Sipas Andreybu, një shkencëtar gjerman me më shumë se 5 vjet përvojë në mësimin e makinerisë, “Nëse mund ta kuptoni nëse detyra e mësimit të makinës është një problem regresioni ose klasifikimi, atëherë zgjedhja e algoritmit të duhur është një copë tortë.”

grupimet e ndryshme të të mësuarit të makineriveGrupimet e ndryshme të të mësuarit të makinerive

Për të numëruar, ndryshimi kryesor midis tyre është se ndryshorja e daljes në regresion është numerike (ose e vazhdueshme) ndërsa ajo për klasifikimin është kategorike (ose diskrete).

Regresioni në të mësuarit e makinerive

Për të filluar, algoritmet e regresionit përpiqen të vlerësojnë funksionin e hartës (f) nga variablat e hyrjes (x) tek variablat dalës numerik ose të vazhdueshëm (y). Tani, variabla e daljes mund të jetë një vlerë reale, e cila mund të jetë një numër i plotë ose një vlerë e pikës lundruese. Prandaj, problemet e parashikimit të regresionit janë zakonisht sasi ose madhësi.

Për shembull, nëse pajiseni me një bazë të dhënash në lidhje me shtëpitë, dhe ju kërkohet të parashikoni çmimet e tyre, kjo është një detyrë regresioni sepse çmimi do të jetë një rezultat i vazhdueshëm.

Shembuj të algoritmeve të regresionit të zakonshëm përfshijnë regresionin linear, Mbështetja e Regresionit të Vektorit (SVR), dhe pemët e regresionit.

Klasifikimi në mësimin e makinerive

Në të kundërt, në rastin e algoritmeve të klasifikimit, y është një kategori që funksioni i hartës parashikon. Për të shtjelluar, për një ose disa ndryshore të hyrjes, një model klasifikimi do të përpiqet të parashikojë vlerën e një përfundimi të vetëm ose disa.

Për shembull, nëse pajiseni me një bazë të dhënash në lidhje me shtëpitë, një algoritëm klasifikimi mund të përpiqet të parashikojë nëse çmimet për shtëpitë “shesin më shumë ose më pak se çmimi i rekomanduar me pakicë.” Këtu dy kategoritë diskrete: mbi ose nën çmimin e përmendur.

Shembuj të algoritmeve të klasifikimit të zakonshëm përfshijnë regresionin logjistik, Bayes Naïve, pemët e vendimeve dhe Fqinjët më të afërt.

Zgjedhja e algoritmeve të duhura

Vlerësimi i duhur i MLGërmimi i përpiktë i të dhënave për vlerësimin e duhur të ML

Kuptoni të dhënat tuaja

  • Shikoni statistikat përmbledhëse
  • Përdorni parametrin “Përqindja” për të identifikuar gamën e të dhënave
  • Mesataret dhe medianet pershkruajne tendencen qendrore
  • Korrelacionet mund të tregojnë marrëdhënie të forta

Vizualizoni të dhënat

  • Komplotet e kutive mund të tregojnë përjashtime.
  • Komplotet e densitetit dhe histogramet tregojnë përhapjen e të dhënave
  • Komplotet e shpërndarjes mund të përshkruajnë marrëdhëniet e sasisë

Pastroni të dhënat

Zbulimi i pjesëve që mungojnëGjetja e pjesëve që mungojnë riPororiteti në listën e detyrave për të gjetur algoritmin e duhur ML

  • Merreni me një vlerë të humbur. Rezultati i nënshtrohet dhënies së rezultateve të ndjeshme në rast (të dhënat që mungojnë për disa ndryshore mund të rezultojnë në parashikime të pasakta)
  • Megjithëse modelet e pemëve janë më pak të ndjeshme ndaj pranisë së jashtme, modelet regresive ose modelet e tjera që përdorin ekuacionet janë më të ndjeshëm ndaj përjashtimeve
  • Në thelb, të huajt mund të jenë rezultat i mbledhjes së të dhënave të këqija, ose ato mund të jenë vlera ekstreme legjitime

Kuratoni të dhënat

Për më tepër, ndërsa shndërroni të dhënat e papërpunuara në një të lëmuar në përputhje me modelet, duhet të kujdeset për sa vijon:

  • Bëni të dhënat më të lehta për tu interpretuar.
  • Kapni të dhëna më komplekse.
  • Përqendrohuni në zvogëlimin e tepricës dhe dimensionit të të dhënave.
  • Normalizoni vlerat e ndryshueshme.

Kategorizoni problemin përmes ndryshores hyrëse

  • Ju keni etiketuar të dhëna; është një problem i mbikëqyrur i mësimit.
  • Nëse keni të dhëna pa leje dhe doni të gjeni strukturë, është një problem i mbikëqyrjes së të mësuarit.
  • Në rast se dëshironi të zgjedhni një funksion objektiv duke bashkëvepruar me një mjedis, është një problem i mësimit përforcues.

Kategorizoni Problemin përmes Variablit të Prodhimit

  • Prodhimi i modelit tuaj është një numër; është një problem regresioni.
  • Kur rezultati i modelit tuaj është një klasë, atëherë është një problem klasifikimi.
  • Prodhimi i modelit tuaj është një grup i grupeve të dhëna; është një problem grumbullimi.

Faktori kufizues

  • Merrni një shënim të aftësisë së ruajtjes pasi ndryshon për modele të ndryshme.
  • A parashikimi duhet të jetë i shpejtë? Për shembull, në skenarë në kohë reale, si klasifikimi i shenjave rrugore, të jetë sa më shpejtë që të jetë e mundur për të shmangur aksidentet.

Më në fund, Gjeni Algoritmin

Metoda logjikeMetoda logjike: Ndiqni Procedurën

Tani që keni një pamje të qartë të të dhënave tuaja, ju mund të zbatoni mjetet e duhura për të zgjedhur algoritmin e duhur.

Ndërkohë, për një vendim më të mirë, këtu është një listë kontrolluese e faktorëve për ju:

  • Shikoni nëse modeli përputhet me qëllimin e biznesit tuaj
  • Sa kërkon para-përpunimi i modelit
  • Kontrolloni saktësinë e modelit
  • Sa i shpjegueshëm është modeli
  • Sa i shpejtë është modeli: Sa kohë duhet për të ndërtuar një model, dhe sa kohë kërkon modeli për të bërë parashikime
  • Shkallueshmëria e modelit

Për të shtuar, duhet t’i kushtoni vëmendje kompleksitetit të algoritmit gjatë zgjedhjes.

Në përgjithësi, ju mund të matni kompleksitetin e modelit duke përdorur parametrat:

  • Kur kërkon dy ose më shumë se dhjetë karakteristika për të mësuar dhe parashikuar objektivin
  • Ai mbështetet në inxhinierinë më të ndërlikuar të tipareve (p.sh., duke përdorur termat polinom, ndërveprimet ose përbërësit kryesorë)
  • Kur skenari ka një përmbledhje më të madhe llogaritëse (p.sh., një pemë e vetme e vendimeve kundrejt një pylli të rastësishëm prej 100 pemësh)

Për më tepër, i njëjti algoritëm mund të bëhet më kompleks me dorë. Kjo varet thjesht nga numri i parametrave të kënaqur dhe skenari në shqyrtim. Për shembull, ju mund të krijoni një model regresioni me më shumë veçori ose terma polinom dhe terma ndërveprimi. Ose, ju mund të krijoni një pemë vendimesh me më pak thellësi.

Algoritmet e mësimit të makinerisë së përbashkët

Regresionit linear

Këto janë ndoshta ato më të thjeshtat.
Pak nga shembujt ku përdoret regresioni linear janë:

  • Së pari, kur është koha për të kaluar një vend në tjetrin
  • Parashikimi i shitjeve të një produkti të veçantë muajin tjetër
  • Ndikimi i përmbajtjes së alkoolit në gjak në koordinimin
  • Parashikoni shitje mujore të kartave të dhuratave dhe përmirësoni parashikimet vjetore të të ardhurave

Regresioni logjistik

Me sa duket, ka shumë përparësi për këtë algoritëm — integrimi i më shumë veçorive me një strukturë të këndshme interpretimi, lehtësi për azhurnimin e lehtë për të aneksuar të dhëna të reja.

Për ta thënë ndryshe, mund ta përdorni këtë për:

  • Parashikimi i dredhjes së klientit.
  • Rasti i veçantë i shënimit të kredisë ose zbulimit të mashtrimit.
  • Matja e efektivitetit të fushatave të marketingut.

Pemë vendimesh

Me sa duket, pemët e vetme përdoren rrallë, por në përbërje, me shumë të tjera, ato ndërtojnë algoritme efikase si Pylli i Rastësishëm ose Nxjerrja e Pemëve me gradient. Sidoqoftë, një nga disavantazhet është që ata nuk e mbështesin mësimin në internet, kështu që ju duhet të rindërtoni pemën tuaj kur të shfaqen shembuj të rinj.

Pemët janë të shkëlqyera për:

  • Vendimet e investimeve
  • Paracaktuesit e huasë bankare
  • Kualifikimet e plumbit të shitjeve

Bayes Naive

Më e rëndësishmja, Bayes Naive është një zgjedhje e duhur kur CPU dhe burimet e kujtesës janë një faktor kufizues. Sidoqoftë, disavantazhi kryesor i tij është se nuk mund të mësojë ndërveprime midis veçorive.

Mund të përdoret për:

  • Njohja e fytyrës
  • Për të shënuar një email si spam ose jo.
  • Analiza e ndjenjës dhe klasifikimi i tekstit.

përfundim

Prandaj, në përgjithësi, në një skenar në kohë reale, është disi e vështirë të jesh nën algoritmin e duhur të mësimit të makinerisë për qëllimin. Sidoqoftë, ju mund ta përdorni këtë listë kontrolluese për të përzgjedhur disa algoritme në lehtësinë tuaj.

Për më tepër, zgjedhja e zgjidhjes së duhur për një problem në jetën reale kërkon mirëkuptim të biznesit ekspert së bashku me algoritmin e duhur. Kështu që, mësojini të dhënat tuaja në algoritmet e duhura, drejtojini të gjitha qoftë paralele ose seriale, dhe në fund vlerësoni performancën e algoritmeve për të zgjedhur më të mirën (a).

Nëse jeni duke kërkuar të specializoheni në mësimin e thellë, atëherë mund të kontrolloni këtë kurs duke mësuar thellë.

TAGS:

  • AI

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map