Î:
Ce este mai bine, o platformă sau un algoritm de învățare a utilajelor proprii pe AWS?
A:În aceste zile, multe companii integrează soluțiile de învățare automată în instrumentul lor de analiză pentru a îmbunătăți managementul mărcii, a îmbunătăți experiența clienților și a crește eficiența operațională. Modelele de învățare automată sunt componentele de bază ale soluțiilor de învățare automată. Modelele sunt instruite folosind algoritmi matematici și seturi mari de date pentru a face predicții fiabile. Două exemple comune de predicții sunt (1) determinarea dacă un set de tranzacții financiare indică o fraudă sau (2) evaluarea sentimentului consumatorului în jurul unui produs, pe baza contribuțiilor colectate de pe social media.
Amazon SageMaker este un serviciu complet gestionat care permite dezvoltatorilor și oamenilor de știință de date să construiască, să antreneze și să implementeze modele de învățare automată. În SageMaker, puteți utiliza algoritmi care nu sunt disponibili, sau puteți accesa propria cale pentru o soluție mai personalizată. Ambele alegeri sunt valabile și servesc la fel de bine ca bază pentru o soluție de succes în învățarea mașinii.
(Nota editorului: Puteți vedea alte alternative la SageMaker aici.)
Algoritmii din afara SageMaker includ exemple populare, extrem de optimizate pentru clasificarea imaginilor, procesarea limbajului natural etc. Lista completă poate fi găsită aici .
- Avantaje din afara acestei categorii: Acești algoritmi au fost pre-optimizați (și se află în continuă îmbunătățire). Puteți fi în funcțiune, rulați și implementați rapid. În plus, este disponibilă reglarea automată a hipermetrilor AWS
- Considerații extraordinare: Îmbunătățirile continue menționate mai sus pot să nu producă rezultate la fel de previzibil ca și cum ai avea un control complet asupra implementării algoritmilor.
Dacă acești algoritmi nu sunt potriviți pentru proiectul dvs., aveți alte trei opțiuni: (1) Biblioteca Apache Spark a Amazonului, (2) cod Python personalizat (care folosește TensorFLow sau Apache MXNet) sau (3) „adu-ți propriul” acolo unde sunt esențial neconfinate, dar va trebui să creeze o imagine Docker pentru a vă antrena și servi modelul dvs. (puteți face acest lucru folosind instrucțiunile de aici ).
Abordarea care vă aduce propriul dvs. vă oferă o libertate deplină. Acest lucru se poate dovedi atractiv pentru oamenii de știință de date care au construit deja o bibliotecă cu cod algoritmic personalizat și / sau proprietar, care poate să nu fie reprezentat în setul curent din afara casetei.
- Avantaje Bring-Your-Own: Permite controlul complet asupra întregii conducte de știință a datelor împreună cu utilizarea IP-ului proprietar.
- Considerații proprii: Dockerizarea este necesară pentru a antrena și servi modelul rezultat. Încorporarea de îmbunătățiri algoritmice este responsabilitatea dumneavoastră.
Indiferent de alegerea algoritmului dvs., SageMaker pe AWS este o abordare demnă de luat în considerare, având în vedere cât de mult a fost pus accentul pe ușurința de utilizare din perspectiva științei datelor. Dacă ați încercat vreodată să migrați un proiect de învățare automată din mediul dvs. local către unul găzduit, veți fi plăcut surprins de cât de bine este SageMaker. Și dacă începi de la zero, ești deja cu câțiva pași mai aproape de obiectivul tău, având în vedere cât de mult este deja la îndemână.