Î:
Cum pot permite noile capabilități de învățare a mașinilor să extragă documente stoc pentru date financiare?
A:Una dintre noile frontiere interesante ale învățării automate și AI este că oamenii de știință și inginerii se angajează pe diverse modalități de a utiliza tipuri complet noi de resurse pentru a prezice rezultatele mișcării stocurilor și investițiilor. Acesta este un schimbător de joc extraordinar în lumea financiară și va revoluționa strategiile de investiții într-un mod foarte profund.
Una dintre ideile de bază pentru extinderea acestui tip de cercetare de stocuri este lingvistica de calcul, care implică modelarea limbajului natural. Experții investighează modul de utilizare a documentelor text, de la înregistrările SEC până la scrisorile acționarilor la alte resurse bazate pe text periferice, pentru a mări sau a regla analiza stocurilor sau pentru a dezvolta analize complet noi.
Descărcare gratuită: învățarea mașinii și de ce contează |
Discriminarea importantă este că toate acestea sunt realizabile doar prin avansuri noi în rețelele neuronale, învățarea automată și analiza limbajului natural. Înainte de apariția ML / AI, tehnologiile de calcul foloseau mai ales programarea liniară pentru „citirea” intrărilor. Documentele text au fost prea nestructurate pentru a fi utile. Dar, odată cu progresele înregistrate în analiza limbajului natural în ultimii ani, oamenii de știință constată că este posibil să „mina” limbajul natural pentru rezultate cuantificabile sau, cu alte cuvinte, rezultate care pot fi calculate într-un fel.
Unele dintre cele mai bune dovezi și cele mai utile exemple în acest sens provin din diverse disertații și lucrări de doctorat disponibile pe internet. Într-o lucrare, „Aplicații ale învățării automate și lingvisticii computaționale în economia financiară”, publicată în aprilie 2016, Lili Gao explică în mod capabil procesele relevante specifice extragerii înregistrărilor corporative SEC, apelurilor acționarilor și mesajelor de social media.
„Extragerea de semnale semnificative din date text nestructurate și de înaltă dimensiune nu este o sarcină ușoară”, scrie Gao. „Cu toate acestea, odată cu dezvoltarea tehnicilor lingvistice de învățare și calculare, procesarea și analizarea statistică a documentelor textuale pot fi realizate, iar multe aplicații ale analizei statisticilor de text în științele sociale s-au dovedit a fi de succes." Din discuția lui Gao privind modelarea și calibrarea în rezumat, întregul document dezvoltat arată modul în care unele dintre aceste tipuri de analiză funcționează în detaliu.
Alte surse pentru proiecte active includ pagini precum acest proiect GitHub sumar și această resursă IEEE vorbind special despre obținerea informațiilor financiare valoroase din „analiza sentimentului Twitter”.
Concluzia este că utilizarea acestor noi modele NLP determină o inovație rapidă în utilizarea tuturor tipurilor de documente text, nu doar pentru analize financiare, ci și pentru alte tipuri de descoperire de ultimă oră, care estompează această linie stabilită în mod tradițional între „limbă” și "date."