Appunti di Machine Learning in ambito finanziario – II parte –

Ottobre 21, 2021 0 Di Ruggero Grando

In questa seconda parte di appunti, continueremo a scrivere del codice in Python. Scendendo nel particolare, vedremo una breve introduzione al modello della regressione polinomiale che ci permetterà nella terza parte di individuare il valore della variabile dipendente dal valore della variabile indipendente. Nel nostro caso, come descritto nella prima parte, la variabile dipendente è il prezzo, o meglio l’attributo ‘Close’ della pair considerata, mentre, la variabile indipendente è il tempo distribuito secondo un intervallo ben definito.

Il modello di regressione polinomiale

Come indicato nella parte introduttiva, in questo articolo, leggeremo come calcolare un valore di previsione del prezzo ‘Close’ applicando il modello della regressione polinomiale.

La regressione polinomiale è un tipo di modello della regressione lineare, e può essere rappresentata dalla seguente espressione:

Facendo riferimento all’espressione illustrata nella figura precedente, il nostro caso di esempio utilizza un solo parametro o feature: il prezzo ‘Close’ dell’asset della pair. Il valore di risposta y (variabile dipendente) non è un vettore, ma solo un valore, quindi il tutto diventa abbastanza semplice. Si trovano i coefficienti, e come valore della variabile x (indipendente) si passa il valore dell’intervallo di tempo considerato. Il tutto, servirà a trovare il valore di previsione. Come vedremo, nella terza parte sarà Python a trovare i coefficienti dell’espressione, e quindi a calcolare i valori stimati.

Quanto scritto, si traduce in codice Python. Quindi, iniziamo da dove avevamo lasciato nella prima parte con la lettura e la spiegazione del codice.

Parte di codice di Python per la trasposizione del dataframe a ndarray o vettore — Fig 1.
(Da Dataframe ad oggetto ndarray).

Nella riga quarantotto si esegue la stampa dei valori della colonna ‘Close’ del dataframe df1_risultato. Questo, ci permetterà di capire la differenza tra i valori del dataframe e i valori presenti in un oggetto ndarray.

Dataframe df1_risultato contenenti le colonne indice (Time) e Close — Fig 2.
(Stampa della colonna ‘Close’ del dataframe df1_risultato).

Come vedete, la stampa della colonna ‘Close’ del dataframe df1_risultato prevede anche l’associazione del relativo indice, che nel nostro caso corrisponde alla colonna ‘Time’ del dataframe come definito nella prima parte di questi appunti.

A questo punto, proseguiamo con la riga del codice Python quarantanove, ove la proprietà values dell’oggetto Dataframe estrae i dati della colonna ‘Close’ e li salva in un oggetto ndarray. L’oggetto in questo caso viene chiamato ‘l’. Ora i dati sono disposti secondo l’immagine seguente.

Valori contenuti nell'oggetto ndarray o vettore l — Fig. 3
(Stampa dei valori nell’oggetto ndarray l)

Guardando la figura tre, ora i valori della colonna ‘Close’ sono epurati dall’indice del dataframe e disposti in un vettore così da poterli manipolare al meglio.

Valori del vettore l epurati dalla media — Fig 4.
(Rappresentazione dei valori dell’andamento della pair utile epurati dalla media).

Nella riga cinquantadue, ad ogni valore presente nel vettore l viene sottratto il valore di media dei dati del vettore l. Quindi, i valori espressi dal vettore l sono sostanzialmente gli scostamenti rispetto alla media. Nella riga successiva, la cinquantatré, riduciamo ad un intervallo [-2,+2] i valori possibile dell’asse x. L’asse x non conterrà più un valore temporale, ma un valore numerico compresso nell’intervallo -2, +2, però, è sottinteso che lo esprime.

Di seguito i valori del vettore f.

Valori f dopo l'applicazione del metodo Numpy Linspace — Fig. 5
(I valori f dopo l’applicazione del metodo Numpy Linspace)

No votes yet.

Please wait...

CategoriaApprofondimenti

Tagfinance machine learning regressione polinomiale standardizzazione

Intelligenza Artificiale – I parte –

Appunti di Machine Learning in ambito finanziario – III parte –

Info sull'autore

Ruggero Grando

Da anni sono un "appassionato" di informatica e in particolare del mondo GNU/Linux. Ho iniziato nel lontano 1998 come collaboratore di DADA s.p.a. per la testata SuperEva e nello specifico ho scritto numerosi articoli per il canale "Overclock dei processori". Nel 2001 ho dato il via, al sito Megaoverclock (https://www.megaoverclock.it) e per sei anni, ho contribuito alla diffusione della pratica dell'overclocking delle CPUs. Nello stesso periodo ho realizzato un versione beta di un software per la gestione di uno zoo in linguaggio Java, un prototipo di un sistema di raffreddamento per microprocessori e collaborato con alcune riviste nazionali del settore informatico. Nel 2011 ho lanciato il sito The Megalinux (https://www.megalinux.it) e ho scritto diversi articoli con l'obiettivo di promuovere la cultura del free sofware. Infine, negli ultimi anni, mi sono dedicato alla conoscenza del mondo della blockchain e delle cryptovalute sviluppando alcuni algoritmi in linguaggio Python per i sistemi di trading.

Lascia un commento Annulla risposta

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Cookie	Durata	Descrizione
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Appunti di Machine Learning in ambito finanziario – II parte –

Il modello di regressione polinomiale

Info sull'autore

Lascia un commento Annulla risposta

Informativa Estesa