Il modello sequenziale di Keras: un esempio di utilizzo.

Aprile 6, 2022 1 Di Ruggero Grando

ADDESTRAMENTO DEL MODELLO KERAS E CONCETTO DI BATCH SIZE

E’ giunto il momento di addestrare il modello sui dati di input. Per fare ciò utilizziamo il seguente codice:

32 model.fit(XScaler, Y, epochs=150, batch_size=10)

Come al solito, cerchiamo di commentare il codice. In particolare, la riga trentadue, utilizza il metodo fit della classe Sequential che permette di addestrare la rete neurale che abbiamo appena creato. Il metodo fit richiede come primo argomento, il dataset XScaler e come secondo argomento il dataset Y (Ouput), di cui abbiamo già ampiamente parlato. Il terzo argomento indica il numero delle epochs, mentre il quarto il numero di Batch Size. Di quest’ultimi ne parliamo successivamente.

L’algoritmo di addestramento della rete neurale utilizzerà un numero di iterazioni definito dall’argomento Epochs per minimizzare la funzione di costo della nostra ipotesi. Durante un’epoch tutto il training set di dati (tutte le righe del dataset) viene elaborato interamente. Nel nostro caso è stato inserito il valore 150 come valore di Epochs, ossia il numero di elaborazioni che il nostro algoritmo di apprendimento (gradient descent) farà per minimizzare la funzione di costo. Con l’argomento Batch Size si comunica alla rete neurale di utilizzare all’interno di ogni epoch degli ulteriori cicli (iterazioni) a gruppi di 10 righe, nel caso in esempio, per i quali viene eseguito l’addestramento o training.

Per chiarire meglio il concetto di Batch Size, diciamo, che un set di dati di training (le nostre righe/campioni del dataset) può essere suddiviso in uno o più batch. Normalmente, si applica il Batch Size in sistemi in cui è limitato il quantitativo di memoria o la potenza di calcolo disponibili, o quando non è possibile elaborare l’intero set di dati di training in un colpo solo!

Quando tutti i campioni di addestramento vengono utilizzati per creare un batch (Batch Size = Size of Training Set), l’algoritmo di apprendimento viene chiamato discesa del gradiente batch ossia “Batch Gradient Descent”.
Invece, quando il batch ha le dimensioni di un campione (Batch Size = 1 campione del nostro set di dati di addestramento), l’algoritmo di apprendimento è chiamato discesa del gradiente stocastico ossia “Stochastic Gradient Descent”.
Infine, quando la dimensione del batch è più di un campione e inferiore alla dimensione del set di dati di addestramento (1 < Batch Size < Size of Training Set), l’algoritmo di apprendimento viene chiamato “Mini-Batch Gradient Descent”.

L’adozione del Batch Size determina il problema evidenziato nell’immagine seguente: più piccolo è il batch size, meno accurata sarà la stima del gradiente. Come si vede, la direzione del gradiente mini-batch ,linea di colore verde, fluttua molto di più della direzione del batch completo (senza batch size).

Gradient directions for different batch setups — Fig. 18
(L’algoritmo di apprendimento ossia Gradient Descent)

Pagina Precedente / Pagina Successiva

No votes yet.

Please wait...

CategoriaArticoli

Tagesempio di utilizzo del modello sequenziale Keras Keras example of sequential model Keras Machine Learning modello sequenziale Keras

Crypto_1_Backtester

ML_Keras_Example_1

Info sull'autore

Ruggero Grando

Da anni sono un "appassionato" di informatica e in particolare del mondo GNU/Linux. Ho iniziato nel lontano 1998 come collaboratore di DADA s.p.a. per la testata SuperEva e nello specifico ho scritto numerosi articoli per il canale "Overclock dei processori". Nel 2001 ho dato il via, al sito Megaoverclock (https://www.megaoverclock.it) e per sei anni, ho contribuito alla diffusione della pratica dell'overclocking delle CPUs. Nello stesso periodo ho realizzato un versione beta di un software per la gestione di uno zoo in linguaggio Java, un prototipo di un sistema di raffreddamento per microprocessori e collaborato con alcune riviste nazionali del settore informatico. Nel 2011 ho lanciato il sito The Megalinux (https://www.megalinux.it) e ho scritto diversi articoli con l'obiettivo di promuovere la cultura del free sofware. Infine, negli ultimi anni, mi sono dedicato alla conoscenza del mondo della blockchain e delle cryptovalute sviluppando alcuni algoritmi in linguaggio Python per i sistemi di trading.

1 commento

Gianfranco ha detto:

Aprile 17, 2022 alle 9:48 pm

Utile

Rispondi

Lascia un commento Annulla risposta

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Cookie	Durata	Descrizione
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Il modello sequenziale di Keras: un esempio di utilizzo.

ADDESTRAMENTO DEL MODELLO KERAS E CONCETTO DI BATCH SIZE

Info sull'autore

1 commento

Lascia un commento Annulla risposta

Informativa Estesa