Natural Language Processing: dai BoW ai Transformers

Questo corso offre una panoramica completa delle principali tecniche di Natural Language Processing (NLP), affrontando sia i concetti teorici di base sia le applicazioni pratiche più avanzate. È pensato per fornire una comprensione solida e strumenti operativi per lavorare con i dati testuali.

Verranno analizzati i passaggi fondamentali che hanno guidato l’evoluzione della disciplina, a partire dai metodi statistici tradizionali come il Bag of Words (BoW), passando per gli Embeddings, fino alle architetture Transformers, evidenziando il loro ruolo centrale nello sviluppo dei più avanzati Large Language Models (LLM) come BERT e GPT.

Il percorso non si limita alla teoria, ma include esempi pratici e casi applicativi, per mostrare come queste tecniche possano essere utilizzate efficacemente in ambito professionale.

Dettagli del Corso

        Durata: 2 giorni

        Data: 27 Febbraio 9:00 – 28 Febbraio 18:00

        Lingua: italiano

        Location: Dipartimento di Scienze Statistiche, Via Cesare Battisti, 241, 35121 Padova PD

        Costo: 500 euro

 

Cosa imparerai

      Comprendere le basi e le applicazioni del Natural Language Processing (NLP) come campo interdisciplinare che combina linguistica, intelligenza artificiale e informatica.

        Applicazione di logiche di Fuzzy String Matching per l’organizzazione di dati non strutturati.

        Utilizzo degli Embeddings per la classificazione di documenti testuali.

       Sviluppo di un sistema RAG (Retrieval-Augmented Generation). Come predisporre un Large Language Models (LLM) a fornire risposte contestualizzate e aggiornabili.

        Fine Tuning di un Large Language Models (LLM). Come personalizzare un LLM per adattarlo a contesti specifici.

      Introduzione a LocalAI – https://localai.io/, una piattaforma open-source progettata per l’utilizzo di modelli linguistici e multimodali in locale o su infrastrutture on-premise. Permette di utilizzare LLM, generare immagini, audio e molto altro, operando con hardware consumer-grade, senza la necessità di una GPU dedicata. Una piattaforma pensata per sviluppatori e aziende che desiderano mantenere il controllo sui propri dati e infrastrutture.

Docente

Dario Solari, professionista con oltre 15 anni di esperienza nel campo della Data Science. Attualmente è impiegato in ambito finanziario come consulente per un importante gruppo assicurativo.  Ha maturato esperienze in startup e aziende di diversi settori, dall’industriale al bancario-assicurativo, con una forte specializzazione nell’uso dell’Intelligenza Artificiale.

Ha partecipato attivamente a competizioni su Kaggle (Google), ottenendo risultati significativi e affinando le sue capacità nella risoluzione di problemi complessi e nell’implementazione di modelli avanzati di Machine Learning.

Perché partecipare 

Questo corso è pensato per chi desidera approfondire la propria conoscenza in NLP, imparando non solo i concetti teorici, ma anche le competenze pratiche necessarie per affrontare sfide reali nel campo dell’elaborazione del linguaggio naturale. Che tu sia uno sviluppatore, un data scientist o un appassionato di intelligenza artificiale, questo corso ti fornirà le basi e le conoscenze avanzate per utilizzare tecnologie all’avanguardia.

Iscrizioni

Per confermare la tua partecipazione, ti invitiamo a registrarti entro il 20 Febbraio 2025 compilando questo form online.  

Al termine del corso verrà rilasciato un attestato di partecipazione indicante il numero delle ore di frequenza.

Qualora il numero minimo di partecipanti non fosse raggiunto, ci si riserva il diritto di annullare il corso, dandone comunicazione agli iscritti.

Per maggiori informazioni contattare: formazione@stat.unipd.it