Laboratorio Data Science
Nodo del Laboratorio CINI Data Science.
Responsabile del nodo: Prof.ssa Sonia Bergamaschi (sonia.bergamaschi@unimore.it)
Membro dellHub sui Big Data costituito dalla Regione Emilia Romagna.
Partecipa al Centro Interdipartimentale AIRI (ex Softech-ICT).
Il laboratorio si suddivide in cinque aree di competenza che affrontano i seguenti temi di ricerca:
- Privacy Preserving Big Data Integration
- Text-to-SQL with Large Language Models
- Scalable techniques for data integrations for (and with) AI applications
- Explainable Entity Matching on textual datasets
- Multivariate time series analytics
- Event extraction from Italian text using Large Language Models
- Anomaly detection of railway equipment using autoencoders
- Service composition based on context data
- Industrial anomaly detection on time series
- Data-centric AI
- Medical decision support system
- Data security and protection
- Cloud-Edge continuum, decentralized intelligence
Area competenza 1
Referente
Prof.ssa senior Sonia Bergamaschi (sonia.bergamaschi@unimore.it)
Sito Web
Composizione
Componenti Strutturati
- Sonia Bergamaschi, professore senior ING-INF/05
- Francesco Guerra, professore ordinario ING-INF/05
- Domenico Beneventano, professore associato ING-INF/05
- Maurizio Vincini, professore associato ING-INF/05
- Laura Po, professore associato ING-INF/05
- Giovanni Simonini, professore associato ING-INF/05
- Luca Gagliardelli, ricercatore tipo A ING-INF/05
- Rollo Federica, ricercatore tipo A ING-INF/05
Componenti Non Strutturati
- Luca Zecchini, assegnista post doc
- Donato Tiano, assegnista post doc
- Francesco Del Buono, assegnista post doc
- Luca Sala, dottorando
- Lisa Trigiante, dottorando
- Angelo Mozzillo, dottorando
- Adeel Aslam, dottorando
- Sania Aftar, dottorando
- Giulio De Sabbata, dottorando
- Giovanni Sullutrone, dottorando
- Ambra Di Piano, dottorando
- Martina Casari, dottorando
- Giovanni Bonisoli, dottorando
- Andrea Baraldi, dottorando
- Riccardo Benassi, dottorando
- Luca Contalbo, dottorando
Temi di ricerca
Privacy Preserving Big Data Integration
Descrizione
L'integrazione dei Big Data è il processo di combinazione di grandi volumi di dati eterogenei provenienti da diverse fonti e formati, al fine di ottenere una visione unificata, completa ed integrata dei dati per l'analisi. Tuttavia, quando si trattano dati sensibili personali relativi agli individui, è fondamentale garantire la protezione della privacy. In questo contesto, l'implementazione di tecniche appropriate per preservare la privacy diventa cruciale. Tra queste tecniche, la pseudonimizzazione è comunemente utilizzata durante il record linkage per proteggere l'identità degli individui, mentre l'anonimizzazione è impiegata durante la fase di data fusion e pubblicazione del dataset integrato per garantire l'irreversibilità della protezione dei dati sensibili.
Rilevanza per il tema "Data Science"
L'integrazione dei Big Data con la preservazione della privacy è essenziale per assicurare che le analisi e le decisioni basate sui dati siano accurate e affidabili. Garantire la privacy durante il processo di integrazione consente di ottenere una visione unificata e completa dei dati, facilitando l'identificazione di pattern e insight significativi senza compromettere la riservatezza delle informazioni personali degli individui.
Text-to-SQL with Large Language Models
[...]
Scalable techniques for data integrations for (and with) AI applications
Descrizione
Questa area di ricerca ha come obiettivo di studiare tecniche di data integration che influenzano la qualità dei dataset utilizzati per training di modelli AI (e.g., fine tuning di applicazioni LLM-based). Allo stesso tempo studia come l'impiego degli LLM stessi può automatizzare il processo di integrazione dei dati. Infatti, questi due task sono strettamente interconnessi e reciprocamente influenzati.
Rilevanza per il tema "Data Science"
Queste tecniche rivestono un'importanza fondamentale nella ricerca in data science poiché consentono di ottenere dataset affidabili e di alta qualità, fornendo una base solida per l'analisi e l'implementazione di modelli predittivi avanzati.
Explainable Entity Matching on textual datasets
[...]
Multivariate time series analytics
[...]
Event extraction from Italian text using Large Language Models
[...]
Area competenza 2
Referente
Prof.ssa Letizia Leonardi (letizia.leonardi@unimore.it)
Sito Web
http://www.agentgroup.unimo.it
Composizione
Componenti Strutturati
- Letizia Leonardi, professore ordinario ING-INF/05
- Giacomo Cabri, professore ordinario ING-INF/05
- Franco Zambonelli, professore ordinario ING-INF/05
- Marco Mamei, professore ordinario ING-INF/05
- Angelo Ferrando, ricercatore tipo B ING-INF/05
Temi di ricerca
Anomaly detection of railway equipment using autoencoders
[...]
Service composition based on context data
[...]
Area competenza 3
Referente
Prof. Simone Calderara (simone.calderara@unimore.it)
Sito Web
https://aimagelab.ing.unimore.it
Composizione
Componenti Strutturati
- Simone Calderara, professore ordinario ING-INF/05
Aree di ricerca
Industrial anomaly detection on time series
[...]
Area competenza 4
Referente
Prof.ssa Federica Mandreoli (federica.mandreoli@unimore.it)
Sito Web
https://www.isgroup.unimore.it
Composizione
Componenti Strutturati
- Federica Mandreoli, professore ordinario ING-INF/05
Componenti Non Strutturati
- Veronica Guidetti, assegnista
- Mattia Billa, dottorando
- Federico Motta, dottorando
Temi di ricerca
Data-centric AI
Medical decision support system
Area competenza 5
Referente
Prof.ssa Claudia Canali (claudia.canali@unimore.it)
Sito Web
https://secloud.ing.unimore.it
Composizione
Componenti Strutturati
- Claudia Canali, professore associato ING-INF/05
- Riccardo Lancellotti, professore associato ING-INF/05
- Mirco Marchetti, professore associato ING-INF/05
Temi di ricerca
Data Security and Protection
Questa attività di ricerca prevede lo sviluppo e l'analisi di nuovi approcci per la rilevazione di attacchi informatici a sistemi informativi connessi. In particolare si prendono in considerazione i recenti sviluppi nell'ambito del machine learning e dell'intelligenza artificiale applicata all'analisi di elevati volumi di traffico di rete con un duplice scopo: sviluppare approcci innovativi di anomaly detection in grado di rilevare attacchi e anomalie in modo robusto; verificare la robustezza dei nuovi algoritmi di analisi basati su AI rispetto ad adversarial attacks che mirano a causare errate classificazioni.
Cloud-Edge continuum, decentralized intelligence
Questa attività di ricerca si basa sullo studio e sulla progettazione di architetture di Cloud-Edge continuum, nel cui contesto l'adozione di modelli di machine learning sta guadagnando sempre più importanza. In particolare, l'obiettivo della ricerca è duplice: sviluppare algoritmi avanzati di data science e di reinforcement learning per una efficace distribuzione e allocazione delle risorse all'interno dell'infrastruttura distribuita; proporre ed implementare modelli prestazionali basati sul machine Learning, per prevedere i tempi di risposta di microservizi e applicazioni su risorse cloud ed edge eterogenee.
Categorie: DBGroup Activities