Ti trovi qui: Home � Research

Laboratorio Data Science

Responsabile del nodo: Prof.ssa Sonia Bergamaschi (sonia.bergamaschi@unimore.it)

Membro dell’Hub sui Big Data costituito dalla Regione Emilia Romagna.
Partecipa al Centro Interdipartimentale AIRI (ex Softech-ICT).

Il laboratorio si suddivide in cinque aree di competenza che affrontano i seguenti temi di ricerca:

Privacy Preserving Big Data Integration
Text-to-SQL with Large Language Models
Scalable techniques for data integrations for (and with) AI applications
Explainable Entity Matching on textual datasets
Multivariate time series analytics
Event extraction from Italian text using Large Language Models
Anomaly detection of railway equipment using autoencoders
Service composition based on context data
Industrial anomaly detection on time series
Data-centric AI
Medical decision support system
Data security and protection
Cloud-Edge continuum, decentralized intelligence

�

Area competenza 1

Referente

Prof.ssa senior Sonia Bergamaschi (sonia.bergamaschi@unimore.it)

Sito Web

http://dbgroup.ing.unimo.it

Composizione

Componenti Strutturati

Sonia Bergamaschi, professore senior ING-INF/05
Francesco Guerra, professore ordinario ING-INF/05
Domenico Beneventano, professore associato ING-INF/05
Maurizio Vincini, professore associato ING-INF/05
Laura Po, professore associato ING-INF/05
Giovanni Simonini, professore associato ING-INF/05
Luca Gagliardelli, ricercatore tipo A ING-INF/05
Rollo Federica, ricercatore tipo A ING-INF/05

Componenti Non Strutturati

Luca Zecchini, assegnista post doc
Donato Tiano, assegnista post doc
Francesco Del Buono, assegnista post doc
Luca Sala, dottorando
Lisa Trigiante, dottorando
Angelo Mozzillo, dottorando
Adeel Aslam, dottorando
Sania Aftar, dottorando
Giulio De Sabbata, dottorando
Giovanni Sullutrone, dottorando
Ambra Di Piano, dottorando
Martina Casari, dottorando
Giovanni Bonisoli, dottorando
Andrea Baraldi, dottorando
Riccardo Benassi, dottorando
Luca Contalbo, dottorando

Temi di ricerca

Privacy Preserving Big Data Integration

Descrizione
L'integrazione dei Big Data � il processo di combinazione di grandi volumi di dati eterogenei provenienti da diverse fonti e formati, al fine di ottenere una visione unificata, completa ed integrata dei dati per l'analisi. Tuttavia, quando si trattano dati sensibili personali relativi agli individui, � fondamentale garantire la protezione della privacy. In questo contesto, l'implementazione di tecniche appropriate per preservare la privacy diventa cruciale. Tra queste tecniche, la pseudonimizzazione � comunemente utilizzata durante il record linkage per proteggere l'identit� degli individui, mentre l'anonimizzazione � impiegata durante la fase di data fusion e pubblicazione del dataset integrato per garantire l'irreversibilit� della protezione dei dati sensibili.

Rilevanza per il tema "Data Science"
L'integrazione dei Big Data con la preservazione della privacy � essenziale per assicurare che le analisi e le decisioni basate sui dati siano accurate e affidabili. Garantire la privacy durante il processo di integrazione consente di ottenere una visione unificata e completa dei dati, facilitando l'identificazione di pattern e insight significativi senza compromettere la riservatezza delle informazioni personali degli individui.
�

Text-to-SQL with Large Language Models

[...]

Scalable techniques for data integrations for (and with) AI applications

Descrizione
Questa area di ricerca ha come obiettivo di studiare tecniche di data integration che influenzano la qualit� dei dataset utilizzati per training di modelli AI (e.g., fine tuning di applicazioni LLM-based). Allo stesso tempo studia come l'impiego degli LLM stessi pu� automatizzare il processo di integrazione dei dati. Infatti, questi due task sono strettamente interconnessi e reciprocamente influenzati.

Rilevanza per il tema "Data Science"
Queste tecniche rivestono un'importanza fondamentale nella ricerca in data science poich� consentono di ottenere dataset affidabili e di alta qualit�, fornendo una base solida per l'analisi e l'implementazione di modelli predittivi avanzati.

Explainable Entity Matching on textual datasets

[...]

Multivariate time series analytics

[...]

Event extraction from Italian text using Large Language Models

[...]

�

Area competenza 2

Referente

Prof.ssa Letizia Leonardi (letizia.leonardi@unimore.it)

Sito Web

http://www.agentgroup.unimo.it

Composizione

Componenti Strutturati

Letizia Leonardi, professore ordinario ING-INF/05
Giacomo Cabri, professore ordinario ING-INF/05
Franco Zambonelli, professore ordinario ING-INF/05
Marco Mamei, professore ordinario ING-INF/05
Angelo Ferrando, ricercatore tipo B ING-INF/05

Temi di ricerca

Anomaly detection of railway equipment using autoencoders

[...]

Service composition based on context data

[...]

�

Area competenza 3

Referente

Prof. Simone Calderara (simone.calderara@unimore.it)

Sito Web

https://aimagelab.ing.unimore.it

Composizione

Componenti Strutturati

Simone Calderara, professore ordinario ING-INF/05

Aree di ricerca

Industrial anomaly detection on time series

[...]

�

Area competenza 4

Referente

Prof.ssa Federica Mandreoli (federica.mandreoli@unimore.it)

Sito Web

https://www.isgroup.unimore.it

Composizione

Componenti Strutturati

Federica Mandreoli, professore ordinario ING-INF/05

Componenti Non Strutturati

Veronica Guidetti, assegnista
Mattia Billa, dottorando
Federico Motta, dottorando

Temi di ricerca

Data-centric AI

Medical decision support system

�

Area competenza 5

Referente

Prof.ssa Claudia Canali (claudia.canali@unimore.it)

Sito Web

https://secloud.ing.unimore.it

Composizione

Componenti Strutturati

Claudia Canali, professore associato ING-INF/05
Riccardo Lancellotti, professore associato ING-INF/05
Mirco Marchetti, professore associato ING-INF/05

Temi di ricerca

Data Security and Protection

Questa attivit� di ricerca prevede lo sviluppo e l'analisi di nuovi approcci per la rilevazione di attacchi informatici a sistemi informativi connessi. In particolare si prendono in considerazione i recenti sviluppi nell'ambito del machine learning e dell'intelligenza artificiale applicata all'analisi di elevati volumi di traffico di rete con un duplice scopo: sviluppare approcci innovativi di anomaly detection in grado di rilevare attacchi e anomalie in modo robusto; verificare la robustezza dei nuovi algoritmi di analisi basati su AI rispetto ad adversarial attacks che mirano a causare errate classificazioni.

Cloud-Edge continuum, decentralized intelligence

Questa attivit� di ricerca si basa sullo studio e sulla progettazione di architetture di Cloud-Edge continuum, nel cui contesto l'adozione di modelli di machine learning sta guadagnando sempre pi� importanza. In particolare, l'obiettivo della ricerca � duplice: sviluppare algoritmi avanzati di data science e di reinforcement learning per una efficace distribuzione e allocazione delle risorse all'interno dell'infrastruttura distribuita; proporre ed implementare modelli prestazionali basati sul machine Learning, per prevedere i tempi di risposta di microservizi e applicazioni su risorse cloud ed edge eterogenee.

�

Categorie: DBGroup Activities

�

Universit� degli studi di Modena e Reggio Emilia

Laboratorio Data Science

Area competenza 1

Referente

Sito Web

Composizione

Componenti Strutturati

Componenti Non Strutturati

Temi di ricerca

Privacy Preserving Big Data Integration

Text-to-SQL with Large Language Models

Scalable techniques for data integrations for (and with) AI applications

Explainable Entity Matching on textual datasets

Multivariate time series analytics

Event extraction from Italian text using Large Language Models

Area competenza 2

Referente

Sito Web

Composizione

Componenti Strutturati

Temi di ricerca

Anomaly detection of railway equipment using autoencoders

Service composition based on context data

Area competenza 3

Referente

Sito Web

Composizione

Componenti Strutturati

Aree di ricerca

Industrial anomaly detection on time series

Area competenza 4

Referente

Sito Web

Composizione

Componenti Strutturati

Componenti Non Strutturati

Temi di ricerca

Data-centric AI

Medical decision support system

Area competenza 5

Referente

Sito Web

Composizione

Componenti Strutturati

Temi di ricerca

Data Security and Protection

Cloud-Edge continuum, decentralized intelligence