Ti trovi qui: Home » Research

Laboratorio Data Science


Nodo del Laboratorio CINI Data Science.

Responsabile del nodo: Prof.ssa Sonia Bergamaschi (sonia.bergamaschi@unimore.it)

Membro dell’Hub sui Big Data costituito dalla Regione Emilia Romagna.
Partecipa al Centro Interdipartimentale AIRI (ex Softech-ICT).

Il laboratorio si suddivide in cinque aree di competenza che affrontano i seguenti temi di ricerca:

 


Area competenza 1

Referente

Prof.ssa senior Sonia Bergamaschi (sonia.bergamaschi@unimore.it)

Sito Web

http://dbgroup.ing.unimo.it

Composizione

Componenti Strutturati

  • Sonia Bergamaschi, professore senior ING-INF/05
  • Francesco Guerra, professore ordinario ING-INF/05
  • Domenico Beneventano, professore associato ING-INF/05
  • Maurizio Vincini, professore associato ING-INF/05
  • Laura Po, professore associato ING-INF/05
  • Giovanni Simonini, professore associato ING-INF/05
  • Luca Gagliardelli, ricercatore tipo A ING-INF/05
  • Rollo Federica, ricercatore tipo A ING-INF/05

Componenti Non Strutturati

  • Luca Zecchini, assegnista post doc
  • Donato Tiano, assegnista post doc
  • Francesco Del Buono, assegnista post doc
  • Luca Sala, dottorando
  • Lisa Trigiante, dottorando
  • Angelo Mozzillo, dottorando
  • Adeel Aslam, dottorando
  • Sania Aftar, dottorando
  • Giulio De Sabbata, dottorando
  • Giovanni Sullutrone, dottorando
  • Ambra Di Piano, dottorando
  • Martina Casari, dottorando
  • Giovanni Bonisoli, dottorando
  • Andrea Baraldi, dottorando
  • Riccardo Benassi, dottorando
  • Luca Contalbo, dottorando

Temi di ricerca

Privacy Preserving Big Data Integration

Descrizione
L'integrazione dei Big Data è il processo di combinazione di grandi volumi di dati eterogenei provenienti da diverse fonti e formati, al fine di ottenere una visione unificata, completa ed integrata dei dati per l'analisi. Tuttavia, quando si trattano dati sensibili personali relativi agli individui, è fondamentale garantire la protezione della privacy. In questo contesto, l'implementazione di tecniche appropriate per preservare la privacy diventa cruciale. Tra queste tecniche, la pseudonimizzazione è comunemente utilizzata durante il record linkage per proteggere l'identità degli individui, mentre l'anonimizzazione è impiegata durante la fase di data fusion e pubblicazione del dataset integrato per garantire l'irreversibilità della protezione dei dati sensibili.

Rilevanza per il tema "Data Science"
L'integrazione dei Big Data con la preservazione della privacy è essenziale per assicurare che le analisi e le decisioni basate sui dati siano accurate e affidabili. Garantire la privacy durante il processo di integrazione consente di ottenere una visione unificata e completa dei dati, facilitando l'identificazione di pattern e insight significativi senza compromettere la riservatezza delle informazioni personali degli individui.
 

Text-to-SQL with Large Language Models

[...]

Scalable techniques for data integrations for (and with) AI applications

Descrizione
Questa area di ricerca ha come obiettivo di studiare tecniche di data integration che influenzano la qualità dei dataset utilizzati per training di modelli AI (e.g., fine tuning di applicazioni LLM-based). Allo stesso tempo studia come l'impiego degli LLM stessi può automatizzare il processo di integrazione dei dati. Infatti, questi due task sono strettamente interconnessi e reciprocamente influenzati.

Rilevanza per il tema "Data Science"
Queste tecniche rivestono un'importanza fondamentale nella ricerca in data science poiché consentono di ottenere dataset affidabili e di alta qualità, fornendo una base solida per l'analisi e l'implementazione di modelli predittivi avanzati.

Explainable Entity Matching on textual datasets

[...]

Multivariate time series analytics

[...]

Event extraction from Italian text using Large Language Models

[...]

 


Area competenza 2

Referente

Prof.ssa Letizia Leonardi (letizia.leonardi@unimore.it)

Sito Web

http://www.agentgroup.unimo.it

Composizione

Componenti Strutturati

  • Letizia Leonardi, professore ordinario ING-INF/05
  • Giacomo Cabri, professore ordinario ING-INF/05
  • Franco Zambonelli, professore ordinario ING-INF/05
  • Marco Mamei, professore ordinario ING-INF/05
  • Angelo Ferrando, ricercatore tipo B ING-INF/05

Temi di ricerca

Anomaly detection of railway equipment using autoencoders

[...]

Service composition based on context data

[...]

 

 

 


Area competenza 3

Referente

Prof. Simone Calderara (simone.calderara@unimore.it)

Sito Web

https://aimagelab.ing.unimore.it

Composizione

Componenti Strutturati

  • Simone Calderara, professore ordinario ING-INF/05

Aree di ricerca

Industrial anomaly detection on time series

[...]

 


Area competenza 4

Referente

Prof.ssa Federica Mandreoli (federica.mandreoli@unimore.it)

Sito Web

https://www.isgroup.unimore.it

Composizione

Componenti Strutturati

  • Federica Mandreoli, professore ordinario ING-INF/05

Componenti Non Strutturati

  • Veronica Guidetti, assegnista
  • Mattia Billa, dottorando
  • Federico Motta, dottorando

Temi di ricerca

Data-centric AI

Medical decision support system

 


Area competenza 5

Referente

Prof.ssa Claudia Canali (claudia.canali@unimore.it)

Sito Web

https://secloud.ing.unimore.it

Composizione

Componenti Strutturati

  • Claudia Canali, professore associato ING-INF/05
  • Riccardo Lancellotti, professore associato ING-INF/05
  • Mirco Marchetti, professore associato ING-INF/05

Temi di ricerca

Data Security and Protection

Questa attività di ricerca prevede lo sviluppo e l'analisi di nuovi approcci per la rilevazione di attacchi informatici a sistemi informativi connessi. In particolare si prendono in considerazione i recenti sviluppi nell'ambito del machine learning e dell'intelligenza artificiale applicata all'analisi di elevati volumi di traffico di rete con un duplice scopo: sviluppare approcci innovativi di anomaly detection in grado di rilevare attacchi e anomalie in modo robusto; verificare la robustezza dei nuovi algoritmi di analisi basati su AI rispetto ad adversarial attacks che mirano a causare errate classificazioni.

Cloud-Edge continuum, decentralized intelligence

Questa attività di ricerca si basa sullo studio e sulla progettazione di architetture di Cloud-Edge continuum, nel cui contesto l'adozione di modelli di machine learning sta guadagnando sempre più importanza. In particolare, l'obiettivo della ricerca è duplice: sviluppare algoritmi avanzati di data science e di reinforcement learning per una efficace distribuzione e allocazione delle risorse all'interno dell'infrastruttura distribuita; proporre ed implementare modelli prestazionali basati sul machine Learning, per prevedere i tempi di risposta di microservizi e applicazioni su risorse cloud ed edge eterogenee.

 

 

 

Categorie: DBGroup Activities