AREA TESI E PROGETTI
Le tesi e i progetti saranno svolti presso il laboratorio di Visione, Elaborazione delle Immagini e Suoni (VIPS).
Gli obiettivi del laboratorio consistono nel creare un gruppo attivo di lavoro nei campi relativi alla visione computazionale (computer vision), pattern recognition, elaborazione delle immagini, elaborazione del suono, grafica, interazione umana-calcolatore e le applicazioni multimediali in genere.
Il lavoro di tesi (o progetto) inizia sempre con una ricerca dello stato dell'arte relativo al problema in oggetto, seguita tipicamente da un'implementazione delle idee trovate in letteratura e di quelle proprie che possono scaturire dall'analisi dello stato dell'arte.
La conoscenza di MATLAB e dei linguaggi C/C++ sono preferite, anche se sia il tool di sviluppo che i linguaggi possono essere ugualmente affrontati durante lo svolgimento del lavoro.Momenti di discussione con i responsabili del laboratorio e con tutte le persone che vi gravitano sono incoraggiate al fine di ampliare la conoscenza a tutti e ricevere opinioni da tutti (brainstorming). A tal fine, sarà chiesto ad ognuno di organizzare un seminario che riassumi lo stato dell'arte del problema affrontato. Il seminario sarà pubblico all'interno del Dipartimento e tutte le persone interessate, specialmente quelle che operano all'interno del laboratorio saranno caldamente invitate a partecipare.
Il Mercoledì di ogni settimana dalle 11 alle 12 nel laboratorio è fissata una riunione nella quale tutte le persone, tipicamente gli studenti in tesi, dovranno riassumere il lavoro svolto nella settimana precedente, oltre ad offrire l'opportunità di condividere e discutere problemi e soluzioni comuni.
Inoltre, saranno organizzati su richiesta riunioni informali, tipicamente aperti alle persone che lavorano nel laboratorio. In queste riunioni, da svolgersi dopo pranzo per circa 1 ora, un membro del laboratorio terrà un breve seminario o condurrà una discussione informale, per descrivere problemi, algoritmi o metodi e scambiarsi idee a riguardo. Ci si incontrerà per un caffé alle 13.30, per iniziare alle 13.45 circa nella stanza riunioni di CV2 al primo piano.
I seminari e le riunioni informali saranno pubblicizzate per via verbale e in rete e sarà organizzata una pagine web adeguata a questo scopo. Le riunioni del mercoledì sono invece fissate ogni settimana e non sarà data pubblicità a tale evento.
Alla fine della tesi (o progetto), sarà richiesto agli studenti di generare una pagina web che riassumi il contenuto ed i risultati del lavoro, possibilmente con una demo in linea.
E` nostra intenzione creare un ambiente di lavoro attivo e creativo dove tutti possono imparare e insegnare in uno scenario produttivo e collaborativo.
Come si scrive una relazione tecnica e cosa consegnare al docente
La relazione tecnica (o rapporto) da organizzare alla fine del progetto deve in generale essere strutturata nel seguente modo:
- Introduzione: descrizione del problema in generale e degli obiettivi del progetto.
- Stato dell'arte: specifico del problema affrontato, articoli, libri che spiegano come altri hanno affrontato lo stesso problema o problemi affini.
- Descrizione della tecnica: descrizione particolareggiata della tecnica proposta, implementata, etc., dettagliando quanto possibile le problematiche tecniche affrontate e come sono state risolte; i dettagli implementativi possono andare in appendice.
- Risultati: descrizione con immagini e figure dei risultati del progetto.
- Conclusioni: sommario di quello che è stato presentato nella relazione (progetto), ed eventuali sviluppi futuri.
- Bibliografia: lista degli articoli/libri citati nella relazione (secondo uno stile IEEE o ACM).
- Appendice: manuale uso del software (come si usa l'algoritmo, dove si trova il codice, i dati, etc.).
- Eventuali altre appendici.
La relazione va consegnata al docente in forma cartacea e in forma elettronica (MS-WORD o Latex, incluse le figure/immagini) in un CD-ROM o dischetto, includendo anche copia del codice e dei dati utilizzati.
Come si scrive una tesi e cosa consegnare al docente
La stesura di una tesi deve in generale essere organizzata nel seguente modo:
Abstract: va fatto innanzitutto un abstract in italiano e inglese di una pagina al massimo che descriva il lavoro nel suo complesso (tipo abstract degli articoli).
Introduzione: descrizione del problema in generale e degli obiettivi della tesi, evidenziando gli aspetti innovativi se esistono.
Stato dell'arte: specifico del problema affrontato, articoli, libri che spiegano come altri hanno affrontato lo stesso problema o problemi affini.
Descrizione della tecnica: descrizione particolareggiata della tecnica proposta, implementata, etc., dettagliando quanto possibile le problematiche tecniche affrontate e come sono state risolte.
Risultati: descrizione con immagini e figure dei risultati del progetto.
Conclusioni: sommario di quello che è stato presentato nella tesi ed eventuali sviluppi futuri.
Bibliografia: lista degli articoli/libri citati nella relazione (secondo uno stile IEEE o ACM).
Eventuali appendici: dettagli tecnici, dimostrazioni di teoremi, appendici propedeutiche su alcuni argomenti, manuale uso del software (come si usa l'algoritmo, dove si trova il codice, i dati, etc.).
Per scegliere il titolo lo studente di solito prepara 3 o 4 titoli di tentativo inserendo le parole chiave del lavoro e li invia al docente, il quale selezionerà o ne produrrà uno diverso come combinazione di quelli esistenti.
La tesi va consegnata al docente in forma cartacea e in forma elettronica (MS-WORD o Latex, incluse le figure/immagini) in un CD-ROM o dischetto, includendo anche copia del codice e dei dati utilizzati.
PROPOSTE DI TESI (Vecchio Ordinamento
e 2o livello)
Per maggiori informazioni contattare il docente.
RETRIEVAL E CATEGORIZZAZIONE
Categorizzazione di pagine web basate sull’analisi di immagini e testo
Nell'ambito del problema di classificazione e clustering, la tesi consisterà in una prima fase nello studio dello stato dell’arte, e quindi nell’acquisizione dei principali strumenti di analisi testuale e di immagini, che, come verrà illustrato dal docente, possono essere ricondotti a tecniche comuni ai due ambiti (Bags of Words, Probabilistic Semantic Analysis). In una fase successiva, si procederà a sviluppare un’applicazione di classificazione e clustering in grado di agire su un database di siti web opportunamente selezionati (come per esempio i siti di notiziari on-line).
Per maggiori informazioni si veda questa pagina e si contatti il docente e/o il dr. Marco Cristani.
In collaborazione con il Dr. Matteo Cristani.
ANALISI DI SEQUENZE VIDEO
Analisi e classificazione di sequenze video
Nell'ambito del problema di classificazione e del clustering, in particolare, sul problema legato all'analisi di dati video (indexing, retrieval, etc.), si vuol investigare una tecnica di classificazione di dati video generici.
Lo scopo è l'interpretazione (classificazione) di sequenze video in maniera non supervisionata e senza conoscenza a priori del contenuto, usando una tecnica "globale", ovvero estraendo informazioni sull'intero stream video o sui singoli frame, senza fasi di segmentazione o riconoscimento.
In questo ambito ci sono diverse tesi affini riguardanti perlopiù applicazioni di videosorveglianza che sono descritte di seguito.
Studio e realizzazione di algoritmi per l'elaborazione di modelli tridimensionali della crescita di plantule (giovani piante).
Scopo della tesi è quello di sviluppare uno strumento per realizzare un modello tridimensionale di giovani piante, della dimensione di alcuni centimetri, per monitorare la velocità e il ritmo di crescita. Il modello tridimensionale dovrebbe rendere lo studio morfologico più accurato di quanto sarebbe possibile con modelli bidimensionali.
La tesi sarà incentrata sulla realizzazione della parte software, fermo restando che l'obiettivo finale del progetto, di cui la tesi è una parte importante, sarà quello di sviluppare uno strumento completo per l'acquisizione automatica di modelli da più esemplari. Il tesista dovrà quindi tenere conto anche delle implicazioni che le scelte algoritmiche avranno sulla parte hardware del sistema di acquisizione, collaborando con il laboratorio che si occuperà della sua realizzazione finale.
L'organismo di riferimento sarà Arabidopsis thaliana, pianta molto usata nei laboratori come modello biologico, ma il progetto potrebbe riguardare anche altre specie, la cui morfologia iniziale non sia molto diversa da quella di Arabidopsis.
La presente tesi può essere vista anche come continuazione e approfondimento della simile tesi di primo livello proposta.In collaborazione con il Prof. Roberto Bassi, Dipartimento Scientifico e Tecnologico, gruppo di Biotecnologie Molecolari e Industriali, Università di Verona.
Videosorveglianza ottico-acustica
La tesi consiste nello sviluppo di uno strumento per la sorveglianza di aree limitate mediante una telecamera e da uno o due (o più) microfoni. Queste zone sono caratterizzate da un background ottico e acustico specifico. Si tratta in sostanza di sviluppare tecniche di background detection acustico e di accoppiarlo ad uno ottico (già sviluppato in un'altra tesi) e di progettare un metodo che rilevi le discontinuità (foreground) sia di tipo ottico che acustico e sia in grado di pilotare una telecamera verso l'area di interesse. Il sistema si baserà verosimilmente su tecniche probabilistiche tipo Hidden Markov Models o affini.
Analisi e classificazione di attività in sequenze video mediante tecniche di machine learning
La tesi consiste nell'analisi delle attività di persone e interazioni tra esse mediante la costruzione di adeguati strumenti computazionali probabilistici come le reti di Bayes dinamiche. Sulla base di situazioni pre-classificate o identificate da ontologie, tali strumenti dovranno essere in grado di identificare tali situazioni o di scoprirne altre non pre-classificate. La tesi ha implicazioni di carattere psicologico per l'identificazione e classificazione delle azioni elementari che danno luogo ad attività più complesse.
Per maggiori informazioni si veda questa pagina e si contatti il docente.
Tecniche di stima della profondità dal livello di sfuocamento delle immagini per applicazioni di videosorveglianza
Un elegante formalismo matematico derivante dall'analisi approfondita dei parametri interni di una telecamera permette di stimare la profondità di zone della scena analizzando il livello di fuoco delle immagini associate (depth from focus/defocus ). A partire da questa stima è possibile monitorare aree di ambienti interni per rilevare intrusi in una certa zona ed inseguirli nello spazio 3D.
VISIONE 3D
Segmentazione/fitting di primitive geometriche elementari a dati 3D
Nell'ambito della visualizzazione di dati 3D, è spesso utile
poter adattare ai dati alcune primitive geometriche predefinite (es., cilindri
generalizzati, superquadriche) che possono essere visualizzate assieme ai
dati grezzi, aumentandone la leggibilità. Come
sottoprodotto si ottiene anche una segmentazione dei dati.
Lo scopo della tesi è lo
sviluppo di tecniche per il fitting di forme geometriche primitive da definire
a dati 3D provenienti da un sensore acustico (a bassa risoluzione).
Ricostruzione basata sui Level Set
I Level Set sono una potente tecnica per la ricostruzione e segmentazione di immagini basata sulla soluzione di un sistema di equazioni differenziali. La tesi vuole implementare un algoritmo classico di ricostruzione preso dalla letteratura.
Per maggiori informazioni si veda http://math.berkeley.edu/~sethian/level_set.html.
Applicazione della trasformata wavelet a mesh 3D
La trasformata wavelet è stata usata con successo in diverse applicazione nell'ambito dell'elaborazione delle immagini come la compressione, il restauro, la segmentazione etc.. L'obiettivo della tesi consiste nell'estendere la trasformata wavelet su mesh tridimensionali. Il candidato dovrebbe prendere spunto dal metodo descritto nel libro "Wavelets for Computer Graphics: Theory and Applications." Eric J. Stollnitz, Tony D. DeRose, and David H. Salesin.In particolare, si vuole sperimentare la robustezza dell'applicazione della trasformata wavelet su dati particolari come dati acustici per la visione subacquea, dati provenienti da un ecografo per applicazioni mediche o dati acquisiti da scanner 3D per la modellazione di oggetti.
RICONOSCIMENTO DI VOLTI
Autenticazione e riconoscimento di volti da immagini 3D
L'autenticazione di volti ha acquisito una notevole importanza negli ultimi anni, grazie anche alle crescenti problematiche di sicurezza. Con il recente sviluppo di sistemi di acquisizione 3D, è possibile basare l'autenticazione e il riconoscimento a partire da caratteristiche (feature) estratte da immagini 3D. La tesi consiste nello sperimentare varie modalità di utilizzo di feature 3D come normali, edge, curvatura, etc. al fine di effettuare riconoscimento e autenticazione di volti mediante tecniche di classificazione avanzate come le support vector machine (SVM).
Morphing per la predizione della variazione di volti nel tempo
La tesi si propone di sviluppare algoritmi per la predizione
della variazione di volti nel tempo. Per esempio, dato un volto in età giovanile,
predire lo stesso dopo 10 anni e viceversa. La base di partenza è un articolo
uscito su PAMI nel quale si investigava su questo aspetto del morphing. L'idea
è di affettuare un addestramento preventivo di parametri caratteristici dell'evoluzione
del volto per poterle poi applicare ad un volto di test ed estrapolare la
sua evoluzione nel tempo.
TESI ESPLORATIVE (ad alta priorità)
Studio e analisi dei file di log per la rilevazione di attacchi in rete
Le attuali
tecnologie con cui si realizzano gli Intrusion Detection Systems (IDS)
di maggior diffusione sono basati essenzialmente su due classi distinte di
analisi o strategie:
1. Rilevazione
di abuso basato sulla conoscenza.
Scopo di queste tecnologie è di rilevare attacchi noti in tempo reale
al fine di poter intervenire in tempo utile.
Per far questo
previsto che tutti gli attacchi noti siano codificati in un opportuno linguaggio
(in modo tale che ogni attacco sia rappresentato da una stringa opportuna,
detta firma dell'attacco o attack signatures) e il sistema provvede
a confrontare tutta l'attività di rete con queste attack signatures.
L'efficacia di IDS basati su questa strategia di analisi dipende dalla validità,
attualità e espressività della base di conoscenza (database delle signature).
L'efficienza data dal tipo di motore che realizza il pattern matching
delle firme.
2. Rilevazione
di anomalia basato sul comportamento.
Con questo approccio si intende realizzare un sistema che utilizza le informazioni
di uso quotidiano della rete (analisi dei log) per rilevare per differenza
quando vi è un uso anomalo della rete. Ci sono diverse tecniche con i quale
possibile rilevare le differenze di comportamento anche se quelle di maggior
successo sono quelle basate su analisi statistiche. Vantaggio di questo approccio
rispetto a quello della rilevazione di abuso dato dal fatto che non
è necessario conoscere a priori quali sono gli attacchi e non si deve codificare
questa informazione nel sistema.
La tesi intende affrontare lo stato del'arte e le tecniche correnti per i
problemi di intrusion detection investigando le potenzialità di metodologie
sofisticate di pattern recognition e data-mining . Lo scopo è
quello di determinare la realizzabilità di strumenti IDS più flessibili rispetto
a quanto offerto dal mercato basato sull'analisi delle firme.
Metodi statistici per la modellazione, la classificazione e il clustering di sequenze di DNA
La problematica dell'analisi informatica di sequenze di DNA é cresciuta di importanza negli ultimi anni, sia per la presenza di sempre piú grandi database di geni, sia per il sempre maggior interesse nello studio del genoma (umano e non).
La tesi prevede lo studio dello stato dell'arte della classificazione (supervisionata e non) di sequenze geniche, un confronto tra i vari metodi presenti, e l'eventuale sviluppo di metodi alternativi. L'attenzione sará rivolta principalmente alla famiglia delle tecniche statistiche di modellazione di sequenze (per esempio i Modelli di Markov a stati nascosti o Hidden Markov Models.
Tecniche di Pattern Recognition per l'analisi e la predizione del mercato borsistico
La tesi si propone di analizzare la grossa mole di dati relativi
al mercato borsistico e di effettuare analisi di mercato e predizioni sulla
base di tecniche di pattern recognition. Una predisposizione verso
gli argomenti di Borsa è ovviamente richiesta.
Riconoscimento di oggetti
Il riconoscimento di oggetti è tuttora un problema ancora aperto in cui sono stati proposti numerosi metodi, perlopiù specializzati su casi più o meno generali.
Uno di questi metodi è stato proposto in ECCV 02 e si basa su un approccio variazionale che integra una statistica non lineare della forma in un processo di segmentazione. Il metodo richiede una fase di addestramento e risulta molto robusto a variazione della forma e anche adatto per problemi di inseguimento.
In caso di interesse specifico, esistono anche altre tipologie di metodi, qui non citati, che possono essere approfonditi mediante discussione diretta col docente.
Protezione di dati mediante tecniche di watermarking
I media digitali quali audio, immagini, video, testo formattato, ecc. possono essere memorizzati, copiati, e distribuiti con grande facilità e senza degradazione alcuna. Nonostante queste siano proprietà altamente desiderabili, esse non permettono di evitare usi fraudolenti dei dati digitali: copie illegali, diffusione non autorizzata, etc.. Un metodo in fase di rapida affermazione per proteggere la proprietà intellettuale dei segnali digitali è conosciuto con il nome di Digital Watermarking e consiste nell'inserire una impercettibile e robusta informazione (e.g. nota di copyright, timestamp, messaggio cifrato, ...) all'interno del media digitale. In questo modo è sempre possibile determinare l'origine del documento. Un possibile sistema di watermarking, sviluppato da Yu, Lu, Liao, è conosciuto in letteratura con il nome di Cocktail Watermarking. Esso prevede la decodifica del watermark attraverso l'uso di una rete neurale (ANN) opportunamente addestrata. L'obiettivo di questa tesi è sviluppare e valutare una nuova metodologia che utilizzi Modelli di Markov anziché ANN per la rilevazione del watermark all'interno del media digitale. Il risultato finale sarà un innovativo sistema di codifica stocastica di segnali, utilizzabile anche in molteplici altri comparti della computer science. Particolare curà dovrà essere posta nella valutazione di efficienza ed efficacia della nuova metodologia rispetto lo stato dell'arte. Sono richieste competenze basilari nel campo dell'elaborazione digitale delle immagini e buona capacità di analisi critica dei risultati, nonchè attitudine allo studio dei Modelli di Markov e loro applicazione pratica.
Il lavoro è stato parzialmente svolto e si tratta di partire da questo per estensioni o variazioni.
TESI ESPLORATIVE (a bassa priorità)
Lego Mindstorm®
I Lego Mindstorm® sono strumenti HW/SW nati dalla collaborazione della Lego con il MIT che ha dato luogo a elementi modulari per la costruzione di robot sfruttando i mattoncini della Lego. In realtà c'è molto di più: insieme ai mattoncini ci sono questi strumenti SW e HW, come telecamere, sensori di posizione, sensori acustici, compilatori, etc., con i quali è possibile costruire robot con disparate funzionalità. Si programma in un linguaggio di alto livello, si compila e si invia l'eseguibile al sistema mobile via IR.
La tesi costituirebbe il primo progetto per la messa a punto di un sistema per applicazioni di tipo robotico o legato all'interazione uomo-macchina.
Per appassionati del genere ...
TESI, PROGETTI E STAGE IN COLLABORAZIONE CON AZIENDE O ALTRI GRUPPI DI RICERCA
Attività in collaborazione con ST Microelectronics
Nell'ambito della collaborazione con ST Microelectronics (Agrate Brianza MI), azienda leader nel settore della progettazione digitale hardware e software, è stata instaurata una collaborazione su dievrsi temi di ricerca relativi all'analisi video, estrazione dati tridimensionali e computer vision in generale.
Seguendo il link è possibile vedere i temi di ricerca coinvolti che possono essere svolti come tesi o progetti/stage presso l'azienda o presso il laboratorio VIPS (da valutare e concordare quando interessati).
I progetti sono in collaborazione con il prof. Fusiello.
Algoritmi di visione su architetture dedicate
Questa tesi riguarda l'implementazione di algoritmi di visione su architetture dedicate (sistemi embedded). Non si tratta di un semplice progetto di porting di metodi esistenti, ma potrebbe essere richiesto di rivedere l'algoritmo stesso in modo da soddisfare i vincoli imposti dall'architettura.
Elaborazione di immagini di Risonanza Magnetica
Il progetto o tesi riguarda lelaborazione di immagini di Risonanza Magnetica ottenute con metodiche ultraveloci in pazienti con ictus cerebrale. Si tratta di sviluppare un algoritmo per il calcolo automatizzato di volumi cerebrali patologici per guidare la decisione terapeutica, investigando differenti algoritmi di ricostruzione a partire dall’immagine grezza e dalla co-registrazione/comparazione quantitativa di immagini ottenute con metodiche diverse di esplorazione encefalica (Diffusione/perfusione).
Le fasi del progetto sono brevemente descritte sotto:
1. sviluppo di software (oppure di scripts) per la visualizzazione delle immagini a partire dal file Dicom;
2. sviluppo di software (o scripts) per la ricostruzione delle immagini finali secondo differenti algoritmi;
3. calcolo di volumi cerebrali da immagini ottenute con metodiche differenti e loro co-registrazione;
4. Sviluppo di algoritmo decisionale interattivo.
In relazione alla tipologia di impegno (tesi o progetto), sarà discusso il tipo di lavoro da eseguire (e.g., una o più fasi, parte di una fase, etc.).
In collaborazione con il dott. Alessandro Adami, Ospedale di Negrar, Verona.
Analisi di immagini MRI per lo studio di patologie cerebrali
Da due anni è iniziata presso il Centro OMS di Verona, Sezione di Psichiatria e Psicologia Clinica dell’Università di Verona, un’area di ricerca nell’ambito del brain imaging in psichiatria.
I lavori proposti vertono sull'analisi di immagini di risonanza che vanno dall'analisi della forma, ricostruzione, alla segmentazione.
Per maggiori informazioni, si veda la pagina informativa.
In collaborazione con il Prof. Michele Tansella e il Dott. Paolo Brambilla, Dipartimento di Medicina e di Sanità Pubblica, Sezione di Psichiatria e Psicologia Clinica, Università di Verona.
Calibrazione automatica di un apparato stereo
Si tratta di recuparare con precisione la posizione relativa
di due telecamere date le corrispondenze tra le due immagini ed i parametri intrinseci.
Questo è il problema noto come relative orientation, per il quale sono
stati sviluppati numerosi algoritmi. Il candidato dovrà implementarne alcuni,
valutarne le prestazioni e produrre un prototipo MATLAB del sistema. L'applicazione
finale è la visione robotica in ambito sottomarino o spaziale.
Proposte di tesi in collaborazione col Centro Ricerche FIAT
Sono proposte tesi in collaborazione col CRF di Orbassano (TO) principalmente relative a supporti di visione a bordo veicolo, quindi applicazioni automotive. Le tesi riguardano lo sviluppo di funzioni come la rilevazione della nebbia, funzione pioggia, navigazione assistita dalla visione.
Si lavorerà su dati acquisiti da un sensore CMOS sviluppato dal CRF con possibilità di implementazione su architetture hardware.
Esiste la possibilità di stage post laurea di 6+6 mesi presso la sede di Orbassano.
Per maggiori informazioni contattare il docente o visitare questa pagina.
PROGETTI E TESI DI LAUREA DI 1o LIVELLO
Questi progetti e tesine sono legate ai corsi di Elaborazione di Immagini, Visione Computazionale, Teoria e Tecniche del Riconoscimento e Laboratorio di Informatica.
Le tesi di I livello legate al corso di Interazione Uomo-Macchine e Multimedia sono volte maggiormente alla parte multimedia e alla visualizzazione delle informazioni. Si accettano comunque proposte dagli studenti.
Taluni progetti possono essere estesi a tesi di laurea di II livello o del vecchio ordinamento.
Per maggiori informazioni contattare il docente.
Sviluppo di un algoritmo per la misurazione delle cinetiche di crescita di giovani piante attraverso l'elaborazione delle immagini
Scopo della tesi è quello di sviluppare un algoritmo che calcoli l'area della superficie delle foglie di giovani piante, della dimensione di alcuni centimetri, per monitorare la velocità e il ritmo di crescita. Il dato iniziale sarà un'immagine fotografica, o eventualmente due, da diversa angolazione, per ottenere una stima più accurata. Il problema principale relativo alla segmentazione della pianta dal terreno di crescita (tipicamente verde contro marrone) e la segmentazione delle singole foglie.
L'organismo di riferimento sarà Arabidopsis thaliana, pianta molto usata nei laboratori come modello biologico, ma il progetto potrebbe riguardare anche altre specie, la cui morfologia iniziale non sia molto diversa da quella di Arabidopsis.In collaborazione con il Prof. Roberto Bassi, Dipartimento Scientifico e Tecnologico, gruppo di Biotecnologie Molecolari e Industriali, Università di Verona.
Modelli generativi per documenti testuali
Il progetto riguarda l'implementazione di un modello generativo per l'analisi di collezioni di dati discreti come per esempio i documenti testuali. Tale modello è stato chiamato Latent Dirichlet Allocation (LDA) ed è stato usato dagli autori per classificare in modo non supervisionato gli argomenti di discussione di un insieme di documenti. L'articolo descrive anche tecniche di addestramento del modello basate metodi variazionali e l'algoritmo EM. Esistono variazioni su questa tematica, come l'introduzione del concetto di "autore", etc.. L'applicazione più immediata di questi modelli è la caratterizzazione automatica di documenti ed autori in modo completamente automatico e senza bisogno di indicare il valore semantico delle parole presenti nei testi. Ogni documento è una collezione di parole provenienti da un mix di argomenti e ad ogni autore è associato uno specifico profilo di argomenti preferiti.
Maggior informazioni:
D. Blei, A. Ng, M. Jordan, "Latent Dirichlet allocation", Journal of Machine Learning Research, 3:993-1022, January 2003. http://www.cs.berkeley.edu/~blei/, http://cl.naist.jp/~daiti-m/dist/lda/
T. Griffiths, M. Steyvers, "Finding Scientific Topics", Proceedings of the National Academy of Sciences, 101 (suppl. 1), pp. 5228-5235, 2004.
M. Rosen-Zvi, T. Griffiths, M. Steyvers, P. Smyth, "The Author-Topic Model for Authors and Documents", 20th Conference on Uncertainty in Artificial Intelligence, Banff, Canada, 2004.
Intrusion detection
I sistemi di rilevamento di intrusioni utilizzano due approcci principali: il rilevamento di segnature malevole (misuse-based) ed il rilevamento di anomalie (anomaly-based). Molti degli attuali sistemi soffrono però di eccesso di prudenza (molti falsi positivi) o di specificità (incapacità di rilevare nuovi tipi di intrusione).
Una possibile soluzione è quella di integrare in modo Bayesiano molte fonti di indizi [5]. Poiché molti attuali sistemi sono ancora basati su regole empiriche, il paradigma Bayesiano è uno degli approcci che permette di affrontare il problema in maniera principled [6]. Per una rassegna di articoli sullo stato dell'arte complessivo consultare per esempio [7][8].
Maggior informazioni:
C. Kruegel, D. Mutz, W. Robertson, F. Valeur (University of California, Santa Barbara), "Bayesian Event Classification for Intrusion Detection", 19th ACSAC, 2003. http://www.ll.mit.edu/IST/ideval/
Steven Scott, "A Bayesian Paradigm for Designing Intrusion Detection Systems", Computational Statistics and Data Analysis, 2004.
Video indexing e summarization
Estrazione di feature per classificazione e riconoscimentoIl progetto riguarda l'implementazione di un algoritmo per la suddivisione di una video sequenza in shot significativi (summarization), ovvero di rilevazione delle transizioni (cambi di scena) o altre applicazioni multimediali. Esistono in letteratura una serie di algoritmi che è possibile implementare.
Il progetto riguarda l'implementazione di un algoritmo per l'estrazione di feature robuste e discriminanti, particolarmente adatte a problemi di classificazione, le cosiddette feature SIFT. Esiste anche un tutorial MATLAB da reperire in rete da cui è possibile partire per sviluppare varianti sul tema e provare algoritmi di riconoscimento. Queste caratteristiche sono state studiate in un articolo cui si fa riferimento per maggiori informazioni.
David G. Lowe, "Distinctive Image Features from Scale Invariant Features", International Journal of
Computer Vision, Vol. 60, No. 2, 2004, pp. 91-110.
Mappatura di volto su modello 3D
Il progetto riguarda la realizzazione di un programma che mappi la foto di un volto (per es., presa da una webcam) su un modello generico 3D di un volto e di adattarlo mettendo i corrispondenza le caratteristiche del modello con quella dell'immagine (occhi, naso, mento, etc.). In una successiva fase si potrebbe mettere in corrispondenza le feature 3D del volto (prese da una stereo camera) con quelle del modello per adattarle in maniera più accurata.
Chroma-key
Il progetto riguarda la realizzazione di un programma che separa lo sfondo dai soggetti in primo piano, avendo lo sfondo di un colore determinato e noto.
Interfaccia di esplorazione dell'informazione
Il progetto riguarda l'uso di un'interfaccia non convenzionale che consiste in un guanto con capacità di localizzazione nello spazio 3D e di un visore 3D. E' stata usata finora per costruire un browser di dati multimediali (video) ed è disponibile per altre applicazioni o estensioni di quella corrente.
Interfaccia di visualizzazione dell'informazione
Il progetto riguarda la sperimentazione di nuove tecniche di clustering su dati MRI in grado di individuare zone di interesse clinico. Esiste una tesi da cui partire ed estendere.
Elaborazione di immagini di tipo piramidale
Il progetto riguarda l'approccio piramidale (multirisoluzione) all'elaborazione di immagini. Si tratta di applicare algoritmi classici (da definire) su uno stack di immagini a diversi livelli di risoluzione e di combinare i risultati tra i vari livelli. E` un aspetto importante in quanto permette ad esempio l'estrazione di feature (eg., edge) a diversi livelli di dettaglio, quindi più robusti, e in maniera più efficiente dell'elaborazione bruta sull'immagine con dettaglio massimo.
Un'estensione possibile potrebbe essere l'estrazione delle rette più affidabili mediante la trasformata di Hough applicata ad una piramide di immagini di elevata complessità (eg., telerilevate).
Segmentazione
Implementazione di una tecnica di segmentazione di immagini in letteratura.
Immagini ad elevata gamma dinamica
Implementazione di una tecnica di compensazione della luminosità/contrasto che consente di ottenere immagini in cui sia i particolari molto chiari che quelli molto scuri sono contemporaneamente distinguibili.
Morphing
Sviluppo di tecniche di morphing, classicamente per la trasformazione di volti e non solo.
Implementazione di un algoritmo di estrazione del background basato su metodi non parametrici
Si tratta di implementare un algoritmo di estrazione del background in sequenze video. L'algoritmo agisce a livello di ogni pixel ed è basato su un metodo non parametrico per estrarre l'informazione legata allo sfondo in una sequenza video.
Per maggiori informazioni, si veda: http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/ELGAMMAL/bgsubtraction.htm,
dove è possibile anche scaricare l'articolo di riferimento.
Esiste anche altro materiale in rete e un articolo sui Proceedings of the IEEE dal titolo:
A. Elgammal, R. Duraiswami, D. Harwood, and L.S. Davis “Background and Foreground Modeling using Non-parametric Kernel Density Estimation for Visual Surveillance”, Proceedings of the IEEE, July 2002.
Autospazi per il riconoscimento
Implementazione della tecnica classica degli autospazi per il riconoscimento view-based (algoritmo visto a lezione e sul libro di Trucco-Verri).
Stima del flusso ottico
Il progetto tratta la valutazione dello stato dell'arte per la stima del movimento in sequenza di immagini. Sulla base di questo, si effettuerà l'implementazione di un algoritmo che potrà essere utilizzato in svariate applicazioni (eg., compressione di immagini).
Estensione della trasformata di Hough allo spazio 3D
La trasformata di Hough è una tecnica di estrazione di curve parametriche in un'immagine, rette nella sua definizione classica. Il progetto tratta la sua estensione al caso 3D a partire dalla definizione data in letteratura per il riconoscimento e stima della posa di oggetti planari.
Algoritmi per l'inseguimento, etichettatura e caratterizzazione di contorni
Il progetto tratta lo sviluppo di un o più algoritmi per la caratterizzazione di contorni. In sostanza, implica l'estrazione dei punti di edge di un'immagine, l'inseguimento ed etichettatura dei contorni più significativi e la generazione di una struttura dati contenente i contorni con una lista di attributi utili alle successive fasi di elaborazione.
Fusione di nuvole di punti 3D
I progetti inerenti questo tema riguardano l'implementazione di algoritmi per la tessellazione di nuvole di punti senza struttura come marching cubes, l'approccio zippering, la registrazione e fusione utilizzando modelli noti a priori o stimati dai dati, di cui esiste ampia documentazione in letteratura.
Last revision: January 2007