UNIPA, primo classificato al 9° Challenge Internazionale di Author Profiling

Da Unipa (Università di Palermo) – Un team di ricerca del Dipartimento di Ingegneria dell’Università degli Studi di Palermo, composto dal dottorando in ICT, dott. Marco Siino, dai proff. Ilenia Tinnirello e Marco La Cascia, e con la collaborazione della dott.ssa Elisa Di Nuovodottoranda in Digital Humanities all’Università degli Studi di Torino, si è classificato primo, su oltre 60 gruppi di ricerca partecipanti da tutto il mondo, al 9° Challenge Internazionale di Author Profiling indetto dal PAN Lab, una competizione sull’analisi automatica di testi e linguaggi naturali, organizzata in occasione della conferenza CLEF 2021.

“PAN è una serie di eventi scientifici e task condivisi sulla digital text forensics e sulla stilometria – spiega il team di ricerca –  Quest’anno, tra i task proposti, quello relativo all’author profiling ha riguardato il riconoscimento automatico dell’hate speech (HS), definito come qualsiasi testo che esprimesse odio verso una persona o un gruppo sulla base di qualche caratteristica come razza, colore, etnia, sesso, orientamento sessuale, nazionalità, religione o altro. Data l’enorme quantità di contenuti generati dagli utenti sul web, il problema consisteva nell’individuare automaticamente, e quindi eventualmente contrastare la diffusione, dell’HS, al fine di combattere, ad esempio, fenomeni quali la misoginia, la xenofobia o il cyberbulling. A tal fine, per questo specifico challenge, il task prevedeva di identificare i possibili utenti diffusori di HS su Twitter come primo passo per prevenire la propagazione di testi con contenuti di odio tra gli utenti online. In particolare, l’obiettivo era di classificare un utente come probabile hate speech spreader o meno, sulla base dei suoi ultimi 200 tweet.

Il modello sviluppato – proseguono – facente parte del ramo dell’Intelligenza Artificiale relativo ai metodi di Deep Learning di uso comune nel campo della Computer Vision, ma meno frequentemente applicati nell’ambito del Natural Language Processing, è una rete neurale convoluzionale applicata a un layer non pre-addestrato di word embedding. L’architettura multilingua proposta è riuscita a classificare correttamente l’85% dei profili di utenti del dataset in lingua spagnola e il 73% di quelli presenti nel dataset relativo alla lingua inglese, totalizzando una media del 79% sull’intero dataset multilingua”.

Redazione

Articoli scritti dalla Redazione.

Post recenti

L’Europa invecchia, i robot ringiovaniscono: chi lavorerà nella nuova economia. Previsioni di Chaslau Koniukh

L'economia europea sta entrando in un decennio in cui la principale carenza non è più…

3 settimane fa

Il Palermo Museum: dove la storia del calcio prende vita

Il Palermo Museum, all’interno dello Stadio Barbera è un viaggio nella storia del club rosanero, attraverso…

2 mesi fa

Il coraggio di Giaccone celebra la memoria con un murale a Palermo

Un murale dedicato a Paolo Giaccone è stato realizzato all’ingresso principale del Policlinico di Palermo.…

2 mesi fa

Alla scoperta di Palermo: tra chiese, musei e palazzi storici

Per tutti gli aggiornamenti: Turismo Palermo I principali siti e le loro schede Palazzo Reale (o dei Normanni) e…

2 mesi fa

Questo sito utilizza cookie tecnici e cookie di profilazione di terze parti per la gestione pubblicitaria. Puoi esprimere le tue preferenze sui singoli programmi pubblicitari cliccando su "maggiori informazioni". Scorrendo questa pagina o cliccando in qualunque suo elemento, acconsenti all'uso dei cookie.

Privacy Policy