CL-Lessema

CL-Lessema: sistema di interrogazione basato sulla Ricerca semantica

Descrizione

Sistema di interrogazione basato sulla Ricerca semantica CL-Lessema

CL-Lessema è un motore interrogazione scritto in ANSI C, ottimizzato per la ricerca semantica di parole chiave all'interno di testi brevi come titoli, didascalie, nomi di file e simili.
Il problema della ricerca nei testi brevi si presenta in tutti quei casi in cui si debbono gestire delle grandi collezioni di documenti per i quali la probabilità che un particolare documento venga cercato è molto bassa, come capita per certi file scaricati da Internet nel corso delle nostre navigazioni ludiche o certi documenti di lavoro dalla vita molto limitata, scritti per essere letti una sola volta per poi essere dimenticati.
Pressati dalla fretta in situazioni del genere è molto forte la tentazione di salvare il file attribuendogli un nome corto, costituito spesso da una sola parola, attribuendogli una sigla oppure accettando addirittura il nome di default (spesso un codice sequenziale) suggerito dal programma usato per creare il documento.
Tali espedienti permettono un certo risparmio di tempo al momento del salvataggio a spese però di un notevole aumento degli sforzi che saranno richiesti in seguito all'occorrenza per ritrovare i documenti.
In alternativa un compromesso accettabile fra una lunga descrizione o un codice inintelligibile è spesso costituito dal ricorso ad una frase corta (tre o quattro parole) ma molto specifica.
Ad esempio una fotografia che ci ritrae vicino al monumento di Napoleone ad Ajaccio potrebbe essere intitolata: “Napoleone”, “Ajaccio”, “Corsica 2009”, “Monumento Napoleone”, ecc.
Il pregio quest'ultima soluzione è che ricordando la parola chiave impiegata si riesce ad accedere al corrispondente documento praticamente a colpo sicuro. Il difetto è che spesso viene dimenticata, anche perché certi termini per la nostra mente sono quasi equivalenti. Si pensi a sostantivi come “Napoleone” e “Bonaparte”, o peggio ancora a nomi comuni come “gatto”, “micio”, “micino”, ...
Il motore di ricerca CL-Lessema rimedia ai suddetti inconvenienti ricorrendo ad un dizionario enciclopedico che associa ad ogni termine (lessema) la sua connotazione semantica effettuando poi una ricerca nello spazio semantico anziché in quello lessicografico.
In alternativa al dizionario enciclopedico standard il sistema può funzionare facendo riferimento a dizionari appositamente sviluppati per ricerche in ambiti specifici (chirurgia, fisica del plasma, industria dolciaria, ecc.).
E' in corso di sviluppo la realizzazione di una versione più evoluta del programma che consentirà l'esecuzione contemporanea di ricerche semantiche multilingua partendo da una query in italiano o in un'altra lingua supportata.





Case Studies




Copyright © 2011-2017 - Luigi D. CAPRA