Welcome

Notizie, riflessioni e curiosità dal mondo dell'alta tecnologia del XXI secolo

giovedì 7 ottobre 2010

La realtà aumentata di Google Goggles




Forse non tutti conoscono Google Goggles, presente già da tempo su Android e da oggi anche su iPhone.
Spiegarlo è abbastanza semplice, proviamoci.
Si tratta di un sistema di realtà aumentata e riconoscimento che consente di trovare luoghi, identificare libri e molto altro semplicemente puntando con il nostro dispositivo mobile verso l'oggetto che ci interessa.
Degli appositi algoritmi di riconoscimento si occupano del riconoscimento, confrontando ciò che viene inquadrato con un database online e generando il contenuto adatto.

Il riconoscimento di oggetti dai contorni non definiti o non standardizzati, come piante ad esempio, non è ancora disponibile, mentre gli oggetti di forme e dimensioni note, quindi catalogabili in un database sono riconoscibili con successo, così come i testi che possono essere letti ed usati per le ricerche.

Come fa a funzionare un riconoscimento del genere? Scopritelo dopo il break.



Senza andare troppo sul tecnico, vengono individuate delle caratteristiche "salienti" dell'oggetto, o features.
Queste features corrispondono generalmente a bordi, angoli o elementi che in gergo vengono definiti ad "alta frequenza" perchè presentano contorni netti e facilmente riconoscibili.
Queste feature vengono modellate poi con un descrittore matematico, ovvero un insieme di numeri che le descrive in dettaglio, e porta informazioni generalmente anche sulla loro dimensione e soprattutto sul loro orientamento.
Un oggetto del mondo reale, ad esempio un palazzo, può quindi essere memorizzato con un insieme di queste caratteristiche, che possono essere successivamente confrontante con un database in memoria.

Trovare una caratteristica corrispondente è una bella coincidenza, ma se ce ne fosse più di una potremmo già parlare di matching, ovvero di corrispondenza tra l'oggetto inquadrato ed il database.
Maggiore è il numero di caratteristiche corrispondenti, migliore sarà il riconoscimento, e c'è da evidenziare che già da tre "match" è possibile capire come è posizionato l'oggetto inquadrato, oltre a riconoscerlo.
Ciò consente di utilizzare appunto tecniche di Realtà Aumentata.


Oltre a questo, Google Goggles utilizza un motore OCR, ovvero un sistema di riconoscimento dei caratteri, per digitalizzare il testo che viene inquadrato dall'obiettivo.
Questo testo può essere in seguito riutilizzato dal motore di ricerca per trarne maggiori informazioni.

Se avete un dispositivo Android o un iPhone potete provare direttamente l'applicazione.

Nessun commento:

Posta un commento