Skip to main content

PrimeSense: oltre Natal

La tecnologia dietro alla rivoluzione di Microsoft.

I due manager di PrimeSense sottolineano inoltre, non senza una punta di orgoglio, come nonostante l’acquisizione da parte di Microsoft di 3DV, specialisti di telecamere “a tempo di volo” che hanno già realizzato diverse demo di giochi, la tecnologia di cattura video e di rilevazione della profondità alla base di Natal deriva direttamente da PrimeSense. “PrimeSense non è solo un fornitore di tecnologia 3D per Natal… è l’unico fornitore”, sostiene Maizels orgogliosamente. “Project Natal è molto più di un dispositivo di rilevazione 3D, ma PrimeSense è l’unica compagnia responsabile della tecnologia 3D che utilizza”.

Nonostante l’orgoglio del team per l’implementazione di tecnologia proprietaria su Natal, è interessante sottolineare come la compagnia consideri l’utilizzo del cosiddetto PrimeSensor solo una parte del pacchetto. “Per rendere il tutto ancora più chiaro, agli inizi c’è l’acquisizione 3D; questa è la parte che PrimeSense ha sviluppato. In Natal, questo è PrimeSense e nessun altro”, afferma Berenson.

“Ma Natal è molto di più. È contenuti, software, differenti modalità di interazione quali la voce, e così via. Microsoft è stata abile nel realizzare questo vasto e costoso ecosistema intorno a Natal al fine di renderlo un prodotto. Natal è un progetto molto più vasto, la tecnologia di acquisizione che vi è alla base invece è di PrimeSense”.

Ecco come si presenta il prototipo della telecamera di Natal.

Nonostante l’acquisizione di 3DV e delle sue tecnologie, PrimeSense insiste sulle differenze tra quelle tecnologie basate su tecniche dette “a tempo di volo” e l’implementazione della cosiddetta zcam. “PrimeSense utilizza una tecnologia proprietaria che chiamiamo Light Coding. Nessun’altra compagnia al mondo la utilizza”, afferma con orgoglio Berenson. “La maggior parte dei nostri rivali implementa tecnologie che possono essere ricondotte alla tecnica definita a tempo di volo…

Si emette un impulso luminoso e si calcola la differenza tra l’impulso e il tempo che impiega a tornare al sensore. Il nostro metodo non consiste in niente di simile. PrimeSense ha ideato l’evoluzione delle tecnologie di rilevazione 3D. Utilizziamo componenti standard e il costo della soluzione, unitamente alla stabilità delle sue performance, la rende adatta ai dispositivi di largo consumo.”

Light Coding agisce in un modo indicato dal nome stesso dalla tecnologia. Una luce vicina all’infrarosso inonda la scena. Quello che PrimeSense definisce un sofisticato algoritmo di calcolo parallelo decifra i dati infrarossi trasformandoli in un’immagine dotata di profondità. La compagnia sostiene che questa soluzione, così come quella detta a tempo di volo, può funzionare a prescindere dalle condizioni di visibilità. “Natal è basato sulla nostra soluzione, non sulle tecniche a tempo di volo”, ribadisce comunque Inon Berach.

“Crediamo che la scelta di impiegare la nostra tecnologia per la prima generazione di questi dispositivi testimoni la validità delle nostre tecniche, già pronte per la produzione; è la miglior soluzione in circolazione per il rapporto qualità/prezzo. Detto questo, non forniremo ulteriori commenti sull’acquisizione da parte di Microsoft di una società che utilizza tecniche di rilevazione differenti dalle nostre”.

PrimeSense si immagina di applicare la sua tecnologia anche in ambiti come i media center, dai quali selezionare i film con un gesto.

L’offerta di PrimeSense ai potenziali partner consiste nel’ideazione di una telecamera di riferimento che si connette al computer via USB 2.0, esattamente come il kit di Natal. La differenza consiste nella presenza in questo primo design di un SoC (System on Chip) che traduce le informazioni catturate dal sensore a infrarossi in una mappa di profondità che viene sovrapposta perfettamente sull’immagine RGB che si ottiene dalla telecamera RGB. Ne risulta un’immagine dalla risoluzione di 640x480 dove ogni singolo pixel è dotato di profondità.

“Dal punto di vista dell’acquisizione, l’hardware per l’acquisizione è basato su un sensore RGB CMOS (Complementary Metal-Oxside Semiconductor), su un sensore IR CMOS e su una sorgente IR collegata al circuito integrato (IC) o SoC di PrimeSense che analizza i segnali e genera un segnale 3D RGBD”, spiega Adi Berenson.

“RGBD significa profondità più immagine e colore, sincronizzato nello spazio e nel tempo. Inoltre, abbiamo integrato la cattura dell’audio, anch’esso sincronizzato. Il segnale in uscita dall’hardware di acquisizione consiste in quattro canali audio e nel segnale 3D RGBD. Tutto sincronizzato. Tutto collegato al centro e pronto per essere analizzato”.

Il SoC include l’interfaccia per la telecamera RGB, convertitori dal segnale analogico a quello digitale e i circuiti USB necessari per connettere il dispositivo al PC. Il chip contiene anche della RAM di tipo flash, il che significa che il firmware può essere aggiornato. Il tutto è sostenuto da un middleware chiamato NITE capace di ricostruire le proporzioni dello scheletro umano partendo dalle immagini così da consentire la rilevazione del movimento umano. Sebbene sia simile a quanto abbiamo visto nelle tech demo di Natal in cui si rilevavano gli scheletri umani, le implementazioni sono radicalmente differenti. Il ruolo di PrimeSense inizia con la telecamera e finisce con la creazione di una mappa di profondità per l’immagine RGB.

PrimeSense mostra la sua versione di un controller gestuale per il mercato di massa.

Di conseguenza, le cose incredibili che abbiamo visto fare a Natal, in particolare la sua capacità di rilevare gli scheletri umani anche quando sono fuori dal campo visivo, è tutto merito di Microsoft. “Project Natal: la magia è tutta opera di Microsoft”, afferma con ammirazione Maizels. “Incredibile quello che hanno fatto per le performance, per la solidità della soluzione, dobbiamo far loro i complimenti. Microsoft è la più grande società di software al mondo, hanno fatto un lavoro fenomenale dal punto di vista del software”, aggiunge Berenson. “La soluzione è tutta loro”.