Oto Instant NeRF.



Aż trudno uwierzyć, że już 75 lat temu wykonano pierwsze zdjęcie z użyciem aparatu Polaroid, który umożliwił natychmiastowe wywoływanie dwuwymiarowych zdjęć trójwymiarowego świata. Pojawienie się tej maszyny było naprawdę przełomowe. Teraz w dziedzinie fotografii dokonano kolejnego przełomu. Opracowano bowiem sztuczną inteligencję, która potrafi w mgnieniu oka zamieniać dwuwymiarowe zdjęcia w trójwymiarowe scenerie.



Instant NeRF, czyli natychmiastowy trójwymiar

Nowa sztuczna inteligencja jest rezultatem wysiłków badaczy z firmy Nvidia nad ulepszeniem technologii znanej jako NeRF (ang. Neural Radiance Field). Polega ona na trenowaniu algorytmów sztucznej inteligencji zdolnych do generowania obiektów 3D na podstawie dwuwymiarowych zdjęć. NeRF, najprościej mówiąc, uzupełnia niewiadome, interpolując to, czego aparat nie uchwycił na fotografii.



Nvidia opracowała nową metodę NeRF – jak dotychczas najszybszą. Pozwala ona w ciągu kilku sekund wytrenować sztuczną inteligencję generującą trójwymiarowe sceny w oparciu o zdjęcia 2D. Dla porównania, trenowanie klasycznych modeli NeRF trwało godzinami.







Aby wytrenować sztuczną inteligencję nowej generacji, zwaną Instant NeRF, wystarczą tuziny zdjęć oraz informacje o tym, pod jakim kątem zostały wykonane z pomocą aparatu. Po nakarmieniu nimi algorytmu sztuczna inteligencja potrzebuje zaledwie milisekund, by tworzyć trójwymiarowe scenerie na podstawie dwuwymiarowych fotografii. Klasyczne modele NeRF musiały poświęcać na to co najmniej kilka minut.



Oczywiście, dokonanie omówionego osiągnięcia było możliwe, ponieważ Nvidia opracowała technikę znaną jako „multi-resolution hash grid encoding”, która została zoptymalizowana pod kątem wydajnego działania na jej kartach graficznych. Technika ta pozwala modelom Instant NeRF znacznie skrócić czas renderowania.





Sceneria 3D utworzona przez Instant NeRF w oparciu o zdjęcia 2D. | Źródło: Nvidia