Ciencia y Tecnología

Modelo de inteligencia artificial genera instantáneamente imágenes 3D a partir de muestra 2D

En el emergente y rápido mundo de la informática a gran escala, era solo cuestión de tiempo antes de que un logro revolucionario estuviera a punto de poner patas arriba el campo de las visualizaciones 3D. Adobe Research y la Universidad Nacional de Australia (ANU) han anunciado el primer modelo de inteligencia artificial capaz de generar imágenes 3D a partir de una única imagen 2D.

En un desarrollo que transformará la creación de modelos 3D, los investigadores aseguran que su nuevo algoritmo, que se entrena con muestras masivas de imágenes, puede generar dichas imágenes 3D en cuestión de segundos.

Una inteligencia artificial con una red neuronal altamente escalable

Yicong Hong, pasante de Adobe y exestudiante de posgrado de la Facultad de Ingeniería, Computación y Cibernética de la ANU, comenta que su gran modelo de reconstrucción (LRM) se basa en una red neuronal altamente escalable que contiene un millón de conjuntos de datos con 500 millones de parámetros. Dichos conjuntos de datos incluyen imágenes, formas 3D y vídeos.

«Esta combinación de un modelo de alta capacidad y datos de entrenamiento a gran escala permite que nuestro modelo de inteligencia artificial sea altamente generalizable y produzca reconstrucciones 3D de alta calidad a partir de diversas entradas de prueba«, indica Hong, autor principal de un informe sobre el proyecto.

«Hasta donde sabemos, [nuestro] LRM es el primer modelo de reconstrucción 3D a gran escala«, insiste Hong.

Una tecnología con un amplio abanico de aplicaciones

Se puede esperar que los sistemas de realidad aumentada y virtual, los juegos, la animación cinematográfica y el diseño industrial aprovechen esta tecnología transformadora de inteligencia artificial.

Los primeros programas de imágenes 3D funcionaron bien solo en categorías de temas específicos con formas preestablecidas. Hong explica que los avances posteriores en la generación de imágenes se lograron con programas como DALL-E y Stable Diffusion, que «aprovecharon la notable capacidad de generalización de los modelos de difusión 2D para permitir vistas múltiples«. Sin embargo, los resultados con esos programas se limitaron a modelos generativos 2D previamente entrenados.

Otros sistemas utilizaron optimización por forma para lograr resultados impresionantes, pero «a menudo son lentos y poco prácticos«, según Hong.

Solo cinco segundos de respuesta

Hong comenta que la evolución de los modelos de lenguaje natural dentro de redes de transformadores masivas que utilizaban datos a gran escala para maximizar las tareas de predicción de la siguiente palabra animó a su equipo a plantearse la pregunta: «¿Es posible aprender un 3D genérico previo para reconstruir un objeto a partir de ¿una sola imagen?» Su respuesta fue ««.

«LRM puede reconstruir formas 3D de alta fidelidad a partir de una amplia gama de imágenes capturadas en el mundo real, así como imágenes creadas por modelos generativos«, afirma Hong. «LRM también es una solución muy práctica para aplicaciones posteriores, ya que puede producir una forma 3D en sólo cinco segundos sin optimización posterior«.

Una base de datos de millones de parámetros de imágenes

El éxito de este modelo de inteligencia artificial radica en su capacidad para aprovechar su base de datos de millones de parámetros de imágenes y predecir un campo de radiación neuronal (NeRF). Esa es la capacidad de generar imágenes 3D de apariencia realista basadas únicamente en imágenes 2D, incluso si esas imágenes son de baja resolución. NeRF tiene capacidades de síntesis de imágenes, detección de objetos y segmentación de imágenes.

Hace 60 años se creó el primer programa informático que permitía a los usuarios generar y manipular formas 3D simples. Sketchpad, diseñado por Ivan Sutherland como parte de su tesis de doctorado en el MIT, con un total de 64K de memoria. A lo largo de las décadas, los programas 3D crecieron a pasos agigantados con programas como AutoCAD, 3D Studio, SoftImage 3D, RenderMan y Maya.

El artículo de Hong, «LRM: Large Reconstruction Model for Single Image to 3D«, se subió al servidor de preimpresión arXiv el 8 de noviembre.

Recent Posts

Red Dead Redemption en PC ¿Una realidad?

A cada día que pasa podemos ver más factible un mercado libre de plataformas para…

9 horas ago

God of War Ragnarok podría llegar a PC

Un emocionante viaje a través de la mitología nórdica cautivó a los jugadores en God…

15 horas ago

La mayor salida de juegos de PlayStation Plus

Ya se sabe de sobra que cada mes, en especial el primer martes del mes,…

20 horas ago

Fallout 4 – Reportaje

Os traemos todos los detalles del parche de Fallout 4 para las consolas de nueva…

20 horas ago

Shadows es el nombre oficial del nuevo Assassins´s Creed

Durante meses, los chicos de Ubisoft han estado refiriéndose a este nuevo proyecto bajo el…

1 día ago

Ya disponible el peculiar Animal Well

Un nuevo y característico juego indie ha llegado a consolas y PC, capturando la atención…

2 días ago

Esta web usa cookies.