La súper inteligencia artificial pronto podría generar mundos 3D completos a partir de videos 2D

En el último lote de interminables proyectos de IA anunciados este año, el gigante del software NVIDIA ha presentado un software capaz de crear réplicas completas en 3D de objetos basándose únicamente en secuencias de video en 2D.

Llamado Neuralangelo (una combinación de neural y Michelangelo), el software puede crear réplicas virtuales realistas de edificios, esculturas, estructuras complejas y una amplia variedad de otros modelos 3D complejos.

dijo Mingyu Liu, director senior de investigación y coautor del artículo. el papel de neuralangelo.

«Esta herramienta eventualmente permitirá a los desarrolladores importar objetos detallados, ya sean pequeñas figuras o enormes edificios, en entornos virtuales para videojuegos o gemelos digitales artificiales».

NVIDIA no es la primera empresa en crear un modelo de IA como este, pero podría decirse que es el más avanzado. Si bien las versiones anteriores tuvieron problemas para capturar patrones de textura repetitivos o colores detallados, esto es un problema mucho menor para Neuralangelo.

Usando videos 2D de un objeto, estructura o escena, todos tomados desde una variedad de ángulos, el modelo selecciona cuadros específicos y traza ángulos clave para obtener una vista completa de la estructura.

Una vez que se determina la posición de la cámara para cada cuadro, el programa crea una interpretación aproximada en 3D de la escena. A continuación, se mejora la representación, se agudizan aún más los detalles y se produce un objeto 3D final que se puede colocar en la realidad virtual o utilizar en una variedad de industrias.

Si bien se ha revelado el potencial del software, el software en sí aún no está disponible para uso público.

READ  Apple está planeando una importante actualización para el iPhone en un intento de ponerse al día con Android a medida que se acerca el acuerdo ChatGPT.

NVIDIA es una de las muchas empresas que apuesta fuerte por la inteligencia artificial este año. Adobe, Google, OpenAI, Microsoft y otras empresas líderes han invertido miles de millones en la producción del modelo que se hará cargo de una industria.

Hasta ahora, hemos visto a la IA intentar crear música, escribir poesía y símbolos complejos e incluso crear obras de arte galardonadas. Sin embargo, la generación 3D es uno de los grandes frutos secos que la IA puede descifrar.

Debido a la naturaleza compleja e impredecible de una forma 3D, no era tan fácil de replicar como una imagen 2D o un escrito. Es algo que OpenAI ha tratado de entender con su proyecto Point-E, pero admitió que era un proyecto complejo de construir.

Si NVIDIA y otras empresas que siguen su ejemplo pueden finalmente crear un generador de modelos 3D de IA, tendrá implicaciones de gran alcance para el mundo de la IA. Sin embargo, uno de los mayores problemas que ha enfrentado el arte de la IA hasta ahora es su incapacidad para comprender formas complejas.

Debido a que se entrena a través de muestras de arte en 2D, estos generadores luchan por comprender formas y manos complejas. Al incluir sus modelos generados en 3D, puede comprender mejor los modelos que intenta replicar.

Leer más:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *