Investigadores de ETH Zurich y Max Plank proponen HOOD: un nuevo método que aprovecha las redes neuronales gráficas, el paso de mensajes de varios niveles y el entrenamiento no supervisado para permitir una predicción eficiente de la dinámica de la ropa en el mundo real.

https://dolorousrtur.github.io/hood/

La telepresencia, la experiencia virtual, los videojuegos y muchas otras aplicaciones que se basan en humanos digitales de alta fidelidad requieren la capacidad de simular un comportamiento de ropa atractivo y realista. El uso de simulaciones basadas en leyes físicas es una forma común de producir movimientos dinámicos naturales. Si bien las simulaciones físicas pueden proporcionar resultados sorprendentes, son costosas de calcular, sensibles a las condiciones iniciales y requieren dibujantes experimentados; Los métodos sofisticados no están diseñados para cumplir con los estrictos presupuestos computacionales necesarios para las aplicaciones en tiempo real. Las tecnologías basadas en el aprendizaje profundo están comenzando a producir resultados eficientes y de alta calidad.

Sin embargo, varias limitaciones han impedido, hasta la fecha, que tales enfoques alcancen todo su potencial. En primer lugar, las técnicas actuales explican en gran medida las deformaciones de la prenda en función de la postura del cuerpo y dependen de la piel mixta lineal. Si bien los planes basados ​​en la piel pueden brindar resultados impresionantes para prendas ajustadas como camisetas y ropa deportiva, necesitan ayuda con vestidos, faldas y otras prendas holgadas que no imitan con precisión el movimiento del cuerpo. Es importante destacar que muchas de las técnicas basadas en el aprendizaje en evolución son específicas de la prenda y solo pueden predecir deformaciones para la prenda específica en la que se detectan. La aplicación está restringida por el requisito de que estas técnicas se vuelvan a entrenar para cada prenda.

En este estudio, investigadores de ETH Zurich y el Instituto Max Planck para Sistemas Inteligentes presentan un método único para predecir deformaciones dinámicas de ropa en redes neuronales gráficas (GNN). A través de la inferencia lógica sobre la relación entre las deformaciones, tensiones y aceleraciones locales, su enfoque aprende a predecir el comportamiento de tejidos físicamente realistas. Su enfoque se generaliza directamente a las formas del cuerpo y los movimientos arbitrarios debido a su localización, independientemente de la estructura y la forma general de la prenda. Aunque las GNN han mostrado resultados prometedores al reemplazar las simulaciones basadas en la física, la aplicación de esta idea a las simulaciones de ropa produce resultados insatisfactorios. Los vectores de vértices de características de red específicas y su vecindad de bucle único se transforman localmente mediante GNN (implementados como MLP).

Luego, cada mensaje de transferencia se usa para actualizar los vectores de características. La repetición de este procedimiento permite que las señales se propaguen por toda la red. Sin embargo, un número predeterminado de etapas de paso de mensajes limita la transmisión de la señal a un cierto radio. En el modelado de prendas, donde se inducen ondas elásticas al estirarse rápidamente a través del material, esto da como resultado un acoplamiento instantáneo, casi universal y de largo alcance entre los vértices. Hay muy pocos pasos, lo que ralentiza la transmisión de la señal y causa molestas distorsiones, dando a la ropa un aspecto gomoso poco natural. Aumentar el tiempo de computadora es el precio de una redundancia estúpidamente aumentada.

READ  Twitch ahora permitirá a los streamers transmitir simultáneamente en cualquier servicio que quieran

El hecho de que no se conozcan de antemano el tamaño máximo y la precisión de las redes de simulación, lo que permitiría una selección conservadora y adecuada de un gran número de iteraciones, no hace sino exacerbar este problema. Proponen un sistema de paso de mensajes a través de una red jerárquica que intercala fases de propagación con diferentes grados de precisión para solucionar este problema. Esto permite un tratamiento eficiente de ondas de movimiento rápido generadas por modos de estiramiento severos en volúmenes amplios, al tiempo que proporciona la clave necesaria para describir detalles locales, como pliegues y arrugas, a escalas más finas. A través de pruebas, muestran cómo su representación gráfica mejora las predicciones de presupuestos informáticos comparables tanto a nivel cualitativo como cuantitativo.

Al adoptar un potencial creciente del paso de tiempo implícito como función de pérdida, combinan las ideas de las redes neuronales basadas en gráficos con varias simulaciones para aumentar el potencial de generalización de su método. Debido a esta sintaxis, ya no requiere anotaciones de Ground Truth (GT). Esto permite que su red se entrene completamente sin supervisión mientras aprende simultáneamente la dinámica de las prendas de múltiples escalas, la influencia de los parámetros del material, la interacción de colisión y el contacto por fricción con el objeto subyacente. La formulación de gráficos también nos permite simular el desabotonado de una camisa en movimiento y prendas con estructuras cambiantes y cambiantes.

Las redes neuronales gráficas, el reenvío de mensajes de varios niveles y el entrenamiento no supervisado se combinan en su enfoque HOOD, lo que permite la predicción en tiempo real de dinámicas de ropa realistas para varios estilos de ropa y tipos de cuerpo. Han demostrado empíricamente que su método ofrece ventajas estratégicas en términos de flexibilidad y generalización en comparación con métodos más desarrollados. En particular, muestran que una sola red entrenada:

  1. Predice de manera efectiva el movimiento dinámico y físicamente realista para una amplia variedad de prendas.
  2. Generaliza sobre nuevos tipos de ropa y formas que no se ven durante el entrenamiento.
  3. Se permiten cambios en el tiempo de ejecución en las propiedades de los materiales y las tallas de las prendas.
  4. Admite cambios de estructura dinámicos, como abrir cremalleras o desabotonarse.
READ  Apple lanza la última versión beta de iOS 15.5: Esto es lo nuevo

Las plantillas y el código están disponibles para buscar en GitHub.


escanear el página del proyecto, enlace githubY papel. No olvides unirte SubReddit de 25k+MLY canal de discordiaY Y Boletín electrónico, donde compartimos las últimas noticias de investigación de IA, interesantes proyectos de IA y más. Si tiene alguna pregunta sobre el artículo anterior o si nos hemos perdido algo, no dude en enviarnos un correo electrónico a [email protected]


Herramientas destacadas:

🚀 Echa un vistazo a las herramientas de IA de 100 en el club de herramientas de IA

Anish Teeku es consultor en prácticas en MarktechPost. Actualmente está cursando sus estudios universitarios en Ciencia de Datos e Inteligencia Artificial en el Instituto Indio de Tecnología (IIT), Bhilai. Pasa la mayor parte de su tiempo trabajando en proyectos destinados a aprovechar el poder del aprendizaje automático. Su interés de investigación es el procesamiento de imágenes y le apasiona crear soluciones a su alrededor. Le gusta comunicarse con la gente y colaborar en proyectos interesantes.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *