- Apple Silicon ahora es más viable como analizador de números de aprendizaje automático.
- La empresa está abriendo su marco de aprendizaje automático MLX.
- Las primeras cifras indican un aumento en la eficiencia y la velocidad.
La energía necesaria para ejecutar los chips ultrarrápidos basados en ARM que hacen funcionar las computadoras de escritorio y portátiles modernas de Apple es una fracción de la utilizada por los chips x86, que es solo una de las razones por las que los consumidores eligen los dispositivos de Cupertino sobre sus competidores. Además de las baterías que pueden alimentar fácilmente un día o más de trabajo en una computadora portátil sin necesidad de recargarlas, las aplicaciones optimizadas para aprovechar los chips de PC a menudo superan en rendimiento a los mismos archivos binarios que se ejecutan en estaciones de trabajo grandes.
Ahora, algunos de los beneficios del silicio de Apple se pueden utilizar más fácilmente en el mundo computacionalmente pesado del aprendizaje automático, gracias a la empresa. Lanzamiento de su propio marco de aprendizaje automático MLX Bajo código abierto Licencia del Instituto de Tecnología de Massachusetts. El marco admite el entrenamiento del lenguaje del modelo Transformer, la generación de imágenes y texto utilizando Stable Diffusion y Mistral, respectivamente, y el reconocimiento de voz utilizando Whisper, ampliamente disponible y extensible.
Parte del atractivo de este cambio de licencia para los desarrolladores de aprendizaje automático será el hecho de que MLX puede aprovechar el sistema de memoria unificada que se encuentra en los chips de generación M1 y M2, lo que significa que las operaciones en matrices en memoria pueden ser realizadas por el sistema central. unidad de procesamiento (CPU) o una unidad de procesamiento de gráficos (GPU), sin tener que transferir datos de una a otra. Si bien este ahorro se puede calcular en milisegundos, la naturaleza altamente iterativa de los cálculos de aprendizaje automático significa que los milisegundos pronto se suman, por lo que Stable Diffusion, por ejemplo, funciona hasta un 40 % más rápido que PyTorch.
Sin embargo, para lotes más pequeños, PyTorch tiene la ventaja. Pero como dice Apple en su documentación, esto se debe a las velocidades de compilación cuando el modelo no se guarda en la memoria.
MLX admite los llamados «cuenta perezosa«, lo que significa que sólo se materializan en una colección de datos cuando es necesario. Relajar los argumentos de los gráficos aritméticos no necesariamente inicia un proceso de compilación (lento).
El marco MLX está escrito en C++ y Python y proporciona llamadas API que ya resultarán familiares para los usuarios de NumPy y PyTorch, por lo que los científicos de datos deberían poder pasar al silicio de Apple con un mínimo de reelaboración.
Apple Silicon en el escritorio de un profesional de datos
Desarrollar modelos eficaces de aprendizaje automático es un proceso que requiere tiempo y recursos, por lo que acelerar el desarrollo de nuevos modelos es una propuesta muy atractiva. Aunque los dispositivos basados en silicio de Apple no son baratos para el consumidor, pueden competir con las computadoras de escritorio de alta gama que normalmente se encuentran en las oficinas de desarrolladores y profesionales de datos.
La historia de Apple en el código abierto es mixta: su macOS está basado en BSD, WebKit tiene sus raíces en KHTML y es el custodio de CUPS (el sistema de impresión común UNIX), pero la compañía ha contribuido poco a la comunidad de código abierto. . Por lo tanto, su decisión de tirar el MLX por encima de la valla se trata más de promover su hardware que de mejorar el poder del ML aprovechando el poder del colectivo.
Poner un marco de aprendizaje automático en manos de científicos de datos que necesitarán su hardware para obtener el mayor beneficio vende algunas unidades adicionales, pero aún queda un largo camino desde esa ganancia a corto plazo hasta convertirse en un jugador poderoso en el aprendizaje automático. Como saben los que están en el área, los mayores avances y desarrollos rápidos provienen del uso extensivo y mejoras iterativas del código fuente abierto; simplemente no es un área donde los motores propietarios superarán a los métodos y marcos de crowdsourcing en el mediano y largo plazo.
La salida de Apple del hardware de servidores a principios de 2010 puede considerarse una mala decisión, ya que los centros de datos que utilizan chips ARM o RISC V podrían ofrecer Rendimiento similar o mejor x86 con menores facturas de energía y refrigeración, porque no se ha recompilado ninguna implementación de la arquitectura. Quizás el juego de los servidores sea en el que Tim Cook debería haberse quedado: tomó el mando en 2011, el mismo año en que Apple dejó de producir su familia de servidores montados en bastidor XServe.