16 de agosto de 2024

Cómo funcionan los modelos de base de Apple en dispositivos y servidores

**Revolutionary AI: Apple Intelligence y sus nuevos modelos de lenguaje**

En la Conferencia Mundial de Desarrolladores de Apple (WWDC), la compañía anunció emocionantes novedades en el campo de la inteligencia artificial. Apple presentó nuevos modelos de lenguaje que se ejecutan tanto localmente en los dispositivos de la marca como en los servidores propios de Apple, potenciados por Apple Silicon.

La inteligencia artificial (IA) se basa en modelos de lenguaje que proporcionan información para entrenar a la IA y producir resultados para consultas y comandos. Estos modelos permiten a las computadoras especializarse en temas específicos y actuar como expertos en dominios particulares.

La alineación de la IA se refiere al proceso de diseñar e implementar sistemas de IA para que se ajusten a los objetivos, valores y resultados deseados por los humanos. En otras palabras, la alineación busca mantener a la IA enfocada en su tarea original y evitar que se desvíe hacia un comportamiento peligroso.

En el WWDC 2024, Apple presentó Apple Intelligence, la propia IA de la compañía que combinará capacidades en dispositivos y en servidores. Mediante el uso de nuevos modelos en Apple Intelligence, la IA de Apple será más precisa, rápida y centrada en sus funciones.

**Modelos de lenguaje fundamentales de Apple**

Apple denomina a sus modelos de IA generativos básicos como modelos de lenguaje fundamentales. Estos modelos son Modelos de Lenguaje Grande (LLM) que utilizan hasta 3 mil millones de parámetros y están diseñados para proporcionar inteligencia artificial generativa básica que la mayoría de los usuarios podrían utilizar.

Apple tiene dos modelos específicos para sus modelos de lenguaje fundamentales: AFM-en-dispositivo y AFM-en-servidor respectivamente. Además, Apple cuenta con otros modelos de propósito general integrados en Apple Intelligence que pueden ejecutarse tanto en dispositivos como en los servidores de la marca.

**Tecnología detrás de los modelos de Apple**

Los modelos fundamentales de Apple utilizan una serie de técnicas de IA, que incluyen la arquitectura Transformer, matriz de incrustación de IO, pre-normalización, normalización de consulta-clave, atención agrupada de consultas, activación SwiGLU, incrustaciones posicionales RoPE, ajuste fino, ajustes y aportes humanos.

Apple Intelligence también utiliza un web crawler automatizado llamado AppleBot. Los sitios web pueden informar a AppleBot que no utilice su contenido mediante la exclusión en sus archivos robots.txt. Para el aprendizaje en IA de código, Apple Intelligence también se nutre de software de código abierto alojado en GitHub, del cual aprende y condensa, eliminando automáticamente casos duplicados.

**Apple Private Cloud Compute**

Apple Private Cloud Compute (PCC) es un servicio remoto de IA que aprovecha todos los modelos mencionados, además de tener acceso a modelos adicionales para una inteligencia más amplia. PCC tiene como objetivos la velocidad, precisión, privacidad y fiabilidad del sitio.

En resumen, Apple se compromete a desarrollar modelos de IA que ayuden a los usuarios en sus actividades diarias con productos Apple, desarrollados de manera responsable en todas las etapas y guiados por los valores fundamentales de la marca.

Con estos avances en inteligencia artificial, Apple promete ofrecer a los usuarios de iOS y Mac una experiencia más rápida y optimizada tanto en dispositivos como en la nube. Estaremos atentos a los siguientes lanzamientos de iOS y macOS para ver cómo se materializan estas innovaciones.