Apple Intelligence no está capacitada para el contenido de YouTube, afirma Apple – Análisis completo

Apple Intelligence no está capacitada para el contenido de YouTube, afirma Apple – Análisis completo

Apple aclara el uso de datos de entrenamiento de IA de YouTube

En un reciente informe de Wired, se reveló que Apple, junto con otras grandes empresas tecnológicas, había utilizado subtítulos de YouTube para entrenar sus modelos de inteligencia artificial. Este dataset incluyó más de 170,000 videos de creadores de contenido populares que se utilizaron en el desarrollo de los modelos de IA de Apple, específicamente en la creación de los modelos OpenELM de código abierto que se hicieron públicos en abril.

Sin embargo, Apple ha confirmado a 9to5Mac que OpenELM no alimenta ninguna de sus funciones de IA o aprendizaje automático, incluido el sistema Apple Intelligence de la compañía. Apple aclaró que OpenELM fue creado únicamente con fines de investigación, con el objetivo de avanzar en el desarrollo de modelos de lenguaje grandes de código abierto.

Al lanzar OpenELM en el Hugging Face Hub, una comunidad para compartir código de IA, los investigadores de Apple lo describieron como un «modelo de lenguaje abierto de última generación» diseñado para «potenciar y enriquecer la comunidad de investigación abierta». El modelo también está disponible a través del sitio web de Investigación de Aprendizaje Automático de Apple. La compañía ha afirmado que no tiene planes de desarrollar nuevas versiones del modelo OpenELM.

Apple hizo hincapié en que, dado que OpenELM no está integrado en Apple Intelligence, el dataset de «Subtítulos de YouTube» no se está utilizando para alimentar ninguna de sus funciones de IA comerciales. Apple reiteró su declaración anterior de que los modelos de Apple Intelligence se entrenan con «datos con licencia, incluidos datos seleccionados para mejorar características específicas, así como datos públicamente disponibles recopilados por nuestro rastreador web».

El informe de Wired detalló cómo empresas como Apple, Anthropic y NVIDIA habían utilizado el dataset de «Subtítulos de YouTube» para el entrenamiento de modelos de IA. Este dataset es parte de una colección más grande conocida como «The Pile», compilada por la organización sin fines de lucro EleutherAI.

En conclusión, Apple ha aclarado el uso de datos de entrenamiento de IA de YouTube y ha confirmado que OpenELM no alimenta sus funciones de IA comerciales. La compañía sigue comprometida con el avance de la investigación de modelos de lenguaje grandes de código abierto y ha puesto a disposición su modelo OpenELM para la comunidad de investigación.



Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *