La pregunta más importante sobre modelos como ChatGPT, Gemini y MidJourney desde su lanzamiento es qué papel (si alguno) desempeñarán en nuestra vida diaria. Esto es algo que Apple está intentando responder con su propio enfoque en esta categoría, Apple Intelligence, que se presentó oficialmente esta semana en la WWDC 2024.

La empresa tuvo un desempeño brillante en la presentación del lunes; Los discursos de apertura son así. Cuando el vicepresidente senior Craig Federighi no estaba haciendo paracaidismo o haciendo parkour con la ayuda de la magia de Hollywood (bueno, Cupertino), Apple estaba decidida a demostrar que sus modelos internos eran tan capaces como los de la competencia.

La pregunta aún está indecisa, ya que la versión beta se lanzó el lunes, pero desde entonces la compañía ha revelado algunos aspectos que hacen que su enfoque de la IA generativa sea diferente. Lo primero y más importante es el alcance. Muchas empresas importantes en este campo adoptan un enfoque de «cuanto más grande, mejor» para sus modelos. El objetivo de estos sistemas es servir como una especie de ventanilla única para la información mundial.

Apple, por otro lado, tiene un enfoque algo más pragmático en esta categoría. Apple Intelligence es un enfoque más especializado de la IA generativa, diseñado específicamente para los distintos sistemas operativos de la empresa basados ​​en ella. Es un enfoque muy Apple en el sentido de que prioriza una experiencia de usuario sin fricciones por encima de todo.

En cierto sentido, Apple Intelligence es un ejercicio de marca, pero en otro sentido, la compañía prefiere que los aspectos generativos de la IA se integren perfectamente en el sistema operativo. Está perfectamente bien –o de hecho es preferible– que el usuario no tenga idea de las tecnologías subyacentes que operan estos sistemas. Los productos Apple siempre han funcionado de esta manera.

mantén el modelo pequeño

La clave para gran parte de esto es construir modelos pequeños: entrenar el sistema en conjuntos de datos personalizados diseñados específicamente para los tipos de funcionalidad requeridos por los usuarios del sistema operativo. No está claro de inmediato cuánto afectará el tamaño de estos modelos al problema de la caja negra, pero Apple cree que, como mínimo, tener más modelos específicos aumentará la transparencia sobre por qué el sistema toma decisiones específicas.

Debido a la naturaleza relativamente limitada de estos modelos, Apple no espera que haya mucha variedad al solicitar al sistema, como, por ejemplo, resumir texto. Sin embargo, en última instancia, la variación de una sugerencia a otra depende de la extensión del texto que se resume. El sistema operativo también tiene un mecanismo de retroalimentación en el que los usuarios pueden informar problemas con el sistema de IA generativa.

Si bien Apple Intelligence está mucho más enfocado que los modelos más grandes, puede cubrir un espectro de solicitudes, gracias a la inclusión de «adaptadores», que son específicos para diferentes funciones y estilos. Sin embargo, en términos generales, Apple no tiene un enfoque de «cuanto más grande, mejor» para construir modelos, ya que se deben tener en cuenta aspectos como el tamaño, la velocidad y la potencia de cálculo, especialmente cuando se trata de modelos en el dispositivo.

ChatGPT, Gemini y el resto

Abrirse a modelos de terceros como ChatGPT de OpenAI tiene sentido dado el enfoque limitado del modelo de Apple. La empresa ha entrenado sus sistemas específicamente para la experiencia macOS/iOS, por lo que habrá mucha información que quedará fuera de su alcance. En los casos en que el sistema crea que una aplicación de terceros sería más adecuada para responder, el mensaje del sistema le preguntará si desea compartir esa información externamente. Si no recibe ese mensaje, la solicitud se está procesando con el modelo interno de Apple.

Debería funcionar igualmente bien con todos los modelos externos, incluido el Google Gemini con el que Apple se asocia. Este es uno de los raros ejemplos en los que el sistema llamará la atención sobre el uso de IA generativa de esta manera. Esta decisión se tomó, en parte, para abordar cualquier problema de privacidad. Cada empresa tiene estándares diferentes a la hora de recopilar y formar datos de los usuarios.

Exigir a los usuarios que se inscriban cada vez elimina parte de la responsabilidad de Apple, incluso si agrega algunas molestias al proceso. También puede optar por no utilizar plataformas de terceros en todo el sistema, aunque hacerlo limitará la cantidad de datos a los que puede acceder el sistema operativo/Siri. Sin embargo, no puede darse de baja de Apple Intelligence de una sola vez. En su lugar, tendrá que hacerlo según las funciones.

computación en la nube privada

Por otro lado, no quedará claro si el sistema procesa una consulta específica en el dispositivo o a través de un servidor remoto con computación en la nube privada. La filosofía de Apple es que tales revelaciones no son necesarias, ya que mantiene sus servidores con los mismos estándares de privacidad que sus dispositivos, incluso para el silicio de origen que utilizan.

Una forma de saber con seguridad si la consulta se está manejando dentro o fuera del dispositivo es desconectar su máquina de Internet. Si se necesita computación en la nube para resolver el problema, pero la máquina no puede encontrar la red, mostrará un error indicando que no puede completar la acción solicitada.

Apple detalla las tareas que requerirán procesamiento basado en la nube. Hay muchos factores involucrados, y la naturaleza siempre cambiante de estos sistemas significa que lo que hoy puede requerir computación en la nube, mañana podrá lograrse en el dispositivo. Computar en el dispositivo no siempre será la opción más rápida, ya que la velocidad es uno de los parámetros que Apple Intelligence toma en cuenta al determinar dónde procesar el mensaje.

Sin embargo, hay algunas operaciones que siempre se realizarán en el propio dispositivo. El más notable de ellos es Image Playground, ya que todo el modelo de difusión se almacena localmente. Apple ha modificado el modelo para que genere imágenes en tres estilos de casa diferentes: animación, ilustración y boceto. El estilo de animación se parece mucho al estilo de la casa. Otra empresa fundada por Steve JobsDel mismo modo, la creación de texto está disponible actualmente en tres tipos de estilos: amigable, empresarial y conciso.

Incluso en esta etapa beta inicial, la creación de Image Playground es impresionantemente rápida y, a menudo, solo toma unos segundos. Para las preguntas de inclusión al crear imágenes de personas, el sistema requiere que ingrese información específica, en lugar de adivinar cosas como el origen étnico.

¿Cómo manejará Apple el conjunto de datos?

Los modelos de Apple se entrenan rastreando una combinación de conjuntos de datos con licencia e información de acceso público. robot manzanaEl rastreador web de la compañía lleva un tiempo proporcionando datos relevantes a aplicaciones como Spotlight, Siri y Safari. El rastreador tiene una función de exclusión voluntaria para los editores.

«Con Applebot-Extended», dijo Apple, «los editores web pueden optar por no utilizar el contenido de su sitio web para entrenar los modelos subyacentes de Apple que impulsan las funciones de inteligencia artificial generativa en los productos Apple», incluida la inteligencia, los servicios y las herramientas de desarrollo de Apple.

Esto se logra incluyendo un mensaje en el código del sitio web. Con la llegada de Apple Intelligence, la compañía ha introducido un segundo mensaje, que permite incluir sitios en los resultados de búsqueda, pero excluirlos para entrenar modelos de IA generativa.

IA responsiva

Apple publicó un documento técnico el primer día de la WWDC titulado «Presentación del modelo básico de servidor y dispositivo de Apple». Entre otras cosas, destaca los principios que rigen los modelos de IA de la empresa. En concreto, Apple destacó cuatro cosas:

  1. “Capacitamos a los usuarios con herramientas inteligentes: identificamos áreas donde la IA se puede utilizar de manera responsable para crear herramientas que aborden las necesidades específicas de los usuarios. Respetamos nuestra «cómo los usuarios usan estas herramientas para lograr sus objetivos».
  2. “Representar a nuestros usuarios: Creamos productos altamente personalizados con el objetivo de representar auténticamente a los usuarios de todo el mundo. Trabajamos continuamente para evitar perpetuar estereotipos y sesgos sistémicos en nuestras herramientas y modelos de IA.
  3. “Diseñar con cuidado: tomamos precauciones en cada paso de nuestro proceso, incluido el diseño, la capacitación del modelo, el desarrollo de funciones y la evaluación de la calidad, para abordar cómo nuestras herramientas de IA podrían usarse indebidamente o causar daños potenciales. ¿Cómo podemos mejorar de manera continua y proactiva nuestras herramientas de IA? con la ayuda de los comentarios de los usuarios.»
  4. «Proteger la privacidad: protegemos la privacidad de nuestros usuarios con un potente procesamiento en el dispositivo y una infraestructura innovadora como la computación en la nube privada. No utilizamos los datos personales privados de nuestros usuarios ni las interacciones de los usuarios cuando entrenamos nuestros modelos Foundation. Lo hacemos».

El enfoque característico de Apple hacia los modelos fundamentales permite que los sistemas se adapten específicamente a la experiencia del usuario. La compañía ha implementado este enfoque de UX primero desde la llegada de la primera Mac. Proporcionar una experiencia lo más fluida posible es beneficioso para el usuario, pero no debe hacerse a expensas de la privacidad.

Será una aplicación de equilibrio complicada que la compañía tendrá que navegar a medida que la actual cosecha de versiones beta del sistema operativo alcance la disponibilidad general este año. El enfoque ideal es proporcionar tanta (o tan poca) información como el usuario final necesita. Seguramente habrá mucha gente a la que le dará igual si una consulta se ejecuta en la máquina o en la nube. Se satisfacen de forma predeterminada para que el sistema sea más preciso y eficiente.

Para los defensores de la privacidad y otros interesados ​​en esos detalles, Apple debería esforzarse por lograr la mayor transparencia posible para los usuarios, sin mencionar la transparencia para los editores que no obtienen su contenido para entrenar estos modelos. Hay algunos aspectos en los que el problema de la caja negra es actualmente inevitable, pero en los casos en los que se pueda ofrecer transparencia, debería ponerse a disposición de los usuarios previa solicitud.

Source link