El enfoque de Apple tiene capas: un modelo en dispositivo de ~3B parámetros maneja tareas rápidas (respuestas inteligentes, edición de texto, resumen básico) enteramente en el Neural Engine del dispositivo. Las tareas más complejas van al Private Cloud Compute de Apple — servidores que ejecutan Apple Silicon que procesan solicitudes sin retener datos del usuario y están sujetos a auditorías de seguridad independientes. Las tareas más allá de las capacidades de Apple (como preguntas de investigación profunda) pueden dirigirse a modelos de terceros con permiso explícito del usuario.
La arquitectura de privacidad de Apple para IA en la nube es técnicamente ambiciosa: los servidores ejecutan Apple Silicon (misma arquitectura que los dispositivos), el software se publica para verificación independiente, las solicitudes están cifradas de extremo a extremo, y Apple afirma no tener capacidad de acceder a los datos del usuario ni siquiera en sus propios servidores. Este es un modelo de privacidad significativamente diferente a "confía en nosotros con tus datos" — es "verifica que no podemos ver tus datos". Si cumple completamente con esta promesa está sujeto a investigación de seguridad en curso.