A abordagem da Apple é em camadas: um modelo on-device de ~3B parâmetros lida com tarefas rápidas (respostas inteligentes, edição de texto, sumarização básica) inteiramente no Neural Engine do dispositivo. Tarefas mais complexas vão para o Private Cloud Compute da Apple — servidores rodando Apple Silicon que processam requisições sem reter dados do usuário e estão sujeitos a auditorias independentes de segurança. Tarefas além das capacidades da Apple (como questões de pesquisa profunda) podem ser roteadas para modelos de terceiros com permissão explícita do usuário.
A arquitetura de privacidade da Apple para IA na nuvem é tecnicamente ambiciosa: servidores rodam em Apple Silicon (mesma arquitetura dos dispositivos), o software é publicado para verificação independente, requisições são criptografadas de ponta a ponta, e a Apple afirma não ter capacidade de acessar dados do usuário mesmo em seus próprios servidores. Este é um modelo de privacidade significativamente diferente de "confie em nós com seus dados" — é "verifique que não podemos ver seus dados". Se cumpre totalmente essa promessa é tema de pesquisa de segurança em andamento.