McDonald's encerrou o drive-thru com IBM. Faltou o número, não a tecnologia., Forja

Notas · Critério, cronograma e custo de projetos de IA · Post-mortem público

Forja · Engenharia forward-deployed · 25 de maio de 2026 · Read in English › · Leer en español ›

Em 2021, o McDonald’s e a IBM começaram a testar pedidos por voz no drive-thru. Em junho de 2024, o McDonald’s encerrou o teste.

O caso virou meme antes de virar referência. Circularam vídeos de um pedido que somava mais de 200 McNuggets sozinho, de bacon adicionado a um sorvete, de uma conta que passava de duzentos dólares.

A leitura fácil é direta: a IA não estava pronta. Está errada. Não pelo motivo que você imagina.

Vamos pela ordem dos fatos.

O que foi anunciado

Em 2019, o McDonald’s comprou a Apprente, uma empresa de reconhecimento de voz, e montou um laboratório interno de tecnologia. Em 2021, vendeu esse laboratório para a IBM e firmou uma parceria para desenvolver o pedido automatizado por voz no drive-thru.

O sistema foi para mais de 100 lojas nos Estados Unidos. A promessa era operacional, não tecnológica: tirar o atendente da etapa de anotar o pedido e devolver esse tempo para a cozinha e para a janela de entrega.

Tirar essa posição no pico é o que muda a conta. No horário de pico, quem anota o pedido vira gargalo, e cada segundo a mais na janela vira fila na rua.

Por relatos da imprensa de negócios, o sistema chegou a tomar cerca de 85% dos pedidos sem intervenção. Número alto para um problema difícil. Drive-thru é ruído de motor, sotaque, criança no banco de trás, e um cardápio com milhares de combinações.

Os vídeos virais eram sintoma, não causa. Todo atendente erra pedido. A pergunta nunca foi se a máquina errava. Foi se ela errava pouco o suficiente para mudar a escala de gente.

O que mudou no registro público

Em junho de 2024, o McDonald’s comunicou aos franqueados que ia remover a tecnologia da IBM das lojas de teste até o fim de julho. A empresa disse que voltaria a olhar pedido por voz com outros parceiros e decidiria os próximos passos até o fim do ano.

Repare no que esse comunicado não diz. Não diz que a IA falhou. Diz que o teste acabou.

Três anos de piloto. Mais de 100 lojas. E o encerramento veio sem um número público que dissesse “passou” ou “não passou”.

A omissão que explica o caso

Aqui está a parte que importa, e é uma só.

O caso de negócio do pedido por voz no drive-thru é remover ou realocar o atendente. Esse é o ganho. Não é a IA ser esperta. É a posição de anotar pedido deixar de existir.

Durante os três anos de teste, um funcionário continuou confirmando cada pedido na tela. O humano nunca saiu da fila.

Faça a conta grosseira. Se a voz resolve 85% e a pessoa confirma 100%, a folha de pagamento não mudou. Em alguns turnos, a confirmação na tela ainda soma um passo a mais.

Quando o humano fica para corrigir os 15% que a máquina erra, você não trocou um custo por outro. Você empilhou um sistema novo em cima de um salário que continua lá.

O McDonald’s não falhou em construir a IA. Falhou em definir, antes do piloto, o número que deixaria o humano sair.

Sem esse número, o teste não tinha linha de chegada. Mediu “está melhorando” por três anos, em vez de “cruzou o ponto que dispensa a pessoa”. Melhora sem fim definido não é progresso. É custo parado no meio.

A Klarna pulou uma fronteira parecida no atendimento: quando a IA deveria parar e passar para o humano. O drive-thru tinha a fronteira oposta. Quando o humano poderia parar. Nenhuma das duas estava escrita no começo.

O critério que teria pego isso

Se a sua operação está pensando em automação que substitui uma posição (self-checkout, visão na gôndola, pedido por WhatsApp, voz no balcão), três números precisam existir antes da primeira loja:

O limiar de autonomia. A acurácia, na hora de pico real e não na média, em que o humano sai da posição. Sem o pico, o número engana.
O teto de intervenção. A taxa de correção humana acima da qual o piloto é custo, não economia. Se a pessoa corrige mais que esse teto, o projeto já respondeu “não”.
A data de matar ou subir. O piloto não roda para sempre. Tem prazo para virar produção ou ser desligado, decidido antes de começar.

Os três são definidos na semana zero, em conversa, com a operação na sala. Não são técnicos. São uma negociação entre quem opera a loja, quem cuida do custo e quem responde pela experiência.

Pule essa conversa e o piloto faz o que o do McDonald’s fez. Roda anos no meio caro, melhorando um número que ninguém combinou onde tinha que chegar.

Seja honesto com você por um segundo.

Olha o piloto de automação que está rodando na tua operação agora. Tem um humano confirmando o que a máquina faz? Pergunta uma coisa só: qual é o número que faz esse humano sair?

Se ninguém na sala souber responder, o teu piloto não tem fim. Tem só custo.

O que este post não está afirmando

Não temos acesso aos dados internos do McDonald’s nem da IBM. A leitura é construída sobre o registro público: comunicados, reportagens, declarações oficiais.

Não estamos dizendo que a tentativa foi tola. Voz em drive-thru é dos problemas mais difíceis do varejo, e testar em escala foi uma decisão defensável.

Estamos dizendo, apenas, que o post-mortem honesto aponta para um critério ausente, não para uma falha de tecnologia. A diferença muda a sua próxima conversa de orçamento.

Se ela começa com “vamos automatizar o atendimento do balcão”, a pergunta antes de aprovar não é “qual fornecedor”. É esta: qual é a acurácia, no pico, que deixa o atendente sair, e em quanto tempo decidimos se chegou lá?

Definir esse número é uma briga entre áreas. Cada uma defende o indicador que já mede. É mais fácil com alguém de fora na sala que conhece a forma da conversa e força o fechamento.

Manda os três indicadores que a tua operação já acompanha nesse balcão ou nesse checkout. Em uma hora te devolvo quais teriam previsto o resultado do McDonald’s e quais são ruído.

Se virmos uma forma de projeto, o Diagnóstico de duas semanas termina com um documento de uma página: três indicadores, três faixas alvo, três gatilhos de revisão. Esse documento vai para a parede da operação, antes da primeira linha de código.