McDonald's encerrou o drive-thru com IBM. Faltou o número, não a tecnologia.
Em 2021, o McDonald’s e a IBM começaram a testar pedidos por voz no drive-thru. Em junho de 2024, o McDonald’s encerrou o teste.
O caso virou meme antes de virar referência. Circularam vídeos de um pedido que somava mais de 200 McNuggets sozinho, de bacon adicionado a um sorvete, de uma conta que passava de duzentos dólares.
A leitura fácil é direta: a IA não estava pronta. Está errada. Não pelo motivo que você imagina.
Vamos pela ordem dos fatos.
O que foi anunciado
Em 2019, o McDonald’s comprou a Apprente, uma empresa de reconhecimento de voz, e montou um laboratório interno de tecnologia. Em 2021, vendeu esse laboratório para a IBM e firmou uma parceria para desenvolver o pedido automatizado por voz no drive-thru.
O sistema foi para mais de 100 lojas nos Estados Unidos. A promessa era operacional, não tecnológica: tirar o atendente da etapa de anotar o pedido e devolver esse tempo para a cozinha e para a janela de entrega.
Tirar essa posição no pico é o que muda a conta. No horário de pico, quem anota o pedido vira gargalo, e cada segundo a mais na janela vira fila na rua.
Por relatos da imprensa de negócios, o sistema chegou a tomar cerca de 85% dos pedidos sem intervenção. Número alto para um problema difícil. Drive-thru é ruído de motor, sotaque, criança no banco de trás, e um cardápio com milhares de combinações.
Os vídeos virais eram sintoma, não causa. Todo atendente erra pedido. A pergunta nunca foi se a máquina errava. Foi se ela errava pouco o suficiente para mudar a escala de gente.
O que mudou no registro público
Em junho de 2024, o McDonald’s comunicou aos franqueados que ia remover a tecnologia da IBM das lojas de teste até o fim de julho. A empresa disse que voltaria a olhar pedido por voz com outros parceiros e decidiria os próximos passos até o fim do ano.
Repare no que esse comunicado não diz. Não diz que a IA falhou. Diz que o teste acabou.
Três anos de piloto. Mais de 100 lojas. E o encerramento veio sem um número público que dissesse “passou” ou “não passou”.
A omissão que explica o caso
Aqui está a parte que importa, e é uma só.
O caso de negócio do pedido por voz no drive-thru é remover ou realocar o atendente. Esse é o ganho. Não é a IA ser esperta. É a posição de anotar pedido deixar de existir.
Durante os três anos de teste, um funcionário continuou confirmando cada pedido na tela. O humano nunca saiu da fila.
Faça a conta grosseira. Se a voz resolve 85% e a pessoa confirma 100%, a folha de pagamento não mudou. Em alguns turnos, a confirmação na tela ainda soma um passo a mais.
Quando o humano fica para corrigir os 15% que a máquina erra, você não trocou um custo por outro. Você empilhou um sistema novo em cima de um salário que continua lá.
O McDonald’s não falhou em construir a IA. Falhou em definir, antes do piloto, o número que deixaria o humano sair.
Sem esse número, o teste não tinha linha de chegada. Mediu “está melhorando” por três anos, em vez de “cruzou o ponto que dispensa a pessoa”. Melhora sem fim definido não é progresso. É custo parado no meio.
A Klarna pulou uma fronteira parecida no atendimento: quando a IA deveria parar e passar para o humano. O drive-thru tinha a fronteira oposta. Quando o humano poderia parar. Nenhuma das duas estava escrita no começo.
O critério que teria pego isso
Se a sua operação está pensando em automação que substitui uma posição (self-checkout, visão na gôndola, pedido por WhatsApp, voz no balcão), três números precisam existir antes da primeira loja:
- O limiar de autonomia. A acurácia, na hora de pico real e não na média, em que o humano sai da posição. Sem o pico, o número engana.
- O teto de intervenção. A taxa de correção humana acima da qual o piloto é custo, não economia. Se a pessoa corrige mais que esse teto, o projeto já respondeu “não”.
- A data de matar ou subir. O piloto não roda para sempre. Tem prazo para virar produção ou ser desligado, decidido antes de começar.
Os três são definidos na semana zero, em conversa, com a operação na sala. Não são técnicos. São uma negociação entre quem opera a loja, quem cuida do custo e quem responde pela experiência.
Pule essa conversa e o piloto faz o que o do McDonald’s fez. Roda anos no meio caro, melhorando um número que ninguém combinou onde tinha que chegar.
Seja honesto com você por um segundo.
Olha o piloto de automação que está rodando na tua operação agora. Tem um humano confirmando o que a máquina faz? Pergunta uma coisa só: qual é o número que faz esse humano sair?
Se ninguém na sala souber responder, o teu piloto não tem fim. Tem só custo.
O que este post não está afirmando
Não temos acesso aos dados internos do McDonald’s nem da IBM. A leitura é construída sobre o registro público: comunicados, reportagens, declarações oficiais.
Não estamos dizendo que a tentativa foi tola. Voz em drive-thru é dos problemas mais difíceis do varejo, e testar em escala foi uma decisão defensável.
Estamos dizendo, apenas, que o post-mortem honesto aponta para um critério ausente, não para uma falha de tecnologia. A diferença muda a sua próxima conversa de orçamento.
Se ela começa com “vamos automatizar o atendimento do balcão”, a pergunta antes de aprovar não é “qual fornecedor”. É esta: qual é a acurácia, no pico, que deixa o atendente sair, e em quanto tempo decidimos se chegou lá?
Definir esse número é uma briga entre áreas. Cada uma defende o indicador que já mede. É mais fácil com alguém de fora na sala que conhece a forma da conversa e força o fechamento.
Manda os três indicadores que a tua operação já acompanha nesse balcão ou nesse checkout. Em uma hora te devolvo quais teriam previsto o resultado do McDonald’s e quais são ruído.
Se virmos uma forma de projeto, o Diagnóstico de duas semanas termina com um documento de uma página: três indicadores, três faixas alvo, três gatilhos de revisão. Esse documento vai para a parede da operação, antes da primeira linha de código.