Ok Google, pesquisar preço de aspirador de pó. Alexa, ligar para a vovó. Siri, agendar reunião para segunda-feira. Se usar assistentes de voz parecia, até pouco tempo atrás, algo um tanto futurista, hoje é a realidade da maioria das pessoas. A começar pelo fato de que todo mundo que tem um smartphone, tem um serviço de voz embutido em seu sistema operacional. No Brasil, 90% já enviaram mensagens de voz, e 60% já usaram a voz para controlar seus aparelhos. Dos 230 milhões de smartphones que existem no país, mais de 120 milhões são habilitados para interações Voice First.
Desde o nascimento da internet, em meados dos anos 1980, um novo mundo vem sendo moldado pelas tecnologias de rede. Por trás delas, sempre houve um comando. Mas este comando se distancia cada vez mais das pontas dos dedos e se transfere para a fala. O assistente de voz é, hoje, a chave da Internet das Coisas, é quem molda os movimentos do mundo contemporâneo. É só falar, e as engrenagens se movem. E, por isso, é grande a oportunidade deste mercado que inaugura a quarta revolução industrial.
Os aplicativos de voz não são o futuro da internet e da cultura do consumo – são o presente. Eles já simplificam a vida, agilizam os processos tecnológicos, otimizam o tempo. Já se pode usá-los para acionar serviços como Rappi, iFood, Uber, Netflix, Spotify, Instagram, sistemas de busca como o Google, e qualquer outra coisa que você quiser acionar.
O grande responsável por esta guinada é o smartphone. O mundo está sendo e será cada vez mais movido a partir desses gadgets que ampliaram a produtividade dos seres humanos. Há 20 anos, uma pessoa era dez vezes menos produtiva do que hoje. O uso do celular aumentou não só a velocidade da comunicação, como também a capacidade analítica e a dinâmica da memória.
Tudo isso potencializou a eficácia das relações sociais e de produtividade, causando um impacto direto também no tempo de quem usa as novas tecnologias. Se o ser humano está mais produtivo porque otimizou dez vezes o seu tempo, logo, seu tempo se torna dez vezes mais valioso. E se economia de tempo é ouro, o uso de voz é decisivo para tornar tudo mais ágil.
Pense neste exemplo cotidiano: pedir um carro. Se você for desbloquear o telefone, abrir o aplicativo, esperá-lo carregar, informar sua localização, clicar no ícone do Uber X ou Black, vai demorar alguns minutos. Mas, se em vez disso, simplesmente pedir à Alexa, a assistente da Amazon, “Alexa, pede meu Uber Black daqui para casa, por favor”, isso vai levar 3,7 segundos.
Os voice apps, como a Alexa, são aplicativos de celular construídos dentro do conceito de inteligência artificial. São personagens criados no universo virtual que interagem com o usuário. Eles simulam conversas para entregar informações baseadas em voz e estão cada vez mais sofisticados. Ou seja, têm uma imensa capacidade de absorver o comportamento do usuário, aprendendo a corresponder a seus hábitos e a seus padrões de atividades, personalizando-se.
Mais real que a ficção
Essa interação entre homem e máquina sempre rendeu muita ficção. Em 2013, a comédia dramática “Her” (Ela, em português), do americano Spike Jonze, trouxe a história de um sujeito que entendeu tão bem o que uma assistente de voz é capaz de fazer que até se apaixonou por ela. Theodore Twombly, um solitário ghostwriter interpretado por Joaquin Phoenix, adquire uma assistente virtual. É uma bela voz feminina (da atriz Scarlett Johansson) que traz uma variedade de entonações sutis, além da refinada inteligência que, aos poucos, assimila o gosto e a personalidade de seu dono, compreendendo tudo o que ele quer.
Muito do que foi experimentado em roteiros de audiovisual já pode ser visto na realidade, dos Jetsons ao seriado britânico Years and Years, onde todos têm seu assistente pessoal por comando de voz (smart speakers) como parte do mobiliário da casa. Existem mais de dois bilhões de assistentes operacionais pelo mundo. Entre as principais marcas de Voice Apps, junto com a Alexa, estão Assistant (Google), Cortana (Microsoft), Bixby (Samsung), Siri (Apple) e AliGenie (Alibaba), além das desenvolvidas por bancos, corporações de varejo, entre outras.
Se por um lado a voz é uma realidade do mercado, por outro, o mundo dos negócios ainda não sacou as mil e uma maneiras que ela pode ser utilizada em seus serviços. Tudo passa pelo cliente, que quer atenção, agilidade e qualidade.
Hoje, mais de 30% das pesquisas no mundo já são feitas via voz – com isso, é essencial o V-SEO (Search Engine Optimization de entrada por voz). Desenvolver uma voz com toque humano, responsiva e que dialogue com o consumidor é oferecer uma experiência única e imersiva. Algo que o Magazine Luiza, para citar uma empresa brasileira de ponta, faz com a sua assistente Lu. No mundo todo, quase metade das buscas no Google em smartphones são feitas por voz – e, pasmem, trazem resultados diferentes que as pesquisas digitadas – mais contextualizadas e, atenção, mais restritas. O teclado fica de escanteio.
Muitas dessas buscas são relacionadas a pesquisas de preços e compras. O chamado Voice Commerce já é uma realidade e a estimativa é de que, no ano que vem, 40% da população global vai usar assistente de voz para comprar alguma coisa. A crise criada pela pandemia, que forçou a distância social entre as pessoas, vêm acelerando ainda mais esse número. Segundo um estudo da Frost & Sullivan, em 2019, o mercado de internet das coisas faturou por volta de R$ 2,2 bilhões. Volume que só vai crescer com o poder da voz.
Para além do V-SEO e do Voice Commerce, há muita coisa que uma empresa pode fazer dentro desta tecnologia. Há o conceito de Voice Apps (Alexa Skills ou Actions, no assistente do Google) que permite engajamentos gerenciáveis de marcas e empresas com seus clientes, sem consumir muita memória ROM (de armazenamento) no smartphone como os MobileApps consomem e, ainda, consumindo menos franquia de dados trafegados.
Tem ainda o Interactive Branded Storytelling, um tipo de roteiro alusivo a uma evolução do programa “Você Decide” (quem se lembra?), que vai ajudando o usuário a garimpar seus gostos, enquanto vai sendo garimpado também. Ou o Sonic Branding, que trabalha a identidade auditiva das marcas. Por fim, há o Flashbriefing, mini podcasts mais frequentes que oferecem ao ouvinte pílulas de informação em sua rotina – conceito ainda mais potencializado com o smart speakers.
No mundo contemporâneo, da velocidade, da identidade, das reivindicações dos direitos, do consumo rápido, do reforço da cidadania e da virtualidade, ter voz própria é tudo.
Rapha Avellar – Fundador & CEO da Avellar