A relevância da ciência de dados nos negócios
Negócios e economia

A relevância da ciência de dados nos negócios

O processo de inovação de uma empresa requer a construção de uma relação intrínseca entre estratégia organizacional e capacidade analítica para monitorar resultados e aperfeiçoar modelos de gestão.

A análise de dados e a modelagem analítica desempenham um papel fundamental na distinção de empresas em qualquer tipo de mercado, gerando oportunidades concretas e substanciais de ganho competitivo. Essa vantagem competitiva permite que as empresas sejam mais inovadoras, tornando-as líderes em seus respectivos segmentos. O uso de abordagens analíticas faz com que as organizações possam identificar quando e quais produtos lançar, determinar quais serviços poderão fidelizar os clientes, realizar prognósticos de vendas e consumo, otimizar preços de produtos e suas distribuições pela cadeia de suprimentos, aumentar a qualidade e o volume de negócios, dentre diversas outras ações, não somente voltados aos clientes, mas também aos processos operacionais das empresas. Inovação significa resolver problemas com soluções simples em vez de complexas, em um período adequado, e usando um processo de replicação viável. Uma solução não pode demorar a ser implementada em mais tempo do que a demanda requer, e nem ser mais cara do que o próprio problema. Mas talvez, ainda mais importante do que ser inovador, seja permanecer inovando. E este é um ponto onde a ciência de dados se torna crucial.

Se a solução for muito complexa para ser facilmente compreendida, muito cara para ser implantada em um processo de produção ou se demorar muito para ser desenvolvida, essa solução certamente não é inovadora. É apenas uma solução, não viável, não palpável e não aplicável à empresa.

Para serem inovadoras, as organizações precisam criar um ambiente adequado para identificar problemas, ameaças e oportunidades. Elas precisam criar soluções rápidas que resolvam os problemas, ainda que não de forma ótima, mas talvez de forma satisfatória. A busca por soluções é um processo contínuo, e as evoluções dessas soluções ao longo do tempo passam a ser uma questão natural. Por fim, todas as soluções devem ser implementadas na cadeia produtiva.

Empresas em todo o mundo estão tentando fazer exatamente isso, embora muitas não estejam conseguindo. Talvez a maioria. E qual é o segredo? Infelizmente, não há segredo. É como no filme Kung Fu Panda. O segredo do noodle incrível era… Não há segredo algum. Era tudo sobre a paixão, o amor e o cuidado colocados na preparação, do início ao fim do processo. O segredo está em cada um de nós, que trabalhamos com paixão, amor, respeito, e que colocamos todo esforço e energia para fazer o nosso melhor. O segredo é olhar para o passado, aprender com ele, observar o presente, identificar os cenários, e tentar fazer o melhor possível no futuro. Fazer o melhor aqui pode ser prever ações do cliente, adequar preços, otimizar cadeias de distribuição, estimar vendas e consumo, e assim por diante. E se o segredo é só sobre nós, apenas uma questão de olhar para o passado, observar o presente e prever o futuro, então, por que essa abordagem nem sempre funciona?

Mesmo que possamos prosseguir em um caminho bem trilhado e seguir um padrão típico, existem tantas variáveis imprevisíveis em nosso mundo, cada uma com tantos atributos a serem considerados, que mesmo uma pequena mudança no ambiente geral pode alterar tudo o que foi planejado.

Adaptação a cenários de mudança no ambiente de negócios

As empresas podem fazer tudo exatamente da maneira correta, mas talvez não na hora certa. Elas podem fazer no momento certo e da maneira correta, mas talvez não considerando todas as variáveis envolvidas. Elas podem até fazer tudo da maneira adequada, no momento certo, mas não levando em conta algum pequeno fator externo, não mapeado, imprevisível, mas impactante nos modelos analíticos. Esse fator pode ser algo em princípio não muito importante ou relacionado com o modelo em desenvolvimento, como um evento natural, um fato político, uma mudança social ou uma ruptura econômica. A mesma abordagem, seguindo os mesmos passos, executando exatamente as mesmas rotinas, prosperaria perfeitamente se fosse feita um pouco mais cedo, ou um pouco mais tarde, mas não naquele exato momento. Este é o imponderável em ciência de dados. E como se preparar para isso? É aí que entra a arte na ciência de dados. Fazer modelos substitutos, modelos considerando cenários distintos, modelos com múltiplas bases de treinamento, treinamentos mais frequentes. Algo parecido com os modelos de previsão de tempo, sobretudo de rotas de furacões e tormentas. São modelos estocásticos, onde as posições passadas da tempestade não informam com certeza sobre a posição futura. Mas os modelos são atualizados com uma alta frequência, redirecionando as previsões em casos de mudanças mais abruptas do comportamento pregresso. Por fim, seguir tentando, sempre. Não importa se são modelos determinísticos ou estocásticos, se a modelagem é paramétrica ou não paramétrica. Os cenários evoluem, os dados que os representam evoluem, e dessa forma, os modelos que os retratam devem evoluir no mesmo ritmo.

As organizações devem usar as melhores ferramentas e as técnicas mais adequadas para se adaptar aos diferentes cenários e às mudanças nos ambientes de negócios. A ciência de dados ajudará fortemente as organizações a entender todas essas mudanças e evoluções. Por mais paradoxal que possa parecer, mesmo quando um modelo falha, a avaliação dessa falha pode ajudar as empresas a entenderem o que se passou, por que a previsão não se materializou conforme o esperado e, assim, indicar possíveis alterações na modelagem para se ajustar ainda mais ao cenário estudado, a definição do problema a ser resolvido. Como na vida, as falhas ajudam as organizações a redirecionarem suas estratégias e se reajustarem no caminho mais adequado.

Ser inovador não é o destino; é a jornada. Para serem inovadoras, as empresas precisam se firmar nesse caminho analítico, monitorando os resultados modelados e melhorando os modelos ao longo do tempo. Aumentar o uso desses modelos e converter todo esse ambiente analítico em um processo operacional que permeie toda a empresa. A estratégia corporativa deve direcionar a construção e a execução do ambiente analítico, e este, por sua vez, deve suportar as ações de negócio que implementam as estratégias corporativas.

Essa relação entre a estratégia organizacional e ambiente analítico pode ser visualizada em quatro etapas distintas. Essas etapas podem ser executadas em diferentes estágios de maturidade analítica, mas podem até ocorrer simultaneamente. Independentemente do tempo, cada uma dessas etapas considera diferentes estágios de procedimentos analíticos aplicados, cada um dos quais visa abordar questões de negócios específicas e com objetivos particulares.

Análise de tendências

Essa primeira camada de análise fornece insights de médio e longo prazo, ajudando as organizações a avaliar tendências e prever cenários de negócios. Data Warehouses, Data Marts, aplicações multidimensionais e dashboards interativos geralmente suportam esse propósito de estágio um. As informações de entrada normalmente suportam análises voltadas para a identificação de tendências, padrões de eventos históricos e cenários de negócios. As análises focam sobretudo em apresentar informações sobre eventos passados por determinadas dimensões (por exemplo, vendas por região e linhas de produtos) e, claro, mudanças ocorridas ao longo do tempo. Os fatos (vendas) e as dimensões (produtos e regiões) podem ser substituídos por diferentes métricas e visões, de acordo com o segmento de negócio das empresa. Contudo, a dimensão tempo sempre deve ser considerada nesta abordagem exploratória. Um exemplo prático desse tipo de análise é identificar que ocorreu um aumento do churn em determinado momento.

Pesquisa de mercado

Uma segunda camada de análise mapeia os ambientes internos e externos que afetam a questão em estudo. Isso pode incluir considerações de mercado, comportamento dos clientes, as ações dos concorrentes, bem como detalhes sobre os produtos e serviços que a organização oferece. As questões exploradas nesta etapa incluem: Quão lucrativos são meus produtos/serviços? Quão bem eles foram adotados pelo público-alvo? Quão bem eles atendem às necessidades do cliente? As análises estatísticas apoiam essas tarefas, com correlações, identificação de tópicos e métodos de associação. Normalmente, nesses casos, há um ambiente analítico disponível para realizar tais consultas e análises. No entanto, distinguindo-o ainda mais do primeiro estágio, normalmente não há ambiente de produção que forneça respostas em tempo real, nem um portal web predefinido ou qualquer outra interface para respostas rápidas a essas perguntas. Esta etapa de análise é realizada sob demanda, quando os departamentos de negócios solicitam informações sobre um determinado problema ou cenário. Um exemplo desse tipo de análise seria identificar as características médias ou mais gerais dos clientes que fizeram churn em um determinado momento, como descrito no estágio 1.

Definição de estratégias

A terceira camada de análise é impulsionada pela estratégia da empresa. O desenvolvimento dos modelos é direcionado por questões centrais de negócios, e mais especificas, como venda cruzada, venda adicional, abandono, fraude, risco etc., e os modelos são implantados e usados em produção assim que os resultados são obtidos. Modelos estatísticos e de machine learning geralmente suportam esses tipos de atividades, sejam eles supervisionados (classificação, estimação ou prognostico) ou não supervisionados (segmentação, associação, sequência, análise de redes, etc.). Esses modelos devem ser atualizados com determinada frequência, sempre que a acuracidade decair, ou uma alteração significativa nos resultados for observada. A frequência depende muito do objetivo do modelo. Por exemplo, modelos de detecção de fraude são atualizados com alta frequência. Modelos de venda ou abandono, nem tanto. Modelos de segmentação podem ser menos frequentemente atualizados. Um exemplo seria a construção de modelos de predição de churn, associando uma probabilidade de abando a cada cliente em determinado momento.

Diagnóstico

O primeiro estágio está muito relacionado com a análise do que aconteceu. Se trata de uma análise mais descritiva. O segundo estágio está mais relacionado com a compreensão dos cenários e condições que levaram tal fato a ocorrer. São análises mais exploratórias e de diagnostico. O terceiro estágio envolve fundamentalmente uma análise preditiva, orientado ao que vai ocorrer. O último estágio, contudo, considera uma análise prescritiva, sendo extremamente direcionada a como executar ou responder aos eventos preditos. Modelos de otimização são utilizados nessa etapa de maneira a conscientizar os tomadores de decisão sobre as opções existentes e as possíveis ações a serem executadas, considerando um conjunto de restrições e os recursos disponíveis. Por exemplo, um modelo de otimização para identificar quais clientes serão abordados e qual oferta de retenção será utilizada para cada um deles.

Como forma de exemplificar esse processo, considere o seguinte cenário. Uma empresa decide lançar um novo produto. Antes de definir o pacote ou o preço adequado, a empresa pode decidir realizar um estudo profundo sobre o mercado, os concorrentes e os consumidores. Este estudo deve levar em consideração as necessidades atuais e eventuais dos clientes. Os clientes estão dispostos a adotar o produto? Que preço eles podem estar dispostos a pagar? Os concorrentes possuem produtos similares? Se sim, qual o preço? A própria empresa possui produtos pré-existentes que competem com este novo lançamento?

Todas essas questões podem ser avaliadas nas primeiras duas camadas de análise, tanto do ponto de vista descritivo, quanto de exploração e diagnostico. Essa tarefa é totalmente sob demanda, e seria necessária para dar suporte a definição estratégica para o lançamento do produto.

Uma análise mais aprofundada sobre como os clientes consomem produtos semelhantes, levando em consideração informações históricas sobre vendas, pode levar a um modelo preditivo que determine a probabilidade de cada um dos clientes comprar esse novo produto. Modelos não supervisionados poderiam indicar diferentes segmentações de clientes e seus perfis característicos, assim como models de sequência poderiam estabelecer os possíveis estágios de compra mais frequentes. Esses modelos combinados apoiariam campanhas de vendas, definindo público-alvo, as ofertas, os canais de contato, e os momentos de abordagem mais adequados. Esse tipo de modelagem estaria associado à terceira camada de análise.

Em um cenário real, sempre existirá uma limitação de produtos a serem produzidos, capacidades de entrega, disponibilidades, taxas de conversão para cada cliente ou segmento de clientes, receitas geradas pelos produtos, custos relacionados à venda por canais, etc. Modelos de otimização podem levar em considerando todos os recursos disponíveis e as restrições existentes dentro de um determinado cenário, indicando quais clientes devem abordados, por qual canal, com qual oferta. Essa abordagem analítica se encaixa na quarta camada de análise.

E, finalmente, uma vez que o produto tenha sido lançado, a empresa poderá monitorar o sucesso das vendas ao longo do tempo. Os analistas de negócios podem ter uma visão clara sobre as vendas do produto em relação a diferentes segmentos de clientes, diferentes tipos de promoções, quão lucrativo é o produto em diferentes filiais, regiões, canal de vendas e assim por diante. O processo é cíclico, e deve ser ajustado no decorrer das ações de negócio, ou seja, as análises descritivas devem ser atualizadas constantemente, assim como os procedimentos de exploração e diagnósticos dos eventos. Os modelos preditivos devem ser da mesma forma ajustados uma vez que o cenário de negócio muda pela simples entrada desse novo produto no mercado. O comportamento dos clientes irá mudar, os dados que retratam esse comportamento também, e assim, os modelos treinados com base nos dados antigos podem decair. Por fim, dado a dinamicidade dos eventos e uma eventual conversão dos clientes para o novo produto, tanto os recursos quanto as restrições podem sofrer modificações. Por isso, os modelos de otimização também devem ser reestruturados e reexecutados, de forma a considerar os novos contornos que definem o problema ou cenário de negócio.

Como conclusão, os ambientes analíticos das organizações, incluindo as plataformas de software, os programas, os modelos, e sobretudo os dados que suportam os diferentes estágios de análise, devem estar fortemente associados com as estratégias corporativas das empresas. Naturalmente que diferentes empresas possuem prioridades distintas, seja de crescimento de base de clientes, aumento de receita, redução de custo operacional, aumento de portfolio de produtos e serviços, e assim por diante. Todavia, os diferentes estágios analíticos devem suportar todas as ações de negócio das empresas, não importando seus segmentos ou prioridades. Esses estágios analíticos deverão sempre considerar as estratégias corporativas. Uma empresa analítica é aquela que toma suas decisões e executa as ações correspondentes com base em fatos estatísticos e probabilísticos. Ainda que se erre em determinadas soluções, dado a aleatoriedade inerente aos eventos reais, a jornada será sempre de persistência. Persistência com o processo analítico, com as análises, com os modelos, e com as diferentes soluções, algumas ótimas, outras nem tanto. O importante é que as tomadas de decisão sejam sempre que possível embasadas em fatos. É um processo cultural, do ponto de vista que se deve criar uma consistência organizacional no uso analítico para suportar as decisões corporativas.

Último vídeo

Nossos tópicos