Quando falamos em Inteligência Artificial, muitas vezes pensamos em robôs: o desenvolvimento de robôs que são uma cópia eletrônica de nós mesmos ou um minúsculo nanobot que monitora o funcionamento de nosso corpo 24 horas por dia, sete dias por semana. Mas a IA também se refere às tecnologias menos tangíveis que ajudam os bancos, por exemplo, a combater fraudes ou com as quais as lojas direcionam seus clientes aos produtos certos.
Em qualquer caso, a IA consiste em dois componentes principais: hardware que tenta imitar nossos sentidos humanos e software que simula as capacidades de nosso cérebro. O hardware será, em muitos aplicativos, um servidor ou computador clássico.
Os cientistas de dados se concentram no desenvolvimento do componente de software da IA. Antes de podermos falar de IA, o software precisa dar um passo adiante e usar os dados processados para se tornar mais inteligente. Chamamos esse processo de Aprendizado de Máquina. Os dados devem ser coletados, processados e analisados para que os sistemas possam aprender e fazer previsões automaticamente. Os cientistas de dados desenvolvem algoritmos para isso, eles são os treinadores do cérebro da IA.
Preparando dados
Chamamos um processo importante na preparação de dados de “caracterização”. Isso significa que coletamos um conjunto significativo de recursos com base em dados brutos e, assim, melhoramos a qualidade dos dados e o desempenho do modelo de aprendizado de máquina. É nisso que os cientistas de dados vêm trabalhando há mais tempo, porque a regra principal da IA é “entra lixo, sai lixo”. Felizmente, todo esse processo pode ser automatizado. Esse sistema inteligente é chamado de “máquina de recursos”. Ele avaliará automaticamente a qualidade dos dados em relação a todos os tipos de problemas potenciais e, em seguida, criará um novo conjunto de recursos.
A aplicação de algoritmos e o treinamento de modelos também são quase automáticos. Os cientistas de dados inserem os dados preparados na máquina e depois têm que esperar até que possam validar os resultados. O trabalho dos cientistas de dados não fica mais fácil quando você percebe que existem muitos algoritmos possíveis. Mas, graças a uma espécie de super algoritmo, um sistema com uma ampla variedade de algoritmos controlados pode ser treinado automaticamente para selecionar o modelo de melhor desempenho.
Ciência da decisão
Quando a preparação de dados e a aplicação de algoritmos são altamente automatizadas, voltamos à questão: por que ainda precisamos de cientistas de dados? No entanto, não devemos esquecer que há uma terceira etapa além do desenvolvimento e implantação de modelos. O valor só pode ser criado quando boas decisões são realizadas graças aos dados, haja vista que não são os dados que impulsionam uma empresa, mas as decisões.
Os sistemas inteligentes, portanto, não são inteligentes porque processam dados com eficiência, mas porque tomam as decisões certas. Um carro que dirige sozinho não deve apenas ser capaz de analisar dados, mas também dirigir com eficiência sem colisões.
Chamamos essa extensão da ciência de dados de “Ciência da Decisão”. Refere-se à arte de combinar a ciência de dados e os resultados dos dados com a experiência humana e usando os insights obtidos na prática. Os insights também devem ser traduzidos em decisões que os usuários finais podem aplicar, por exemplo, em processos de negócios. Afinal, os modelos só geram probabilidades e é difícil interpretá-los se você não tiver formação matemática.
A inteligência humana continua sendo crucial
Isso também explica a popularidade dos cientistas de dados. O trabalho não deve parar com a construção de um modelo que automatize um processo. Em muitas empresas, a ênfase ainda recai sobre os dados e a maneira como esses dados são processados. Muito mais importante é a questão do que faremos com os resultados. Os dados são apenas um meio, mas o objetivo do processo é tomar decisões informadas. Enquanto os dados não suportam isso, não podemos dizer que eles geram valor para as empresas ou para as aplicações do nosso dia a dia.
No momento, o potencial da IA ainda é relativamente limitado e geralmente só podemos resolver um problema específico com ele. No futuro, esperamos que a IA possa abordar as situações da maneira que nós, como humanos, faríamos. Vemos a IA como o poder de expandir nossas capacidades humanas, mas não devemos esquecer que hoje o inverso também é necessário: a inteligência humana é essencial para uma boa IA. É o ingrediente secreto que torna a IA verdadeiramente inteligente. Cientistas de dados são, portanto, o elo crucial entre os humanos e a IA.