As origens
Em algum momento de 2006 o matemático britânico Clive Humby cunhou aquela que passaria a ser uma das mais emblemáticas frases sobre o mercado de dados: “Data is the new oil” ou “Dados são o novo petróleo”. Assim como o petróleo teve papel fundamental na economia após a Segunda Revolução Industrial, os dados passam a ganhar cada vez mais relevância e notoriedade das empresas, principalmente a partir da segunda década do século XXI.
Mas o que fez os dados ganharem tanta relevância a ponto de serem comparados à commodity mais dinamicamente negociada do mundo? Grande parte está associada à própria geração de dados, que se tornou mais abrangente e democrática à medida que a internet passou a ser acessível para uma parcela maior da sociedade.
Se analisado o número de acessos à internet móvel de banda larga no Brasil no ano de 2023, percebe-se um crescimento de 78% quando comparado há 10 anos, no ano de 2013. Ao mesmo tempo, viu-se o segmento de compras online expandir o seu faturamento em um crescimento constante de 15%, em média.
Nesse cenário, principalmente a partir da segunda década dos anos 2000, houve uma explosão de possibilidades de coleta de dados, já que enquanto no varejo físico – por exemplo – a loja geralmente está limitada a coletar os dados de quantidades vendidas ou de pessoas que entram na loja caso esta trabalhe com algum sensor na porta de entrada, no e-commerce a loja pode conseguir coletar dados até mesmo sobre quanto tempo um possível comprador ficou na página de venda de um de seus itens, podendo usar esses dados posteriormente para melhorar a sua estratégia de preços ou de campanhas de publicidade.
É importante destacar que assim como toda nova tecnologia, o custo é muito alto nos primeiros anos de vida e com as ferramentas de dados não foi diferente, com o uso em larga escala restrito a um pequeno grupo de organizações, como a IBM e o seu revolucionário Watson. A popularização mesmo inicia por volta de 2017-2018, com destaque para o escândalo da Cambridge Analytica e o uso político dos dados pessoais de usuários do Facebook para intervir nas eleições presidenciais dos Estados Unidos e para a implementação da Regulamento Geral sobre a Proteção de Dados (GDPR), regulamentação que no Brasil passaria a ter como equivalente a Lei Geral de Proteção de Dados Pessoais (LGPD), publicada em 2020.
O profissional de dados
Dado o contexto, surge então a necessidade do profissional capaz de transformar todos esses dados em informações relevantes, uma formação que a academia ainda não disponibilizava formalmente. Com isso, uma explosão de cursos livres sobre Data Science chegou ao mercado e uma onda de migração de carreira, sobretudo de profissionais das ciências exatas, engenharias ou tecnologia para se qualificarem nesse segmento muito aquecido.
À medida que novos profissionais eram formados no mercado e a tecnologia seguia em constante evolução ascendente, como o crescimento do mercado de streaming brasileiro em 2019 que recebeu novos players como Amazon Prime Video e AppleTV+, a cultura “data driven” se consolidava e a busca por profissionais pelas empresas disparou. Já no início de 2020, com a chegada da pandemia causada pelo coronavírus e a necessidade do isolamento social que forçou empresas majoritariamente físicas a também atuarem no segmento online, fez que a busca pelo profissional de dados que já estava alta crescer mais ainda, assim como por outros profissionais de tecnologia como desenvolvedores de software e designers de interface.
A pandemia acabou, mas as mudanças de hábito permaneceram na sociedade e a tecnologia não parou de se desenvolver, desde os relógios inteligentes que usam de análise de dados para exibir as estatísticas do seu exercício físico diário, do algoritmo da sua plataforma de streaming que sugere a série ou filme baseado no seu histórico de consumo recente ou daquele anúncio que é exibido para você na rede social após você ter buscado por um item semelhante. Todos esses exemplos são casos em que um profissional da área de dados certamente esteve envolvido no desenvolvimento dessa funcionalidade, aplicando métodos estatísticos nos dados históricos para ser capaz de realizar as predições e entregar a melhor experiência para o consumidor.
E o que esperar do futuro?
Segundo o instituto de pesquisa Gartner, com base em dados até 2020, é possível estimar que haja um total de 40 trilhões de gigabytes de dados no mundo, o que significa 2,2 milhões de terabytes sendo gerados todos os dias. E é baseado nessa imensidão de dados que surgiram as chamadas inteligências artificiais generativas, que é o caso do ChatGPT lançado em 2022 e capaz de gerar novas informações de maneira original que evolui constantemente por conta própria, sem necessidade de intervenção humana, indo muito além dos modelos de machine e deep learning muito utilizados até então.
Com a chegada do ChatGPT e de outras inteligências generativas no mercado, o que se pode esperar para o futuro é a contínua evolução altamente veloz no uso dos dados, mas também com preocupações sobre o quanto a inteligência artificial substituirá o trabalho de humanos tal qual as máquinas fizeram na Revolução Industrial. Um estudo da Universidade de Princeton, por exemplo, revelou o alto risco que as profissões de operador de call center e professor de língua e literatura, além de muitas outras, tendem a serem extintas, ao passo que em outras profissões a mesma tecnologia tende a atuar como uma aliada do profissional humano no dia a dia.