Investimento em Data Science: como obter mais retorno?

Neste artigo você vai ver:

O investimento em Data Science e sua relação com a produtividade de uma empresa é um tema a se explorar e investigar. Contra o que o senso comum poderia pensar, a relação entre investimento e produtividade é paradoxal.

“Você pode ver computadores em toda parte, menos nas estatísticas de produtividade”, frase do economista norte-americano Robert Solow (*), que foi utilizada para explicar o que ficou conhecido como o paradoxo da produtividade. 

Em outras palavras: investe-se muito em tecnologia, mas o retorno sobre este investimento é questionável. Por outro lado, quando falamos em Data Science (ciência de dados), ter retorno sobre o que foi investido pode ser ainda mais desafiador.

Já aviso que o artigo é um pouco mais longo, porém garanto que vale a leitura!

O que é o paradoxo da produtividade?

O paradoxo da produtividade é o fenômeno pelo qual a produtividade do trabalho não aumenta proporcionalmente à crescente quantidade de capital investida na economia. Esse paradoxo foi primeiramente identificado pelo economista Robert Solow, que ganhou o Prêmio Nobel de Economia em 1987.

De acordo com Solow, a produtividade do trabalho é determinada por dois fatores: a quantidade de capital da classe trabalhadora (como máquinas e equipamentos) e a tecnologia disponível.

Ele argumenta que, enquanto o aumento do capital por pessoa pode ter um impacto positivo na produtividade, o impacto é geralmente menor do que o esperado. Isso deve-se ao fato de que a maioria dos ganhos de produtividade vem da inovação tecnológica.

O economista também observou que, mesmo quando a quantidade de capital por indivíduo trabalhador aumenta, a produtividade não necessariamente acompanha esse crescimento. Isso ocorre porque o aumento do capital por pessoa pode levar a uma diminuição na produtividade, se esses indivíduos não estiverem capacitados ou se a tecnologia não estiver sendo utilizada de maneira eficiente.

Além disso, Solow argumentou que, em economias avançadas, a maioria dos ganhos de produtividade vem de inovações tecnológicas que não podem ser facilmente medidas pelo aumento do capital de pessoas trabalhadoras. Ele denominou esses ganhos de “produtividade residual” e argumentou que eles são responsáveis por grande parte do crescimento econômico.

Em resumo, o paradoxo da produtividade indica que a produtividade do trabalho não aumenta proporcionalmente à crescente quantidade de capital investida na economia. Isso ocorre porque a maioria dos ganhos de produtividade vem de inovações tecnológicas e não podem ser facilmente medidos pelo aumento do capital individual.

Estatísticas versus Realidade

A compreensão desses fatores é crucial para entender o crescimento econômico e para formular políticas e estratégias para aumentar a produtividade.

A partir desses dados, surge a indagação natural de quanto, neste período, esse investimento em tecnologia trouxe aumento na produtividade e lucratividade das empresas. A constatação é constrangedora: “não há nenhuma evidência de que a informática trouxe algum aumento na produtividade do setor terciário nestes 40 anos” (Wainer, 2003). 

Segundo Gideon Marinho Gonçalves em artigo publicado em Abril/2018, o Paradoxo da Produtividade despertou interesse Robert Solow, justamente pela grande quantia investida pelas organizações em TI.

De acordo com o Department of Labor Statistics – DLS (Departamento de Estatísticas do Trabalho) dos Estados Unidos da América, “a soma de todos os investimentos em computadores no país, entre 1960 e 1998, foi de 500 bilhões de dólares” (Wainer, 2003); em softwares gastou-se 1 trilhão de dólares; e em comunicação gastou-se também 1 trilhão de dólares. 

Considerando-se as substituições em decorrência de obsolescência o valor acumulado em 1998 dos bens de computadores era de 228 bilhões de dólares, e em software 250 bilhões de dólares (Wainer, 2003).

Data Science e produtividade

No artigo “Artificial Intelligence and the Modern Productivity Paradox: A Clash of Expectations and Statistics”, os autores Erik Brynjolfsson, Daniel Rock e Chad Syverson  falam sobre a contradição existente entre, por um lado, o surgimento de novas tecnologias que têm o potencial de impactar economias e o bem-estar, cujos primeiros resultados já se mostram bastante animadores como é o caso da Inteligência Artificial (IA). 

Certamente é mais produtivo criar um texto no computador e ainda mais produtivo executar a mesma tarefa utilizando uma tecnologia como o GPT-3 como acelerador – tecnologia esta que está por trás do tão falado Chat GPT.

Por outro lado e de acordo com as estatísticas, tem-se a constatação de que a produtividade geral diminuiu significativamente na última década. Uma grande desaceleração que reduziu o crescimento da produtividade pela metade ou mais comparado ao seu nível na década anterior.

Este fenômeno foi observado pela Organização para a Cooperação e Desenvolvimento Econômico (OCDE) e, agora mais recentemente, também entre muitas grandes economias emergentes (Syverson, 2017).

Para compreender melhor, os autores do artigo argumentam sobre as possíveis explicações para o fenômeno da desaceleração:

Tecnologia não tão promissora

As novas tecnologias talvez sejam menos promissoras do que parecem. Essa hipótese está associada à pesquisa de alguns economistas, especialmente Robert Gordon, que em livro publicado (“The Rise and Fall of American Growth”), argumentou que as inovações associadas à Terceira Revolução Industrial, como computadores e smartphones, tiveram impacto bem menor na produtividade que as invenções da Segunda Revolução Industrial, como eletricidade e o motor de combustão interna.

Erros de mensuração

Os ganhos de produtividade decorrentes das novas tecnologias não estão sendo capturados nas estatísticas devido a erros de mensuração. Várias inovações que beneficiam pessoas consumidoras estão relacionadas a serviços intangíveis ou que são ofertados de forma gratuita. É possível, portanto, que não sejam capturadas no PIB dos países e, consequentemente, nos dados de produtividade.

Pouco impacto na produtividade

Os efeitos positivos das novas tecnologias talvez estejam sendo capturados por poucas empresas e, dessa forma, tenham pouco impacto na produtividade agregada. De fato, existem evidências de que a distância entre a produtividade de empresas na fronteira tecnológica e as demais aumentou nos últimos anos.

Defasagem temporal

No entanto, profissionais de pesquisa consideram uma quarta explicação como a mais provável causa do paradoxo: a de que existe uma defasagem temporal entre o surgimento de uma tecnologia e seu efeito na produtividade. 

É o que ocorre no caso de tecnologias que afetam a economia de forma profunda e disseminada, conhecidas como general purpose technologies. Essas inovações exigem mudanças profundas na forma de organização das empresas e no ambiente regulatório para que seu potencial seja plenamente explorado.

O mercado e investimento em Data Science

Os investimentos em Data Science têm aumentado significativamente nos últimos 10 anos independente da desaceleração da produtividade. De acordo com dados do mercado, as empresas e pessoas investidoras gastaram bilhões de dólares em tecnologias e soluções de Data Science, incluindo armazenamento, processamento, análise e visualização de dados.

As principais razões para o crescimento dos investimentos em Data Science já são conhecidas: big data – muitos dados jorrando para todos os lados! E as empresas obviamente estão buscando formas de obter insights valiosos a partir desses dados para melhorar suas operações e tomar decisões.

Além disso, a popularidade de ferramentas de análise de dados, como o R e o Python, tornou mais fácil e acessível para que as empresas desenvolvam e implementem soluções de ciência de dados. 

A popularidade de ferramentas de visualização de dados, como o Tableau, Qlikview e o Power BI também cresceu, pois permitem que as empresas explorem e compartilhem insights de forma mais fácil e intuitiva.

Os investimentos em Data Science também foram impulsionados pelo crescimento de empresas de tecnologia como Amazon, Google e Microsoft. Essas empresas oferecem soluções e ferramentas baseadas em cloud

A popularidade de tecnologias como inteligência artificial (IA) e aprendizado de máquina (ML) também contribuíram para o crescimento dos investimentos, pois são fortemente dependentes de grandes conjuntos de dados para serem treinados e operarem. Vale a pena conferir alguns dados desse contexto:

  • Segundo relatório publicado pela The Business Reserach Company, o tamanho do mercado global de inteligência artificial crescerá de US$ 56,89 bilhões em 2022 para US$ 73,38 bilhões em 2023 a uma taxa composta de crescimento anual (CAGR) de 29,0%.
  • Outro relatório publicado pela Acumen & Research Company aponta que o tamanho do mercado global de data analytics representou US$ 31,8 bilhões em 2021 e deve atingir um tamanho de mercado de US$ 329,8 bilhões até 2030, crescendo a um CAGR de 29,9% de 2022 a 2030.

Quer continuar mergulhando no universo de Data Science? Temos um Zup Open Talks sobre “Data Science: onde estamos e quais são os desafios com Fabiane Nardon”. Aproveite para assistir depois do artigo!

Dados entrando e dinheiro caindo da mesa…

A relação entre investimentos em Data Science, aumento da produtividade e retorno sobre investimento é complexa e pode variar de acordo com a empresa e o setor. De uma forma geral, é esperado que o investimento em Data Science possa ajudar as empresas em duas camadas: 

  • Camada estratégica: investimentos feitos na camada estratégica, via de regra estão mais focados em resultados obtidos no longo prazo. A ideia é potencializar resultados tornando a empresa mais competitiva em seu marketplace (diferencial competitivo).
  • Camada tático/operacional: investimentos na camada tático/operacional tem por objetivo a intervenção direta em eficiência focando em processos específicos de negócio, sem se limitar a ele, mas também gerando efeitos colaterais em áreas e processos correlatos ou interdependentes.

A ideia é incentivar as empresas a serem mais produtivas e economicamente bem-sucedidas, ao fornecer insights valiosos a partir dos dados, que podem ser usados para melhorar operações, automatizar tarefas e tomar melhores decisões. 

No entanto, segundo uma pesquisa do Gartner, 80% dos insights analíticos não fornecerão resultados de negócios até 2022.

Investimento em Data Science e GAPs

Em geral, é importante que as empresas tenham uma estratégia clara do que se espera fazer e obter com seus projetos e produtos de dados, bem como, para implementar tecnologias baseadas em Data Science. 

Sem visão clara do resultado que se espera obter, a possibilidade de ter dinheiro caindo da mesa é grande, mas esse é o primeiro passo. Portanto, a falta de objetivos claros e uma definição inadequada do problema podem impedir que a iniciativa seja bem-sucedida. 

Embora existam, sem dúvida, histórias de sucesso, também há muitas evidências de que investimentos substanciais em ciência de dados não estão gerando os retornos esperados para a maioria das organizações. Nós sabemos isso!

Existem várias causas, mas elas decorrem normalmente de duas fontes principais:

  • Abordagem da arquitetura da informação do século 20 para lidar com o novo cenário de dados do século 21;
  • Falta de conhecimento e suporte organizacional para ciência e análise de dados.

Principais GAPs

Investigando um pouco mais os detalhes das causas de fracasso em iniciativas de Data Science, também é possível encontrar alguns GAPs que as empresas precisam revisitar para obter melhores resultados:

  • Conhecimento sobre dados: para permitir melhores decisões, cientistas de dados precisam de um bom entendimento do domínio de negócios para permitir uma melhor compreensão do problema.
  • Conhecimento na área de TI: é raro ver processos de TI projetados para dar suporte a processos analíticos avançados.
  • Conhecimento tecnológico: grandes empresas tendem a se concentrar nas tecnologias de big data usadas para criar aplicativos. Eles são obcecados por Kafka, Spark e Kubernetes, mas falham em fornecer a cientistas de dados acesso suficiente aos dados, bibliotecas de software e ferramentas de que precisam.
  • Uso de dados na camada de liderança: a maioria das pessoas executivas C-suite não parece entender a ciência de dados, embora tendem a ter domínio de data ou mesmo alfabetizadas em TI. A ciência de dados é real. Seus benefícios são reais. No entanto, uma estratégia de IA sozinha não consertará magicamente produtos ruins, marketing ineficaz e processos quebrados que têm problemas profundos.
  • Data literacy (intimidade com dados): a ausência de data literacy avançada é o motivo pelo qual a democratização dos dados encontra limites. Embora mais informações sejam melhores do que menos, mover dados de uma planilha do Excel para uma ferramenta visual de Business Intelligence (BI) não levará automaticamente a melhores decisões.
  • Falta de suporte: contratar pessoas brilhantes e deixá-las agregar valor aos negócios é uma receita para o fracasso. O gerenciamento de dados e a ciência de dados não são mutuamente exclusivos. O gerenciamento correto torna a ciência de dados mais eficaz. O gerenciamento de dados errado sufoca.

Fato é que, se não há retorno comprovado, padrões ou modus operandi ultrapassados são continuamente reforçados por uma simples questão de “vamos evitar riscos errando onde já estamos acostumados”.

O que fazer para estar na parte boa das estatísticas?

Não existe uma fórmula mágica e tampouco um modelo pronto. Para empresas que já nasceram 100% digitais talvez alguns destes GAPs ou problemas sejam muito menores ou simplesmente não existem. 

Mas para empresas que possuem desafios mais contundentes de dados em aplicações legadas, produtos concebidos sem considerar data-by-design e arquitetura de referência pronta para uma boa revisão, pode ser que uma iniciativa em Data Science se torne algo como viver um dia de cada vez. 

Passar mais tempo em manter e ter um orçamento que não privilegia a inovação com dados, além de não ter uma comprovação clara de resultado é uma dura realidade em muitas áreas de dados de muitas empresas.

No entanto, já existem alguns painkillers (analgésicos) para as dores atuais e alguns caminhos mais efetivos para aumentar as chances de sucesso de suas iniciativas em Data Science. Conheça algumas delas:

Visão estratégica 

Comece com um objetivo claro e que de preferência esteja conectado de forma explícita a um objetivo estratégico da empresa. Quer dizer: defina claramente o escopo e a métrica com a qual deseja trabalhar. 

Por exemplo: criar uma solução de dados que faça uma recomendação de conteúdo para clientes de um site de notícias. A taxa de assertividade na recomendação utilizando a solução atual é de 65% e a taxa almejada pela nova solução é de 95%. 

Determine o valor e a viabilidade

O que significa em termos de retorno para a empresa um aumento na taxa de assertividade? É um problema que tem que ser resolvido efetivamente com Data Science ou é algo que pode ser resolvido de outras maneiras? 

Iniciativas de Data Science costumam demorar um pouco mais para gerar resultados. Essa área requer pessoas, processo e tecnologia mais especializados e o anseio por resultados rápidos podem frustrar empresas e times.

Determine o processo de negócio

Iniciativas em Data Science costumam gerar valor em duas camadas:

1) camada estratégica onde garantem diferencial competitivo para empresa;

2) camada tático-operacional onde incremental eficiência para um processo específico podendo reverberar em procedimentos correlatos ou inter-relacionados. 

Quanto mais estratégica a iniciativa, mais long run pode se tornar a jornada, porém o prêmio também é maior.

Ter atenção ao escolher a solução

Cuidado ao escolher a solução ou o conjunto de soluções utilizadas para a iniciativa. Um lock-in com uma plataforma pode ser fatal, por exemplo, quando estamos falando de uma iniciativa que tem por missão estabelecer os alicerces para um modelo de negócio mais data-driven. Sua habilidade para inovação é diretamente proporcional a sua habilidade para testar, pilotar e perseverar em suas iniciativas de Data Science.

Estratégia de dados

Muita atenção para este ponto: não ter uma estratégia clara de dados pode colocar tudo a perder. Para quem não sabe onde quer chegar, todo caminho serve, não é mesmo? Se tratando de dados, a possibilidade de se escolher um caminho que vai gerar mais confusão e mais re-trabalho é grande. Não deixe assuntos como governança de dados para depois, aplique esse processo desde o início.

Build and run

Criar um produto de Data Science é desafiador! Em contrapartida, mantê-lo relevante no que se refere a geração de resultados para a sua empresa é ainda mais! Dependendo das suas escolhas em investimento em Data Science, em algum momento, seu time pode passar mais tempo no “manter” sem tempo para evoluções. 

Técnicas de aceleração do pipeline de dados (DataOps) e do pipeline de Machine Learning (MLOps) são bem-vindas. Ter parceiros que te auxiliam na aceleração do Build and Run alivia e muito o esforço cognitivo dos times técnicos.

Monitoramento e avaliação periódica 

Não basta criar novas soluções, como já foi dito, é importante mantê-las saudáveis e gerando resultado. Tenho um processo de feedback loop claro e formalizado. Trate dados como produto e evolua continuamente.

Sobre a Zup

A Zup ajuda sua empresa com serviços profissionais de diagnóstico e criação de estratégia de dados. A ideia é ajudar CIOs, CTOs e CDOs a conectarem seus projetos e produtos de dados aos indicadores estratégicos da empresa, passando pela identificação de GAPs, criação e introdução de um modelo de seleção de iniciativas, potencializando o retorno sobre o seu investimento em Data Science. 

Nosso time está qualificado para atuar diretamente com suas equipes técnicas em diversas fases do ciclo de vida dos dados, garantindo uma visão robusta de dados como produto (product mindset) gerando impacto direto em suas iniciativas estratégicas e/ou tático-operacionais relacionadas à Data Science.

Apêndice

Quem foi Robert Solow?

Robert Solow é um economista americano criador do Solow-Swan Model ou Modelo de Crescimento Exógeno (influenciado por forças externas). Este modelo econômico de longo prazo se baseia na acumulação de capital, crescimento da mão-de-obra ou da população e, por fim, incremento na produtividade altamente influenciado pelo progresso tecnológico. 

A principal suposição do modelo de crescimento de Solow-Swan é que o capital está sujeito a retornos decrescentes em uma economia fechada:

  • Se você mantém um estoque fixo de mão-de-obra, o impacto sobre a produção da última unidade de capital acumulada será sempre menor do que a anterior; 
  • Se você não investe em tecnologia e inovação nem em mão-de-obra qualificada (educação especializada), os rendimentos em algum ponto começam a decrescer tornando a quantia de capital produzido suficiente apenas para compensar a quantidade de capital existente perdida devido a depreciação. Resumindo: a economia para de crescer;
  • Ocorre então que, no curto prazo, a taxa de crescimento diminui à medida que os retornos decrescentes entram em vigor e a economia converge para um “estado estacionário” com uma taxa de crescimento constante, portanto nenhum crescimento econômico per capita.

Se ainda assim o progresso tecnológico for diferente de zero e a isto também supõe-se um crescimento não nulo da força de trabalho, em termos de “trabalho efetivo” significa que um novo estado estacionário é alcançado com produção constante por hora de trabalho necessária para uma unidade de produção. 

No entanto, neste caso, a produção per capita cresce à taxa do progresso tecnológico no “estado estacionário”. Dessa forma, isso culmina-se num cenário de estagnação da produtividade mesmo com investimentos em tecnologia e mão-de-obra. 

É o famoso “não adianta aumentar o time, porque não vai sair em maior quantidade ou mais rápido”, porque a alta-disponibilidade de recursos operando no mesmo espaço do problema não produz resultados tão diferentes ou melhores.

Referências

Erik Brynjolfsson, Daniel Rock & Chad Syverson, 2017, Artificial Intelligence and the Modern Productivity Paradox: A Clash of Expectations and Statistics. 

Gordon, 2016, The Rise and Fall of American Growth. 

Productivity paradox – Wikipedia

O Paradoxo da produtividade 

WAINER, Jacques. O Paradoxo da Produtividade. In: RUBEN, Guilhermo; WAINER, Jacques; DWYER, Tom. (Organizadores). Informática, Organizações e Sociedade no Brasil. São Paulo: Cortez, 2003.

Imagem com “Data Science” em destaque em um fundo azul com elementos que remetem a dados, como engrenagens e gráficos. Apontando para o título, está uma mão de uma pessoa branca.
Foto de Carlos Ferraiuolo
Data Director
Data Director na Zup, com passagem por grande empresas de varejo do Brasil e do mundo. Especialista em soluções e produtos que envolvam utilização de dados e inteligência artificial para tomada de decisão em ambientes críticos. É um nerd, mas ao mesmo tempo pragmático quando o assunto é inovação, criação de times de alta performance, ESG em sistemas complexos e organizações exponenciais.

Este site utiliza cookies para proporcionar uma experiência de navegação melhor. Consulte nossa Política de Privacidade.