Como empresas estão mudando a forma de coleta e uso de dados para treinar modelos de inteligência artificial
Startups de IA estão adotando novas abordagens para a coleta de dados, priorizando a qualidade sobre a quantidade.
Empresas de inteligência artificial estão adotando uma nova abordagem na coleta de dados, priorizando qualidade e controle. Ao invés de depender de dados de baixo custo, startups como a Turing estão se dedicando à coleta manual de dados para treinar seus modelos. Essa mudança está ocorrendo em um momento em que a qualidade dos dados se torna um diferencial competitivo.
O trabalho manual na coleta de dados
Taylor, uma freelancer de dados, foi contratada pela Turing para produzir horas de gravações em vídeo, trabalhando com tarefas do cotidiano para treinar um modelo de visão computacional. Ao lado de outros trabalhadores manuais, essa abordagem visa criar um conjunto de dados diversificado e de alta qualidade. Sudarshan Sivaraman, Chief AGI da Turing, enfatiza a importância de ter dados variados na fase de pré-treinamento.
A qualidade dos dados é o novo diferencial
Em vez de simplesmente acumular dados, as startups estão focando em dados curados. Richard Hollingsworth, fundador da Fyxer, uma empresa que usa IA para classificar e responder e-mails, percebeu que a qualidade dos dados é o que realmente define o desempenho do modelo. Isso levou a uma estrutura organizacional onde assistentes executivos, que conhecem as nuances da comunicação, desempenham um papel crucial no treinamento da IA.
A competição por dados de alta qualidade
A coleta de dados não só melhora o desempenho da IA, mas também serve como uma barreira competitiva. A Fyxer, por exemplo, acredita que o trabalho árduo na coleta de dados é uma das melhores formas de se proteger contra a concorrência. Assim, enquanto a maioria das empresas pode construir modelos abertos, a capacidade de encontrar e treinar com dados de alta qualidade é um desafio que distingue as melhores do mercado.
A coleta interna e a atenção à qualidade dos dados são, portanto, estratégias essenciais para as startups de IA que buscam se destacar em um campo cada vez mais competitivo.