Em um momento em que nossa indústria é escandalizada por um provedor de painéis indiciado por vender entrevistados fraudulentos de pesquisas, vem outro provedor que está fazendo quase a mesma coisa com divulgação absolutamente completa. O problema? Eles estão usando a IA para fazê -lo e vesti -lo com frases como “contextualmente relevante” e “estatisticamente válido” e “aprendizado de máquina”.
Aqui estão trechos de seu campo:
Vamos enfrentá-lo-examinar os segmentos de consumidores difíceis de alcance em cronogramas de projeto apertados podem aumentar os custos e aumentar os prazos, criando desafios que até estudos bem projetados lutam para superar. . . . As respostas sintéticas oferecem uma solução promissora. . . . As respostas sintéticas aumentam seu conjunto de dados coletados para preencher estrategicamente lacunas críticas, principalmente ao atingir públicos de difícil acesso, como executivos C-suite, indivíduos de alta rede e outros dados demográficos notoriamente difíceis de acessar que geralmente deixam aspas incompletas. Por exemplo, se o seu estudo exigir respostas de 30 entrevistados de alta rede com mais de 40 anos em uma região geográfica específica, mas você apenas garantiu 20 (nossa oferta) fornece a opção de gerar as 10 respostas restantes com base nos padrões comportamentais de participantes semelhantes.
Qual é a diferença entre respostas sintéticas e técnicas de ponderação padrão? Embora a ponderação simplesmente ajuste os resultados de um estudo existente para torná -los mais representativos para análise, as respostas sintéticas criam novas respostas artificiais que imitam dados reais dos respondentes, usando modelos de aprendizado de máquina. O mecanismo leva em consideração todas as respostas da pesquisa e informações detalhadas do perfil, empregando técnicas avançadas de imputação, para criar respostas que preenchem lacunas de cotas onde falta respostas reais. Essa abordagem aborda efetivamente os desafios de pesquisa, como baixas taxas de resposta ou tamanhos de amostras insuficientes para segmentos de difícil acesso.
Para ser justo, o campo tem o kernel de algo interessante: talvez possamos usar a IA para criar entrevistados da pesquisa sintética que se aproximam de perto como os entrevistados reais responderiam. (Até aqui, Estudos rigorosos Sugira que não possamos.) Talvez possamos reunir modelos de IA e técnicas estatísticas atuais para imputar dados ausentes para aumentar os dados parciais que temos em mãos. (Até onde eu sei, não há evidências credíveis que possamos.)
Mas Yikes. Eles estão “resolvendo” o problema de pequenos tamanhos de amostra simplesmente inflando conjuntos de dados com entrevistados sintéticos. Eles agem como se “validade estatística” envolverem nada mais do que obter amostras maiores que imitam amostras menores.
É claro que existem outras maneiras pelas quais você pode inflar seus tamanhos de amostra e preencher cotas. Você pode fazer isso copiando linhas de dados existentes, contando cada um de seus entrevistados mais de uma vez. Isso seria fraude. Você pode contratar pessoas para fingir que são entrevistados e preencher sua pesquisa, como o fornecedor do painel agora sob acusação. Isso também seria fraude.
Agora, em vez disso, você pode usar a IA para criar linhas adicionais de dados, abrindo -as (em vez de copiá -las) com algoritmos derivados das outras linhas de dados. Voilà. Agora você tem um grande tamanho de amostra, todas as suas cotas estão cheias e seus testes de “significância estatística” passarão.
Hum. Não vou chamar isso de fraude, porque o fornecedor dessa ferramenta é totalmente franco sobre o que está fazendo. Mas até que haja prova de que os dados sintéticos funcionam e em quais contextos eles podem funcionar, a Versta Research recomenda ficar longe desse tipo de “pesquisa” para decisões de negócios.