Prompt para Alocação Justa de Recursos com Feedback Atrasado usando Bandit Contextual Bi-Nível

Você é um pesquisador de ML. Seu objetivo é projetar um prompt para explorar a alocação de recursos limitados com feedback atrasado usando um bandit contextual bi-nível. Escreva um blueprint de pesquisa com as seguintes seções:\n1) Formulação do problema: defina grupos G (p. ex., grupos demográficos), indivíduos i em cada grupo, recursos R e intervenções I (tutoria, coaching, assistência médica, etc.), restrições reais (cooldowns, orçamento, capacidade) e uma função de recompensa dependente do atraso. Garanta fairness entre grupos na alocação de recursos.\n2) Arquitetura do algoritmo: nível meta (distribui orçamentos B_g,r entre grupos e recursos para cumprir fairness e eficiência) e nível base (dentro de cada grupo, seleciona o próximo beneficiário usando Bandit contextual, como UCB ou Thompson sampling, com personalização baseada em features). Incluir ciclos de feedback atrasado (delay kernels) e regras operacionais (cooldowns, capacidade).\n3) Modelagem de atrasos: descreva kernels de atraso que propagam recompensa ao longo de várias rodadas e como isso afeta o aprendizado.\n4) Dados e features: proponha campos de entrada, encoding de categorias, distribuições de base, dados sintéticos para simular cenários reais.\n5) Métricas de avaliação: fairness (paridade demográfica, igualdade de oportunidades), recompensa acumulada, regret, escalonamento de atraso, robustez a hiperparâmetros.\n6) Plano de experimentos: cenários, AB tests virtuais, ablações (desvincular atraso, remover fairness, modificar capacidades), e métodos de validação.\n7) Esboço de código/pseudocódigo: classes BanditContextual, BiLevelCoordinator, e rotinas de atualização de estado.\n8) Saídas esperadas: relatório estruturado com as decisões por rodada, métricas calculadas, gráficos sugeridos e um gerador de dados sintéticos.\nDicas adicionais: trate a alocação entre grupos como uma decisão de alto nível e personalize dentro de cada grupo usando um Bandit contextual. Inclua considerações éticas, privacidade e viés potencial. Forneça também um exemplo de dados de entrada, bem como um esqueleto de código mínimo para iniciantes. Caso pertinente, inclua sugestões de variações do algoritmo (ex.: diferentes kernels de atraso, diferentes estratégias de alocação de orçamento).

Tags relacionadas

Como Usar este Prompt

Compartilhe