Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Crémieux
Eu escrevo sobre genética, métricas e demografia.
Leia meus textos longos em https://t.co/8hgA4nNS2A.
Um amigo viu meu sucesso com a cirurgia a laser nos olhos e recomendou para um amigo
Ele estava ferido
Ele surtou quando o cirurgião colocou as colírias, tentou sair do assento reflexivamente e bateu o olho no sistema de laser
Não foi exatamente culpa do LASIK, mas ele ainda assim se machucou!

Crémieux14 de fev. de 2026
I still can't believe this worked as well as it did.
Doctors put me under a laser for less than 20 seconds and now I have perfect vision all day.
No glasses, no contacts, no dryness, just great vision without any hassle.
I love technology!
20
Eu *acho* que descobri a maior parte do que Horvath fez para obter seus resultados que ele não explicou.
Vou explicar usando as notas dele em Matemática do 4º ano.
Peguei o gráfico dele e digitalizei, o que gera um pequeno erro porque a resolução do gráfico estava um pouco baixa. O erro aqui é pequeno. Depois, procurei programaticamente a especificação dele. Cheguei bem perto ao alternar entre as possibilidades.
Igualei a inclinação e meu RMSE nos pontos era pequeno antes do suposto ponto de inflexão digital. Depois, ficou um pouco maior, porque não está tão claro exatamente o que ele fez. Mas para chegar tão perto quanto cheguei, tive que:
- Pontuação de caixa por tempo de evento de 2 anos em relação aos anos de inflexão declarados
- Excluir 2022 (que ele apenas teoricamente, mas não estatisticamente, justificou)
- Cortar as caixas mais externas da Flórida
- Usar o tempo de evento como x em vez do ponto médio do bin
Isso mostra exatamente a inclinação dele: 1,08 antes da inflexão digital e -0,28 depois.
Mas e se desfazermos todas as decisões arbitrárias que tivemos que usar para chegar até aqui?
Se usarmos pontos médios de bin em vez de tempo médio de evento, passamos para 1,06/-0,27. Não tem grande efeito. Se incluirmos as caixas de postes da Flórida na encosta, vamos para +1,08/-0,33. Se incluirmos 2022, vamos para +1,08/-0,76. Se incluirmos a Flórida 1992/1996, obtemos +1,08/-0,28. Se mantivermos N = 1 bins em vez de descartá-los (o que não deveríamos fazer, porque são confiáveis já que são estados inteiros!), chegamos a +1,05/-0,25. E se dividirmos os pontos médios e todos os compartimentos de postes, obtemos +1,06/-0,33.
Se combinarmos essas coisas e conduzirmos a análise mais sensata disponível para nós com base nos dados, obteremos +1,04/+0,10, uma redução da inclinação com certeza, mas o que esperávamos afinal? Se a tendência pré-tendência tivesse se mantido, a extrapolação seria de 256,3 pontos, o que é maior do que qualquer estado individual já obteve.
A tendência pré-tendência de +1,08/ano não é um contrafactual plausível. Na verdade, é uma tendência de recuperação das décadas de 1990 a 2000 que já estava desacelerando (olhe!) antes de qualquer estado adotar o ensino digital. Extrapolar isso para frente e tratar isso como evidência real de uma lacuna ou 'perda' é atribuir um efeito teto à EdTech.
Além disso, a verdadeira chave do erro de Horvath é esta:
Ele mexeu nos dados até encontrar um desenho que apenas recapitula tendências nacionais, independentemente da causalidade! 76% dos estados têm anos de inflexão em 2014-16, e ele cortou as entradas mais distantes (FL/TX), então centrar no ano de inflexão e fazer a média entre estados é quase idêntico a centrar em 2015 e fazer a média. A pré-tendência é a melhora nacional do NAEP dos anos 1990 até meados dos anos 2010, e a pós-tendência é a estagnação e declínio nacional, e os testes de permutação confirmam isso: a mudança aleatória dos anos de inflexão entre estados apresenta o mesmo padrão!
Na verdade, Horvath tomou decisões que efetivamente garantiram que seu resultado acabaria sendo apenas uma repetição das tendências nacionais ao reduzir seu poder com a exclusão de FL e TX, e a consequente eliminação de 36% da variação nas datas de inflexão.
Esta não é uma análise crível de forma alguma. A única análise realmente confiável é o estudo de controle sintético da Flórida. É a única análise que identifica variação porque a Flórida adotou em 2011, quatro anos antes da maior parte do país. E a Flórida *superou* seu controle sintético após a adoção!
Todas as outras análises que você pode fazer aqui, desde um TWFE, até testes de permutação, análises dose-resposta de todos os tipos, são fundamentalmente limitadas por terem apenas 49/51 jurisdições em um período de 4 anos. (Isso é um grande problema para todo tipo de análise que usa apenas os 50 estados dos EUA + D.C. Eles são muito fracos!)
A construção não complicada que usei, onde tudo é sensato, direto e não ad hoc (sempre teste!), retorna nulos e possivelmente até resultados positivos. E os métodos analíticos de Horvath? Bem, eles simplesmente não conseguiam sustentar suas conclusões, mesmo que ele não tivesse mexido.
Conselho para outros analistas: nunca construa seu caminho até um resultado. Apenas use a limpeza básica de dados e os testes mais simples que você conseguir executar. Você não precisa ser sofisticado, ou pode acabar tão confuso que recoloca uma versão transformada dos seus dados observados e chama mudanças ilusórias de tendência de 'evidência causal'.


Crémieux18 horas atrás
1. Este artigo não forneceu os dados que afirmou ter.
2. Há muitos pontos de dados, dado o quanto o NAEP foi aplicado.
3. Não consegui replicar esse resultado.
4. Tive o resultado oposto, se é que tive algo.
5. Eu REALMENTE forneci meus dados E meu código🧵

795
Melhores
Classificação
Favoritos