Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Basta ler o jornal e, antes de tudo, é um bom artigo! Eles realmente foram e fizeram o pré-treinamento até o pós-treinamento a jusante. Os modelos são pequenos, mas em comparação com trilhões de LLMs de tokens, os dados de célula única não são tão grandes. Manter o arco do modelo foi inteligente. MAS... Aqui está a coisa. Não é uma grande mudança na forma como o campo faz as coisas. Nem uma demonstração de novas capacidades ou uma mudança paradigmática na precisão / recall. A realidade de tudo isso é que os dados de expressão gênica, mesmo no nível de uma única célula, têm suas limitações. A maior parte do sinal virá de genes diferencialmente expressos: você provavelmente não precisa fazer LLMs para extrair boas hipóteses. Portanto, este é um avanço incremental.
Mas, vamos supor que haja algum sinal oculto que só pode ser extraído com contexto relevante, perfeito para LLMs. Suponha que você crie um modelo que você acha que pode extrair essas informações. A questão-chave é: como você testa isso em escala? Como faço para validar que este modelo está encontrando coisas interessantes que eu não poderia ter encontrado usando métodos mais simples? Este é o verdadeiro desafio e apenas fazer um punhado de experimentos não provará isso.
Suponha que você faça esses experimentos de validação em escala, gaste muito $$, espere muitos meses... E você percebe que o modelo não é tão bom em comparação com a linha de base quanto você pensava, e agora? Você faz outra rodada de treinamento experimental em grande escala e repete? Isso é caro! É muito mais caro do que o LLM padrão, onde você pode ELO/classificar seu caminho em arenas de bate-papo e dados do usuário.
E *isso* é por que mover a agulha na biologia é tão difícil. O ciclo de feedback experimental simplesmente mata você. E se você está projetando terapêuticas? O loop se torna ainda mais longo, anos ou décadas, mesmo se você quiser medir pontos finais verdadeiros.
Essa é a amarga lição da biologia: o ensaio é rei, a cabeceira é rei - os métodos computacionais só o levarão até certo ponto sem extensas validações experimentais. Acredito no fundo do meu coração que há algo em torno disso, mas quem decifrar esse código vence.
Melhores
Classificação
Favoritos

