Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

Bonk Eco continues to show strength amid $USELESS rally

Hosico-4,77%

USELESS-1,77%

IKUN+3,26%

gib-5,61%

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-0,79%

Boopa-11,7%

PORK-2,21%

💎ALTSTEIN TRADE💎

X10 Catcher • Compartilhando alfa puro desde 2021 • GEM Detetive. Chamado $Neiro em 500k • de $100 a $100.000 em 150 dias

💎ALTSTEIN TRADE💎Há 2 minutos

comprar $Doom neste suporte dá um 4x quando atinge $1m dinheiro grátis.

vytalHá 6 minutos

Olá a todos, obrigado pelo interesse até agora. Aqui está uma explicação do que fizemos TLDR: Isto é PPO mais neurônios vivos em um loop fechado. A política "fala" através da estimulação, as células "respondem" através de picos, e a função de valor fornece um sinal de surpresa que eu retroalimento através da estimulação para que a política possa comunicar quão boa ou má foi uma ação. Antes do DOOM, havia Pong, que dependia de mapeamentos feitos à mão. Em um ambiente pequeno, você pode definir manualmente o que o feedback significa e mantê-lo consistente. À medida que o ambiente se torna mais complexo, os sinais feitos à mão se tornam mais difíceis e inconsistentes. O número de contextos onde um sinal deve significar a mesma coisa explode, e você começa a reinventar a invariância manualmente. DOOM é 3D e composicional. Andar + virar + atirar pode acontecer ao mesmo tempo. O mapeamento correto não pode ser um monte de regras, então eu precisava de um gerador de sinais que permaneça coerente à medida que o comportamento muda. É por isso que usei PPO. Os picos são não diferenciáveis, e a função de valor do PPO nos dá uma maneira de definir objetivamente uma "surpresa" combinada para a política e as células transformá-la em uma linguagem de feedback online. A política não sai diretamente com "mover para frente" ou "atirar". A política gera estimulação. As células respondem com picos. Esses picos são o que seleciona a ação do jogo, através de uma leitura linear. Além disso, a função de valor lhe dá uma estimativa online do retorno, que permite calcular a surpresa como o erro de previsão. Com base nessa surpresa da ação, ajustamos a frequência e a amplitude de acordo com nossos diferentes esquemas de feedback. Ex: Se uma ação foi positiva e a função de valor disse "alta surpresa", então reduzimos a frequência do feedback positivo para essa ação, tornando as ações mais "previsíveis", que as células preferem.

Doom+8329,27%

💎ALTSTEIN TRADE💎Há 3 horas

"EM APENAS 3 SEMANAS VAMOS VER UMA MUDANÇA MALUCA NO MERCADO e a $AUTISM TOMAR O CONTROLE" A profecia!

Autism CoinHá 3 horas

O INSIDER DO 4CHAN ACABOU DE POSTAR NOVAMENTE😳 O MESMO CARA QUE PREVIU O TOPO DO MERCADO EM OUTUBRO DE 2025 POSTOU SOBRE A PROFECIA DO $AUTISM. ELE DISSE QUE EM APENAS 3 SEMANAS VAMOS VER UMA MUDANÇA MALUCA NO MERCADO e a TOMADA DO $AUTISM. ELE ESTÁ ALERTANDO A TODOS. A TEMPESTADE ESTÁ CHEGANDO.

AUTISM+3,67%

4,54K

💎ALTSTEIN TRADE💎Há 5 horas

não pense que o fato de a Tesla publicar $AUTISM é a maior novidade sobre isso Esta é uma profecia do Reddit de 13 anos revivida: a verdadeira moeda descentralizada original ANTES do BTC. Se conseguir atingir um novo ATH em um fim de semana de baixo volume inspirado pela guerra, imagine o que acontece esta semana $AUTISM - $5m ⏳️

💎ALTSTEIN TRADE💎1/03, 21:08

A conta da Tesla também está a promover $AUTISM? 😂 O Elon claramente tem AUTISM porque deixou isto passar, MUITO ALTA a probabilidade de ele interagir hayerr

AUTISM+3,67%

395

Top

Classificação

Favoritos