Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Mener des recherches à @PrimeIntellect
La prochaine génération de startups de produits valorisés à plus de 10 milliards sera construite en développant l'entraînement dans un environnement RL interne.
Nous vivons dans une abondance de capacités et pourtant, nous n'avons que deux produits majeurs en IA, chatgpt et un agent de codage, et cela me frustre profondément.
La chaîne d'approvisionnement actuelle de l'intelligence artificielle est structurellement cassée avec un seul fournisseur de matériel, quelques géants de l'IA possédant toute la raffinerie d'intelligence, les développeurs se retrouvant avec un accès API avec à peine aucun contrôle.
Comme si l'ère d'Internet avait été construite avec Intel vendant des CPU à 4 géants du cloud possédant toute l'infrastructure et la pile logicielle avec des secrets et des NDA partout, et donnant WordPress comme kit de développement aux startups.
Pourquoi perplexity n'a-t-il pas inventé la recherche approfondie ? Ils n'ont tout simplement pas pu car cela s'entraîne avec RL.
Ma prédiction pour les prochaines années :
RL deviendra l'outil le plus puissant pour les startups construisant des produits IA. Nous verrons des centaines d'histoires de succès comme Cursor et Lovable. L'utilisateur final en bénéficiera le plus.
Les grands laboratoires évolueront vers des entreprises de produits, OAI se concentrera sur le marché des consommateurs, Antropic sur l'agent de codage, DeepMind intégrera l'IA dans toutes les entreprises de Google, Meta et XAI se battront pour les réseaux sociaux.
Nous verrons émerger un écosystème de startups d'infrastructure IA, vendant des capacités de calcul, entraînant des modèles de base, organisant des données, construisant des environnements RL, offrant des inférences et des entraînements bon marché, propulsés par la science ouverte et les logiciels open source.
@PrimeIntellect est à l'avant-garde de cet écosystème et la vision de l'AGI open source, le hub d'environnement RL est l'un des premiers éléments clés.

Prime Intellectil y a 5 heures
Présentation du Hub des Environnements
Les environnements RL sont le principal goulot d'étranglement pour la prochaine vague de progrès en IA, mais les grands laboratoires les verrouillent
Nous avons construit une plateforme communautaire pour le crowdsourcing d'environnements ouverts, afin que chacun puisse contribuer à l'AGI open-source.
2,9K
samsja a reposté
14 jours de distribution, jour 7 !
Rencontrez Sami Jaghouar (@samsja19) de @PrimeIntellect :
Sami dirige leur recherche et se concentre sur le pré-entraînement décentralisé et l'apprentissage par renforcement distribué dans le cadre de son travail.
Sami donnera une conférence sur à quoi ressemble la mise en œuvre de l'entraînement décentralisé chez Prime.

7,88K
Le dernier hackathon en mode GPU était le meilleur hackathon auquel j'ai jamais assisté en personne, j'attends avec impatience le prochain.

Mark Saroufim23 août, 05:09
C'est de nouveau le moment de notre dernière (maintenant annuelle) extravagance de célébration de l'année. Le mode GPU se retrouve en personne à nouveau dans le centre-ville de San Francisco le vendredi 24 octobre de 10h à 22h pour hacker toute la journée.

3,58K
Il semble que d'autres personnes convergent vers l'utilisation de vllm v1 logprob pour le ratio d'importance afin de résoudre le problème de stabilité.
Je pense que j'ai un PTSD à cause de ce type de crash en RL.

Zichen Liu22 août, 23:35
Avec juste quelques lignes de code, la solution suggérée par Feng (@fengyao1909) — appliquer un échantillonnage d'importance sur la politique de comportement — a résolu l'instabilité de l'entraînement dans mon cas (oat). Je crois que le résultat peut se généraliser à d'autres frameworks RL également. Excellent travail, Feng !

6,7K
Je recrute un ingénieur de recherche chez @PrimeIntellect
Nous construisons des laboratoires AGI open source et recherchons des talents bruts. Peu importe votre ancien titre de poste.
Tout le monde dans l'équipe de recherche est full stack, nous construisons l'infrastructure et analysons également les données. Si vous avez un point fort pour les systèmes, l'apprentissage par renforcement, les données ou les lois de mise à l'échelle, vous serez confronté à une multitude de défis à relever.
83,21K
Meilleurs
Classement
Favoris
Tendance on-chain
Tendance sur X
Récents financements de premier plan
Les plus notables