Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Дослідження міркувань @OpenAI | Співавтор надлюдських покерних AI Libratus/Pluribus, CICERO Diplomacy AI та OpenAI o3 / o1 / 🍓 міркувань
Може бути важко «відчути AGI», поки ви не побачите, що штучний інтелект освоює домен, який вам глибоко небайдужий. У кожного буде свій момент Лі Седоля в різний час.

Dave White22 лип. 2025 р.
Новини openAI IMO досить сильно вразили мене цими вихідними
Я все ще перебуваю в гострій фазі удару, я думаю
Я вважаю себе професійним математиком (характеристика, з якою деякі справжні професійні математики можуть не погодитися, але моя партія має мої правила) і не думаю, що можу відповісти на жодне запитання IMO
Гаразд, так, IMO – це свій маленький спортивний підрозділ математики, для якого я не тренувався, і т.д., і т.д., але. якщо я зустрічаю когось у дикій природі, хто має золото IMO, я негайно оновлююся до «ця людина набагато краще розбирається в математиці, ніж я»
Тепер це під силу купі роботів. Для людини, яка багато в чому має свою особистість і своє реальне життя, побудоване на тому, що «добре розбирається в математиці», це удар по нутру. Це свого роду вмирання.
Мовляв, одного разу ви виявляєте, що можете розмовляти з собаками. Це весело і цікаво, тому ви робите це більше, вивчаючи тонкощі їхньої мови та їхні найглибші звичаї. Ви дізнаєтеся, що інші люди здивовані тим, що ви можете зробити. Ви ніколи не вписувалися в колектив, але ви вчитеся, що люди цінують ваші здібності і хочуть, щоб ви допомагали їм. Собаки теж цінують вас, єдиний двоногий, хто дійсно це розуміє. Ви збираєте для себе якусь приналежність. Потім одного разу ви прокидаєтеся, і універсальний перекладач собак продається в Walmart за $4.99
Результат IMO не є новиною, точно. насправді, якщо ви подивитеся на графік тривалості завдання агента METR у часі, я думаю, що агенти, здатні вирішити ~ 1,5 годинні задачі, приходять точно вчасно. Так що в якійсь мірі дивуватися не варто. І справді, схоже, що кілька компаній досягли однакового результату. Це просто... Приплив піднімається так само швидко, як і піднімається
Звичайно, скорбота за моєю особистою ідентичністю як математика (і/або продуктивного члена суспільства) є найменшою частиною цієї історії
Помножте це горе на *кожного* математика, на кожного програміста, можливо, на кожного працівника знань, кожного художника... протягом наступних кількох років... Це трохи більша історія
І, звичайно, крім цього, є страх справжньої смерті, про який я, можливо, розповім пізніше.
Цей пакет - горе за актуальністю, горе за життя, горе за те, що я знав - не є унікальним для епохи штучного інтелекту або чогось подібного. Я думаю, що це стандартна річ, коли людина закінчує кар'єру або закінчує життя. Можливо, для багатьох з нас це настане трохи раніше, і все відразу.
Цікаво, чи готові ми
148,38K
Вітаємо команду GDM з результатом на IMO! Я думаю, що їхній паралельний успіх підкреслює, наскільки швидким є прогрес штучного інтелекту. Їхній підхід дещо відрізнявся від нашого, але я думаю, що це свідчить про те, що є багато напрямків досліджень для подальшого прогресу. Кілька думок про нашу модель та результати 🧵
386,33K
Їхня ставка дозволила використовувати офіційні математичні системи штучного інтелекту (наприклад, AlphaProof). У 2022 році майже ніхто не думав, що LLM може стати золотим рівнем IMO до 2025 року.

Nat McAleese19 лип. 2025 р.
Ми спостерігаємо набагато швидший прогрес штучного інтелекту, ніж прогнозували Пол Крістіано** та **Юдковський**, які мали золото у 2025 році на рівні 8% та 16% відповідно, за методами, які є більш загальними, ніж очікувалося
164,51K
Нам потрібно кілька місяців, щоб перетворити рубіж експериментальних досліджень на продукт. Але прогрес настільки швидкий, що кілька місяців можуть означати велику різницю в можливостях.

Ravid Shwartz Ziv19 лип. 2025 р.
Отже, всі моделі поступаються людям у питаннях нової Міжнародної математичної олімпіади, і Grok-4 особливо погано справляється з цим, навіть при виборі best of-n? Неймовірно!

128,52K
Шеріл (@sherylhsu02) була нашою першою найнятою в команду з кількох агентів. За кілька місяців після вступу вона допомогла зробити це можливим. Нам дуже пощастило, що вона є в команді!

Sheryl Hsu19 лип. 2025 р.
Спостерігати за тим, як модель вирішує ці проблеми IMO та досягає продуктивності золотого рівня, було чарівно. Декілька думок 🧵
114,5K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги