Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Будівля @EurekaLabsAI. Раніше директор AI @ Tesla, команда засновників @ OpenAI, CS231n/PhD @ Stanford. Мені подобається тренувати великі глибокі нейронні мережі.
В епоху передпідготовки важливим був текст в Інтернеті. Перш за все, вам потрібна велика, різноманітна, високоякісна колекція інтернет-документів для навчання.
В епоху контрольованого доопрацювання це були розмови. Контрактні працівники наймаються для створення відповідей на питання, трохи схожі на ті, що ви бачите на Stack Overflow / Quora або і т.д., але орієнтовані на випадки використання LLM.
Ні те, ні інше не зникає (імо), але в цю епоху навчання з підкріпленням це тепер середовище. На відміну від перерахованих вище, вони дають ЛЛМ можливість реально взаємодіяти - виконувати дії, бачити результати і т.д. Це означає, що ви можете сподіватися на набагато краще, ніж статистична експертна імітація. І їх можна використовувати як для модельного навчання, так і для оцінки. Але, як і раніше, основна проблема зараз полягає в потребі у великому, різноманітному, високоякісному наборі середовищ, як вправ для практики LLM.
У певному сенсі мені нагадує найперший проєкт OpenAI (тренажерний зал), який був саме фреймворком, який сподівався побудувати велику колекцію середовищ у тій самій схемі, але це було набагато раніше LLM. Таким чином, середовища були простими академічними контрольними завданнями того часу, як картшток, ATARI тощо. Хаб @PrimeIntellect середовищ (і репозиторій 'verifiers' на GitHub) будує модернізовану версію, спеціально націлену на LLM, і це великі зусилля/ідеї. Я запропонував, щоб хтось побудував щось подібне на початку цього року:
Середовища мають ту властивість, що як тільки скелет фреймворку на місці, в принципі, спільнота / індустрія може паралельно працювати в багатьох різних доменах, що захоплює.
Заключна думка - особиста і довгострокова, я оптимістично налаштований щодо оточення та агентичної взаємодії, але я ведмежий щодо навчання саме з підкріпленням. Я думаю, що функції винагороди супер су, і я думаю, що люди не використовують РЛ для навчання (можливо, вони використовують для якихось рухових завдань і т.д., але не для завдань з інтелектуального вирішення проблем). Люди використовують різні парадигми навчання, які є значно потужнішими та ефективними для вибірки, і які ще не були належним чином винайдені та масштабовані, хоча існують ранні ескізи та ідеї (як лише один із прикладів, ідея «системного оперативного навчання», перенесення оновлення на лексеми/контексти, а не ваги, і, за бажанням, переведення на ваги як окремий процес, трохи схожий на сон).

Prime Intellect13 годин тому
Знайомство з Environments Hub
Середовища RL є ключовим вузьким місцем для наступної хвилі прогресу штучного інтелекту, але великі лабораторії блокують їх
Ми створили платформу спільноти для краудсорсингу відкритих середовищ, тому будь-хто може зробити свій внесок у AGI з відкритим вихідним кодом
372,6K
Продовження шляху до оптимального досвіду кодування за допомогою LLM. Зокрема, я помічаю, що замість того, щоб обмежуватися однією ідеальною річчю, моє використання все більше диверсифікується на кілька робочих процесів, які я «зшиваю» плюси/мінуси:
Особисто хліб і масло (~75%?) моєї допомоги LLM продовжують залишатися лише (Курсор) вкладки завершені. Це тому, що я вважаю, що написання конкретних фрагментів коду/коментарів самостійно і в потрібній частині коду є способом передачі "специфікації завдання" з високою пропускною здатністю до LLM, тобто це в першу чергу стосується бітів специфікації завдання - потрібно занадто багато бітів і занадто велика затримка, щоб повідомити те, що я хочу в тексті, І швидше просто продемонструвати це в коді і в потрібному місці. Іноді модель з вкладками в комплекті дратує, тому я часто вмикаю/вимикаю її.
Наступним шаром є виділення конкретного шматка коду та прохання внести якусь модифікацію.
Наступним шаром вгору йде Claude Code / Codex / etc, що працює на стороні Cursor, до якого я переходжу за більшими шматками функціональності, які також досить легко вказати в підказці. Вони надзвичайно корисні, але все одно змішані в цілому і іноді трохи розчаровують. Я не бігаю в режимі YOLO, тому що вони можуть збиватися з траси і робити дурні речі, які ви не хотіли/не потребували, і я досить часто ESC. Я також не навчився бути продуктивним, використовуючи більше одного екземпляра паралельно - один вже відчувається досить важко. Я так і не вигадав хорошого способу утримати Клода[.]Доктор медичних наук хороший або актуальний. Мені часто доводиться робити прохід "чисток" для стилю кодування або питань смаку коду. Наприклад, вони занадто захисні та часто надмірно використовують оператори try/catch, вони часто надмірно ускладнюють абстракції, вони надмірно роздувають код (наприклад, вкладені конструкції if-the-else, коли розуміння списку або однорядковий запит if-then-else спрацює), або вони дублюють фрагменти коду замість того, щоб створити гарну допоміжну функцію, подібні речі... У них в основному відсутнє почуття смаку. Вони незамінні у випадках, коли я переходжу на територію більш вайб-кодування, де я менш знайомий (наприклад, нещодавно пишу якийсь rust, або sql команди, або щось інше, з чим я раніше займався менше). Я також намагався CC навчити мене чомусь разом з кодом, який вона писала, але це зовсім не спрацювало - вона дійсно хоче просто писати код набагато більше, ніж пояснювати що-небудь на цьому шляху. Я намагався змусити CC зробити налаштування гіперпараметрів, що було дуже кумедно. Вони також надзвичайно корисні у всіх видах одноразової користувацької візуалізації або утиліт з низькими ставками, або коду налагодження, який я б ніколи не написав інакше, тому що це зайняло б занадто багато часу. Наприклад, CC може вибити 1,000 рядків одноразової розгорнутої візуалізації/коду лише для того, щоб виявити конкретну помилку, яка видаляється відразу після того, як ми її знаходимо. Це епоха пост-дефіциту коду - ви можете просто створити, а потім видалити тисячі рядків супер власного, супер ефемерного коду, тепер це нормально, це більше не така дорогоцінна дорога річ.
Завершальний рівень захисту – це GPT5 Pro, до якого я звертаюся за найскладнішими речами. Наприклад, зі мною вже кілька разів траплялося, що я / Курсор / CC всі застрягли на багу на 10 хвилин, але коли я копіюю і вставляю все це в 5 Pro, він спрацьовує на 10 хвилин, але потім насправді знаходить дійсно тонку помилку. Він дуже міцний. Він може відкопувати всілякі езотеричні документи та папери тощо. Я також використовував його для інших більш м'ясних завдань, наприклад, пропозицій про те, як очистити абстракції (змішані результати, іноді хороші ідеї, але не всі), або цілого огляду літератури про те, як люди роблять те чи інше, і він повертається з хорошими відповідними ресурсами / вказівками.
У будь-якому випадку, кодування здається абсолютно відкритим завдяки можливостям для ряду «видів» кодування, а потім і ряду інструментів зі своїми плюсами/мінусами. Важко уникнути почуття занепокоєння через те, що ви не перебуваєте на межі колективно можливого, звідси випадковий недільний дощ думок і велика кількість цікавості до того, що знаходять інші.
613,88K
Я отримую ~10 спам-дзвінків на день (різні автоматичні голосові повідомлення, «попереднє схвалення кредиту» тощо) та ~5 спам-повідомлень на день (зазвичай фішинг).
- У мене AT&T Active Armor, все перераховане вище все одно проскакує.
- Все перераховане завжди з нових, унікальних номерів, тому блокування не працює.
- Я в усіх списках «Не дзвонити».
- У мене ввімкнено функцію «Глушити невідомих абонентів» на iOS, але навіть якщо вона ловить і вимикає їх, я все одно отримую сповіщення.
Не впевнений, що інші люди бачать щось подібне або зрозуміли щось, що працює
3,1K
Я (повільно) перечитую легендаріум Толкієна (невелика частина якого є «Володарем перснів»). Весь корпус робіт настільки неймовірний, що більше нічого подібного немає... Вона розбавляє інші світи художньої літератури. Зачекайте - ваша історія не має всеосяжної історії/міфології, що охоплює кілька віків, аж до міфу про створення світу, як це детально описано в окремих томах? Ви спочатку не винайшли нові мови та діалекти для своїх персонажів? Ви не наповнили її потужними темами та історіями, не написали її в красивому, архаїчному стилі і не склали разом вірші та пісні? Вам не знадобилося кілька десятиліть ітерацій? А як щодо всієї незвіданої території, яка ще залишилася? Чи є Том Бомбадиль одним з айнурів. Де знаходяться Entwives. Що сталося з двома неврахованими Ітарі. Чи можемо ми почути більше про те, яким він був у Куйв'єнені, коли ельфи вперше прокинулися? Або побачити світло двох дерев Валінору. Або про пишність печер Агларонда.
Але найбільше мені на думку – легендаріум Толкієна є конкретним прикладом висоти культури. Чи дозволяє штучний інтелект, сьогодні чи найближчим часом, досягти цього рівня завдяки розширенню можливостей як у письмі, так і в генерації ідей? Або важче, коли швидкі перемоги спокусливі і ~вільні, а самостійна здатність до творчості пригнічена. Якщо така робота буде виконана знову, але вже за потужної допомоги штучного інтелекту, чи викликає це таке ж здивування? А раптом тисячі з них вийдуть на вимогу лише з підказкою? Чому ви відчуваєте себе обдуреним, коли дізнаєтеся, що те, що ви прочитали, було згенеровано штучним інтелектом? Це минущий чи функція можливостей? Це неохайність? Що таке помиї? Чи, може, диво невіддільне від міфу про довічне створення, одержимість розумом, подібним до вашого власного? Стільки запитань.
3,53K
Я помічаю, що через (я думаю?) багато бенчмаркxing на завданнях з довгим горизонтом, LLM стають занадто агентськими за замовчуванням, трохи перевищуючи мій звичайний варіант використання.
Наприклад, у кодуванні, моделі зараз схильні міркувати досить довго, вони мають схильність починати перераховувати та перевіряти файли по всьому репозиторію, вони здійснюють повторні веб-пошуки, вони надмірно аналізують і надмірно обмірковують маленькі рідкісні крайові випадки навіть у коді, який є свідомо неповним і перебуває на стадії активної розробки, і часто повертаються ~ хвилин пізніше навіть за простими запитами.
Це може мати сенс для довготривалих завдань, але це не дуже добре підходить для більш "в циклі" ітераційної розробки, яку я все ще виконую багато, або якщо я просто шукаю швидку вибіркову перевірку перед запуском скрипту, на випадок, якщо я помилився в індексації або зробив якусь дурну помилку. Тому я ловлю себе на тому, що досить часто зупиняю LLM з варіаціями на кшталт «Стоп, ти занадто багато думаєш про це. Подивіться тільки на цей єдиний файл. Не використовуйте жодних інструментів. Не перестарайтеся» і т.д.
В основному, коли стандарт починає повільно переходити в суперагентський режим «ультрамислення», я відчуваю потребу в зворотному, і в більш загальному хороших способах позначити або повідомити про наміри / ставки, від «просто швидко подивитися» до «відійдіть на 30 хвилин, поверніться, коли будете абсолютно впевнені».
130,27K
Обожнюю це! Нагнітач, закусочна, ... А насправді своєрідний експонат на майбутнє. Побудова графіка подорожі СФ -> ЛА для зарядки Shadowfax

Tesla22 лип. 2025 р.
Tesla Diner & Supercharger в Голлівуді, Луїзіана
Працює 24/7, починаючи з зараз
40,58K
Дифузійні відеомоделі, але тепер - **в реальному часі**!
Прості відеофільтри працюють у режимі реального часу, але можуть виконувати лише базове перефарбування та стилі. Моделі з дифузією відео (Veo та друзі) – це магія, але для їх генерації потрібно багато секунд/хвилин. MirageLSD – це магія в реальному часі. На відміну від простих відеофільтрів, дифузійні моделі насправді *розуміють*, на що вони дивляться, тому вони можуть розумно стилізувати всі частини стрічки (наприклад, надягати капелюхи на голови, або світлові шаблі в руки тощо). І ними можна керувати довільно, наприклад, за допомогою текстових підказок.
Настроювані інтелектуальні відеофільтри з часом відкривають безліч цікавих ідей:
- Перетворюйте трансляції з камери на альтернативні реальності
- режисувати та знімати власні фільми, розігруючи сцени з реквізитом. У реальному часі = > миттєвий зворотний зв'язок/огляд.
- Ігри з кодом Vibe навколо простих сфер/блоків, а потім використовуйте модель дифузії в реальному часі, щоб текстурувати свою гру, щоб зробити її красивою.
- стилізувати і налаштовувати будь-який відеопотік: ігри, відео, ... наприклад, Skyrim, але "БІЛЬШ EPIC"? DOOM II, але сучасна якість Unreal Engine з однією лише підказкою? Фільм жахів, але "милий, рожевий і тільки зайчики"? Я не знаю!
- Zoom фон дзвінка+++
- віртуальна примірка одягу в режимі реального часу
- Окуляри: наприклад, мультфільмізувати свій зір у реальному часі?
- тепер ми можемо створити дзеркало Гаррі Поттера в Erised, показуючи «сиру стрічку» вас у дзеркалі, але доповнене вашими найглибшими бажаннями (як робить висновок штучний інтелект).
- Не знаю, я, мабуть, сумую за найбільшим, стільки всього!
(Розкриття інформації: Я (дуже маленький) ангельський інвестор у Decart, я був схвильований, тому що imo ця технологія стане дуже хорошою дуже швидко, і вона здається загальною, потужною, але вона також технічно дуже складна. Вітаю команду з запуском!)

Decart18 лип. 2025 р.
Представляємо MirageLSD: першу модель штучного інтелекту з дифузією в прямому ефірі (LSD)
Вводьте будь-який відеопотік, з камери або відеочату на екран комп'ютера або гру, і перетворюйте його в будь-який світ за вашим бажанням в режимі реального часу (затримка <40 мс).
Ось як це працює (з демонстраційною версією, яку ви можете використовувати!):
360,13K
Найкращі
Рейтинг
Вибране