Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Cristóbal Valenzuela
Spoluzakladatel CEO @runwayml
Kontrola přichází tentokrát na konec. Ale už se to blíží.

Cristóbal Valenzuela14. 11. 2024
Často mluvím o kontrole v AI. Ale uvědomil jsem si, že někdy si lidé myslí, že mám na mysli "lepší podněty". Takže tady jsou moje myšlenky na to, co myslím tím ovládáním: Grafiku řešíme pozpátku.
Historie počítačové grafiky sleduje jasný vývoj: nejprve přišla kontrola, pak kvalita. Trvalo desítky let, než jsme vytvořili správné abstrakce - křivky, trojúhelníky, mnohoúhelníky, mřížky - které by nám umožnily kreslit na plátno přesně to, co jsme chtěli. Tyto základní stavební kameny se příliš nezměnily, protože se ukázaly jako správné. Od ruky Eda Catmulla až po moderní herní enginy zůstaly základní principy ovládání pixelů pozoruhodně stabilní. Základy se objevily nejen pro ovládání, ale také jako efektivní způsoby popisu a vykreslování složitých scén.
Kvalita vykreslování byla poslední hranicí. Krychle modelovaná v roce 1987 pomocí první verze Rendermanu se řídí stejnými geometrickými principy jako kostka modelovaná v Blenderu dnes. Co se dramaticky liší, je vykreslování - osvětlení, materiály, stíny a odrazy, díky nimž to působí reálně. Průmysl strávil desetiletí uzavíráním tohoto tajemného údolí a budováním stále sofistikovanějších vykreslovacích systémů, aby se přiblížil fotorealismu. Samozřejmě, že mnoho grafických inovací zlepšilo ovládání i kvalitu současně a historie grafického pokroku je složitější než jen "kontrola a kvalita".
Ale toto pořadí nebylo svévolné. Samotná grafická pipeline to vynucuje: geometrie definuje, co chceme kreslit, shadery určují, jak to bude vypadat. Dokonce i enginy pracující v reálném čase se řídí tímto vzorem – nejprve zavedou ovládací prvky pro úroveň detailů a poté v rámci těchto omezení zlepší kvalitu vykreslování.
Umělá inteligence tento vývoj zcela obrátila.
Dnešní generativní modely dosahují fotorealistické kvality vykreslování, která konkuruje tradičním řetězcům nebo ji předčí, a efektivně se učí celý grafický stack – od geometrie až po globální osvětlení – prostřednictvím rozsáhlého tréninku. Podařilo se jim odstranit tradiční rozdělení mezi modelováním a vykreslováním a vytvořit ucelený systém, který dokáže vytvářet ohromující snímky z popisů na vysoké úrovni.
Co chybí, je kontrola.
I když můžeme generovat fotorealistické scény během několika sekund, chybí nám přesná kontrola, kterou nám poskytovaly desítky let výzkumu grafiky. Nemůžeme snadno upravovat geometrii, dolaďovat materiály nebo manipulovat s osvětlením s granularitou, kterou umělci očekávají. Deterministická povaha tradiční grafiky - kde každý parametr má předvídatelný efekt - byla nahrazena pravděpodobnostními modely.
To je problém inverzní grafiky: před řešením ovládání jsme vyřešili vykreslování. Naše modely dokážou vytvářet ohromující obrazy, ale postrádají základní abstrakce, díky nimž byla počítačová grafika tak výkonná - schopnost provádět přesné a záměrné změny na jakékoli úrovni detailů.
Nejedná se o trvalé omezení. Stejně jako počítačová grafika nakonec vyřešila problém s vykreslováním, umělá inteligence vyřeší problém s ovládáním. Otázkou není jestli, ale jak. Nacházíme správné abstrakce pro řízení generativních modelů - ekvivalent křivek, trojúhelníků a mnohoúhelníků, které dříve způsobily revoluci v počítačové grafice. Myslím, že řešení by mohla vypadat jinak. Nová primitiva pro řízení, která jsou nativní pro neuronové sítě, by mohla být správnou odpovědí, spíše než se snažit vnutit tradiční grafické koncepty do tohoto nového paradigmatu. I když si také myslím, že existují hybridní přístupy kombinující tradiční grafiku s umělou inteligencí, které stojí za to prozkoumat.
Cílem zůstává poskytnout stejnou úroveň předvídatelnosti a přesnosti, která z počítačové grafiky učinila základní nástroj pro kreativní vyjádření. To je konečný cíl, ale lepší: v reálném čase, levně a s přesným ovládáním, které je co nejintuitivnější a univerzální.
Kontrola přichází tentokrát na konec. Ale už se to blíží.
2,37K
Další skvělý příklad toho, jak řídit přesné ovládání pomocí personalizovaných rozhraní. Runway můžete vyzvat k zadání přizpůsobené trasy a libovolných anotací videa, které chcete.
Výzva+první video: Modrý ovál je vesmírná loď létajícího talíře UFO, která létá nad domem, a částice jsou jeho vlečný paprsek světla, který dům zvedá. Odstraňte modré oválné a tečkové anotace.
2,98K
Ano! V režimu chatu můžete generovat mnoho videí současně.

Alin Cristian Tiganus (eyes2AI)7. 8. 04:44
Myslel jsem si, že režim chatu od @runwayml umožňuje pouze jednu generaci najednou. Ukázalo se, že jsem se mýlil. Nyní, kromě práce s Turbem, mohu provozovat dvě generace současně a možná jsem to jen já, ale zdá se, že lépe sleduje pokyny v režimu chatu. Nevím, ale je to prostě správný pocit, jako bych pracovala, ale bez toho, abych to cítila. Děkuju!
66
Stačí mu to jen říct.

Jamie8. 8. 06:21
I z těch nejnudnějších záběrů se s @runwayml Aleph může stát hřiště. Přidejte k tomu. Změňte to. Nebo k němu přidejte racka. A vše, co musíte udělat, je říct Alephu, co chcete.
2,73K
Cristóbal Valenzuela repostoval/a
Dráha Aleph má granulární ovládání objektů. To znamená, že můžete své video přidávat nebo měnit způsoby, které působí přirozeně a realisticky, bez jakýchkoli složitých výzev nebo klíčových kompozic. Nebo můžete úplně porušit fyzikální zákony. Vše, co musíte udělat, je říct Alephu, co chcete.
39,73K
To byl cíl po celou dobu. Odstraňte člověka, ponechte odlesk objektivu a nechte myš přijít až k objektivu fotoaparátu

Cristóbal Valenzuela1. 8. 13:51
To je těžká otázka. Odstraňte muže, ale ponechte odlesky objektivu. Nádherné kouzlo od Alephu.
15,18K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější