Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Spolehlivost je název hry pro agenty a je nepravděpodobné, že by se v dohledné budoucnosti vyřešila čistě na úrovni modelu. To vytváří zelené výhonky pro stavitele infrastruktury, přičemž se začíná objevovat několik zajímavých trendů:
1. Simulace jako CI pro agenty:
a) Nejcennějším datem dneška jsou data o trajektoriích, tj. soubory úloh (P) -> {t1, t2... tk} mapování. S větším množstvím dat o trajektorii mohou být agenti vylepšeni pomocí technik jako je RFT.
b) Vzhledem k tomu, že tyto trajektorie mohou být zcela specifické pro podkladová data společnosti (D), musíte být schopni skutečně simulovat chování agentů ve vašem prostředí a spoléhat se na data o trajektoriích 3P.
Jak to tedy můžete udělat?
- Udržovat registr agenta a MCP pro podnik a pracovní prostředí. Bootstrap vrstva metadat, která obsahuje cíl každého agenta, nástroje, ke kterým má přístup, rozsah každého agenta ve vztahu k jednotlivým nástrojům atd. Vaše sada SDK může být nucena generovat servery MCP za běhu pro určité interní aplikace.
- Provádějte scénáře v přípravě pro každého agenta poskytováním rychlých variací / variací úkolů, kontrolou vytvořených volání nástrojů a hodnocením výkonu ve srovnání s vícekriteriální funkcí odměňování (např. výkon oproti cíli, minimalizace vyvolání nástroje).
- Kritickou komponentou je přesné poskytování kvantifikovatelných funkcí odměn pro každého agenta, které odemykají vysoce věrné evaly a uzavírají smyčku pro spolehlivou CI.
- To vše je třeba zproduktivizovat: snadno přijatelnou infrastrukturu, kterou mohou vývojáři rozšířit, ale včetně baterií. Můžete začít vidět formování nového paradigmatu – ne jednotkové testy kódu, ale simulační svazky pro agenty.
Co se stane, když získáte údaje o trajektorii?
2. Podniky se přesunou do "kontextových jezer":
- Vyvíjející se dotazovatelná paměťová vrstva, která slouží jako centrum pro trajektorie agentů obohacené o podniková data uložená v delta lake / SNOW. Účinná kombinace znalostní báze, sémantické mezipaměti a protokolu spuštění.
- Extrémně rychlé čtení pro načítání v době odvozování, které podporuje vysokou QPS.
- Jak bylo zmíněno v předchozím příspěvku, sémantická mezipaměť (opravdu zajímavá příležitost pro startupy) bude seskupovat páry úloha-trajektorie (např. pomocí k-means), což umožní rychlé načítání a "slučování výsledků" během plánování nebo výběru nástrojů.
Agenti se budou neustále ponořovat do jezera kontextu. Načítání kontextu s vysokým QPS a nízkou latencí se stane stejně důležitým jako dnes rychlé vyhledávání vkládání.
3. Ověřování agentů se stává prvořadým problémem:
-Tradiční klíčové modely OAuth a API se rozpadají, když agenti jednají jménem uživatelů a sami sebe v rámci dlouhodobých relací.
- Potřebujete rámec pro identitu, delegování a rozsah agenta – takový, který podporuje věci, jako jsou oprávnění na úrovni nástroje, přihlašovací údaje vázané na úlohy a grafy delegování.
Vstupujeme do éry, kdy testování softwaru znamená simulaci chování, dotazovací software znamená získávání kontextu a zabezpečení softwaru znamená ověřování autonomních agentů.
2,65K
Top
Hodnocení
Oblíbené