AI Agents 的一周就像傳統軟體的一年。 以下是本週 AI 代理中發生的一切,來自 Ramp、Agno、AgentOps、NVIDIA、AutoGen、Context Suite、Replit、Nebius、Firebase、Pipedream、Trae 等。🧵 (留到以後再用)
2/ @nvidia公佈了突破性的研究,該研究將使用戶能夠立即獲得百科全書長度的問題的答案 該技術將使代理能夠跟踪數月的對話或審查數百萬行計算機代碼
NVIDIA AI Developer
NVIDIA AI Developer2025年7月8日
如果您可以向聊天機器人提出一個相當於整本百科全書大小的問題,並即時獲得答案,會怎麼樣? 現在,Helix Parallelism 可以進行數百萬個代幣查詢,用戶數量增加 32 倍,Helix Parallelism 是 #NVIDIAResearch 的一項創新,可大規模推動推理。 🔗
5/ 博客 v2.0 @AgentOpsAI現已上線!🖇 讓您離代理可觀測性、基礎設施和操作的世界更近一步。@n_sri_laasya
Sri Laasya Nutheti 🖇️
Sri Laasya Nutheti 🖇️2025年7月10日
Blog v2.0 @AgentOpsAI 現已上線! 讓您更接近代理可觀察性、基礎設施和運營的世界
6/ @Firebase 正在利用 Firebase Studio 推進代理 AI 開發。🚀
Firebase
Firebase2025年7月10日
我們正在使用 Firebase Studio 推進代理程式 AI 開發。獲取最新更新詳情↓
7/ 認識@contextsuite,第一個 AI 辦公室套件。 人類每年在辦公室工作上花費 2.5 兆小時。上下文可以一次性拍攝大部分內容。@josephsemrai
Joseph Semrai
Joseph Semrai2025年7月8日
認識 Context,第一個 AI 辦公室套件。 人類每年在辦公室工作上花費 2.5 兆小時。上下文可以一次性拍攝大部分內容。 歡迎來到氛圍工作的時代。 立即註冊或使用提示標記@contextsuite。
9/ @kevinlu625 推出了 Orchids - 世界上第一個 AI 工具,可讓您與 AI 聊天,以構建看起來和感覺上都不是“AI 生成”的應用程序和網站。
Kevin Lu
Kevin Lu2025年7月8日
隆重推出 Orchids - 世界上第一個 AI 工具,可讓您與 AI 聊天,以構建外觀和感覺上都不是“AI 生成”的應用程序和網站。 在內部基準測試中,Orchids 在一般應用程式和網站建立任務上的表現比市場上任何其他工具高出近 3 倍。 如果您不相信我們,請在蘭花 [dot] 應用程序中嘗試一下:) 評論“蘭花”,我們將為您提供 2 天的無限積分。
10/ @Trae_ai開源的 Trae-Agent。您現在可以將“git clone”稱為“cd trae-agent”!🔥
TRAE
TRAE2025年7月4日
我們已經開源了 Trae-Agent。 你們現在都可以'git clone' 'cd trae-agent'
11/ 如果您想大幅加快運輸的迭代速度,您必須使用 playwright MCP 並告訴您的代理如何在您的 AGENT(.)MD(或遊標/克勞德/雙子座規則) @ryancarson
Ryan Carson
Ryan Carson2025年7月10日
如果您想大幅加快運輸迭代,您必須使用 playwright mcp 並告訴您的代理如何在您的(或光標/克勞德/雙子座規則)中使用它 巨大的解鎖
12/ 使用 Google Agent 開發工具包 (ADK) 100% 開源代碼構建具有結構化輸出的客戶支持票證代理。🤝 @Saboo_Shubham_ @AgentOpsAI原生支援 Google ADK。
Shubham Saboo
Shubham Saboo2025年7月6日
使用 Google Agent Development Kit 建立具有結構化輸出的客戶支援票證代理。 100% 開源代碼和分步教程:
13/ @tryramp – 代理協調的第一步。@diegozaks 一體化財務運營平台,可節省企業時間和金錢。受到 40,000+ 團隊的信賴。
Diego Zaks
Diego Zaks2025年7月10日
人工智慧的使用者體驗還不存在。 想像力、品味和對智能體-人類反饋循環的痴迷——這就是我們如何做到這一點。了解@tryramp進入代理協調的第一步。 劇透警告,這不僅僅是聊天。
14/ 這款 Claude MCP AI 代理取代了您 $200K+ 的營運團隊。 它審計了@aryanXmahajan的整個業務,發現了 12 個瓶頸,並構建了 5 個生產就緒的 n8n 代理。
Aryan Mahajan
Aryan Mahajan2025年7月9日
這款 Claude MCP AI 代理取代了您 $200K+ 的營運團隊。 我可能不應該免費分享確切的系統...... 當我試圖在凌晨 3 點在 Pokemon Go 上捕捉皮卡丘時,它審核了我的整個業務,發現了 12 個瓶頸,並為我建立了 5 個生產就緒的 n8n 代理 效率提升絕對是瘋狂的 大多數創始人花費數月時間聘請運營顧問,他們每小時收費 500 美元,只是為了告訴你出了什麼問題 這個代理系統在幾分鐘內完成了他們的全部工作 以下是部署它時會發生的情況: → 在 3 分鐘內執行完整的商業智慧審計(顧問需要數週的時間) → 識別 12+ 個工作流程瓶頸,從而降低您的效率 → 架構為您的業務量身定制的代理系統 → 構建 5+ 個具有高級錯誤處理功能的自主 AI 代理 → 創建智能編排層,將所有內容同步在一起 →可在 10 分鐘內完成營運轉型 顧問現在收取 50 萬美元的整個審計在 10 分鐘內完成 需要零技術知識 無需零昂貴的顧問 零個月的來回 只需描述您當前的設置,然後觀看它建立您的特工帝國 數學很愚蠢,很簡單: 200 萬美元營運團隊薪資與一次性 MCP 部署 每月節省 16,600 美元 該系統包括: - 智能業務堆棧分析器 - 瓶頸檢測AI - 自訂代理架構師 - 自主代理程式建置器 - 完整的部署文件 這正是構建 7 位數運營基礎設施的系統 而且您可以免費獲得它 關注 + 轉發 + 評論“MCP”,今晚我會向您發送完整的設置指南 不要睡這個 您等待的每週都是 30+ 小時的體力勞動,您將永遠無法回來
15/ @mckaywrigley分享了他關於如何使用 Claude Code 進行筆記和研究的 1 小時教程。📝
Mckay Wrigley
Mckay Wrigley2025年7月10日
這是我關於如何使用 Claude Code 進行筆記和研究的 1 小時教程。 10 倍您的筆記: - 核心代理程式流程 - 自訂指令 - 自動標籤/鏈接 - 子代理程式 - 雲端使用情況 - STT 目標是讓你對未來的工作進行“代理藥丸”。 在 61 分鐘內觀看 10 個提示 + 演示。
16/ @JulianGoldieSEO 分享這個新的 AI 操作系統 🤯
Julian Goldie SEO
Julian Goldie SEO2025年7月9日
這個新的人工智能操作系統太瘋狂了!🤯 想要完整指南嗎?私信我。
17/ @JulianGoldieSEO測試了每個人工智慧網站建立器,只有一個他會真正使用的 - MiniMax。
Julian Goldie SEO
Julian Goldie SEO2025年7月8日
MiniMax 是 AI 代理中的詹姆斯邦德。 我測試了每個人工智慧網站建立器。 只有一個人創造了我真正會使用的東西。 Minimax M1 品質指標: → 像素完美的設計執行 → 功能互動元素 → 專業多媒體集成 → 響應式佈局優化 → 真實內容生成 保存此評估,它將指導您的工具選擇 📐 想要完整指南嗎?私信我。📥
20/ @nebiusaistudio 部落格:代理人 101 – 大規模推出生產級 AI 代理 🤖 全部由 Nebius AI Studio 提供支持 – 30 多個開源模型、快速推理、具成本效益的層級,以及無縫的即插即用兼容性。 感謝包含 @AgentOpsAI!
456550
4565502025年7月11日
🤖 Nebius 部落格新文章:Agent 101 – 大規模推出生產級 AI 代理 從概念驗證到生產級系統,我們分解完整堆疊: ✅ LLMs ✅ 框架:@crewaiinc, @LangChainAI, @Google ADK, @AgnoAgi ✅ 可觀察性:@helicone_ai, @AgentOpsAI, @keywordsai ✅ 實時基礎:@Linkup_platform ✅ 記憶、工具使用、評估等更多內容 🧠 全部由 Nebius AI Studio 提供支持 – 30 多個開源模型、快速推理、具成本效益的層級,以及無縫的即插即用兼容性。
21/ 「對於代理來說,可靠性是遊戲的名稱,而在可預見的未來,這不太可能僅僅在模型層面上解決..」@anaganath
Aditya Naganath
Aditya Naganath2025年7月6日
Reliability is the name of the game for agents, and it's unlikely to be solved purely at the model layer for the foreseeable future. This is creating green shoots for infrastructure builders, with a few interesting trends starting to emerge: 1. Simulation as CI for agents: a) The most valuable piece of data today is trajectory data i.e. collections of task (P) -> {t1, t2... tk} mappings. With more trajectory data, agents can be improved with techniques like RFT. b) Since these trajectories can be quite specific to a company's underlying data (D), you need to be able to actually simulate the behavior of agents within your environment vs. rely on 3P trajectory data. So, how might you do this? - Maintain an agent and MCP registry for an enterprise, and a staging environment. Bootstrap a metadata layer that contains the objective of each agent, the tools it has access to, the scope of each agent vis.a.vis each tool etc. Your SDK may need to generate MCP servers on the fly for certain internal applications. - Execute scenarios in staging for each agent by providing prompt / task variations, inspecting the tool calls produced and evaluating performance against a multi-objective reward function (e.g. performance against the objective, minimization of tool invocations). - A critical component is accurately providing quantifiable reward functions for each agent that unlock high-fidelity evals and close the loop for reliable CI. - All of this needs to be productized: easy-to-adopt infrastructure that developers can extend, but with batteries included. You can start to see a new paradigm forming—not unit tests for code, but simulation harnesses for agents. What happens when you get trajectory data? 2. Enterprises will move to "context lakes": - An evolving, queryable memory layer that serves as a hub for agent trajectories enriched by enterprise data stored in the delta lake / SNOW. A potent mix of a knowledge base, a semantic cache, and an execution log. - Extremely fast reads for inference-time retrieval that supports high QPS. - As mentioned in a prior post, the semantic cache (really interesting opportunity for startups) will cluster task–trajectory pairs (e.g., via k-means), enabling fast retrieval and “result fusing” during planning or tool selection. Agents will dip into the context lake constantly. High QPS, low-latency context fetch will become as important as fast embedding search is today. 3. Agent authentication becomes a first-class concern: -Traditional OAuth and API key models break down when agents act on behalf of users and themselves, across long-lived sessions. -You need a framework for agent identity, delegation, and scoping—one that supports things like tool level permissions, task bound credentials and delegation graphs. We’re entering an era where testing software means simulating behavior, querying software means retrieving context, and securing software means authenticating autonomous agents.
22/ @jxnlco分享了為什麼您的編碼代理不再需要 rag,以及 rag 發生了什麼。💭
jason liu
jason liu2025年7月11日
為什麼您的編碼代理不再需要 Rag 來自 Cline 的 Nik Pash 解釋了為什麼他不再推薦 RAG 用於自主編碼代理,他的觀點比我預期的要強烈。 應用層正在縮小。隨著模型的改進,我們圍繞 LLM 構建的所有巧妙工程都不斷過時。 RAG 發生了什麼: 上下文視窗大幅擴展,無需嵌入搜尋 編碼代理在直接檔案存取方面比區塊內嵌效果更好 當您將溫度設置為 0 時,幻覺甚至不是問題 內嵌儲存體的安全問題很重要 像 Klein 這樣的現代編碼代理不是 RAG,而是使用 Nik 所說的“敘事完整性”。讓代理透過 grep 等工具有機地探索程式碼,完整讀取文件,並遵循自己的思路。這模仿了高級工程師的實際工作方式。 就連 Cloud Code 的 Boris 也承認他們嘗試過 RAG 並放棄了它。模式很清楚。 當 RAG 仍然有意義時: 預算限制 (內嵌搜尋使用較少的權杖) 海量非結構化資料湖 一些非編碼用例 但對於嚴肅的工程團隊來說呢?停止使用嵌入搜索分散您的編碼代理的注意力。讓他們直接閱讀程式碼,自然地建立理解,並專注地執行。 真正的問題不在於 Rag 是否已經消亡,而是當更簡單的方法現在效果更好時,您是否仍然堅持過時的解決方案。
23/ @AgentOpsAI 已準備好開始我們的代理託管產品的入職專案。如果您想生產您的代理,請私信我。📩 @braelyn_ai @AlexReibman @ssslomp
Braelyn 🖇️
Braelyn 🖇️2025年7月11日
AgentOps 已經準備好開始為我們的代理託管進行項目上線。如果你想要將你的代理投入生產,請私訊我。
32.83K