熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
AI Agents 的一周就像傳統軟體的一年。
以下是本週 AI 代理中發生的一切,來自 Ramp、Agno、AgentOps、NVIDIA、AutoGen、Context Suite、Replit、Nebius、Firebase、Pipedream、Trae 等。🧵
(留到以後再用)

2/
@nvidia 揭示了突破性的研究,將使用者能夠即時獲得長達百科全書的問題答案。
這項技術將使代理能夠追蹤數月的對話或檢視數百萬行的電腦程式碼。

2025年7月8日
如果你可以向一個聊天機器人提出一個像整本百科全書那樣大的問題——並且能夠即時獲得答案,會怎樣呢?
現在,通過 #NVIDIAResearch 的 Helix Parallelism 創新,支持多達數百萬個標記的查詢,並且用戶數量增加了 32 倍,這一切都變得可能。
🔗
5/
Blog v2.0 @AgentOpsAI 現已上線!🖇
讓您更接近代理可觀察性、基礎設施和運營的世界。@n_sri_laasya
6/
@Firebase 正在通過 Firebase Studio 推進自主 AI 的發展。🚀

2025年7月10日
我們正在利用 Firebase Studio 推進代理 AI 的開發。獲取最新更新的詳細資訊 ↓
7/
認識 @contextsuite,第一個 AI 辦公室套件。
人類每年在辦公工作上花費 2.5 兆小時。Context 可以一次性處理大部分工作。@josephsemrai

2025年7月8日
認識 Context,首個 AI 辦公室套件。
人類每年在辦公工作上花費 2.5 兆小時。Context 可以一次性處理大部分工作。
歡迎來到 vibe-working 的時代。
今天就註冊或標記 @contextsuite 並給出提示。
9/
@kevinlu625 介紹了 Orchids - 世界上第一個 AI 工具,讓你可以與 AI 聊天,構建看起來和感覺都不像是 "AI 生成" 的應用程式和網站。

2025年7月8日
介紹 Orchids - 世界上第一個 AI 工具,讓你可以與 AI 聊天,建立看起來和感覺都不像是「AI 生成」的應用程式和網站。
在內部基準測試中,Orchids 在一般應用程式和網站創建任務上的表現比市場上任何其他工具高出近 3 倍。
如果你不相信我們,請在 orchids [dot] app 試試看 :)
留言「orchids」,我們將給你 2 天的無限信用。
10/
@Trae_ai 開源了 Trae-Agent。你現在可以呼叫 `git clone` `cd trae-agent` 了!🔥

2025年7月4日
我們已經開源了 Trae-Agent。
你現在可以全部 'git clone' 'cd trae-agent'
11/
如果你想大幅加快發佈的迭代速度,你必須使用 playwright MCP,並告訴你的代理如何在你的 AGENT(.)md(或 cursor/claude/gemini 規則)中使用它。
@ryancarson

2025年7月10日
如果你想大幅加快發佈的迭代速度,你必須使用 playwright mcp 並告訴你的代理如何在你的 (或 cursor/claude/gemini 規則) 中使用它
巨大的解鎖
12/
使用 Google Agent Development Kit (ADK) 建立具有結構化輸出的客戶支持票務代理,100% 開源代碼。🤝 @Saboo_Shubham_
@AgentOpsAI 原生支持 Google ADK。

2025年7月6日
使用 Google Agent Development Kit 建立具有結構化輸出的客戶支持票務代理。
100% 開源代碼,附有逐步教程:
13/
@tryramp – 進入代理協調的第一步。 @diegozaks
這是一個一體化的財務操作平台,幫助企業節省時間和金錢。受到超過40,000個團隊的信賴。

2025年7月10日
AI 的使用者體驗尚未存在。
想像力、品味,以及對代理人與人類反饋循環的執著——這就是我們如何做到正確的方式。來看看 @tryramp 在代理協調方面的第一步。
劇透警告,這不僅僅是聊天。
14/
這個 Claude MCP AI 代理取代了你超過 20 萬美元的運營團隊。
它審核了 @aryanXmahajan 的整個業務,找到了 12 個瓶頸,並建立了他 5 個準備投入生產的 n8n 代理。

2025年7月9日
這個 Claude MCP AI 代理取代了你 $200K+ 的運營團隊。
我可能不應該免費分享這個系統...
當我在凌晨 3 點玩 Pokemon Go 嘗試抓 Pikachu 時,它審核了我的整個業務,找到了 12 個瓶頸,並為我建造了 5 個生產就緒的 n8n 代理。
效率提升絕對瘋狂。
大多數創始人花幾個月的時間聘請收費 $500/小時的運營顧問,只是告訴你什麼地方出問題了。
這個代理系統在幾分鐘內完成他們的整個工作。
當你部署它時會發生什麼:
→ 在 3 分鐘內運行完整的商業智能審核(顧問需要幾週的時間)
→ 確定 12 個以上的工作流程瓶頸,影響你的效率
→ 設計量身定制的代理系統,符合你的業務需求
→ 建造 5 個以上具有先進錯誤處理的自主 AI 代理
→ 創建智能協調層,將所有內容同步在一起
→ 在 10 分鐘內交付完整的運營轉型
顧問收取 $50K 的整個審核現在只需 10 分鐘。
不需要任何技術知識
不需要昂貴的顧問
不需要幾個月的來回溝通
只需描述你當前的設置,然後看它如何建立你的代理帝國。
數學非常簡單:
$200K 的運營團隊薪水對比一次性 MCP 部署。
這每月節省 $16,600。
系統包括:
- 智能商業堆棧分析器
- 瓶頸檢測 AI
- 自定義代理架構師
- 自主代理建造者
- 完整的部署文檔
這正是建立 7 位數運營基礎設施的系統。
而你現在可以免費獲得它。
關注 + 轉發 + 評論 "MCP",我今晚會把完整的設置指南發給你。
不要錯過這個機會。
每週你等待的時間都是 30 小時以上的手動工作,你永遠無法再回來。
15/
@mckaywrigley分享了他關於如何使用 Claude Code 進行筆記和研究的 1 小時教程。📝

2025年7月10日
這是我關於如何使用 Claude Code 進行筆記和研究的 1 小時教程。
10 倍您的筆記:
- 核心代理程式流程
- 自訂指令
- 自動標籤/鏈接
- 子代理程式
- 雲端使用情況
- STT
目標是讓你對未來的工作進行“代理藥丸”。
在 61 分鐘內觀看 10 個提示 + 演示。
16/
@JulianGoldieSEO 分享這個新的 AI 操作系統 🤯

2025年7月9日
這個全新的 AI 作業系統太瘋狂了!🤯
想要完整指南嗎?私訊我。
17/
@JulianGoldieSEO 測試了每一個 AI 網站建設者,只有一個是他實際會使用的 - MiniMax。

2025年7月8日
MiniMax 是 AI 代理的詹姆斯·邦德。
我測試了每一個 AI 網站建設者。
只有一個創建了我實際會使用的東西。
Minimax M1 質量指標:
→ 像素完美的設計執行
→ 功能性互動元素
→ 專業的多媒體整合
→ 響應式佈局優化
→ 真實內容生成
保存這個評估,它將指導你的工具選擇 📐
想要完整指南嗎?私訊我。 📥
20/
@nebiusaistudio 部落格:代理人 101 – 大規模推出生產級 AI 代理 🤖
全部由 Nebius AI Studio 提供支持 – 30 多個開源模型、快速推理、具成本效益的層級,以及無縫的即插即用兼容性。
感謝包含 @AgentOpsAI!

2025年7月11日
🤖 Nebius 部落格新文章:Agent 101 – 大規模推出生產級 AI 代理
從概念驗證到生產級系統,我們分解完整堆疊:
✅ LLMs
✅ 框架:@crewaiinc, @LangChainAI, @Google ADK, @AgnoAgi
✅ 可觀察性:@helicone_ai, @AgentOpsAI, @keywordsai
✅ 實時基礎:@Linkup_platform
✅ 記憶、工具使用、評估等更多內容
🧠 全部由 Nebius AI Studio 提供支持 – 30 多個開源模型、快速推理、具成本效益的層級,以及無縫的即插即用兼容性。

21/
「對於代理來說,可靠性是遊戲的名稱,而在可預見的未來,這不太可能僅僅在模型層面上解決..」@anaganath

2025年7月6日
Reliability is the name of the game for agents, and it's unlikely to be solved purely at the model layer for the foreseeable future. This is creating green shoots for infrastructure builders, with a few interesting trends starting to emerge:
1. Simulation as CI for agents:
a) The most valuable piece of data today is trajectory data i.e. collections of task (P) -> {t1, t2... tk} mappings. With more trajectory data, agents can be improved with techniques like RFT.
b) Since these trajectories can be quite specific to a company's underlying data (D), you need to be able to actually simulate the behavior of agents within your environment vs. rely on 3P trajectory data.
So, how might you do this?
- Maintain an agent and MCP registry for an enterprise, and a staging environment. Bootstrap a metadata layer that contains the objective of each agent, the tools it has access to, the scope of each agent vis.a.vis each tool etc. Your SDK may need to generate MCP servers on the fly for certain internal applications.
- Execute scenarios in staging for each agent by providing prompt / task variations, inspecting the tool calls produced and evaluating performance against a multi-objective reward function (e.g. performance against the objective, minimization of tool invocations).
- A critical component is accurately providing quantifiable reward functions for each agent that unlock high-fidelity evals and close the loop for reliable CI.
- All of this needs to be productized: easy-to-adopt infrastructure that developers can extend, but with batteries included. You can start to see a new paradigm forming—not unit tests for code, but simulation harnesses for agents.
What happens when you get trajectory data?
2. Enterprises will move to "context lakes":
- An evolving, queryable memory layer that serves as a hub for agent trajectories enriched by enterprise data stored in the delta lake / SNOW. A potent mix of a knowledge base, a semantic cache, and an execution log.
- Extremely fast reads for inference-time retrieval that supports high QPS.
- As mentioned in a prior post, the semantic cache (really interesting opportunity for startups) will cluster task–trajectory pairs (e.g., via k-means), enabling fast retrieval and “result fusing” during planning or tool selection.
Agents will dip into the context lake constantly. High QPS, low-latency context fetch will become as important as fast embedding search is today.
3. Agent authentication becomes a first-class concern:
-Traditional OAuth and API key models break down when agents act on behalf of users and themselves, across long-lived sessions.
-You need a framework for agent identity, delegation, and scoping—one that supports things like tool level permissions, task bound credentials and delegation graphs.
We’re entering an era where testing software means simulating behavior, querying software means retrieving context, and securing software means authenticating autonomous agents.
22/
@jxnlco 分享了為什麼你的編碼代理不再需要 rag,以及 rag 發生了什麼事。💭

2025年7月11日
為什麼你的編碼代理不再需要 RAG
Cline 的 Nik Pash 解釋了為什麼他不再推薦 RAG 用於自主編碼代理,他的觀點比我預期的更有說服力。
應用層正在縮小。我們圍繞 LLMs 建立的所有巧妙工程隨著模型的改進而變得過時。
RAG 發生了什麼:
上下文窗口大幅擴展,使嵌入搜索變得不必要
編碼代理在直接訪問文件時表現更好,而不是分塊嵌入
當你將溫度設置為 0 時,幻覺甚至不是問題
嵌入存儲的安全問題相當重要
現代編碼代理如 Klein 使用 Nik 所謂的 "敘事完整性",讓代理通過 grep 等工具有機地探索代碼,完整閱讀文件,並遵循自己的思路。這模仿了資深工程師的實際工作方式。
甚至雲代碼的 Boris 也承認他們嘗試過 RAG 並放棄了。這一模式很明顯。
RAG 仍然有意義的情況:
預算限制(嵌入搜索使用更少的標記)
大量非結構化數據湖
一些非編碼用例
但對於認真的工程團隊來說?停止用嵌入搜索分散你的編碼代理的注意力。讓他們直接閱讀代碼,自然建立理解,並專注執行。
真正的問題不是 RAG 是否已死,而是你是否仍然堅持過時的解決方案,而更簡單的方法現在效果更好。
23/
@AgentOpsAI 已準備好開始為我們的代理託管產品進行專案上線。如果你想要將你的代理投入生產,請私訊我。📩
@braelyn_ai @AlexReibman @ssslomp

2025年7月11日
AgentOps 已經準備好開始為我們的代理託管進行項目上線。如果你想要將你的代理投入生產,請私訊我。
32.69K
熱門
排行
收藏