在 AI Agents 中一周就像在传统软件中一年。 以下是本周 AI 代理中发生的一切,来自 Ramp、Agno、AgentOps、NVIDIA、AutoGen、Context Suite、Replit、Nebius、Firebase、Pipedream、Trae 等。🧵 (保存以备后用)
2/ @nvidia 揭示了开创性的研究,这将使用户能够立即获得长达百科全书的答案。 该技术将使代理能够跟踪数月的对话或审查数百万行计算机代码。
NVIDIA AI Developer
NVIDIA AI Developer2025年7月8日
如果你可以向一个聊天机器人提问,问题的规模相当于整个百科全书——并实时获得答案,会怎么样呢? 借助 #NVIDIAResearch 的创新 Helix Parallelism,现在可以进行多百万个令牌的查询,用户数量增加了 32 倍,推理在大规模下变得可能。 🔗
5/ Blog v2.0 @AgentOpsAI 现已上线!🖇 让您更接近代理可观察性、基础设施和运营的世界。@n_sri_laasya
Sri Laasya Nutheti 🖇️
Sri Laasya Nutheti 🖇️2025年7月10日
Blog v2.0 @AgentOpsAI 现已上线! 让您更进一步接触代理可观察性、基础设施和运维的世界
6/ @Firebase 正在通过 Firebase Studio 推进自主 AI 的发展。🚀
Firebase
Firebase2025年7月10日
我们正在通过 Firebase Studio 推进自主 AI 的开发。获取最新更新的详细信息 ↓
7/ 认识 @contextsuite,首个 AI 办公套件。 人类每年在办公室工作上花费 2.5 万亿小时。Context 可以一次性处理大部分工作。@josephsemrai
Joseph Semrai
Joseph Semrai2025年7月8日
认识 Context,首个 AI 办公套件。 人类每年在办公室工作上花费 2.5 万亿小时。Context 可以一次性处理大部分工作。 欢迎来到 vibe-working 时代。 今天就注册,或用提示标记 @contextsuite。
9/ @kevinlu625 介绍了 Orchids - 世界上第一个 AI 工具,让你与 AI 聊天,构建看起来和感觉上都不像是 "AI 生成" 的应用和网站。
Kevin Lu
Kevin Lu2025年7月8日
介绍 Orchids - 世界上第一个让你与 AI 聊天以构建看起来和感觉上都不像"AI 生成"的应用和网站的工具。 在内部基准测试中,Orchids 在一般应用和网站创建任务上的表现比市场上任何其他工具高出近 3 倍。 如果你不相信我们,可以在 orchids [dot] app 尝试一下 :) 评论“orchids”,我们将为你提供 2 天的无限信用。
10/ @Trae_ai 开源了 Trae-Agent。你现在可以调用 `git clone` `cd trae-agent` 了!🔥
Trae
Trae2025年7月4日
我们已经开源了 Trae-Agent。 你们现在可以 `git clone` `cd trae-agent` 了。
11/ 如果你想大幅加快你的迭代速度,必须使用 playwright MCP,并告诉你的代理如何在你的 AGENT(.)md(或 cursor/claude/gemini 规则)中使用它。 @ryancarson
Ryan Carson
Ryan Carson2025年7月10日
如果你想大幅加快你的迭代速度,必须使用 playwright mcp,并告诉你的代理如何在你的 (或 cursor/claude/gemini 规则) 中使用它。 巨大的解锁
12/ 使用 Google Agent Development Kit (ADK) 构建具有结构化输出的客户支持工单代理,100% 开源代码。🤝 @Saboo_Shubham_ @AgentOpsAI 原生支持 Google ADK。
Shubham Saboo
Shubham Saboo2025年7月6日
使用 Google Agent Development Kit 构建具有结构化输出的客户支持工单代理。 100% 开源代码和逐步教程:
13/ @tryramp – 迈向代理编排的第一步。 @diegozaks 一个一体化的财务运营平台,帮助企业节省时间和金钱。受到超过40,000个团队的信任。
Diego Zaks
Diego Zaks2025年7月10日
AI 的用户体验尚不存在。 想象力、品味,以及对代理人-人类反馈循环的痴迷——这就是我们将其做对的方式。来看看 @tryramp 在代理编排方面的第一步。 剧透警告,这不仅仅是聊天。
14/ 这个Claude MCP AI代理取代了你超过20万美元的运营团队。 它审计了@aryanXmahajan的整个业务,发现了12个瓶颈,并构建了他5个生产就绪的n8n代理。
Aryan Mahajan
Aryan Mahajan2025年7月9日
这个Claude MCP AI代理可以替代你20万美元以上的运营团队。 我可能不应该免费分享这个确切的系统…… 当我在凌晨3点玩Pokemon Go试图抓到皮卡丘时,它审计了我整个业务,找到了12个瓶颈,并为我构建了5个生产就绪的n8n代理。 效率提升绝对疯狂。 大多数创始人花费数月时间雇佣收费500美元/小时的运营顾问,只是为了告诉你哪里出了问题。 这个代理系统在几分钟内完成他们的全部工作。 部署后会发生以下情况: → 在3分钟内运行完整的商业智能审计(顾问需要几周的时间) → 识别出12个以上的工作流程瓶颈,影响你的效率 → 构建量身定制的代理系统,适合你的业务 → 构建5个以上具有高级错误处理的自主AI代理 → 创建智能编排层,将一切同步在一起 → 在10分钟内交付完整的运营转型 顾问收费5万美元的整个审计现在只需10分钟。 不需要任何技术知识 不需要昂贵的顾问 不需要数月的反复沟通 只需描述你当前的设置,看看它如何构建你的代理帝国。 数学非常简单: 20万美元的运营团队薪水与一次性MCP部署相比。 每月节省16600美元。 系统包括: - 智能商业堆栈分析器 - 瓶颈检测AI - 定制代理架构师 - 自主代理构建器 - 完整的部署文档 这就是构建七位数运营基础设施的确切系统。 而你将免费获得它。 关注 + 转发 + 评论 "MCP",我今晚会把完整的设置指南发给你。 不要错过这个机会。 你每周等待的时间都是30多个小时的手动工作,你永远无法找回。
15/ @mckaywrigley分享了他关于如何使用 Claude Code 进行笔记和研究的 1 小时教程。📝
Mckay Wrigley
Mckay Wrigley2025年7月10日
这是我关于如何使用 Claude Code 进行笔记和研究的 1 小时教程。 10 倍您的笔记: - 核心代理流 - 自定义命令 - 自动标签/链接 - 子代理 - 云使用 - STT 目标是让你对未来的工作“代理药丸”。 在 61 分钟内观看 10 个提示 + 演示。
16/ @JulianGoldieSEO 分享这个新的 AI 操作系统 🤯
Julian Goldie SEO
Julian Goldie SEO2025年7月9日
这个新的人工智能操作系统太疯狂了!🤯 想要完整指南吗?私信我。
17/ @JulianGoldieSEO 测试了每一个 AI 网站构建器,只有一个是他真正会使用的 - MiniMax。
Julian Goldie SEO
Julian Goldie SEO2025年7月8日
MiniMax 是 AI 代理中的詹姆斯·邦德。 我测试了每一个 AI 网站构建器。 只有一个创建了我实际上会使用的东西。 Minimax M1 质量指标: → 像素完美的设计执行 → 功能性互动元素 → 专业的多媒体整合 → 响应式布局优化 → 真实内容生成 保存此评估,它将指导您的工具选择 📐 想要完整指南吗?私信我。 📥
20/ @nebiusaistudio 博客:代理 101 – 大规模推出生产级 AI 代理 🤖 全部由 Nebius AI Studio 提供支持 – 30 多个开源模型,快速推理,经济实惠的层级,以及无缝的即插即用兼容性。 感谢您提到 @AgentOpsAI!
456550
4565502025年7月11日
🤖 Nebius 博客新内容:Agent 101 – 大规模推出生产级 AI 代理 从概念验证到生产级系统,我们分解了完整的技术栈: ✅ LLMs ✅ 框架:@crewaiinc, @LangChainAI, @Google ADK, @AgnoAgi ✅ 可观察性:@helicone_ai, @AgentOpsAI, @keywordsai ✅ 实时基础:@Linkup_platform ✅ 内存、工具使用、评估等更多内容 🧠 所有这些都由 Nebius AI Studio 提供支持 – 30 多个开源模型,快速推理,具有成本效益的层级,以及无缝的兼容性。
21/ “可靠性是代理的游戏名称,在可预见的未来,这不太可能仅仅在模型层面上解决。” @anaganath
Aditya Naganath
Aditya Naganath2025年7月6日
Reliability is the name of the game for agents, and it's unlikely to be solved purely at the model layer for the foreseeable future. This is creating green shoots for infrastructure builders, with a few interesting trends starting to emerge: 1. Simulation as CI for agents: a) The most valuable piece of data today is trajectory data i.e. collections of task (P) -> {t1, t2... tk} mappings. With more trajectory data, agents can be improved with techniques like RFT. b) Since these trajectories can be quite specific to a company's underlying data (D), you need to be able to actually simulate the behavior of agents within your environment vs. rely on 3P trajectory data. So, how might you do this? - Maintain an agent and MCP registry for an enterprise, and a staging environment. Bootstrap a metadata layer that contains the objective of each agent, the tools it has access to, the scope of each agent vis.a.vis each tool etc. Your SDK may need to generate MCP servers on the fly for certain internal applications. - Execute scenarios in staging for each agent by providing prompt / task variations, inspecting the tool calls produced and evaluating performance against a multi-objective reward function (e.g. performance against the objective, minimization of tool invocations). - A critical component is accurately providing quantifiable reward functions for each agent that unlock high-fidelity evals and close the loop for reliable CI. - All of this needs to be productized: easy-to-adopt infrastructure that developers can extend, but with batteries included. You can start to see a new paradigm forming—not unit tests for code, but simulation harnesses for agents. What happens when you get trajectory data? 2. Enterprises will move to "context lakes": - An evolving, queryable memory layer that serves as a hub for agent trajectories enriched by enterprise data stored in the delta lake / SNOW. A potent mix of a knowledge base, a semantic cache, and an execution log. - Extremely fast reads for inference-time retrieval that supports high QPS. - As mentioned in a prior post, the semantic cache (really interesting opportunity for startups) will cluster task–trajectory pairs (e.g., via k-means), enabling fast retrieval and “result fusing” during planning or tool selection. Agents will dip into the context lake constantly. High QPS, low-latency context fetch will become as important as fast embedding search is today. 3. Agent authentication becomes a first-class concern: -Traditional OAuth and API key models break down when agents act on behalf of users and themselves, across long-lived sessions. -You need a framework for agent identity, delegation, and scoping—one that supports things like tool level permissions, task bound credentials and delegation graphs. We’re entering an era where testing software means simulating behavior, querying software means retrieving context, and securing software means authenticating autonomous agents.
22/ @jxnlco 分享了为什么你的编码代理不再需要 rag,以及 rag 现在发生了什么。💭
jason liu
jason liu2025年7月11日
为什么你的编码代理不再需要 RAG 了 Cline 的 Nik Pash 解释了他为什么不再推荐 RAG 用于自主编码代理,他的观点比我预期的更有力。 应用层正在缩小。我们围绕 LLMs 构建的所有聪明工程随着模型的改进而变得过时。 RAG 发生了什么: 上下文窗口大幅扩展,使得嵌入搜索变得不必要 编码代理在直接文件访问时表现更好,而不是分块嵌入 当你将温度设置为 0 时,幻觉甚至不是问题 嵌入存储的安全隐患是显著的 现代编码代理如 Klein 使用 Nik 所称的 "叙事完整性",让代理通过 grep 等工具有机地探索代码,完整阅读文件,并遵循自己的思路。这模仿了高级工程师的实际工作方式。 甚至云代码的 Boris 也承认他们尝试过 RAG 并放弃了。模式很明显。 RAG 仍然有意义的情况: 预算限制(嵌入搜索使用更少的令牌) 大量非结构化数据湖 一些非编码用例 但对于严肃的工程团队来说?停止用嵌入搜索分散你的编码代理的注意力。让他们直接阅读代码,自然建立理解,并专注执行。 真正的问题不是 RAG 是否死了,而是你是否仍然固守过时的解决方案,而更简单的方法现在效果更好。
23/ @AgentOpsAI 准备开始为我们的代理托管产品进行项目入驻。如果您想将您的代理投入生产,请私信我。📩 @braelyn_ai @AlexReibman @ssslomp
Braelyn 🖇️
Braelyn 🖇️2025年7月11日
AgentOps 已准备好开始为我们的代理托管项目进行入驻。如果您希望将您的代理投入生产,请私信我。
32.69K