Một tuần trong AI Agents giống như một năm trong phần mềm truyền thống. Dưới đây là mọi thứ đã xảy ra trong tuần này trong AI Agents từ Ramp, Agno, AgentOps, NVIDIA, AutoGen, Context Suite, Replit, Nebius, Firebase, Pipedream, Trae, v.v. 🧵 (lưu lại để dùng sau)
2/ @nvidia tiết lộ nghiên cứu đột phá cho phép người dùng ngay lập tức nhận được câu trả lời cho các câu hỏi có độ dài của một bách khoa toàn thư Kỹ thuật này sẽ cho phép các nhân viên theo dõi các cuộc trò chuyện kéo dài hàng tháng hoặc xem xét hàng triệu dòng mã máy tính
NVIDIA AI Developer
NVIDIA AI Developer8 thg 7, 2025
Điều gì sẽ xảy ra nếu bạn có thể hỏi một chatbot một câu hỏi có kích thước bằng toàn bộ bách khoa toàn thư — và nhận được câu trả lời trong thời gian thực? Nhiều triệu truy vấn mã thông báo với người dùng gấp 32 lần hiện có thể thực hiện được với Helix Parallelism, một sự đổi mới của #NVIDIAResearch thúc đẩy suy luận ở quy mô lớn. 🔗
5/ Blog v2.0 @AgentOpsAI hiện đang hoạt động! 🖇 Đưa bạn đến gần hơn một bước với thế giới của khả năng quan sát, cơ sở hạ tầng và hoạt động của tác nhân. @n_sri_laasya
Sri Laasya Nutheti 🖇️
Sri Laasya Nutheti 🖇️10 thg 7, 2025
Blog v2.0 @AgentOpsAI hiện đang hoạt động! đưa bạn đến gần hơn một bước với thế giới quan sát tác nhân, cơ sở hạ tầng và hoạt động
6/ @Firebase đang thúc đẩy phát triển AI tác nhân với Firebase Studio. 🚀
Firebase
Firebase10 thg 7, 2025
We're advancing agentic AI development with Firebase Studio. Get the details of the latest update ↓
7/ Gặp gỡ @contextsuite, bộ ứng dụng văn phòng AI đầu tiên. Nhân loại dành 2,5 nghìn tỷ giờ mỗi năm cho công việc văn phòng. Bối cảnh có thể chụp hầu hết nó. @josephsemrai
Joseph Semrai
Joseph Semrai8 thg 7, 2025
Meet Context, the first AI office suite. Humanity spends 2.5 trillion hours a year on office work. Context can one-shot most of it. Welcome to the era of vibe-working. Sign up today or tag @contextsuite with a prompt.
9/ @kevinlu625 giới thiệu Orchids - công cụ AI đầu tiên trên thế giới cho phép bạn trò chuyện với AI để xây dựng các ứng dụng và trang web không giống như "AI tạo ra".
Kevin Lu
Kevin Lu8 thg 7, 2025
Introducing Orchids - the world's first AI tool that lets you chat with AI to build apps and websites that don't look and feel "AI generated". On internal benchmarks, Orchids performs close to 3x better on general app and website creation tasks than any other tool on the market. If you don't believe us, give it a try at orchids [dot] app :) Comment “orchids” and we'll give you 2 days of unlimited credits.
10/ @Trae_ai Trae-Agent mã nguồn mở. Bạn có thể gọi 'git clone' là 'cd trae-agent' ngay bây giờ! 🔥
TRAE
TRAE4 thg 7, 2025
We’ve open-sourced Trae-Agent. You can all `git clone` `cd trae-agent` now
11/ Nếu bạn muốn tăng tốc độ lặp lại vận chuyển của mình, bạn PHẢI sử dụng nhà viết kịch MCP và cho đại lý của bạn biết cách sử dụng nó trong AGENT(.)MD (hoặc quy tắc con trỏ / Claude / Gemini) @ryancarson
Ryan Carson
Ryan Carson10 thg 7, 2025
If you want to massively speed up your iteration on shipping, you've GOT to use playwright mcp and tell your agent how to use it in your (or cursor/claude/gemini rules) HUGE unlock
12/ Xây dựng Đại lý yêu cầu hỗ trợ khách hàng với đầu ra có cấu trúc bằng cách sử dụng mã nguồn mở 100% Bộ công cụ phát triển đại lý của Google (ADK). 🤝 @Saboo_Shubham_ @AgentOpsAI hỗ trợ Google ADK nguyên bản.
Shubham Saboo
Shubham Saboo6 thg 7, 2025
Xây dựng Đại lý yêu cầu hỗ trợ khách hàng với đầu ra có cấu trúc bằng Bộ công cụ phát triển đại lý của Google. Mã nguồn mở 100% với hướng dẫn từng bước:
13/ @tryramp – bước đầu tiên vào điều phối tác nhân. @diegozaks Nền tảng hoạt động tài chính tất cả trong một giúp doanh nghiệp tiết kiệm thời gian và tiền bạc. Được 40.000+ đội tin tưởng.
Diego Zaks
Diego Zaks10 thg 7, 2025
The UX of AI doesn’t exist yet. Imagination, taste, and obsessing over the agent-human feedback loop—that’s how we’ll get it right. Meet @tryramp's first step into agentic orchestration. Spoiler alert, it's not just chat.
14/ Tác nhân AI Claude MCP này thay thế Nhóm Hoạt động 200 nghìn đô la + của bạn. Nó đã kiểm toán toàn bộ hoạt động kinh doanh của @aryanXmahajan, tìm thấy 12 nút thắt cổ chai và xây dựng 5 đại lý n8n sẵn sàng sản xuất của anh ấy.
Aryan Mahajan
Aryan Mahajan9 thg 7, 2025
Tác nhân AI Claude MCP này thay thế Nhóm Hoạt động 200 nghìn đô la + của bạn. Có lẽ tôi không nên chia sẻ hệ thống chính xác miễn phí... trong khi tôi đang cố gắng bắt Pikachu lúc 3 giờ sáng trên Pokemon Go, nó đã kiểm tra toàn bộ công việc kinh doanh của tôi, tìm thấy 12 nút thắt cổ chai và xây dựng cho tôi 5 đại lý n8n sẵn sàng sản xuất tăng hiệu quả là hoàn toàn ĐIÊN RỒ Hầu hết các nhà sáng lập đều dành hàng tháng để thuê các nhà tư vấn OPS, những người tính phí 500 đô la / giờ chỉ để cho bạn biết những gì bị hỏng Hệ thống tác nhân này thực hiện toàn bộ công việc của họ trong vài phút Dưới đây là những gì xảy ra khi bạn triển khai nó: → chạy kiểm tra kinh doanh thông minh hoàn chỉnh trong 3 phút (mất vài tuần tư vấn) → xác định 12+ nút thắt quy trình làm việc giết chết hiệu quả của bạn → kiến trúc sư hệ thống đại lý tùy chỉnh phù hợp với doanh nghiệp của bạn → xây dựng 5+ tác nhân AI tự động với khả năng xử lý lỗi nâng cao → tạo ra lớp điều phối thông minh đồng bộ hóa mọi thứ với nhau → cung cấp chuyển đổi hoạt động hoàn toàn trong vòng chưa đầy 10 phút toàn bộ cuộc kiểm toán mà các nhà tư vấn tính phí 50 nghìn đô la hiện xảy ra trong 10 phút KHÔNG cần kiến thức kỹ thuật KHÔNG yêu cầu tư vấn đắt tiền KHÔNG CÓ tháng qua lại Chỉ cần mô tả thiết lập hiện tại của bạn và xem nó xây dựng đế chế đặc vụ của bạn Phép toán đơn giản ngu ngốc: Mức lương của nhóm hoạt động 200 nghìn đô la so với triển khai MCP một lần đó là 16,600 đô la tiết kiệm được hàng tháng Hệ thống bao gồm: - Máy phân tích ngăn xếp kinh doanh thông minh - AI phát hiện nút cổ chai - Kiến trúc sư đại lý tùy chỉnh - Trình tạo đại lý tự trị - Tài liệu triển khai hoàn chỉnh Đây là hệ thống chính xác xây dựng cơ sở hạ tầng hoạt động 7 con số và bạn đang nhận được nó miễn phí Theo dõi + RT + bình luận "MCP" & Tôi sẽ gửi cho bạn hướng dẫn thiết lập ĐẦY ĐỦ tối nay Đừng ngủ trên cái này Mỗi tuần bạn chờ đợi là 30+ giờ làm việc thủ công mà bạn sẽ không bao giờ quay lại
15/ @mckaywrigley chia sẻ hướng dẫn 1 giờ của mình về cách sử dụng Claude Code cho ghi chú và nghiên cứu. 📝
Mckay Wrigley
Mckay Wrigley10 thg 7, 2025
Đây là hướng dẫn 1 giờ của tôi về cách sử dụng Claude Code cho ghi chú và nghiên cứu. Gấp 10 lần ghi chú của bạn với: - các luồng tác nhân cốt lõi - lệnh tùy chỉnh - thẻ / liên kết tự động - đại lý phụ - sử dụng đám mây - STT Mục tiêu là "đại lý" bạn về tương lai của công việc. Xem 10 mẹo + bản demo trong 61 phút.
16/ @JulianGoldieSEO chia sẻ Hệ điều 🤯 hành AI mới này
Julian Goldie SEO
Julian Goldie SEO9 thg 7, 2025
This NEW AI Operating System is INSANE! 🤯 Want the full guide? DM me.
17/ @JulianGoldieSEO đã thử nghiệm mọi trình tạo trang web AI và chỉ có một công cụ được tạo ra mà anh ấy thực sự sử dụng - MiniMax.
Julian Goldie SEO
Julian Goldie SEO8 thg 7, 2025
MiniMax is the James Bond of AI agents. I tested every AI website builder. Only one created something I'd actually use. Minimax M1 Quality Indicators: → Pixel-perfect design execution → Functional interactive elements → Professional multimedia integration → Responsive layout optimization → Real content generation Save this evaluation, it will guide your tool selection 📐 Want the full guide? DM me. 📥
20/ @nebiusaistudio blog: Đại lý 101 – Ra mắt các đại lý AI đạt tiêu chuẩn sản xuất quy mô lớn 🤖 Tất cả đều được cung cấp bởi Nebius AI Studio – 30+ mô hình mã nguồn mở, suy diễn nhanh, các mức giá tiết kiệm chi phí và khả năng tương thích liền mạch. Cảm ơn vì đã đưa @AgentOpsAI vào!
456550
45655011 thg 7, 2025
🤖 New on the Nebius blog: Agent 101 – Launching production‑grade AI agents at scale From proof‑of‑concept to production-level systems, we break down the full stack: ✅ LLMs ✅Frameworks: @crewaiinc, @LangChainAI, @Google ADK, @AgnoAgi ✅Observability: @helicone_ai, @AgentOpsAI, @keywordsai ✅Real-time grounding: @Linkup_platform ✅Memory, tool usage, evals & more 🧠All powered by Nebius AI Studio – 30+ open-source models, fast inference, cost-effective tiers, and seamless drop-in compatibility.
21/ "Độ tin cậy là tên gọi của trò chơi đối với các đại lý, và khó có khả năng được giải quyết chỉ ở tầng mô hình trong tương lai gần.." @anaganath
Aditya Naganath
Aditya Naganath6 thg 7, 2025
Reliability is the name of the game for agents, and it's unlikely to be solved purely at the model layer for the foreseeable future. This is creating green shoots for infrastructure builders, with a few interesting trends starting to emerge: 1. Simulation as CI for agents: a) The most valuable piece of data today is trajectory data i.e. collections of task (P) -> {t1, t2... tk} mappings. With more trajectory data, agents can be improved with techniques like RFT. b) Since these trajectories can be quite specific to a company's underlying data (D), you need to be able to actually simulate the behavior of agents within your environment vs. rely on 3P trajectory data. So, how might you do this? - Maintain an agent and MCP registry for an enterprise, and a staging environment. Bootstrap a metadata layer that contains the objective of each agent, the tools it has access to, the scope of each agent vis.a.vis each tool etc. Your SDK may need to generate MCP servers on the fly for certain internal applications. - Execute scenarios in staging for each agent by providing prompt / task variations, inspecting the tool calls produced and evaluating performance against a multi-objective reward function (e.g. performance against the objective, minimization of tool invocations). - A critical component is accurately providing quantifiable reward functions for each agent that unlock high-fidelity evals and close the loop for reliable CI. - All of this needs to be productized: easy-to-adopt infrastructure that developers can extend, but with batteries included. You can start to see a new paradigm forming—not unit tests for code, but simulation harnesses for agents. What happens when you get trajectory data? 2. Enterprises will move to "context lakes": - An evolving, queryable memory layer that serves as a hub for agent trajectories enriched by enterprise data stored in the delta lake / SNOW. A potent mix of a knowledge base, a semantic cache, and an execution log. - Extremely fast reads for inference-time retrieval that supports high QPS. - As mentioned in a prior post, the semantic cache (really interesting opportunity for startups) will cluster task–trajectory pairs (e.g., via k-means), enabling fast retrieval and “result fusing” during planning or tool selection. Agents will dip into the context lake constantly. High QPS, low-latency context fetch will become as important as fast embedding search is today. 3. Agent authentication becomes a first-class concern: -Traditional OAuth and API key models break down when agents act on behalf of users and themselves, across long-lived sessions. -You need a framework for agent identity, delegation, and scoping—one that supports things like tool level permissions, task bound credentials and delegation graphs. We’re entering an era where testing software means simulating behavior, querying software means retrieving context, and securing software means authenticating autonomous agents.
22/ @jxnlco chia sẻ lý do tại sao các nhân viên lập trình của bạn không cần rag nữa và điều gì đang xảy ra với rag. 💭
jason liu
jason liu11 thg 7, 2025
Tại sao các tác nhân lập trình của bạn không cần rag nữa Nik Pash từ Cline giải thích lý do tại sao anh ấy không còn đề xuất rag cho các tác nhân mã hóa tự động và quan điểm của anh ấy đánh mạnh hơn tôi mong đợi. lớp ứng dụng đang thu hẹp. Tất cả các kỹ thuật thông minh mà chúng tôi xây dựng xung quanh LLM tiếp tục trở nên lỗi thời khi các mô hình được cải thiện. Điều gì đang xảy ra với Rag: Cửa sổ ngữ cảnh mở rộng đáng kể, khiến tìm kiếm nhúng trở nên không cần thiết Các tác nhân mã hóa hoạt động tốt hơn với truy cập tệp trực tiếp so với nhúng phân đoạn Ảo giác thậm chí không phải là vấn đề khi bạn đặt nhiệt độ thành 0 Mối quan tâm về bảo mật với bộ nhớ nhúng là rất quan trọng Thay vì rag, các tác nhân mã hóa hiện đại như Klein sử dụng cái mà Nik gọi là "tính toàn vẹn của tường thuật". Cho phép tác nhân khám phá mã một cách tự nhiên thông qua các công cụ như gREP, đọc toàn bộ tệp và làm theo dòng suy nghĩ của riêng mình. Điều này bắt chước cách các kỹ sư cao cấp thực sự làm việc. Ngay cả Boris của Cloud Code cũng thừa nhận họ đã thử rag và từ bỏ nó. Mô hình rõ ràng. Khi giẻ vẫn có ý nghĩa: Hạn chế ngân sách (tìm kiếm nhúng sử dụng ít mã thông báo hơn) Hồ dữ liệu phi cấu trúc khổng lồ Một số trường hợp sử dụng không phải mã hóa Nhưng đối với các nhóm kỹ thuật nghiêm túc? Ngừng làm mất tập trung các tác nhân mã hóa của bạn bằng cách nhúng tìm kiếm. Hãy để họ đọc mã trực tiếp, xây dựng sự hiểu biết một cách tự nhiên và thực hiện với sự tập trung. Câu hỏi thực sự không phải là liệu Rách rách có chết hay không, mà là liệu bạn có còn bám vào các giải pháp lỗi thời khi các cách tiếp cận đơn giản hơn hiện nay hoạt động tốt hơn.
23/ @AgentOpsAI đã sẵn sàng bắt đầu các dự án giới thiệu cho sản phẩm lưu trữ đại lý của chúng tôi. DM cho tôi nếu bạn đang muốn sản xuất đại lý của mình. 📩 @braelyn_ai @AlexReibman @ssslomp
Braelyn 🖇️
Braelyn 🖇️11 thg 7, 2025
AgentOps is ready to start onboarding projects for our agent hosting. DM if youre looking to productionize your agent
32,83K