Lokale MCP-kunder er så undervurdert! Alle bruker Cursor, Claude Desktop og ChatGPT som MCP-verter, men hvis du bygger dine egne apper som støtter MCP, trenger du tilpassede klienter. Her er problemet: Å skrive MCP-klienter fra bunnen av er smertefullt og tidkrevende. I dag viser jeg deg hvordan du bygger tilpassede MCP-klienter på minutter, ikke timer. For å bevise dette bygde jeg en helt privat, ultimat AI-assistent som kan: - Kobles til hvilken som helst MCP-server - Automatiserer nettleserbruk - Skraper nettdata sømløst - Styrer terminalen på datamaskinen min - Behandler bilder, lyd og dokumenter - Husker alt med kunnskapsgrafer Hemmeligheten? MCP-bruk – et 100 % åpen kildekode-rammeverk som gjør MCP-integrasjon triviell. Å bygge tilpassede MCP-agenter tar 3 trinn: 1. Definer MCP-serverkonfigurasjonen 2. Koble hvilken som helst LLM til MCP-klienten 3. Distribuer agenten din Det er det. Ingen komplisert oppsett, ingen proprietære avhengigheter. Den beste delen? Alt går lokalt. Dataene dine forblir private, og du kontrollerer hele stabelen. Full oversikt med kode... 👇
La oss bryte dette ned ved å utforske hver integrasjon og forstå hvordan den fungerer, ved hjelp av kode og illustrasjoner:
1️⃣ Stagehand MCP-server Vi begynner med å la agenten vår kontrollere en nettleser, navigere på nettsider, ta skjermbilder osv., ved å bruke @Stagehanddev MCP. Nedenfor stilte jeg et værspørsmål, og agenten svarte autonomt på det ved å starte en nettleserøkt. Sjekk dette👇
2️⃣ Firecrawl MCP-server Deretter legger vi til skraping, gjennomsøking og dype forskningsfunksjoner til agenten. MCP-USE støtter tilkobling til flere MCP-servere samtidig. Så vi legger til den @firecrawl_dev MCP-konfigurasjonen til den eksisterende konfigurasjonen og samhandler med den. Sjekk dette👇
3️⃣ Graphiti MCP-server Så langt er agenten vår hukommelsesløs. Den glemmer alt etter hver oppgave. @Zep_ai's Graphiti er en MCP-server som gir agenten vår et grafbasert sanntidsminnelag. Du kan også visualisere denne grafen i Neo4j. Sjekk dette👇
4️⃣ Ragie MCP-server Deretter tilbyr vi multimodale RAG-funksjoner til agenten for å behandle tekster, bilder, videoer, lyd, dokumenter osv. Den drives av @ragieai MCP. Nedenfor ba jeg den om å liste opp prosjekter i min MCP PDF (et komplekst dokument), og den svarte perfekt. Sjekk dette👇
5️⃣ GitIngest MCP-server Deretter, for å imøtekomme utviklernes behov, lar vi agenten vår chatte med et hvilket som helst GitHub-repositorium. Nedenfor spurte jeg om teknologistabelen til bokforfatterflyten min ved å oppgi repo-lenken. Den hentet ut riktig informasjon ved å bruke MCP-serveren. Sjekk dette👇
6️⃣ Terminal MCP-server Til slutt gir vi agentterminalkontrollen vår for å utføre kommandoer for utvikleren om nødvendig. Den gir verktøy som: - lese/skrive/søke/flytte filer - utføre en kommando - opprette/liste katalog osv. Sjekk dette👇
Til slutt pakker vi dette inn i et Streamlit-grensesnitt, hvor vi dynamisk kan endre MCP-konfigurasjonen. Dette gir oss en 100 % lokal ultimat AI-assistent som kan bla, skrape, har minne, hente fra en multimodal kunnskapsbase og mye mer. Sjekk denne demoen👇
Det er en innpakning! Hvis du syntes det var innsiktsfullt, kan du dele det med nettverket ditt. Finn meg → @akshay_pachaar ✔️ For praktisk innsikt og veiledninger om LLM-er, AI-agenter og maskinlæring!
38,64K