Hacker News

Hagyd abba a kontextusablak égetését – Hogyan csökkentjük az MCP-kimenetet 98%-kal a Claude Code-ban

Ismerje meg, hogyan csökkentettük 98%-kal az MCP-eszköz teljesítményét a Claude Code programban, hogy megakadályozzuk a kontextusablak kimerülését, és hogy az AI-kódolási asszisztensek a legjobb teljesítményt nyújtsák.

8 min read

Mewayz Team

Editorial Team

Hacker News

Rejtett adó minden mesterséges intelligenciával működő munkafolyamatnál

Ha értelmes időt töltött az AI-kódoló asszisztensekkel való építéssel, akkor a falnak ütközött. Nem az, ahol a modell hallucinálja vagy félreérti a szándékodat – a finomabb, frusztrálóbb, ahol a tökéletesen alkalmas mesterségesintelligencia-partnered hirtelen elveszíti a cselekményt a beszélgetés közben. Elfelejti a három üzenettel ezelőtt tárgyalt fájlstruktúrát. Újra beolvassa a már elemzett fájlokat. Kezd ellentmondani saját korábbi javaslatainak. A bűnös nem a modell minősége, hanem a kontextusablak kimerülése, és a legnagyobb tényező a felfújt eszközkimenet, amelyet senki sem kért.

Ez a probléma nem elméleti. Az MCP (Model Context Protocol) integrációra építő csapatok a Claude Code, Cursor és hasonló, mesterséges intelligencia által vezérelt fejlesztői környezetekben felfedezték, hogy az eszközválaszaik rutinszerűen 50-100-szor több adatot adnak vissza, mint amennyire a modellnek valójában szüksége van. Egy egyszerű adatbázis-lekérdezés teljes sémakiíratokat ad vissza. A fájlkeresés teljes könyvtárfát ad vissza. Az API állapotellenőrzése hetek múltra visszamenőleg oldalszámozott naplókat ad vissza. Minden felesleges token beemészti a véges környezeti ablakot, rontva a ténylegesen fontos feladatok teljesítményét. A javítás nem bonyolult, de alapvető változást igényel az AI-eszközök tervezésében.

Miért szakad meg a Windows kontextusa a modellek előtt?

A modern nagy nyelvi modellek, mint például a Claude, nagyvonalú kontextusablakokkal rendelkeznek – 200 000 token számos konfigurációban. Ez egészen addig hangzik, amíg rá nem jön, hogy a szerszámigényes munkafolyamatok milyen gyorsan emésztik fel. Egyetlen MCP-eszközhívás, amely egy teljes, 500 soros adatbázistáblát ad vissza, 15 000-30 000 tokent égethet el egyetlen válaszban. Láncoljon öt vagy hat ilyen hívást egy hibakeresési munkamenetben, és már a kontextusablak felét felhasználta, mielőtt egyetlen kódsort írna. A modell nem lesz hülyébb – szó szerint elfogy a helye, hogy megőrizze a beszélgetést.

Az összetett hatás az, ami ezt annyira rombolóvá teszi. Amikor a kontextus tömörítésre vagy csonkolásra kerül, hogy új információkhoz illeszkedjen, a modell elveszíti a hozzáférést a beszélgetésből származó korábbi utasításokhoz, építészeti döntésekhez és kialakult mintákhoz. A végén ismételgeti önmagát, helyreállítja a kontextust, és azt nézi, ahogy a mesterséges intelligencia hibázik, amit tíz üzenettel korábban nem tett volna. A szolgáltatásokat szűk határidőn belül szállító mérnöki csapatok számára ez közvetlenül az elveszett órákat és a kódminőség romlását jelenti.

A Mewayznél pontosan ezzel a problémával találkoztunk a 207 modulból álló üzleti platformunk építése során. Fejlesztési munkafolyamatunk nagymértékben támaszkodik a mesterséges intelligencia által támogatott kódolásra az összekapcsolt modulokon keresztül – CRM, számlázás, bérszámfejtés, HR, analitika –, ahol az egyik modul változása gyakran átcsap a másikba. Amikor az MCP-eszközeink kimenetei felduzzadtak, Claude egyetlen munkameneten belül elvesztette a modulok közötti függőségek nyomát. A megoldás megkövetelte, hogy minden eszközre adott választ az alapoktól kezdve újragondoljunk.

A 98%-os csökkentési keretrendszer: Négy alapelv, amely mindent megváltoztatott

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

Az MCP-kimenet 98%-os csökkentése nem az információk eltávolításáról szól, hanem arról, hogy csak azokat az információkat adja vissza, amelyekre a modellnek szüksége van a következő döntéshez. A megkülönböztetés számít. Egy felhasználói rekordot visszaadó eszköznek nem kell minden mezőt tartalmaznia, amikor a modell csak azt kérdezte, hogy a felhasználó létezik-e. A fájlkeresésnek nem kell fájltartalmat visszaadnia, ha a modellnek csak fájlútvonalakra van szüksége. Minden válasznak a feltett kérdésre kell válaszolnia, semmi többre.

Íme a négy alapelv, amelyek optimalizálták az optimalizálást:

Összegzéseket ad vissza, nem adatkészleteket. Ahelyett, hogy 200 sort adna vissza egy lekérdezésből, adjon vissza egy számot és a 3-5 legrelevánsabb sort. Ha a modellnek többre van szüksége, kérhet egy adott szeletet. Ez az egyetlen változtatás általában 80-90%-kal csökkenti a teljesítményt az adatigényes eszközökön.

Használjon strukturált, minimális sémákat. Távolítson el minden olyan mezőt, amely nem kapcsolódik közvetlenül az eszköz deklarált céljához. A „telepítési állapot ellenőrzése” eszköznek állapotot, időbélyeget és hibát (ha van ilyen) kell visszaadnia – nem a teljes telepítési jegyzéket, a környezeti változókat és az összeállítási naplókat.

Manó

Frequently Asked Questions

What is context window exhaustion and why does it matter?

Context window exhaustion occurs when an AI coding assistant runs out of usable memory mid-conversation due to bloated tool outputs. This causes the model to forget earlier context, re-read files unnecessarily, and contradict its own suggestions. For teams relying on AI-powered development workflows, this silently degrades productivity and output quality, turning a capable assistant into an unreliable one without any obvious error message.

How did you reduce MCP output by 98%?

We restructured our MCP tool responses to return only essential data instead of verbose, unfiltered outputs. By implementing smart summarization, selective field returns, and context-aware truncation, we eliminated the noise that was consuming precious context tokens. The result is that Claude Code maintains coherent, productive conversations for significantly longer sessions — enabling complex, multi-step engineering tasks without losing the thread.

Does this optimization work with platforms like Mewayz?

Absolutely. Mewayz is a 207-module business OS starting at $19/mo that relies on efficient AI automation across its entire platform. Optimized MCP outputs mean AI-assisted workflows within tools like Mewayz at app.mewayz.com run faster and more reliably, since every saved token translates directly into longer productive sessions and more accurate responses when managing complex business operations.

Can I apply these MCP optimization techniques to my own projects?

Yes. The core principles — minimizing response payloads, returning only requested fields, and summarizing large datasets before passing them to the model — are universally applicable. Whether you're building custom MCP servers or integrating third-party tools with Claude Code, auditing your tool outputs for unnecessary verbosity is the single highest-impact optimization you can make to extend productive conversation length.

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start managing your business smarter today

Join 30,000+ businesses. Free forever plan · No credit card required.

Ready to put this into practice?

Join 30,000+ businesses using Mewayz. Free forever plan — no credit card required.

Start Free Trial →

Ready to take action?

Start your free Mewayz trial today

All-in-one business platform. No credit card required.

Start Free →

14-day free trial · No credit card · Cancel anytime