Hacker News

Uri HN: Badge li turi kemm il-codebase tiegħek tidħol sew fit-tieqa tal-kuntest ta' LLM

Kummenti

14 min read Via github.com

Mewayz Team

Editorial Team

Hacker News

Il-Codebase Tiegħek Għandha Metrika Ġdida Li Attwalment Tgħodd

Għal għexieren ta' snin, l-iżviluppaturi ossessjonaw fuq linji ta' kodiċi, kumplessità ċiklomatika, perċentwali ta' kopertura tat-test, u frekwenza ta' skjerament. Iżda metrika ġdida qed tfassal bil-kwiet kif it-timijiet tal-inġinerija jaħsbu dwar il-bażijiet tal-kodiċi tagħhom: fit-tieqa tal-kuntest — il-perċentwal tal-kodiċi kollu tiegħek li LLM jista 'jiddiġerixxi f'pront wieħed. Jidher sempliċi b'mod qarrieqi, iżda dan in-numru qed isir wieħed mill-indikaturi l-aktar prattiċi ta 'kemm it-tim tiegħek jista' jinfluwenza b'mod effettiv għodod ta 'żvilupp assistit mill-AI. U jekk qed tinjoraha, qed tħalli qligħ sinifikanti fil-produttività fuq il-mejda.

L-idea reċentement kisbet trazzjoni fil-komunitajiet tal-iżviluppaturi wara li ħarġet proġett li jiġġenera badge sempliċi — mhux b'differenza mill-ilqugħ familjari tal-build-passing jew tal-kopertura tiegħek — li turi eżattament kemm tar-repożitorju tiegħek jidħol fit-twieqi tal-kuntest LLM popolari. Qajmet konverżazzjoni sorprendentement rikka dwar l-arkitettura tal-kodiċi, il-monorepos versus il-mikroservizzi, u jekk għandniex inkunu qed infasslu l-kodiċi tagħna għal komprensjoni tal-AI. L-implikazzjonijiet huma aktar profondi milli l-biċċa l-kbira tal-iżviluppaturi inizjalment jirrealizzaw.

Liema Fit-Tieqa tal-Kuntest Toqgħod Attwalment Tkejjel

Kull mudell lingwistiku kbir jopera f'tieqa ta' kuntest finit — l-ammont massimu ta' test li jista' jipproċessa f'daqqa. GPT-4 Turbo jimmaniġġja madwar 128K tokens. L-aħħar mudelli ta 'Claude jimbuttaw il-passat ta' 200K tokens. Gemini jippretendi aktar minn miljun. Meta tgħaddi l-codebase tiegħek f'wieħed minn dawn il-mudelli għal analiżi, suġġerimenti ta' refactoring, jew skoperta ta 'bugs, il-mudell jista' biss "jara" dak li jidħol ġewwa dik it-tieqa. Kollox lil hinn minnu huwa inviżibbli, bħallikieku ma jeżistix.

Fit-tieqa tal-kuntest tkejjel il-proporzjon bejn id-daqs totali tal-codebase tiegħek (f'tokens) u t-tieqa tal-kuntest ta' mudell partikolari. Repożitorju li tokenizza għal 80K tokens jikseb 100% tajbin f'mudell ta '200K tokens - l-AI tista' tifhem il-proġett kollu tiegħek f'pass wieħed. Monorepo ta' 2 miljun token? Qed tħares lejn perċentwali b'ċifra waħda, jiġifieri l-AI qed taħdem bi frammenti, qatt ma tifhem l-istampa sħiħa. Din id-distinzjoni hija importanti ħafna għall-kwalità tas-suġġerimenti tal-kodiċi ġġenerati mill-AI, ir-reviżjonijiet arkitettoniċi, u r-refactoring awtomatizzat.

Il-kunċett tal-badge jikkristallizza dan f'metrika viżibbli u li tista' tinqasam. Waħħalha fil-README tiegħek flimkien mal-istatus tas-CI tiegħek u l-perċentwal ta' kopertura. Jgħid lill-kontributuri u lill-mantenituri xi ħaġa ġenwinament utli: din il-codebase kemm hi faċli għall-AI?

Għaliex Din il-Metrika Tbiddel Kif It-Timijiet Jibnu Software

Id-deċiżjonijiet dwar l-arkitettura tas-software dejjem kienu mmexxija minn tħassib uman — il-leġibbiltà, il-mantenibbiltà, il-prestazzjoni, l-istruttura tat-tim. Fit-tieqa tal-kuntest tintroduċi parti interessata ġdida f'dawn il-konversazzjonijiet: il-programmatur tal-par AI. Meta l-kodiċi kollu tiegħek jidħol f'tieqa tal-kuntest, l-għodod tal-IA jistgħu jirraġunaw dwar tħassib trasversali, jidentifikaw ktajjen ta 'dipendenza sottili, u jissuġġerixxu bidliet li jammontaw għas-sistema sħiħa. Meta ma jagħmilx hekk, essenzjalment tkun qed titlob lil AI biex tirranġa l-kċina tiegħek filwaqt li turiha biss il-kamra tal-banju.

Dan għandu konsegwenzi prattiċi li t-tmexxija tal-inġinerija qed jibdew jieħdu bis-serjetà. Timijiet b'punteġġi għoljin ta' konformità mal-kuntest jirrappurtaw riżultati aħjar li jistgħu jitkejlu minn għodod ta' reviżjoni tal-kodiċi AI. Ir-rati ta' sejbien tal-bug jitjiebu minħabba li l-mudell jista' jittraċċa mogħdijiet ta' eżekuzzjoni tul il-fajls. Is-suġġerimenti ta' refactoring isiru arkitettonikament sodi aktar milli lokalment ottimali iżda globalment distruttivi. Tim wieħed ta' inġinerija f'kumpanija SaaS ta' daqs medju ddokumentatnaqqis ta' 40 % fir-rigressjonijiet ssuġġeriti mill-AIwara qasmet il-monorepo tagħhom f'servizzi iżgħar, li jiffavorixxu t-tieqa tal-kuntest.

Il-metrika toħloq ukoll funzjoni ta' sfurzar għal prattiki ta' inġinerija tajba li t-timijiet għandhom ikunu qed isegwu xorta waħda. Il-bażijiet ta' kodiċi li jagħtu punteġġ tajjeb fit-tieqa tal-kuntest għandhom it-tendenza li jkollhom konfini tal-moduli aktar nodfa, inqas kodiċi mejjet, separazzjoni aħjar tat-tħassib, u repożitorji aktar iffukati. Il-metrika tal-komprensjoni tal-AI tispiċċa tkun prokura għas-saħħa ġenerali tal-kodiċi.

L-Implikazzjonijiet ta' l-Arkitettura Ħadd ma Stennija

Il-konversazzjoni dwar l-adattament tat-tieqa tal-kuntest reġgħet qabdet id-dibattitu monorepo versus polyrepo b'dimensjoni kompletament ġdida. L-avukati ta 'Monorepo ilhom jargumentaw li ż-żamma ta' kollox f'repożitorju wieħed tissimplifika l-ġestjoni tad-dipendenza, tippermetti impenji atomiċi bejn is-servizzi, u jnaqqas l-uġigħ fl-integrazzjoni. Imma meta l-monorepo tiegħek jegħleb għal 5 miljun tokens u l-aħjar tieqa tal-kuntest disponibbli hija 200K, inti ħloqt bażi ta' kodiċi li l-ebda għodda AI ma tista' tifhem bis-sħiħ.

Dan ma jfissirx li l-monorepos huma mejta - bogħod minnha. Timijiet intelliġenti qed isibu triq tan-nofs. Strateġiji li qed jitfaċċaw jinkludu:

  • Tqattigħ intelliġenti: L-użu ta' fajls .contextignore (simili għal .gitignore) biex teskludi kodiċi ġġenerat, dipendenzi mill-bejjiegħ, u attrezzaturi tat-test mill-analiżi AI
  • Mapep tal-kuntest fil-livell tal-modulu: Il-ħolqien ta' manifesti ħfief li jgħinu lill-għodod tal-AI jifhmu liema fajls għandhom x'jaqsmu ma' liema karatteristiċi mingħajr ma jitgħabbew kollox
  • Dokumentazzjoni ta' l-arkitettura bħala kuntest: Inkluż rekords ta' deċiżjonijiet ta' arkitettura konċiżi (ADRs) li jagħtu lill-AI fehim strutturali mingħajr ma teħtieġ li tiddeduċi relazzjonijiet mill-kodiċi biss
  • Estrazzjoni ta' servizz strateġiku: Tkissir ta' moduli ġenwinament indipendenti f'repożitorji separati meta ma jkollhom l-ebda tħassib trasversali reali mas-sistema ewlenija

L-għarfien ewlieni huwa li l-ottimizzazzjoni għat-twaħħil tat-tieqa tal-kuntest mhix dwar li tagħmel il-kodiċi tal-bażi tiegħek iżgħar — hija dwar li tagħmilhaaktar komprensibbli, kemm għall-għodod tal-IA kif ukoll għall-bnedmin li jaħdmu flimkien magħhom.

Il-Kejl tal-Codebase Tiegħek: Qafas Prattiku

Qabel ma tibda tirrefactoring is-sistema kollha tiegħek biex tissegwi metrika ta' badge, ta' min tifhem kif tkejjel il-qagħda tat-tieqa tal-kuntest b'mod sinifikanti. L-għadd ta' tokens mhux ipproċessati tar-repożitorju kollu tiegħek huwa punt tat-tluq, iżda huwa strument ċar. Approċċ aktar sfumat jikkunsidra dak li l-AI fil-fatt jeħtieġ li tara għal kompiti differenti.

"Il-mistoqsija reali mhix jekk il-codebase kollu tiegħek jidħolx f'tieqa ta' kuntest — huwa jekk il-kuntest relevanti għal kwalunkwe kompitu partikolari jaqbilx. Codebase strutturat tajjeb b'konfini ċari jħalli lill-għodod tal-AI jgħabbu eżattament dak li għandhom bżonn, anki jekk ir-repożitorju totali huwa massiv."

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

Biex tikseb kejl prattiku, ibda billi tokenizza l-kodiċi tal-applikazzjoni prinċipali tiegħek — esklużi node_modules, direttorji tal-bejjiegħa, artifacts tal-bini, u fajls iġġenerati. Il-biċċa l-kbira tat-tokenizers moderni (bħall-tiktoken ta' OpenAI jew il-metodi tal-għadd tat-tokens ippubblikati ta' Anthropic) jistgħu jipproċessaw direttorju f'sekondi. Qabbel ir-riżultat mat-twieqi tal-kuntest tal-mudelli li t-tim tiegħek fil-fatt juża. Jekk il-kodiċi tal-applikazzjoni prinċipali tiegħek jidħol f'tieqa ta' kuntest wieħed bi spazju għal mistoqsijiet u istruzzjonijiet, int f'forma eċċellenti. Jekk taqbeż it-tieqa b'2-5x, ikun meħtieġ qsim strateġiku. Lil hinn minn 10x, tkun trid tinvesti f'bidliet arkitettoniċi jew pipelines RAG (ġenerazzjoni miżjuda bl-irkuprar) speċjalizzati biex l-għodod tal-IA jkunu effettivi.

Għal timijiet li jibnu fuq pjattaformi bħal Mewayz, fejn l-arkitettura modulari diġà tissepara t-tħassib f'moduli distinti — CRM, fatturazzjoni, HR, analytics, u aktar minn 200 oħra — dan il-kejl isir partikolarment interessanti. Kull modulu jiffunzjona bħala unità awtonoma b'interfaces ċari, li b'mod naturali jimmappa għal biċċiet li jiffavorixxu t-tieqa tal-kuntest. Huwa t-tip ta' mudell arkitettoniku li jħallas id-dividendi kemm għall-manutenzjoni tal-bniedem kif ukoll għall-komprensjoni tal-AI.

X'Qed Attwalment Tiddibatti l-Komunità tal-Iżviluppaturi

Id-diskussjoni Hacker News dwar badges tat-tieqa tal-kuntest ħarġet diversi tensjonijiet affaxxinanti fil-komunità tal-iżviluppaturi. L-ewwel huwa filosofiku:għandna nfasslu kodiċi għall-konsum tal-AI?Il-puristi jargumentaw li l-kodiċi għandu jinkiteb l-ewwel għall-bnedmin, u l-għodod tal-AI għandhom jadattaw. Il-pragmatisti jirrikkmandaw li jekk għażla arkitettonika sempliċi tagħmel it-tim tiegħek 30% aktar produttiv b'għodod tal-IA bi spiża żero għall-leġġibbiltà tal-bniedem, li tirrifjuta li tagħmilha hija ideoloġija fuq l-inġinerija.

It-tieni dibattitu jiffoka fuq jekk l-adattament tat-tieqa tal-kuntest hijiex saħansitra metrika stabbli li ta' min wieħed isegwi. It-twieqi tal-kuntest kibru b'mod esponenzjali - minn tokens 4K fil-bidu GPT-3.5 għal aktar minn miljun f'Gemini 1.5 Pro. Jekk it-twieqi jibqgħu jespandu, il-lum "ma joqgħodx" isir għada "taqbel faċilment." Iżda inġiniera b'esperjenza jindikaw li anke bi twieqi tal-kuntest enormi, il-prestazzjoni tal-mudell tiddegrada bit-tul tal-kuntest. Mudell li jipproċessa 50K tokens ta 'kodiċi ffukat u rilevanti se jegħleb l-istess mudell li jipproċessa 500K tokens ta' monorepo sprawling, anki jekk it-tnejn teknikament "tajbin." Il-kwalità tal-kuntest hija importanti daqs il-kwantità.

It-tielet, konverżazzjoni aktar prattika ddur madwar l-għodda. L-iżviluppaturi jridu integrazzjonijiet IDE konxji mill-kuntest li jiddeterminaw awtomatikament liema fajls għandhom jinkludu meta jibagħtu kodiċi lil AI. Iridu intelliġenza fil-livell ta 'repożitorju li tifhem il-konfini tal-moduli mingħajr konfigurazzjoni manwali. Bosta proġetti open-source issa qed jindirizzaw din il-problema eżatta, billi jibnu dak li jammontaw għal "kompilaturi tal-kuntest" li jiġbru l-aħjar sett ta' fajls għal kwalunkwe kompitu partikolari assistit mill-AI.

Nbiddlu Dan Fi Vantaġġ Kompetittiv

Għan-negozji — mhux biss timijiet ta' żviluppaturi — l-adattament tat-tieqa tal-kuntest għandu implikazzjonijiet downstream ta' min jiftiehem. Kumpaniji li jibagħtu softwer aktar malajr, b'inqas bugs, bi prezz aktar baxx, jirbħu s-swieq tagħhom. L-iżvilupp assistit mill-AI huwa multiplikatur tal-forza ġenwin, iżda biss meta l-bażi tal-kodiċi sottostanti tkun strutturata biex tieħu vantaġġ minnha. Organizzazzjonijiet li jinvestu f'bażijiet ta' kodiċi li jiffavorixxu l-AI llum qed jibnu vantaġġi ta' taħlit li se jwessgħu maż-żmien.

Dan il-prinċipju jestendi lil hinn mill-kumpaniji tas-softwer puri. In-negozji li jaħdmu fuq pjattaformi bħal Mewayz, li jikkonsolida CRM, fatturazzjoni, pagi, HR, ġestjoni tal-flotta, u analytics f'sistema modulari waħda, jibbenefikaw minn din l-istess filosofija fil-livell operattiv. Meta d-dejta tan-negozju tiegħek tgħix f'moduli interkonnessi u strutturati tajjeb aktar milli mxerrda fuq 15-il għodda SaaS skonnettjata, l-AI tista' tirraġuna dwar l-operat kollu tiegħek — tidentifika mudelli bejn il-bejgħ, l-appoġġ u l-finanzi li jkunu inviżibbli f'sistemi siled. L-istess prinċipju li jagħmel codebase faċli għall-AI jagħmel negozju faċli għall-AI: struttura ċara, konfini nodfa, u kuntest komprensiv.

It-teħid prattiku għall-mexxejja tal-inġinerija huwa sempliċi. Ibda tkejjel it-tieqa tal-kuntest tiegħek illum - anke b'mod informali. Żidha mad-dashboards tas-saħħa tal-inġinerija tiegħek flimkien mal-ħinijiet tal-bini u l-kopertura tat-test. Użaha bħala input wieħed (mhux l-uniku input) meta tieħu deċiżjonijiet arkitettoniċi. U rrikonoxxi li l-bażijiet tal-kodiċi li se jibbenefikaw l-aktar mill-ġenerazzjoni li jmiss ta 'għodod ta' żvilupp AI huma dawk li qed jiġu strutturati għall-komprensibbiltà issa.

Il-Badge Hija Bidu ta' Konversazzjoni, Mhux Id-Destinazzjoni

Badge README li turi "87% context fit — Claude 200K" hija ħaġa żgħira. Huwa jieħu sekondi biex jiġġenera u jokkupa linja waħda fid-dokumentazzjoni tal-proġett tiegħek. Imma dak li jirrappreżenta - impenn intenzjonat u li jista 'jitkejjel għall-komprensibbiltà tal-kodiċi - jindika xi ħaġa sinifikanti dwar il-prijoritajiet ta' tim ta 'inġinerija. Jgħid: naħsbu dwar kif il-kodiċi tagħna se jinftiehem, mhux biss mill-iżviluppatur li jmiss, iżda mis-sistemi AI li huma dejjem aktar parti minn kull fluss tax-xogħol tal-iżvilupp.

L-aktar riżultat ta' valur ta' din it-tendenza mhuwiex il-badge nnifisha. Huma l-konversazzjonijiet li jqanqal waqt reviżjonijiet tal-arkitettura, ippjanar tal-isprints, u diskussjonijiet dwar id-dejn tekniku. Meta "fit-tieqa tal-kuntest" issir parti mill-vokabularju tal-inġinerija tiegħek, tibda tieħu deċiżjonijiet li jiġri li jallinjaw ma 'dak kollu li ilna nafu dwar id-disinn tajjeb tas-softwer għal għexieren ta' snin: moduli żgħar u ffukati b'interfaces ċari u akkoppjar minimu. Ir-rivoluzzjoni tal-IA ma vvintatx dawn il-prinċipji. Iżda qed tagħti lit-timijiet raġuni ġdida u kwantifikabbli biex finalment isegwuhom.

Mistoqsijiet Frekwenti

X'inhi tajba t-tieqa tal-kuntest u għaliex hija importanti?

Fit-tieqa tal-kuntest tkejjel x'perċentwal tal-kodiċi tal-bażi tiegħek jista' jipproċessa LLM f'pront wieħed. Perċentwal ogħla jfisser li l-għodod tal-IA jistgħu jifhmu aktar mill-proġett tiegħek f'daqqa, li jwassal għal suġġerimenti ta' kodiċi aħjar, refactoring aktar preċiż, u inqas alluċinazzjonijiet. Hekk kif l-iżvilupp assistit mill-AI jsir standard, din il-metrika taffettwa direttament kemm jista' jkun produttiv it-tim tiegħek b'għodod bħal Copilot, Cursor u Claude.

Kif nista' niċċekkja t-tieqa tal-kuntest tal-codebase tiegħi?

Tista' tuża l-għodda tal-badge open-source kondiviża fuq Hacker News biex tiġġenera indikatur viżiv għar-repożitorju tiegħek. Jikkalkula l-għadd totali tat-tokens tal-codebase tiegħek u jqabbilha mat-twieqi popolari tal-kuntest tal-LLM. Il-badge turi punteġġ perċentwali li tista' tiddaħħal fil-README tiegħek, li tagħti lill-kontributuri u lill-partijiet interessati stampa immedjata ta' kemm il-proġett tiegħek huwa lest għall-AI.

Liema strateġiji jtejbu l-punteġġ ta' adattament tat-tieqa tal-kuntest ta' codebase?

Ffoka fuq arkitettura modulari, separazzjoni ċara tat-tħassib, u telimina kodiċi mejjet. Monorepos strutturati tajjeb b'konfini loġiċi ħalli LLMs jipproċessaw moduli rilevanti b'mod indipendenti. It-tnaqqis tad-duplikazzjoni tal-kodiċi, iż-żamma tal-fajls konċiżi, u ż-żamma ta 'siġar nodfa tad-dipendenza kollha jikkontribwixxu. Pjattaformi bħal Mewayz juru dan il-prinċipju — ippakkjaw 207 moduli f'OS tan-negozju ssimplifikat iddisinjat għal manutenzjoni u effiċjenza.

Bażi ta' kodiċi iżgħar dejjem tfisser kompatibilità aħjar tal-AI?

Mhux neċessarjament. Bażi ta' kodiċi iżgħar b'dipendenzi mħabbta u dokumentazzjoni fqira tista' tkun aktar diffiċli għall-LLMs biex jirraġunaw dwarha minn waħda akbar u organizzata tajjeb. Dak li jgħodd huwa kemm il-kuntest rilevanti jidħol fit-tieqa. Astrazzjonijiet nodfa, konvenzjonijiet ta' ismijiet konsistenti, u disinn modulari jħallu lill-għodod tal-AI jaħdmu b'mod effettiv anke meta ma jkunux jistgħu jibilgħu kull linja ta' kodiċi f'daqqa.

.

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start managing your business smarter today

Join 30,000+ businesses. Free forever plan · No credit card required.

Ready to put this into practice?

Join 30,000+ businesses using Mewayz. Free forever plan — no credit card required.

Start Free Trial →

Ready to take action?

Start your free Mewayz trial today

All-in-one business platform. No credit card required.

Start Free →

14-day free trial · No credit card · Cancel anytime