Onyesha HN: Beji inayoonyesha jinsi codebase yako inavyofaa katika dirisha la muktadha la LLM
Maoni
Mewayz Team
Editorial Team
Codebase Yako Ina Kipimo Kipya Kinachofaa Kwa Kweli
Kwa miongo kadhaa, wasanidi programu wamezingatia mistari ya msimbo, utata wa cyclomatic, asilimia ya matumizi ya majaribio na marudio ya utumiaji. Lakini kipimo kipya kinaunda upya kwa utulivu jinsi timu za wahandisi zinavyofikiri kuhusu misingi yao ya msimbo: kufaa kwa dirisha la muktadha — asilimia ya msimbo wako wote ambao LLM inaweza kuchimbua kwa haraka moja. Inaonekana rahisi kiudanganyifu, lakini nambari hii inakuwa mojawapo ya viashirio vya vitendo vya jinsi timu yako inavyoweza kutumia zana za maendeleo zinazosaidiwa na AI. Na ikiwa unaipuuza, unaacha faida kubwa za tija kwenye meza.
Wazo hili lilipata mvuto hivi majuzi katika jumuiya za wasanidi programu baada ya kuibuka kwa mradi unaozalisha beji rahisi - si tofauti na ngao zako za upitishaji-jengo au ngao za kufunika - kuonyesha ni kiasi gani cha hazina yako kinacholingana ndani ya madirisha ya muktadha maarufu wa LLM. Ilizua mazungumzo mazuri ya kushangaza kuhusu usanifu wa codebase, monorepos dhidi ya huduma ndogo, na kama tunapaswa kubuni msimbo wetu kwa ufahamu wa AI. Madokezo ni ya ndani zaidi kuliko wasanidi wengi walivyotambua hapo awali.
Ni Muktadha Gani Hupima Dirisha Inayolingana
Kila muundo mkubwa wa lugha hufanya kazi ndani ya kidirisha chenye kikomo cha muktadha - kiwango cha juu cha maandishi ambacho kinaweza kuchakatwa mara moja. GPT-4 Turbo hushughulikia takriban tokeni 128K. Miundo ya hivi punde ya Claude inasukuma tokeni 200K zilizopita. Gemini anadai zaidi ya milioni. Unapolisha msingi wako wa msimbo katika mojawapo ya miundo hii kwa uchanganuzi, mapendekezo ya urekebishaji upya, au ugunduzi wa hitilafu, modeli hiyo inaweza tu "kuona" kinachofaa ndani ya dirisha hilo. Kila kitu zaidi yake hakionekani, kana kwamba hakipo.
Kulingana kwa dirisha la muktadha hupima uwiano kati ya saizi ya jumla ya msimbo wako (katika tokeni) na kidirisha cha muktadha wa muundo fulani. Hazina inayoonyesha tokeni 80K inatosheleza 100% katika muundo wa tokeni wa 200K - AI inaweza kufahamu mradi wako wote kwa pasi moja. Monorepo ya ishara ya milioni 2? Unaangalia asilimia za tarakimu moja, kumaanisha AI inafanya kazi na vipande, kamwe haielewi picha kamili. Tofauti hii ni muhimu sana kwa ubora wa mapendekezo ya msimbo yanayozalishwa na AI, hakiki za usanifu na urekebishaji kiotomatiki.
Dhana ya beji huangazia hili katika kipimo kinachoonekana, kinachoweza kushirikiwa. Ibandike kwenye README yako pamoja na hali yako ya CI na asilimia ya chanjo. Inawaambia wachangiaji na watunzaji jambo muhimu sana: msimbo huu ni wa kirafiki kwa AI kwa kiasi gani?
Kwa Nini Kipimo Hiki Hubadilisha Jinsi Timu Huunda Programu
Maamuzi ya usanifu wa programu kila wakati yametokana na maswala ya kibinadamu - usomaji, udumishaji, utendakazi, muundo wa timu. Context window fit inatanguliza mshikadau mpya katika mazungumzo haya: kipanga programu jozi cha AI. Wakati codebase yako yote inafaa ndani ya dirisha la muktadha, zana za AI zinaweza kufikiria juu ya maswala mtambuka, kutambua minyororo hila ya utegemezi, na kupendekeza mabadiliko ambayo akaunti kwa mfumo kamili. Ikiwa sivyo, unauliza AI kurekebisha jikoni yako huku akiionyesha bafuni pekee.
Hii ina madhara ya kiutendaji ambayo uongozi wa uhandisi unaanza kutiliwa maanani. Timu zilizo na alama zinazolingana na muktadha wa juu huripoti matokeo bora zaidi kutoka kwa zana za kukagua msimbo wa AI. Viwango vya ugunduzi wa hitilafu huboreshwa kwa sababu muundo unaweza kufuatilia njia za utekelezaji kwenye faili zote. Mapendekezo ya urekebishaji yanakuwa sawa kiusanifu badala ya kuwa bora zaidi ya ndani lakini yanaharibu ulimwengu. Timu moja ya wahandisi katika kampuni ya SaaS ya ukubwa wa kati iliandika 40% ya kupunguza urejeshaji uliopendekezwa na AI baada ya kugawanya shirika lao moja katika huduma ndogo, zinazofaa madirisha.
Kipimo pia huunda utendaji wa kulazimisha kwa mbinu bora za uhandisi ambazo timu zinapaswa kufuata hata hivyo. Misimbo ambayo ina alama vyema kwenye kidirisha cha dirisha la muktadha huwa na mipaka ya moduli safi, msimbo usiokufa, utengano bora wa wasiwasi, na hazina zilizolengwa zaidi. Kipimo cha ufahamu wa AI huishia kuwa proksi kwa afya ya jumla ya msimbo.
Athari za Usanifu Hakuna Mtu Aliyetarajia
Mazungumzo kuhusu kufaa kwa dirisha la muktadha yameibua mjadala wa monorepo dhidi ya polyrepo kwa mwelekeo mpya kabisa. Watetezi wa Monorepo kwa muda mrefu wamebishana kuwa kuweka kila kitu katika hazina moja hurahisisha usimamizi wa utegemezi, huwezesha ahadi za atomiki katika huduma zote, na hupunguza maumivu ya ushirikiano. Lakini wakati monorepo yako inapata tokeni milioni 5 na dirisha bora zaidi la muktadha ni 200K, umeunda msingi wa msimbo ambao hakuna zana ya AI inayoweza kuelewa kikamilifu.
Hii haimaanishi kwamba monorepos wamekufa - mbali nayo. Timu zenye akili zinapata nafasi ya kati. Mikakati inayojitokeza ni pamoja na:
- Kuchanganya kwa akili: Kwa kutumia faili za .contextignore (sawa na .gitignore) ili kuwatenga msimbo uliozalishwa, utegemezi wa wauzaji, na urekebishaji wa majaribio kutoka kwa uchanganuzi wa AI
- Ramani za muktadha wa kiwango cha moduli: Kuunda faili nyepesi ambazo husaidia zana za AI kuelewa ni faili zipi zinazohusiana na vipengele vipi bila kupakia kila kitu
- Nyaraka za usanifu kama muktadha: Ikiwa ni pamoja na rekodi fupi za uamuzi wa usanifu (ADRs) ambazo huipa AI uelewa wa kimuundo bila kuhitaji kukisia uhusiano kutoka kwa msimbo pekee
- Uchimbaji wa huduma za kimkakati: Kutenganisha moduli zinazojitegemea kweli katika hazina tofauti wakati hazina maswala mtambuka halisi na mfumo mkuu
Ufahamu muhimu ni kwamba uboreshaji wa kufaa kwa dirisha la muktadha sio juu ya kufanya codebase yako kuwa ndogo - ni juu ya kuifanya ieleweke zaidi, kwa zana za AI na kwa wanadamu wanaofanya kazi pamoja nazo.
Kupima Misimbo Yako Mwenyewe: Mfumo wa Kiutendaji
Kabla ya kuanza kurekebisha mfumo wako mzima ili kufuata kipimo cha beji, inafaa kuelewa jinsi ya kupima kidirisha cha muktadha kwa njia inayofaa. Hesabu ghafi ya tokeni ya hazina yako yote ni mahali pa kuanzia, lakini ni chombo butu. Mbinu iliyochanganuliwa zaidi inazingatia kile ambacho AI inahitaji kuona kwa kazi tofauti.
"Swali la kweli si kama codebase yako yote inafaa katika dirisha la muktadha - ni ikiwa muktadha husika wa kazi yoyote unalingana. Msimbo ulioundwa vyema na mipaka iliyo wazi huruhusu zana za AI kupakia kile wanachohitaji, hata kama hazina jumla ni kubwa."
💡 DID YOU KNOW?
Mewayz replaces 8+ business tools in one platform
CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.
Start Free →
Ili kupata kipimo cha vitendo, anza kwa kuweka alama kwenye msimbo wako mkuu wa maombi - bila kujumuisha node_modules, saraka za wauzaji, vizalia vya kuunda na faili zilizotengenezwa. Viashiria vingi vya kisasa (kama vile tiktoken ya OpenAI au njia za kuhesabu tokeni zilizochapishwa za Anthropic) vinaweza kuchakata saraka kwa sekunde. Linganisha matokeo dhidi ya madirisha ya muktadha wa miundo ambayo timu yako hutumia. Ikiwa msimbo wako wa msingi wa programu unalingana ndani ya dirisha moja la muktadha na nafasi ya kuhifadhi kwa vidokezo na maagizo, uko katika umbo bora. Ikiwa inazidi dirisha kwa 2-5x, chunking ya kimkakati itakuwa muhimu. Zaidi ya 10x, utataka kuwekeza katika mabadiliko ya usanifu au mabomba maalum ya RAG (retrieval-augmented generation) ili kuwezesha zana za AI.
Kwa timu zinazounda mifumo kama vile Mewayz, ambapo usanifu wa moduli tayari unatenganisha hoja katika sehemu tofauti - CRM, ankara, HR, takwimu, na zaidi ya 200 zingine - kipimo hiki kinavutia sana. Kila sehemu hufanya kazi kama kitengo kinachojitosheleza chenye violesura wazi, ambavyo kwa kawaida hupanga visehemu vinavyofaa muktadha. Ni aina ya muundo wa usanifu ambao hulipa gawio kwa udumishaji wa binadamu na ufahamu wa AI.
Jumuiya ya Wasanidi Programu Inajadili Nini Hasa
Mjadala wa Habari za Hacker kuhusu beji za dirisha-muktadha uliibua mivutano kadhaa ya kuvutia katika jumuiya ya wasanidi programu. Ya kwanza ni ya kifalsafa: tunapaswa kubuni msimbo kwa matumizi ya AI? Watakasaji wanabishana kuwa kanuni inapaswa kuandikwa kwa ajili ya wanadamu kwanza, na zana za AI zinafaa kubadilika. Pragmatists wanapinga kwamba ikiwa chaguo rahisi la usanifu litaifanya timu yako kuwa na tija kwa 30% kwa kutumia zana za AI bila gharama sifuri kwa usomaji wa binadamu, kukataa kuifanya ni itikadi badala ya uhandisi.
Mjadala wa pili unahusu iwapo kufaa kwa dirisha la muktadha ni kipimo thabiti kinachostahili kufuatiliwa. Madirisha ya muktadha yamekua kwa kasi - kutoka tokeni za 4K mwanzoni mwa GPT-3.5 hadi zaidi ya milioni moja katika Gemini 1.5 Pro. Ikiwa madirisha yanaendelea kupanuka, ya leo "haifai" inakuwa kesho "inafaa kwa urahisi." Lakini wahandisi wenye uzoefu wanasema kwamba hata kwa madirisha makubwa ya muktadha, utendaji wa mfano huharibika kwa urefu wa muktadha. Kielelezo cha kuchakata tokeni za 50K za msimbo unaolengwa, unaofaa utafanya kazi vizuri zaidi kuliko muundo sawa wa usindikaji wa tokeni za 500K za monorepo inayosambaa, hata kama zote mbili "zinafaa." Ubora wa muktadha ni muhimu kama vile wingi.
Mazungumzo ya tatu, ya vitendo zaidi yanahusu zana. Wasanidi programu wanataka miunganisho ya IDE inayofahamu muktadha ambayo huamua kiotomatiki faili zitakazojumuisha wakati wa kutuma msimbo kwa AI. Wanataka akili ya kiwango cha hazina ambayo inaelewa mipaka ya moduli bila usanidi wa mwongozo. Miradi kadhaa ya programu huria sasa inashughulikia tatizo hili haswa, na kujenga ni kiasi gani kwa "wakusanyaji muktadha" ambao hukusanya seti bora ya faili kwa kazi yoyote iliyopewa ya kusaidiwa na AI.
Kugeuza Hii kuwa Faida ya Ushindani
Kwa biashara - sio tu timu za wasanidi - usawa wa dirisha la muktadha una athari zinazofaa kueleweka. Makampuni ambayo husafirisha programu haraka, na hitilafu chache, kwa gharama ya chini, hushinda masoko yao. Ukuzaji unaosaidiwa na AI ni kizidishi cha nguvu halisi, lakini tu wakati msingi wa msingi umeundwa kuchukua fursa hiyo. Mashirika ambayo yanawekeza katika misingi ya kanuni zinazofaa AI leo yanaunda manufaa shirikishi ambayo yataongezeka baada ya muda.
Kanuni hii inaenea zaidi ya makampuni safi ya programu. Biashara zinazoendeshwa kwenye mifumo kama vile Mewayz, ambayo huunganisha CRM, ankara, malipo, HR, usimamizi wa meli na uchanganuzi katika mfumo mmoja wa moduli, hunufaika na falsafa hii katika kiwango cha utendaji. Wakati data ya biashara yako inaishi katika moduli zilizoundwa vizuri, zilizounganishwa badala ya kutawanyika katika zana 15 za SaaS zilizotenganishwa, AI inaweza kujadiliana kuhusu utendakazi wako wote - kutambua mifumo katika mauzo, usaidizi na fedha ambayo haitaonekana katika mifumo iliyofungwa. Kanuni hiyo hiyo inayoifanya codebase kuwa rafiki kwa AI hufanya biashara ifae AI: muundo wazi, mipaka safi na muktadha mpana.
Njia ya vitendo kwa viongozi wa uhandisi ni ya moja kwa moja. Anza kupima kidirisha cha muktadha wako leo - hata kwa njia isiyo rasmi. Iongeze kwenye dashibodi zako za afya ya uhandisi kando ya nyakati za ujenzi na matumizi ya majaribio. Itumie kama ingizo moja (sio pembejeo pekee) wakati wa kufanya maamuzi ya usanifu. Na utambue kwamba misingi ya msimbo ambayo itafaidika zaidi kutoka kwa kizazi kijacho cha zana za ukuzaji wa AI ndiyo inayoundwa kwa ajili ya kueleweka sasa hivi.
Beji Ni Kianzilishi cha Mazungumzo, Sio Lengwa
Beji ya README inayoonyesha "87% inafaa kwa muktadha - Claude 200K" ni jambo dogo. Inachukua sekunde kuzalisha na kuchukua mstari mmoja katika nyaraka za mradi wako. Lakini kile inachowakilisha - kujitolea kwa makusudi, na kupimika kwa ufahamu wa codebase - kuashiria kitu cha maana kuhusu vipaumbele vya timu ya wahandisi. Inasema: tunafikiri kuhusu jinsi msimbo wetu utakavyoeleweka, si tu na msanidi programu anayefuata, bali na mifumo ya AI ambayo inazidi kuwa sehemu ya kila mtiririko wa maendeleo.
Tokeo muhimu zaidi la mtindo huu si beji yenyewe. Ni mazungumzo yanayoibua wakati wa ukaguzi wa usanifu, upangaji wa mbio za kasi, na mijadala ya madeni ya kiufundi. Wakati "muktadha wa kufaa kwa dirisha" inakuwa sehemu ya msamiati wako wa uhandisi, unaanza kufanya maamuzi ambayo hufanyika ili kupatana na kila kitu ambacho tumejua kuhusu muundo mzuri wa programu kwa miongo kadhaa: moduli ndogo zilizolengwa zilizo na violesura wazi na uunganishaji mdogo. Mapinduzi ya AI hayakubuni kanuni hizi. Lakini inazipa timu sababu mpya, inayoweza kubainika hatimaye kuzifuata.
Maswali Yanayoulizwa Sana
Dirisha la muktadha ni nini na kwa nini ni muhimu?
Kulingana kwa dirisha la muktadha hupima ni asilimia ngapi ya codebase yako LLM inaweza kuchakata kwa kidokezo kimoja. Asilimia ya juu ina maana kwamba zana za AI zinaweza kuelewa zaidi mradi wako kwa wakati mmoja, na hivyo kusababisha mapendekezo bora ya msimbo, urekebishaji sahihi zaidi, na maono machache. Uendelezaji unaosaidiwa na AI unavyozidi kuwa wa kawaida, kipimo hiki huathiri moja kwa moja jinsi timu yako inavyoweza kuwa na tija kwa kutumia zana kama vile Copilot, Cursor na Claude.
Je, ninawezaje kuangalia kidirisha cha muktadha wa codebase yangu?
Unaweza kutumia zana ya beji huria iliyoshirikiwa kwenye Hacker News ili kutengeneza kiashirio cha kuona cha hazina yako. Hukokotoa jumla ya hesabu yako ya tokeni ya codebase na kuilinganisha na madirisha ya muktadha maarufu wa LLM. Beji inaonyesha asilimia ya alama unayoweza kupachika katika README yako, ikiwapa wachangiaji na washikadau picha ya papo hapo ya jinsi mradi wako ulivyo tayari kwa AI.
Je, ni mikakati gani inayoboresha alama za kidirisha cha muktadha wa codebase?
Zingatia usanifu wa kawaida, utenganisho wazi wa wasiwasi, na uondoe msimbo uliokufa. Monorepo zilizo na muundo mzuri na mipaka ya kimantiki huruhusu LLMs kuchakata moduli zinazofaa kwa kujitegemea. Kupunguza marudio ya msimbo, kuweka faili kwa ufupi, na kudumisha miti safi ya utegemezi yote huchangia. Mifumo kama vile Mewayz huonyesha kanuni hii — kufunga moduli 207 kwenye Mfumo wa Uendeshaji wa biashara ulioratibiwa iliyoundwa kwa udumishaji na ufanisi.
Je, msingi mdogo wa msimbo huwa unamaanisha uoanifu bora wa AI?
Sio lazima. Codebase ndogo iliyo na tegemezi zilizochanganyikana na uwekaji hati duni inaweza kuwa ngumu kwa LLM kufikiria kuliko kubwa zaidi, iliyopangwa vizuri. Jambo kuu ni ni kiasi gani cha muktadha kinachofaa kinafaa ndani ya dirisha. Vifupisho safi, kanuni thabiti za kutaja majina, na muundo wa moduli huruhusu zana za AI kufanya kazi kwa ufanisi hata wakati haziwezi kumeza kila safu ya msimbo mara moja.
We use cookies to improve your experience and analyze site traffic. Cookie Policy