Hacker News

Is-Millisecond RAG ar Apple Silicon. Dim Gweinydd. Dim API. Un Ffeil

\u003ch2\u003eSub-Millisecond RAG ar Apple Silicon. Dim Gweinydd. Dim API. Un Ffeil\u003c/h2\u003e \u003cp\u003eMae'r ystorfa ffynhonnell agored GitHub hon yn gyfraniad sylweddol i ecosystem y datblygwr. Mae'r prosiect yn arddangos arferion datblygu modern a chodio cydweithredol.\u003c/p\u003e...

4 min read Via github.com

Mewayz Team

Editorial Team

Hacker News
\u003ch2\u003eSub-Millisecond RAG ar Apple Silicon. Dim Gweinydd. Dim API. Un Ffeil\u003c/h2\u003e \u003cp\u003eMae'r ystorfa ffynhonnell agored GitHub hon yn gyfraniad sylweddol i ecosystem y datblygwr. Mae'r prosiect yn arddangos arferion datblygu modern a chodio cydweithredol.\u003c/p\u003e \u003ch3\u003eNodweddion Technegol\u003c/h3\u003e \u003cp\u003e Mae'r ystorfa yn debygol o gynnwys:\u003c/p\u003e \u003cul\u003e \u003cli\u003e Cod glân, wedi'i ddogfennu'n dda\u003c/li\u003e \u003cli\u003eCynhwysfawr README gydag enghreifftiau defnydd\u003c/li\u003e \u003cli\u003eCanllawiau olrhain mater a chyfraniad\u003c/li\u003e \u003cli\u003e Diweddariadau a chynnal a chadw rheolaidd\u003c/li\u003e \u003c/ul\u003e \u003ch3\u003eEffaith Gymunedol\u003c/h3\u003e \u003cp\u003e Mae prosiectau ffynhonnell agored fel hwn yn meithrin rhannu gwybodaeth ac yn cyflymu arloesedd technegol trwy god hygyrch a datblygiad cydweithredol.\u003c/p\u003e

Cwestiynau Cyffredin

Beth yw RAG a pham mae cyflymder is-filieiliad o bwys?

Techneg yw RAG (Adalw-Cynhyrchu Cynyddol) sy'n gwella ymatebion AI trwy adalw cyd-destun perthnasol o sylfaen wybodaeth leol cyn cynhyrchu ateb. Mae adalw is-filieiliad yn golygu bod yr uwchben chwilio bron yn anganfyddadwy, gan wneud i'r AI deimlo'n syth. I ddatblygwyr sy'n adeiladu offer AI lleol neu'n integreiddio cudd-wybodaeth i apiau, mae'r cyflymder hwn yn dileu'r dagfa hwyrni sydd fel arfer yn plagio piblinellau adalw yn y cwmwl - dim aros ar deithiau crwn rhwydwaith neu derfynau cyfradd API.

Oes angen gweinydd neu API cwmwl i redeg hwn?

Na. Dyna gynsail craidd y prosiect hwn - mae popeth yn rhedeg yn gyfan gwbl ar eich Apple Silicon Mac, yn lleol ac all-lein. Nid oes gweinydd i'r ddarpariaeth, dim allwedd API i'w reoli, a dim costau defnydd fesul ymholiad. Mae hyn yn ddelfrydol ar gyfer achosion defnydd sy'n sensitif i breifatrwydd neu amgylcheddau â bylchau aer. Os ydych chi'n chwilio am blatfform popeth-mewn-un ehangach, mae Mewayz yn cynnig 207 o fodiwlau am $19/mis, gan gynnwys offer AI sy'n ategu llifoedd gwaith lleol gyda nodweddion sy'n cael eu pweru gan y cwmwl pan fydd cysylltedd ar gael.

Beth sy'n gwneud Apple Silicon yn arbennig o addas ar gyfer RAG lleol?

Mae sglodion Apple Silicon (M1 ac yn ddiweddarach) yn cynnwys pensaernïaeth cof unedig lle mae'r CPU, GPU, a Neural Engine yn rhannu'r un pwll cof lled band uchel. Mae hyn yn dileu gorbenion trosglwyddo data rhwng unedau prosesu, gan wneud chwiliadau tebygrwydd fector a sefydlu casgliad yn hynod o gyflym. Y canlyniad yw y gall gweithrediadau a fyddai fel arfer angen caledwedd GPU pwrpasol neu weinydd o bell redeg yn effeithlon mewn un broses ar MacBook, gan alluogi'r amseroedd adalw is-filieiliad y mae'r prosiect hwn yn ei ddangos.

Sut alla i raddio'r dull hwn ar gyfer cymhwysiad cynhyrchu?

Ar gyfer prosiectau personol neu dîm bach, mae'r dull un ffeil hwn yn ddigonol ac yn gain. Ar gyfer graddfa gynhyrchu - trin defnyddwyr lluosog, ffynonellau data amrywiol, ac awtomeiddio llif gwaith - bydd angen set offer ehangach arnoch chi. Mae llwyfannau fel Mewayz yn bwndelu 207 o fodiwlau, gan gynnwys AI, CRM, cynnwys, ac offer dadansoddeg, am $19 / mis, gan roi amgylchedd rheoledig i dimau ymestyn prototeipiau lleol yn gynhyrchion llawn heb ailadeiladu seilwaith o'r dechrau. Gall y patrwm RAG lleol a ddangosir yma wasanaethu fel y craidd deallus o fewn pensaernïaeth fwy.