Hacker News

MDST қозғалтқышы: WebGPU/WASM көмегімен шолғышта GGUF үлгілерін іске қосыңыз

MDST қозғалтқышы: WebGPU/WASM көмегімен шолғышта GGUF үлгілерін іске қосыңыз Бұл барлау оның маңыздылығы мен ықтимал әсерін зерттей отырып, mdst-ті зерттейді. Қамтылған негізгі ұғымдар Бұл мазмұн зерттейді: Негізгі принциптер мен теориялар ...

1 min read Via mdst.app

Mewayz Team

Editorial Team

Hacker News

MDST қозғалтқышы: WebGPU/WASM көмегімен шолғышта GGUF үлгілерін іске қосыңыз

MDST механизмі – әзірлеушілер мен компанияларға WebGPU және WebAssembly (WASM) көмегімен GGUF пішіміндегі үлкен тіл үлгілерін тікелей браузер ішінде орындауға мүмкіндік беретін жаңа жұмыс уақыты, бұл арнайы сервер немесе бұлттық GPU қажеттілігін болдырмайды. Толығымен клиенттік AI тұжырымына ауысу веб-қосымшаларда интеллектуалды мүмкіндіктердің жеткізілу ережелерін қайта жазып, жеке, кідіріссіз AI заманауи браузері бар кез келген адамға қолжетімді етеді.

MDST қозғалтқышы дегеніміз не және ол не үшін маңызды?

MDST қозғалтқышы – llama.cpp сияқты жобалармен танымал болатын квантталған GGUF үлгілерін тікелей веб-мәтін ішінде жүктеп, іске қосуға арналған шолғыштың AI қорытынды жүйесі. Әрбір AI сұрауын бұлттың соңғы нүктесі арқылы бағыттаудың орнына, MDST GPU жылдамдатылған есептеуге арналған шолғыштың WebGPU API және жергілікті орталық процессордың қалпына келтіру өнімділігі үшін WebAssembly арқылы пайдаланушының жеке аппараттық құралында модельдік қорытындыны орындайды.

Бұл бірнеше себептерге байланысты өте маңызды. Біріншіден, ол серверлік қорытындыға тән айналу кідірісін жояды. Екіншіден, ол құпия пайдаланушы деректерін толығымен құрылғыда сақтайды, бұл кәсіпорын және тұтынушы қолданбалары үшін құпиялылықтың маңызды артықшылығы болып табылады. Үшіншіден, бұл API қоңырауы үшін төлейтін немесе жеке GPU кластерлерін сақтайтын бизнес үшін инфрақұрылымдық шығындарды күрт төмендетеді.

"Браузерде AI тұжырымын іске қосу бұдан былай тұжырымдаманы дәлелдейтін қызығушылық емес — бұл орталықтандырылмаған пайдаланушы аппараттық құралдары үшін орталықтандырылған бұлт шығындарын сататын, AI-мен жұмыс істейтін қолданбалардың есептеу ауыртпалығын кім көтеретінін түбегейлі өзгертетін өндіріске жарамды архитектура."

WebGPU және WASM браузердегі AI-ны қалай мүмкін етеді?

MDST Engine техникалық негіздерін түсіну үшін ол қолданатын екі негізгі шолғыш примитивіне қысқаша шолу қажет. WebGPU — JavaScript және WGSL шейдер кодынан төмен деңгейлі GPU қатынасын қамтамасыз ететін WebGL мұрагері. Алдыңғы нұсқасынан айырмашылығы, WebGPU LLM қорытындысында басым болатын матрицаны көбейту операцияларының жұмыс күші болып табылатын есептеу шейдерлерін қолдайды. Бұл MDST тензорлық операцияларды графикалық процессорға жоғары параллельді түрде жіберіп, браузердің құм жәшігінде бұрын мүмкін болмаған өткізу қабілетіне қол жеткізе алатынын білдіреді.

WebAssembly қозғалтқыштың негізгі жұмыс уақытының логикасы үшін резерв және жинақ мақсаты ретінде қызмет етеді. WebGPU қолдауы жоқ құрылғылар үшін — ескі браузерлер, белгілі мобильді орталар немесе бассыз сынақ контексттері — WASM стандартты JavaScript-тен әлдеқайда асатын жылдамдықта құрастырылған C++ немесе Rust кодын іске қосатын өнімді, портативті орындау қабатын қамтамасыз етеді. WebGPU және WASM бірге деңгейлі орындау стратегиясын құрайды: GPU - қолжетімді болғанда, біріншіден, процессор - WASM жоқ кезде.

GGUF модельдері дегеніміз не және неге бұл пішім осы тәсілдің негізгі бөлігі болып табылады?

GGUF (GPT-генерацияланған Бірыңғай пішім) – үлгі салмақтарын, токенизатор деректерін және метадеректерді бір портативті артефактқа жинақтайтын екілік файл пішімі. Бастапқыда llama.cpp файлында тиімді жүктеуді қолдау үшін әзірленген GGUF квантталған ашық салмақты үлгілер үшін іс жүзінде стандарт болды, себебі ол әзірлеушілерге үлгі өлшемі, жад көлемі және шығыс сапасы арасындағы келісуді таңдауға мүмкіндік беретін 2-биттен 8-битке дейінгі бірнеше кванттау деңгейлерін қолдайды.

Браузерге негізделген қорытынды үшін кванттау міндетті емес — бұл өте маңызды. Толық дәлдіктегі 7B параметр үлгісі шамамен 14 ГБ жадты қажет етеді. 4-ші тоқсанда кванттау кезінде сол модель шамамен 4 ГБ-қа дейін қысқарады, ал 2-ші тоқсанда ол 2 ГБ-тан төмен түсуі мүмкін. MDST Engine-дің GGUF-ті қолдауы әзірлеушілер интеграцияға кедергіні күрт төмендететін қосымша түрлендіру қадамынсыз қазірдің өзінде квантталған модельдердің ауқымды экожүйесін тікелей пайдалана алатынын білдіреді.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

Браузерде GGUF үлгілерін іске қосатын бизнес үшін нақты әлемдегі қолдану жағдайлары қандай?

Браузердегі GGUF қорытындысының практикалық қолданбалары барлық дерлік салалық вертикалды қамтиды. Бұл тәсілді қолданатын компаниялар бұрын шығынды талап ететін немесе бұлттық AI шешімдерімен құпиялылыққа сәйкес келмейтін мүмкіндіктерді ашады. Негізгі қолдану жағдайлары мыналарды қамтиды:

  • Офлайн жұмыс істейтін AI көмекшілері: Дала топтары мен қашықтағы орталар үшін өте қолайлы, интернет қосылымынсыз толық жұмыс істейтін тұтынушыларға қолдау көрсететін чат-боттар мен ішкі білім базалары.
  • Жеке құжат талдауы: Құпиялық құжаттар пайдаланушы құрылғысынан ешқашан шықпауы керек, бірақ AI көмегімен қорытындылау мен шығарудың пайдасын көретін құқықтық, медициналық және қаржылық жұмыс процестері.
  • Нақты уақыттағы мазмұнды құру: Тікелей браузерге негізделген құралдардың ішінде жекелендірілген көшірмелерді, өнім сипаттамаларын немесе әлеуметтік медиа мазмұнын нөлдік шекті қорытынды құнымен шығаратын маркетингтік топтар.
  • Edge-орналастырылған кодтау көмекшілері: Меншікті код базасын сыртқы API интерфейстеріне жіберместен кодты аяқтауды және түсіндіруді қамтамасыз ететін әзірлеуші өнімділігі құралдары.
  • Білім беру платформалары: Төмен өткізу қабілеттілігі немесе деректер шектелген орталарда AI басқаратын кері байланысты қамтамасыз ететін студенттік құрылғыларда жергілікті түрде жұмыс істейтін бейімделген репетиторлық жүйелер.

Mewayz сияқты платформалар MDST қозғалтқышының мүмкіндіктерін өздерінің экожүйесіне қалай біріктіре алады?

Mewayz, айына 19 доллардан басталатын баға деңгейлері бойынша 138 000-нан астам пайдаланушылар сенім артқан 207-модульдік бизнес операциялық жүйесі, MDST Engine сияқты браузердегі AI қорытынды технологияларынан ең көп пайда алатын платформаның түрі. CRM, электрондық коммерция, мазмұнды басқару, аналитика, топпен бірлесіп жұмыс істеу және т.б. қамтитын модульдері бар Mewayz қазірдің өзінде мыңдаған кәсіпорындардың операциялық жүрек соғысын орталықтандырды.

MDST Engine мүмкіндіктерін Mewayz сияқты платформаға ендіру пайдаланушыларға үшінші тарап AI провайдеріне бизнес үшін маңызды деректерді ешқашан жібермей-ақ, AI көмегімен жұмыс процестерін іске қосуға мүмкіндік береді - өнім сипаттамаларын жасау, клиенттік байланыстарды жасау, есептерді қорытындылау немесе деректерді талдау. Қорытынды клиент тарапынан орындалатындықтан, платформа провайдеріне бір пайдаланушының шекті құны тиімді нөлге тең, бұл оны тіпті ең төменгі жазылым деңгейінде AI мүмкіндіктерін ұсынуды экономикалық тұрғыдан тиімді етеді. Бұл премиум-жоспар иелеріне сақтаудың орнына, бүкіл пайдаланушы базасы бойынша интеллектуалды автоматтандыруға қолжетімділікті демократияландырады.

Жиі қойылатын сұрақтар

Браузерде GGUF үлгісін іске қосу пайдаланушылардан үлкен файлдарды жүктеп алуды талап ете ме?

Иә, GGUF моделінің файлдары қорытынды басталмас бұрын браузерге жүктелуі керек, бірақ заманауи енгізулер мұны бір реттік әрекет ету үшін прогрессивті ағынды және шолғыш кэш API интерфейстерін пайдаланады. Бастапқы жүктеп алғаннан кейін модель жергілікті түрде кэштеледі және кейінгі сеанстар бірден жүктеледі. Шағын квантталған нұсқаларды (Q4 немесе Q2) 2–4 ГБ көлемінде сақтауға болады, бұл кең жолақты қосылымдары бар пайдаланушылар үшін тиімді.

WebGPU-ға 2026 жылы браузерлер мен құрылғыларда кеңінен қолдау көрсетіледі ме?

WebGPU Chrome және Edge жүйелерінде тұрақты күйге жетті, Firefox қолдауы 2025 жылға дейін және 2026 жылға дейін біртіндеп жеткізіледі. Мобильдік құрылғыларда қолдау құрылғы мен ОЖ нұсқасына байланысты өзгереді, бірақ MDST сияқты қозғалтқыштардағы WASM резерві GPU жеделдету қолжетімсіз болған кезде де функционалдылықтың сақталуын қамтамасыз етеді. Арнайы немесе біріктірілген графикалық процессорлары бар жұмыс үстелі орталары бүгінгі күні өндірісті орналастырудың оңтайлы мақсаты болып табылады.

Жылдамдық тұрғысынан браузердегі нәтиже бұлттық API қорытындысымен қалай салыстырылады?

Қазіргі тұтынушы аппаратурасындағы кішірек квантталған үлгілер үшін шолғышқа негізделген қорытынды секундына 10–30 таңбалауышты өткізу қабілетіне қол жеткізе алады, бұл желінің айналу кідірісінсіз орта деңгейлі бұлт API жауап жылдамдығымен салыстыруға болады. Бірінші таңбалауыштың кідірісі жиі жүктеме кезінде бұлттың соңғы нүктелеріне қарағанда жылдамырақ, өйткені кезек жоқ. Үлкенірек модельдер мен төменгі деңгейлі құрылғылар, әрине, төмендетілген өткізу қабілетін байқайды, бұл модель таңдау мен кванттау деңгейін әзірлеушілерге қолжетімді негізгі өнімділік терулеріне айналдырады.


WebGPU, WebAssembly және GGUF моделінің экожүйесінің конвергенциясы AI мүмкіндіктерінің веб-қолданбаларда қалай жеткізілетіні үшін шынайы бұрылу нүктесін жасайды. MDST Engine сияқты клиенттік қорытынды жүйелерін біріктіру үшін ертерек көшкен компаниялар тұрақты бәсекелестік артықшылыққа ие болады — төмен операциялық шығындар, күштірек құпиялылық кепілдіктері және кез келген жерде, кез келген қосылымда жұмыс істейтін AI мүмкіндіктері.

Егер сіз бизнес құрып немесе кеңейтіп жатсаңыз және дәл осындай перспективалық операциялық тиімділікке арналған платформаға қол жеткізгіңіз келсе, Mewayz саяхатыңызды app.mewayz.com сайтынан бастаңыз. 207 біріктірілген модульдері мен айына $19 жоспарлары бар Mewayz сіздің командаңызға бүгінгі күні және AI мүмкіндіктері дамып келе жатқандықтан, ақылдырақ жұмыс істеу үшін инфрақұрылым береді.

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start managing your business smarter today

Join 30,000+ businesses. Free forever plan · No credit card required.

Ready to put this into practice?

Join 30,000+ businesses using Mewayz. Free forever plan — no credit card required.

Start Free Trial →

Ready to take action?

Start your free Mewayz trial today

All-in-one business platform. No credit card required.

Start Free →

14-day free trial · No credit card · Cancel anytime