Hacker News

DjVu agus a cheangal ri Deep Learning (2023)

DjVu agus a cheangal ri Deep Learning (2023) Bidh an rannsachadh seo a’ sgrùdadh djvu, a’ sgrùdadh a chudromachd agus a’ bhuaidh a dh’fhaodadh a bhith aige. Bun-bheachdan air an còmhdach Bidh an susbaint seo a’ sgrùdadh: Bun-phrionnsabalan agus teòiridhean Prac...

10 min read Via scottlocklin.wordpress.com

Mewayz Team

Editorial Team

Hacker News

DjVu agus a cheangal ri ionnsachadh domhainn (2023): Na dh’ fheumas tu a bhith eòlach

’S e cruth sgrìobhainn teann a th’ ann an DjVu a chaidh a dhealbhadh an toiseach airson sgrìobhainnean a chaidh a sganadh agus tasglannan didseatach, agus tha an ceangal a th’ aige ri ionnsachadh domhainn air nochdadh mar aon de na h-eadar-cheanglaichean as làidire ann an giullachd sgrìobhainnean ùr-nodha air a stiùireadh le AI. Mar a bhios dòighean ionnsachaidh innealan a’ fàs nas ionnsaichte, tha ailtireachd agus dòighean còdaidh DjVu air a thighinn gu bhith nan raon trèanaidh luachmhor agus targaidean cleachdadh airson siostaman lìonra neòil a’ làimhseachadh digiteachadh sgrìobhainnean air sgèile mhòr.

Dè dìreach a th’ ann an DjVu agus Carson a tha e cudromach ann an Linn AI?

Chaidh DjVu (air fhuaimneachadh “déjà vu”) a leasachadh aig deireadh na 1990n aig AT&T Labs mar fhuasgladh air duilgheadas leantainneach: ciamar a chumas tu gu h-èifeachdach a’ stòradh agus a’ tar-chuir sgrìobhainnean le sganadh àrd-rùn gun a bhith ag ìobradh càileachd? Bidh an cruth a’ cleachdadh dòigh teannachaidh sreathach a tha a’ sgaradh sgrìobhainn a-steach don aghaidh (teacsa, ealain loidhne), cùl-raon (ìomhaighean dath), agus sreathan masg (dàta cumadh). Tha gach còmhdach air a dhlùthadh gu neo-eisimeileach a’ cleachdadh algoirmean air leth sònraichte.

Is e an rud a tha a’ fàgail DjVu gu sònraichte buntainneach an-diugh gu bheil an lobhadh ioma-fhilleadh seo mar sgàthan air an às-tharraing feartan rangachd a tha a’ mìneachadh ailtireachd ionnsachadh domhainn. Bidh lìonraidhean neural convolutional (CNNn), mar eisimpleir, a’ giullachd ìomhaighean le bhith a’ comharrachadh oirean, an uairsin cumaidhean, an uairsin structaran àrd-ìre - adhartas a tha gu math coltach ri mar a bhios DjVu a’ roinn sgrìobhainnean gu prìomhairean lèirsinneach. Chan eil an co-shìnte structarail seo dìreach acadaimigeach; tha buaidh phractaigeach aige air mar a tha siostaman AI air an trèanadh gus leughadh, seòrsachadh agus brìgh a tharraing à sgrìobhainnean eachdraidheil.

Ciamar a tha Modalan Ionnsachaidh domhainn gan trèanadh air Tasglann Sgrìobhainnean DjVu?

Tha leabharlannan mòra - a’ toirt a-steach Tasglann an Eadar-lìn, anns am bi milleanan de fhaidhlichean DjVu - air a thighinn gu bhith nam mèinnean òir airson trèanadh aithneachadh caractar optigeach (OCR) agus modalan tuigse sgrìobhainnean. Bidh luchd-rannsachaidh ionnsachadh domhainn a’ cleachdadh tasglannan DjVu leis gu bheil an cruth a’ gleidheadh ​​mion-fhiosrachadh clò-sgrìobhaidh eadhon aig fìor cho-mheasan teannachaidh, ga dhèanamh nas fheàrr na sganaidhean JPEG call airson gnìomhan ionnsachaidh fo stiùir.

Chaidh modalan ùr-nodha stèidhichte air cruth-atharrachaidh leithid LayoutLM agus DocFormer a ghleusadh air stòran-dàta anns a bheil susbaint bho thùs DjVu. Bidh na modailean sin ag ionnsachadh a bhith a’ ceangal cruth spàsail le brìgh semantach - a’ tuigsinn gu bheil bann trom a’ comharrachadh cudromachd no gu bheil briseadh colbh a’ comharrachadh atharrachadh earrann. Tha dealachadh còmhdach glan DjVu a’ dèanamh mothachadh fìrinn talmhainn gu math nas fhasa, a’ lughdachadh an leubail os an cionn a tha a’ cur mòran de phìoban trèanaidh lèirsinn coimpiutair.

"Tha feallsanachd ailtireachd DjVu a thaobh a bhith a’ lobhadh iom-fhillteachd gu sreathan a ghabhas làimhseachadh, làn-leasaichte gu neo-eisimeileach na phrionnsapal a lorg ionnsachadh domhainn a-rithist deicheadan às deidh sin - agus tha an co-obrachadh eadar an dà rud a’ toirt a-mach leasachaidhean ann am fiosrachadh sgrìobhainnean nach robh furasta a shamhlachadh nuair a chaidh an cruth a leigeil ma sgaoil an toiseach."

Dè na cleachdaidhean practaigeach a th’ ann an siostaman ionnsachaidh domhainn le fios DjVu?

Thathas mu thràth a’ faireachdainn a’ bhuaidh san t-saoghal bho bhith a’ cothlamadh tasglannan DjVu le ionnsachadh domhainn thar iomadh gnìomhachas. Am measg nam prìomh thagraidhean tha:

  • Didseatachadh sgrìobhainnean eachdraidheil: Tha institiudan leithid leabharlannan nàiseanta agus tasglannan acadaimigeach a’ cleachdadh AI air a thrèanadh le DjVu gus tar-sgrìobhadh de làmh-sgrìobhainnean làmh-sgrìobhte, clàran laghail, agus teacsaichean tearc a thoirt gu fèin-ghluasadach a bheireadh deicheadan de chatalogairean daonna ri làimhseachadh le làimh.
  • Mion-sgrùdadh sgrìobhainnean laghail is gèillidh: Bidh companaidhean lagha agus ionadan ionmhais a’ cleachdadh mhodalan air an trèanadh ann an leabharlannan cùmhnant le stòr DjVu gus clàsan a thoirt a-mach, cànan cunnairt a chomharrachadh, agus cùisean riaghlaidh a chomharrachadh aig sgèile.
  • Giullachd chlàran meidigeach: Tha siostaman cùram slàinte ag atharrachadh faidhlichean euslainteach dìleab a tha air an stòradh ann an cruth DjVu gu clàran slàinte dealanach structarail a ghabhas sgrùdadh a’ cleachdadh pìoban AI a ghlèidheas notaichean breithneachaidh agus notaichean làmh-sgrìobhte.
  • Luathachadh rannsachadh acadaimigeach: Bidh luchd-saidheans a’ cleachdadh siostaman ionnsachaidh domhainn air an trèanadh ann an tasglannan irisean saidheansail (mòran air an sgaoileadh mar DjVu) gus lèirmheasan litreachais air sgèile mhòr a dhèanamh, mion-sgrùdadh lìonra luaidh, agus gineadh beachd-bharail.
  • Foillseachadh agus riaghladh susbaint: Bidh companaidhean meadhanan a’ dèanamh tagaichean meata-dàta gu fèin-ghluasadach, a’ riaghladh chòraichean, agus ag ath-chleachdadh susbaint le bhith a’ giullachd nan leabharlannan tasglainn DjVu aca tro mhodalan tuigse sgrìobhainnean.

Dè na dùbhlain a tha mu choinneamh ionnsachadh domhainn nuair a thathar a’ giullachd fhaidhlichean DjVu?

A dh’aindeoin an co-obrachadh gealltanach, tha cnapan-starra teicnigeach cudromach ann fhathast. Tha an codec teannachaidh seilbh DjVu a’ ciallachadh nach urrainn do lìonraidhean neural amh an cruth a phròiseasadh gu dùthchasach - feumaidh sgrìobhainnean a bhith air an dì-chòdachadh agus an raster an toiseach mus cuir iad a-steach do mhodalan àbhaisteach stèidhichte air ìomhaigh. Tha an ceum dì-chòdaidh seo a’ toirt a-steach latency ro-ghiollachd agus truailleadh càileachd a dh’ fhaodadh a bhith ann mura tèid na paramadairean a ghleusadh gu faiceallach.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

A bharrachd air an sin, tha an structar ioma-fhilleadh a tha a’ dèanamh DjVu cho èifeachdach dha leughadairean daonna na dhùbhlan do phìoban ionnsachaidh domhainn deireadh-gu-deireadh. Bidh a’ mhòr-chuid de chruth-atharraichean lèirsinn a’ dùileachadh aon tensor ìomhaigh aonaichte; le bhith a’ biathadh an aghaidh agus na sreathan cùl-raoin air leth feumar ailtirean àbhaisteach no sreathan fusion a chuireas ri iom-fhillteachd mhodail. Tha luchd-rannsachaidh gu gnìomhach a’ sgrùdadh uidheamachdan aire as urrainn obrachadh gu dùthchasach air riochdachaidhean lobhadh DjVu, a dh’ fhuasgladh buannachdan èifeachdais cudromach ann an sruthan obrach giollachd sgrìobhainnean mòr.

Dè a tha san àm ri teachd airson DjVu agus Giullachd Sgrìobhainnean Neural?

A’ coimhead air adhart, tha an t-slighe soilleir: mar a bhios modalan ionnsachaidh domhainn a’ fàs nas comasaiche agus nas èifeachdaiche, bidh na tasglannan mòra de sgrìobhainnean DjVu a’ sìor fhàs ruigsinneach agus luachmhor. Tha modalan cànain mòra ioma-mhodhail as urrainn teacsa, cruth agus susbaint ìomhaigh a phròiseasadh aig an aon àm a’ tòiseachadh a’ làimhseachadh tuigse sgrìobhainnean mar ghnìomh aonaichte seach mar loidhne-phìoban de cheumannan fa-leth.

Tha àrdachadh ann an siostaman ginealach leasaichte ath-ghairm (RAG) cuideachd a’ suidheachadh tasglannan DjVu mar bhunaitean eòlais riatanach. Bidh deagh thoiseach tòiseachaidh aig buidhnean a tha a’ tasgadh a-nis ann an tionndadh agus clàr-amais nan cruinneachaidhean DjVu aca ann a bhith a’ cleachdadh luchd-cuideachaidh iomairt AI a fhreagras ceistean stèidhichte air eòlas institiùideach thar deicheadan.


Ceistean Bitheanta

An urrainn dhomh faidhlichean DjVu a thionndadh gu cruthan a tha co-chosmhail ri innealan AI an latha an-diugh?

Tha. Faodaidh innealan stòr fosgailte leithid DjVuLibre agus luchd-tionndaidh malairteach faidhlichean DjVu a dhì-chòdachadh gu cruthan PDF, TIFF, no PNG a tha a’ faighinn taic dhùthchasach bhon mhòr-chuid de fhrèaman ionnsachaidh domhainn. Airson mòr-ghiollachd, faodaidh pìoban loidhne-àithne tionndadh gu fèin-obrachail thar thasglannan slàn, ged a bu chòir dhut càileachd toraidh a dhearbhadh air sampall riochdachail mus ruith thu atharrachaidhean mòra.

A bheil DjVu fhathast ga leasachadh gu gnìomhach neo an e cruth dìleab a th’ ann?

’S e cruth dìleab a th’ ann an DjVu sa mhòr-chuid aig an ìre seo, le leasachadh gnìomhach air a stad gu ìre mhòr bho mheadhan nan 2000n. Ach, tha e fhathast air a chleachdadh gu farsaing ann an eag-shiostaman leabharlann didseatach air sgàth na tha de shusbaint ann mu thràth air a stòradh sa chruth. Tha ionnsachadh domhainn gu h-èifeachdach a’ toirt dàrna beatha dha DjVu le bhith ga dhèanamh comasach gu h-eaconamach an eòlas a tha glaiste sna tasglannan sin a tharraing agus a chleachdadh.

Ciamar a tha teannachadh DjVu an coimeas ri PDF airson dàta trèanaidh ionnsachadh domhainn?

Mar as trice bidh DjVu a’ coileanadh teannachadh 5–10x nas fheàrr na PDF airson sgrìobhainnean a chaidh a sganadh fhad ‘s a tha e a’ gleidheadh ​​dìlseachd lèirsinneach nas àirde aig meudan faidhle co-ionann. Tha seo a’ fàgail stòran-dàta bho DjVu nas èifeachdaiche a thaobh stòradh airson pìoban trèanaidh, ged a tha taic prìomh-shruthach an cruth nas lugha a’ ciallachadh gu bheil feum air innealan ro-ghiollachd a bharrachd an taca ris an eag-shiostam PDF uile-làthaireach.


Le bhith a’ riaghladh nan innealan, sruthan-obrach, agus siostaman eòlais a tha a’ toirt cumhachd do ghnìomhachd ùr-nodha air a stiùireadh le AI - bho ghiollachd sgrìobhainnean gu riaghladh susbaint - tha feum air àrd-ùrlar a chaidh a thogail airson iom-fhillteachd aig sgèile. Tha Mewayz na shiostam obrachaidh gnìomhachais 207-modal anns a bheil earbsa aig còrr air 138,000 neach-cleachdaidh gus gach taobh den bhuidheann aca a cho-òrdanachadh, a’ tòiseachadh aig dìreach $19/mìos. Co-dhiù a tha thu a’ digiteachadh thasglannan, ag fèin-ghluasad sruthan obrach sgrìobhainnean, no a’ togail bhunaitean eòlais le cumhachd an AI as ùire, bheir Mewayz dhut am bun-structar airson a dhèanamh uile ann an aon àite.

Tòisich do thuras Mewayz an-diugh aig app.mewayz.com agus faigh a-mach mar a dh’ atharraicheas OS gnìomhachais aonaichte an dòigh sa bheil an sgioba agad ag obair, a’ sgèileadh agus ag ùr-ghnàthachadh.

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start managing your business smarter today

Join 30,000+ businesses. Free forever plan · No credit card required.

Ready to put this into practice?

Join 30,000+ businesses using Mewayz. Free forever plan — no credit card required.

Start Free Trial →

Ready to take action?

Start your free Mewayz trial today

All-in-one business platform. No credit card required.

Start Free →

14-day free trial · No credit card · Cancel anytime