Hacker News

Sérfræðingar gefa viðvörun eftir að ChatGPT Health greinir ekki neyðartilvik

Athugasemdir

14 min read Via www.theguardian.com

Mewayz Team

Editorial Team

Hacker News

Þegar gervigreind fer úrskeiðis: Hættulega bilið í gervigreindarverkfærum

Gervigreind átti að gjörbylta aðgangi að heilbrigðisþjónustu. Milljónir manna um allan heim leita nú til gervigreindarspjallbotna til að fá læknisfræðilega leiðbeiningar áður en þeir tala við lækni - lýsa einkennum, leita að fullvissu og treysta algrímssvörun fyrir líðan sinni. En vaxandi kór lækna og gervigreindarfræðinga veldur brýnum áhyggjum: sum af mest notuðu gervigreindarheilbrigðisverkfærunum tekst ekki að bera kennsl á lífshættuleg neyðartilvik, sem gæti stofnað notendum í alvarlega hættu. Afleiðingarnar ná langt út fyrir heilbrigðisþjónustuna og neyða allar atvinnugreinar til að horfast í augu við óþægilega spurningu um gervigreindartækin sem þeir eru háðir daglega.

Nýlegt mat á AI-knúnum heilbrigðisaðstoðarmönnum hefur leitt í ljós skelfilega blinda bletti. Í stýrðum prófunaratburðum hafa þessi tæki að sögn saknað klassískra viðvörunarmerkja um ástand eins og heilablóðfall, hjartaáfall og blóðsýkingu - aðstæður þar sem hver mínúta af seinkuðum meðferð getur þýtt muninn á bata og varanlegum skaða. Þegar spjallvíti bregst við einkennum lungnasegareks með ráðleggingum um að „hvíla og fylgjast með“ eru afleiðingarnar ekki fræðilegar. Þau eru mæld í lífum.

Það sem læknar eru í raun og veru að sjá

Bráðalæknar og sérfræðingar á bráðamóttöku eru farnir að skrásetja tilvik þar sem sjúklingar komu hættulega seint á sjúkrahús, eftir að hafa ráðfært sig fyrst við gervigreindarspjalltölvur sem tókst ekki að tilkynna brýnt. Ráðleggingar frá gervigreindartækjum eru oft trúverðugar og rólegar - sem er einmitt vandamálið. Hughreystandi viðbrögð við því að einhver upplifir kramjandi brjóstverk og mæði missir ekki bara greininguna; það kemur virkan í veg fyrir að viðkomandi leiti neyðarþjónustu sem hann þarf á að halda.

Rannsóknir sem rannsaka nákvæmni AI heilsuspjallbotna hafa fundið villuhlutfall sem væri óviðunandi í hvaða klínísku umhverfi sem er. Ein greining sem víða er vitnað í leiddi í ljós að vinsælir gervigreindaraðstoðarmenn greindu réttilega þörfina fyrir neyðaríhlutun í færri en 50% tilvika sem varða alvarlega bráða sjúkdóma. Í samhengi er búist við því að fyrsta árs læknanemi, sem er þjálfaður í triage samskiptareglum, flaggi þessar sömu aðstæður með næstum fullkominni nákvæmni. Bilið er ekki lélegt - það er gjá.

Rótmálið er ekki það að gervigreind skortir læknisfræðilega þekkingu. Stór tungumálalíkön hafa sýnt glæsilegan árangur í læknisfræðilegum leyfisprófum og geta munað mikið magn af klínískum bókmenntum. Bilunin liggur í samhengisröksemd undir tvíræðni - hæfileikinn til að vega samkeppniseinkenni, þekkja óhefðbundnar framsetningar og fara varlega þegar óvissan er mikil. Þetta er einmitt hæfileikinn sem reyndir læknar þróa með margra ára æfingum og núverandi gervigreindararkitektúr eiga í erfiðleikum með að endurtaka á áreiðanlegan hátt.

Hvers vegna gervigreind á í erfiðleikum með ákvarðanatöku með mikilli húfi

Til að skilja hvers vegna gervigreind heilsutól mistakast við neyðarviðurkenningu hjálpar það að skilja hvernig stór tungumálalíkön virka í raun og veru. Þessi kerfi búa til svör byggð á tölfræðilegum mynstrum í þjálfunargögnum. Þau eru fínstillt til að framleiða gagnlegan, samræðandi og viðeigandi texta - ekki til að virka sem greiningartæki með innbyggðum öryggisþröskuldum. Þegar notandi lýsir einkennum framkvæmir líkanið ekki klíníska rökhugsun; það spáir fyrir um hvernig gagnlegt svar myndi líta út byggt á mynstrum sem það hefur lært.

Þetta skapar grundvallarmisræmi milli væntinga notenda og kerfisgetu. Einstaklingur sem skrifar „Ég er með skyndilega mikinn höfuðverk og sjónin mín er óskýr“ býst við að gervigreindin skilji hugsanlega alvarleika stöðu þeirra. Líkanið getur hins vegar framkallað svörun sem tekur á höfuðverk almennt - sem bendir til vökvunar, hvíldar eða verkjastillingar án lyfseðils - vegna þess að þessi svör birtast oft í þjálfunargögnum þess fyrir höfuðverkstengdar fyrirspurnir. Tölfræðilegar líkur á góðkynja orsök skyggja á mikilvægan minnihluta tilfella þar sem þessi einkenni benda til læknisfræðilegs neyðartilviks eins og blæðingar í skjaldkirtli.

Hættulegasta bilunaraðferð gervigreindar er ekki að misskilja hlutina algjörlega – það er að vera öruggur, trúlega, næstum því réttur í aðstæðum þar sem "næstum" getur kostað einhvern lífið eða fyrirtæki hans.

Beyond Healthcare: Traustvandamálið sem sérhver iðnaður stendur frammi fyrir

Þó að heilsugæslubrestarnir séu mest stórkostlegir, nær undirliggjandi vandamálið til allra geira þar sem fyrirtæki og einstaklingar treysta á gervigreind fyrir ákvarðanir. Fjármálaþjónustufyrirtæki sem nota gervigreind til að greina svik standa frammi fyrir svipaðri áhættu - kerfi sem nær 95% sviksamlegra viðskipta hljómar áhrifamikið þar til þú reiknar tapið út frá þeim 5% sem það missir af. Lögfræðiteymi sem nota gervigreind til að fara yfir samninga gætu komist að því að tólið dregur saman ákvæði á öruggan hátt á meðan vantar mikilvægar ábyrgðarábyrgðir grafnar á flóknu máli.

Fyrir 138.000+ fyrirtæki sem nota palla eins og Mewayz til að stjórna rekstri – allt frá CRM og reikningagerð til starfsmannamála og greiningar – er lærdómurinn af bilun í gervigreindarverkfærum skýr: sjálfvirkni ætti að efla dómgreind mannsins, aldrei skipta henni alfarið í mikilvægum verkflæði. Þetta er ástæðan fyrir því að ábyrgir viðskiptavettvangar byggja gervigreind sem aukið lag með mannlegum eftirlitsstöðvum, frekar en sem sjálfstæðir ákvarðanatökur sem starfa án eftirlits.

Fyrirtækin sem munu dafna á gervigreindartímanum eru þau sem skilja hvar eigi að beita sjálfvirkni á árásargjarnan hátt og hvar eigi að viðhalda stjórn manna. Skipuleggja stefnumót, búa til reikningaáminningar, fylgjast með flutningum flota, greina þróun viðskiptavina – þetta eru lén þar sem gervigreind sjálfvirkni skilar gífurlegu gildi með lágmarks áhættu. En ákvarðanir sem fela í sér reglufylgni, velferð starfsmanna, fjárhagslegar skuldbindingar eða öryggi viðskiptavina krefjast mannlegrar endurskoðunar, sama hversu háþróuð undirliggjandi tækni verður.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

Fimm meginreglur fyrir ábyrga gervigreind í viðskiptum

Gallar gervigreindarheilbrigðisverkfæra bjóða upp á hagnýtan ramma fyrir hvaða stofnun sem er sem metur hvernig eigi að samþætta gervigreind í starfsemi sína. Þessar meginreglur gilda hvort sem þú ert að reka heilsugæslufyrirtæki eða stjórna 50 manna þjónustufyrirtæki:

  1. Skilgreindu sprengingarradíusinn. Áður en þú setur upp gervigreindarverkfæri skaltu kortleggja versta tilvik ef það mistekst. Ef afleiðingarnar eru léttvægar (örlítið óþægileg sjálfvirk efnislína tölvupósts), gerðu sjálfvirkan frjálsan. Ef afleiðingarnar eru alvarlegar (misskilinn launafrestur, röng skattskráning, rangt meðhöndluð kvörtun viðskiptavina) skaltu byggja inn lögboðin mannleg endurskoðunarskref.
  2. Takið á gervigreindaröryggi sem merki, ekki dóm. gervigreindarkerfi „vita“ í raun ekki hlutina – þau búa til líkindaúttak. Spjallbotni sem segir „þetta er líklega minniháttar vandamál“ er ekki að greina; það er mynstur-samsvörun. Notaðu sömu tortryggni gagnvart gervigreindum viðskiptainnsýn, fjárhagsáætlunum og rekstrarráðleggingum.
  3. Stöðugt endurskoðað, ekki bara við uppsetningu. Frammistaða gervigreindar getur versnað með tímanum þar sem raunverulegar aðstæður reka frá þjálfunargögnum. Komdu á reglulegum endurskoðunarlotum þar sem mennska sérfræðingar meta gervigreind út frá sannleikanum. Þetta er jafn mikilvægt fyrir mælaborð fyrirtækjagreiningar og fyrir læknisfræðilega gervigreind.
  4. Viðhalda fallleiðum. Sérhvert verkflæði sem knúið er gervigreind ætti að hafa skýra stigmögnunarleið til mannsins sem tekur ákvarðanir. Ef sjálfvirka þjónustuverið þitt getur ekki leyst vandamál í tveimur kauphöllum, ætti það að afhenda aðila óaðfinnanlega – ekki hlekkja viðskiptavininn í gegnum sífellt óviðkomandi tillögur.
  5. Veldu vettvang sem deila þessari hugmyndafræði. Verkfærin sem þú byggir fyrirtækið þitt á endurspegla gildin þín um áreiðanleika og ábyrgð. Pallar eins og Mewayz sem samþætta gervigreind sjálfvirkni í 207 einingar – allt frá bókunarkerfum til launaskrár – gera það með þeim skilningi að sjálfvirkni sér um magn á meðan menn sjá um dómgreind.

Hvað sjúklingar og neytendur vilja fá af gervigreind

Rannsóknir sýna stöðugt að fólk vill í raun ekki að gervigreind komi í stað mannlegrar sérfræðiþekkingar – það vill að hún geri mannlega sérfræðiþekkingu aðgengilegri. Könnun Pew Research Center árið 2024 leiddi í ljós að 60% Bandaríkjamanna myndu vera óánægð með að heilbrigðisstarfsmaður þeirra treysti á gervigreind við greiningu, en á sama tíma lýst yfir áhuga á gervigreindarverkfærum sem gætu hjálpað þeim að undirbúa betri spurningar fyrir lækninn sinn eða skilja læknisfræðileg hugtök. Löngunin er aukning, ekki staðgengill.

Þessi sami kraftur á sér stað í viðskiptasamhengi. Eigendur lítilla fyrirtækja vilja ekki gervigreind sem tekur fjárhagslegar ákvarðanir fyrir þá - þeir vilja kerfi sem skipuleggur fjárhagsgögn sín á skýran hátt, flaggar frávik og kynnir valkosti svo þeir geti tekið upplýstar ákvarðanir fljótt. Farsælustu viðskiptavettvangarnir skilja þennan aðgreining á innsæi. Þeir gera sjálfvirkan leiðinlega, tímafreka vinnu sem grafar fyrir frumkvöðlum - innsláttur gagna, tímaáætlun, eftirfylgni reikninga, skýrslugerð - á sama tíma og manneskjan hefur fasta stjórn á stefnu, samböndum og mikilvægum ákvörðunum.

Gjaldgreindarbilanir í heilbrigðisþjónustu eru að mörgu leyti varnaðarsaga um hvað gerist þegar tæknifyrirtæki setja getu fram yfir viðeigandi notkun. Að byggja upp gervigreind sem getur fjallað um læknisfræðileg einkenni er tæknilega áhrifamikil. Að byggja upp einn sem á áreiðanlegan hátt veit hvenær á að segja "hættu að tala við mig og hringdu á sjúkrabíl" krefst í grundvallaratriðum mismunandi hönnunarheimspeki - sem setur öryggismörk fram yfir samræður.

Uppbygging öruggari gervigreindar framtíðar fyrir fyrirtæki og víðar

Leiðin fram á við er ekki að yfirgefa gervigreind – kostir tækninnar eru of verulegir og of víða dreifðir til að snúa við. Þess í stað ætti heilsugæsluviðvörunin að hvetja til þroskaðri nálgun við gervigreindaruppfærslu í öllum atvinnugreinum. Þetta þýðir regluverk sem halda gervigreind heilsuverkfærum við klíníska staðla, viðmið í iðnaði sem mæla gervigreind viðskiptatæki gegn raunverulegum útkomum (ekki bara kynningaratburðarás) og menningarbreyting frá þeirri hugmynd að meiri sjálfvirkni jafngildir alltaf meiri framförum.

Fyrir fyrirtækjaeigendur sem vafra um þetta landslag eru hagnýtu ráðin einföld: Fjárfestu í kerfum og verkfærum sem meðhöndla gervigreind sem öflugan aðstoðarmann frekar en óskeikula véfrétt. Leitaðu að kerfum sem gera vinnuflæði þitt hraðari og gögnin þín skýrari án þess að fjarlægja möguleika þína á að hnekkja, stilla og að lokum ákveða. Hvort sem þú ert að stjórna fimm eða fimm hundruð manna teymi ætti réttur tæknistafla að gefa þér skiptimynt - ekki taka stýrið þitt af þér.

Læknastarfsmenn sem gefa viðvörun um gervigreind heilsuverkfæri eru ekki andstæðingur tækni. Þeir eru hlynntir ábyrgð. Þeir skilja að flóknasta reiknirit í heimi er aðeins eins gott og rammi eftirlits, jafnvægis og mannlegrar eftirlits sem byggt er í kringum það. Sú regla á ekki bara við um læknisfræði. Það á við um alla reikninga sem þú sendir, hvern starfsmann sem þú ert um borð í, hvert viðskiptasamband sem þú hlúir að og hverja ákvörðun sem mótar framtíð fyrirtækisins þíns.

Algengar spurningar

Hvers vegna tókst ChatGPT Health ekki að viðurkenna neyðartilvik?

ChatGPT Health og svipuð gervigreind heilsuverkfæri byggja á mynstursamsvörun frekar en klínískri röksemdafærslu. Læknisfræðingar komust að því að þessi kerfi flokka oft brýn einkenni eins og brjóstverk eða heilablóðfallsvísa sem venjubundnar kvartanir, sem skortir samhengisdóm sem þjálfaðir læknar þróa með sér í gegnum árin. Verkfærin voru ekki hönnuð með neyðarprófunarreglum, sem skapaði hættulegt bil á milli væntinga notenda og raunverulegrar greiningargetu.

Er hægt að treysta gervigreind heilsuspjallbotnum fyrir læknisráðgjöf?

Núverandi gervigreind heilsuspjallbotar ættu aldrei að koma í stað faglegrar læknisráðgjafar, sérstaklega vegna brýnna einkenna. Þó að þeir geti veitt almennar upplýsingar um heilsufar, vara sérfræðingar við því að treysta á þá við greiningu. Notendur ættu aðeins að meðhöndla AI-myndaða heilsuleiðbeiningar sem upphafspunkt og leita alltaf hæfrar læknishjálpar þegar þeir lenda í einkennum eða hugsanlegum neyðartilvikum.

Hver er áhættan af því að vera háð gervigreind fyrir ákvarðanir um heilbrigðisþjónustu?

Helstu áhætturnar eru seinkuð meðferð við tímaviðkvæmum sjúkdómum eins og hjartaáföllum og heilablóðfalli, ranga greining sem leiðir til óviðeigandi sjálfsmeðferðar og rangrar fullvissu sem dregur úr leit að faglegri umönnun. Viðkvæmir íbúar sem ekki hafa greiðan aðgang að heilbrigðisþjónustu verða fyrir óhóflegri áhrifum þar sem þeir geta treyst meira á ókeypis gervigreindartæki í stað þess að ráðfæra sig við læknisfræðinga.

Hvernig ættu fyrirtæki að nálgast áreiðanleika gervigreindartækja í öllum rekstri?

Fyrirtæki verða að meta hvert gervigreind tól sem þau nota á gagnrýninn hátt, hvort sem það er fyrir heilbrigðisþjónustu eða rekstur. Pallar eins og Mewayz bjóða upp á 207 eininga viðskiptastýrikerfi sem byrjar á $19/mán, byggt með gagnsæi og áreiðanleika í grunninn. Í stað þess að treysta í blindni hverju einasta gervigreindarkerfi ættu stofnanir að innleiða mannleg eftirlitslög og velja sérsmíðuð verkfæri með sannað afrekaskrá.