Hacker News

Eksperdid annavad häiresignaali pärast seda, kui ChatGPT Health ei tuvasta meditsiinilisi hädaolukordi

Kommentaarid

11 min read Via www.theguardian.com

Mewayz Team

Editorial Team

Hacker News

Kui tehisintellekt läheb valesti: ohtlik lõhe tehisintellektiga töötavates tervisetööriistades

Tehisintellekt pidi muutma revolutsiooni tervishoiuteenuste kättesaadavuses. Miljonid inimesed kogu maailmas pöörduvad nüüd tehisintellekti vestlusrobotite poole, et saada meditsiinilisi juhiseid, enne kui nad kunagi arstiga räägivad – kirjeldavad sümptomeid, otsivad kindlustunnet ja usaldavad algoritmilisi vastuseid oma heaolule. Kuid kasvav meditsiinitöötajate ja tehisintellekti teadlaste koor tõstatab kiireloomulisi muresid: mõned kõige laialdasemalt kasutatavad tehisintellekti tervisetööriistad ei suuda tuvastada eluohtlikke hädaolukordi, seades kasutajad potentsiaalselt tõsisesse ohtu. Mõju ulatub palju kaugemale tervishoiust, sundides iga tööstusharu vastama ebamugavale küsimusele tehisintellekti tööriistade kohta, millest nad igapäevaselt sõltuvad.

AI-toega terviseassistentide hiljutised hinnangud on paljastanud murettekitavad pimealad. Kontrollitud testimise stsenaariumides on need tööriistad väidetavalt jätnud tähelepanuta klassikalised hoiatusmärgid selliste seisundite kohta nagu insult, südameatakk ja sepsis – olukord, kus iga hilinenud ravi minut võib tähendada erinevust paranemise ja püsiva kahjustuse vahel. Kui vestlusrobot reageerib kopsuemboolia sümptomitele ja soovitab puhata ja jälgida, ei ole tagajärjed teoreetilised. Neid mõõdetakse eludes.

Mida meditsiinieksperdid tegelikult näevad

Kiirearstid ja intensiivravi spetsialistid on hakanud dokumenteerima juhtumeid, kus patsiendid jõudsid haiglasse ohtlikult hilja, olles esmalt konsulteerinud tehisintellekti vestlusrobotidega, mis ei suutnud kiireloomulisust märku anda. Tehisintellekti tööriistade dr. soovitused loetakse sageli usutavateks ja rahulikeks – just selles on probleem. Rahustav reaktsioon, kui keegi kogeb muserdavat valu rinnus ja õhupuudust, ei jäta lihtsalt diagnoosi tegemata; see heidutab inimest aktiivselt vajaliku erakorralise abi otsimisest.

Teislõigete tervisega seotud vestlusrobotite täpsust uurivates uuringutes on leitud veamäärasid, mis oleksid kõigis kliinilistes tingimustes vastuvõetamatud. Ühes laialdaselt tsiteeritud analüüsis leiti, et populaarsed tehisintellekti assistendid tuvastasid erakorralise sekkumise vajaduse õigesti vähem kui 50% juhtudest, mis hõlmasid tõsiseid ägedaid seisundeid. Konteksti jaoks eeldatakse, et triaažiprotokollide alal koolitatud esimese aasta arstitudeng märgistab need samad stsenaariumid peaaegu täiusliku täpsusega. Vahe ei ole marginaalne – see on kuristik.

Põhiprobleem ei seisne selles, et tehisintellektil puuduvad meditsiinilised teadmised. Suured keelemudelid on näidanud muljetavaldavat jõudlust meditsiinilise litsentsi eksamitel ja suudavad meenutada tohutul hulgal kliinilist kirjandust. Ebaõnnestumine seisneb ebaselguse kontekstipõhises arutluskäigus – võimes kaaluda konkureerivaid sümptomeid, ära tunda ebatüüpilisi esitlusi ja olla ettevaatlik, kui ebakindlus on suur. Just need on oskused, mida kogenud arstid aastatepikkuse praktika jooksul arendavad ja mida praegusel tehisintellekti arhitektuuril on raske usaldusväärselt paljundada.

Miks tehisintellekt on hädas kõrgete otsuste tegemisega

Selleks, et mõista, miks AI tervisetööriistad hädaolukorra tuvastamisel ebaõnnestuvad, aitab see mõista, kuidas suured keelemudelid tegelikult töötavad. Need süsteemid genereerivad vastuseid koolitusandmete statistiliste mustrite põhjal. Need on optimeeritud tootma kasulikku, vestlust toetavat ja kontekstuaalselt sobivat teksti – mitte toimima sisseehitatud ohutuslävedega diagnostikavahenditena. Kui kasutaja kirjeldab sümptomeid, ei teosta mudel kliinilist põhjendust; see ennustab õpitud mustrite põhjal, kuidas kasulik vastus välja näeks.

See tekitab põhimõttelise lahknevuse kasutaja ootuste ja süsteemi võimaluste vahel. Inimene, kes kirjutab teksti "Mul on äkiline tugev peavalu ja mu nägemine on udune", eeldab, et tehisintellekt mõistab tema olukorra võimalikku tõsidust. Mudel võib aga genereerida vastuse, mis käsitleb peavalusid üldiselt – viitab hüdratatsioonile, puhkusele või käsimüügi valuvaigistile – kuna need vastused ilmuvad sageli peavaluga seotud päringute treeningandmetes. Healoomulise põhjuse statistiline tõenäosus varjutab kriitilise vähemuse juhtudest, kui need sümptomid viitavad hädaolukorrale, näiteks subarahnoidaalsele hemorraagiale.

AI kõige ohtlikum tõrkerežiim ei seisne asjade täiesti valesti ajamises – see on enesekindel, usutav, peaaegu õige tegutsemine olukordades, kus "peaaegu" võib kellelegi maksta elu või äri.

Tervishoid: usaldusprobleem, millega silmitsi seisab iga tööstus

Kuigi tervishoiu tõrked on kõige dramaatilisemad, laieneb põhiprobleem igale sektorile, kus ettevõtted ja üksikisikud toetuvad tehisintellektile. Finantsteenuste ettevõtted, kes kasutavad tehisintellekti pettuste avastamiseks, seisavad silmitsi sarnaste riskidega – süsteem, mis püüab kinni 95% petturlikest tehingutest, kõlab muljetavaldavalt, kuni arvutate välja kahju, mis sellel 5% vahele jääb. Juriidilised meeskonnad, kes kasutavad lepingute ülevaatamiseks tehisintellekti, võivad avastada, et tööriist teeb klauslitest enesekindlalt kokkuvõtte, jättes samas tähelepanuta keerulises keeles peituvad kriitilised kohustused.

Üle 138 000 ettevõtte jaoks, kes kasutavad toimingute haldamiseks selliseid platvorme nagu Mewayz – alates CRM-ist ja arveldamisest kuni personali ja analüütikani – on tehisintellekti tervisetööriistade tõrgete õppetund selge: automatiseerimine peaks võimendama inimeste otsustusvõimet, mitte kunagi asendama seda kriitilistes töövoogudes. Seetõttu loovad vastutustundlikud äriplatvormid tehisintellekti inimeste kontrollpunktidega täienduskihina, mitte iseseisvate otsustajatena, kes tegutsevad ilma järelevalveta.

AI-ajastul arenevad edukad ettevõtted, kes mõistavad, kus automatiseerimist agressiivselt kasutusele võtta ja kus säilitada inimlik kontroll. Kohtumiste planeerimine, arvete meeldetuletuste koostamine, sõidukipargi logistika jälgimine, klientide suundumuste analüüsimine – need on valdkonnad, kus tehisintellekti automatiseerimine pakub minimaalse riskiga tohutut väärtust. Kuid otsused, mis hõlmavad vastavust, töötajate heaolu, rahalisi kohustusi või klientide turvalisust, nõuavad inimese ülevaatust, olenemata sellest, kui keerukaks aluseks olev tehnoloogia muutub.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

Viis põhimõtet vastutustundliku tehisintellekti kasutuselevõtuks ettevõtluses

AI tervisetööriistade tõrked pakuvad praktilist raamistikku igale organisatsioonile, kes hindab, kuidas AI oma tegevustesse integreerida. Need põhimõtted kehtivad olenemata sellest, kas juhite tervishoiuga tegelevat idufirmat või juhite 50-liikmelist teenindusettevõtet.

  1. Määrake plahvatuse raadius. Enne mis tahes tehisintellekti tööriista juurutamist kaardistage halvim stsenaarium, kui see ebaõnnestub. Kui tagajärjed on tühised (veidi ebamugav automaatselt loodud meili teemarida), automatiseerige seda vabalt. Kui tagajärjed on tõsised (palgaarvestuse tähtaeg möödas, ebaõige maksudeklaratsioon, valesti käsitletud kliendi kaebus), lisage kohustuslikud inimlikud ülevaatused.
  2. Kohtlege tehisintellekti usaldust signaalina, mitte otsusena. AI-süsteemid tegelikult ei "tea" asju – need genereerivad tõenäosuslikke väljundeid. Vestlusbot, mis ütleb, et "see on tõenäoliselt väike probleem", ei diagnoosi; see on mustri sobitamine. Rakendage sama skeptilisust tehisintellekti loodud äriülevaadete, finantsprognooside ja tegevussoovituste suhtes.
  3. Auditeerige pidevalt, mitte ainult juurutamisel. AI jõudlus võib aja jooksul halveneda, kuna tegelikud tingimused treeningandmetest lähtuvad. Luua regulaarsed ülevaatustsüklid, kus inimeksperdid hindavad tehisintellekti väljundeid põhitõe suhtes. See on teie ärianalüütika juhtpaneeli jaoks sama oluline kui meditsiinilise tehisintellekti jaoks.
  4. Säilitage varuvõimalused. Igal tehisintellektil põhineval töövool peaks olema selge eskalatsioonitee inimesest otsustajani. Kui teie automaatne klienditugi ei suuda probleemi kahe vahetusega lahendada, peaks see sujuvalt inimesele üle andma – mitte suunama klienti üha ebaolulisemate soovituste kaudu.
  5. Valige platvormid, mis jagavad seda filosoofiat. Tööriistad, millele oma äri üles ehitate, peegeldavad teie usaldusväärsuse ja vastutustundega seotud väärtusi. Platvormid, nagu Mewayz, mis integreerivad tehisintellekti automatiseerimist 207 moodulisse – alates broneerimissüsteemidest kuni palgaarvestuseni – teevad seda mõistmisega, et automatiseerimine tegeleb mahuga, samal ajal kui inimesed otsustavad.

Mida patsiendid ja tarbijad tehisintellektilt tegelikult tahavad

Uuringud näitavad järjekindlalt, et inimesed ei tahagi, et tehisintellekt asendaks inimteadmisi – nad tahavad, et see muudaks inimteadmised kättesaadavamaks. Pew Research Centeri 2024. aasta uuring näitas, et 60% ameeriklastest tunneks end ebamugavalt, kui nende tervishoiuteenuse osutaja tugineb diagnoosimisel tehisintellektile, samal ajal väljendades huvi tehisintellekti tööriistade vastu, mis võiksid aidata neil arstile paremaid küsimusi ette valmistada või meditsiiniterminoloogiat mõista. Soov on suurendamine, mitte asendamine.

Sama dünaamika avaldub ka ärikontekstis. Väikeettevõtete omanikud ei soovi tehisintellekti, mis teeb nende eest finantsotsuseid – nad tahavad süsteemi, mis korraldab nende finantsandmed selgelt, märgistab kõrvalekalded ja pakub võimalusi, et nad saaksid kiiresti teadlikke valikuid teha. Edukamad äriplatvormid mõistavad seda erinevust intuitiivselt. Need automatiseerivad tüütu ja aeganõudva töö, mis ettevõtjaid matab – andmete sisestamine, kohtumiste ajastamine, arvete järelkontroll, aruannete koostamine –, hoides samal ajal inimese strateegia, suhete ja kriitiliste otsuste üle kindlalt kontrolli all.

Tervishoiuteenuste tehisintellekti tõrked on paljuski hoiatav lugu selle kohta, mis juhtub, kui tehnoloogiaettevõtted eelistavad võimekust õigele kasutamisele. Meditsiiniliste sümptomite üle arutleva AI loomine on tehniliselt muljetavaldav. Sellise kujunduse loomine, mis teaks usaldusväärselt, millal öelda "lõpetage minuga rääkimine ja kutsuge kiirabi", nõuab põhimõtteliselt teistsugust disainifilosoofiat – seda, mis seab ohutuse piirid esikohale vestluse sujuvuse asemel.

Turvalise tehisintellekti tuleviku loomine ettevõtetele ja kaugemalegi

Tee edasiminekuks ei ole tehisintellektist loobumine – tehnoloogia eelised on liiga olulised ja liiga laialt levinud, et kurssi pöörata. Selle asemel peaks tervishoiuhäire katalüseerima küpsemat lähenemist tehisintellekti kasutuselevõtule kõigis tööstusharudes. See tähendab regulatiivseid raamistikke, mis järgivad tehisintellekti tervisetööriistu kliinilistele standarditele, tööstusharu võrdlusaluseid, mis mõõdavad tehisintellekti äritööriistu tegelike tulemustega (mitte ainult demostsenaariumitega), ja kultuurilist nihet arusaamast, et suurem automatiseerimine tähendab alati suuremat edu.

Sel maastikul liikuvate ettevõtete omanike jaoks on praktiline nõuanne otsekohene: investeerige platvormidesse ja tööriistadesse, mis käsitlevad tehisintellekti kui võimsat abistajat, mitte eksimatut oraaklit. Otsige süsteeme, mis muudavad teie töövood kiiremaks ja andmed selgemaks, ilma et kaotate teie võimet alistada, kohandada ja lõpuks otsustada. Olenemata sellest, kas juhite viie- või viiesajaliikmelist meeskonda, peaks õige tehnoloogiapakett andma teile mõjuvõimu, mitte võtma roolilt ära.

Meditsiinitöötajad, kes AI tervisetööriistade pärast häirekella löövad, ei ole tehnoloogiavastased. Nad pooldavad vastutust. Nad mõistavad, et maailma kõige keerukam algoritm on täpselt nii hea, kui on selle ümber ehitatud kontrollide, tasakaalu ja inimliku järelevalve raamistik. See põhimõte ei kehti ainult meditsiini kohta. See kehtib iga teie saadetud arve, iga teie töötaja, iga kliendisuhte ja iga teie ettevõtte tulevikku kujundava otsuse kohta.

Korduma kippuvad küsimused

Miks ei tuvastanud ChatGPT Health meditsiinilisi hädaolukordi?

ChatGPT Health ja sarnased AI tervisetööriistad põhinevad pigem mustrite sobitamisel kui kliinilisel arutluskäigul. Meditsiinitöötajad leidsid, et need süsteemid liigitavad sageli ekslikult kiireloomulisi sümptomeid, nagu valu rinnus või insuldi näitajad, rutiinseteks kaebusteks, kuna koolitatud arstidel puudub aastate jooksul kontekstipõhine hinnang. Tööriistad ei olnud loodud hädaolukorra triaažiprotokollidega, mis tekitas ohtliku lõhe kasutaja ootuste ja tegeliku diagnostikavõimaluse vahel.

Kas tehisintellekti tervisega seotud vestlusroboteid saab usaldada arstiabi saamiseks?

Praegused AI tervisevestlusbotid ei tohiks kunagi asendada professionaalset meditsiinilist konsultatsiooni, eriti kiireloomuliste sümptomite korral. Kuigi nad võivad anda üldist heaoluteavet, hoiatavad eksperdid, et nad ei usaldaks neid diagnoosimisel. Kasutajad peaksid käsitlema tehisintellekti loodud tervisejuhiseid ainult lähtepunktina ja otsima alati kvalifitseeritud arstiabi, kui neil tekivad sümptomid või võimalikud hädaolukorrad.

Millised riskid kaasnevad tervishoiuotsuste tegemisel tehisintellektist sõltumisega?

Peamised riskid hõlmavad ajatundlike seisundite, nagu südameatakk ja insult, hilinenud ravi, väärdiagnoosid, mis põhjustavad sobimatut eneseravi, ja vale kinnitus, mis heidutab professionaalse abi otsimist. See mõjutab ebaproportsionaalselt palju haavatavaid elanikkonda, kellel pole kerget juurdepääsu tervishoiuteenustele, kuna nad võivad meditsiinitöötajatega konsulteerimise asemel rohkem toetuda tasuta tehisintellekti tööriistadele.

Kuidas peaksid ettevõtted lähenema tehisintellekti tööriistade töökindlusele kõigis operatsioonides?

Ettevõtted peavad kriitiliselt hindama kõiki tehisintellekti tööriistu, mida nad tervishoiu või operatsioonide jaoks kasutusele võtavad. Sellised platvormid nagu Mewayz pakuvad 207-moodulist ärisüsteemi alates 19 dollarist kuus, mis on loodud läbipaistvuse ja töökindlusega. Selle asemel, et pimesi usaldada mõnda üksikut tehisintellektisüsteemi, peaksid organisatsioonid rakendama inimliku järelevalve kihte ja valima sihipärased tööriistad, millel on tõestatud kogemused.