Modél Basa Besar (LLM) tiasa nyerat artikel persuasif dumasar kana kecap ajakan, lulus ujian kamahéran profésional, sareng nyerat inpormasi anu ramah sareng empati. Sanajan kitu, salian resiko kawentar fiksi, fragility, jeung fakta akurat dina LLM, isu unresolved séjén laun jadi fokus, kayaning model AI ngandung potensi diskriminatif "nilai manusa" dina kreasi sarta pamakéan maranéhanana, komo lamun LLM euweuh fabricates eusi jeung ngaleungitkeun jelas hasil kaluaran ngabahayakeun, "nilai LLM" masih bisa nyimpang.
Conto anu teu kaétang ngagambarkeun kumaha data anu dianggo pikeun ngalatih modél AI nangkodkeun nilai-nilai individu sareng sosial, anu tiasa nguatkeun dina modél éta. Conto ieu ngalibatkeun sauntuyan aplikasi, kaasup interpretasi otomatis tina sinar-X dada, klasifikasi panyakit kulit, sarta algorithmic-pembuatan kaputusan ngeunaan alokasi sumberdaya médis. Salaku nyatakeun dina artikel panganyarna dina jurnal urang, data latihan bias bisa ngagedekeun tur nembongkeun nilai na biases hadir di masarakat. Sabalikna, panilitian ogé nunjukkeun yén AI tiasa dianggo pikeun ngirangan bias. Contona, panalungtik nerapkeun model pembelajaran jero kana pilem X-ray dengkul sarta manggihan faktor anu lasut ku indikator severity baku (dinilai ku radiologists) dina gabungan dengkul, kukituna ngurangan béda nyeri unexplained antara penderita hideung bodas.
Sanajan beuki loba jalma anu sadar bias dina model AI, utamana dina hal data latihan, loba titik éntri séjén tina nilai manusa teu dibikeun perhatian cukup dina prosés ngembangkeun sarta deployment model AI. AI médis nembé ngahontal hasil anu pikaresepeun, tapi sabagéan ageung, éta henteu sacara eksplisit nganggap nilai-nilai manusa sareng interaksina sareng penilaian résiko sareng penalaran probabilistik, sareng teu acan dimodelkeun.
Pikeun concretize konsép abstrak ieu, bayangkeun yén anjeun hiji endocrinologist anu diperlukeun pikeun nulis resep hormon pertumbuhan manusa rékombinan pikeun budak 8 taun heubeul anu sahandapeun persentil 3rd umur na. Tingkat hormon pertumbuhan manusa anu dirangsang budak éta sahandapeun 2 ng/mL (nilai rujukan,> 10 ng/mL, nilai rujukan pikeun seueur nagara di luar Amérika Serikat nyaéta> 7 ng/mL), sareng gén pengkodean hormon pertumbuhan manusa na parantos mendakan mutasi inaktivasi anu jarang. Kami yakin yén aplikasi terapi hormon pertumbuhan manusa atra sareng teu tiasa dibantah dina setting klinis ieu.
Aplikasi terapi hormon pertumbuhan manusa dina skenario di handap ieu bisa ngabalukarkeun kontrovérsi: jangkungna budak 14 taun geus salawasna geus di persentil 10th peers-Na, sarta puncak hormon pertumbuhan manusa sanggeus stimulasi nyaeta 8 ng / ml. Henteu aya mutasi fungsional anu dipikanyaho anu tiasa mangaruhan jangkungna, atanapi panyabab anu sanés anu dipikanyaho pikeun jangkung pondok, sareng umur tulangna umurna 15 taun (nyaéta henteu aya reureuh kamekaran). Ngan bagian tina kontrovérsi téh alatan béda dina nilai bangbarung ditangtukeun ku para ahli dumasar kana puluhan studi ngeunaan tingkat hormon pertumbuhan manusa dipaké pikeun diagnosing kakurangan hormon pertumbuhan terasing. Sahenteuna saloba kontrovérsi batang tina kasaimbangan benefit résiko ngagunakeun terapi hormon pertumbuhan manusa ti sudut pandang pasien, kolotna sabar, professional Podomoro, pausahaan farmasi, sarta payers. Endocrinologists murangkalih tiasa beuratna épék ngarugikeun anu jarang tina suntikan hormon pertumbuhan sapopoé salami 2 taun kalayan kamungkinan henteu atanapi ngan ukur pertumbuhan minimal dina ukuran awak dewasa dibandingkeun sareng ayeuna. Budak lalaki bisa yakin yén sanajan jangkungna maranéhanana ngan bisa ngaronjat ku 2 cm, eta sia injecting hormon pertumbuhan, tapi payer jeung pausahaan farmasi bisa tahan pintonan béda.
Urang nyandak eGFR dumasar kréatinin sabagé conto, nu mangrupakeun indikator fungsi ginjal loba dipaké pikeun diagnosing jeung pementasan panyakit ginjal kronis, netepkeun cangkok ginjal atawa kaayaan tutulung, sarta nangtukeun kriteria réduksi jeung contraindications pikeun loba obat resép. EGFR nyaéta persamaan régrési saderhana anu digunakeun pikeun ngira-ngira laju filtrasi glomérular (mGFR) anu diukur, anu mangrupa standar rujukan, tapi métode évaluasina rélatif pajeujeut. Persamaan régrési ieu henteu tiasa dianggap modél AI, tapi ngagambarkeun seueur prinsip ngeunaan nilai-nilai manusa sareng penalaran probabilistik.
Titik éntri munggaran pikeun nilai manusa pikeun ngasupkeun eGFR nyaéta nalika milih data pikeun persamaan pas. Antrian aslina dipaké pikeun ngarancang rumus eGFR lolobana diwangun ku pamilon hideung bodas, sarta applicability na keur loba etnis séjén teu jelas. Titik éntri saterusna pikeun nilai manusa kana rumus ieu ngawengku: milih akurasi mGFR salaku tujuan primér pikeun evaluate fungsi ginjal, naon tingkat akurasi ditarima, kumaha carana ngukur akurasi, sarta ngagunakeun eGFR salaku bangbarung pikeun triggering klinis-pembuatan kaputusan (saperti nangtukeun kaayaan pikeun cangkok ginjal atawa resep nginum obat). Tungtungna, nalika milih eusi modél input, nilai manusa ogé bakal asup kana rumus ieu.
Contona, saméméh 2021, tungtunan nyarankeun nyaluyukeun tingkat kréatinin dina rumus eGFR dumasar kana umur sabar, jenis kelamin, jeung ras (ngan digolongkeun salaku individu hideung atanapi non hideung). Penyesuaian dumasar kana balapan ditujukeun pikeun ningkatkeun katepatan rumus mGFR, tapi dina taun 2020, rumah sakit utama mimiti naroskeun kana panggunaan eGFR dumasar kana balapan, nyarioskeun alesan sapertos ngalambatkeun kamampuan pasien pikeun cangkok sareng konkret balapan salaku konsép biologis. Panaliti nunjukkeun yén ngarancang modél eGFR tina segi balapan tiasa gaduh pangaruh anu jero sareng rupa-rupa kana akurasi sareng hasil klinis; Ku alatan éta, selektif fokus kana akurasi atawa fokus kana bagian tina hasil ngagambarkeun judgments nilai tur bisa masking transparan-pembuatan kaputusan. Tungtungna, grup kerja nasional ngusulkeun rumus anyar anu dipasang deui tanpa merhatikeun balapan pikeun nyaimbangkeun masalah kinerja sareng kaadilan. conto ieu illustrates yén sanajan rumus klinis basajan boga loba titik asupna kana nilai manusa.
Dibandingkeun jeung rumus klinis kalawan ukur sajumlah leutik indikator prediksi, LLM bisa diwangun ku milyaran nepi ka ratusan milyar parameter (model beurat) atawa leuwih, sahingga hésé ngarti. Alesan naha urang nyebutkeun "hésé kahartos" nya éta dina kalolobaan LLMs, cara pasti eliciting réspon ngaliwatan questioning teu bisa dipetakeun. Jumlah parameter pikeun GPT-4 teu acan ngumumkeun; Miheulaan na GPT-3 miboga 175 milyar parameter. Parameter anu langkung seueur henteu hartosna kamampuan anu langkung kuat, sabab modél anu langkung alit anu kalebet siklus komputasi langkung seueur (sapertos séri modél LLaMA [Modél Basa Besar Meta AI]) atanapi modél anu disaluyukeun sacara halus dumasar kana tanggapan manusa bakal langkung saé tibatan modél anu langkung ageung. Salaku conto, numutkeun panaksir manusa, modél InstrumentGPT (modél kalayan 1,3 milyar parameter) ngaleuwihan GPT-3 dina ngaoptimalkeun hasil kaluaran modél.
Rincian latihan khusus ngeunaan GPT-4 teu acan diungkabkeun, tapi wincik model generasi saacanna kalebet GPT-3, InstrumentGPT, sareng seueur LLM open source sanésna parantos diungkabkeun. Kiwari, seueur model AI anu nganggo kartu modél; Data evaluasi sareng kaamanan GPT-4 parantos diterbitkeun dina kartu sistem anu sami anu disayogikeun ku perusahaan nyiptakeun modél OpenAI. Nyiptakeun LLM kasarna bisa dibagi jadi dua tahap: tahap pra latihan awal jeung tahap fine-tuning aimed di optimizing hasil kaluaran model. Dina tahap pra-latihan, modél disayogikeun ku korpus ageung kalebet téks Internét asli pikeun ngalatih éta pikeun ngaduga kecap salajengna. Proses "parantosan otomatis" anu katingalina saderhana ieu ngahasilkeun modél dasar anu kuat, tapi ogé tiasa nyababkeun kabiasaan anu ngabahayakeun. Ajén-ajén manusa bakal asup kana tahap pra-latihan, kaasup milih data pra-latihan pikeun GPT-4 jeung mutuskeun pikeun mupus eusi nu teu pantes saperti eusi porno tina data pra-latihan. Sanaos usaha-usaha ieu, modél dasar masih tiasa henteu kapaké atanapi henteu tiasa ngandung hasil kaluaran anu ngabahayakeun. Dina tahap salajengna fine-tuning, loba paripolah mangpaat tur bahaya bakal muncul.
Dina tahap fine-tuning, paripolah model basa mindeng profoundly dirobah ngaliwatan diawasan fine-tuning jeung learning penguatan dumasar kana eupan balik manusa. Dina tahap fine-tuning diawasan, tanaga kontraktor hired bakal nulis conto respon pikeun kecap ajakan tur langsung ngalatih model. Dina tahap diajar penguatan dumasar kana umpan balik manusa, evaluator manusa bakal milah-milah hasil kaluaran modél salaku conto eusi input. Saterusna larapkeun hasil babandingan di luhur pikeun neuleuman “model reward” sarta satuluyna ngaronjatkeun modél ngaliwatan reinforcement learning. Keterlibatan manusa tingkat rendah anu luar biasa tiasa nyaluyukeun modél ageung ieu. Contona, modél InstrumentGPT ngagunakeun tim kurang leuwih 40 tanaga kontraktor anu direkrut ti situs web crowdsourcing sareng lulus tés saringan anu ditujukeun pikeun milih grup annotator anu sénsitip kana karesep kelompok populasi anu béda.
Salaku dua conto ekstrim ieu, nyaéta rumus klinis basajan [eGFR] jeung LLM kuat [GPT-4], demonstrate, pembuatan kaputusan manusa jeung nilai manusa muterkeun hiji peran indispensable dina shaping model kaluaran hasil. Naha modél AI ieu tiasa nangkep nilai pasien sareng dokter anu rupa-rupa? Kumaha carana ngabimbing umum aplikasi AI dina ubar? Sakumaha didadarkeun di handap, pamariksaan ulang analisa kaputusan médis tiasa masihan solusi anu prinsip pikeun masalah ieu.
Analisis kaputusan médis teu wawuh ka loba clinicians, tapi bisa ngabedakeun antara nalar probabilistik (pikeun hasil nu teu pasti patali jeung putusan-pembuatan, kayaning naha mun administer hormon pertumbuhan manusa dina skenario klinis kontroversial ditémbongkeun dina Gambar 1) jeung faktor tinimbangan (pikeun nilai subjektif napel hasil ieu, nu nilai nu disadiakeun dina jangkungna sistem jalu), nu nilaina diitung salaku "dina utilitas jalu" cm. solusi pikeun kaputusan médis kompléks. Dina analisis kaputusan, clinicians mimitina kudu nangtukeun sagala kaputusan mungkin jeung probabiliti pakait sareng unggal hasil, lajeng ngasupkeun pasién (atawa pihak séjén) utiliti pakait sareng unggal hasil pikeun milih pilihan paling luyu. Ku alatan éta, validitas analisis kaputusan gumantung kana naha setting hasilna komprehensif, kitu ogé naha ukuran utilitas jeung estimasi probabiliti akurat. Ideally, pendekatan ieu mantuan mastikeun yén kaputusan anu dumasar-bukti sarta Blok kalawan preferensi sabar, kukituna narrowing celah antara data obyektif jeung nilai pribadi. Metoda ieu diwanohkeun kana widang médis sababaraha dasawarsa ka tukang sareng diterapkeun kana kaputusan pasien individu sareng penilaian kaséhatan populasi, sapertos masihan saran pikeun saringan kanker kolorektal ka populasi umum.
Dina analisis kaputusan médis, rupa-rupa métode geus dimekarkeun pikeun meunangkeun utiliti. Paling métode tradisional langsung diturunkeun nilai ti penderita individu. Métode pangbasajanna nyaéta ngagunakeun skala rating, dimana pasien ngira-ngira tingkat karesepna pikeun hasil anu tangtu dina skala digital (sapertos skala linier mimitian ti 1 dugi ka 10), kalayan hasil kaséhatan anu paling ekstrim (sapertos kaséhatan lengkep sareng maot) anu aya dina dua tungtung. Métode pertukaran waktos mangrupikeun padika anu biasa dianggo. Dina metodeu ieu, pasien kedah nyandak kaputusan ngeunaan sabaraha waktos séhat anu aranjeunna badé nyéépkeun tukeran pikeun waktos kaséhatan anu goréng. Metodeu judi baku nyaeta metoda sejen ilahar dipake pikeun utiliti nangtukeun. Dina metoda ieu, penderita ditanya mana tina dua pilihan maranéhna resep: boh hirup sababaraha taun dina kaséhatan normal kalawan probabiliti husus (p) (t), sarta nanggung résiko maot ku probabiliti 1-p; Atawa pastikeun pikeun hirup salila t taun dina kaayaan kaséhatan cross. Tanya penderita sababaraha kali dina p-nilai béda dugi aranjeunna némbongkeun euweuh leuwih sering dipake tinimbang keur pilihan sagala, ku kituna utiliti bisa diitung dumasar kana respon sabar.
Salian métode anu digunakeun pikeun meunangkeun preferensi pasien individu, métode ogé geus dimekarkeun pikeun ménta utilitas pikeun populasi sabar. Utamana diskusi kelompok fokus (ngahijikeun pasien pikeun ngabahas pangalaman khusus) tiasa ngabantosan ngartos sudut pandangna. Dina raraga éféktif agrégat utiliti grup, rupa téhnik sawala grup terstruktur geus diajukeun.
Dina prakna, bubuka langsung tina utilitas dina diagnosis klinis jeung prosés perlakuan pisan waktos-consuming. Minangka solusi, angkét survéy biasana disebarkeun ka populasi anu dipilih sacara acak pikeun meunangkeun skor utilitas dina tingkat populasi. Sababaraha conto kalebet angkét EuroQol 5 diménsi, bentuk pondok beurat utilitas 6 diménsi, Indéks Utiliti Kaséhatan, sareng Kanker Spésifik Europeanropa Panaliti sareng Pangobatan Quality of Life Questionnaire Core 30 alat.
waktos pos: Jun-01-2024




