Health

Studi: Google mengungkapkan kemampuan baru LLM Med-Gemini

Sebuah pelajaran dilakukan oleh Google Penelitian, bekerja sama dengan Google DeepMindmengungkapkan raksasa teknologi tersebut memperluas kemampuan model AI-nya untuk Med-Gemini-2D, Med-Gemini-3D, dan Med-Gemini Polygenic.

Google mengatakan pihaknya menyempurnakan kemampuan Med-Gemini menggunakan data histopatologi, dermatologi, radiologi 2D dan 3D, genomik dan oftalmologi.

Med-Gemini-2 perusahaan dilatih tentang gambar medis konvensional yang dikodekan dalam 2D, seperti irisan CT, patch patologi, dan rontgen dada.

Med-Gemini-3D menganalisis data medis 3D, dan Google melatih Med-Gemini-Polygenic tentang fitur non-gambar seperti genomik.

Studi tersebut mengungkapkan bahwa model Med-Gemini-2D yang disempurnakan melampaui hasil sebelumnya dalam pembuatan laporan rontgen dada yang didukung AI sebesar 1% hingga 12%, dengan laporan yang “setara atau lebih baik” dibandingkan laporan ahli radiologi asli.

Model ini juga melampaui kinerja sebelumnya dalam hal menjawab pertanyaan visual rontgen dada berkat penyempurnaan pada encoder visual dan komponen bahasa Gemini.

Hal ini juga dilakukan dengan baik dalam klasifikasi rontgen dada dan tanya jawab visual radiologi, melebihi baseline sebelumnya pada 17 dari 20 tugas; namun, dalam bidang oftalmologi, histopatologi, dan dermatologi, Med-Gemini-2D melampaui batas dasar dalam 18 dari 20 tugas.

Med-Gemini-3D dapat membaca pemindaian 3D, seperti CT, dan menjawab pertanyaan tentang gambar.

Model tersebut terbukti menjadi LLM pertama yang mampu menghasilkan laporan untuk CT scan 3D. Namun, hanya 53% laporan yang dapat diterima secara klinis. Perusahaan mengakui bahwa penelitian tambahan diperlukan agar teknologi tersebut dapat mencapai kualitas pelaporan ahli radiologi.

Med-Gemini-Polygenic adalah model pertama perusahaan yang menggunakan data genomik untuk memprediksi hasil kesehatan.

Para penulis menulis bahwa model tersebut mengungguli “pendekatan berbasis skor risiko poligenik linier standar untuk prediksi risiko penyakit dan menggeneralisasi penyakit yang berkorelasi secara genetik yang belum pernah dilatih.”

TREN YANG LEBIH BESAR

Para peneliti melaporkan keterbatasan dalam penelitian ini, dengan menyatakan bahwa perlunya mengoptimalkan model multimodal untuk beragam aplikasi klinis yang relevan, mengevaluasinya secara ekstensif pada kumpulan data klinis yang sesuai, dan mengujinya di luar tolok ukur akademis tradisional untuk memastikan keamanan dan keandalan dalam situasi dunia nyata.

Penulis penelitian ini juga mencatat bahwa “semakin beragam profesional kesehatan perlu terlibat secara mendalam dalam penerapan teknologi ini di masa depan, membantu memandu model menuju kemampuan yang memiliki kegunaan berharga di dunia nyata.”

Sejumlah bidang disebutkan di mana evaluasi di masa depan harus menjadi fokus, termasuk menutup kesenjangan antara benchmark dan bedside, meminimalkan kontaminasi data dalam model besar dan mengidentifikasi serta memitigasi risiko keselamatan dan bias data.

“Meskipun kemampuan canggih pada tugas-tugas medis individual berguna, kami membayangkan masa depan di mana semua kemampuan ini diintegrasikan bersama ke dalam sistem yang komprehensif untuk melakukan serangkaian tugas klinis multidisiplin yang kompleks, bekerja sama dengan manusia untuk memaksimalkan kemanjuran klinis dan meningkatkan hasil pasien. Hasil yang disajikan dalam penelitian ini mewakili langkah menuju realisasi visi ini,” tulis para peneliti.

Source

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button