Od EPFL-a novi multimodalni model za fleksibilniju umjetnu inteligenciju

Može učiti iz teksta, slika, videa i zvuka i, zahvaljujući modularnosti, proizvodi bilo koji broj ili kombinaciju predviđanja

Strojno učenje: novi multimodalni model za fleksibilniju umjetnu inteligenciju iz EPFL-a
Od EPFL-a novi multimodalni model za fleksibilniju umjetnu inteligenciju (Foto: Brian Penny/Pixabay)

Bilo da govorimo o OpenAI-u ili ChatGPT-u, velika većina chatbota generativna umjetna inteligencija temelje se na tzv Veliki jezični model (LLM), modeli od duboko učenje u velikoj mjeri osposobljeni da daju odgovore na pitanja koja im postavlja učenje informacija kroz velike količine teksta.

Posljednja granica odgenerativni AI jesam li ja multimodalni modeli, koji kombiniraju razumijevanje jezika i slike, video i audio kako bi ponudili još naprednije iskustvo i uslugu.

Njihovo stvaranje, međutim, predstavlja nekoliko izazova, posebno ako je namjera izgraditi multimodalne modele u maloj mjeri: česti prisutnost podataka koji nedostaju zbog nedostupnosti informacija, gotovo uvijek zbog djelomične dostupnosti resursa.

Ukratko, rizik je da model uči na temelju nedostatka, te da su izračuni i predviđanja iskrivljeni. I tu je EPFL započeo sa svojim novim projektom.

S Tehničkog sveučilišta u Lausanni i Zürichu koalicija za zelenu energiju
U 3D tehnološka rukavica koja će virtualnu stvarnost učiniti opipljivom

Strojno učenje
Kampus Savezne politehnike u Lausanni (Foto: Facebook/EFPL)

MultiModN, modularni multimodalni model rođen u Lausanni

Istraživači Savezno veleučilište u Lausanni (EPFL), jedno od najboljih sveučilišta na svijetu u pogledu inženjerstva i informacijske tehnologije, zapravo su se razvila MultiModN, jedinstveni modularni multimodalni model nedavno predstavljen na NeurIPS2023.

Istraživači iz laboratorija Machine Learning for Education (ML4ED) i Machine Learning and Optimization (MLO) na EPFL-ovoj školi računalnih znanosti i komunikacija odlučili su razviti i testirati upravo suprotno od velikog, ali razmišljati u manjoj mjeri.

Na čelu s učiteljicom Mary-Anne Hartley, direktor Laboratorija za globalne inteligentne zdravstvene tehnologije čiji su domaćini MLO i Medicinski fakultet Yale, i prof. Tanja Käser, direktor ML4ED, tim je stvorio multimodalni model koji može učiti iz teksta, slika, videa i zvukova, ali koji se, za razliku od postojećih, sastoji od promjenjivi broj manjih modula, autonomna i specifična za unos.

Potonji se mogu odabrati na temelju dostupnih informacija i zatim sastaviti u niz bilo kojeg broja, kombinacije ili vrste unosa. Stoga može proizvesti bilo koji broj ili kombinaciju predviđanja.

"Procijenili smo MultiModN u deset pravih aktivnosti, uključujući podršku za medicinsku dijagnozu, predviđanje akademskog uspjeha i vremensku prognozu,” objasnio je Vinitra Swamy, doktorant na ML4ED i MLO i prvi koautor projekta.

„Kroz ove eksperimente vjerujemo da je MultiModN prvi intrinzično interpretabilan pristup multimodalnom modeliranju koji je otporan na nedostajuće podatke".

EPFL-ov "recept" za snažnija kvantna računala
Od umjetne inteligencije odlučujući poticaj kriptovalutama?

Strojno učenje
EPFL School of Computer Science and Communication (Foto: Facebook/EPFL IC)

Prvi slučaj upotrebe: kliničke odluke za medicinsko osoblje

Prvi slučaj korištenja MultiModN-a bit će kao sustav podrške za kliničke odluke za medicinsko osoblje u okruženjima s ograničenim resursima.

U sektoru zdravstva, zapravo, klinički podaci često nedostaju, možda zbog ograničenih resursa (pacijent si ne može priuštiti određeni test) ili, obrnuto, zbog obilja resursa i informacija. MultiModN može učiti iz ovih podataka iz stvarnog svijeta bez upijanja njihovih takozvanih pristranosti i prilagoditi predviđanja bilo kojoj kombinaciji ili broju ulaza.

"Podaci koji nedostaju obilježje su konteksta s ograničenim resursima, a kako modeli uče te obrasce koji nedostaju, mogu kodirati pogreške u svojim predviđanjima,” istaknuo je Mary-Anne Hartley.

“Potreba za fleksibilnošću u suočavanju s nepredvidivo dostupnim resursima je ono što je inspiriralo MultiModN".

U vrhunskom događaju utjecaj umjetne inteligencije i strojnog učenja na usluge
Svi razlozi za sve veći utjecaj umjetne inteligencije u digitalnoj umjetnosti

Strojno učenje
Laboratorij za analizu (Foto: Michal Jarmoluk/Pixabay)

Iz laboratorija u stvarni život: u tijeku je ispitivanje upale pluća i tuberkuloze

Publikacija je, međutim, samo prvi korak prema implementaciji i testiranju na terenu. Profesor Hartley je radio s kolegama u Sveučilišnoj bolnici Lausanne (CHUV) i Inselspitalu, Sveučilišnoj bolnici u Bernu, na provođenju kliničke studije usredotočen na dijagnosticiranje upale pluća i tuberkuloze u okruženjima s ograničenim resursima iu procesu je zapošljavanja tisuća pacijenata Južna Afrika, Tanzanija, Namibija e Benin.

Istraživačke skupine poduzele su opsežnu inicijativu za obuku, podučavanje više od 100 liječnika za sustavno prikupljanje multimodalnih podataka uključujući ultrazvučne slike i video zapise, tako da se MultiModN može osposobiti da bude osjetljiv na stvarne podatke iz regija s niskim resursima.

"Prikupljamo upravo onakvu vrstu složenih multimodalnih podataka za koje je MultiModN dizajniran da rukuje", rekao je liječnik Noémie Boillat-Blanco, infektolog u CHUV.

“Uzbuđeni smo vidjeti model koji može cijeniti složenost resursa koji nedostaju u našem kontekstu i sustavnog nedostatka rutinskih kliničkih procjena", dodala je liječnica Kristina Keitel Inselspitala, sveučilišne bolnice u glavnom gradu Švicarske.

Sigurnost AI? Izjava iz Bletchley Parka je ključna
Axel Springer-OpenAI os za AI u službi novinarstva

EPFL-ova inovacija osmišljena je za poboljšanje kliničkog odlučivanja pružanjem pristupa specijaliziranim medicinskim znanjima (Foto: Irwan/Unsplash)

Strojno učenje u službi javnog dobra

Razvoj i obuka MultiModN-a predstavlja nastavak EPFL-ovih napora da se alati za strojno učenje prilagode stvarnosti i za javno dobro, a dolazi nedugo nakon pokretanja Meditron, model umjetne inteligencije posebno dizajniran za medicinski sektor.

Meditron također pripada kategoriji velikih jezičnih modela (LLM), ali za razliku od generalističkih modela, koji služe širokom rasponu zadataka, fokusiran je na medicinsko polje, i kompaktniji je u smislu veličine, ali jednako učinkovit.

Cilj Meditrona je da demokratizirati pristup medicinskim informacijama visoke kvalitete, što pomaže u donošenju kliničkih odluka.

Istraživači EPFL-a razvili su dvije verzije sa 7 milijardi odnosno 70 milijardi parametara, a modeli su obučeni na odabranim, visokokvalitetnim izvorima medicinskih podataka, uključujući recenziranu znanstvenu literaturu i razne kliničke smjernice, osiguravajući široku i točnu bazu znanja.

I Meditron, predstavljen u studenom 2023., i MultiModN stoga su u skladu s misijom EPFL-ovog novog AI centra, koji se fokusira na to kako odgovorna i učinkovita umjetna inteligencija može promicati tehnološke inovacije za dobrobit svih sektora društva.

Revolucionarni senzori koji mogu uštedjeti milijune baterija
AI: Rat koji će izbiti neće biti onakav kakav očekujemo…

Strojno učenje: novi multimodalni model za fleksibilniju umjetnu inteligenciju iz EPFL-a
Vanjski izgled EPFL kampusa s logom Savezne politehnike u Lausanni (Foto: Facebook/EFPL IC)