
Bør vi investere mer i datadeling, eller dele ferdigtrente KI-modeller? En bærekraftig tilnærming til kunstig intelligens
I en artikkel på Digi.no fremhever Tommi Larsen fra Tietoevry Industry at minst halvparten av budsjettet for kunstig intelligens (KI) bør brukes på datainnsamling, strukturering og tilrettelegging. Dette er en sterk påminnelse om hvor viktig det er å ha tilgang til gode data for å oppnå suksess med KI-prosjekter. Likevel kan denne tilnærmingen ha sine begrensninger. I denne artikkelen ønsker vi å diskutere en alternativ tilnærming: deling av modeller fremfor data, samt utforske federert læring som en mulig løsning for fremtiden.
Data som grunnlag for KI-modeller
Som Larsen påpeker, ligger verdien av KI i de dataene som brukes til å trene modellene. Dataene må være strukturerte, av høy kvalitet og relevante for det aktuelle formålet. Dette krever omfattende arbeid med dataforvaltning, noe som kan være både tidkrevende og kostbart.
Mange organisasjoner bruker store ressurser på å samle inn og rense data, men kan fortsatt oppleve utfordringer med datasiloer, manglende deling og datasikkerhet. Derfor er det viktig å ha kontroll på egne data, men vi bør også stille spørsmål ved om dette er den mest effektive måten å drive KI-utvikling på.
Deling av modeller: En mer effektiv tilnærming?
Et alternativ til datadeling er å dele ferdigtrente modeller. Dette kan være spesielt fordelaktig når:
1. Datasikkerhet og personvern er kritisk: Deling av data kan være problematisk i mange sektorer, særlig innen helse, finans og offentlig sektor. Ved å dele modeller i stedet for data, reduseres risikoen for brudd på personvern og konfidensialitet.
2. Redusert ressursbruk: Å trene KI-modeller krever betydelig datakraft, noe som kan være både kostbart og miljøskadelig. Ved å gjenbruke eksisterende modeller kan vi redusere energiforbruket knyttet til trening av nye modeller.
3. Tilgjengelighet for små og mellomstore bedrifter: Mange mindre aktører har ikke tilgang til store datasett. Ferdigtrente modeller gir dem en mulighet til å implementere KI-løsninger uten behov for store investeringer i datainnsamling.
Federert læring: En mulig løsning for fremtiden
Federert læring er en metode som gjør det mulig å trene modeller uten å dele selve dataene. I stedet for å sende data til en sentral server, trener man modeller lokalt på egne data, og sender kun oppdaterte modellparametere tilbake til en sentral modell. Dette har flere fordeler:
• Personvern og sikkerhet: Dataene forlater aldri den lokale enheten, noe som reduserer risikoen for datalekkasjer og personvernbrudd.
• Redusert båndbredde: Kun modellparametere deles, ikke hele datasett. Dette reduserer mengden data som må overføres.
• Samarbeid på tvers av organisasjoner: Federert læring legger til rette for samarbeid mellom organisasjoner som ønsker å dra nytte av felles kunnskap uten å eksponere sensitive data.
Miljømessige fordeler ved deling av modeller
KI-trening er ressurskrevende og har en betydelig miljøpåvirkning, spesielt når det kommer til energiforbruk. Ved å dele eksisterende modeller kan vi redusere behovet for å trene nye modeller fra bunnen av, noe som kan bidra til lavere energiforbruk og en mer bærekraftig tilnærming til KI-utvikling.
Konklusjon
Mens investering i datainnsamling og strukturering utvilsomt er viktig, bør vi også vurdere fordelene ved å dele ferdigtrente modeller. Dette kan være en mer effektiv og bærekraftig tilnærming, spesielt når det kombineres med teknologier som federert læring. Ved å fokusere på deling av modeller kan vi åpne døren for et mer inkluderende, sikkert og miljøvennlig økosystem for kunstig intelligens.

