Debatt

Nå skaper vi det nye dataspråket

Språklig logikk med utspring i oldtidens filosofi hjelper oss nå i jakten på grønne fremtidsmaterialer.

Dette er et debattinnlegg som gir uttrykk for skribentens holdninger og meninger. Du kan sende inn debattinnlegg til debatt@dagsavisen.no.

Hvordan velge materialer som får klær, møbler og sportsutstyr til å vare lenger? Hvordan må råstoffer bearbeides for at det skal bli lett å gjenvinne «byggeklossene» i emballasje og hvitevarer? Og hvilke miljøvennlige forbindelser kan gi batteriet i den neste elbilen din økt rekkevidde?

Nå skal det bli enklere å få svar på slike og andre spørsmål som avgjør om vi mennesker vil lykkes med den grønne omstillingen.

Enklere fordi en gruppe forskere i Europa, inkludert oss i Sintef, nå lager et felles språk for vitenskapens datasystemer. Nærmere bestemt et definisjonssystem som har sine røtter i klassisk gresk filosofi og nå utvikles gjennom et nært samarbeid mellom filosofer av i dag og oss naturvitere.

Bakteppet er at datamaskiner i dag gjør nesten alt innen forskning og industri. Resultater og dokumentasjon er derfor stort sett digitale, mens tolkningen av slike data som regel gjøres av mennesker.

Hvis informasjon fra ett datasystem skal brukes videre av et annet system, trengs som oftest en manuell innmating. En ineffektiv prosess med mange feilkilder. Eksempelvis fikk Nav for noen år siden erfare at dette ga lang saksbehandling.

Ett alternativ har vært å koble systemer sammen to og to ved å skreddersy nye «språkkurs» hver gang et program skal utveksle data, alt etter hvem «samtalepartneren» er. En stor jobb. Litt som å gjøre nordmenn og finner i stand til å samarbeide ved å lære nordmenn finsk eller finnene norsk. Men om disse etterpå skal samarbeide med en tyrker eller portugiser, er de like langt.

Så hva om vi i stedet gir alle datasystemer et språk med felles grunntrekk – i vår lignelse samme alfabet og felles grunnleggende grammatikkregler? Det er faktisk nok til å få alle systemer til å kommunisere effektivt.

Nettopp et slikt språk utvikler vi i prosjektene våre, som ledd i EUs rammeprogram for forskning. Behovet for fellesspråket er nært knyttet til den økende bruken av maskinlæring – en av disiplinene innen vekstområdet kunstig intelligens.

Målet vårt er et formelt språk som kan beskrive, formidle og gjenbruke data. Formelt ved at informasjon fra ethvert fagfelt skal kunne forstås og uttrykkes av maskiner og algoritmer. Blant annet legges rett inn i en kunstig intelligens, noe som en dag kan åpne for design av det perfekte produkt og avdekking av uante sammenhenger.

Språk i den forstand at informasjonen kan forstås og uttrykkes også av mennesker.

Slår du opp «stol» i en ordliste, er svaret «møbel til å sitte på». Slike forklaringer inngår også i den ordlista vi lager.

Skal datasystemer snakke sammen, må de bruke de samme ordene. Og disse må være så veldefinerte at de ikke kan misforstås. Men datasystemer er ikke intelligente på samme måte som deg. Om du hører ordet «batteri», forstår du ut fra sammenhengen om det gjelder energilagring eller en artillerienhet.

Skal et datasystem skjønne sammenhengen, må den spesifiseres. Slike formelle spesifikasjoner kalles ontologier.

Ontologi er opprinnelig en gammel filosofisk disiplin som handler om hva virkeligheten består av. Eksempelvis: Finnes stoler egentlig? Eller er de en samling partikler med et spesielt forhold til hverandre i rom og tid som kun skaper et inntrykk av at det vi kaller en stol finnes?

Prosjektene våre går utenom denne filosofiske tilnærmingen og hviler i stedet på ontologienes definisjonsregler for å beskrive det vi erfarer.

Slår du opp «stol» i en ordliste, er svaret «møbel til å sitte på». Slike forklaringer inngår også i den ordlista vi lager. Men vi utvider definisjonene ved å bryte begrepene ned til en slags legoklosser i tillegg.

Vi redegjør for de antatt minste byggesteinene en ting består av, og beskriver hvordan «legoklossene» kan settes sammen til større gjenstander. Dette gir oss definisjoner av oppbyggingen til stoff og gjenstander, av prosessene som kan endre disse og av formålet med formgivingen. Slik gjenoppbygger vi det universet vi først plukket fra hverandre.

På 1980-tallet begynte forskere innen kunstig intelligens (AI) å bruke ontologier – til å lage databaser av begrep og forholdet mellom dem. Ved hjelp av disse utledet AI-systemer ny kunnskap gjennom logisk resonnering.

Ontologier ble senere brukt til å lage en semantisk web. En utvidelse av internett som gjorde at ikke bare mennesker, men også datamaskiner kan dra nytte av informasjonen.

Så sto biomedisinfaget for tur. Ontologier bidro til at kunnskap om det komplette menneskelige arvematerialet (genomet) oppklarte til da skjulte sammenhenger. Deriblant hvordan ulike proteiner fungerer. Dette ga raske framskritt i medisinsk forskning.

Men innen materialteknologi har innføring av ontologier gått trått – fordi fysikk og kjemi er så komplekse og vidtspennende fag.

Det er bakgrunnen for arbeidet vårt. Ambisiøse prosjekter der vi lager en logisk forankret ontologi for naturvitenskap: En «ordliste» som kombinerer perspektiver fra høyst ulike fag- og forskningsmiljøer i sin beskrivelse av emner. Den har fått navnet «Elemental Multiperspective Material Ontology».

Utvikling av grønne batterier er ett felt der ontologien vår kan gjøre en forskjell. Til det trengs et språk som forklarer at batterier består av en anode, katode, elektrolytt og andre komponenter. Vi må også definere hva en anode er. Angi dens egenskaper, beskrive dem og hvordan anoden forholder seg til de andre komponentene.

Til dette vil vi bruke et eget språk for fagfeltet batteriutvikling, basert på det grunnleggende språket vi alt har laget.

Slik vil datasystemer for batteriutvikling kunne utnytte informasjon fra andre fagfelt raskt og rimelig. Eksempelvis relevante resultater fra eksperimenter med røntgendiffraksjon, en metode som gir opplysninger om elektronfordelingen i molekyler.

Hele datautvekslingen vil da skje uten menneskers tids- og kostnadskrevende involvering.

For snart 950 år siden brukte filosofen Anselm av Canterbury ontologidisiplinen til å bevise at Gud finnes. Like høyt har ikke vi lagt lista. Men vi er ubeskjedne nok til å si at vi skal bidra til teknologiske fremskritt ved å bruke klassisk filosofi på nye måter.


Hold deg oppdatert. Få daglig nyhetsbrev fra Dagsavisen

Mer fra: Debatt