Text- och datautvinning, EU och licensavtal: Hur kan juridiken underlätta? (1/2)

Samtidigt som big data, open science och open access blivit etablerade begrepp i forsknings- och bibliotekskretsar de senaste åren talas det också alltmer om text- och datautvinning, text and data mining på engelska (TDM). Text- och datautvinning betyder att man på teknisk väg kan genomsöka stora mängder data som det skulle vara omöjligt att sammanställa resultat och slutsatser kring för hand.1 På så sätt kan man t.ex. kartlägga trender inom ett forskningsfält genom att samköra ett stort antal vetenskapliga artiklar inom loppet av några minuter.

Tekniken existerar redan idag men det finns stora juridiska frågetecken kring användningen av den till dess fulla potential. Som exempel kan nämnas cancerforskare vid Karolinska Institutet som arbetar med TDM för att kartlägga mekanismer bakom canceruppkomst, t.ex. för att förstå hur kemikalier orsakar cancer. Inom cancerforskningen är den vetenskapliga litteraturen mycket omfattande. För att kartlägga längre utvecklingstendenser och identifiera nya samband och mönster i data har forskare tillsammans med lingvister tagit fram TDM-baserade verktyg som hittills har analyserat sammanfattande abstracts av medicinska publikationer. Problemet är dock att fulltextversionerna inte är fritt tillgängliga för användning av TDM, vilket hämmar forskningens potential. En manuell genomgång av detta informationsmaterial skulle vara ogörligt.

Eftersom en utvinningsprocess genom TDM på material i en tidskriftsdatabas baseras på upphovsrättsskyddat material och rent tekniskt kräver att man gör en kopia av den data som ska undersökas är en central fråga om det kräver rättighetshavarens (d.v.s. förlagets) tillåtelse för att kunna utföra TDM. Rättsläget är idag oklart. Från bibliotekshåll har principen ”the right to read is the right to mine” hävdats: bibliotek som genom licens förvärvat läsrättigheter till material i en databas har också förvärvat rättigheterna att göra TDM på materialet. Förläggare och databasinnehavare har däremot hävdat att TDM är ett särskilt upphovsrättsligt förfogande som kräver uttrycklig separat licensiering och att TDM-resultatet borde anses som ett bearbetat verk utifrån det undersökta materialet. Frågan om huruvida samtycke behövs för en TDM-process på material som användaren har rätt att läsa har aldrig prövats i Sverige. Förmodligen skulle det i dagsläget krävas samtycke om frågan prövades rättsligt.

En juridisk men också praktisk fråga

Juridiskt finns det olika sätt att kunna få samtycke att utföra TDM. Samtliga har olika praktiska konsekvenser.

"Miner Wayne Gipson, 39, With His Daughter Tabitha, 3" av Jack Corn (PD)

”Miner Wayne Gipson, 39, With His Daughter Tabitha, 3” av Jack Corn (PD)

Ett första sätt är att forskaren ber om förlagets tillåtelse varje gång hen vill använda sig av TDM. Ur förlagets synvinkel kan detta ses som en användning av deras material som inte ingår i de klassiska läsrättigheterna som lärosäten förvärvar, och alltså som en anledning att kräva betalning av en extra avgift. Förutom de eventuella kostnaderna innebär denna lösning en administrativ belastning för forskaren och biblioteket (kontakta förlaget, skriva på ett avtal, betala en faktura, etc.) som kan få dem att avstå från att utföra TDM. Dessutom har många forskare ingen kompetens, och förväntas inte ha det, när det gäller att förhandla licenser.

Ett annat sätt att få samtycke är att få in en rätt till TDM i det licensavtal som lärosätet tecknar med förlaget, vilket innebär att så länge att man har rätt att läsa materialet har man också rätt att utföra TDM. En fördel med denna lösning är att lärosätet bara behöver förhandla en gång och sedan får alla forskare som är anslutna till det utföra TDM utan särskilt tillstånd under licensperioden. Men allt beror på hur bra förhandlingen av licensavtalet går: vissa förlag ställer svåra villkor som gör att utförandet av TDM blir mycket mindre smidigt i praktiken, ibland omöjligt. Praxis visar också att det inte går att få exakt samma villkor med alla förlag. I slutändan måste forskarna ta reda på vad man får och inte får göra beroende på vilket material man vill undersöka.

Mot dessa svårigheter skulle man kunna agera på lagstiftningsnivå och införa ett permanent undantag i upphovsrätten som tillåter utförande av TDM utan rättighetshavares tillåtelse, oavsett vad licensavtalen föreskriver. Storbritannien introducerade ett sådant undantag i sin nationella lagstiftning 2014. Alla forskare i Storbritannien får alltså använda sig av TDM-tekniken under samma villkor. Men eftersom forskning ofta sker över gränserna skulle det behövas en reform på högre nivå, till att börja med inom EU.

Samma TDM för hela EU

Idag finns inga enhetliga upphovsrättsliga regler kring TDM i Europa. Frankrike kommer snart att införa en undantagsregel i linje med den brittiska. I andra EU-länder pågar liknande diskussioner. Utanför Europa finns undantag i den nationella lagstiftningen i bland annat Japan och Israel. I USA kan TDM utföras under det upphovsrättsligt tillåtna användningsområden som brukar kallas fair use.

"ready to mine." av Matt Hintsa (CC-By-NC-ND)

”ready to mine.” av Matt Hintsa (CC-By-NC-ND)

Inom EU har det alltmer börjat uppmärksammas att det är en konkurrensnackdel för forskning och innovation att det råder tydligare regler kring TDM utanför EU. Därför har EU-kommissionen genom sitt pågående reformarbete med en EU-gemensam upphovsrätt (inom det som kallas digitala inre marknaden) identifierat lagstiftning kring TDM som ett område som behöver uppmärksammas när man gör en översyn av det så kallade Infosoc-direktivet. Detta är ett direktiv från 2001 som innehåller upphovsrättsliga undantag som medlemsländerna kan välja att implementera nationellt. Ett förslag om en sådan gemensam upphovsrättslig undantagsregel för TDM har diskuterats i EU-parlamentet under 2016. En diskussionspunkt har varit om undantagsregeln endast skulle vara för icke-kommersiellt bruk eller generell. Svårigheten ligger i att formulera en lagtext som ger forsknings- och innovationssektorn tillräckliga möjligheter för TDM samtidigt som den inte inkräktar på upphovsrättsinnehavarnas intressen. Detta är förstås föremål för ett intensivt lobbyarbete från båda sidor. I september 2016 lämnade Kommissionen sitt förslag till upphovsrättsreform i form av ett nytt direktivförslag. Detta innehåller, bland mycket annat, en gemensam upphovsrättsregel som tillåter TDM för offentliga forskningsinstitutioner. Förslaget kommer nu att behandlas inom EU:s lagstiftningsprocess under det närmaste året. Först när direktivet har beslutats kan lagstiftningen implementeras i varje medlemsstat.

Vad ska vi i Sverige göra så länge?

Det är svårt att säga hur mycket forskare i Sverige använder sig av TDM-tekniken idag men man kan i vilket fall säga att den juridiska miljön inte uppmuntrar dem att börja.2 Vissa licensavtal som lärosätena tecknar med förlagen (bland annat via Bibsamkonsortiet) innehåller TDM-klausuler men långt ifrån alla. För vissa lärosäten är det avsiktligt att de nuvarande licensavtalen inte nämner TDM. Även om det lämnar forskare i ett juridiskt vakuum vill man inte riskera att låsa in sig i sämre villkor genom avtalen än vad man skulle kunna få i framtiden genom lagstiftning. Det finns nämligen inga garantier för att den eventuella kommande EU-lagstiftningen som nämns ovan blir obligatorisk tillämplig. EU-lagstiftare kan bestämma att avtalsfriheten också ska gälla för TDM, med andra ord att lagstiftningen bara gäller om licensavtalen inte föreskriver speciella villkor.

Om ett kommande upphovsrättsundantag däremot blir obligatoriskt tillämpligt kan man under tiden med fördel förhandla TDM-vilkor i licensavtalen. Dessa villkor kommer att gälla tills lagen träder i kraft, även om de inte är optimala.

☛ Texten fortsätter här.

Laurent Fournier, licenshandläggare och juridiskt stöd för Bibsamkonsortiet, Kungliga biblioteket, och Jonas Holm, jurist, Stockholms universitetsbibliotek

Denna text är publicerad under licensen Creative Commons Erkännande 4.0 (CC-By).


Fotnoter

1. Mer specifikt innebär TDM att automatisera algoritmer och att driftsätta dem i programvara i syfte att aggregera information ur stora datamängder för vidare analys av mänskliga analytiker.
2. Det har visats att ”länder där akademiska forskare måste skaffa uttryckligt samtycke från rättighetsinnehavarna att utföra laglig TDM uppvisar en betydligt lägre andel av TDM forskningsresultat i förhållande till de totala forskningsresultaten” (egen översättning av: Handke, Christian och Guibault, Lucie och Vallbé, Joan-Josep, Is Europe Falling Behind in Data Mining? Copyright’s Impact on Data Mining in Academic Research (June 7, 2015). Finns på http://ssrn.com/abstract=2608513 eller http://dx.doi.org/10.2139/ssrn.2608513).
Det här inlägget postades i EU, Licenser, TDM. Bokmärk permalänken.

En kommentar till Text- och datautvinning, EU och licensavtal: Hur kan juridiken underlätta? (1/2)

  1. Pingback: Text- och datautvinning, EU och licensavtal: Hur kan juridiken underlätta? (2/2) | Open access i Sverige