Yle vaalikone data offline for now

I’ve looked a bit closer at the Finnish copyright laws and come to the conclusion that I might have been a bit overenthusiastic publishing the raw data from the vaalikone of Yle. I scraped and published this data thinking it would merely be a mashup of public data and therefore a legal thing to do. However, I did not consider the 49 § of the copyright law which states that the producer of a catalogue or database including a “great amount of information” owns the exclusive right to distribute the catalogue (or an “essential” part of it). I have not run this by any legal expert, but my own conclusion is that:

  • Gathering the data should not be a problem. In other words, anyone can download my Ruby script (or this slightly more professional version by Anon) and scrape the data to ones own computer.
  • Publishing this data without the permission of Yle might be a legal problem. Or could one argue that the vaalikone data is actually not a catalogue or database, but rather a large number of “quotes” from candidates? After all the answers given by the candidates are not visually published as databases.
  • Publishing a mashup (a visualization for example) should not be a problem as it does not mean that the user gets a hold of the raw data.

I have contacted Yle to ask for their permission to publish the data again. Their response was that they will consider it within a couple of weeks.

If anyone holds any expertise in these questions I would love to hear your input.


7 Comments on “Yle vaalikone data offline for now”

  1. veikko says:

    Yle, come on, seriously. “Within a couple of weeks” reads like a sick joke. Welcome to the future.

  2. En ole mikään lakiekspertti itsekään, mutta Julkisen datan opasta kirjoittaessamme ( http://www.julkinendata.fi ) jouduimme asiaan paneutumaan. Oma käsitykseni on, että sinä et ottanut käyttöösi “katalogia” tai “tietokantaa”, vaan ainoastaan sen sisällön, mikä on vapaata riistaa. Alla ote kirjastamme:

    —CLIP—

    Tekijänoikeus ei suojaa ideoita eikä faktatietoja, vaan sitä muotoa, mikä niille annetaan. Tämä tarkoittaa, että faktoista koostuvaa tietosisältöä itsessään ei omista kukaan, ellei sopimuksessa tiedon tuottajan kanssa ole niin määritelty. EU:ssa tekijänoikeuslaissa suojataan myös tietokantoja joko kirjallisina teoksina tai niin sanotun sui generis -suojan avulla. Mikäli tietokanta on suojattu kirjallisena teoksena suojan kohteena on tietojen omaperäinen valinta ja järjestäminen tietokantaan. Sui generis -suoja taas kohdistuu tietokannan keräämiseen, valmistamiseen tai esittämiseen käytettyyn huomattavaan työmäärään. Kirjallisten teosten tekijänoikeussuoja on 70 vuotta tekijän kuolinvuodesta ja sui generis -suoja-aika on 15 vuotta tietokannan valmistumisesta tai viimeisestä muutoksesta.

  3. Kokonaisesta tietokannasta ei saisi tehdä kopiota, koska se rikkoo juuri tuota sui generis-suojaa. Toisaalta laillisesta lähteestä (check) yksityiseen käyttöön (tässä harmaalla vyöhykkeellä) tehtyjen kopioiden tekeminen on edelleen sallittua.

    Vaikka toiminta olisikin tekijänoikeuslain vastaista, silti on varsin vaikea nähdä miksi YLE lähtisi oikeuteen tällaisesta.

  4. Mikä tahansa luettelo saa tämän luettelosuojan, kyseessä ei tarvitse olla “oikea tietokanta”. Tässä ehkä voisi vääntää kättä siitä, onko tuon tietokokonaisuuden kerääminen ollut kovan työn takana, vai onko se syntynyt itsekseen, yksittäisten ihmisten syöttäessä sinne tiedot. Eli onko YLE tietokannan tuottajana nähnyt suuren vaivan vai ei? Jos on, tietokanta on luettelosuojan piirissä eikä sitä saa merkittävissä määrin julkistaa muualla. Tietokannan sisältöä saa kyllä käyttää, jos sen saa käsiinsä vaikkapa scrape-skriptin avulla, mutta sitä tietoa ei saa könttinä levitellä julkisesti.


Leave a reply to Antti Poikola Cancel reply