Documentació

Què és Open Data?

Open Data o RISP?

Principis de l’Open Data

Què és un dataset?

Beneficis

Què és Open Data?

Open Data és una filosofia que té per objectiu posar a disposició de la societat les dades que gestiona l’administració pública en formats fàcils de manipular.

Qualsevol persona o empresa pot analitzar, reutilitzar i redistribuir aquestes dades, generant nous serveis i permetent d’aquesta manera que l’administració pública millori en transparència i govern obert i fomenti la generació de riquesa a través de la gestió intel·ligent dels recursos (govern intel·ligent).

L’objectiu és que ciutadania i empreses reaprofitin aquestes dades per generar valor econòmic. Podran construir sobre elles una nova idea que generi noves dades, coneixements o, fins i tot, la creació de nous serveis que reportin beneficis econòmics i / o socials. A aquestes empreses o persones se’ls denomina “infomediaris” o “reutilitzadors”.

Open Data o RISP?

Els termes Open Data i RISP (Reutilització de la Informació del Sector Públic) estan molt relacionats. En ambdós casos, del que es tracta és de posar a disposició de la societat dades “en brut” que mantingui l’administració.

Tot i que els termes puguin semblar similars, el concepte Dades Obertes persegueix oferir les dades en formats completament lliures (no propietaris) i no es contempla el pagament per l’ús de dades (han de ser gratuïts). No obstant això, la Reutilització de la Informació de les Administracions Públiques preveu la possibilitat del pagament per l’ús d’aquestes dades i la publicació de les dades en qualsevol format.

Principis de l’Open Data

Per assegurar que s’està parlant de Dades Obertes i no d’un succedani que no entraria dins de la filosofia real de l’Open Data, és necessari que les dades oferides compleixin els següents principis:

  1. Públiques
    Cal obrir totes les dades de caràcter públic (totes aquelles, és clar, que no estiguin subjectes a restriccions de privacitat, seguretat o drets d’autor). Així, no hauria d’existir cap altra trava per part de l’administració a l’hora de decidir quines dades és pertinent publicar.
  2. Detallades
    Cal publicar les dades tal com estan en el seu origen, sense processar i, per tant, mantenint el major nivell de detall possible, el que es coneix com dades en brut.
  3. Actualitzades
    Les dades han de ser posades a disposició dels usuaris amb la freqüència necessària perquè no perdin el seu valor i siguin precises i actuals.
  4. Accessibles
    Cal fer accessible les dades al major nombre d’usuaris possible. No hauria d’existir cap restricció per a tots aquells que vulguin fer ús de les dades, ni en el propòsit d’ús.
  5. Automatitzades
    Les dades han d’estar estructurades perquè puguin ser processades de manera automàtica per un ordinador. Aquesta és una condició molt important perquè es puguin reutilitzar les dades d’una forma automàtica.
  6. Sense registre
    Les dades han d’estar disponibles per a tothom, sense necessitat d’identificar-se prèviament.
  7. Obertes
    Els formats de les dades han de ser no propietaris; és a dir, no poden dependre d’una entitat o d’una eina propietària d’una entitat. Com a exemple, un format obert seria CSV o XML, mentre que formats propietaris serien Word, Excel, etc.
  8. Lliures
    Les dades han de ser d’ús 100% lliure per als usuaris. Així, les dades han d’estar lliures de drets, patents, copyright i no estar subjectes a drets de privacitat, seguretat o privilegis que puguin estar reglades per altres normes.

Què és un dataset (conjunt de dades)?

El terme dataset o conjunt de dades fa referència a la categorització de les dades públiques en catàlegs de dades. Les dades en brut s’organitzen en datasets per ser més fàcilment indexats i localitzats. Per això, s’utilitzen camps que defineixen el grup de dades com la descripció, la freqüència d’actualització, el format o la llicència d’ús entre altres.

Els formats de dades més utilitzats per a l’obertura de les mateixes són:

  • CSV (Comma-separated values): és un tipus de document de text pla per a representar dades tabulades en columnes separades per comes (o punt i coma) i files separades per salts de línia. És molt senzill d’utilitzar i en molts casos és trivial exportar les dades d’un full Excel a format CSV.
  • XML (eXtensible Markup Language): és un metallenguatge simple que permet la interpretació de dades per a diferents llenguatges. És l’estàndard per a l’intercanvi d’informació estructurada entre diferents plataformes. Moltes bases de dades permeten l’exportació de les seves dades a format XML.
  • RDF XML / TURTLE / N3 – (Resource Description Framework) no és un format concret sinó una infraestructura per a la descripció dels recursos de la web mitjançant expressions de la forma subjecte-predicat-objecte. El subjecte és el recurs que es descriu, el predicat és la propietat sobre la qual es vol establir el recurs i l’objecte és el valor de la propietat amb el qual s’estableix la relació. La combinació d’RDF amb altres eines permet afegir significat a les pàgines i és una de les tecnologies essencials per a la web semàntica. Hi ha diversos formats de representació: XML, per a processament automàtic; N3, per representació en text pla d’ forma més llegible per humans; Turtle, com a simplificació de l’anterior.
  • JSON (JavaScript Object Notation) – és un format lleuger per a l’intercanvi de dades. JSON és un subconjunt de la notació literal d’ objectes de JavaScript que no requereix l’ús de XML.
  • JSON-LD (JavaScript Object Notation for Linked Data) – JSON-LD, és un mètode de transport de dades enllaçats (Linked Data) utilitzant JSON.
  • WMS (Web Map Service) – és un servei definit pel OGC (Open Geospatial Consortium ) que produeix mapes de dades referenciades espacialment, de manera dinàmica a partir d’informació geogràfica. És un estàndard internacional que defineix un mapa com una representació de la informació geogràfica en forma d’un arxiu d’imatge digital.
  • WFS (Web Feature Service) – també del Consorci Open Geospatial Consortium és un servei estàndard, que ofereix una interfície de comunicació que permet interactuar amb els mapes servits per l’estàndard WMS , com per exemple, editar la imatge que ens ofereix el servei WMS o analitzar la imatge seguint criteris geogràfics.
  • GML (Geography Markup Language) – és un subllenguatge de XML descrit com una gramàtica en XML Schema per al modelatge, transport i emmagatzematge d’informació geogràfica. La seva importància radica que a nivell informàtic es constitueix com una llengua franca per al maneig i transvasament d’informació entre els diferents programari que fan ús d’aquest tipus de dades, com els Sistemes d’Informació Geogràfica.
  • KML (Keyhole Markup Language) és un llenguatge de marcat basat en XML per representar dades geogràfiques en tres dimensions. Va ser desenvolupat per ser manejat amb Keyhole LT, precursor de Google Earth. La seva gramàtica conté moltes similituds amb la de GML.

Altres formats impedeixen que les dades puguin ser considerats com oberts, com les imatges (JPEG, GIF, TIFF, etc.), ja que les màquines no poden interpretar el seu contingut d’una manera automàtica al no estar estructurats.

En el cas dels arxius PDF, encara que el seu origen es pretenia la portabilitat, tampoc són adequats al no ser estructurats ja que poden contenir imatges o ser directament una imatge que conté text.

Els formats com Word o Excel requereixen disposar de llicència per al seu ús pel que no seria aconsellable el seu ús en el l’àmbit de les dades obertes. En el cas de les dades en format Excel, aquests són fàcilment exportables a formats de text com CSV que sí complirien els requisits de format no propietari.

Beneficis de l’Open Data

Segons apunta la Llei 37/2007 de reutilització de la informació del sector públic, “la informació generada des de les instàncies públiques, amb la potencialitat que li atorga el desenvolupament de la societat de la informació, té un gran interès per les empreses a l’hora d’operar en els seus àmbits d’actuació, contribuir al creixement econòmic i a la creació d’ocupació, i per als ciutadans com a element de transparència i guia per a la participació democràtica”. La pròpia Administració, millorant la seva eficiència i capacitat d’interoperar amb altres administracions també és beneficiària d’aquesta obertura. Del que es dedueix que hi ha tres rols per als quals es generen beneficis: empreses, ciutadans i Administració.

Beneficis per a les empreses

Els avantatges econòmics de l’Open Data provenen de la possibilitat que les empreses generin valor econòmic a partir de les dades públiques servides per les administracions, creant serveis i aplicacions a partir d’aquestes dades lliures.

Això es tradueix en un nou nínxol de mercat basat en continguts digitals, el que ajuda a la creació de riquesa i la possibilitat de donar serveis de valor afegit. Així mateix fomenta la competitivitat entre empreses, al brindar la possibilitat de monetitzar aquesta informació pública i lliure obtenint un benefici.

Beneficis per al ciutadà

El principal avantatge que comporta la lliure difusió de dades públiques és l’apropament als principis de govern obert i intel·ligent, és a dir, aquell en permanent conversa amb els ciutadans i que facilita la participació i col·laboració de la ciutadania en l’exercici de les seves funcions.

L’ús i utilització de les dades públiques pot generar diverses aplicacions i nous serveis de valor social que millorin la vida dels ciutadans. La creació de nous serveis per part de les iniciatives privades amb l’ús dels catàlegs de dades obertes, comporta la generació de nous llocs de treball.

Per altra banda, proporciona una major transparència pel fet d’exposar les dades públiques en un portal web de forma estandarditzada, de manera que tant ciutadans com empreses o altres institucions puguin fer-ne ús. Això suposa un gran pas per a la transparència informativa i la consecució d’un dels objectius del govern obert. Els ciutadans poden tenir una visió més clara de les accions i serveis de la seva Administració així de com s’està invertint la seva contribució i gestionant els recursos públics.

Beneficis per a l’administració pública

Les administracions poden reduir notablement els costos de la realització d’aplicacions costoses que ara poden dissenyar les empreses infomediaries, dinamitzant d’aquesta manera l’economia.

L’Administració també es beneficia de la col·laboració dels ciutadans, els que col·laboren activament en la millora del servei públic amb continguts generats per ells mateixos o idees i iniciatives creades i promogudes per ells o noves aplicacions desenvolupades a partir de les dades públiques alliberades.

El poder intercanviar les dades entre diferents administracions (local, central, autonòmica) promovent així la interoperabilitat dóna com a resultat una major eficiència en el funcionament de l’Administració i la càrrega de treball dels empleats públics, incrementant la col·laboració entre administracions, beneficiant, per tant, al ciutadà.

La interoperabilitat comporta també una reducció de costos a causa del fet que en la mesura que dos conjunts de dades es refereixin al mateix tipus d’informació, si el format escollit per les diferents administracions és el mateix, permet obtenir més fàcilment nous usos de les dades al combinar.

La possibilitat que el ciutadà col·labori permet als responsables polítics estar al dia de les inquietuds i els interessos dels seus veïns.