Què és Open Data?

Open Data és una filosofia que té per objectiu posar a disposició de la societat les dades que gestiona l'administració pública en formats fàcils de manipular.

Qualsevol persona o empresa pot analitzar, reutilitzar i redistribuir aquestes dades, generant nous serveis i permetent d'aquesta manera que l’administració pública millori en transparència i govern obert i fomenti la generació de riquesa a través de la gestió intel·ligent dels recursos (govern intel·ligent).

L'objectiu és que ciutadania i empreses reaprofitin aquestes dades per generar valor econòmic. Podran construir sobre elles una nova idea que generi noves dades, coneixements o, fins i tot, la creació de nous serveis que reportin beneficis econòmics i / o socials. A aquestes empreses o persones se'ls denomina "infomediaris" o "reutilitzadors".

Open Data o RISP?

Els termes Open Data i RISP (Reutilització de la Informació del Sector Públic) estan molt relacionats. En ambdós casos, del que es tracta és de posar a disposició de la societat dades "en brut" que mantingui l'administració.

Tot i que els termes puguin semblar similars, el concepte Dades Obertes persegueix oferir les dades en formats completament lliures (no propietaris) i no es contempla el pagament per l'ús de dades (han de ser gratuïts). No obstant això, la Reutilització de la Informació de les Administracions Públiques preveu la possibilitat del pagament per l'ús d'aquestes dades i la publicació de les dades en qualsevol format.

Principis de l’Open Data – Decàleg

Per assegurar que s’està parlant de Dades Obertes i no d’un succedani que no entraria dins de la filosofia real de l'Open Data, és necessari que les dades oferides compleixin els següents principis:

  1. Públiques
    Cal obrir totes les dades de caràcter públic (totes aquelles, és clar, que no estiguin subjectes a restriccions de privacitat, seguretat o drets d'autor). Així, no hauria d'existir cap altra trava per part de l'administració a l'hora de decidir quines dades és pertinent publicar.
  2. Detallades
    Cal publicar les dades tal com estan en el seu origen, sense processar i, per tant, mantenint el major nivell de detall possible, el que es coneix com dades en brut.
  3. Actualitzades
    Les dades han de ser posades a disposició dels usuaris amb la freqüència necessària perquè no perdin el seu valor i siguin precises i actuals.
  4. Accessibles
    Cal fer accessible les dades al major nombre d'usuaris possible. No hauria d'existir cap restricció per a tots aquells que vulguin fer ús de les dades, ni en el propòsit d'ús.
  5. Automatitzades
    Les dades han d'estar estructurades perquè puguin ser processades de manera automàtica per un ordinador. Aquesta és una condició molt important perquè es puguin reutilitzar les dades d'una forma automàtica.
  6. Sense registre
    Les dades han d'estar disponibles per a tothom, sense necessitat d’identificar-se prèviament.
  7. Obertes
    Els formats de les dades han de ser no propietaris; és a dir, no poden dependre d'una entitat o d'una eina propietària d'una entitat. Com a exemple, un format obert seria CSV o XML, mentre que formats propietaris serien Word, Excel, etc.
  8. Lliures
    Les dades han de ser d'ús 100% lliure per als usuaris. Així, les dades han d'estar lliures de drets, patents, copyright i no estar subjectes a drets de privacitat, seguretat o privilegis que puguin estar reglades per altres normes.
Què és un dataset (conjunt de dades)?

El terme dataset o conjunt de dades fa referència a la categorització de les dades públiques en catàlegs de dades. Les dades en brut s'organitzen en datasets per ser més fàcilment indexats i localitzats. Per això, s'utilitzen camps que defineixen el grup de dades com la descripció, la freqüència d'actualització, el format o la llicència d'ús entre altres.

Els formats de dades més utilitzats per a l'obertura de les mateixes són:

  • CSV (Valors Separats per Coma): és un tipus de document de text pla en format senzill per representar dades tabulades en columnes separades per comes (o punt i coma) i files separades per salts de línia. Les extensions que utilitza són ‘csv’ o ‘txt’. És molt senzill d'utilitzar i en molts casos és trivial exportar les dades d'un full Excel a format CSV.
  • XML (Llenguatge Etiquetatge Extensible): és un metallenguatge simple que permet la interpretació de dades per diferents llenguatges. És l'estàndard per a l'intercanvi d'informació estructurada entre diferents plataformes. Moltes bases de dades permeten l'exportació de les seves dades a format XML.
  • RDF (Infraestructura per Descripció de Recursos): és un model universal basat en XML que permet intercanviar i enllaçar a través de diferents aplicacions dades i recursos sense que perdin el seu significat, el que facilita la reutilització i enriquiment dels recursos a la Web.
  • RSS (Sindicació Realment Senzilla): és un format basat en XML per a l'ordenació de continguts de pàgines web actualitzats freqüentment, com poden ser les notícies, blocs o podcasts. Encara que és molt utilitzat en la web no és el més aconsellat per dades obertes perquè la informació que conté no sol ser detallada.
  • ODATA (Open Data Protocol): és un protocol obert que permet fer directament consultes i seleccions sobre els conjunts de dades oferts, així com descarregar els resultats d'aquestes operacions.

Hi ha infinitat d'altres formats estructurats en menor o major mesura com SHP, JSON, ODS, o alguns orientats a la informació geogràfica per poder ser representada en mapes com KML, WMS, WCS o WFS.

Altres formats impedeixen que les dades puguin ser obertes, com les imatges (JPEG, GIF, TIFF, etc.) ja que les màquines no poden interpretar el seu contingut d'una manera automàtica.

En el cas dels arxius PDF, tot i que el seu origen va ser per ser universals, tampoc són estructurats ja que poden contenir imatges o ser una imatge que conté text.

Els formats com Word o Excel requereixen disposar de llicència per al seu ús, pel que no seria aconsellable usar-los. En el cas de les dades en format Excel, aquests són fàcilment exportables a formats de text com CSV que sí complirien els requisits de format no propietari.

Beneficis de l’Open Data

Segons apunta la Llei 37/2007 de reutilització de la informació del sector públic, "la informació generada des de les instàncies públiques, amb la potencialitat que li atorga el desenvolupament de la societat de la informació, té un gran interès per les empreses a l'hora d'operar en els seus àmbits d'actuació, contribuir al creixement econòmic i a la creació d'ocupació, i per als ciutadans com a element de transparència i guia per a la participació democràtica". La pròpia Administració, millorant la seva eficiència i capacitat d'interoperar amb altres administracions també és beneficiària d'aquesta obertura. Del que es dedueix que hi ha tres rols per als quals es generen beneficis: empreses, ciutadans i Administració.

Beneficis per a les empreses

Els avantatges econòmics de l'Open Data provenen de la possibilitat que les empreses generin valor econòmic a partir de les dades públiques servides per les administracions, creant serveis i aplicacions a partir d'aquestes dades lliures.

Això es tradueix en un nou nínxol de mercat basat en continguts digitals, el que ajuda a la creació de riquesa i la possibilitat de donar serveis de valor afegit. Així mateix fomenta la competitivitat entre empreses, al brindar la possibilitat de monetitzar aquesta informació pública i lliure obtenint un benefici.

Beneficis per al ciutadà

El principal avantatge que comporta la lliure difusió de dades públiques és l'apropament als principis de govern obert i intel·ligent, és a dir, aquell en permanent conversa amb els ciutadans i que facilita la participació i col·laboració de la ciutadania en l'exercici de les seves funcions.

L'ús i utilització de les dades públiques pot generar diverses aplicacions i nous serveis de valor social que millorin la vida dels ciutadans. La creació de nous serveis per part de les iniciatives privades amb l'ús dels catàlegs de dades obertes, comporta la generació de nous llocs de treball.

Per altra banda, proporciona una major transparència pel fet d'exposar les dades públiques en un portal web de forma estandarditzada, de manera que tant ciutadans com empreses o altres institucions puguin fer-ne ús. Això suposa un gran pas per a la transparència informativa i la consecució d'un dels objectius del govern obert. Els ciutadans poden tenir una visió més clara de les accions i serveis de la seva Administració així de com s'està invertint la seva contribució i gestionant els recursos públics.

Beneficis per a l’administració pública

Les administracions poden reduir notablement els costos de la realització d'aplicacions costoses que ara poden dissenyar les empreses infomediaries, dinamitzant d'aquesta manera l'economia.

L'Administració també es beneficia de la col·laboració dels ciutadans, els que col·laboren activament en la millora del servei públic amb continguts generats per ells mateixos o idees i iniciatives creades i promogudes per ells o noves aplicacions desenvolupades a partir de les dades públiques alliberades.

El poder intercanviar les dades entre diferents administracions (local, central, autonòmica) promovent així la interoperabilitat dóna com a resultat una major eficiència en el funcionament de l'Administració i la càrrega de treball dels empleats públics, incrementant la col·laboració entre administracions, beneficiant, per tant, al ciutadà.

La interoperabilitat comporta també una reducció de costos a causa del fet que en la mesura que dos conjunts de dades es refereixin al mateix tipus d'informació, si el format escollit per les diferents administracions és el mateix, permet obtenir més fàcilment nous usos de les dades al combinar.

La possibilitat que el ciutadà col·labori permet als responsables polítics estar al dia de les inquietuds i els interessos dels seus veïns.