{"id":2337,"date":"2024-03-21T17:35:46","date_gmt":"2024-03-21T15:35:46","guid":{"rendered":"https:\/\/itgespub.net\/?p=2337"},"modified":"2024-03-21T17:41:07","modified_gmt":"2024-03-21T15:41:07","slug":"datos-publicos-abiertos-inteligencia-artificial-y-viceversa-una-reaccion-en-cadena","status":"publish","type":"post","link":"https:\/\/itgespub.net\/en\/datos-publicos-abiertos-inteligencia-artificial-y-viceversa-una-reaccion-en-cadena\/","title":{"rendered":"Datos p\u00fablicos abiertos, inteligencia artificial y viceversa: una reacci\u00f3n en cadena"},"content":{"rendered":"<p class=\"wp-block-paragraph\">En los \u00faltimos meses, diferentes organismos a nivel nacional e internacional han hecho un llamamiento a reflexionar sobre el <strong>papel de los datos (p\u00fablicos) abiertos en la era de la inteligencia artificial (IA)<\/strong>. Algunos de ellos como la <a href=\"https:\/\/unesdoc.unesco.org\/in\/documentViewer.xhtml?v=2.1.196&amp;id=p::usmarcdef_0000385841&amp;file=\/in\/rest\/annotationSVC\/DownloadWatermarkedAttachment\/attach_import_5c32032e-d197-426f-a157-2a3effa4d8bb%3F_%3D385841eng.pdf&amp;locale=es&amp;multi=true&amp;ark=\/ark:\/48223\/pf0000385841\/PDF\/385841eng.pdf#%5B%7B%22num%22%3A48%2C%22gen%22%3A0%7D%2C%7B%22name%22%3A%22XYZ%22%7D%2C0%2C712%2C0%5D\" target=\"_blank\" rel=\"noreferrer noopener\">Organizaci\u00f3n de las Naciones Unidas para la Educaci\u00f3n, la Ciencia y la Cultura (UNESCO)<\/a>, el <a href=\"https:\/\/summit2023.theodi.org\/\" target=\"_blank\" rel=\"noreferrer noopener\">Open Data Institute (ODI)<\/a>, la <a href=\"https:\/\/medium.com\/opendatacharter\/ai-and-open-data-90cb5b5180fa\" target=\"_blank\" rel=\"noreferrer noopener\">Open Data Charter<\/a>, el portal de datos abiertos europeo (<a href=\"https:\/\/data.europa.eu\/en\/academy\/artificial-intelligence-and-data-ecosystems\" target=\"_blank\" rel=\"noreferrer noopener\">data.europe.eu<\/a>) y el referente al Gobierno de Espa\u00f1a (<a href=\"https:\/\/datos.gob.es\/en\/blog\/combining-benefits-open-data-and-artificial-intelligence\" target=\"_blank\" rel=\"noreferrer noopener\">datos.gob<\/a>), entre otros, est\u00e1n explorando esta relaci\u00f3n incipiente debido a los beneficios, pero tambi\u00e9n desaf\u00edos, a los que se enfrentan actualmente los gobiernos en los procesos de dise\u00f1o, adopci\u00f3n e implementaci\u00f3n de sistemas de IA, adentr\u00e1ndose en lo que algunos autores denominan <a href=\"https:\/\/www.econstor.eu\/handle\/10419\/210652\" target=\"_blank\" rel=\"noreferrer noopener\">gobernanza algor\u00edtmica<\/a>. En este post, exploramos esta sinergia bajo una perspectiva <em>datac\u00e9ntrica<\/em>, situando los datos en el centro de esta relaci\u00f3n.&nbsp;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Esta <strong>relaci\u00f3n<\/strong> entre <strong>datos p\u00fablicos abiertos<\/strong> e <strong>IA<\/strong> se puede abordar desde <strong>dos frentes opuestos pero complementarios<\/strong>. As\u00ed, en una primera aproximaci\u00f3n, los datos p\u00fablicos abiertos pueden ser utilizados para alimentar sistemas de IA y ofrecer importantes beneficios, aunque tambi\u00e9n existen ciertos riesgos, como consecuencia de su disponibilidad en formatos y licencias abiertas de reutilizaci\u00f3n. Al mismo tiempo, el dise\u00f1o y uso de diferentes tecnolog\u00edas de IA como el <em>aprendizaje profundo<\/em>, el <em>aprendizaje autom\u00e1tico<\/em>, las <em>redes neuronales<\/em> o el <em>procesamiento de lenguaje natural<\/em>, entre otros, puede servir para optimizar los procesos de gesti\u00f3n de datos p\u00fablicos abiertos por parte de las administraciones p\u00fablicas, algo fundamental para adquirir un adecuado gobierno del dato y fomentar con ello un ecosistema de datos sostenible. A continuaci\u00f3n, ahondamos en las oportunidades y riesgos de esta relaci\u00f3n ambivalente, que se mueve desde los datos hacia la IA y que retorna de nuevo hacia los datos, en una especie de reacci\u00f3n en cadena que puede expandir y optimizar los modelos actuales de gesti\u00f3n de la informaci\u00f3n p\u00fablica por parte de los gobiernos y administraciones.&nbsp;<\/p>\n\n\n\n<h5 class=\"wp-block-heading\"><strong>Datos p\u00fablicos abiertos para alimentar sistemas de inteligencia artificial<\/strong>&nbsp;<\/h5>\n\n\n\n<p class=\"wp-block-paragraph\">Un argumento intuitivo nos dice que, si los datos son el combustible con el que funcionan las tecnolog\u00edas basadas en IA, los datos p\u00fablicos abiertos pueden utilizarse igualmente para tales fines. Como hemos abordado en anteriores entradas de este blog (<a href=\"https:\/\/itgespub.net\/en\/que-son-los-datos-publicos-abiertos-y-como-pueden-fortalecer-nuestras-democracias\/\" target=\"_blank\" rel=\"noreferrer noopener\">aqu\u00ed<\/a>, <a href=\"https:\/\/itgespub.net\/en\/aplicaciones-moviles-ciudadanas-co-produccion-de-servicios-reutilizando-datos-publicos-abiertos\/\" target=\"_blank\" rel=\"noreferrer noopener\">aqu\u00ed<\/a> y <a href=\"https:\/\/itgespub.net\/en\/innovacion-docente-a-traves-de-datos-publicos-abiertos%ef%bf%bc\/\" target=\"_blank\" rel=\"noreferrer noopener\">aqu\u00ed<\/a>), los datos p\u00fablicos abiertos son iniciativas clave del Gobierno Abierto para fomentar el acceso y la reutilizaci\u00f3n de la informaci\u00f3n p\u00fablica. Esto genera una serie de beneficios inmediatos cuando son utilizados como materia prima para el entrenamiento y dise\u00f1o de sistemas de IA. En un inicio, la reutilizaci\u00f3n de estos datos no est\u00e1 sujeta a ninguna restricci\u00f3n legal, pol\u00edtica o econ\u00f3mica. Adem\u00e1s, los datos deben de cumplir con ciertos est\u00e1ndares comunes y est\u00e1n sujetos a una regulaci\u00f3n espec\u00edfica en materia de calidad, veracidad y anonimizaci\u00f3n. Esto, sumado a su disponibilidad y acceso en abierto, apoya la apertura de la llamada caja negra o <em>black box<\/em> de los algoritmos, con un impacto positivo en los procesos de <a href=\"https:\/\/digitalfuturesociety.com\/app\/uploads\/2024\/02\/Towards-accountable-algorithms_esp.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">auditor\u00eda algor\u00edtmica<\/a>, en el fomento de sistemas de IA confiables y libres de sesgos y discriminaci\u00f3n, as\u00ed como en la toma de decisiones p\u00fablicas <a href=\"https:\/\/journals.sagepub.com\/doi\/full\/10.1177\/0894439320980118\" target=\"_blank\" rel=\"noreferrer noopener\">m\u00e1s transparentes y m\u00e1s correctas<\/a>.&nbsp;&nbsp;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Sin embargo, tambi\u00e9n existen desaf\u00edos asociados a la utilizaci\u00f3n de datos p\u00fablicos abiertos en este contexto. Aunque los datos deben cumplir con unos est\u00e1ndares m\u00ednimos de calidad, en ciertos casos contin\u00faan existiendo problemas relacionados con la ausencia o inexactitud de los metadatos (p.e. la existencia de celdas vac\u00edas dentro del conjunto de datos, etiquetado err\u00f3neo o confusi\u00f3n en la informaci\u00f3n de alguna de las celdas, mala estructuraci\u00f3n o disposici\u00f3n de las celdas, etc.), disuadiendo a los potenciales usuarios de su reutilizaci\u00f3n. En paralelo, pensemos en los datos sensibles, privados o que puedan inferir alg\u00fan tipo de <a href=\"https:\/\/itgespub.net\/en\/inteligencia-artificial-e-igualdad-de-genero-en-la-ue-espana-y-suecia\/\" target=\"_blank\" rel=\"noreferrer noopener\">sesgo en un sistema algor\u00edtmico<\/a>. Aunque, por norma general, este tipo de situaciones se producen de manera no intencionada, podr\u00eda suceder que los datos, al estar publicados en abierto, sufran alg\u00fan tipo de modificaci\u00f3n por parte de un agente externo, cuyo ataque genere desequilibrios negativos en el funcionamiento de los algoritmos que se alimentan de dichos datos, incurriendo en el escenario conocido como \u201c<a href=\"https:\/\/cset.georgetown.edu\/publication\/poison-in-the-well\/\" target=\"_blank\" rel=\"noreferrer noopener\">veneno en el pozo<\/a>\u201d (<em>poison in the well <\/em>en ingl\u00e9s).&nbsp;<\/p>\n\n\n\n<h5 class=\"wp-block-heading\"><strong>Inteligencia artificial para la gesti\u00f3n de datos p\u00fablicos abiertos<\/strong>&nbsp;<\/h5>\n\n\n\n<p class=\"wp-block-paragraph\">En anteriores entradas del blog hemos analizado diferentes <a href=\"https:\/\/itgespub.net\/en\/estrategias-de-inteligencia-artificial-en-america-latina-desde-un-enfoque-de-etica-y-derechos-humanos\/\" target=\"_blank\" rel=\"noreferrer noopener\">estrategias de IA<\/a>, reflexionado sobre las distintas <a href=\"https:\/\/itgespub.net\/en\/capacidades-de-la-inteligencia-artificial-aplicadas-en-el-sector-publico\/\" target=\"_blank\" rel=\"noreferrer noopener\">capacidades de estos sistemas<\/a> y debatido sobre el <a href=\"https:\/\/itgespub.net\/en\/hacia-donde-debe-ir-la-inteligencia-artificial-en-y-desde-el-sector-publico-un-debate-necesario\/\" target=\"_blank\" rel=\"noreferrer noopener\">futuro de estas iniciativas en el sector p\u00fablico<\/a>. Aqu\u00ed, es importante destacar que los sistemas de IA no solo beben de la fuente de los datos, tambi\u00e9n pueden optimizar los procesos humanos de gesti\u00f3n de los mismos, y generar oportunidades para solucionar gran parte de las problem\u00e1ticas actuales relacionadas con los datos p\u00fablicos abiertos. En primer lugar, la IA se puede utilizar para facilitar la recopilaci\u00f3n y catalogaci\u00f3n de los conjuntos de datos que ser\u00e1n publicados en el futuro y que actualmente se encuentran dispersos en diferentes bases de datos gubernamentales. Esta exploraci\u00f3n es compatible con el an\u00e1lisis de los conjuntos de datos ya publicados para la detecci\u00f3n de inconsistencias o anomal\u00edas en la calidad e integridad de los mismos. Adem\u00e1s, tambi\u00e9n se podr\u00edan integrar sistemas de IA en los portales de datos abiertos para mejorar la accesibilidad, comprensi\u00f3n, visualizaci\u00f3n y an\u00e1lisis de los conjuntos de datos, por ejemplo, mediante <a href=\"https:\/\/www.sciencedirect.com\/science\/article\/pii\/S0740624X23000771\" target=\"_blank\" rel=\"noreferrer noopener\"><em>chatbots<\/em> o agentes conversacionales<\/a> y otras herramientas de visualizaci\u00f3n.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">A pesar del potencial de los <strong>sistemas de IA<\/strong> para la mejora de los procesos de gesti\u00f3n, publicaci\u00f3n y reutilizaci\u00f3n de los datos, tambi\u00e9n se derivan algunos <strong>desaf\u00edos<\/strong> importantes. Por un lado, desde el punto de vista t\u00e9cnico, tanto los algoritmos como los datos de entrenamiento deben cumplir con una serie de est\u00e1ndares \u00e9ticos, de calidad y confiabilidad que no siempre es f\u00e1cil alcanzar (especialmente cuando hablamos de grandes cantidades de datos y de algoritmos opacos). De aqu\u00ed, emerge una paradoja importante: los sistemas de IA utilizados para identificar alg\u00fan tipo de inconsistencia en los conjuntos de datos deben ser entrenados con datos perfectamente estructurados e integrados. A este debate se le a\u00f1ade otro adicional, y es que la utilizaci\u00f3n de IA por parte de empleados p\u00fablicos y ciudadanos va a requerir de nuevas capacidades digitales que deben desarrollarse y fomentarse para asegurar una adopci\u00f3n efectiva y un aprovechamiento completo de estas nuevas herramientas.<\/p>\n\n\n\n<h5 class=\"wp-block-heading\">&nbsp;<strong>\u00bfHacia d\u00f3nde se dirige esta nueva sinergia?<\/strong><\/h5>\n\n\n\n<p class=\"wp-block-paragraph\">La relaci\u00f3n entre datos p\u00fablicos abiertos e IA se presenta como una doble v\u00eda que, si bien genera oportunidades sustanciales para la optimizaci\u00f3n de los procesos de gesti\u00f3n de informaci\u00f3n p\u00fablica abierta y el desarrollo de nuevas tecnolog\u00edas m\u00e1s transparentes, tambi\u00e9n plantea ciertos desaf\u00edos y reaviva debates cl\u00e1sicos en torno a los datos y los sistemas de IA. En un futuro cercano, esta sinergia ser\u00e1 m\u00e1s compleja y, entonces, debatiremos sobre datos p\u00fablicos abiertos de alto valor en el contexto de la IA, de nuevas interacciones (y capacidades) entre portales de datos abiertos y usuarios, de <a href=\"https:\/\/medium.com\/@nikiforova.anastasija\/generative-ai-role-in-shaping-the-future-of-open-data-ecosystems-synergies-amidst-paradoxes-00fcfb2518fc\" target=\"_blank\" rel=\"noreferrer noopener\">datos p\u00fablicos abiertos e IA generativa en el sector p\u00fablico<\/a>&#8230; Y todo ello, en realidad, nos devuelve al origen de la pregunta, a los aspectos m\u00e1s b\u00e1sicos de los datos y de la IA, y al quehacer de nuestras instituciones para garantizar valores \u00e9ticos y de calidad comunes en torno a estas nuevas herramientas sobre las que todav\u00eda queda mucho por conocer.&nbsp;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Carlos Jim\u00e9nez Cid.<\/strong> Investigador predoctoral FPI Comunidad de Madrid. Departamento de Ciencia Pol\u00edtica y Relaciones Internacionales, y miembro del Lab IT_GesPub (Innovaci\u00f3n, Tecnolog\u00eda y Gesti\u00f3n P\u00fablica), Universidad Aut\u00f3noma de Madrid.<\/p>\n\n\n\n<p class=\"has-small-font-size wp-block-paragraph\">Este post se ha realizado con el apoyo del Proyecto del Ministerio de Ciencia, Innovaci\u00f3n y Universidades \u201cAbriendo la caja negra de la gobernanza p\u00fablica mediada por algoritmos. Implicaciones de la Inteligencia Artificial en gobiernos, servicios p\u00fablicos y personas (#AIPublicGov)\u201d. Ref. PID2022-136283OB-I00, MCIN\/AEI\/10.13039\/501100011033 y FSE+.<\/p>\n\n\n\n<p class=\"has-small-font-size wp-block-paragraph\"><em>La imagen de encabezado fue generada por la inteligencia artificial&nbsp;<a rel=\"noreferrer noopener\" href=\"https:\/\/openai.com\/dall-e-2\/\" target=\"_blank\"><strong>DALL\u00b7E 2, de openai.<\/strong><\/a><\/em><\/p>","protected":false},"excerpt":{"rendered":"<p>En los \u00faltimos meses, diferentes organismos a nivel nacional e internacional han hecho un llamamiento a reflexionar sobre el papel de los datos (p\u00fablicos) abiertos en la era de la inteligencia artificial (IA). Algunos de ellos como la Organizaci\u00f3n de las Naciones Unidas para la Educaci\u00f3n, la Ciencia y la Cultura (UNESCO), el Open Data Institute (ODI), la Open Data Charter, el portal de datos abiertos europeo (data.europe.eu) y el referente al Gobierno de Espa\u00f1a (datos.gob), entre otros, est\u00e1n explorando esta relaci\u00f3n incipiente debido a los beneficios, pero tambi\u00e9n desaf\u00edos, a los que se enfrentan actualmente los gobiernos en los procesos de dise\u00f1o, adopci\u00f3n e implementaci\u00f3n de sistemas de IA, adentr\u00e1ndose en lo que algunos autores denominan gobernanza algor\u00edtmica. En este post, exploramos esta sinergia bajo una perspectiva datac\u00e9ntrica, situando los datos en el centro de esta relaci\u00f3n.\u00a0<\/p>","protected":false},"author":8,"featured_media":2340,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[12],"tags":[96,41,35],"class_list":["post-2337","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-investigacion-y-proyectos","tag-datos-publicos-abiertos","tag-gobernanza-algoritmica","tag-inteligencia-artificial"],"_links":{"self":[{"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/posts\/2337","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/users\/8"}],"replies":[{"embeddable":true,"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/comments?post=2337"}],"version-history":[{"count":0,"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/posts\/2337\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/media\/2340"}],"wp:attachment":[{"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/media?parent=2337"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/categories?post=2337"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/itgespub.net\/en\/wp-json\/wp\/v2\/tags?post=2337"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}