En 2023, se proyecta que la inversión en Tecnologías de la Información en Europa alcance más de un billón de dólares, según un informe reciente de la firma Gartner. Este aumento representa un incremento del 5,5% en comparación con el año 2022. En particular, el gasto en centros de datos ha experimentado un crecimiento del 3,1%, superando los 46.000 millones de dólares.
Estos datos resaltan la continua importancia de la información en las decisiones empresariales y en la expansión de los negocios. En este contexto, la empresa española PUE, especializada en consultoría e implementación de proyectos de Datos y Aprendizaje Automático, ha identificado 5 claves que serán fundamentales para la gestión de datos en 2024. Estas claves buscan ayudar a las empresas a optimizar sus procesos de datos y aprovechar al máximo su potencial.
En el próximo año, las empresas continuarán adoptando rápidamente las últimas innovaciones en aprendizaje automático, centrándose especialmente en los grandes modelos de lenguaje (LLM). Estos modelos utilizan técnicas de aprendizaje automático para entender patrones complejos de lenguaje natural a partir de vastas cantidades de datos.
Aunque el procesamiento del lenguaje natural (PNL) seguirá siendo predominante en muchos casos de uso, las empresas intensificarán la integración de LLM, como el GPT de OpenAI y el BERT de Google. Esto resultará en mejoras en la calidad de la interacción con proveedores y clientes, automatización de tareas de procesamiento de lenguaje natural, desarrollo de prototipos y aplicaciones en este campo, así como avances en la extracción de información y la generación de contenido creativo.
Más empresas adoptarán arquitecturas data lakehouse en almacenamiento, fusionando las ventajas de datalakes y data warehouses. Y es que, aprovechan la flexibilidad cruda de datalakes y la capacidad analítica estructurada de los data warehouses, proporcionando un enfoque más completo y equilibrado para el análisis de datos.
Esta evolución mejorará la gobernanza del dato, ofreciendo eficiencia, reducción de tiempos y optimización de procesos. Todo ello, respaldada por nuevas funcionalidades avanzadas como Apache Iceberg.
La práctica de compartir información en espacios de datos entre entidades está ganando relevancia en las colaboraciones empresariales. Estos entornos virtuales permiten la consolidación de conjuntos de datos de diversas fuentes bajo reglas comunes, facilitando la colaboración entre compañías. Estos espacios mejoran la eficiencia, transparencia y colaboración en sectores como el retail, donde personalizan el «customer journey» con ofertas específicas basadas en datos de intereses y hábitos de compra.
En el sector sanitario, la compartición de datos del historial del paciente mejora el control y seguimiento del proceso de recuperación, así como acelera la investigación y desarrollo de fármacos y tratamientos al permitir la colaboración entre instituciones médicas, firmas farmacéuticas y laboratorios.
Las empresas también explorarán la creación de sus propios productos de datos para mejorar la gobernanza de la información y abordar las necesidades específicas de sus negocios. Estas herramientas van más allá del simple almacenamiento de datos, transformándolos en información útil que optimiza los procesos.
El desarrollo de data products implica la creación de nuevas plataformas que facilitan la gestión, acceso, calidad y análisis de datos dentro de la organización, generando así valor en la toma de decisiones estratégicas. Por ejemplo: paneles interactivos y dashboards para visualizar datos de manera más intuitiva, soluciones de pronóstico con modelos productivos para anticipar cambios en el mercado, sistemas de monitoreo y alerta para prevenir la falta de stock, y asistentes virtuales que integran servicios de atención al cliente.
En cuanto a la integración, la federación de datos emerge como la tendencia principal para abordar el desafío de proporcionar acceso a datos distribuidos sin consolidarlos físicamente en un único repositorio central. Esta estrategia mantiene la autonomía de los datos en su origen, siendo una solución efectiva para empresas con procesos complejos en entornos híbridos y multicloud.
La federación de datos maximiza su utilidad sin la necesidad de trasladarlos físicamente, resultando en la reducción de costos, optimización de recursos y aceleración de procedimientos.
Cookie | Duración | Descripción |
---|---|---|
__cf_bm | 1 hour | This cookie, set by Cloudflare, is used to support Cloudflare Bot Management. |
_GRECAPTCHA | 6 months | Google Recaptcha service sets this cookie to identify bots to protect the website against malicious spam attacks. |
cookielawinfo-checkbox-advertisement | 1 year | Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Advertisement" category. |
cookielawinfo-checkbox-analytics | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics". |
cookielawinfo-checkbox-functional | 11 months | The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional". |
cookielawinfo-checkbox-necessary | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary". |
cookielawinfo-checkbox-others | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other. |
cookielawinfo-checkbox-performance | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance". |
CookieLawInfoConsent | 1 year | CookieYes sets this cookie to record the default button state of the corresponding category and the status of CCPA. It works only in coordination with the primary cookie. |
csrftoken | 1 year | This cookie is associated with Django web development platform for python. Used to help protect the website against Cross-Site Request Forgery attacks |
opt_out | 1 year | This cookie is used for preventing the installation of third party advertiser or other cookies on the browser. |
PHPSESSID | 24 minutes | This cookie is native to PHP applications. The cookie stores and identifies a user's unique session ID to manage user sessions on the website. The cookie is a session cookie and will be deleted when all the browser windows are closed. |
rc::a | never | This cookie is set by the Google recaptcha service to identify bots to protect the website against malicious spam attacks. |
rc::b | session | This cookie is set by the Google recaptcha service to identify bots to protect the website against malicious spam attacks. |
rc::c | session | This cookie is set by the Google recaptcha service to identify bots to protect the website against malicious spam attacks. |
rc::f | never | This cookie is set by the Google recaptcha service to identify bots to protect the website against malicious spam attacks. |
ts | 1 year 1 month | PayPal sets this cookie to enable secure transactions through PayPal. |
usprivacy | 1 year 1 month | This is a consent cookie set by Dailymotion to store the CCPA consent string (mandatory information about an end-user being or not being a California consumer and exercising or not exercising its statutory right). |
viewed_cookie_policy | 11 months | The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data. |
wordpress_test_cookie | session | WordPress sets this cookie to determine whether cookies are enabled on the users' browsers. |
Cookie | Duración | Descripción |
---|---|---|
cX_G | 1 year 1 month | Cxense sets this cookie for storing the global ID, mapping different ids together into one ID. |
v1st | 1 year 1 month | The v1st cookie is set by TripAdvisor to collect details about how visitors use the website, by displaying user reviews, awards and information received on the TripAdvisor community. |
yt-player-headers-readable | never | The yt-player-headers-readable cookie is used by YouTube to store user preferences related to video playback and interface, enhancing the user's viewing experience. |
yt-remote-cast-available | session | The yt-remote-cast-available cookie is used to store the user's preferences regarding whether casting is available on their YouTube video player. |
yt-remote-cast-installed | session | The yt-remote-cast-installed cookie is used to store the user's video player preferences using embedded YouTube video. |
yt-remote-connected-devices | never | YouTube sets this cookie to store the user's video preferences using embedded YouTube videos. |
yt-remote-device-id | never | YouTube sets this cookie to store the user's video preferences using embedded YouTube videos. |
yt-remote-fast-check-period | session | The yt-remote-fast-check-period cookie is used by YouTube to store the user's video player preferences for embedded YouTube videos. |
yt-remote-session-app | session | The yt-remote-session-app cookie is used by YouTube to store user preferences and information about the interface of the embedded YouTube video player. |
yt-remote-session-name | session | The yt-remote-session-name cookie is used by YouTube to store the user's video player preferences using embedded YouTube video. |
ytidb::LAST_RESULT_ENTRY_KEY | never | The cookie ytidb::LAST_RESULT_ENTRY_KEY is used by YouTube to store the last search result entry that was clicked by the user. This information is used to improve the user experience by providing more relevant search results in the future. |
Cookie | Duración | Descripción |
---|---|---|
_gat | 1 minute | Google Universal Analytics sets this cookie to restrain request rate and thus limit data collection on high-traffic sites. |
dmvk | session | The dmvk cookie is set by Dailymotion to record data of visitor behaviour on the website. |
Cookie | Duración | Descripción |
---|---|---|
_fbp | 3 months | Facebook sets this cookie to display advertisements when either on Facebook or on a digital platform powered by Facebook advertising after visiting the website. |
_ga | 1 year 1 month 4 days | Google Analytics sets this cookie to calculate visitor, session and campaign data and track site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognise unique visitors. |
_gid | 1 day | Google Analytics sets this cookie to store information on how visitors use a website while also creating an analytics report of the website's performance. Some of the collected data includes the number of visitors, their source, and the pages they visit anonymously. |
cX_P | 1 year 1 month | Cxense sets this cookie for site-specific user sessions - across sessions. |
Cookie | Duración | Descripción |
---|---|---|
guest_id | 1 year 1 month | Twitter sets this cookie to identify and track the website visitor. It registers if a user is signed in to the Twitter platform and collects information about ad preferences. |
test_cookie | 15 minutes | doubleclick.net sets this cookie to determine if the user's browser supports cookies. |
VISITOR_INFO1_LIVE | 6 months | YouTube sets this cookie to measure bandwidth, determining whether the user gets the new or old player interface. |
VISITOR_PRIVACY_METADATA | 6 months | YouTube sets this cookie to store the user's cookie consent state for the current domain. |
YSC | session | Youtube sets this cookie to track the views of embedded videos on Youtube pages. |
yt.innertube::nextId | never | YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen. |
yt.innertube::requests | never | YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen. |
Cookie | Duración | Descripción |
---|---|---|
__cflb | 1 day | This cookie is used by Cloudflare for load balancing. |
_awl | 1 year 1 month | No description available. |
_pcid | 1 year 1 month | Description is currently not available. |
_pctx | 1 year 1 month | Description is currently not available. |
gckp | 1 year | This cookie is set by the provider Cxense. This cookie is used for building user profile information across all sites in the Cxense network. |
itsec-hb-login-27e4caa2b0fb20a2dee118de04e9de77 | 1 hour | Description is currently not available. |
ntvSession | session | Description is currently not available. |