A medida que las empresas continúan poniendo a prueba proyectos de IA generativa, muchas descubren que el costo de implementar la tecnología en sus propios centros de datos puede ser prohibitivo.
Aunque se espera que los modelos de inteligencia artificial (IA) generativa se reduzcan en tamaño para adaptarse a las necesidades y presupuestos corporativos, un gran número de proveedores de servicios todavía están trazando su rumbo de ingresos, basándose en la prestación de esta tecnología en la nube.
En su carta anual a los accionistas de la semana pasada, Andy Jassy, director ejecutivo de AWS, dijo que la compañía se centrará menos en crear aplicaciones de IA generativa orientadas al consumidor y más en ofrecer modelos a través de servicios web a clientes empresariales. “A veces la gente nos pregunta: ‘¿Cuál es vuestro próximo pilar?’ Elegiría la IA generativa. Somos optimistas de que gran parte de esta IA que cambiará el mundo se construirá en AWS”.
Las expectativas de Jassy sobre las fuentes de ingresos procedentes de los servicios de IA no están fuera de lugar. Las organizaciones planean invertir entre un 10 y un 15% más en iniciativas de este tipo durante el próximo año y medio en comparación con 2022, según la consultora IDC. En otoño pasado, AWS lanzó Bedrock, que ofrece una variedad de modelos de lenguaje grande (LLM, de sus siglas inglesas) a través de su nube para que las empresas puedan crear aplicaciones de IA generativa. Y, recientemente presentó Amazon Q, un asistente de codificación de software asistido por IA.
Actualmente, la computación en la nube lidera todos los demás métodos para ofrecer aplicaciones de IA generativa. Esto se debe al alto coste de construir una infraestructura patentada. AWS, Google, IBM, Microsoft y Oracle han invertido miles de millones desde que OpenAI desató la tormenta de la IA generativa con ChatGPT en noviembre de 2022.
“Nadie, excepto los hiperescalares, puede darse el lujo de capacitar y operar los LLM y los modelos básicos de gran tamaño”, asegura, Avivah Litan, analista vicepresidente de Gartner. “Los costes ascienden a cientos de millones de dólares. Sin embargo, a medida que las empresas siguen aumentando sus pilotos de aplicaciones de IA generativa, el coste de los servicios en la nube puede convertirse en un factor limitante. En cambio, muchas organizaciones buscan implementar LLM locales más pequeños destinados a tareas específicas.
De hecho, los modelos más pequeños de dominio específico desafiarán eventualmente el dominio de los LLM líderes en la actualidad, como GPT 4, LLaMA 2 o PaLM 2. Hasta 2025, el 30% de los proyectos de IA generativa se abandonarán después de la prueba de concepto debido a la mala calidad de los datos, controles de riesgo inadecuados, costes crecientes o valor comercial poco claro, según Gartner. Y, para 2028, más de la mitad de las empresas que han creado sus propios LLM desde cero abandonarán sus esfuerzos debido a los costes, la complejidad y la deuda técnica en sus implementaciones.
Los modelos actuales de precios de proveedores que trasladan el alto costo de la innovación y el desarrollo, la capacitación y la ejecución de LLM también podrían significar que las empresas no verán el retorno de la inversión en sus proyectos de IA, según un informe reciente de Gartner. Incluso cuando los proveedores subsidian los precios con la esperanza de ganar una participación de mercado temprana, a menudo no es suficiente para producir una recuperación rápida, dijo Gartner. En cambio, las organizaciones deberían adoptar un enfoque a largo plazo para lograr ganancias de productividad y retorno de la inversión gracias a la IA generativa.
Lee Sustar, analista principal de Forrester Research, dice que los servicios de inteligencia artificial a través de la nube seguirán creciendo a medida que productos como AWS Bedrock, Azure AI y Google Cloud Vertex reduzcan la barrera de entrada. “Dada la gravedad de los datos en la nube, suele ser el lugar más fácil para comenzar con los datos de entrenamiento. Sin embargo, habrá muchos casos de uso para LLM más pequeños e inferencia de IA en el extremo. Además, los proveedores de la nube seguirán ofreciendo opciones de plataforma de inteligencia artificial para crear sus propias opciones a través de las plataformas Kubernetes, que los científicos de datos han utilizado durante años”, indica. “Algunas de estas implementaciones se llevarán a cabo en el centro de datos en plataformas como Red Hat OpenShift AI. Mientras tanto, las nuevas nubes orientadas a GPU como Coreweave ofrecerán una tercera opción. Estamos en los primeros días, pero los servicios de IA gestionados por proveedores de nube seguirán siendo fundamentales para el ecosistema de IA”.
Y aunque hay LLM más pequeños en el horizonte, las empresas seguirán utilizando los servicios en la nube de IA de las grandes empresas cuando necesiten acceso a LLM muy grandes, según Litan. Aun así, con el tiempo más organizaciones utilizarán LLM pequeños que se ejecutan en hardware mucho más pequeño, “incluso tan pequeño como una computadora portátil común.
«Y veremos el aumento de empresas de servicios que admitan esa configuración junto con los servicios de privacidad, seguridad y gestión de riesgos que serán necesarios», dijo Litan. «Habrá mucho espacio para ambos modelos: el modelo básico muy grande de entrega de servicios en la nube y el modelo básico pequeño de entrega de servicios en la nube privada en la GPU/CPU de su elección».
Cookie | Duración | Descripción |
---|---|---|
__cf_bm | 1 hour | This cookie, set by Cloudflare, is used to support Cloudflare Bot Management. |
_GRECAPTCHA | 6 months | Google Recaptcha service sets this cookie to identify bots to protect the website against malicious spam attacks. |
cookielawinfo-checkbox-advertisement | 1 year | Set by the GDPR Cookie Consent plugin, this cookie records the user consent for the cookies in the "Advertisement" category. |
cookielawinfo-checkbox-analytics | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics". |
cookielawinfo-checkbox-functional | 11 months | The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional". |
cookielawinfo-checkbox-necessary | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary". |
cookielawinfo-checkbox-others | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other. |
cookielawinfo-checkbox-performance | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance". |
CookieLawInfoConsent | 1 year | CookieYes sets this cookie to record the default button state of the corresponding category and the status of CCPA. It works only in coordination with the primary cookie. |
csrftoken | 1 year | This cookie is associated with Django web development platform for python. Used to help protect the website against Cross-Site Request Forgery attacks |
opt_out | 1 year | This cookie is used for preventing the installation of third party advertiser or other cookies on the browser. |
PHPSESSID | 24 minutes | This cookie is native to PHP applications. The cookie stores and identifies a user's unique session ID to manage user sessions on the website. The cookie is a session cookie and will be deleted when all the browser windows are closed. |
rc::a | never | This cookie is set by the Google recaptcha service to identify bots to protect the website against malicious spam attacks. |
rc::b | session | This cookie is set by the Google recaptcha service to identify bots to protect the website against malicious spam attacks. |
rc::c | session | This cookie is set by the Google recaptcha service to identify bots to protect the website against malicious spam attacks. |
rc::f | never | This cookie is set by the Google recaptcha service to identify bots to protect the website against malicious spam attacks. |
ts | 1 year 1 month | PayPal sets this cookie to enable secure transactions through PayPal. |
usprivacy | 1 year 1 month | This is a consent cookie set by Dailymotion to store the CCPA consent string (mandatory information about an end-user being or not being a California consumer and exercising or not exercising its statutory right). |
viewed_cookie_policy | 11 months | The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data. |
wordpress_test_cookie | session | WordPress sets this cookie to determine whether cookies are enabled on the users' browsers. |
Cookie | Duración | Descripción |
---|---|---|
cX_G | 1 year 1 month | Cxense sets this cookie for storing the global ID, mapping different ids together into one ID. |
v1st | 1 year 1 month | The v1st cookie is set by TripAdvisor to collect details about how visitors use the website, by displaying user reviews, awards and information received on the TripAdvisor community. |
yt-player-headers-readable | never | The yt-player-headers-readable cookie is used by YouTube to store user preferences related to video playback and interface, enhancing the user's viewing experience. |
yt-remote-cast-available | session | The yt-remote-cast-available cookie is used to store the user's preferences regarding whether casting is available on their YouTube video player. |
yt-remote-cast-installed | session | The yt-remote-cast-installed cookie is used to store the user's video player preferences using embedded YouTube video. |
yt-remote-connected-devices | never | YouTube sets this cookie to store the user's video preferences using embedded YouTube videos. |
yt-remote-device-id | never | YouTube sets this cookie to store the user's video preferences using embedded YouTube videos. |
yt-remote-fast-check-period | session | The yt-remote-fast-check-period cookie is used by YouTube to store the user's video player preferences for embedded YouTube videos. |
yt-remote-session-app | session | The yt-remote-session-app cookie is used by YouTube to store user preferences and information about the interface of the embedded YouTube video player. |
yt-remote-session-name | session | The yt-remote-session-name cookie is used by YouTube to store the user's video player preferences using embedded YouTube video. |
ytidb::LAST_RESULT_ENTRY_KEY | never | The cookie ytidb::LAST_RESULT_ENTRY_KEY is used by YouTube to store the last search result entry that was clicked by the user. This information is used to improve the user experience by providing more relevant search results in the future. |
Cookie | Duración | Descripción |
---|---|---|
_gat | 1 minute | Google Universal Analytics sets this cookie to restrain request rate and thus limit data collection on high-traffic sites. |
dmvk | session | The dmvk cookie is set by Dailymotion to record data of visitor behaviour on the website. |
Cookie | Duración | Descripción |
---|---|---|
_fbp | 3 months | Facebook sets this cookie to display advertisements when either on Facebook or on a digital platform powered by Facebook advertising after visiting the website. |
_ga | 1 year 1 month 4 days | Google Analytics sets this cookie to calculate visitor, session and campaign data and track site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognise unique visitors. |
_gid | 1 day | Google Analytics sets this cookie to store information on how visitors use a website while also creating an analytics report of the website's performance. Some of the collected data includes the number of visitors, their source, and the pages they visit anonymously. |
cX_P | 1 year 1 month | Cxense sets this cookie for site-specific user sessions - across sessions. |
Cookie | Duración | Descripción |
---|---|---|
guest_id | 1 year 1 month | Twitter sets this cookie to identify and track the website visitor. It registers if a user is signed in to the Twitter platform and collects information about ad preferences. |
test_cookie | 15 minutes | doubleclick.net sets this cookie to determine if the user's browser supports cookies. |
VISITOR_INFO1_LIVE | 6 months | YouTube sets this cookie to measure bandwidth, determining whether the user gets the new or old player interface. |
VISITOR_PRIVACY_METADATA | 6 months | YouTube sets this cookie to store the user's cookie consent state for the current domain. |
YSC | session | Youtube sets this cookie to track the views of embedded videos on Youtube pages. |
yt.innertube::nextId | never | YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen. |
yt.innertube::requests | never | YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen. |
Cookie | Duración | Descripción |
---|---|---|
__cflb | 1 day | This cookie is used by Cloudflare for load balancing. |
_awl | 1 year 1 month | No description available. |
_pcid | 1 year 1 month | Description is currently not available. |
_pctx | 1 year 1 month | Description is currently not available. |
gckp | 1 year | This cookie is set by the provider Cxense. This cookie is used for building user profile information across all sites in the Cxense network. |
itsec-hb-login-27e4caa2b0fb20a2dee118de04e9de77 | 1 hour | Description is currently not available. |
ntvSession | session | Description is currently not available. |