{"id":135011,"date":"2026-06-10T18:26:58","date_gmt":"2026-06-10T18:26:58","guid":{"rendered":"https:\/\/enfoquenoticioso.com\/?p=135011"},"modified":"2026-06-10T18:26:58","modified_gmt":"2026-06-10T18:26:58","slug":"google-lanza-una-ia-que-genera-texto-diez-veces-mas-rapido-que-chatgpt-y-es-gratis","status":"publish","type":"post","link":"https:\/\/enfoquenoticioso.com\/?p=135011","title":{"rendered":"Google lanza una IA que genera texto diez veces m\u00e1s r\u00e1pido que ChatGPT (y es gratis)"},"content":{"rendered":"<figure><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"576\" src=\"https:\/\/i0.wp.com\/imgs.hipertextual.com\/wp-content\/uploads\/2026\/06\/diffusion-gemma-google.jpg?fit=1024%2C576&amp;quality=70&amp;strip=all&amp;ssl=1\" class=\"attachment-rss-image-size size-rss-image-size wp-post-image\" alt=\"\" \/><\/figure>\n<p class=\"wp-block-paragraph\">Google ha presentado <strong>DiffusionGemma<\/strong>, un modelo experimental de inteligencia artificial que <strong>cambia la forma como se genera el texto<\/strong>. A diferencia de los modelos actuales, este no construye las respuestas palabra por palabra, sino que lo hace en bloques completos, y eso lo vuelve mucho m\u00e1s r\u00e1pido.<\/p>\n<p class=\"wp-block-paragraph\">De acuerdo con <a href=\"https:\/\/blog.google\/innovation-and-ai\/technology\/developers-tools\/diffusion-gemma-faster-text-generation\/\" target=\"_blank\" rel=\"noopener\">una publicaci\u00f3n en su blog<\/a>, DiffusionGemma puede alcanzar hasta cuatro veces m\u00e1s velocidad de inferencia respecto a Gemma 4 y otros modelos autorregresivos convencionales. En una GPU dedicada como la NVIDIA H100, el modelo <strong>supera los 1.000 tokens por segundo<\/strong>, que equivale a<a href=\"https:\/\/openai.com\/es-419\/api-priority-processing\/\" target=\"_blank\" rel=\"noopener\"> diez veces la velocidad de GPT-5.4 mini<\/a>.<\/p>\n<p class=\"wp-block-paragraph\">Para entender qu\u00e9 hace diferente a DiffusionGemma de otras IA, tenemos que partir desde lo m\u00e1s b\u00e1sico. La mayor\u00eda de los modelos de lenguaje funcionan como una m\u00e1quina de escribir, es decir, generan un token tras otro, de izquierda a derecha, esperando a que cada pieza est\u00e9 lista para pasar a la siguiente.<\/p>\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" data-recalc-dims=\"1\" width=\"780\" height=\"429\" src=\"https:\/\/i0.wp.com\/imgs.hipertextual.com\/wp-content\/uploads\/2026\/06\/diffusion-gemma-02.jpg?resize=780%2C429&amp;quality=70&amp;strip=all&amp;ssl=1\" alt=\"\" class=\"wp-image-1891655\" \/><\/figure>\n<p class=\"wp-block-paragraph\">Este proceso es eficiente en la nube, donde miles de peticiones se agrupan para aprovechar el hardware al m\u00e1ximo. Pero si ejecutas un modelo en tu propio ordenador para uso individual, esa GPU potente que tienes pasa gran parte del tiempo sin hacer nada, esperando el siguiente token.<\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_81 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Tabla de Contenido<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Alternar tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/enfoquenoticioso.com\/?p=135011\/#Como_funciona_DiffusionGemma\" >C\u00f3mo funciona DiffusionGemma<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/enfoquenoticioso.com\/?p=135011\/#Cuando_usarlo_y_cuando_no\" >Cu\u00e1ndo usarlo (y cu\u00e1ndo no)<\/a><\/li><\/ul><\/nav><\/div>\n<h2 id=\"h-como-funciona-diffusiongemma\" class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Como_funciona_DiffusionGemma\"><\/span>C\u00f3mo funciona DiffusionGemma<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p class=\"wp-block-paragraph\">DiffusionGemma rompe con ese esquema. En lugar de generar los tokens en secuencia, <strong>redacta un bloque completo de 256 tokens a la vez<\/strong>, haciendo que el procesador reciba un trabajo mucho m\u00e1s grande de una sola vez. Esto ser\u00eda como pasar de una m\u00e1quina de escribir a una imprenta que estampa toda la p\u00e1gina de golpe, aprovechando todo el hardware que tienes a tu disposici\u00f3n.<\/p>\n<p class=\"wp-block-paragraph\">El modelo <strong>aplica un proceso de refinamiento iterativo<\/strong>, comenzando con un bloque de texto aleatorio que va haciendo pasadas hasta afinar el resultado. DiffusionGemma <strong>opera de forma parecida a modelos de im\u00e1genes como DALL-E 3 y <a href=\"https:\/\/hipertextual.com\/tecnologia\/midjourney-v1-modelo-ia-convierte-imagenes-video\/\" target=\"_blank\" rel=\"noopener\">Midjourney<\/a><\/strong>, que parten de ruido visual y lo van refinando hasta obtener una imagen n\u00edtida.<\/p>\n<p class=\"wp-block-paragraph\">Otra caracter\u00edstica relevante es su atenci\u00f3n bidireccional. Cuando genera esos 256 tokens en paralelo, cada uno puede relacionarse con todos los dem\u00e1s. Eso abre posibilidades interesantes para tareas donde los modelos autorregresivos tienen problemas, como rellenar huecos en c\u00f3digo, editar fragmentos en l\u00ednea o trabajar con estructuras no lineales.<\/p>\n<p class=\"wp-block-paragraph\">En cuanto al tama\u00f1o, DiffusionGemma es <strong>un modelo Mixture of Experts de 26.000 millones de par\u00e1metros totales<\/strong>, pero durante la inferencia solo activa 3.800 millones. Traducido al hardware, el modelo cabe en GPUs de consumo con 18 GB de VRAM, como la RTX 5090 o la RTX 4090, lo que lo hace accesible sin necesidad de infraestructura de servidor.<\/p>\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" data-recalc-dims=\"1\" width=\"780\" height=\"437\" src=\"https:\/\/i0.wp.com\/imgs.hipertextual.com\/wp-content\/uploads\/2026\/06\/diffusion-gemma-01.jpg?resize=780%2C437&amp;quality=70&amp;strip=all&amp;ssl=1\" alt=\"\" class=\"wp-image-1891657\" \/><\/figure>\n<h2 id=\"h-cuando-usarlo-y-cuando-no\" class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Cuando_usarlo_y_cuando_no\"><\/span>Cu\u00e1ndo usarlo (y cu\u00e1ndo no)<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p class=\"wp-block-paragraph\">DiffusionGemma <strong>ya est\u00e1 disponible en Hugging Face<\/strong> bajo licencia Apache 2.0, lo que significa que <strong>puedes descargarlo y usarlo libremente<\/strong>. Google trabaja con herramientas como vLLM, MLX y Hugging Face Transformers para<a href=\"https:\/\/developers.googleblog.com\/en\/diffusiongemma-the-developer-guide\/\" target=\"_blank\" rel=\"noopener\"> facilitar la integraci\u00f3n, y el soporte oficial<\/a> para llama.cpp llegar\u00e1 pr\u00f3ximamente.<\/p>\n<p class=\"wp-block-paragraph\">Ahora bien, <strong>hay que ser honesto con sus limitaciones<\/strong>. DiffusionGemma prioriza velocidad sobre calidad de salida, y en ese sentido, el propio Google reconoce que <strong>los modelos Gemma 4 est\u00e1ndar siguen siendo superiores para producci\u00f3n<\/strong>. Este modelo brilla en entornos locales para tareas de edici\u00f3n en tiempo real, prototipado r\u00e1pido o experimentaci\u00f3n con flujos no lineales.<\/p>\n<p class=\"wp-block-paragraph\">Para el <strong>usuario entusiasta que ya tiene una GPU decente<\/strong> y disfruta probando modelos en su ordenador, DiffusionGemma es una de las propuestas m\u00e1s interesantes que ha llegado en lo que va de a\u00f1o.<\/p>\n<p class=\"wp-block-paragraph\">\n<p>Seguir leyendo: <a href=\"https:\/\/hipertextual.com\/inteligencia-artificial\/diffusiongemma-modelo-ia-google-generacion-texto-rapida\/\" target=\"_blank\" rel=\"noopener\">Google lanza una IA que genera texto diez veces m\u00e1s r\u00e1pido que ChatGPT (y es gratis)<\/a><\/p>\n<p><a href=\"https:\/\/hipertextual.com\/inteligencia-artificial\/diffusiongemma-modelo-ia-google-generacion-texto-rapida\/\" class=\" target=\" title=\"Google lanza una IA que genera texto diez veces m\u00e1s r\u00e1pido que ChatGPT (y es gratis)\" target=\"_blank\" rel=\"noopener\">Ver fuente<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Google ha presentado DiffusionGemma, un modelo experimental de inteligencia artificial que cambia la forma como se genera el texto. A diferencia de los modelos actuales, este no construye las respuestas palabra por palabra, sino que lo hace en bloques completos, y eso lo vuelve mucho m\u00e1s r\u00e1pido. De acuerdo con una publicaci\u00f3n en su blog, [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":135012,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[],"class_list":["post-135011","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia"],"_links":{"self":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/posts\/135011","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=135011"}],"version-history":[{"count":0,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/posts\/135011\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/media\/135012"}],"wp:attachment":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=135011"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=135011"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=135011"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}