{"id":136338,"date":"2026-06-21T11:08:09","date_gmt":"2026-06-21T11:08:09","guid":{"rendered":"https:\/\/enfoquenoticioso.com\/?p=136338"},"modified":"2026-06-21T11:08:09","modified_gmt":"2026-06-21T11:08:09","slug":"como-usar-gemma-4-12b-la-alternativa-a-claude-code-que-te-ayuda-a-programar-gratis-con-ia","status":"publish","type":"post","link":"https:\/\/enfoquenoticioso.com\/?p=136338","title":{"rendered":"C\u00f3mo usar Gemma 4 12B, la alternativa a Claude Code que te ayuda a programar gratis con IA"},"content":{"rendered":"<figure><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"577\" src=\"https:\/\/i0.wp.com\/imgs.hipertextual.com\/wp-content\/uploads\/2026\/06\/Gemma-4-12B.jpg?fit=1024%2C577&amp;quality=70&amp;strip=all&amp;ssl=1\" class=\"attachment-rss-image-size size-rss-image-size wp-post-image\" alt=\"Gemma 4 12B\" \/><\/figure>\n<p class=\"wp-block-paragraph\">Con<a href=\"https:\/\/hipertextual.com\/inteligencia-artificial\/nuevos-limites-de-uso-gemini\/\" target=\"_blank\" rel=\"noopener\"> los l\u00edmites de uso <\/a>en Claude, Gemini y ChatGPT, cada vez m\u00e1s usuarios est\u00e1n migrando a <strong>modelos que se ejecutan en el ordenador<\/strong>. Aunque estos no alcanzan los niveles de Opus 4.8 o Gemini 3.1 Pro, lo cierto es que han avanzado de forma notable. Tal es el caso de <a href=\"https:\/\/hipertextual.com\/inteligencia-artificial\/nuevo-gemma-4-12b\/\" target=\"_blank\" rel=\"noopener\"><strong>Gemma 4 12B<\/strong>, un modelo de c\u00f3digo abierto<\/a> pensado para <strong>generar, completar o corregir c\u00f3digo<\/strong>, as\u00ed como tambi\u00e9n otras funciones que involucran razonamiento y capacidades multimodales.<\/p>\n<p class=\"wp-block-paragraph\">Gemma 4 12B es una nueva variante de Gemma 4 que <strong>puede ejecutarse en cualquier ordenador con 16 GB de memoria RAM o VRAM<\/strong>. En t\u00e9rminos de especificaciones encontramos un modelo multimodal con 12.000 millones de par\u00e1metros y una ventana de contexto de hasta 256.000 tokens. Esto \u00faltimo es importante si trabajas con proyectos con muchos archivos o documentaci\u00f3n extensa, ya que no te dejar\u00e1 tirado a mitad del proceso.<\/p>\n<p class=\"wp-block-paragraph\">Una de las caracter\u00edsticas que presume Google de su nuevo modelo es que <strong>no utiliza encoders separados<\/strong>. En lugar de usar m\u00f3dulos independientes para procesar im\u00e1genes o audio, todo entra directamente al backbone del LLM. Esta capacidad de comprender im\u00e1genes y audio de forma nativa le permite<strong> reducir el consumo de memoria y<\/strong> <strong>la latencia<\/strong>.<\/p>\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" data-recalc-dims=\"1\" width=\"780\" height=\"438\" src=\"https:\/\/i0.wp.com\/imgs.hipertextual.com\/wp-content\/uploads\/2026\/06\/gemma-4-12b.jpg?resize=780%2C438&amp;quality=70&amp;strip=all&amp;ssl=1\" alt=\"\" class=\"wp-image-1894005\" \/><\/figure>\n<p class=\"wp-block-paragraph\">Pero si lo que a ti te interesa es <strong>usarlo como alternativa a Claude Code<\/strong>, esta variante de Gemma 4 se defiende muy bien. Comparado con su versi\u00f3n anterior, Gemma 4 12B pas\u00f3 del 29,1% al 80,0% en LiveCodeBench, un benchmark que mide la capacidad de generar c\u00f3digo, verificar que corre sin errores y corregirlos sobre la marcha. Por otro lado, en Codeforces ELO lleg\u00f3 a 2.150, lo que lo coloca en territorio de <strong>programador competitivo experto<\/strong>.<\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_81 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Tabla de Contenido<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Alternar tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/enfoquenoticioso.com\/?p=136338\/#Como_instalar_y_usar_Gemma_4_12B_para_desarrollo_de_software\" >C\u00f3mo instalar y usar Gemma 4 12B para desarrollo de software<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/enfoquenoticioso.com\/?p=136338\/#Que_ventajas_tiene_Gemma_4_12B_frente_a_Claude_Code\" >Qu\u00e9 ventajas tiene Gemma 4 12B frente a Claude Code<\/a><\/li><\/ul><\/nav><\/div>\n<h2 id=\"h-como-instalar-y-usar-gemma-4-12b-para-desarrollo-de-software\" class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Como_instalar_y_usar_Gemma_4_12B_para_desarrollo_de_software\"><\/span>C\u00f3mo instalar y usar Gemma 4 12B para desarrollo de software<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p class=\"wp-block-paragraph\">Gemma 4 12B puede funcionar con 8 GB de RAM con cuantizaci\u00f3n a 4 bits, pero lo recomendable es duplicar esa cifra para una mayor calidad. Eso significa que puedes ejecutar el modelo con cualquier <strong>Mac con chip Apple Silicon de 16 GB de memoria unificada<\/strong> o con un PC con la misma cantidad de RAM o una <strong>GPU NVIDIA con 16 GB de VRAM<\/strong> o superior (como una RTX 3090 o modelos superiores).<\/p>\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" data-recalc-dims=\"1\" width=\"780\" height=\"510\" src=\"https:\/\/i0.wp.com\/imgs.hipertextual.com\/wp-content\/uploads\/2026\/06\/gemma-4-12b_lmstudio.jpg?resize=780%2C510&amp;quality=70&amp;strip=all&amp;ssl=1\" alt=\"\" class=\"wp-image-1894006\" \/><\/figure>\n<p class=\"wp-block-paragraph\">Si quieres probarlo en tu PC pero no tienes experiencia corriendo modelos de forma local, puedes seguir<a href=\"https:\/\/hipertextual.com\/inteligencia-artificial\/como-probar-gemma-4-12b-lm-studio\/\" target=\"_blank\" rel=\"noopener\"> esta gu\u00eda que publicamos hace unos d\u00edas para instalar LM Studio<\/a>. Esta herramienta est\u00e1 pensada para usuarios menos t\u00e9cnicos.<\/p>\n<p class=\"wp-block-paragraph\">Si eres desarrollador, <strong>Ollama es la mejor alternativa, ya que se integra bien con VS Code<\/strong>. Tambi\u00e9n puedes combinarlo con OpenCode, que es la interfaz de terminal donde trabajas con \u00e9l como asistente de c\u00f3digo. Ollama <strong>gestiona la descarga y ejecuci\u00f3n del modelo con un solo comando<\/strong>, solo <a href=\"https:\/\/ollama.com\/download\" target=\"_blank\" rel=\"noopener\">necesitas descargarlo primero de la web oficial<\/a>.<\/p>\n<p class=\"wp-block-paragraph\">Una vez configurado, solo ejecuta este comando en la terminal<\/p>\n<p class=\"wp-block-paragraph\"><code>ollama run gemma4:12b<\/code><\/p>\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" data-recalc-dims=\"1\" width=\"780\" height=\"421\" src=\"https:\/\/i0.wp.com\/imgs.hipertextual.com\/wp-content\/uploads\/2026\/06\/gemma-4-12b_1-1500x810.jpg?resize=780%2C421&amp;quality=70&amp;strip=all&amp;ssl=1\" alt=\"\" class=\"wp-image-1894007\" \/><\/figure>\n<p class=\"wp-block-paragraph\">Ollama <strong>descargar\u00e1 los pesos del modelo y dejar\u00e1 disponible un servidor local <\/strong>compatible con la API. Eso significa que puedes conectar cualquier herramienta que ya uses habitualmente: Continue (extensi\u00f3n para VS Code), Aider, o cualquier cliente que soporte endpoints.<\/p>\n<p class=\"wp-block-paragraph\">Una vez que el servidor est\u00e1 corriendo, en VS Code instala la extensi\u00f3n Continue y apunta el endpoint a <code>http:\/\/localhost:11434<\/code>. Desde ah\u00ed puedes pedirle al modelo que complete c\u00f3digo, explique funciones, refactorice bloques o genere tests directamente desde el editor, sin salir del entorno de trabajo.<\/p>\n<p class=\"wp-block-paragraph\">Para conectarlo a OpenCode, abre o crea un archivo <code>~\/.config\/opencode\/opencode.jsonc<\/code> y a\u00f1ade lo siguiente:<\/p>\n<pre class=\"wp-block-preformatted\">{<br \/> &nbsp;\"provider\": {<br \/> &nbsp; &nbsp;\"ollama\": {<br \/> &nbsp; &nbsp; &nbsp;\"npm\": \"@ai-sdk\/openai-compatible\",<br \/> &nbsp; &nbsp; &nbsp;\"options\": {<br \/> &nbsp; &nbsp; &nbsp; &nbsp;\"baseURL\": \"http:\/\/localhost:11434\/v1\"<br \/> &nbsp; &nbsp;  },<br \/> &nbsp; &nbsp; &nbsp;\"models\": {<br \/> &nbsp; &nbsp; &nbsp; &nbsp;\"gemma4:12b\": {}<br \/> &nbsp; &nbsp;  }<br \/> &nbsp;  }<br \/>  }<br \/>}<\/pre>\n<p class=\"wp-block-paragraph\">Tambi\u00e9n necesitas a\u00f1adir un placeholder en <code>~\/.local\/share\/opencode\/auth.json<\/code>:<\/p>\n<pre class=\"wp-block-preformatted\">{<br \/> &nbsp;\"ollama\": {<br \/> &nbsp; &nbsp;\"type\": \"api\",<br \/> &nbsp; &nbsp;\"key\": \"ollama\"<br \/>  }<br \/>}<\/pre>\n<p class=\"wp-block-paragraph\">Ya que lo hiciste, reinicia OpenCode, ejecuta <code>\/models<\/code> y cambia a <code>ollama\/gemma4:12b<\/code>.<\/p>\n<p class=\"wp-block-paragraph\">Un tema a considerar es que <strong>Ollama descarga el modelo de la memoria luego de cinco minutos de inactividad<\/strong>. Si no quieres tener que lidiar con una carga en fr\u00edo cada vez que vuelves al terminal despu\u00e9s de ese tiempo, solo necesitas a\u00f1adir <code>OLLAMA_KEEP_ALIVE=\"-1\"<\/code> en tu archivo <code>~\/.zshrc<\/code>.<\/p>\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" data-recalc-dims=\"1\" width=\"780\" height=\"439\" src=\"https:\/\/i0.wp.com\/imgs.hipertextual.com\/wp-content\/uploads\/2026\/04\/claude-code-app-02-1500x844.jpg?resize=780%2C439&amp;quality=70&amp;strip=all&amp;ssl=1\" alt=\"Claude Code\" class=\"wp-image-1882024\" \/><figcaption class=\"wp-element-caption\">Claude Code<\/figcaption><\/figure>\n<h2 id=\"h-que-ventajas-tiene-gemma-4-12b-frente-a-claude-code\" class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Que_ventajas_tiene_Gemma_4_12B_frente_a_Claude_Code\"><\/span>Qu\u00e9 ventajas tiene Gemma 4 12B frente a Claude Code<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p class=\"wp-block-paragraph\">Claude Code es una herramienta potente, pero depende de los servidores de Anthropic. Adem\u00e1s, existe un coste asociado que deber\u00e1s pagar cada mes, el cual puede dispararse de acuerdo con la complejidad de tus proyectos. En contraste, <strong>ejecutar Gemma 4 12B en tu ordenador no tiene coste por token<\/strong>.<\/p>\n<p class=\"wp-block-paragraph\">Otro detalle a considerar es la privacidad. Al usar el modelo localmente,<strong> todo el c\u00f3digo, capturas de pantalla o documentos privados no salen de tu ordenador<\/strong>. Para proyectos bajo NDA o c\u00f3digo propietario esto es una gran ventaja, incluso para aquellos que simplemente no desean que sus datos pasen por terceros.<\/p>\n<p class=\"wp-block-paragraph\">Aunque todo suena muy lindo, <strong>existe un pero si lo comparamos con la herramienta de Anthropic<\/strong>. Las tareas que implican refactorizaci\u00f3n completa de proyectos, decisiones arquitect\u00f3nicas complejas o cadenas de herramientas muy largas siguen funcionando mejor con modelos en la nube como Claude Sonnet.<\/p>\n<p class=\"wp-block-paragraph\">Lo que puedes hacer es combinar ambos y dejar que Gemma 4 12B se encargue de un 60 o 70% de las tareas rutinarias, como boilerplate, tests o explicaci\u00f3n de errores. Las<strong> decisiones complejas las reservas para Claude<\/strong> y con ese enfoque h\u00edbrido, reducir\u00e1s el gasto en APIs sin que tengas que renunciar a la calidad cuando lo necesites.<\/p>\n<p>Seguir leyendo: <a href=\"https:\/\/hipertextual.com\/inteligencia-artificial\/gemma-4-12b-vs-claude-code\/\" target=\"_blank\" rel=\"noopener\">C\u00f3mo usar Gemma 4 12B, la alternativa a Claude Code que te ayuda a programar gratis con IA<\/a><\/p>\n<p><a href=\"https:\/\/hipertextual.com\/inteligencia-artificial\/gemma-4-12b-vs-claude-code\/\" class=\" target=\" title=\"C\u00f3mo usar Gemma 4 12B, la alternativa a Claude Code que te ayuda a programar gratis con IA\" target=\"_blank\" rel=\"noopener\">Ver fuente<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Con los l\u00edmites de uso en Claude, Gemini y ChatGPT, cada vez m\u00e1s usuarios est\u00e1n migrando a modelos que se ejecutan en el ordenador. Aunque estos no alcanzan los niveles de Opus 4.8 o Gemini 3.1 Pro, lo cierto es que han avanzado de forma notable. Tal es el caso de Gemma 4 12B, un [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":136339,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[],"class_list":["post-136338","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia"],"_links":{"self":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/posts\/136338","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=136338"}],"version-history":[{"count":0,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/posts\/136338\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/media\/136339"}],"wp:attachment":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=136338"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=136338"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=136338"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}