{"id":3978,"date":"2024-05-28T13:23:23","date_gmt":"2024-05-28T13:23:23","guid":{"rendered":"https:\/\/enfoquenoticioso.com\/tecnologia\/han-hecho-un-estudio-y-la-mitad-de-sus-respuestas-son-incorrectas\/"},"modified":"2024-05-28T13:23:23","modified_gmt":"2024-05-28T13:23:23","slug":"han-hecho-un-estudio-y-la-mitad-de-sus-respuestas-son-incorrectas","status":"publish","type":"post","link":"https:\/\/enfoquenoticioso.com\/?p=3978","title":{"rendered":"han hecho un estudio y la mitad de sus respuestas son incorrectas"},"content":{"rendered":"<div>\n<p>Buscar respuestas en Stack Overflow o hacer b\u00fasquedas en Google ya no mola tanto. Muchos programadores han encontrado en <a href=\"https:\/\/www.xataka.com\/basics\/chatgpt-que-como-usarlo-que-puedes-hacer-este-chat-inteligencia-artificial\" target=\"_blank\" rel=\"noopener\">ChatGPT<\/a> una herramienta estupenda para <strong>agilizar su trabajo<\/strong> y depender menos de las mencionadas plataformas. Sin embargo, el chatbot de inteligencia artificial (IA) de OpenAI est\u00e1 lejos de ser perfecto, y fiarnos completamente en \u00e9l puede no ser lo m\u00e1s acertado.<\/p>\n<p><!-- BREAK 1 --> <\/p>\n<p>ChatGPT, al igual que cualquier otra herramienta basada en modelos de lenguaje grande (LLM), tiene varias limitaciones. La propia compa\u00f1\u00eda liderada por Sam Altman se\u00f1ala en su p\u00e1gina web que el chatbot \u201cpuede cometer errores\u201d e invita a verificar la informaci\u00f3n importante. Ahora bien, en el mundo de la programaci\u00f3n, \u00bfqu\u00e9 tan bien (o mal) hace su trabajo? Veamos lo que dicen unos investigadores.<\/p>\n<p><!-- BREAK 2 --><\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_81 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Tabla de Contenido<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Alternar tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/enfoquenoticioso.com\/?p=3978\/#Cuando_mas_del_50_de_las_respuestas_son_incorrectas\" >Cuando m\u00e1s del 50% de las respuestas son incorrectas<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Cuando_mas_del_50_de_las_respuestas_son_incorrectas\"><\/span>Cuando m\u00e1s del 50% de las respuestas son incorrectas<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Un grupo de investigadores de la Universidad de Purdue <a rel=\"noopener, noreferrer\" href=\"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3613904.3642596\" target=\"_blank\">present\u00f3 este mes una investigaci\u00f3n<\/a> motivada por la \u201ccreciente popularidad de ChatGPT\u201d y la din\u00e1mica de los LLM para \u201c<strong>generar textos inventados<\/strong>\u201d que generalmente son dif\u00edciles de reconocer por usuarios que carecen de cierta experiencia en el tema en cuesti\u00f3n. Muchas respuestas, de hecho, son plausibles, pero err\u00f3neas.<\/p>\n<p><!-- BREAK 3 --> <\/p>\n<p>\u201cDescubrimos que el 52% de las respuestas de ChatGPT contienen informaci\u00f3n err\u00f3nea\u201d, afirman los investigadores. En este sentido a\u00f1aden que el 77% de las respuestas son m\u00e1s detalladas que las respuestas humanas (lo que no garantiza su precisi\u00f3n) y que el 78% de estas sufren de diferentes grados de inconsistencia. Se trata de cifras que realmente no pasan desapercibidas.<\/p>\n<p><!-- BREAK 4 --><\/p>\n<p>Para obtener estos valores, los investigadores tomaron 517 preguntas de programaci\u00f3n de Stack Overflow. Despu\u00e9s, examinaron la correcci\u00f3n, coherencia, <strong>exhaustividad y concisi\u00f3n<\/strong> de las respuestas con ChatGPT basado en <a href=\"https:\/\/www.xataka.com\/servicios\/gpt-3-5-tengo-sensacion-cuando-use-internet-primera-vez-siendo-nino\" target=\"_blank\" rel=\"noopener\">GPT-3.5<\/a> y realizaron un an\u00e1lisis ling\u00fc\u00edstico a gran escala, como un estudio con usuarios para comprender las respuestas de ChatGPT desde diferentes puntos de vista.<\/p>\n<p><!-- BREAK 5 --><\/p>\n<div class=\"article-asset-image article-asset-normal article-asset-center\">\n<div class=\"asset-content\">\n                   <img class=\"centro_sinmarco\" height=\"1600\" width=\"2400\" loading=\"lazy\" decoding=\"async\" sizes=\"auto, 100vw\" fetchpriority=\"high\" srcset=\"https:\/\/i.blogs.es\/4a01fd\/programacion-1\/450_1000.jpeg 450w, https:\/\/i.blogs.es\/4a01fd\/programacion-1\/650_1200.jpeg 681w,https:\/\/i.blogs.es\/4a01fd\/programacion-1\/1024_2000.jpeg 1024w, https:\/\/i.blogs.es\/4a01fd\/programacion-1\/1366_2000.jpeg 1366w\" src=\"https:\/\/i.blogs.es\/4a01fd\/programacion-1\/450_1000.jpeg\" alt=\"Programacion 1\"\/><br \/>\n   <img decoding=\"async\" alt=\"Programacion 1\" class=\"centro_sinmarco\" src=\"https:\/\/i.blogs.es\/4a01fd\/programacion-1\/450_1000.jpeg\"\/><\/p><\/div>\n<\/div>\n<p>Los investigadores de Purdue escogieron GPT-3.5 en lugar de <a href=\"https:\/\/www.xataka.com\/nuevo\/gpt-4-que-cuando-sale-como-funciona-toda-informacion\" target=\"_blank\" rel=\"noopener\">GPT-4<\/a>, la \u00faltima versi\u00f3n del modelo de lenguaje al momento de realizar el estudio, que es la versi\u00f3n gratuita m\u00e1s ampliamente utilizada. Cabe se\u00f1alar que tambi\u00e9n hicieron pruebas paralelas con GPT-4 y llegaron a la conclusi\u00f3n de que, si bien el modelo m\u00e1s nuevo funciona \u201cligeramente mejor\u201d, ambos tienen una tasa de inexactitud alta.<\/p>\n<p><!-- BREAK 6 --> <\/p>\n<p>Cuando hablamos de ChatGPT estamos haciendo referencia a un chatbot de IA que puede ser utilizado para diferentes tareas. Desde ayudarnos a programar <strong>hasta escribir una carta<\/strong>. En el mundo de la programaci\u00f3n tambi\u00e9n tenemos otras herramientas impulsadas por IA dise\u00f1adas espec\u00edficamente para desarrolladores, como GitHub Copilot, que se integra a los entornos de desarrollo.<\/p>\n<p><!-- BREAK 7 --><\/p>\n<div class=\"article-asset article-asset-normal article-asset-center\">\n<div class=\"desvio-container\">\n<div class=\"desvio\">\n<div class=\"desvio-figure js-desvio-figure\">\n    <a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/buscador-google-vive-revolucion-importante-su-historia-ahora-esta-siendo-desastre\" target=\"_blank\" rel=\"noopener\"><br \/>\n     <img loading=\"lazy\" decoding=\"async\" alt=\"El buscador de Google vive la revoluci\u00f3n m\u00e1s importante de su historia. Por ahora est\u00e1 siendo un desastre\" width=\"375\" height=\"142\" src=\"https:\/\/i.blogs.es\/d9ab22\/sundar2\/375_142.jpeg\"\/><br \/>\n    <\/a>\n   <\/div>\n<\/p><\/div>\n<\/p><\/div>\n<\/div>\n<p>En cualquier caso, estamos presenciando en directo como la IA cambia la forma en la que trabajamos, y en este proceso vamos descubriendo bondades y defectos de las herramientas que utilizamos. Por lo pronto, ChatGPT parece estar lejos de poder superar las respuestas humanas en el \u00e1mbito de la programaci\u00f3n. De hecho, <a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/stack-overflow-acaba-prohibir-respuestas-chatgpt-esto-que-ha-sucedido\" target=\"_blank\" rel=\"noopener\">est\u00e1 prohibido publicar respuestas con esta herramienta en Stack Overflow<\/a>.<\/p>\n<p><!-- BREAK 8 --><\/p>\n<p>Im\u00e1genes | <a rel=\"noopener, noreferrer\" href=\"https:\/\/unsplash.com\/es\/fotos\/ordenador-portatil-en-blanco-y-negro-pJaocJrXGFQ\" target=\"_blank\">Gema Saputera<\/a> | <a rel=\"noopener, noreferrer\" href=\"https:\/\/unsplash.com\/es\/fotos\/mujer-con-camisa-negra-sentada-al-lado-de-un-monitor-de-computadora-de-pantalla-plana-negra-Im_cQ6hQo10\" target=\"_blank\">Rivage\u00a0<\/a><\/p>\n<p>En Xataka | <a href=\"https:\/\/www.xataka.com\/servicios\/copilot-chatgpt-gpt-4-han-cambiado-para-siempre-mundo-programacion-esto-que-opinan-expertos\" target=\"_blank\" rel=\"noopener\">Copilot, ChatGPT y GPT-4 han cambiado el mundo de la programaci\u00f3n para siempre. Esto opinan los programadores<\/a><\/p>\n<p><!-- BREAK 9 --><\/p>\n<p>En Xataka | <a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/elon-musk-xai-quieren-ganar-guerra-ia-acaba-recibir-6-000-millones-dolares-para-lograrlo\" target=\"_blank\" rel=\"noopener\">Elon Musk y xAI quieren ganar la guerra de la IA: acaba de recibir 6.000 millones de d\u00f3lares para lograrlo<\/a><\/p>\n<p><!-- BREAK 10 --> <\/p><\/div>\n<p><a href=\"https:\/\/www.xataka.com\/robotica-e-ia\/creiamos-que-chatgpt-era-genial-para-programar-han-hecho-estudio-mitad-sus-respuestas-incorrectas\" class=\" target=\" title=\"han hecho un estudio y la mitad de sus respuestas son incorrectas\" target=\"_blank\" rel=\"noopener\">Ver fuente<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Buscar respuestas en Stack Overflow o hacer b\u00fasquedas en Google ya no mola tanto. Muchos programadores han encontrado en ChatGPT una herramienta estupenda para agilizar su trabajo y depender menos de las mencionadas plataformas. Sin embargo, el chatbot de inteligencia artificial (IA) de OpenAI est\u00e1 lejos de ser perfecto, y fiarnos completamente en \u00e9l puede [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":3979,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[],"class_list":["post-3978","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia"],"_links":{"self":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/posts\/3978","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=3978"}],"version-history":[{"count":0,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/posts\/3978\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=\/wp\/v2\/media\/3979"}],"wp:attachment":[{"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=3978"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=3978"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/enfoquenoticioso.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=3978"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}