{"id":5144,"date":"2023-02-15T19:13:51","date_gmt":"2023-02-15T18:13:51","guid":{"rendered":"http:\/\/bounsel.com\/?p=5144"},"modified":"2023-07-25T11:17:12","modified_gmt":"2023-07-25T09:17:12","slug":"reconocimiento-entidades-nombradas-ner","status":"publish","type":"post","link":"https:\/\/www.bounsel.com\/es\/blog\/reconocimiento-entidades-nombradas-ner\/","title":{"rendered":"\u00bfQu\u00e9 significa NER, Reconocimiento de entidades nombradas?"},"content":{"rendered":"<p>En los \u00faltimos a\u00f1os, la sociedad ha cambiado radicalmente gracias a los avances tecnol\u00f3gicos. Hoy en d\u00eda es dif\u00edcil imaginar la vida sin nuestros smartphones, los ordenadores de \u00faltima generaci\u00f3n, las plataformas de televisi\u00f3n, etc. La tecnolog\u00eda llega para hacernos la vida m\u00e1s f\u00e1cil,\u00a0<strong>y esto es sin\u00f3nimo de progreso. Recientemente, la investigaci\u00f3n tecnol\u00f3gica se ha centrado en la <\/strong><a href=\"https:\/\/www.bounsel.com\/es\/producto\/bounsel-ai\/\" target=\"_blank\" rel=\"noopener\"><strong>Inteligencia Artificial (IA)<\/strong><\/a>, lo cual constituye un verdadero hito hist\u00f3rico. Los desarrolladores est\u00e1n creando funcionalidades asombrosas que eran inconcebibles a finales del siglo XX. Entre ellas, podemos encontrar:<\/p>\n<ul role=\"list\">\n<li>Sistemas de recomendaci\u00f3n, como el que utiliza Netflix u otras plataformas para mostrarnos sugerencias basadas en nuestro historial.<\/li>\n<li>Comprensi\u00f3n del habla humana, como Siri o Alexa, que pueden realizar acciones a partir de nuestras palabras.<\/li>\n<li>Traducci\u00f3n de textos, como la que ofrece Google, que puede proporcionar una traducci\u00f3n s\u00f3lida de fragmentos completos de texto.<\/li>\n<li>Coches autoconducidos, que son veh\u00edculos aut\u00f3nomos capaces de mantenerse en un carril, evitar obst\u00e1culos o incluso aparcar.<\/li>\n<\/ul>\n<p>Esta es s\u00f3lo una lista muy breve de algunas de las funcionalidades que van de la mano de la IA. Hoy vamos a introducir un concepto clave en el contexto del\u00a0Procesamiento del Lenguaje Natural (NLP), esto es, el subcampo de la IA que se ocupa de las interacciones entre los ordenadores y el lenguaje humano. Se trata del llamado\u00a0<strong>Reconocimiento de Entidades (NER)<\/strong>. \u00bfOs imagin\u00e1is poder extraer las ideas m\u00e1s importantes de un documento sin necesidad de leer y comprender todo el texto? Aqu\u00ed es donde el NER entra en escena.<\/p>\n<p><span style=\"font-weight: 400;\"><div class=\"awb-toc-el awb-toc-el--1\" data-awb-toc-id=\"1\" data-awb-toc-options=\"{&quot;allowed_heading_tags&quot;:{&quot;h2&quot;:0,&quot;h3&quot;:1,&quot;h4&quot;:2},&quot;ignore_headings&quot;:&quot;&quot;,&quot;ignore_headings_words&quot;:&quot;&quot;,&quot;enable_cache&quot;:&quot;yes&quot;,&quot;highlight_current_heading&quot;:&quot;yes&quot;,&quot;hide_hidden_titles&quot;:&quot;yes&quot;,&quot;limit_container&quot;:&quot;all&quot;,&quot;select_custom_headings&quot;:&quot;&quot;,&quot;icon&quot;:&quot;fa-flag fas&quot;,&quot;counter_type&quot;:&quot;decimal&quot;}\" style=\"--awb-margin-top:16px;--awb-margin-bottom:16px;--awb-item-font-size:var(--awb-typography4-font-size);--awb-item-line-height:var(--awb-typography4-line-height);--awb-item-letter-spacing:var(--awb-typography4-letter-spacing);--awb-item-text-transform:var(--awb-typography4-text-transform);--awb-counter-color:var(--awb-color5);--awb-list-indent:16px;--awb-item-padding-top:4px;--awb-item-padding-right:12px;--awb-item-padding-bottom:4px;--awb-item-padding-left:12px;--awb-item-radius-top-left:6px;--awb-item-radius-top-right:6px;--awb-item-radius-bottom-right:6px;--awb-item-radius-bottom-left:6px;--awb-item-font-family:var(--awb-typography4-font-family);--awb-item-font-weight:var(--awb-typography4-font-weight);--awb-item-font-style:var(--awb-typography4-font-style);--awb-counter-type:counters(awb-toc, &quot;.&quot;, decimal) &quot;. &quot;;--awb-item-overflow:hidden;--awb-item-white-space:nowrap;--awb-item-text-overflow:ellipsis;\"><div class=\"awb-toc-el__content\"><ul class=\"awb-toc-el__list awb-toc-el__list--0\"><li class=\"awb-toc-el__list-item\"><a class=\"awb-toc-el__item-anchor\" href=\"#toc_En_que_consiste_el_Reconocimiento_de_entidades_nombradas\">\u00bfEn qu\u00e9 consiste el Reconocimiento de entidades nombradas (NER)?<\/a><\/li><li class=\"awb-toc-el__list-item\"><a class=\"awb-toc-el__item-anchor\" href=\"#toc_No_pierdas_la_oportunidad_de_llevar_tu_gestion\">No pierdas la oportunidad de llevar tu gesti\u00f3n de contratos al siguiente nivel<\/a><\/li><li class=\"awb-toc-el__list-item\"><a class=\"awb-toc-el__item-anchor\" href=\"#toc_Tecnicas_para_construir_nuestro_modelo_NER\">T\u00e9cnicas para construir nuestro modelo NER<\/a><ul class=\"awb-toc-el__list awb-toc-el__list--1\"><li class=\"awb-toc-el__list-item\"><a class=\"awb-toc-el__item-anchor\" href=\"#toc_Tablas_de_busqueda\"><span>Tablas de b\u00fasqueda<\/span><\/a><\/li><li class=\"awb-toc-el__list-item\"><a class=\"awb-toc-el__item-anchor\" href=\"#toc_Expresiones_regulares\"><span>Expresiones regulares<\/span><\/a><\/li><li class=\"awb-toc-el__list-item\"><a class=\"awb-toc-el__item-anchor\" href=\"#toc_Aprendizaje_profundo\"><span>Aprendizaje profundo<\/span><\/a><\/li><\/ul><\/li><\/ul><\/div><\/div><div class=\"fusion-text fusion-text-1\"><\/div><div class=\"fusion-text fusion-text-2\"><\/div><div class=\"fusion-text fusion-text-3\"><\/div><\/span><\/p>\n<figure class=\"w-richtext-figure-type-image w-richtext-align-fullwidth\">\n<div><a href=\"https:\/\/bounsel.app\/signup?utm_source=google&amp;utm_medium=organic&amp;utm_campaign=%C2%BFQu%C3%A9+significa+NER%2C+Reconocimiento+de+entidades+nombradas%3F&amp;utm_term=boton+1\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" class=\"lazyload alignnone\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272184%27%20height%3D%27547%27%20viewBox%3D%270%200%202184%20547%27%3E%3Crect%20width%3D%272184%27%20height%3D%27547%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/uploads-ssl.webflow.com\/61deb8eb918b0855f0c514f4\/63ee10ce70961c51d9e71bec_reconocimiento-entidades-nombradas-ner-2.jpg\" alt=\"NER\" width=\"2184\" height=\"547\" \/><\/a><\/div>\n<\/figure>\n<h2>\u00bfEn qu\u00e9 consiste el Reconocimiento de entidades nombradas (NER)?<\/h2>\n<p><strong>NER consiste en identificar la informaci\u00f3n clave del texto y clasificarla en un conjunto de categor\u00edas predefinidas.\u00a0<\/strong>Pongamos un ejemplo dentro del mundo jur\u00eddico. Imaginemos que se necesita conocer los detalles de un contrato de trabajo, como la empresa contratante, el nombre del empleado, el salario o la duraci\u00f3n del contrato. Toda esta informaci\u00f3n podr\u00eda estar dispersa por el documento, y podr\u00edamos perder mucho tiempo intentando encontrar todos estos detalles. \u00bfNo ser\u00eda fant\u00e1stico tener una aplicaci\u00f3n que leyera y procesara autom\u00e1ticamente tu documento y te devolviera toda esta informaci\u00f3n? Por descontado nos ahorrar\u00eda mucho tiempo y esfuerzo. Y ahora esta funcionalidad est\u00e1 al alcance de tu mano gracias al Reconocimiento de Entidades.<\/p>\n<p>Pero, \u00bfc\u00f3mo funciona NER? En esencia, el NER es un proceso de dos pasos. En primer lugar, el algoritmo debe detectar una entidad en un texto. En segundo lugar, debe categorizar la entidad detectada. Algunas categor\u00edas frecuentes son persona (PER), localizaci\u00f3n (LOC), organizaci\u00f3n (ORG), monetaria (MON) o fecha (DATE). Ilustr\u00e9moslo con un ejemplo:<\/p>\n<figure class=\"w-richtext-figure-type-image w-richtext-align-fullwidth\">\n<div><a href=\"https:\/\/uploads-ssl.webflow.com\/61deb8eb918b0855f0c514f4\/63ec9b87eee8c7c5d2270543_s8HeVklVWYNDprFpd0Bze9-Ce5QPdEcb49k7JaQv1tMKmPL9sCZdSUQIfFiP4Ow0VugJSYokJ09uqvUcRWPHQP6PDwJkwMsx2KBygJc3-f21p1PiMLKJPIRasSGjVsRrCTK4iwK3gES0uyrdb5TQ2ZQ.png\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" class=\"lazyload alignnone\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271554%27%20height%3D%27402%27%20viewBox%3D%270%200%201554%20402%27%3E%3Crect%20width%3D%271554%27%20height%3D%27402%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/uploads-ssl.webflow.com\/61deb8eb918b0855f0c514f4\/63ec9b87eee8c7c5d2270543_s8HeVklVWYNDprFpd0Bze9-Ce5QPdEcb49k7JaQv1tMKmPL9sCZdSUQIfFiP4Ow0VugJSYokJ09uqvUcRWPHQP6PDwJkwMsx2KBygJc3-f21p1PiMLKJPIRasSGjVsRrCTK4iwK3gES0uyrdb5TQ2ZQ.png\" alt=\"\" width=\"1554\" height=\"402\" \/><\/a><\/div>\n<\/figure>\n<p>Como se puede ver, el modelo parte de la frase \u00abMe llamo Galo Gonzalvo, vivo en Valencia y trabajo en Bounsel S.L.\u00bb y extrae tres entidades, la persona \u00abGalo Gonzalvo\u00bb, la localizaci\u00f3n \u00abValencia\u00bb, y la organizaci\u00f3n \u00abBounsel S.L.\u00bb. Concretamente, se trata de un modelo\u00a0<a href=\"https:\/\/arxiv.org\/abs\/1907.11692\" rel=\"nofollow noopener\" target=\"_blank\">RoBERTa<\/a>\u00a0espec\u00edfico para NER impulsado por Facebook AI.\u00a0<strong>Se entrena con el conjunto de datos\u00a0<\/strong><a href=\"https:\/\/paperswithcode.com\/dataset\/conll-2003\" rel=\"nofollow noopener\" target=\"_blank\"><strong>CoNLL-2003<\/strong><\/a><strong>, que contiene m\u00e1s de 20.000 entidades etiquetadas en m\u00e1s de 20.000 frases. Est\u00e1 especializado en detectar todas las entidades de localizaci\u00f3n, organizaci\u00f3n y persona.\u00a0<\/strong>Puedes probar este modelo a trav\u00e9s de la API de HuggingFace siguiendo este\u00a0<a href=\"https:\/\/huggingface.co\/Jean-Baptiste\/roberta-large-ner-english\" rel=\"nofollow noopener\" target=\"_blank\">link<\/a>.<\/p>\n<p>Ahora vamos a entrar en algunos detalles. El primer paso es detectar una entidad, y esto se hace frecuentemente utilizando el etiquetado Inside-outside-beginning (IOB). Como se muestra en el ejemplo anterior, una entidad dada puede ser simplemente una palabra (o token), pero tambi\u00e9n puede ser una combinaci\u00f3n de tokens. En este caso, I- y B- son etiquetas de prefijo asociadas a una entidad detectada, mientras que una etiqueta O indica que una palabra no pertenece a ninguna entidad. Concretamente, el prefijo I- indica que un token dado est\u00e1 dentro de una entidad detectada, y el prefijo B- indica que la entidad detectada es el principio de una entidad que sigue inmediatamente a una entidad anterior sin etiquetas O entre ellas. Ilustr\u00e9moslo con otro ejemplo: \u00abMar\u00eda est\u00e1 visitando a su abuela en las Islas Canarias, Espa\u00f1a\u00bb:<\/p>\n<p>Internamente, el etiquetado IOB funcionar\u00eda de la siguiente manera:<\/p>\n<figure class=\"w-richtext-figure-type-image w-richtext-align-fullwidth\">\n<div><a href=\"https:\/\/uploads-ssl.webflow.com\/61deb8eb918b0855f0c514f4\/63ec9ef3b1de4f13bd89f7fd_que%20significa%20ner.png\" rel=\"nofollow noopener\" target=\"_blank\"><img decoding=\"async\" class=\"lazyload alignnone\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271214%27%20height%3D%27862%27%20viewBox%3D%270%200%201214%20862%27%3E%3Crect%20width%3D%271214%27%20height%3D%27862%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/uploads-ssl.webflow.com\/61deb8eb918b0855f0c514f4\/63ec9ef3b1de4f13bd89f7fd_que%20significa%20ner.png\" alt=\"\" width=\"1214\" height=\"862\" \/><\/a><\/div>\n<\/figure>\n<p>Como puede observarse, tanto \u00abMar\u00eda\u00bb como \u00abIslas Canarias\u00bb y \u00abEspa\u00f1a\u00bb est\u00e1n etiquetadas correctamente. \u00abEspa\u00f1a\u00bb contiene una etiqueta B- solo para diferenciarla claramente de \u00abIslas Canarias\u00bb, ya que ambas son localizaciones pero se refieren a entidades diferentes.<\/p>\n<p><strong>Hasta este punto, hemos estado ilustrando c\u00f3mo funciona NER utilizando modelos de aprendizaje profundo de \u00faltima generaci\u00f3n, como RoBERTa.<\/strong>\u00a0Sin embargo, para construir nuestro modelo NER se pueden utilizar principalmente tres t\u00e9cnicas diferentes:<\/p>\n<p><div class=\"fusion-builder-row fusion-builder-row-inner fusion-row\"><div class=\"fusion-layout-column fusion_builder_column_inner fusion-builder-nested-column-0 fusion-column-first\" style=\"--awb-padding-top:36px;--awb-padding-right:36px;--awb-padding-bottom:36px;--awb-padding-left:36px;--awb-bg-color:var(--awb-custom_color_3);--awb-bg-color-hover:var(--awb-custom_color_3);--awb-bg-size:cover;--awb-margin-top:0px;--awb-margin-bottom:0px;width:37.6%; margin-right: 4%;\" data-scroll-devices=\"small-visibility,medium-visibility,large-visibility\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-column-wrapper-legacy\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-div\" style=\"--awb-text-color:#2b3d30;--awb-margin-bottom:5px;--awb-font-size:var(--awb-typography4-font-size);\"><div class=\"fusion-title-heading title-heading-left title-heading-tag\" style=\"font-family:var(--awb-typography4-font-family);font-weight:var(--awb-typography4-font-weight);font-style:var(--awb-typography4-font-style);margin:0;font-size:1em;letter-spacing:var(--awb-typography4-letter-spacing);text-transform:var(--awb-typography4-text-transform);line-height:var(--awb-typography4-line-height);\">Descubre Bounsel AI<\/div><\/div><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:#2b3d30;--awb-margin-bottom-small:32px;--awb-font-size:var(--awb-typography2-font-size);\"><h2 class=\"fusion-title-heading title-heading-left\" style=\"font-family:var(--awb-typography2-font-family);font-weight:var(--awb-typography2-font-weight);font-style:var(--awb-typography2-font-style);margin:0;font-size:1em;letter-spacing:var(--awb-typography2-letter-spacing);text-transform:var(--awb-typography2-text-transform);line-height:var(--awb-typography2-line-height);\">No pierdas la oportunidad de llevar tu gesti\u00f3n de contratos al siguiente nivel<\/h2><\/div><div class=\"fusion-button-wrapper\"><a class=\"fusion-button button-flat fusion-button-default-size button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" style=\"--button_text_transform:var(--awb-typography4-text-transform);--button_font_size:var(--awb-typography4-font-size);--button_line_height:var(--awb-typography4-line-height);--button_typography-letter-spacing:var(--awb-typography4-letter-spacing);--button_typography-font-family:var(--awb-typography4-font-family);--button_typography-font-weight:var(--awb-typography4-font-weight);--button_typography-font-style:var(--awb-typography4-font-style);\" target=\"_blank\" rel=\"noopener noreferrer nofollow\" href=\"https:\/\/bnsl.es\/c7ozf\"><span class=\"fusion-button-text\">Solicita una demo<\/span><\/a><\/div><div class=\"fusion-clearfix\"><\/div><\/div><\/div><div class=\"fusion-layout-column fusion_builder_column_inner fusion-builder-nested-column-1 fusion-column-last\" style=\"--awb-padding-top-small:100px;--awb-padding-bottom-small:100px;--awb-bg-color:var(--awb-custom_color_21);--awb-bg-color-hover:var(--awb-custom_color_21);--awb-bg-position:center center;--awb-bg-size:cover;--awb-margin-top:0px;--awb-margin-bottom:0px;width:58.4%;\" data-scroll-devices=\"small-visibility,medium-visibility,large-visibility\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-column-wrapper-legacy\"><div class=\"fusion-image-element fusion-image-align-center in-legacy-container\" style=\"text-align:center;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><div class=\"imageframe-align-center\"><span class=\" fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"3597\" height=\"1969\" alt=\"bounsel_ai\" title=\"bounsel_ai-min\" src=\"https:\/\/media-bnsl.s3.eu-west-1.amazonaws.com\/www\/uploads\/2023\/06\/04165841\/bounsel_ai-min.png\" data-orig-src=\"https:\/\/media-bnsl.s3.eu-west-1.amazonaws.com\/www\/uploads\/2023\/06\/04165841\/bounsel_ai-min-600x328.png\" class=\"lazyload img-responsive wp-image-18837\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%273597%27%20height%3D%271969%27%20viewBox%3D%270%200%203597%201969%27%3E%3Crect%20width%3D%273597%27%20height%3D%271969%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/media-bnsl.s3.eu-west-1.amazonaws.com\/www\/uploads\/2023\/06\/04165841\/bounsel_ai-min-200x109.png 200w, https:\/\/media-bnsl.s3.eu-west-1.amazonaws.com\/www\/uploads\/2023\/06\/04165841\/bounsel_ai-min-400x219.png 400w, https:\/\/media-bnsl.s3.eu-west-1.amazonaws.com\/www\/uploads\/2023\/06\/04165841\/bounsel_ai-min-600x328.png 600w, https:\/\/media-bnsl.s3.eu-west-1.amazonaws.com\/www\/uploads\/2023\/06\/04165841\/bounsel_ai-min-800x438.png 800w, https:\/\/media-bnsl.s3.eu-west-1.amazonaws.com\/www\/uploads\/2023\/06\/04165841\/bounsel_ai-min-1200x657.png 1200w, https:\/\/media-bnsl.s3.eu-west-1.amazonaws.com\/www\/uploads\/2023\/06\/04165841\/bounsel_ai-min.png 3597w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 3597px\" \/><\/span><\/div><\/div><div class=\"fusion-clearfix\"><\/div><\/div><\/div><\/div><div class=\"fusion-text fusion-text-4\"><\/div><div class=\"fusion-text fusion-text-5\"><\/div><div class=\"fusion-text fusion-text-6\"><\/div><\/p>\n<h2>T\u00e9cnicas para construir nuestro modelo NER<\/h2>\n<h3><strong>Tablas de b\u00fasqueda<\/strong><\/h3>\n<p><strong>\u200d<\/strong>Este es el caso de uso m\u00e1s sencillo. La idea consiste en crear una base de datos con entidades y sus correspondientes categor\u00edas. Por ejemplo, se podr\u00eda crear una tabla de b\u00fasqueda con todos los pa\u00edses del mundo, y cada vez que el algoritmo encuentre una ocurrencia de cualquiera de ellos en un fragmento de texto, lo etiquetar\u00eda como una entidad de pa\u00eds.<\/p>\n<h3><strong>Expresiones regulares<\/strong><\/h3>\n<p><strong>\u200d<\/strong>\u00a0Las expresiones regulares son patrones con una estructura determinada. Por ejemplo, se podr\u00eda crear una expresi\u00f3n regular de la forma \u00abDD-MM-YYYY\u00bb, donde tanto D, M como Y son d\u00edgitos, y cada vez que este patr\u00f3n aparezca en un texto \u00e9ste se etiquetar\u00e1 como una entidad tipo fecha.<\/p>\n<p><a href=\"https:\/\/bounsel.app\/signup?utm_source=google&amp;utm_medium=organic&amp;utm_campaign=%C2%BFQu%C3%A9+significa+NER%2C+Reconocimiento+de+entidades+nombradas%3F&amp;utm_term=boton+2\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" class=\"lazyload alignnone wp-image-12829 size-full\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%272184%27%20height%3D%27547%27%20viewBox%3D%270%200%202184%20547%27%3E%3Crect%20width%3D%272184%27%20height%3D%27547%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"http:\/\/bounsel.com\/wp-content\/uploads\/2023\/03\/Bounsel-Flow-2-ESP.jpg\" alt=\"NER\" width=\"2184\" height=\"547\" \/><\/a><\/p>\n<h3><strong>Aprendizaje profundo<\/strong><\/h3>\n<p>El NER de aprendizaje profundo es el NER de \u00faltima generaci\u00f3n y se basa en principios de IA. Utiliza un m\u00e9todo denominado\u00a0<em>word embedding<\/em>, que asocia un vector num\u00e9rico a una palabra determinada para comprender las relaciones sem\u00e1nticas y sint\u00e1cticas entre los distintos componentes del texto.<\/p>\n<p>Ahora te estar\u00e1s preguntando, si los modelos de aprendizaje profundo son los m\u00e1s potentes, \u00bfpor qu\u00e9 necesitamos considerar tablas de b\u00fasqueda o expresiones regulares? Pues bien, la respuesta a esta pregunta es que l<strong>os modelos de aprendizaje profundo son robustos siempre que se disponga de datos de entrenamiento. La IA aprende con la experiencia y, por lo tanto, es crucial disponer de un conjunto de datos lo suficientemente grande como para captar las sutilezas de un caso de uso espec\u00edfico.<\/strong>\u00a0En general, el procedimiento habitual consiste en obtener un modelo NER general, como RoBERTa, que se entrena en un conjunto de datos lo suficientemente grande, y luego afinarlo para un caso de uso espec\u00edfico (por ejemplo, documentos legales, como hacemos en\u00a0Bounsel\u00a0\ud83d\ude09). Para obtener los datos de entrenamiento para dicho caso, puede ser \u00fatil recurrir a tablas de b\u00fasqueda y expresiones regulares, lo cual constituye una forma fant\u00e1stica de empezar a entrenar tu modelo para el problema en cuesti\u00f3n.<\/p>\n<p>Adem\u00e1s, para algunas entidades espec\u00edficas como fechas o dinero, que tienen patrones muy particulares, las expresiones regulares han demostrado ser extremadamente \u00fatiles. As\u00ed pues, est\u00e1 claro que los modelos de aprendizaje profundo constituyen el NER m\u00e1s potente y sofisticado, pero conviene tener en cuenta que existen otras posibilidades que pueden constituir un magn\u00edfico punto de partida para afinar los modelos para tareas m\u00e1s espec\u00edficas.<\/p>\n<p>Espero que despu\u00e9s de leer este art\u00edculo quede m\u00e1s claro c\u00f3mo funciona el NER y lo \u00fatil que puede ser extraer las entidades m\u00e1s importantes de un texto determinado. Si a\u00fan no est\u00e1s convencido, voy a concluir este art\u00edculo con algunas de las aplicaciones de las t\u00e9cnicas NER, que se utilizan a diario en muchos \u00e1mbitos diferentes.\u00a0<strong>Por ejemplo, son muy empleadas en los departamentos de recursos humanos, que utilizan estas t\u00e9cnicas para resaltar los elementos clave de los curr\u00edculums y agilizar los procesos de contrataci\u00f3n<\/strong>; los motores de b\u00fasqueda tambi\u00e9n emplean NER para extraer los componentes clave de una consulta y encontrar con mucha m\u00e1s facilidad informaci\u00f3n relevante; y la categorizaci\u00f3n de art\u00edculos emplea NER para extraer las personas, organizaciones y lugares implicados en los mismos y situarlos autom\u00e1ticamente dentro de una categor\u00eda determinada.<\/p>\n<p><strong>Aqu\u00ed, en\u00a0<\/strong><strong>Bounsel<\/strong><strong>, aplicamos t\u00e9cnicas de IA para hacer los contratos m\u00e1s comprensibles, m\u00e1s f\u00e1ciles de leer y acercarlos a las personas.\u00a0<\/strong>En concreto, entrenamos nuestros propios modelos en un corpus espec\u00edfico de documentos jur\u00eddicos para hacerlos extremadamente robustos para todas las tareas del mundo jur\u00eddico-legal. Esto ahorra mucho tiempo y esfuerzo a nuestros clientes, que pueden manipular f\u00e1cilmente sus documentos legales dentro de la plataforma\u00a0Bounsel\u00a0y utilizar nuestros modelos NER para identificar las piezas clave de informaci\u00f3n aprovechando las t\u00e9cnicas de IA m\u00e1s avanzadas. Si quieres seguir aprendiendo sobre las incre\u00edbles funcionalidades de IA incluidas en las soluciones\u00a0Bounsel, \u00a1sigue atento para saber m\u00e1s!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hoy te toca conocer a Brenda, nuestra nueva integrante se une al equipo de Dise\u00f1o Gr\u00e1fico para maximizar todo el potencial de nuestra marca.<\/p>\n","protected":false},"author":11,"featured_media":5147,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[517,521],"tags":[],"class_list":["post-5144","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-inteligencia-artificial","category-legal-es"],"_links":{"self":[{"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/posts\/5144","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/users\/11"}],"replies":[{"embeddable":true,"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/comments?post=5144"}],"version-history":[{"count":2,"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/posts\/5144\/revisions"}],"predecessor-version":[{"id":20225,"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/posts\/5144\/revisions\/20225"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/media\/5147"}],"wp:attachment":[{"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/media?parent=5144"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/categories?post=5144"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.bounsel.com\/es\/wp-json\/wp\/v2\/tags?post=5144"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}