La terminología farmacéutica y médica, pese a lo que la mayoría de la gente pueda pensar, es bastante ambigua y para un mismo concepto pueden utilizarse, por distintos profesionales, distintos términos para referenciar a un mismo concepto. Esto genera innumerables problemas, sobretodo a la hora de compartir historiales médicos entre profesionales. Esta varianza de terminología también provoca que algoritmos de procesamiento del lenguaje para, por ejemplo, simplificar el texto de cara al paciente; para traducir el historial a distintos idiomas si el paciente se tiene que ir al extranjero; o, en general, para unificar la terminología en una común que todos entiendan. Jorge Cruanes, de la Universidad de Alicante, nos presenta un propuesta para intentar unificar toda esta terminología a través de una ontología de referencia mediante algoritmos de similitud añadiendo una capa de semántica basado en tres principios: expresiones existenciales, antónimos y sinónimos.
Mediante las expresiones existenciales se pretende buscar expresiones léxicas que deben aparecer en ambos términos, o en ninguno de ellos. Si aparecen en ambos o no aparecen en ninguno entonces podemos tener en cuenta esos términos como sinónimos si la similitud léxica supera cierto umbral, en caso contrario ni siquiera los consideraríamos. La otra técnica, usando antónimos, detecta si hay palabras en los términos que son antónimas, en tal caso, esos términos se descartan como similares. Finalmente, se usan expresiones léxicas sinónimas para aumentar la cobertura al relacionar palabras aunque no tengan una semejanza léxica.
Los resultados que el autor expone, demuestran que las dos primeras técnicas son considerablemente buenas aunque la última, la del uso de sinónimos, aporta ciertas irregularidades.
Entre los trabajos futuros quedan, por tanto, mejorar el uso de sinónimos en las comparaciones, así como aumentar el conocimiento semántico superficial del método. De cara a mejorar el uso de sinónimos los autores proponen una búsqueda de un mínimo número de términos comunes.