Ya sabemos por las publicaciones del blog en los dias precedentes que el principal problema de la Sanidad Electronica es la falta de conectividad, parte de la cual deriva de la ausencia de estandarizacion en la mensajeria de las aplicaciones que en muchos casos no utilizan una ontologia y una semantica comun.
La mineria de textos que tipicamente realiza categorizacion, agrupacion de textos, extraccion de conceptos y entidades, identificacion de elementos dominio especificos, granulometria en las taxonomias, analisis de sentimientos, resumen automatico de documentos, relacion y modelizacion de entidades ect… Es esencial en la clasificacion automatica de las entidades medicas y de sus relaciones.
De este modo se introducen automaticamente los metadatos en la totalidad de los procesos informaticos relacionados con la salud para permitir el descubrimiento de conocimiento y relaciones (Knowledge discovery) novedosas, seminovedosas o conocidas, pero de forma mas pragmatica localizar los elementos esenciales que puedan ser identificados por aplicaciones informaticas no compatibles asegurando que la informacion comun pueda intercambiarse.
La arquitectura de la mineria de textos incluye los subsistemas para la coleccion de datos (source selection and text retrieval), para data warehousing (extraccion de informacion y archivo de datos), y explotacion de datos (data mining and presentation).
La anotacion automatica de metadatos en medicina (AAMM) parecida a la que hace el <!metaMarker>™ (Knowledge Management through Automatic Metadata Extraction ) colleva una simplificacion considerable de gestion de documentacion clinica, favorece el descubrimiento de conocimiento y facilita la compatibilidad informatica.
El termino de “text mining” introducido por Hearst en 1999 varia del clasico concepto de “data mining” o mineria de datos y es distinto del “web mining” que identifica ademas elementos como los multimedia y los anuncios comerciales entre otros.