6.3 Fundamentos formales de la formación de conocimiento

Abstracción de datos -- transformación de señales en símbolos

Pasar de una caracterización extensa, detallada y precisa del sistema supervisado a descripciones más abstractas, concisas y semánticas es una práctica común es supervisión de procesos basada en conocimiento. De hecho, las cantidades grandes de datos precisos pero extensos son difíciles de comprender y tratar al nivel del conocimiento. Es necesaria una abstracción de rasgos semánticos para mantener la entrada de conocimiento al nivel del procesado de conocimiento.

La supervisión de procesos también puede percibirse como un procesado de información a varios niveles; dependiendo del nivel, se usa un lenguaje diferente para la representación de conocimiento, interesan características diferentes y se emprenden acciones diferentes.

En el nivel más bajo, los lenguajes son relativamente simples pero precisos; se usan guardar y manipular datos simples (normalmente números), realizando operaciones simples, bien definidas (por ejemplo filtrado, calculo del valor medio, varianza, etc.). Con estos lenguajes, los datos puede representarse y procesarse, pero no puede especificarse ningún conocimiento abstracto, general. En los niveles superiores, no hay ninguna necesidad ni ninguna posibilidad de tratar con datos detallados; en cambio, el lenguaje opera en lo abstracto, en términos simbólicos y cualitativos y representa propiedades generales, como relaciones entre ellos. El poder expresivo y las capacidades de manipulación de conocimiento dependen del nivel de abstracción.

El problema importante es la reducción de la cantidad de información mediante una apropiada abstracción de conocimiento semántico a partir de una gran cantidad de datos. Hay varios enfoques, dependiendo principalmente del tipo de datos de entrada, las herramientas aplicadas y los objetivos propuestos. A continuación, se presentan brevemente las operaciones más típicas desde un punto de vista matemático general.

Para el tratamiento posterior, se supone un modelo de datos similar al presentado previamente. Se supone que el modelo es de la forma de una tabla relacional . Se supone que se caracterizan las componentes de sistemas proporcionando los valores de los atributos característicos en el instante i, o en el caso de que la consideración explícita del tiempo no sea crucial, sólo algún posible estado o el estado parcial del sistema; es importante destacar que  puede referirse al estado total del sistema o describir simplemente solo una parte de los parámetros del sistema. Así, el comportamiento dinámico (comportamiento parcial) puede ser especificado mediante una sucesión de estas tablas  de longitud arbitraria, cada de ellas correspondiente a momentos consecutivos de tiempo o a un estado diferente del sistema; esta sucesión se denotaría como . Si el tiempo no es importante, para denotar el conjunto anterior se escribirá sólo B. Esta descripción engloba varias representaciones frecuentemente usadas, por ejemplo sucesiones numéricas, vectores de estado, datos codificados en forma tabular, etc.

Sea Q un conjunto de etiquetas lingüísticas pensado para denotar términos abstractos interpretados a nivel abstracto (que tengan algún significado para los expertos del dominio), ; los elementos de Q también pueden denotar ítems de cualquier formalismo de representación de conocimiento específico, por ejemplo formulas proposicionales, hechos atributivos de formalismos lógicos, etiquetas cualitativas, etc., Las operaciones básicas de abstracción pueden ser:

Ejemplos de aproximaciones a la transformación señal-símbolo

En [Rakoto and Aguilar, 1995] se consideran las siguientes características cualitativas y simbólicas: