Pasos básicos desde los datos al conocimiento
Para preparar el conocimiento de entrada de los sistemas de supervisión
basados en conocimiento, la gran cantidad inicial de datos debe transformarse
a una forma de conocimiento más concisa y significativa. Las siguientes
actividades constituyen las operaciones básicas para pasar del nivel
de los datos al nivel del conocimiento, del nivel de la información
numérica extensa al nivel semántico, simbólico, cualitativo
y conciso del conocimiento:
Aunque no siempre se aplican todas las operaciones, pueden considerarse
como básicas, pasos genéricos, constituyendo un posible procedimiento
de transformación de datos-en-conocimiento. Aquí se presentan
en el ámbito abstracto, independientemente del dominio y las herramientas;
para su aplicación práctica, las operaciones particulares
deben traducirse y codificarse de forma específica según
el formalismo de representación de conocimiento, los datos adquiridos
y el nivel de abstracción.
Abstracción y generalización
Las nociones presentadas involucran representación de conocimiento y se refieren a la comparación de expresiones de representación de conocimiento diferentes con respecto a los conjuntos de objetos que satisfacen las descripciones. Se involucra la interpretación de formulas con respecto a algún universo de discurso y, simultáneamente, la comparación de ellas con respecto a su alcance y a la exactitud del conocimiento representado. A grandes rasgos, se define y se analiza una relación de orden con respecto a la ‘cantidad de información’ representada por una fórmula.
La misma idea de noción presentada de generalización consiste
en la interpretacion de formulas lógicas o cualquier otra expresión
de representación de conocimiento en términos de conjuntos
de objetos descritos (normalmente estados del universo de discurso) en
lugar de considerar las formulas como los axiomas y teoremas de algunos
sistemas formalizados. Consideremos dos formulas u otras expresiones de
representación de conocimiento
y
. Se considera que las
dos expresiones anteriores describen sistemas dinámicos (universos,
mundos). Así, a cualquiera de las expresiones puede asociársele
un conjunto físico de estados para los que la fórmula es
válida. A grandes rasgos, cuanto más grande es el conjunto
más general se considera la fórmula adjunta. Una fórmula
generaliza otra fórmula si describe un conjunto más grande
de estados con respecto al universo de discurso. Más formalmente,
sean
y
los conjuntos de estados u otros ítems descritos por las correspondientes
formulas. Se dice que
es más general que
,
,
si y sólo si
.
Intuitivamente, la idea de generalización se presenta de forma gráfica
en la siguiente figura.
La relación presentada es válida en el conjunto de todas
las formulas lógicas de primer orden. De hecho,
si y sólo si
Æ
,
la fórmula más detallada conlleva lógicamente la más
general. Más adelante se presentan esquemas de verificación
basados en modos de inferencia específicos para formulas simples
y normales. En secciones posteriores se discuten las aplicaciones en sistemas
dinámicos basados en conocimiento. La idea principal del concepto
propuesto de interpretación lógica puede explicarse más
precisamente.
Destaquemos que, a grandes rasgos, si una fórmula contiene información detallada (muchos hechos, por ejemplo), entonces el conjunto correspondiente de estados es bastante pequeño, ya que toda la información debe ser verdad en cualquiera de los estados. Al contrario, si una fórmula contiene información parcial (sólo varios hechos), puede realmente describir un conjunto numeroso de estados, ya que el requisito de información verdadera en cualquiera de los estados es bastante débil. Puede decirse directamente que una fórmula más general describe más estados que una menos general.
Para proporcionar algunas intuiciones acerca de la noción de
generalización pueden mostrarse las maneras básicas de hacer
más general a una fórmula, de resumir la información
Éstas son:
Examinemos las posibilidades anteriores de una manera más
detallada. Sean y
fórmulas lógicas; entonces:
,
eliminando una condición en cualquier fórmula conjunta se hace más general. Igualmente:
,
agregando una fórmula (disyuntiva) se hace más general. La tercera posibilidad consiste en reemplazar una constante (o un término) por una variable y aplica a lógica de predicados o un calculo similar.
,
donde X es una variable reemplazando alguna constante a. Otras posibilidades incluyen extensiones de un solo valor o conjunto a un conjunto más grande o intervalos cerrados.
Las tres vías de generalizar una fórmula constituyen las posibilidades más básicas y naturales. Otra posibilidad proviene de los métodos de inferencia lógica.
Se definirá una relación de la equivalencia con respecto
al grado de generalidad como sigue. Dos fórmulas
y
se dice que son igualmente
generales (
) si y sólo
si
y
.
Intuitivamente, dos fórmulas igualmente generales tienen el mismo
"poder expresivo", describen el mismo conjunto de estados del mundo o sistema
considerado. Puede demostrarse que la relación de generalidad es
igual a una relación de equivalencia (es reflexiva, simétrica
y transitiva) mientras que la relación del generalización
es una relación del orden parcial (es reflexiva, antisimétrica
y transitiva).
La definición presentada de generalización no proporciona ningún método constructivo para verificar si una fórmula dada es más general que otra fórmula - verificar si una fórmula proviene lógicamente de otra es, en general, un problema de cálculo muy complejo. Sin embargo, en muchos casos, puede observarse que, gracias a la forma simple y regular de las fórmulas positivas simples conjuntivas, es posible verificar si la generalización se cumple mediante el simple análisis de las dos fórmulas. Se ha presentado la manera de verificar generalización para el formalismo lógico y la representación de conocimiento atributiva.
Problemas en la adquisición de datos