4.3 Representación simbólica de datos   En esta sección se perfila la representación de conocimiento mediante el uso de atributos. Este tipo de representación de conocimiento parece prevalecer en la ingeniería del conocimiento debido a su interpretación simple e intuitiva y gran aplicabilidad. Aunque la forma particular de desplegar la información (variantes de la notación) puede ser diferente, el formalismo es básicamente el mismo en numerosos formalismos de representación de conocimiento. En general, es aplicable tanto a datos cualitativos como cuantitativos. A continuación se presentan una forma general simple y sus extensiones.

Representación de conocimiento simple mediante atributos

  Sea C un conjunto de objetos (elementos) de interés; en supervisión éstos son normalmente los estados consecutivos. También pueden ser componentes físicos del sistema considerado o conceptos abstractos como índices de comportamiento caracterizando el sistema. A continuación se describirán los elementos de C proporcionando valores a algunos atributos aplicables a su caracterización. Los atributos son simplemente cualquier propiedad preseleccionada que toma valores específicos en ciertos instantes de tiempo.

Sea A un conjunto de atributos seleccionado para describir características importantes del sistema considerado, . Para cualquier atributo , sea  un conjunto (finito) de posibles valores de este atributo, o en caso números reales o enteros algún intervalo. Para evitar trivialidad, se supone que cualquier conjunto  contiene por lo menos dos elementos diferentes. Se asume el carácter funcional de los atributos, en algún instante de tiempo para cualquier objeto, , si  entonces .

Además, para simplificar se supone que cualquier atributo es aplicable a cualquier objeto; La extensión al caso más general, donde cualquier objeto tiene conjuntos específicos de atributos aplicable a él, puede obtenerse directamente. Los valores de un atributo pueden simplemente listarse en un conjunto o puede establecerse algún orden entre ellos.

Un ítem básico de representación de conocimiento consiste en la especificación de algún elemento , su atributo  y un valor de este atributo. Estos tres valores constituyen un hecho; en términos lógicos constituyen una fórmula atómica. Por intuición, el significado de esta fórmula es que el valor del atributo especificado para un elemento dado es justamente el proporcionado; así, la relación básica es la igualdad, en el sentido de asignación de un valor a una función. De esta forma, la fórmula atómica básica siempre es:
 

donde  es un atributo,  es un objeto a ser caracterizado, y  es el valor del atributo para el objeto, . También pueden admitirse hechos parcialmente especificados de la forma
  donde X es una variable; en este caso el valor del atributo no se especifica.

Por ejemplo, color(luz) = rojo denota el hecho que el valor del atributo color para luz es rojo. Para un atributo como temperatura y un objeto como refrigenrante un hecho como temperatura(refrigerante) = limite_superior podría denotar alguna situación peligrosa en la que la temperatura del líquido refrigerante alcanzara algún límite superior predefinido. Para las variables numéricas, la representación es similar, para denotar el hecho de que la velocidad actual es 60 (típicamente v=60), puede construirse la descripción valor(velocidad)=60.

Destaquemos que cuando se caracteriza un objeto específico, la especificación de sus atributos puede ser aun más simple, puede tomar la forma:
 

donde t es el valor específico del atributo o una variable (si el valor es desconocido).

Si se especifican los valores de dos o más atributos, entonces esta especificación forma la llamada conjunción de hechos, una noción importada de la lógica. Una conjunción representa un conjunto de hechos que ocurren simultáneamente. Esta conjunción de hechos también se llama fórmula de hechos simple o fórmula simple. La conjunción se denota con el símbolo . Una fórmula simple tiene siempre la forma , donde cualquier  es un hecho. La representación de conocimiento mediante atributos es a veces llamada formalismo Objecto-Atributo-Valor (OAV) o Atributo-Objeto-Valor (AOV).

Los formulas simples caracterizan el estado actual de un sistema (en otras secciones se describen de forma más detallada, las definiciones y un tratamiento formal del problema de la representación de estado lógica). Dado que una fórmula simple constituye de hecho una caracterización abstracta (normalmente sólo se tienen en cuenta determinados parámetros/características), puede referirse a una situación que incluya un gran número de estados reales.

Si todos los atributos se aplican a todos los objetos, una fórmula completa caracterizando todos los valores de los atributos para todos los objetos visualizada de forma de conjunción "lineal" sería torpe y quizás difícil de leer; en este caso una representación tabular es mucho más transparente. La forma tabular de una fórmula simple puede ser:
 

donde  es un valor definido o una variable. Si se especifican todos los valores de los atributos explícitamente, la fórmula representa la máxima información. En el caso que algunos de los atributos tengan valores no especificado para ciertos objetos entonces la representación tabular puede reducirse.

En la práctica, algunos de los atributos pueden ser insignificantes o inaplicables para ciertos objetos (por ejemplo el color de ciertos elementos puede no ser importantes y, por lo tanto, no especificarse, el peso no es un atributo aplicable a un elemento como luz). En el primer caso puede usarse el signo "_" y en el segundo "*". Esta descripción constituye una fórmula más general (abstracta).

A menudo, es todavía más conveniente usar una forma tabular simplificada similar a las tablas en bases de datos relacionales. En esta forma las columnas se marcan con atributos, mientras que cualquier fila proporciona la descripción de cierto objeto. La forma tabular simplificada todavía es más leíble y permite no repetir los nombres de los atributos y los nombres de los objetos.

 
Igualmente, en esta tabla, si cierto atributo no es aplicable a cierto objeto puede denotarse con, por ejemplo, "*", mientras que si cierto atributo puede tomar cualquier valor posible se marca con "_."

La forma de presentar datos en tablas como la anterior es popular, ampliamente aceptada. Es entendida fácilmente por los expertos en el dominio y, ademas, pueden aplicarse todas las nociones bien establecidas y el motor de las bases de datos relacionales. El tratamiento de ciertos problemas acerca de la representación de conocimiento mediante formas tabulares y de las nociones básicas del dominio de las bases de datos puede resultar muy práctico. Una ventaja de este enfoque consiste en la posibilidad de aplicar nociones y operaciones normales en bases de datos en algunos de los pasos del procesado de datos y transformaciones de la tabla.

Representación de conocimiento extendida mediante atributos

En esta subsección se presenta un lenguaje para la representación de conocimiento mediante el uso de atributos. La extensión básica consiste en admitir la caracterización imprecisa del valor de los atributos para ciertos objetos permitiendo el uso de conjuntos. Se supone que el valor de cierto atributo para un objeto determinado se da precisamente. Como generalización, se especifica un conjunto de posibles valores en lugar de uno solo.

Como en la subsección anterior, sea C un conjunto de objetos (elementos) de interés. Los elementos de C se describirán proporcionando valores o conjuntos de valores de algunos atributos aplicables a su caracterización. Sea A el conjunto de atributos seleccionados, . Para cualquier atributo  es el conjunto (finito) de posibles valor de este atributo. Como antes, se supone el carácter funcional del valor del atributo y para ganar simplicidad también se supone que cualquier atributo es aplicable a cualquier objeto.

Como extensión de la subsección anterior, un ítem básico de representación de conocimiento (hecho, átomo) consiste en cualquier elemento, un atributo determinado para describirlo y un conjunto de posibles valores de este atributo (si son aplicables). Esta especificación de ítem de conocimiento se llama hecho o fórmula atómica (átomo). Intuitivamente, su significado es que el valor del atributo especificado para un elemento dado es igual a uno de los elementos del conjunto especificado. La relación básica aquí es la inclusión y la forma normal de cualquier fórmula atómica es siempre:

donde  es un atributo,  es un objeto a caracterizar, y  es el conjunto de posibles valores del atributo seleccionado  para el objeto . Por supuesto es un subconjunto del conjunto predefinido de posibles valores del atributo . Para simplificar, el caso de variables utilizadas para especificar el conjunto de valor admisibles no es considerado.

Desde el punto de vista formal los hechos definidos de la forma anterior no son una subclase directa de átomos en lógica de primer orden pura; con respecto a la interpretación intencional, si se usan conjuntos como argumentos, deben aplicarse mecanismos de razonamiento específicos. Por ejemplo, dados dos hechos como  ningún mecanismo de razonamiento puramente lógico podría deducir q de p, o sea, para mostrar que pÆ q (donde Æ es el símbolo que denota consecuencia lógica). Para conseguir esto, deben transformarse los átomos anteriores en formulas lógicas "equivalentes" como  y

respectivamente. El significado de que un elemento pertenezca a un conjunto de posibles valores es que toma algunos de estos valores, corresponde a la disyunción lógica (). Esta transformación, sin embargo, llevaría normalmente a expresiones torpes y largas, y en algunos casos pueden llegar a ser imposibles (si el conjunto especificado es infinito). Así deben proporcionarse reglas de inferencia específicas.

Dependiendo de las necesidades, pueden admitirse varias posibilidades de notación, por ejemplo si el conjunto de valores para el atributo a es ordenado, pueden utilizarse símbolos algebraicos típicos como . Por ejemplo, si , entonces el hecho  puede denotarse como , etc.,

Destaquemos que para varios hechos con el mismo objeto y atributo pero conjuntos de valores distintos, puede establecerse una relación de orden parcial. Un hecho más general admitirá un conjunto más ancho de posibles valores. La siguiente la definición introduce formalmente el concepto de generalización.

Definición. Considérense dos hechos, . Se dice que el hecho q es más general que el hecho p (o que el hecho p es más específico que el hecho q) si y sólo si .

Notemos que si no se especifica el conjunto apropiado (se da una variable sin restricciones), entonces puede reemplazarse por el dominio del atributo, es decir, el conjunto  y la fórmula atómica generada es equivalente a la anterior. Este tipo de convención puede usarse para simplificar posteriores consideraciones. Un hecho más general sigue lógicamente de uno más específico (pÆ q) con tal de que se considere la interpretación referente a los conjuntos de valores apropiados.

La definición anterior permite la inspección simple de generalización entre hechos si se dan explícitamente los conjuntos apropiados. En el caso que los conjuntos se especifiquen implícitamente, deben aplicarse procedimientos del razonamiento específicos, dependientes de los casos. Por ejemplo, si los conjuntos se especifican como intervalos, debe verificarse la inclusión de intervalos, que puede hacerse por comparación de sus límites.

Como antes, pueden usarse varios hechos para formar formulas simples conjuntivas. Al igual que en la subsección anterior, puede admitirse la representación tabular de formulas de hechos simples. Un problema interesante consiste en comparar estas formulas con respecto a cual de las dos es más general, o para verificar si se sostiene la generalización. Como antes, la fórmula más general describe potencialmente más ítems, ya que impone condiciones más débiles. La generalización para formulas simples se define a continuación.

Definición. Consideremos dos formulas simples . Se dice que la fórmula  es más general que la fórmula  (también se dice que la fórmula  es más específica que la fórmula ) si y sólo si para cualquier hecho de fórmula  existe algún hecho  en fórmula , tal que es más general que  (Æ).

La generalizacion definida anteriormente es equivalente a la suposición lógica, es decir una fórmula más general proviene lógicamente de otra más específica; también se usará la notación  Æ.

En la definición anterior se supone que ambas formulas están específicamente reducidas, que nunca dos hechos de la misma fórmula se refieren a la misma combinación de objeto y atributo. Por ejemplo, si

,

entonces una forma reducida (pero equivalente) de  sería

.

Puede verse que la generalización no se cumplía para la fórmula simple  y para la formula no reducida de ; sin embargo si se cumple  Æ, para la forma reducida puesto que . De aquí en adelante sólo se considerarán las formas reducidas de las formulas simples.

Verificar si la generalización se sostiene para formulas simples es una prueba crucial en el reconocimiento de situaciones, verificación de si la condición previa de cierta fórmula se cumple, etc. Las definiciones introducidas en esta sección constituyen fundamentos importantes para la inferencia en sistemas basados en conocimiento.