Aprendizaje automático basado en prototipos

A continuación se introducen brevemente algunas nociones fundamentales de lógica borrosa y aprendizaje automático, y cómo ambas se combinan en este sistema.

Subconjuntos borrosos

En algunos casos, el diseño de modelos matemáticos que describan un cierto problema requiere la representación de conceptos vagos, bien por falta de información o por la vaguedad intrínseca del concepto en sí.

En estos casos, las teorías matemáticas clásicas resultan inadecuadas, ya que están pensadas para representar conceptos nítidos.

Un buen ejemplo de ello es la teoría de conjuntos. En ella, un elemento dado pertenece a un conjunto siempre de forma absoluta: o bien pertenece totalmente, o bien no pertenece en absoluto. No se admite ningún grado intermedio.

La teoría de subconjuntos borrosos extiende la teoría clásica de conjuntos para admitir la representación de conjuntos imprecisos, en los que un elemento no sólo puede pertenecer (o no) totalmente, sino también de forma parcial.

Empleando subconjuntos borrosos pueden representarse realidades genéricas o vagas, y definir reglas lógicas que operan sobre ellas, reproduciendo, en cierta medida, la forma de pensamiento humano que con frecuencia se basa en nociones imprecisas y subjetivas.

Aprendizaje automático

El principal objetivo del sistema FLPD es el aprendizaje automático. Por aprendizaje automático se entiende el proceso mediante el cual un sistema (informático) es capaz de extraer información de un conjunto de ejemplos, para después aplicarla de forma autónoma sobre nuevos casos.

La aplicación típica de este tipo de sistemas se da en tareas de clasificación: se quiere discriminar el tipo o clase al que pertenecen una serie de elementos en función de un conjunto limitado de parámetros (atributos) que se conocen de cada uno de ellos.

Para ello se lleva a cabo un proceso de inducción sobre un conjunto base de elementos cuya clase ya se conoce (conjunto de entrenamiento), para obtener un clasificador, capaz de emplear la información sintetizada a partir de los ejemplos dados para clasificar nuevos elementos.

Existen diversas estrategias para extraer y representar información significativa de un conjunto de ejemplos. En el sistema FLPD se emplean prototipos: a partir de los datos de ejemplo se genera un conjunto (reducido) de prototipos que sintetizan la información común a los datos dados.

Un prototipo es, sencillamente, un conjunto de valores asociados a una serie de atributos. En cierto modo, los datos originales también son prototipos. En este sistema, sin embargo, se representan los prototipos de una forma especial, como se describe más abajo.

Una vez inducidos los prototipos, el sistema clasifica nuevos datos comparándolos con los prototipos que ha inferido. El esquema de funcionamiento de una clasificación supervisada sería el siguiente:

Figura 1. Esquema de un aprendizaje supervisado

Esquema de un aprendizaje supervisado

Los elementos que constituyen el esquema anterior son:

Descriptor lingüístico (fuzzify)

Describe lingüísticamente los datos, convirtiéndolos en prototipos borrosos. Ésto es necesario a causa de la naturaleza del algoritmo de inducción empleado (véase la siguiente sección).

Inductor de prototipos (clustering)

Lleva a cabo la inducción. A partir de los datos (ya descritos de forma borrosa) de entrada, genera un conjunto de prototipos representativos.

Clasificador (classify)

Emplea los prototipos generados por el inductor para clasificar los datos de entrada.

Descripción lingüística

El sistema FLPD utiliza un algoritmo de inducción denominado HPI (Hierarchical Prototype Induction), que, a partir de los datos originales, genera un conjunto de prototipos obtenidos mediante un proceso de inducción en sucesivos niveles.

Para representar estos prototipos, que han de sintetizar la mayor cantidad posible de información acerca de los datos originales, se emplean prototipos borrosos.

Un prototipo borroso está compuesto por un conjunto de conjuntos borrosos (valga la redundancia) asociados a una serie de atributos. El uso de conjuntos borrosos permite un cierto grado de imprecisión que facilita la representación de información genérica o prototípica.

La utilización de prototipos borrosos requiere, por una parte, la transformación de los datos originales en datos borrosos, y, por otra, la definición de las herramientas matemáticas apropiadas para comparar y combinar prototipos borrosos.

Descripción lingüística

La transformación de los datos originales, compuestos por tuplas de valores, en prototipos borrosos se lleva a cabo a través de un proceso de descripción lingüística. Definiendo una cobertura lingüística sobre el dominio de cada uno de los atributos, se convierten sus valores en prototipos borrosos discretos definidos sobre el conjunto de etiquetas generado.

La cobertura lingüística de un cierto rango de valores consiste en particionar dicho rango en un cierto número de subintervalos disjuntos, asociando a cada intervalo una etiqueta simbólica y un conjunto borroso continuo que representa en qué medida los valores del rango original pertenecen a esa etiqueta.

Teoría de asignación de masas

Una vez representados los datos originales en prototipos borrosos, el inductor, empleando HPI, combina aquellos prototipos que se parecen, generando así un conjunto mucho más reducido de prototipos que representan (aproximadamente) la misma información.

Es necesario, por tanto, disponer de una operación que evalúe la semejanza entre dos prototipos borrosos, y, por otra parte, de una operación que permita fusionar dos prototipos borrosos.

Dado que la teoría de subconjuntos borrosos no proporciona estas operaciones, es preciso recurrir a la teoría de asignación de masas. Esta teoría define un tipo especial de subconjuntos borrosos que es posible transformar en una distribución de probabilidad equivalente, denominada LPD (Least Prejudiced Distribution). Asimismo, es posible regenerar un subconjunto borrosos a partir de su descripción probabilística.

Empleando esta teoría, pueden definirse operaciones apropiadas para la comparación y combinación de prototipos borrosos, recurriendo a sus distribuciones LPD asociadas.

De esta forma, pueden definirse algoritmos de aprendizaje automático, como HPI, que aprovechan la generalidad proporcionada por la representación de información en forma borrosa.